音频信号合成的制作方法

文档序号：2824767阅读：757来源：国知局

专利名称：音频信号合成的制作方法
技术领域：
本发明涉及音频信号合成，且特别地但非排他地涉及用于耳机再现的空间环绕声音频的合成。
背景技术：
随着数字信号表示和通信日益取代模拟表示和通信，各种源信号的数字编码在过去几十年已变得日益重要。例如，已经开发了用于有效地编码音乐或其它音频信号的编码标准。最流行的扩音器再现系统基于典型地在预定位置处采用两个扩音器的双通道立体声学。在这种系统中，基于从两个扩音器位置发出的两个通道生成声音空间，并且原始立体声信号典型地被生成以使得在扩音器处于靠近它们相对于听者的预定位置时再现期望的声舞台(sound stage)。在这种情形中，可以认为用户处在最有效点(sweet spot)。常常使用幅度平移生成立体声信号。在这种技术中，可以通过分别调整左和右通道中相应信号分量的幅度把各声音对象部署在扬声器之间的声舞台中。因而，对于中央位置，为每个通道按相位馈送信号分量以及衰减3 dB。对于朝向左扩音器的位置，可以增加左通道中信号的幅度并相应地减小右通道中的幅度，以及对于朝向右扬声器的位置，反之亦然。然而，虽然这种立体声再现可以提供空间体验，但它趋向于次优。例如，声音的位置限于在两个扩音器之间，最优的空间声音体验限于小听音区域(小的最有效点)，需要特定的头部取向(朝向扬声器之间的中途点)，谱音染(spectral coloration)可以由于从扬声器至听者耳朵的变化路径长度差异而发生，通过幅度平移途径提供的声音源本地化线索只是将对应于期望位置处声音源的本地化线索的粗略近似等。相比于扩音器回放场景，感知到经由耳机再现的立体声音频内容在听者头部的内部发起。从外界声音源至听者耳朵的声学路径的效果的缺失使得空间图像听起来不自然。为了克服这一点以及从耳机提供改进的空间体验，引入了双耳处理以生成用于耳机的每个听筒的合适信号。特别地，在常规立体声装备中接收信号的情况下，通过估计为对应于分别从左以及右扬声器至用户左耳的声学传递函数的两个滤波器过滤去往左听筒/ 耳机的信号(包括由于头部和耳朵的形状所致的任何影响)。另外，两个滤波器被应用于去往右听筒/耳机的信号，以对应于分别从左以及右扬声器至用户右耳的声学传递函数。滤波器因而表示对人类头部(以及可以是其它对象)对信号的影响建模的感知传递函数。公知类型的空间感知传递函数是所谓头部相关传递函数(HRTF)，其借助脉冲响应描述从某个声音源位置至鼓膜的传递。也把房间的墙壁、天花板和地板引起的反射考虑在内的可替代类型的空间感知传递函数是双耳房间脉冲响应(BRIR)。为了合成来自特定位置的声音，通过两个HRTF (或BMR)、即表示从估计位置分别至左耳和右耳的声学传递函数的 HRTF过滤相应信号。典型地把这两个HRTF (或BRIR)称作HRTF对(或BMR对)。双耳处理可以提供改进的空间体验并且特别地可以创建‘头部外’的3D效果。
因而，传统双耳立体声处理基于各立体声扬声器的虚拟位置的假定。然后，它寻求对来自这些扩音器的信号分量经受的声学传递函数建模。然而，这种途径易于引入一些恶化以及特别地遭受使用扩音器的常规立体声系统的缺点中的许多缺点。事实上，基于虚拟扬声器固定集合的耳机音频再现如先前所讨论地容易遭受固定扩音器的真实集合固有引入的缺陷。一个具体缺陷是本地化线索易于是期望位置处声音源的实际本地化线索的粗略近似，这导致恶化的空间图像。另一缺陷是幅度平移只在左右方向上、而不在任何其它方向上工作。可以把双耳处理扩展到通道多于两个的多通道音频系统。例如，可以把双耳处理用于包括例如五个或七个空间通道的环绕声系统。在这种实例中，针对去往用户两个耳朵中每个耳朵的每个扬声器位置确定HRTF。因而，两个HRTF被用于每个扬声器/通道，从而得到对应于仿真的不同声学传递函数的大量信号分量，这易于致使感知的质量恶化。例如，由于HRTF函数只是将会被感知的正确传递函数的近似，所以组合的大量HRTF易于引入用户可以感知的不准确性。因而，对于多通道系统而言，缺点易于增加。另外，该途径具有高复杂度并且具有高的运算资源使用。事实上，为了把例如5. 1或者甚至7. 1的环绕信号转换成双耳信号，需要极大量的过滤。然而，近来提出了可以通过所谓的幻象物化显著改进立体声内容的虚拟环绕重现的质量。具体地，欧洲专利申请EP 07117830. 5以及J. Breekiart、E. Schuijers的文献 "Phantom Materialization: A Novel Method to Enhance Stereo Audio Reproduction on Headphones，，，IEEE Transactions on Audio, Speech, and Language Processing,第 16卷，No. 8，第1503 — 1511页，2008年11月中提出了这种途径。在所述途径中，通过假定从虚拟扩音器位置发起的两个声音源不生成虚拟立体声信号，而是把声音信号分解成定向信号分量和间接/解相关的信号分量。此分解可以具体地针对合适时间以及频率范围。随后通过仿真幻象位置处的虚拟扩音器来合成直接分量。通过仿真固定位置(典型地对应于环绕扬声器的标称位置)处的虚拟扩音器合成间接分量。例如，如果立体声信号包括朝向右方平移比方说10°的单声音分量，则立体声信号可以包括右通道中的约为左通道中的信号两倍响亮的信号。因而，在传统双耳处理中，此声音分量将会由来自从左扬声器至左耳的HRTF过滤的左通道的分量、来自从左扬声器至右耳的HRTF过滤的左通道的分量、来自从右扬声器至左耳的HRTF过滤的右通道的分量以及来自从右扬声器至右耳的HRTF过滤的右通道的分量表示。相比而言，在幻象物化途径中，主要分量可以生成为对应于声音分量的信号分量的和，并且此主要分量的方向可以随后估计(即，朝向右方10°)。此外，在两个立体声通道的公共分量(主要分量)被减去之后，幻象物化途径生成表示残留信号分量的一个或多个扩散或解相关信号。因而，残留信号可以表示声音环境，诸如源自房间中的反射的声音、混响、环境噪声等。幻象物化途径随后继续合成直接从估计的位置(即，从朝向右方10°)发起的主要分量。因而，只使用两个HRTF (即，表示从估计的位置分别至左耳和右耳的声学传递函数的HRTF)合成主要分量。可以随后合成扩散环境信号以从其它位置发起。幻象物化途径的优点是它不在虚拟重现情景上施加扬声器装备的限制以及相应地它提供了大为改进的空间体验。特别是，典型地可以实现听者感知的声舞台中声音的清楚得多的和良好定义的定位。
然而，幻象物化途径的问题是它限于立体声系统。事实上，EP 07117830.5明确陈述了如果存在多于两个通道，则幻象物化途径应当各自地且单独地应用于通道的每个立体声对(对应于每个扩音器对)。然而，这种途径不仅会复杂和需求资源而且会常常导致降级的性能。所以，改进的系统将会是有益的，且特别地，允许灵活性增加、复杂性减少、资源需求减少、针对具有多于两个通道的多通道系统的适合性改进、质量改进、空间用户体验改进和/或性能改进的系统将会是有益的。

发明内容
相应地，本发明旨在单独地或以任何组合方式优选减轻、缓解或消除上述缺点中的一个或多个缺点。根据本发明的一个方面，提供了用于合成多声音源信号的装置，该装置包括用于接收表示多声音源信号的编码信号的单元，编码信号包括多声音源信号的下混合信号以及用于把下混合信号扩充为多声音源信号的参数扩展数据；用于执行下混合信号的信号分解以至少生成第一信号分量和第二信号分量的分解单元，第二信号分量与第一信号分量至少部分地解相关；位置单元，用于响应于参数扩展数据确定第一信号分量的第一空间位置指示；第一合成单元，用于基于第一空间位置指示合成第一信号分量；以及第二合成单元，用于合成第二信号分量以从与第一信号分量不同的方向发起。本发明可以在许多场景中提供改进的音频性能和/或便利的操作。具体地，本发明可以在许多场景中提供改进和更良好定义的空间体验。特别是，可以通过声场中各声音分量位置的更良好定义的感知提供改进的环绕声体验。本发明可适用于具有多于两个通道的多通道系统。此外，本发明可以允许便利和改进的环绕声体验以及可以允许与现有多通道(N>2)编码标准(例如MPEG环绕标准)的高度兼容性。参数扩展数据可以具体地是参数空间扩展数据。参数扩展数据可以例如表征从下混合向多个(多于两个)空间声音通道的上混合。可以例如合成第二信号分量以从一个或多个固定位置发起。每个声音源可以对应于多通道信号的通道。多声音源信号可以具体地是具有多于两个通道的多通道信号。第一信号分量典型地可以对应于主要定向信号分量。第二信号分量可以对应于扩散信号分量。例如，第二信号分量可以主要表示环境音频效果，例如混响和房间反射。第一信号分量可以具体地对应于与如将会利用经典扩音器系统中使用的幅度平移技术获得的幻象源近似的分量。将会明白在一些实施例中，分解可以进一步生成可以例如是其他定向信号和/或可以是扩散信号的附加信号分量。特别是，可以生成第三信号分量以与第一信号分量至少部分地解相关。在这种系统中，可以合成第二信号分量以主要从右侧发起，而可以合成第三信号分量以主要从左侧发起(或者反之亦然)。例如，第一空间位置指示可以是例如对应于第一信号分量的幻象源的三维位置、方向、角度和/或距离的指示。按照本发明的可选特征，所述装置进一步包括用于把下混合划分成时间间隔频带块且布置成各自处理每个时间间隔频带块的单元。
这可以在许多实施例中提供改进的性能和/或便利的操作和/或减少的复杂性。具体地，该特征可以允许与许多现有多通道编码系统的改进兼容性以及可以简化需要的处理。此外，该特征可以提供声音信号的改进声音源定位，其中，下混合包括来自不同地点处多个声音分量的贡献。特别是，所述途径可以利用以下事实对于这种场景，每个声音分量常常在有限数量的时间间隔频带块中是主导的，并且相应地该途径可以允许每个声音分量自动在期望地点处定位。按照本发明的可选特征，第一合成单元被布置成将参数头部相关传递函数应用于第一信号分量的时间间隔频带块，该参数头部相关传递函数对应于由第一空间位置指示表示的位置并且包括每个时间间隔频带块的参数值集合。这可以在许多实施例中提供改进的性能和/或便利的操作和/或减少的复杂性。具体地，该特征可以允许与许多现有多通道编码系统的改进兼容性以及可以简化需要的处理。典型地可以实现显著减少的计算资源使用。参数集合可以例如包括要应用到每个时间间隔频带块的信号值的复数或者功率和角度参数。按照本发明的可选特征，多声音源信号是空间多通道信号。本发明可以允许多通道信号(例如，具有多于两个通道)的改进的和/或便利的合成。按照本发明的可选特征，位置单元被布置成响应于参数扩展数据的上混合参数以及多通道信号通道的假定扬声器位置来确定第一空间位置指示，该上混合参数指示下混合的上混合以得到多通道信号。这可以在许多实施例中提供改进的性能和/或便利的操作和/或减少的复杂性。特别是，它允许特别实用的实施方式，其得到位置的准确估计因而得到高质量空间体验。按照本发明的可选特征，参数扩展数据描述从下混合信号向多通道信号通道的变换，并且位置单元被布置成响应于多通道信号通道的假定扬声器位置的角度和权重的组合来确定第一空间位置指示的角度方向，通道的每个权重取决于从下混合信号向通道的变换的增益。这可以提供第一信号位置估计的特别有益的确定。特别是，它可以允许基于相对较低复杂性的处理的准确估计，以及在许多实施例中可以特别适合于现有多通道/源编码标准。在一些实施例中，所述装置可以包括用于响应于假定的扬声器位置的角度和权重的组合来确定第二信号分量的第二空间位置指示的角度方向的部件，通道的每个权重取决于从下混合信号向通道的变换的幅度增益。按照本发明的可选特征，所述变换包括包括信号解相关函数的第一子变换以及不包括信号解相关函数的第二子变换，并且其中第一空间位置指示的确定不考虑第一子变换。这可以提供第一信号位置估计的特别有益的确定。特别是，它可以允许基于相对较低复杂性的处理的准确估计，以及在许多实施例中可以特别适合于现有多通道/源编码标准。第一子变换可以具体地对应于参数空间解码操作(如，MPEG环绕解码)的“湿”信号的处理，且第二子变换可以对应于“干”信号的处理。在一些实施例中，所述装置可以被布置成响应于所述变换以及在不考虑第二子变换的情况下确定第二信号分量的第二空间位置指示。按照本发明的可选特征，所述装置进一步包括被布置成响应于参数扩展数据生成第二信号分量的第二空间位置指示的第二位置单元；并且第二合成单元被布置成基于第二空间位置指示合成第二信号分量。这可以在许多实施例中提供改进的空间体验以及特别是可以改进扩散信号分量的感知。按照本发明的可选特征，下混合信号是单声道信号，并且分解单元被布置成生成第一信号分量以对应于单声道信号以及第二信号分量以对应于单声道信号的解相关信号。甚至对于采用简单单声道下混合的编码方案，本发明也可以提供高质量空间体验。按照本发明的可选特征，第一信号分量是主要定向信号分量，第二信号分量是下混合信号的扩散信号分量。本发明可以通过分离和不同地合成定向的和扩散的信号来提供改进和更良好定义的空间体验。按照本发明的可选特征，第二信号分量对应于从补偿第一信号分量的下混合得到的残留信号。这可以在许多实施例中提供特别有益的性能。补偿可以例如通过从下混合的一个或更多个通道中减去第一信号分量。按照本发明的可选特征，分解单元被布置成响应于组合下混合的多个通道的信号的函数确定第一信号分量，该函数取决于至少一个参数，其中，分解单元被进一步布置成确定所述至少一个参数以最大化第一信号分量的功率测量。这可以在许多实施例中提供特别有益的性能。特别是，它可以提供用于把下混合信号分解成对应于(至少)主要定向信号的分量以及对应于扩散环境信号的分量的高效途径。按照本发明的可选特征，多源信号的每个源是声音对象。本发明可以允许多个或各声音对象的改进合成和重现。声音对象可以例如是诸如立体声声音对象之类的多通道声音对象。按照本发明的可选特征，第一空间位置指示包括第一信号分量的距离指示，并且第一合成单元被布置成响应于该距离指示合成第一信号分量。这可以改进听者的空间感知和空间体验。根据本发明的一个方面，提供了合成多声音源信号的方法，该方法包括接收表示多声音源信号的编码信号，该编码信号包括多声音源信号的下混合信号以及用于把下混合信号扩充为多声音源信号的参数扩展数据；执行下混合信号的信号分解以至少生成第一信号分量和第二信号分量，第二信号分量与第一信号分量至少部分地解相关；响应于参数扩展数据确定第一信号分量的第一空间位置指示；基于第一空间位置指示合成第一信号分量；以及合成第二信号分量以从与第一信号分量不同的方向发起。本发明的这些和其它方面、特征和优点将会根据下文中描述的实施例而变得清楚并且参照这些实施例来阐明。

将参照附图只通过实例的方式描述本发明的实施例，在附图中图1图示了 MPEG环绕音频编解码器的元件的实例；
图2图示了按照本发明一些实施例的音频合成器的元件的实例；图3图示了生成单声道信号的解相关信号的元件的实例；以及图4图示了 MPEG环绕音频上混合的元件的实例。
具体实施例方式以下描述关注适用于使用MPEG环绕编码信号的系统的本发明的实施例，但是将会明白本发明不限于此应用而是可以应用于许多其它编码机制。MPEG环绕是在标准IS0/IEC 23003-1，MPEG环绕中运动图像专家组近来标准化的多通道音频编码中重大进展之一。MPEG环绕是允许把现有的基于单声道或立体声的编码器扩展到更多通道的多通道音频编码工具。图1图示了通过MPEG环绕扩展的立体声核心编码器的框图实例。首先MPEG环绕编码器根据下混合器101中的多通道输入信号创建立体声下混合。随后由下混合器101根据多通道输入信号估计空间参数。把这些参数编码成MPEG环绕比特流。使用核心编码器 103 (例如HE-AAC核心编码器)把立体声下混合编码成比特流。所得核心编码器比特流和空间参数比特流在复用器105中被合并以创建总体比特流。典型地，空间比特流包含在核心编码器比特流的辅助数据部分中。因而，用单独编码的单声道或立体声下混合信号表示编码信号。该下混合信号可以在传统解码器中解码和合成以提供单声道或立体声输出信号。此外，编码信号包括包含用于把下混合信号上混合为编码多通道信号的空间参数的参数扩展数据。因而，合适装配的解码器可以通过提取空间参数以及基于这些空间参数将所述下混合信号进行上混合而生成多通道环绕信号。空间参数可以例如包括如对本领域技术人员而言将会公知的通道间级别差异、通道间相关系数、通道间相位差、通道间时间差等。更详细地，图1的解码器首先在解复用器107中提取核心数据(用于下混合的编码数据)和参数扩展数据(空间参数)。在解码器单元109中解码表示下混合信号的数据(即，核心比特流)以便再现立体声下混合。随后把该下混合连同表示空间参数的数据一起馈送到MPEG环绕解码单元111，其首先通过解码比特流的对应数据生成空间参数。随后空间参数被用于立体声下混合进行上混合以便获得多通道输出信号。在图1的实例中，MPEG环绕解码单元111包括处理多通道以提供适合于用耳机听音的双通道空间环绕信号的双耳处理器。因而，对于多个输出通道中的每个输出通道，双耳处理器将HRTF分别应用于用户的右耳和左耳。例如对于五个空间通道，包括总共5个HRTF 对集合以产生双通道空间环绕信号。因而，在实例中，MPEG环绕解码单元111包括两阶段过程。首先，MPEG环绕解码器执行MPEG环绕兼容解码以重新生成编码多通道信号。随后把此解码多通道信号馈送到双耳处理器，该双耳处理器应用HRTF对以生成双耳空间信号(该双耳处理并非MPEG环绕标准的一部分)。因而，在图1的MPEG环绕系统中，合成信号基于对于每个通道具有一个扩音器的假定的扩音器装备。假定扩音器处于HRTF函数中反映的标称位置。然而，此途径易于提供次优的性能，并且事实上有效地试图建模从每一个不同扩音器位置到达用户的信号分量的途径导致声舞台中声音的较不良好定义的位置。例如，为了使用户感知声舞台中特定位置处的声音分量，图1的途径首先计算从此声音分量对每个扩音器的贡献，以及随后计算从这些扩音器位置中的每个位置对到达听者耳朵的信号的贡献。已发现这种途径不仅需求资源而且致使空间体验和音频质量的感知下降。还应当注意虽然可以在一些情况下例如通过对下混合信号应用表示HRTF处理和上混合的组合效果的合适单个矩阵，把上混合和HRTF处理组合到单个处理步骤中，但这种途径仍然固有地反映了将每个通道的各声音辐射(扩音器)进行合成的系统。图2图示了按照本发明一些实施例的音频合成器的实例。在该系统中，把下混合分解成至少两个信号分量，其中一个信号分量对应于主要定向信号分量，而另一个信号分量对应于间接/解相关信号分量。随后通过直接在此直接信号分量的幻象位置处仿真虚拟扩音器而合成该直接分量。此外，根据参数扩展数据的空间参数确定幻象位置。因而，定向信号被直接合成以从一个具体方向发起，相应地在到达听者耳朵的组合信号分量的计算中只涉及两个HRTF函数。此外，幻象位置不限于任何具体扬声器定位(如，立体声扬声器之间)，而是可以来自任何方向，包括来自听者的背部。另外，幻象源的确切位置通过参数扩展数据进行控制，以及因而被生成以从原始输入环绕声信号的适当环绕源方向发起。间接分量独立于定向信号合成并且具体地合成为使得它通常不从计算的幻象位置发起。例如，可以合成它以从一个或多个固定位置(例如，向听者的背部)发起。因而，生成扩散或环境声音分量对应的间接/解相关信号分量以提供扩散空间声音体验。此途径克服了与有赖于每个环绕声通道的声音源位置和(虚拟)扩音器装备相关联的缺点中的一些或所有缺点。具体地，它典型地提供更真实的虚拟环绕声体验。因而，图2的系统提供了包括以下阶段的改进MPEG环绕解码途径 -将下混合分解为主要和环境分量的信号分解，
-基于MPEG环绕空间参数的定向分析，
-利用从定向分析得出的HRTF数据对主要分量的双耳重现，
-利用可以具体地对应于固定位置的不同HRTF数据对环境分量的双耳重现。系统具体地在子带域或频域中操作。因而，把下混合信号变换为信号分解发生的子带域或频域表示。并行地根据空间参数得出定向信息。可以调整典型地为可选地具有距离信息的角度数据的定向信息，例如以包括头部跟踪器设备诱发的偏移。随后对应于所得定向数据的HRTF数据被用于重现/合成主要和环境分量。把所得信号变换回时间域从而得到最终输出信号。更详细地，图2的解码器接收包括左和右通道的立体声下混合信号。把下混合信号馈送给左和右域变换处理器201、203。域变换处理器201、203中的每个把进入的下混合通道转换为子带/频域。域变换处理器201、203生成把下混合信号划分成时间间隔频带块的频域表示，此后称作时频片段。时频片段中的每个对应于具体时间间隔中的具体频率间隔。例如，可以用例如30毫秒持续时间的时间帧表示下混合信号，并且域变换处理器201、203可以在每个时间帧中执行傅立叶变换(例如，快速傅立叶变换)以得到给定数量的频率窗口(bin)。每个帧中的每个频率窗口可以随后对应于时频片段。将会明白在一些实施例中，每个时频片段可以例如包括多个频率窗口和/或时间帧。例如，可以把频率窗口组合以使得每个时频片段对应于Bark带。在许多实施例中，每个时频片段典型地将会小于100毫秒和200 Hz或者频率片段的中心频率的一半。在一些实施例中，将会在整个音频带上执行解码器处理。然而，在具体实例中，将会各自处理每个时间间隔频带块。相应地，以下描述关注对分解、定向分析和合成操作单独地且各自地应用于每个时间间隔频带块的实施方式。此外，在该实例中，每个时间间隔频带块对应于一个时频片段，但是将会明白在一些实施例中可以把多个例如FFT窗口或时间帧分组在一起以形成时间间隔频带块。域变换处理器201、203耦合到信号分解处理器205，该信号分解处理器205布置成分解下混合信号的频域表示以至少生成第一和第二信号分量。生成第一信号分量以对应于下混合信号的主要定向信号分量。具体地，第一信号分量被生成为将会通过经典的扩音器系统中的幅度平移技术获得的幻象源的估值。事实上，信号分解处理器205旨在确定第一信号分量以对应于听者将会从下混合信号表示的声音源接收的直接信号。第二信号分量是与第一信号分量至少部分地(以及常常基本上完全)解相关的信号分量。因而，第二信号分量可以表示下混合信号的扩散信号分量。事实上，信号分解处理器205可以旨在确定第二信号分量以对应于听者将会从下混合信号表示的声音源接收的扩散或间接信号。因而，第二信号分量可以表示下混合信号表示的声音信号的非定向分量，如，混响、房间反射等。所以，第二信号分量可以表示下混合信号表示的环境声音。在许多实施例中，第二信号分量可以对应于从补偿第一信号分量的下混合得到的残留信号。例如，对于立体声下混合，第一信号分量可以被生成为两个通道中信号的加权和，其中制约是权重必须是功率中性的。例如
Χι=α· +b ■ r
其中，1和r分别是左和右通道中的下混合信号，a和b是选择为在如下这种约束下得到X1的最大功率的权重
-Ja2 +b2 ~ 1。因而，第一信号被生成为组合下混合多个通道的信号的函数。函数本身取决于选择为用以使第一信号分量的所得功率最大化的两个参数。在该实例中，进一步约束参数以得到功率中性的下混合的信号组合，即，选择参数以使得参数的变化不影响可实现的功率。此第一信号的计算可以允许所得第一信号分量对应于将会到达听者的主要定向信号的高概率。在实例中，可以随后例如简单地通过从下混合信号中减去第一信号将第二信号计算为剩余信号。例如，在一些场景中，可以生成两个扩散信号，其中，一个这种扩散信号对应于从中减去第一信号分量的左下混合信号，另一个这种扩散信号对应于从中减去第一信号分量的右下混合信号。将会明白可以在不同实施例中使用不同分解途径。例如，对于立体声下混合信号，可以应用欧洲专利申请 EP 07117830. 5 以及 J. Breebaart,E. Schuijers 的“Phantom Materialization A Novel Method to Enhance Stereo Audio Reproduction on Headphones，，，IEEE Transactions on Audio, Speech, and Language Processing,第 16 卷，No. 8，第1503 - 1511页，2008年11月中应用于立体声信号的分解途径。例如，大量分解技术会适合用于把立体声下混合信号分解成一个或多个定向/主要信号分量以及一个或多个环境信号分量。例如，可以根据以下公式把立体声下混合分解成单个定向/主要分量和两个环境分量
权利要求
1.一种用于合成多声音源信号的装置，该装置包括用于接收表示多声音源信号的编码信号的单元(201、203)，编码信号包括用于多声音源信号的下混合信号以及把下混合信号扩充为多声音源信号的参数扩展数据；用于执行下混合信号的信号分解以至少生成第一信号分量和第二信号分量的分解单元(205)，第二信号分量与第一信号分量至少部分地解相关；位置单元(207)，用于响应于参数扩展数据确定第一信号分量的第一空间位置指示；第一合成单元(211、213、215)，用于基于第一空间位置指示合成第一信号分量；以及第二合成单元(211、213、215)，用于合成第二信号分量以从与第一信号分量不同的方向发起。
2.如权利要求1所述的装置，进一步包括用于把下混合划分成时间间隔频带块并且被布置成各自处理每个时间间隔频带块的单元(201、203)。
3.如权利要求2所述的装置，其中，第一合成单元(211、213)被布置成对第一信号分量的时间间隔频带块应用参数头部相关传递函数，参数头部相关传递函数对应于第一空间位置指示表示的位置以及包括每个时间间隔频带块的参数值集合。
4.如权利要求1所述的装置，其中，多声音源信号是空间多通道信号。
5.如权利要求4所述的装置，其中，位置单元(207)被布置成响应于参数扩展数据的上混和参数以及多通道信号通道的假定扬声器位置确定第一空间位置指示，上混和参数指示下混合的上混和以得到多通道信号。
6.如权利要求4所述的装置，其中，参数扩展数据描述从下混合信号向多通道信号通道的变换，并且位置单元(207)被布置成响应于多通道信号通道的假定扬声器位置的角度和权重的组合确定第一空间位置指示的角度方向，通道的每个权重取决于从下混合信号向通道的变换的增益。
7.如权利要求6所述的装置，其中，所述变换包括包括信号解相关函数的第一子变换以及不包括信号解相关函数的第二子变换，且其中，第一空间位置指示的确定不考虑第一子变换。
8.如权利要求1所述的装置，进一步包括第二位置单元(207)，其被布置成响应于参数扩展数据生成第二信号分量的第二空间位置指示；且第二合成单元(211，213，215)被布置成基于第二空间位置指示合成第二信号分量。
9.如权利要求1所述的装置，其中，下混合信号是单声道信号，且分解单元(205)被布置成生成第一信号分量以对应于单声道信号以及第二信号分量以对应于单声道信号的解相关信号。
10.如权利要求1所述的装置，其中，第一信号分量是主要定向信号分量，第二信号分量是下混合信号的扩散信号分量。
11.如权利要求1所述的装置，其中，第二信号分量对应于从补偿第一信号分量的下混合得到的残留信号。
12.如权利要求1所述的装置，其中，分解单元(205)被布置成响应于组合下混合的多个通道的信号的函数确定第一信号分量，该函数取决于至少一个参数，且其中，分解单元 (205)被进一步布置成确定该至少一个参数以使第一信号分量的功率测量最大化。
13.如权利要求1所述的装置，其中，多源信号的每个源是声音对象。
14.如权利要求1所述的装置，其中，第一空间位置指示包括第一信号分量的距离指示，并且第一合成单元(211、213、215)被布置成响应于距离指示合成第一信号分量。
15.一种合成多声音源信号的方法，该方法包括接收表示多声音源信号的编码信号，该编码信号包括多声音源信号的下混合信号以及用于把下混合信号扩充为多声音源信号的参数扩展数据；执行下混合信号的信号分解以至少生成第一信号分量和第二信号分量，第二信号分量与第一信号分量至少部分地解相关；响应于参数扩展数据确定第一信号分量的第一空间位置指示；基于第一空间位置指示合成第一信号分量；以及合成第二信号分量以从与第一信号分量不同的方向发起。
全文摘要
一种音频合成装置，接收包括下混合信号和用于把下混合信号扩充为多声音源信号的参数扩展数据的编码信号。分解处理器(205)执行下混合信号的信号分解以至少生成第一信号分量和第二信号分量，其中第二信号分量与第一信号分量至少部分地解相关。位置处理器(207)响应于参数扩展数据确定第一信号分量的第一空间位置指示，并且双耳处理器(211)基于第一空间位置指示合成第一信号分量以及第二信号分量以从不同方向发起。本发明可以通过使用来自适当位置的主要定向信号的直接合成而非作为来自虚拟扩音器位置的信号的组合而从例如耳机提供改进的空间体验。
文档编号G10L19/00GK102414743SQ201080017735
公开日2012年4月11日申请日期2010年4月14日优先权日2009年4月21日
发明者J. 里恩伯格 A., W. J. 乌门 A., G. P. 舒伊杰斯 E., M. J. 德邦特 F., G. H. 科彭斯 J., 奥斯特罗夫斯基 M. 申请人:皇家飞利浦电子股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：E. G. P. 舒伊杰斯;A. W. J. 乌门;F. M. J. 德邦特;M. 奥斯特罗夫斯基;A. J. 里恩伯格;J. G. H. 科彭斯
技术所有人：E.G.P.舒伊杰斯;A.W.J.乌门;F.M.J.德邦特;M.奥斯特罗夫斯基;A.J.里恩伯格;J.G.H.科彭斯
我是此专利的发明人

上一篇：数字信号再生装置以及数字信号压缩装置的制作方法
上一篇：用于制造层压玻璃件的方法以及层压玻璃件的制作方法