用于扬声器或耳机播放的虚拟音频处理的制作方法

文档序号：6349763阅读：729来源：国知局

专利名称：用于扬声器或耳机播放的虚拟音频处理的制作方法
技术领域：
本申请涉及处理音频信号，更具体地涉及处理音频信号以在虚拟通道上再现声
曰
背景技术：
音频在消费电子中提供内容丰富的多媒体体验方面扮演着重要角色。消费电子设备的可扩展性和移动性以及无线连接的发展，为用户提供了对内容的即时访问。图Ia示出了用于通过本领域技术人员已知的耳机12或扬声器14进行播放的传统音频再现系统10。传统音频再现系统10从音频或音频/视频源18 (例如，CD播放器、TV调谐器、手持媒体播放器等)接收数字或模拟音频源信号16。音频再现系统10可以是家庭影院接收器或专用于选择、处理和路由广播音频和/或视频信号的自动音频系统。可选地，音频再现系统10和一个或多个音频信号源可以在消费电子设备中集成在一起，所述消费电子设备例如是便携式媒体播放器、电视机、膝上型计算机等。音频输出信号20通常经过扬声器系统被处理并被输出以播放。这样的输出信号20可以是发送至耳机12或一对前置扬声器14的双通道信号，或用于环绕声播放的多通道信号。对于环绕声播放，音频再现系统10可以包括多通道解码器，如转让给Digital TheaterSystems, Inc. (DTS)的美国专利第5，974，380号中描述的,其通过引用结合于此。其它常用的多通道解码器包括DTS-HD 和Dolby AC3。音频再现系统10还包括标准处理设备(未示出)，例如用于连接模拟音频源的模数转换器，或数字音频输入接口。音频再现系统10可以包括用于处理音频信号的数字信号处理器，以及用于将处理后的输出信号转换为发送至换能器(耳机12或扬声器14)的电信号的数模转换器和信号放大器。通常，扬声器14可以被布置为由各种应用决定的多种结构。扬声器14可以是如图Ia所不的独立扬声器。可替换地,扬声器14可以结合到同一设备中，例如在诸如电视机、膝上型计算机、手持立体声播放器等消费电子设备的情形下。图Ib示出了具有两个彼此平行布置的嵌入式扬声器24a、24b的膝上型计算机22。嵌入式扬声器彼此间隔较窄，如由a’所示。消费电子设备可以包括以各种朝向布置的嵌入式扬声器24a、24b，例如并列或上下布置。嵌入式扬声器24a、24b的空间和大小是特定于应用的，因此依赖于外壳的大小和物理限制。
由于技术和物理限制，在这样的设备中，音频播放常常作出妥协或被限制。这在具有扬声器间距较窄或用耳机播放声音的物理限制的电子设备(例如膝上型计算机、MP3 播放器、移动电话等)中特别明显。一些设备由于扬声器之间的物理间隔以及由于扬声器和听众之间的相应小角度而被限制。在这样的声音系统中，听众感觉到的感觉声场(sound stage)的宽度通常劣于扬声器具有足够间隔的系统的情形。通常，产品设计者通过不包括中置扬声器来避免偏离电视机的美学设计。这种妥协在声音和对话是朝着中央扬声器时可能会限制电视的整体声音质量。为了解决这些音频限制，通常使用音频处理方法以来通过一对耳机或一对扬声器再现两通道或多通道音频信号。这样的方法包括引人注目的空间增强效果来改进在具有窄间隔扬声器的应用中的音频播放。在美国专利第5，671，287号中，Gerzon公开了具有低“回响(phasiness) ”和基本平坦的再现总能量响应的伪立体声或定向分散效果。伪立体声效果包括很小的不愉快和不期望的主观副作用。其也可以提供控制伪立体声效果的各种参数(例如声源的角展度 (angular spread)的大小)的简单方法。在美国专利第6，370，256号中，McGrath公开了在头部跟踪聆听环境中作用于输入音频信号的头部相关传递函数，头部跟踪聆听环境包括连接至输入音频信号的一系列主分量滤波器，每个滤波器输出预定的模拟声音到达；一系列延迟部件，每个延迟部件连接至相应的一个主分量滤波器，并根据延迟输入将滤波器的输出延迟一可变量，从而产生滤波器延迟输出；求和装置，互连至所述一系列延迟部件，并将滤波器延迟输出求和，以产生音频扬声器输出信号；头部跟踪参数映射单元，具有当前方向信号输入并互连至所述一系列延迟元件的每一个，从而提供延迟输入。在美国专利第6，574，649号中，McGrath公开了用于空间增强的有效卷积技术。利用较低的处理能力，时域输出为输入信号增加各种空间效果。传统的空间音频增强效果包括处理音频信号以提供它们是从虚拟扬声器输出的感觉，从而具有头部外效果(在耳机播放中)，或超越扬声器弧效果(在扬声器播放中)。这样的“虚拟化”处理对于主要包含侧面(或“全左/全右声像(hard-panned)”)声音的音频信号特别有效。然而，当音频信号包含中央声像(center-panned)声音分量时,所感觉到的中央声像声音分量的位置保持为“锚定”在扬声器的中央点处。当这样的声音通过耳机被再现时，它们往往被感觉为被提升，并可能产生不期望的“在头部中”的音频体验。对于双通道或立体声信号，较少强烈混合的音频素材的虚拟音频效果较为不引人注目。就这点而言，中央声像分量在混合中占优势，导致空间增强很小。在输入信号是完全单通道(在左和右音频源通道中相同)的极端情况下，当空间增强算法被启用时，根本听不到空间效果。这在扬声器低于听众的耳朵水平面(水平聆听平面)的系统中特别成为问题。这样的结构出现在膝上型计算机或移动设备中。在这些情况下，音频混合的处理过的全左/ 全右声像分量可以被感觉为超出扬声器并被提升到高于扬声器的平面，而中央声像和/或单通道内容被感觉为从原始扬声器之间发出。这就导致非常“脱节”的再现的立体声图像。因此，鉴于日益增加的对在音频信号中提供空间效果的兴趣和应用，在本领域中需要改进的虚拟音频处理。

发明内容
根据本发明的第一方面，包括一种处理音频信号的方法，该方法包括以下步骤接收至少一个音频信号，所述音频信号至少具有中央通道信号、右侧通道信号和左侧通道信号；使用第一虚拟化处理器处理所述右侧通道信号和所述左侧通道信号，由此创建右虚拟化通道信号和左虚拟化通道信号；使用空间扩展器处理所述中央通道信号以产生有区别的右输出和左输出，由此将中央通道扩展为具有伪立体声效果；以及将所述右输出和所述左输出与所述右虚拟化通道信号和所述左虚拟化通道信号相加，以产生至少一个经修改的侧通道输出。所述中央通道信号被右全通滤波器和左全通滤波器滤波以产生右相移输出信号和左相移输出信号。所述右侧通道信号和所述左侧通道信号被所述第一虚拟化处理器处理以便为所述右侧通道信号和所述左侧通道信号中的至少一个创建不同的所感觉的空间位置。在一个可替换实施例中，使用空间扩展器处理所述中央通道信号的步骤还包括对所述中央通道信号应用延迟或全通滤波器，由此创建经相移的中央通道信号的步骤。接着，从所述中央通道信号减去所述经相移的中央通道信号，以产生所述右输出。然后，将所述中央通道信号加上所述经相移的中央通道信号，以产生所述左输出。在一个可替换实施例中，所述空间扩展器基于用于确定所感觉的空间扩展量的至少一个系数来缩放所述中央通道信号。所述系数由满足a2+b2 = c的乘法因子a和b确定，其中c等于预定常数值。根据本发明的第二方面，包括一种处理音频信号的方法，该方法包括以下步骤接收至少一个音频信号，所述音频信号至少具有右侧通道信号和左侧通道信号；处理所述右侧通道信号和所述左侧通道信号，以提取中央通道信号；使用第一虚拟化处理器进一步处理所述右侧通道信号和所述左侧通道信号，由此创建右虚拟化通道信号和左虚拟化通道信号；使用空间扩展器处理所述中央通道信号以产生有区别的左输出和右输出，由此将中央通道扩展为具有伪立体声效果；以及将所述右输出和所述左输出与所述右虚拟化通道信号和所述左虚拟化通道信号相加，以产生至少一个经修改的侧通道输出。所述第一处理步骤可包括以下步骤将所述右侧通道信号和所述左侧通道信号滤波成多个子带音频信号，每个子带信号与一个不同频带相关联；从每个频带中提取子带中央通道信号；以及将所提取的子带中央通道信号重新组合以产生全频带中央通道信号。所述第一处理步骤可包括通过使用至少一个缩放系数缩放所述右侧子带通道信号或所述左侧子带通道信号中的至少一个，来提取所述子带中央通道信号的步骤。可以想到，所述至少一个缩放系数是通过评估所述右侧通道信号和所述左侧通道信号之间的通道间相似指数来确定的。所述通道间相似指数与所述右侧通道信号和所述左侧通道信号共同的信号分量的大小有关。根据本发明的第三方面，提供一种音频信号处理设备，包括至少一个音频信号，该音频信号至少具有中央通道信号、右侧通道信号和左侧通道信号；处理器，用于接收所述右侧通道信号和所述左侧通道信号，所述处理器使用第一虚拟化处理器处理所述右侧通道信号和所述左侧通道信号，由此创建右虚拟化通道信号和左虚拟化通道信号；空间扩展器，用于接收所述中央通道信号，所述空间扩展器处理所述中央通道信号以产生有区别的右输出信号和左输出信号，由此将中央通道扩展为具有伪立体声效果；以及混合器，用于将所述右输出信号和所述左输出信号与所述右虚拟化通道信号和所述左虚拟化通道信号相加，以产生至少一个经修改的侧通道输出。使用所述第一虚拟化处理器处理所述右侧通道信号和所述左侧通道信号，以便为所述右侧通道信号和所述左侧通道信号中的至少一个创建不同的所感觉的空间位置。通过在结合附图进行阅读时参考下面的具体描述，能够最好地理解本发明。

关于下面的描述和附图，在此公开的各种实施例的这些和其它特征和优点将被更好地理解，通篇类似的标号表示类似的部件，附图中图Ia是示出了用于通过耳机或扬声器进行再现的传统音频再现播放系统的示意图。图Ib是示出了具有间距较窄的两个嵌入式扬声器的膝上型计算机的示意图。图2是示出了用于通过一对前置扬声器进行播放的虚拟音频处理设备的示意图。图3是示出了具有三个并行处理块和包括在中央通道处理块中的空间扩展器的虚拟音频处理系统的框图。图3a是具有HRTF滤波器并产生两个输出信号的前通道虚拟化处理块的框图， HRTF滤波器具有和以及差传递函数。图3b是示出了具有HRTF滤波器并产生两个输出信号的环绕通道虚拟化处理块的框图，HRTF滤波器具有和以及差传递函数。图4是示出了根据本发明的实施例的空间扩展处理的听觉效果的示意图。图5a是描述了用右全通滤波器和左全通滤波器对中央通道信号进行滤波的空间扩展处理块的框图。图5b是包括延迟单元的全通滤波器的框图。图5c是具有延迟单元的空间扩展处理块的框图。图5d是具有一个全通滤波器的空间扩展处理块的框图。图6是虚拟音频处理设备的框图，该虚拟音频处理设备包括用于从右通道信号和左通道信号提取中央通道信号的中央通道提取块。图7是执行子带分析的中央通道提取处理块的框图。图8是在同一处理块中具有空间扩展和通道虚拟化器的虚拟音频处理设备的框图。
具体实施例方式在下面的描述中，阐述了大量特定细节。然而，应该理解本发明的实施例在没有这些特定细节的情况下也可以被实现。在其它情况下，已知的电路、结构和技术没有被示出，以不模糊对本说明书的理解。本发明的一个实施例的元件可以由硬件、固件、软件或其任何组合来实现。当以软件来实现时，本发明的实施例的元件实质上是执行必要任务的代码段。软件可以包括用于执行在本发明的一个实施例中描述的操作的实际代码，或用于仿真或模拟这些操作的代码。程序或代码段可以被存储在处理器或机器可访问介质中，或通过传输介质，由包括在载波中的计算机数据信号或由载波调制的信号发送。“处理器可读或可访问介质”或“机器可读或可访问介质”可以包括能够存储、发送或传递信息的任何介质。处理器可读介质的示例包括电子电路、半导体存储设备、只读存储器(ROM)、闪存、可擦写ROM(EROM)、软盘、紧密盘 (⑶)ROM、光盘、硬盘、光纤介质、射频(RF)链路等等。计算机数据信号可以包括能够通过传输介质传播的任何信号，传输介质例如电子网络信道、光纤、空气、电磁、RF链路等等。代码段可以通过诸如互联网、内联网等的计算机网络被下载。机器可访问介质可以被包括在产品中。机器可访问介质可以包括在被机器访问时使得机器执行下面所述操作的数据。术语“数据”在此表示为机器可读目的被编码的任何类型的信息。因此，其可以包括程序、代码、数据、文件等。本发明的一个实施例全部或部分由软件实现。软件可以具有彼此耦连的多个模块。软件模块耦连至另一模块以接收变量、参数、自变量、指针等等，和/或产生或传递结果、更新的变量、指针等。软件模块还可以是软件驱动程序或与运行在平台上的操作系统交互的接口。软件模块还可以是硬件驱动程序，用于配置、设置、初始化硬件设备，以及发送数据至硬件设备和接收来自硬件设备的数据。本发明的一个实施例可以被描述为处理，其通常被示出为流程图、过程图、结构图或框图。尽管框图可以将操作描述为顺序处理，但是许多操作可以并行或同时执行。此外，操作的顺序可以被重新安排。处理在其操作完成时被终止。处理可以对应于方法、程序、过程等。图2是示出了可以实施本发明一个实施例的环境的示意图。该环境包括虚拟音频处理设备26，其被配置为接收至少一个音频源信号28。音频源信号28可以是任何音频信号，例如单通道信号或双通道信号(例如音乐或TV广播)。双通道音频信号包括预期通过一对前置扬声器LF、RF进行播放的两个侧通道信号LF (t)、RF(t)。可替换的，音频源信号 28可以是多通道信号(例如电影原声)，并包括预期通过环绕声扬声器阵列进行播放的中央通道信号CF (t)和四个侧通道信号LS (t)、LF (t)、RF (t)、RS (t)。优选地，音频信号源28 至少包括左通道信号LF (t)和右通道信号RF(t)。虚拟音频处理设备26处理音频源信号28，以产生音频输出信号30a、30b，以通过扬声器或耳机进行播放。音频源信号28可以是预期通过环绕听众的扬声器阵列14进行表演的多通道信号，该扬声器阵列例如是图Ia所示的标准“5. I”扬声器布局，其具有标记为 LS(左环绕)、LF(左前)、CF(中前)、RF(右前)、RS(右环绕)、SW(重低音)的扬声器。标准“5. I”扬声器布局14是给出的示例，而不是限制性的。就这点而言，可以想到，音频输出信号30a、30b可以被配置为模拟由“m.n”表示的任何源(或“虚拟”)扬声器布局，其中m 是主(卫星)通道的数量，η为重低音(或低频增强)通道的数量。可替换的，音频输出信号30a、30b可以被处理以通过一对耳机12播放。虚拟音频处理设备26具有各种传统处理装置(未示出)，其可以包括连接至数字音频输入和输出接口的数字信号处理器，以及用于存储临时处理数据和处理程序指令的存储设备。音频输出信号30a、30b被引向分别被标记为L和R的一对扬声器。图2不出了用于5通道音频输入信号的扬声器LS、LF、CF、RF和RS的预期布置。在许多实际应用中，例如电视机或膝上型计算机，输出扬声器L和R的物理间隔窄于LF和RF扬声器的预期间隔。在这种情况下，虚拟音频处理设备26被设计为产生立体声展宽效果。立体声展宽效果提供了音频信号LF(t)和RF(t)是从位于位置LF和RF的一对虚拟扬声器发出的错觉。因此，感觉声音是从位于预期扬声器位置的虚拟扬声器发出的。虚拟扬声器可以位于空间声场的任何位置。就这点而言，可以想到，音频源信号28可以被处理为从位于任何被感觉的位置的虚拟扬声器发出。对于5通道音频源信号28，虚拟音频处理设备26产生音频通道信号CF(t)、LS(t) 和RS(t)从分别位于位置CF、LS和RS的扬声器发出的感觉。类似的，音频通道信号CF(t)、 LF(t)和RF(t)可以被感觉为从分别位于位置CF、LF和RF的扬声器发出。如本领域中已知的，这些错觉可以通过考虑到对扬声器至耳朵的声音传递函数(或称为头部相关传递函数(HRTF))的测量或近似，对音频输入信号28进行变换来实现。HRTF与施加在从任何声音源发出的声音上并对围绕听众头部的声音衍射做出贡献的、依赖于频率的时间和幅度差有关。可以想到，来自任何方向的每个源产生两个相关联的HRTF(每个耳朵一个)。重要的是要注意，大部分3D声音系统不能够使用用户的HRTF ;在大多数情况下，使用非个性化的 (通用的)HRTF。通常，基于物理或心理声学的理论方法被用于得出对于大部分人群都通用的非个性化HRTF。同侧(ipsilateral)HRTF表示通向最靠近源的耳朵的路径，而对侧(contralateral)HRTF表示通向最远耳朵的路径。在图2中标注的HRTF如下
H0i:针对前置左或右前实际扬声器位置的同侧HRTF ；
H0c:针对前置左或右前实际扬声器位置的对侧HRTF ；
Hpi:针对前置左或右前虚拟扬声器位置的同侧HRTF ；
Hfc:针对前置左或右前虚拟扬声器位置的对侧HRTF ；
Hsi:针对环绕左或右虚拟扬声器位置的同侧HRTF ；
Hsc:针对环绕左或右虚拟扬声器位置的对侧HRTF ；
Hf针对前置中央虚拟扬声器位置的HRTF (对于两个耳朵是相同的)。
虚拟音频处理设备假定实际扬声器布局和虚拟扬声器布局关于听众的前面方向
为对称关系。在对称关系的情况下，听众位于与CF扬声器有关的直线轴上，从而音频图像在方向上是平衡的。可以想到，头部位置的稍微改变将不会打乱该对称关系。对称关系是示例性提出的，不用于限制。就这点而言，本领域的技术人员应该理解本发明可以扩展到不对称的虚拟扬声器布局，该布局包括位于声场中任何被感觉的位置处的任意数量的虚拟扬声器。在本发明的示例性实施例中，预期的输出扬声器可以是耳机12。在该种情况下，实际输出扬声器L和R位于听众的耳朵处。传递函数Htli是耳机传递函数，而传递函数Hcto可以被忽略。现在参考图3，示出了虚拟音频处理设备26的框图。整个处理被分解成处理音频源信号通道28的三个并行处理块，其输出信号被分别相加以计算出最终的输出信号L(t)， R (t)。每个音频源信号28被虚拟化，从而提供各个源通道信号LF (t)，RF (t)，LS (t)，RS (t)， CF(t)位于3D空间中的不同预定位置的错觉。然而，为了提供预期空间效果，侧通道信号 LF(t)，RF(t)，LS(t)，RS(t)中仅有一个需要被虚拟化。针对5. I通道系统的环绕扬声器的各种虚拟化技术在本领域是已知的。在一些系统中，5. I环绕混合的LS(t)和RS(t)通道可以被双耳处理，从而使用对应于距离任一侧的前方大约110度(环绕扬声器的正常位置) 的HRTF来产生虚拟源。前通道虚拟化处理块34处理前通道源音频信号对LF (t)，RF (t)。环绕通道虚拟化处理块36处理环绕通道源音频信号对LS (t)，RS (t)。中央通道虚拟化处理模块38处理中央通道源音频信号CF(t)。对于前置扬声器输出，中央通道虚拟化处理块38可以包括3dB的信号衰减。对于耳机输出，中央通道虚拟化处理模块38可以对源信号CF(t)应用由传递函数[HfZUJ定义的滤波。现在参考图3a和3b，示出了描述前通道虚拟化处理模块34和环绕通道虚拟化处理块36的优选实施例的框图。本实施例假设实际和虚拟扬声器布局关于听众的前面方向
对称。块HFslm, HFdiff, HSsum和HSdiff表示具有分别由以下各式定义的传递函数的滤波器
HF = 111 SUM=[HFi+HfJ / [H0i+H0c]；
HF 111 DIFF=[Hpi-HpJ / [H0i-H0J ；
HS = iloSUM=[HSi+HSc] / [H0i+H0c]；
HSdiff=[Hsi-HsJ / [H0i-H0J ο返回参考图3，中央通道虚拟化块38之后为空间扩展处理块40(或空间扩展器，下面将详细描述)，从而从单通道输入信号CF (t)产生两个不同(L和R)输出信号，带来伪立体声效果。伪立体声效果将单通道信号转换为双通道或多通道输出信号，从而将单通道信号扩展到双通道或多通道声场。在前置扬声器播放中，得到的主观效果是感觉中央通道音频信号CF(t)从位于实际扬声器附近的扩展空间区域中发出，如图4所示。得到的信号CF(t)因此被散开或分散，从而产生更自然的声音感觉。在耳机播放中，得到的主观效果是更自然和形象地感觉到中央通道音频信号的定位。该主观效果是改进的前方“在头部外”的感觉，从而减轻耳机播放时的一个通常缺点。在图3中，中央通道虚拟化处理块38是单输入单输出滤波器，因此，其可以等同于通过首先对输入信号CF(t)应用空间扩展处理，然后对空间扩展处理块的两个输出信号L 和R中每一个相同地应用中央通道虚拟化处理来修改图3的处理。现在参考图5a，示出了空间扩展处理块40的框图。源信号CF(t)被分成左和右输出信号L、R，它们被不同的全通滤波器APFl和APFk处理。全通滤波器是电子滤波器，其相等地通过所有频率，但是改变各频率之间的相位关系。因此，全通滤波器可以为信号提供依赖于频率的相移和/或随频率改变传播延迟。全通滤波器通常被用于补偿在处理中出现的其它不希望的相移，或与原始信号的未移相版本混合以实现陷波梳状滤波器。它们也可以被用于将混合相位滤波器转换为具有等同的幅度响应的最小相位滤波器，或将不稳定滤波器转换为具有等同的幅度响应的稳定滤波器。现在参考图5b，示出了全通滤波器处理块APF的实施例的框图。全通滤波器APF 包括延迟单元42，表示为Z_N，用于为中央通道信号CF(t)引入时间延迟。数字延迟长度N 用采样来表达，g表示正或负环路增益，以使其幅度|g| < 1.0。优选地，空间扩展处理块 40为各个全通滤波器APF包括不同的数字延迟长度N，延迟的时间长度在3ms到5ms之间。然而，该时间长度的范围不旨在限制，因为时间长度可以根据各种参数来确定。
现在参考图5c，示出了根据一个可替换实施例的空间扩展处理块40的框图。在该实施例中，通过分别将音频源信号CF(t)加上和减去其本身的延迟拷贝，产生空间扩展处理块40的L和R输出信号之间的区别。优选地，拷贝的CF(t)信号包括具有在2ms到 4ms之间的数字延迟长度的时间延迟。对于给定的数字延迟长度N，空间扩展度由缩放系数 a和b确定。缩放系数根据具有比率a/b的乘法因子而生成。优选地，比率a/b被包含在
中。通过利用规则a2+b2 = C，输出信号L和R的总功率可以被限制为与输入信号CF(t)的功率相匹配。可以想到，c等于预定常数。优选地c等于大约O. 5。现在参考图5d，示出了根据一个可替换实施例的空间扩展处理块40的框图。通过用全通滤波器APF代替延迟单元42，来修改图5c的处理块。延迟或全通滤波器被应用于CF(t)，从而产生经相移的中央通道信号。从CF(t)中减去该经相移的中央通道信号，以产生右输出。将CF(t)加上该经相移的中央通道信号，以产生左输出。空间扩展处理块40 的变型可以通过用另一种单输入单输出全通网络代替APF来实现。用于构建单输入单输出全通网络的替换方法可以被应用在图5a或图5d中示出的空间扩展块的实施例中。这些方法包括级联多个单输入单输出全通网络，和/或用另一全通网络代替全通网络滤波器中的任何延迟单元或与之级联。现在参考图6，示出了包括在设备26中的前通道和中央通道虚拟化处理的另一实施例。该实施例在音频源信号28不包括独立的中央通道信号CF(t)时为优选的。中央通道提取处理块44被插在前通道虚拟化处理块34的前面。中央通道提取处理块44接收用 LF(t)，RF(t)表示的前通道信号对，并输出三个信号LF’、RF’和CF’。音频信号CF’是提取的中央通道音频信号，其包含原始左输入信号和右输入信号LF和RF共同的音频信号分量 (或“中央声像”)。音频信号LF’包含定位(或“声像定位”)至原始双通道输入信号(LF， RF)中的左侧的音频信号分量。类似地，音频信号RF’包含定位(或“声像定位”)至输入信号(LF，RF)中的右侧的音频信号分量。三个信号LF’、RF’和CF’然后以与图3的虚拟音频处理设备26中相同的方式被处理。可选地，提取的中央通道信号CF’可以与独立的中央通道输入信号CF(t)加性组合，从而该相同的虚拟音频处理设备26也可以被采用来处理包括原始中央通道信号的多通道输入信号。现在参考图7，示出了中央通道提取处理块44的实施例的框图。音频源通道信号 LF (t)和RF(t)被可选的子带分析级46a、46b处理,子带分析级将信号分解成与不同频带相关联的多个子带音频信号。在包括这些子带分析级46a、46b的实施例中，为每个频带分别执行中央通道提取处理，并且可以可选地被提供合成块，以将与三个输出通道LF (t)、RF(t) 和CF(t)中的每一个相对应的子带输出信号分别重新组合为全频带音频信号LF’、RF’和 CF’。在一个实施例中，中央通道提取处理通过以下来实现LF，= kL * LF ;RF，= kK * RF ;CF，= kc * (LF+RF)；其中&表示用于LF’信号的缩放系数，1^表示用于RF’信号的缩放系数，以及k。表示用于CF’信号的缩放系数。在一个实施例中，缩放系数匕，^和匕由自适应优势检测器块48自适应地计算出，其不断地评估输入通道之间的通道间相似度M，在通道间相似性高时增大kc的值，而在通道间相似性低时减小kc的值。同时，自适应优势检测器块在通道间相似性高时减小&和kK的值，而在通道间相似性低时增大这些值。在本发明的一个实施例中，通道间相似指数M如下定义
M = log [ I LF+RF |2/ | LF-RF |2]现在参考图8，示出了根据一个可替换实施例的虚拟音频处理设备26的框图。空间扩展处理块40和图3a的前通道虚拟化处理块34被组合在单个处理块中。空间扩展处理被应用至滤波器HFsm的输出，该滤波器HFsum的输出是由音频源通道信号LF (t)和RF (t)之和导出的。延迟或全通滤波器被应用于CF(t)，从而产生经相移的中央通道信号。从CF(t) 中减去该经相移的中央通道信号，产生右输出。将CF(t)加上该经相移的中央通道信号，产生左输出。右侧通道信号和左侧通道信号的差被HFdiff处理，以产生滤波后的差信号。该滤波后的差信号与经相移的中央通道信号相加。可选的自适应优势检测器48根据通道间相似指数M来不断调节空间扩展度。可选地，如图7中那样，输入信号LF(t)和RF(t)可以由子带分析块(图8中未示出)进行预处理，以及输出信号L和R可以由合成块进行后处理，以将子带重新组合成全频带信号。特定细节在此通过示例被示出，它们仅出于示意性讨论本发明的实施例的目的，并且是为了提供被认为是对本发明原理和概念方面最有用且最容易理解的描述而呈现的。就这点而言，没有试图示出比基本理解本发明所需的更具体的本发明细节，结合附图的说明使得本领域的技术人员明白本发明的多种形式可以如何在实际中被实现。
权利要求
1.一种处理音频信号的方法，包括以下步骤接收至少一个音频信号，所述音频信号至少具有中央通道信号、右侧通道信号和左侧通道信号；使用第一虚拟化处理器处理所述右侧通道信号和所述左侧通道信号，由此创建右虚拟化通道信号和左虚拟化通道信号；使用空间扩展器处理所述中央通道信号以产生有区别的右输出和左输出，由此将中央通道扩展为具有伪立体声效果；以及将所述右输出和所述左输出与所述右虚拟化通道信号和所述左虚拟化通道信号相加，以产生至少一个经修改的侧通道输出。
2.根据权利要求I所述的方法，其中，使用空间扩展器处理所述中央通道信号的步骤包括使用右全通滤波器处理所述中央通道信号以产生右相移输出信号。
3.根据权利要求I所述的方法，其中，使用空间扩展器处理所述中央通道信号的步骤包括使用左全通滤波器处理所述中央通道信号以产生左相移输出信号。
4.根据权利要求I所述的方法，其中，使用所述第一虚拟化处理器处理所述右侧通道信号和所述左侧通道信号为所述右侧通道信号和所述左侧通道信号中的至少一个创建不同的所感觉的空间位置。
5.根据权利要求I所述的方法，其中，使用空间扩展器处理所述中央通道信号的步骤包括对所述中央通道信号应用延迟或全通滤波器，由此创建经相移的中央通道信号；从所述中央通道信号减去所述经相移的中央通道信号，以产生所述右输出；以及将所述中央通道信号加上所述经相移的中央通道信号，以产生所述左输出。
6.根据权利要求5所述的方法，其中，使用空间扩展器处理所述中央通道信号的步骤还包括基于用于确定所感觉的空间扩展量的至少一个系数来缩放所述中央通道信号的步骤。
7.根据权利要求6所述的方法，其中所述至少一个系数由满足a2+b2= c的乘法因子a 和b来确定，其中c等于预定常数值。
8.根据权利要求7所述的方法，其中所述预定常数值是O.5。
9.根据权利要求I所述的方法，其中所述至少一个音频信号还包括右环绕侧通道信号和左环绕侧通道信号。
10.根据权利要求9所述的方法，其中所述右环绕侧通道信号和所述左环绕侧通道信号被第二虚拟化处理器处理，从而创建右环绕虚拟化通道信号和左环绕虚拟化通道信号。
11.根据权利要求10所述的方法，还包括以下步骤将所述右输出和所述左输出与所述右环绕虚拟化通道信号和所述左环绕虚拟化通道信号相加，以产生至少一个经修改的侧通道输出。
12.根据权利要求I所述的方法，其中所述虚拟化处理器包括由H(sum)表示的第一HRTF 滤波器，以及由H(diff)表不的第二 HRTF滤波器,其中H(sum)和H(diff)包括以下传递函数H(SUM) = [Hi+Hj / [H0i+H0c]；H(DIFF) = [Hi-Hj / [H0i-H0J ；其中，Hi是针对左虚拟扬声器位置或右虚拟扬声器位置的同侧HRTF，H。是针对左虚拟扬声器位置或右虚拟扬声器位置的对侧HRTF ；H0i是针对左实际扬声器位置或右实际扬声器位置的同侧HRTF，H0c是针对左实际扬声器位置或右实际扬声器位置的对侧HRTF。
13.—种处理音频信号的方法，包括以下步骤接收至少一个音频信号，所述音频信号至少具有右侧通道信号和左侧通道信号；处理所述右侧通道信号和所述左侧通道信号，以提取中央通道信号；使用第一虚拟化处理器进一步处理所述右侧通道信号和所述左侧通道信号，由此创建右虚拟化通道信号和左虚拟化通道信号；使用空间扩展器处理所述中央通道信号以产生有区别的左输出和右输出，由此将中央通道扩展为具有伪立体声效果；以及将所述右输出和所述左输出与所述右虚拟化通道信号和所述左虚拟化通道信号相加，以产生至少一个经修改的侧通道输出。
14.根据权利要求13所述的方法，其中所述第一处理步骤包括将所述右侧通道信号和所述左侧通道信号滤波成与不同频带相关联的多个子带音频信号;在至少一个频带中提取子带中央通道信号；以及将所述子带中央通道信号重新组合以产生全频带中央通道信号。
15.根据权利要求13所述的方法，其中所述第一处理步骤包括使用至少一个缩放系数来缩放所述右侧通道信号或所述左侧通道信号中的至少一个。
16.根据权利要求15所述的方法，其中所述至少一个缩放系数是通过不断评估所述右侧通道信号和所述左侧通道信号之间的通道间相似指数来确定的，其中所述通道间相似指数与所述右侧通道信号和所述左侧通道信号共同的信号分量的大小有关。
17.根据权利要求16所述的方法，其中所述通道间相似指数是通过将所述右侧通道信号和所述左侧通道信号的和与差的幂进行比较来确定的。
18.根据权利要求13所述的方法，其中所述第一虚拟化处理器包括由H(sum)表示的第一 HRTF滤波器，以及由H(diff)表示的第二 HRTF滤波器，其中H(sm)和H(DIFF)包括以下传递函数H(SUM) = [Hi+Hj / [H0i+H0c]；H(DIFF) = [Hi-Hj / [H0i-H0J ；其中，Hi是针对左虚拟扬声器位置或右虚拟扬声器位置的同侧HRTF，H。是针对左虚拟扬声器位置或右虚拟扬声器位置的对侧HRTF, H0i是针对左实际扬声器位置或右实际扬声器位置的同侧HRTF，H0c是针对左实际扬声器位置或右实际扬声器位置的对侧HRTF。
19.根据权利要求18所述的方法，包括步骤使用H(sum)处理所述右侧通道信号与所述左侧通道信号之和，以产生所述中央通道信号。
20.根据权利要求13所述的方法，其中使用空间扩展器处理所述中央通道信号的步骤包括对所述中央通道信号应用延迟或全通滤波器，由此创建经相移的中央通道信号；从所述中央通道信号减去所述经相移的中央通道信号，以产生所述右输出；以及将所述中央通道信号加上所述经相移的中央通道信号，以产生所述左输出。
21.根据权利要求18所述的方法，还包括步骤对所述中央通道信号应用延迟或全通滤波器，由此创建经相移的中央通道信号；从所述中央通道信号减去所述经相移的中央通道信号，以产生所述右输出；将所述中央通道信号加上所述经相移的中央通道信号，以产生所述左输出；使用H(diff)处理所述右侧通道信号与所述左侧通道信号之差，以产生经滤波的差信号；以及将所述经滤波的差信号与所述经相移的中央通道信号相加。
22.根据权利要求18所述的方法，其中所述传递函数Htli是耳机传递函数，并且所述传递函数凡。基本为零。
23.根据权利要求20所述的方法，包括基于用于确定所感觉的空间扩展量的至少一个系数来缩放所述中央通道信号的步骤。
24.根据权利要求20所述的方法，其中所述中央通道信号的幅度由基于所述右侧通道信号和所述左侧通道信号之间的通道间相似指数的缩放系数来不断调节，其中所述相似指数与所述右侧通道信号和所述左侧通道信号共同的信号分量的大小有关。
25.根据权利要求I或13所述的方法，其中所述相加步骤产生用于通过耳机进行播放的至少两个经修改的侧通道输出信号。
26.—种音频信号处理设备,包括至少一个音频信号，该音频信号至少具有中央通道信号、右侧通道信号和左侧通道信号;处理器，用于接收所述右侧通道信号和所述左侧通道信号，所述处理器使用第一虚拟化处理器处理所述右侧通道信号和所述左侧通道信号，由此创建右虚拟化通道信号和左虚拟化通道信号；空间扩展器，用于接收所述中央通道信号，所述空间扩展器处理所述中央通道信号以产生有区别的右输出信号和左输出信号，由此将中央通道扩展为具有伪立体声效果；以及混合器，用于将所述右输出信号和所述左输出信号与所述右虚拟化通道信号和所述左虚拟化通道信号相加，以产生至少一个经修改的侧通道输出。
27.根据权利要求26所述的音频信号处理设备，其中，使用所述第一虚拟化处理器处理所述右侧通道信号和所述左侧通道信号为所述右侧通道信号和所述左侧通道信号中的至少一个产生不同的所感觉的空间位置。
28.根据权利要求26所述的音频信号处理设备，其中所述音频信号包括右环绕侧通道信号和左环绕侧通道信号。
全文摘要
提供了处理音频信号的方法和设备。根据本发明的一个方面，包括一种处理音频信号的方法，包括以下步骤接收至少一个音频信号，所述音频信号至少具有中央通道信号、右侧通道信号和左侧通道信号；使用第一虚拟化处理器处理所述右侧通道信号和所述左侧通道信号，由此创建右虚拟化通道信号和左虚拟化通道信号；使用空间扩展器处理所述中央通道信号以产生有区别的右输出和左输出，由此将中央通道扩展为具有伪立体声效果；以及将所述右输出和所述左输出与所述右虚拟化通道信号和所述左虚拟化通道信号相加，以产生至少一个经修改的侧通道输出。
文档编号G06F17/00GK102597987SQ201080028926
公开日2012年7月18日申请日期2010年5月28日优先权日2009年6月1日
发明者J-M·约特, M·沃尔什, W·P·斯密斯申请人:Dts(英属维尔京群岛)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：M·沃尔什;W·P·斯密斯;J-M·约特
技术所有人：DTS（英属维尔京群岛）有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。