使用子带滤波器的立体声呈现技术的制作方法

文档序号：7675720阅读：213来源：国知局

专利名称：使用子带滤波器的立体声呈现技术的制作方法
技术领域：
本发明一般地涉及信号处理，更特别地涉及提供转换函数的精确且有效率的实现的信号处理。

背景技术：
用于实现转换函数的典型信号处理技术经常使用计算密集的高阶滤波器。立体声呈现技术是在只使用两个声道的声场中典型地运用转换函数来合成很多音频源的听觉效果的应用实例。立体声呈现技术产生二声道输出信号，具有从一个或者多个输入信号得出的空间线索，其中每个输入信号与对于一个收听者位置来说特定的位置相关。所得到的二声道输出信号，当在比如耳机或者扬声器的适当设备上回放时，旨在传达声场的相同听觉影像，该声场由源自一个或多个特定位置的输入声信号产生。
沿着由声源到耳朵或者其它感应器的路径的精确路径和遇到的物理特点将导致特定的声音修正。例如，比如大的开放空间或者反射表面的环境或结构特点影响声波，并产生例如回声的各种特征。在本公开中，更特别地提及的是对到达听者耳朵的声波的声音特点和效果。
由声源产生的声波沿着不同的声音路径到达听者的每只耳朵，其通常引起不同的修正。耳朵的位置与外耳、头、肩膀的形状使得声波以不同的声级和不同的谱形状在不同的时间到达每只耳朵。这些修正的累积效果称为头部相关转换函数(HRTF)。HRTF随个人而变化，也随声源与听者的相对位置的变化而变化。听者能够处理由HRTF修正的对两只耳朵的声音信号来确定声源的空间特征，比如源的方向、距离和空间宽度。
立体声呈现过程典型地包括向每个输入信号应用一对滤波器来模拟对该信号的HRTF的效果。每个滤波器对人类听觉系统内的一只耳朵执行HRTF。组合通过向输入信号应用左耳HRTF而产生的全部信号来产生立体声信号的左声道，并且组合通过向输入信号应用右耳HRTF而产生的全部信号来产生立体声信号的右声道。
可从各种源，如收音机和音频光盘，得到二声道信号以用于在扬声器或者耳机上再现，然而很多这些信号传达很少的立体声线索。如果有任何空间影响，这些信号的再现传达的立体声线索更少。这种限制在耳机上回放时尤其显著，其能产生“在头部内”的听觉影像。如果二声道信号传达足够的立体声线索，其在此称为立体声信号，该信号的再现能够产生包括强的空间感受的收听体验。
立体声呈现技术的一种应用是用由仅两个声道再现的多声道音频节目来改善收听体验。多声道音频节目，比如与DVD和HDTV广播的视频节目相关的多声道音频节目，其高品质再现典型地需要具有多声道的放大器和扬声器的适当的收听区域。通常，除非使用立体声呈现技术，否则二声道再现的空间感觉极差。
在对于具有五个输入声道的系统的立体声呈现的典型实现中，例如，立体声输出信号通过向每个输入信号应用两个全带滤波器而获得，一个输出声道使用一个滤波器，并且组合每个输出声道的滤波器输出。该滤波器典型地是有限冲激响应(FIR)数字滤波器，其能够通过卷积合适的离散时间脉冲响应和输入信号来实现。用于呈现HRTF的脉冲响应的长度直接影响实现滤波器所需的处理的计算复杂度。比如快速卷积技术的技术是已知的，其用于降低计算复杂度而又保持滤波器模拟所需HRTF所使用的精度；然而，需要能够实现高品质的转换函数并且计算复杂度更低的技术。

发明内容
本发明的一个目标是提供实现转换函数的滤波器的高效实现方式。
根据本发明的一个方面，一种子带域滤波器结构实现了用于包括立体声呈现的各种应用的HRTF。在一个实施例中，该滤波器结构包括幅度滤波器、分数样本延迟滤波器和相位校正滤波器，它们互相级联设置。存在不同但是等效的结构根据本发明的其它方面，使用一种子带域滤波器结构以用于各种应用，包括音量均衡，其中以逐子带的方式调整信号的音量；房间声音校正，其中根据回放信号的房间的声学性质以逐子带的方式对信号进行衡恒；以及助听，其中信号根据听者的听觉障碍以逐子带的方式对信号进行均衡。
可有利地与产生任何数目声道的输出信号的处理方法和系统一起使用本发明。
通过实施本发明而实现的处理方法可结合其它编码技术，例如高级音频编码(AAC)和环绕声道信号编码(MPEG环绕)。子带域滤波器结构可用于降低系统整体的计算复杂度，其中通过重新排列以及组合该结构的元件以消除子带或多声道中的冗余滤波来使用它。
本发明的各种特征以及其优选实施例可通过参考下列讨论和附图而更好地理解。下列提出的讨论和附图的内容仅作为例子，而不应该理解为表示对本发明范围的限制。

图1a和1b是在音频编码系统中的编码器和解码器的示意方块图。
图2和3是立体声呈现五声道音频信息的音频解码器的示意方块图。
图4是HRTF的幅度和相位响应的示意图。
图5是耦合至合成滤波器组的输入的子带域滤波器结构的示意方块图。
图6是子带滤波器的示意方块图。
图7是包括子带域滤波器结构的音频解码系统的示意方块图。
图8是子带域滤波器结构和相应时域滤波器结构的示意方块图。
图9是表示用于多速滤波器系统的Noble等式。
图10和11是子带滤波器响应的示意图。
图12a和12b是子带延迟滤波器的群延迟的示意图。
图13是空间音频解码器中的分量的示意方块图。
图14和15是耦合至实现立体声呈现的滤波器结构的空间音频解码器的分量的示意方块图。
图16和17是组合公共分量滤波器以降低计算复杂度的滤波器结构的示意方块图。
图18是用于实现本发明各方面的设备的示意方块图。

具体实施例方式 A.引言本发明可有利地在包括音频压缩或音频编码的各种应用中使用。音频编码用于减少存储或者发送音频信息所需空间或带宽的数量。一些感知音频编码技术将音频信号分割为多个子带信号，并以试图要保存所感知或主观的音频信号品质的方式编码子带信号。一些这些技术公知为Dolby DigitalTM、Dolby TrueHDTM、MPEG 1 Layer 3(mp3)，MPEG 4 Advanced Audio Coding(AAC)和High Efficiency AAC(HE-AAC)。
其它编码技术可独立使用或与上述感知编码技术组合使用。一种被称为空间音频解码(SAC)的技术可用于以如下方式通过将各个输入信号组合或者向下混频为合成信号来压缩多音频声道使得原始输入信号的复制能够通过向上混频该合成信号恢复。如果期望，该种处理能够产生“边带信息”或者“元数据”来帮助控制向上混频处理。典型地，合成信号具有一个或两个声道，并以这样的方式产生尽管其可能缺乏完整的空间感觉，但其能被直接回放以提供可接受的听觉体验。该处理的例子包括公知的Dolby ProLogic和ProLogic2技术。这些特别的方法不使用元数据，而是在编码/向下混频处理期间，使用在探测到的声道之间的相位关系。其它技术在编码/向下混频处理期间产生元数据参数，如上所述在向上混频处理期间使用元数据参数。典型的源数据参数包括声道水平差(CLD)、声道间时间差(ITD)或者声道间相位差(IPD)，以及声道间相干(ICC)。典型地为所有输入声道信号上的多个子带估计元数据参数。
用于空间编码系统的编码器和解码器分别在图1a和1b中所示。利用例如离散傅立叶变换(DFT)、修正离散余弦变换(MDCT)或者一组正交镜像滤波器(QMF)的各种技术之一实现的适当的分析滤波器组，该编码器将N声道输入信号分割成时间/频率(T/F)域内的子带信号。计算CLD、ITD、IPD和/或ICC的估计以作为每个子带的边带信息或者元数据。如果对应N声道输入信号的M声道混合信号尚未存在，该边带信息可用于将原始N声道输入信号向下混频为M通道合成信号。可选择地，可用同一滤波器组同步地处理已存在的M声道合成信号，可相对于M声道合成信号计算N声道输入信号的边带信息。该边带信息和合成信号被编码并和合成为经编码的输出信号。解码器从该被编码的信号获得M声道合成信号和边带信息。该合成信号转换到T/F域，并且该边带信息用于向上混频该合成信号为相应子带信号，以产生N声道T/F域信号。适当的合成滤波器组应用到N声道T/F域信号，以恢复原始N声道时域信号的估计。可选择地，可省略向上混频处理，并且作为代替，播放该M声道合成信号。
图2表示常规的编码系统，其中经解码的音频信号的五个输出声道要被立体声呈现。在该系统中，每个输出声道信号由各自的合成滤波器组产生。实现左耳和右耳HRTF的滤波器应用到每个输入声道信号，且组合滤波器输出信号以产生二声道立体声信号。可选择地，如图3所示，实现HRTF的多对滤波器可应用到T/F域信号以产生多对经滤波的信号，它们被组合成以产生左耳和右耳T/F域信号，以及随后用各自的合成滤波器组转换成时域信号。该可选择的实施例是吸引人的，因为其通常可以减少合成滤波器的数量，这些合成滤波器是计算密集的且需要相当多的计算资源来实现。
用于执行如图2和3中所示的常规系统中的HRTF的滤波器是典型地计算密集的，因为HRTF具有很多精细频谱细节。典型HRTF的响应如图4所示。在幅度响应中的精细细节的精确实现需要高阶滤波器，它们是计算密集的。根据本发明的子带域滤波器结构能够精确地实现HRTF而不需要高阶滤波器。
B.子带域滤波器结构 1.概述子带域滤波器结构如图5所示。每个子带信号xk(n)由滤波器Sk(z)处理，该滤波器实现对HRTF中相应于子带的部分的近似。在图6中示出了一种实现方式，每个子带滤波器Sk(z)包括三个滤波器的级联。滤波器Ak(z)改变子带信号的幅度。滤波器Dk(z)将子带信号的群延迟改变包括一个取样周期的分数的量，其在此称为分数样本延迟。滤波器Pk(z)改变子带信号的相位。
幅度滤波器Ak(z)被设计成确保子带域滤波器结构的合成幅度响应等于或近似等于在特定子带内的目标HRTF的幅度响应。
对于至少一些子带，延迟滤波器Dk(z)是分数样本延迟滤波器，其被设计成对特定子带内的信号分量精确地模型化目标HRTF的延迟。优选地，延迟滤波器在子带整个频率范围上提供恒定的分数样本延迟。
相位滤波器Pk(z)被设计成利用相位滤波器的响应提供连续相位响应，以当在合成滤波器合成子带信号时，用于避免不期望的信号消除效果。
将在下面更详细地描述这些滤波器。
图7是包含本发明子带域滤波器结构的具有N声道输入和二声道输出的音频编码系统的示意图。每个输入声道信号用分析滤波器组分割成子带信号并被编码。经编码的子带信号被组合成经编码的信号或者比特流。经编码的信号随后被解码为子带信号。每个被解码的子带信号由合适的子带域滤波器结构处理，其中记号SnL，m(z)和SnR，m(z)表示用于声道n的子带m的子带域滤波器结构，并且组合其输出以分别形成L声道和R声道输出信号。L声道输出的经滤波的子带信号被组合，并由产生L声道输出信号的合成滤波器组处理。R声道输出的经滤波的子带信号被组合，并由产生R声道输出信号的合成滤波器组处理。
本发明的子带域滤波器结构还可用于实现除了HRTF之外的其它类型的信号处理元件，并且除了立体声呈现还可用于其它应用。上面陈述了一些例子。
下面的部分描述可用于设计幅度、延迟和相位滤波器的方法。如果期望，其它技术可用于设计这些滤波器。无特定设计技术对本发明是关键的。此外，任何或所有这些滤波器都可通过包括另一个滤波器的响应特征而实现为另一个滤波器的一部分。
2.幅度滤波器如上面所解释的，子带域滤波器结构应用于一组子带信号，并向合成滤波器组的输入提供其经滤波的输出，如图8的左手侧所示。设计该子带域结构，以便随后的合成滤波器组的输出基本上与由图8的右手侧所示的目标时域滤波器所获得的输出相同。该时域滤波器耦合到合成滤波器组的输出。
图8左手侧上所示的系统的输出Y(z)可表示为其中M＝子带的总数； X(z)＝到分析滤波器组的输入信号； Hk(z)＝子带k的分析滤波器组的脉冲响应； Gk(z)＝子带k的合成滤波器组的脉冲响应； xT(z)＝[X(z)，X(zW)，...，X(zWM-1)]；(2)
gT(z)＝[G1(z)·S1(zM)，...GM(z)·SM(zM)]；以及 (4) 在公式4中所示的zM符合图9所示的多速系统的Noble等式。
为了简化随后的推导，假设分析滤波器组或者是复杂的过抽样滤波器组，就像在HE-AAC或MPEG环绕编码系统中使用的那些(参见2005年5月第118届AES大会的大会论文欲印版第6447号Herre等人的“The Reference Model Architecture for MPEG Spatial AudioCoding”)，或者其实现抗锯齿技术(参见2004年5月第116届AES大会的大会论文欲印版第6048号Shimada等人的“A Low Power SBRAlgorithm for the MPEG-4 Audio Standard and its DSPImplementation”)，以便其在HAC(z)·g(z)中的锯齿项是可忽略的。以此假设 HAC(z)·g(z)＝[T(z)，0，...，0]T (5) 其中使用公式5和6，公式1可被重写为在图8的右手侧上所示的系统的输出Y’(z)可表示为其中F(z)＝目标时域滤波器。
如果图8所示的两个系统提供相等的结果，则Y(z)＝Y’(z)，并且从公式7和8 其中为简化随后的推导，在公式9中进一步被考虑的元素仅仅是具有显著能量的那些。参考图10，对于设计良好的滤波器组，只有子带k和k+1在靠近子带界限的频率ω处具有显著能量 k＝1，...M-1 其中

并且结果，公式9可简化如下 Hk(ω)Sk(Mω)Gk(ω)+Hk+1(ω)Sk+1(Mω)Gk+1(ω)＝T′(ω) (12) 每个子带域滤波器在频率ω的频率响应由带入z＝ejω而获得。此外，相位转换函数Pk(z)以这样的方式设计，其中公式12中的第一和第二项的相位响应近似相等。结果，该两个滤波器的合成幅度响应等于他们幅度响应的合成。幅度滤波器Ak(z)也需要是实数系数线性相位FIR滤波器。使用这些要求以及幅度滤波器Ak(z)的幅度响应为对称的观察结果，以及知道滤波器F(z)为期望响应下，在下面表示的公式系统可对给定频率的幅度响应写出。参考图11可有助于这些方程结构的可视化。
|F1(Δω)H1(Δω)‖A1(Δω)|＝|T′(Δω)| (13) |FM(π-Δω)HM(π-Δω)‖AM(π-MΔω)|＝|T′(π-Δω)|(16) 其中通过限制Δω为一组离散值，上面所示的方程可被求解以对ω＝MΔωi和ω＝π-MΔωi获得幅度响应|Ak(ω)|。该响应可用于使用在例如纽约John Wiley & Sons1987年出版的Park等人所著的DigitalFilter Design中所述的技术来设计幅度滤波器Ak(z)。
该设计过程可概括如下对k＝1，...，M求解公式13至16而获得幅度响应|Ak(ω)|，并使用该响应来设计线性相位FIR滤波器Ak(z)。
3.延迟滤波器提供分数样本延迟的滤波器用于优选实施例中，因为以频带为基准精细控制组延迟涉及声道间相位差(IPD)、声道间时间差(ITD)和声道间相干差(ICC)。所有这些差在产生精确空间效果上是重要的。分数样本延迟在使用多速滤波器组和向下抽样的实施例中甚至更加期望，因为子带域滤波器结构在降低的抽样速率下工作，该抽样速率的周期甚至比原始信号的抽样间隔还长。
优选地，延迟滤波器被设计为在整个子带的整个带宽上具有近似线性的相位。结果，延迟滤波器在子带的整个带宽上具有大致恒定的组延迟。这显著地降低了在子带边界处的组延迟的失真。用于实现该设计的优选方法是避免尝试消除组延迟失真，而是取而代之地对该子带将任何失真移动到合成滤波器的通带之外的频率上。
在根据其带宽将子带信号向下抽样的实施例中，对每个子带信号的抽样率FSsubband为其中M＝子带的抽取因数；并且 FStime＝原始输入信号的抽样率。
理论上，对所有频率都提供恒定的分数取样延迟的理想分数样本延迟(FD)滤波器需要无限冲激响应。遗憾的是，这是不实际的，FD滤波器的实际设计通常使用在某些频率范围[-ω0，ω0]上提供精确的分数样本延迟的实数值全通FIR或IIR滤波器，其中ω0<π。在接近Nyquist频率ω＝π的频率处，延迟会有较大的偏差。这对于全带宽FD滤波器一般不成问题，因为Nyquist频率通常很高并且在感觉上不显著。遗憾的是，子带FD滤波器的Nyquist频率在子带域滤波器结构中将被映射至在子带边界上的频率。这些频率低得多，并一般感觉得到。因此，常规FD滤波器是不理想的。
避免该问题的一个方法是用复数正弦信号调制实数值系数FD滤波器的脉冲响应，以移动滤波器的恒定延迟范围，以便其覆盖调制后的期望的频率范围。以图10为例说明。图12a表示实数值系数的六阶FIR FD滤波器的延迟，其在整个频率范围[-π/2，π/2)上具有几乎恒定的分数样本延迟。该延迟的较大偏差发生在Nyquist频率π附近。图12b表示同一滤波器但是用复数正弦信号s(n)＝ejnπ/2调制。得到的组延迟平移了π/2，在整个频率范围[0，π)上提供几乎恒定的分数抽样延迟。
优选地，FD滤波器在子带合成滤波后具有显著能量的频率范围中应具有恒定的分数抽样延迟。如图10中所示，子带k的恒定的分数样本延迟应覆盖频率范围[(k-1)π，kπ)，其对应于k＝1，3，5，...的抽取的子带域中的频率范围[0，π)，并且对应于k＝2，4，6，...的抽取的子带域的频率范围[-π，0)。结果，期望的FD滤波器可通过用频率为或者的复数正弦调制原型FD滤波器而获得。
该设计过程可总结如下设计具有脉冲响应h’k(n)，n＝0，...，Lk-1的原型FD滤波器D’k(z)，其中Lk是滤波器的长度，并且对k的奇数值用复数正弦，以及对k的偶数值用复数正弦调制脉冲响应h’k(n)。原型滤波器可用IEEE信号处理杂志1996年1月第30-36页的Laakso等人的“Splitting the Unit Delay-Tools for FractionalDelay Filter Design”中公开的各种方法获得。
4.相位滤波器对每个子带k的相位校正滤波器

被设计成保证滤波器Hk(z)Sk(z)Gk(z)的整体相位响应在所有子带之间的边界上在频率k＝1，...，M-1上对齐。通过匹配每个相邻子带滤波器之间的相位响应，可以避免合成滤波器组中的不期望的信号消除。换言之，整个子带边界上的连续相位响应保证子带滤波器不会在一个子带中产生这样的信号，它不正确地取消或者衰减在相邻子带内产生的信号。这可以通过选择相位校正角

，以便子带k内的滤波器Hk(z)Sk(z)Gk(z)的相位响应φk(ω)满足以下等式来实现k＝1，...，M-1. 对很多实施例，其它设计考虑的子带域滤波器Sk(z)在相邻子带之间的边界上得到类似延迟量。该条件通常足以保证在子带之间的边界上相邻子带中的滤波器的相位响应相匹配。
C.低复杂度的变形能够以以下所述的几个方式减少用于实现子带域滤波器结构的技术的计算复杂度。
1.子带滤波器阶可减少在一些较高频率子带中使用的滤波器的计算复杂度，因为在这些子带中的目标HRTF响应的频谱细节较粗并且因为听觉敏锐度在这些子带内的频率处降低。
公知的是人类听觉系统不以相等的敏感度感觉不同频率的声音。每当模拟的HRTF中的输出误差不可辨别的时候，能够降低子带域滤波器的计算复杂度。例如，可在较高频率的子带中使用较低阶的幅度滤波器Ak(z)而不会降低感觉到的声音品质。经验测试已经表明，对于频率为约2kHz以上的子带，可用零阶FIR滤波器满意地模型化很多HRTF的幅度响应。对于这些子带，幅度滤波器Ak(z)可实现为单一的缩放因子。通过使用整数样本延迟滤波器，延迟滤波器Dk(z)的计算复杂度也可在较高频率子带内被降低。对于频率在约1.5kHz以上的子带，分数样本延迟可用整数样本延迟替换，因为人类听觉系统在较高频率处对ITD不敏感。整数样本延迟滤波器比FD滤波器实现起来更便宜。
2.组合编码处理如图3中所示的音频解码器中用于应用空间边带信息的处理的计算复杂度，能够通过组合以及简化用于执行空间音频解码和立体声呈现的两个处理而降低。
如上所述，典型的边带信息参数包括声道水平差(CLD)、声道间时间差(ITD)或者声道间相位差(IPD)，以及声道间相干性(ICC)。实际上，CLD和ICC在重建原始多声道音频节目的精确空间图像中更重要。
如果仅使用CLD和ICC参数，图3中所示的应用空间边带信息方块可如在13中所示的被实现。在该例子中，原始多声道音频节目被向下混频为单声道信号。标示有CLD的方块表示获得每个输出声道信号的合适信号幅度的处理，并且标示有ICC的方块表示获得输出声道信号之间适当量的去相关的处理。每个CLD方块处理可利用应用到整个宽带的单声道信号的增益而实现，或者其可利用应用到单声道信号的子带的一组不同增益而实现。每个ICC方块处理可通过应用至宽带单声道信号的全通滤波器而实现，或者其可通过应用到单声道信号的子带的一组不同的全通滤波器而实现。
如果期望，可通过只使用CLD方块处理而进一步降低解码和立体声呈现处理的计算复杂度，代价是进一步降低输出信号品质。图14表示该简化处理怎样被包括到图3所示的系统内的。Rs、R、C、L和Ls(右环绕、右、中、左和左环绕)声道的信号只在幅度上彼此不同。
图14所示的处理元件的结构可如图15所示的那样重新排列，而不影响结果的精度，因为所有的处理都是线性的。如图所示，对图14所示的每个独立HRTF，用于实现滤波器结构的处理由宽带增益因子或者一组子带增益因子修正，然后组合形成如图15所示的滤波器结构，该结构对每个输出声道实现合成HRTF。在某些应用中，CLD增益因子以被编码的信号传达且被周期性地修改。在该类型应用中，对不同合成HRTF的新滤波器结构用每次变化的增益因子形成。
因为形成对合成HRTF的子带域滤波器结构，以及然后对这些合成HRTF应用这些滤波器所需的计算资源量，比对图14所示的单独HRTF应用滤波器结构的计算资源量少，所以该方法可降低该解码处理的计算复杂度。该计算复杂度的降低应当对立体声呈现的品质中的降低平衡。对品质降低的主要原因是省略根据ICC参数对信号去相关所需的处理。
3.组合滤波器如果用于两个或更多子带的滤波器具有任何公共的分量滤波器Ak(z)、Dk(z)或者Pk(z)，则可降低这些子带的滤波器的计算复杂度。通过组合这些子带内的信号以及仅应用一次公共分量，可实现公共分量滤波器。
图16中示出用于立体声呈现的例子。在该例子中，用于声源1、2、3的HRTF在子带k中基本上具有相同的延迟滤波器Dk(z)，并且用于声源4和5的HRTF在子带k中基本上具有相同的延迟滤波器Dk(z)以及基本上相同的相位滤波器Pk(z)。在子带k中用于声源1、2、3的HRTF的延迟滤波器通过向下混频子带信号并向经向下混频的信号应用一个延迟滤波器Dk(z)而实现。在子带k内用于声源4和5的HRTF的延迟和相位滤波器通过向下混频子带信号并向该经向下混频的信号应用一个相位滤波器Pk(z)和一个延迟滤波器Dk(z)而实现。该经向下混频和滤波的子带信号如上面讨论的那样组合并输入到合成滤波器组。
如果一个分量滤波器对所有子带与所有声道或源是公共的，则该公共的滤波器可如在图17中所示的例子那样在时域中实现，并被应用于合成滤波器的输出。如果公共滤波器为延迟滤波器，可通过设计滤波器提供整数样本延迟而进一步降低计算复杂度。
D.实现包括本发明各个方面的设备可以各种方式实施，包括由计算机执行的软件或者一些包括更专业元件的其它设备，例如耦合到类似于那些在通用计算机中安装的数字信号处理器(DSP)电路。图18是可用于实现本发明各方面的设备70的示意方块图。DSP72提供计算源。RAM 73是由DSP 72使用用于处理的系统随机存取存储器(RAM)。ROM 74表示永久存储器的某种形式，例如用于存储操作装置70所需程序并且可能用于执行本发明各个方面的只读存储器(ROM)。I/O控制75表示通过通信通道76、77接收和传送信号的接口电路。在所示的实施例中，所有的主要系统元件连接到总线71，其可表示多于一个的物理或逻辑总线；然而，不需要总线结构来实现本发明。
在由通用计算机系统执行的实施例中，可包括另外的元件用于与例如键盘或鼠标和显示器的结构设备交互，用于控制具有例如磁带或磁盘、或者光学介质的存储介质的存储设备78。该存储介质可用于记录用于操作系统、公用程序和应用程式的指令程序，并可包括实现本发明各个方面的程序。
实施本发明各个方面所需的功能可以由以各种方式实现的元件来执行，包括离散逻辑元件、集成电路、一个或多个ASIC和/或受程序控制的处理器。这些元件实现的方式对本发明不重要。
本发明的软件实现可用各种机器可读介质传达，例如包括基带或者由超声波至紫外线频率的整个频谱调制的通信路径，或者包括实质上使用任何记录技术传达信息的存储介质，包括磁带、卡片或磁盘、光学卡片或光盘、以及在包括纸的媒介上可探测的标记。
权利要求书(按照条约第19条的修改)
1.一种用于处理表示输入信号的输入信息的方法，其中该方法包括
接收该输入信息，并从其获得该输入信号的多个子带信号；
通过对相应的子带信号应用幅度、延迟和相位校正滤波器而产生各自的经滤波的信号，其中每个各自的经滤波的信号对于其相应的子带信号而言在幅度上被改变、在时间上被延迟并且在相位上被修正，并且其中至少一些延迟滤波器是分数样本延迟滤波器；以及
通过向经滤波的信号应用合成滤波器组，产生输出信号。
2.根据权利要求1的方法，其中通过以复数正弦调制具有实数值系数的原型分数样本延迟滤波器的脉冲响应而获得所述分数样本延迟滤波器。
3.根据权利要求1或2的方法，其中至少一些延迟滤波器是整数样本延迟滤波器。
4.根据权利要求1至3的任何一个的方法，其中由有限冲激响应(FIR)滤波器实现各个延迟滤波器，所述有限冲激响应滤波器的组延迟在包括由各个延迟滤波器过滤的各个子带信号的带宽的频率范围上偏离一个恒定值，并且其中各个子带信号的带宽内的偏移量小于此带宽之外的偏移量。
5.如权利要求1至4的任何一个的方法，其其中所述合成滤波器组是多速滤波器组。
6.如权利要求1至5的任何一个的方法，其中由公共滤波器在时间上延迟，或者在相位上修正两个或多个各自经滤波的信号。
7.根据权利要求1至6任何一个的方法，包括
用子带增益因子修正多个滤波器；以及
组合该经修正的滤波器形成合成滤波器结构，该结构包括应用于所述子带信号的延迟和相位校正滤波器。
8.根据权利要求7的方法，其包括从输入信息获得所述子带增益因子。
9.一种处理表示输入信号的输入信息的装置，其中该装置包括
用于接收该输入信息，并从其获得该输入信号的多个子带信号的装置；
用于通过对相应的子带信号应用幅度、延迟和相位校正滤波器而产生各自的经滤波的信号的装置，其中每个各自的经滤波的信号对于其相应的子带信号而言在幅度上被改变、在时间上被延迟并且在相位上被修正，并且其中至少一些延迟滤波器是分数样本延迟滤波器；以及
用于通过向经滤波的信号应用合成滤波器组以产生输出信号的装置。
10.根据权利要求9的装置，其中通过以复数正弦调制具有实数值系数的原型分数样本延迟滤波器的脉冲响应而获得所述分数样本延迟滤波器。
11.根据权利要求9或10的装置，其中至少一些延迟滤波器是整数样本延迟滤波器。
12.根据权利要求9至11的任一个的装置，其中由有限冲激响应(FIR)滤波器实现各个延迟滤波器，所述有限冲激响应滤波器的组延迟在包括由各个延迟滤波器过滤的各个子带信号的带宽的频率范围上偏离一个恒定值，并且其中各个子带信号的带宽内的偏移量小于此带宽之外的偏移量。
13.如权利要求9至12的任何一个的装置，其中所述合成滤波器组是多速滤波器组。
14.如权利要求9至13的任何一个的装置，其中由公共滤波器在时间上延迟，或者在相位上修正两个或多个各自经滤波的信号。
15.根据权利要求9至14的装置，包括
用子带增益因子修正多个滤波器的装置；以及
组合该经修正的滤波器形成合成滤波器结构的装置，该结构包括应用于所述子带信号的延迟和相位校正滤波器。
16.根据权利要求15的装置，其包括从输入信息获得子带增益因子的装置。
17.一种传达指令程序的介质，其可由设备执行，以实现在权利要求1至8的任何一个描述的方法。
权利要求
1.一种用于处理表示输入信号的输入信息的方法，其中该方法包括
接收该输入信息，并从其获得该输入信号的多个子带信号；
通过对相应的子带信号应用延迟和相位校正滤波器而产生各自的经滤波的信号，其中每个各自的经滤波的信号对于其相应的子带信号而言在时间上被延迟，并且在相位上被修正；以及
通过向经滤波的信号应用合成滤波器组，产生输出信号。
2.根据权利要求1的方法，其中也通过对所述相应的子带信号应用幅度响应随频率变化的滤波器来产生所述各自的经滤波的信号，使得相对相应的子带信号幅度而改变所述各自的经滤波的信号幅度。
3.根据权利要求1或2的方法，其中至少一些延迟滤波器是分数样本延迟滤波器。
4.根据权利要求3的方法，其中通过以复数正弦调制具有实数值系数的原型分数样本延迟滤波器的脉冲响应而获得所述分数样本延迟滤波器。
5.根据权利要求1或2的方法，其中至少一些延迟滤波器是整数样本延迟滤波器。
6.根据权利要求1至5的任何一个的方法，其中由有限冲激响应(FIR)滤波器实现各个延迟滤波器，所述有限冲激响应滤波器的组延迟在包括由各个延迟滤波器过滤的各个子带信号的带宽的频率范围上偏离一个恒定值，并且其中各个子带信号的带宽内的偏移量小于此带宽之外的偏移量。
7.如权利要求1至6的任何一个的方法，其中所述合成滤波器组是多速滤波器组。
8.如权利要求1至7的任何一个的方法，其中由公共滤波器在时间上延迟，或者在相位上修正两个或多个各自经滤波的信号。
9.根据权利要求1至8任何一个的方法，包括
用子带增益因子修正多个滤波器；以及
组合该经修正的滤波器形成合成滤波器结构，该结构包括应用于所述子带信号的延迟和相位校正滤波器。
10.根据权利要求9的方法，其包括从输入信息获得所述子带增益因子。
11.一种用于处理表示输入信号的输入信息的方法，其中该方法包括
接收该输入信息并从其获得该输入信号的多个子带信号；
通过向多个子带滤波器的每一个应用各自的子带增益因子，产生一组经修正的子带滤波器；
对多个子带中每个子带，将各个子带的经修正的子带滤波器组合为合成子带滤波器；
通过对相应子带信号应用该合成子带滤波器到，产生各自的经滤波的信号；以及
通过向该经滤波的信号应用合成滤波器组，产生输出信号。
12.根据权利要求11的方法，其包括从输入信息获得子带增益因子。
13.根据权利要求11或12的方法，其中该输入信号表示多声道音频节目，并且该子带增益因子表示多声道的声道水平差。
14.一种处理表示输入信号的输入信息的装置，其中该装置包括
用于接收该输入信息，并从其获得该输入信号的多个子带信号的装置；
用于通过对相应的子带信号应用延迟和相位校正滤波器而产生各自的经滤波的信号的装置，其中每个各自的经滤波的信号对于其相应的子带信号而言在时间上被延迟，并且在相位上被修正；以及
用于通过向经滤波的信号应用合成滤波器组以产生输出信号的装置。
15.根据权利要求14的装置，其中用于产生各自的经滤波的信号的装置也应用幅度响应随频率变化的滤波器来产生所述各自的经滤波的信号，使得相对相应的子带信号幅度而改变所述各自的经滤波的信号幅度。
16.根据权利要求14或15的装置，其中至少一些延迟滤波器是分数样本延迟滤波器。
17.根据权利要求16的装置，其中通过以复数正弦调制具有实数值系数的原型分数样本延迟滤波器的脉冲响应而获得所述分数样本延迟滤波器。
18.根据权利要求14或15的装置，其中至少一些延迟滤波器是整数样本延迟滤波器。
19.根据权利要求14至18的任何一个的装置，其中由有限冲激响应(FIR)滤波器实现各个延迟滤波器，所述有限冲激响应滤波器的组延迟在包括由各个延迟滤波器过滤的各个子带信号的带宽的频率范围上偏离一个恒定值，并且其中各个子带信号的带宽内的偏移量小于此带宽之外的偏移量。
20.如权利要求14至19的任何一个的装置，其中所述合成滤波器组是多速滤波器组。
21.如权利要求14至20的任何一个的装置，其中由公共滤波器在时间上延迟，或者在相位上修正两个或多个各自经滤波的信号。
22.根据权利要求14至21的装置，包括
用子带增益因子修正多个滤波器的装置；以及
组合该经修正的滤波器形成合成滤波器结构的装置，该结构包括应用于所述子带信号的延迟和相位校正滤波器。
23.根据权利要求22的装置，其包括从输入信息获得子带增益因子的装置。
24.一种用于处理表示输入信号的输入信息的装置，其中该装置包括
用于接收该输入信息并从其获得该输入信号的多个子带信号的装置；
用于接收该输入信息并从其获得该输入信号的多个子带信号的装置；
用于通过向多个子带滤波器的每一个应用各自的子带增益因子，产生一组经修正的子带滤波器的装置；
用于对多个子带中每个子带，将各个子带的经修正的子带滤波器组合为合成子带滤波器的装置；
用于通过对相应子带信号应用该合成子带滤波器产生各自的经滤波的信号的装置；以及
用于通过向该经滤波的信号应用合成滤波器组产生输出信号的装置。
25.根据权利要求24的装置，其包括用于从输入信息获得子带增益因子的装置。
26.根据权利要求24或25的装置，其中该输入信号表示多声道音频节目，并且该子带增益因子表示多声道的声道水平差。
27.一种传达指令程序的介质，其可由设备执行，以实现在权利要求1至13的任何一个描述的方法。
全文摘要
由子带域滤波器结构有效地实现立体声呈现所需的转换函数，例如头部相关转换函数(HRTF)。在一个实施例中，幅度、分数样本延迟和相位校正滤波器彼此级联设置，并且应用于表示频率子带内的音频信号的谱内容的子带信号。也公开了其它滤波器结构。在各种信号处理应用中有利地使用这些滤波器结构。音频应用的几个例子包括信号带宽压缩、音量均衡、房间声音校正和对有听觉障碍的人的助听。
文档编号H04S3/00GK101401455SQ200780008995
公开日2009年4月1日申请日期2007年3月14日优先权日2006年3月15日
发明者俞容山, C·Q·罗宾森, M·S·文顿申请人:杜比实验室特许公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：俞容山;C.Q.罗宾森;M.S.文顿
技术所有人：杜比实验室特许公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。