音频编码器和带宽扩展解码器的制作方法

文档序号:2823269阅读:276来源:国知局
专利名称:音频编码器和带宽扩展解码器的制作方法
技术领域
根据本发明的实施方式涉及音频信号处理,更具体地,涉及音频编码器、用来提供输出信号的方法、带宽扩展解码器以及用于提供带宽扩展音频信号的方法。
背景技术
对音频信号进行听觉适应编码以减少数据从而有效地存储和传输这些信号,在很多领域中已经得到了认可。已知的编码算法有,例如,MPEG1/2层3“MP3”或MPEG 4 AAC0用于此(特别是当达到最低比特速率时)的编码算法导致了音频质量的降低,这通常主要由将被传输的音频信号带宽的编码器侧局限性而导致。使用所谓的核心编码器(core coder) 来编码低通滤波信号并参数化具有较高频率的区域,使得它们能够根据低通滤波信号而被近似地重构。从WO 9857436可知,将音频信号在这样的情况下在编码器侧进行频带限制(band limiting)并通过高质量音频编码器仅对音频信号的较低频带进行编码。然而,较高频带例如仅通过一组参数(这些参数允许较高频带的原始频谱包络(spectral envelope) 再现)来非常粗略地表征。在解码器侧,然后将较高频带进行合成。为此,提出了谐波变换(harmonic transposition),其中,将解码的音频信号的较低频带提供至滤波器组 (filterbank),将较低频带的滤波器组信道(channel)连接至较高频带的滤波器组信道, 或“暂时地连接(patched)”,并且每个暂时连接的带通信号受到包络调节。这里,属于特定分析滤波组的合成滤波组接收到较低频带的音频信号的带通信号和较低频带的包络调节的带通信号(它们被协调地暂时连接至较高频带)。合成滤波器组的输出信号为相对于其音频带宽被扩展的音频信号,其中,该音频信号以非常低的数据速率从编码器侧传输到解码器侧。特别地,在滤波器组域中的滤波器组计算和暂时连接(patching)可以变为高的计算工作量(computational effort)。用于频带受限音频信号(bmd-limited audio signal)的带宽扩展的复杂性降低的方法替代地将低频信号部分(LF)的复制功能用在高频范围内(HF),以近似由于频带限制而丢失的信息。在 M. Dietz,L. Liljeryd,K. Kjorling and 0. Kunz,“Spectral Band Replication,a novel approach in audio coding,,,in 112th AES Convention,Munich, May 2002 ;S. Meltzer, R. Bohm and F. Henn, "SBR enhanced audio codecs for digital broadcasting such as “Digital Radio Mondiale,,(DRM),” 112th AE S Convention, Munich,May2002 ;T.Ziegler,A. Ehret, P.Ekstrand and M. Lutzky,“Enhancing mp3 withSBR :Features and Capabilities of the new mp3PR0 Algorithm,,,in 112th AESConvention, Munich, May 2002 ;International Standard IS0/IEC14496-3 :2001/ FPDAM 1, "Bandwidth Extension, “ IS0/IEC, 2002, ^"Speech bandwidth extension method and apparatus,,,Vasu Iyengar et al. US Patent Nr. 5,455,888 中描述了这样的方法。在这些方法中,没有执行谐波变换,但较低频带的相邻带通滤波器组信道被人工地引入到较高频带的相邻滤波器组信道。这导致了音频信号的较高频带的大致近似。这种信号的大致近似然后在进一步的步骤中通过定义从原始信号推导的附加控制参数被精修。 作为一个实例,MPEG-4标准使用用于调节频谱包络的比例因子(scale factor)、用于改写音调的噪音基底(noise floor)的附加物和反转过滤的组合以及用于音调分量的补充的正弦信号部分的插入。除此之外,还存在其他的方法,诸如在E. Larsen,R. Μ. Aarts, and Μ. Danessis, "Efficient high-frequency bandwidth extension of music and speech,,, In AES 112th Convention, Munich, Germany, May 2002 中描述的所谓的“盲带宽扩展(blind bandwidth extension)”,其中,没有使用关于原始HF范围的信息。此外,还存在在K. Kayhko, A Robust Wideband Enhancement for Narrowband Speech Signal ;Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing,2001 中描述的所谓的“人工带宽扩展(Artificial bandwidth extension),, 的方法。在J. Makinen等中描述了 AMR-WB+ —种用于第3代移动音频服务广播的新的音频编码标准、IEEE、ICASSP' 05、用于带宽扩展的方法,其中,通过由例如向上采样低通滤波信号而获得的镜象操作来执行将低频分量复制到高频带中的操作。作为选择,可以采用基本上等同于滤波器组域中的复制操作的信号侧频带调制。能够使得谐波带宽扩展的方法通常采用间距确定步骤(间距跟踪)、非线性畸变 (non-linear distortion)步骤(参见,例如"U· Kornagel,Spectral widening of the excitation signal for telephone-band speech enhancement, in-Proceedings of the IWAENC, Darmstadt,Germany,September 2001,pp. 215-218”)或者使用相位音码器(例如,如申请号为US 61/0251 的美国临时专利申请“F. Nagel,S. Disch !“Apparatus and method of harmonic bandwidth extension in audio signals,,,,所不)。例如,WO 02/41302A1披露了一种用来提高使用高频重构方法的编码系统的性能的方法。其披露了如何通过由核心编码器编码的低频带和由高频率重构系统编码的高频带之间的交叉频率的时间上的调整来提高这种系统的整体特性。对于这种方法,核心编码器必须能够以不同的交叉频率在编码器侧和解码器侧进行工作。从而,增加了核心编码器的复杂性。例如,在"R. M· Aarts,E· Larsen,and 0. Ouweltjes, A unified approach to low—and high-frequency bandwidth extension.In AES 115th Convention, New York, USA, October 2003","E.Larsen and R. M.Aarts :Audio Bandwidth Extension-Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley&Sons,Ltd,2004”,‘ . Larsen,R. M. Aarts,and M. Danessis :Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention, Munich,Germany, May 2002”,“J. Makhoul :Spectral Analysis of Speech by Linear Prediction. IEEETransactions on Audio and Electroacoustics,AU-21(3), June 1973", “United States Patent Application 08/951,029, Ohmori et al. :Audio band width extending system and method”禾口“United States Patent 6895375,Malah,D&Cox,R. VS. System for bandwidth extension of Narrow-band speech,,中描述了其他的用于带宽扩展的技术。谐波带宽扩展方法通常表现出很高的复杂性,而复杂性降低的带宽扩展方法表现出质量降低。在将低比特速率与低频带的小带宽结合的具体情况下,则会产生诸如糙涩和令人不舒服的音色的人工产物。其原因在于,近似的HF部分基于不能保持音调信号部分之间的谐波关系的复制操作。这适用于LF和HF之间的谐波关系,还适用于HF部分自身中的连续的插入码(patch)之间的谐波关系。例如,在SBR中,在低频带和高频带之间的边界处出现的编码分量和复制分量的毗邻可能导致粗糙的声音印象。在图18中示出了原因,其中,从LF范围复制到HF范围内的音调部分在频谱上很密地与LF范围的音调部分相邻。图18a示出了由三个音调构成的信号的原始声谱图1800a。图18b示出了对应于图18a的原始信号的带宽扩展信号的示图1800b。横坐标表示时间,纵坐标表示频率。具体地,在最后一个音调处,可以观察到潜在的问题1810(模糊的线1810)。如果通过已知方法来考虑谐波关系,这总是基于Fcr评估来进行。在这种情况下, 这些方法的成功主要依赖于该评估的可靠性。

发明内容
通常,已知的带宽扩展方法以低比特速率提供音频信号,但具有差的音频质量或者以高比特速率而具有好的音频质量。本发明的目标在于提供一种用于音频信号的改善的编码方案。该目标通过根据权利要求1的音频编码器,根据权利要求3和权利要求8的带宽扩展解码器,以及根据权利要求12、13和14的方法而实现。本发明的实施方式提供了一种用来使用输入音频信号提供输出信号的音频编码器。该音频编码器包括插入码生成器 (patch generator)、比较器和输出接口。插入码生成器被配置为生成至少一个带宽扩展高频信号。带宽扩展高频信号包括高频带,其中,带宽扩展高频信号的高频带基于输入音频信号的低频带。如果生成了不同的带宽扩展高频信号,则不同的带宽扩展高频信号在它们的高频带内包括不同的频率。比较器被配置为计算多个比较参数。基于输入音频信号和生成的带宽扩展高频信号的比较来计算比较参数。基于输入音频信号和生成的带宽扩展高频信号之间的不同的偏移频率(offset frequency)来计算多个比较参数的每个比较参数。此外,比较器被配置为根据多个比较参数来确定一个比较参数,其中,所述确定的比较参数满足预定标准。换句话说,例如,比较器可以被配置为在多个比较参数中确定能够最好地满足预定标准的比较参数。输出接口被配置为提供用于传输或存储的输出信号。该输出信号包括与确定的比较参数对应的基于偏移频率的参数标识(parameter indication)。换句话说,该输出信号可以包括所选择的表示最佳偏移频率的比较参数。本发明的另一个实施方式提供了一种带宽扩展解码器,该带宽扩展解码器用来基于输入音频信号和参数信号提供带宽扩展音频信号。参数信号包括偏移频率的标识和功率密度(power density)参数的标识。带宽扩展解码器包括插入码生成器、组合器和输出接插入码生成器被配置为生成包括高频带的带宽扩展高频信号。基于输入音频信号的频带的一个或多个频移(frequency shift)来生成带宽扩展高频信号的高频带。频移基于偏移频率(offset frequency)。此外,插入码生成器被配置为能够通过等于功率密度参数的值的因子或等于功率密度参数的倒数值的因子来分别放大或衰减带宽扩展高频信号的高频带。组合器被配置为组合带宽扩展高频信号和输入音频信号以得到带宽扩展音频信号。输出接口被配置为提供带宽扩展音频信号。本发明的再一个实施方式提供了一种带宽扩展解码器,该带宽扩展解码器用来基于输入音频信号提供带宽扩展音频信号。该带宽扩展解码器包括插入码生成器、比较器、组合器和输出接口。插入码生成器被配置为基于输入音频信号生成至少一个包括高频带的带宽扩展高频信号,其中,生成的带宽扩展高频信号的高频带的下限截止频率(cutoff frequency) 低于输入音频信号的上限截止频率。如果生成了不同的带宽扩展高频信号,则不同的生成的带宽扩展高频信号在它们的高频带中包括不同的频率。比较器被配置为计算多个比较参数。基于输入音频信号和生成的带宽扩展高频信号的比较来计算比较参数。基于输入音频信号和生成的带宽扩展高频信号之间的不同的偏移频率来计算多个比较参数中的各个比较参数。此外,比较器被配置为从多个比较参数中确定一个比较参数,其中,所述确定的比较参数满足预定标准。换句话说,例如,比较器被配置为在多个比较参数中确定能够最好地满足预定标准的比较参数。组合器被配置为组合输入音频信号和带宽扩展高频信号以得到带宽扩展音频信号,其中,用来得到带宽扩展音频信号的带宽扩展高频信号是基于对应于确定的比较参数的偏移频率的。输出接口被配置为提供带宽扩展音频信号。根据本发明的实施方式基于这样的中心思想,即,带宽扩展高频信号(也被称为插入码)可以被生成并与原始的输入音频信号相比较。通过使用带宽扩展高频信号的不同的偏移频率或具有不同的偏移频率的几个频带扩展高频信号,可以计算与不同的偏移频率对应的多个比较参数。这些比较参数可以与和音频质量相关联的质量相关。因此,可确定一比较参数,确保带宽扩展高频信号和输入音频信号的兼容性,从而使音频质量提高。通过使用基于偏移频率(其对应于用于原始的输入音频信号的高频带的重构的确定的比较参数)的参数标识,可以降低用于编码的音频信号的传输或存储的比特速率。 以这种方式,只需要存储或传输输入音频信号的低频部分和参数标识。随后将定义术语比较参数、交叉频率和参数标识。根据本发明的一些实施方式涉及一种使用交叉关系(cross correlation)来比较输入音频信号和生成的带宽扩展高频信号以计算比较参数的比较器。根据本发明的另外的实施方式涉及一种插入码生成器,基于信号侧频带调制来在时域中生成带宽扩展高频信号。本发明的优选实施方式的优点在于,提供了一种允许提高音频质量和/或降低用于传输或存储的比特速率的用于音频信号的编码方案。


随后将参照附图详细描述根据本发明的实施方式,其中图1是音频编码器的框图;图2是带宽扩展高频信号生成、输入音频信号和生成的带宽扩展高频信号的比较以及带宽扩展高频信号的功率自适应(power adaptation)的示意图;图3是带宽扩展高频信号生成、输入音频信号和带宽扩展高频信号的比较以及带宽扩展高频信号的功率自适应(power adaptation)的示意图;图4是带宽扩展编码器的框图;图5是带宽扩展解码器的框图;图6是带宽扩展解码器的框图;图7是用来基于输入音频信号提供输出信号的方法的流程图;图8是用来提供带宽扩展音频信号的方法的流程图;图9是用来基于输入音频信号提供输出信号的方法的流程图;图10是用来计算比较参数的方法的流程图;图11是偏移频率的内插的示意图;图12是带宽扩展解码器的框图;图13是用来提供带宽扩展音频信号的方法的流程图;图14是用来提供带宽扩展音频信号的方法的框图;图15是带宽扩展编码器的框图;图16a是使用可变的交叉频率的三个音调的声谱图;图16b是三个音调的原始音频信号的声谱图;图17是原始音频信号、使用恒定交叉频率的带宽扩展音频信号和使用可变的交叉频率的带宽扩展音频信号的能谱图;图18a是使用已知的带宽扩展方法的三个音调的声谱图;以及图18b是三个音调的原始音频信号的声谱图。
具体实施例方式下面,相同的参考标号局部地用于具有相同或相似功能特性的对象和功能单元, 并且参照附图对其的描述还应当适用于其他附图,以减少实施方式说明的赘述。图1示出了根据本发明实施方式的使用输入音频信号102提供输出信号132的音频编码器100的框图。输出信号适于解码器处的带宽扩展。因此,音频编码器还称为带宽扩展编码器。带宽扩展编码器100包括插入码生成器110、比较器120以及输出接口 130。 插入码生成器110连接至比较器120,而比较器120连接至输出接口 130。插入码生成器110生成至少一个带宽扩展高频信号112。带宽扩展高频信号112 包括高频带,其中,带宽扩展高频信号112的高频带基于输入音频信号102的低频带。如果生成不同的带宽扩展高频信号112,则不同带宽扩展高频信号112在其高频带内包括不同的频率。比较器120计算多个比较参数。基于对输入音频信号102和所生成的带宽扩展高频信号112的比较来计算比较参数。基于输入音频信号102和所生成的带宽扩展高频信号 112之间的不同偏移频率来计算多个比较参数中的每个比较参数。此外,比较器120从多个比较参数中确定一个比较参数,其中,所确定的比较参数满足预定标准。输出接口 130提供用于传输或者存储的输出信号132。输出信号132包括基于对应于所确定的比较参数的偏移频率的参数标识。通过计算用于不同偏移频率的多个比较参数,可以找出很好地符合原始输入音频信号102的带宽扩展高频信号112。这可以通过产生均具有不同偏移频率的多个带宽扩展高频信号112或者通过生成一个带宽扩展高频信号并将带宽扩展高频信号112的高频带移动不同的偏移频率来实现。同样,产生具有不同偏移频率的多个带宽扩展高频信号112与将它们的高频带移动其它不同的偏移频率的结合也是可以的。例如,生成五个不同带宽扩展高频信号112,并且它们中的每个都以恒定偏移频率被移动了五次。图2示出了在仅有一个带宽扩展高频信号产生并且被移动不同偏移频率的情况下带宽扩展高频信号生成、带宽扩展高频信号和输入音频信号的比较以及带宽扩展高频信号的可选的功率自适应的示意图200。第一示意图“功率-频率”示图210示意性示出了输入音频信号102。基于该输入音频信号102,例如,通过将输入音频信号102的低频带移动222至较高频(如参考标号所示),插入码生成器100可以生成带宽扩展高频信号112。例如,将低频带移动等于核心编码器(图1中未示出,其可以是带宽扩展编码器100的一部分)的交叉频率的频率或另一
预定频率。然后可以将所生成的带宽扩展高频信号112移动不同的偏移频率232,并且对于各偏移频率232 (如参考标号230所示),可以通过比较器120来计算比较参数。例如,偏移频率232可以相对于核心编码器的交叉频率或相对于另一特定频率来定义,或者可以定义为绝对频率值。接下来,比较器120确定满足预定标准的比较参数值。这样,可以确定具有对应于预定比较参数的偏移频率M2的带宽扩展高频信号112(如参考标号240所示)。此外,还可以确定功率密度参数252(如参考标号250所示)。功率密度参数252 可以表示具有对应于所确定的比较参数的偏移频率的带宽扩展高频信号的高频带与输入音频信号的对应频带的比率。例如,比率可以涉及功率密度比率、功率比率或者与频带的功率密度相关的量的另一比率。可选地,图3示出了在生成具有不同偏移频率的多个带宽扩展高频信号的情况下,带宽扩展高频信号生成、所生成的带宽扩展高频信号与输入音频信号的比较以及带宽扩展高频信号的可选的功率自适应的示意图330。与图2所示的顺序不同,插入码生成器110生成了具有不同偏移频率232的多个带宽扩展高频信号112(如参考标号320所示)。这同样可以通过输入音频信号102的低频带频移222到较高的频率来实现。可以通过恒定频率加上各带宽扩展高频信号112的各偏移频率232来移动输入音频信号102的低频带。恒定频率可以等于核心编码器的交叉频率或者另一特定频率。然后可以计算每个所生成的带宽扩展高频信号112的比较参数,并且可以通过比较器120来确定240满足预定标准的比较参数。
功率密度参数可以如上所述地确定250。图2和图3所示的概念也可以结合。可以通过两个信号交叉相关来进行输入音频信号102与所生成的带宽扩展高频信号112的比较。在这种情况下,比较参数可以是例如输入音频信号102与所生成的带宽扩展高频信号112之间的特定偏移频率的交叉相关的结果。输出信号132的参数标识可以是偏移频率本身、量化的偏移频率或者是基于偏移
频率的另一量。通过仅传输或者存储参数标识,而不是输入音频信号102的高频带,可以降低传输或存储的比特速率。通过基于对应于满足预定标准的比较参数的偏移频率来选择参数, 这可以比仅解码频带受限音频信号产生更好的音频质量。预定标准可以确定多个比较参数的,例如,表明具有对应偏移频率的带宽扩展高频信号112比具有其他偏移频率的带宽扩展高频信号112与输入音频信号102的匹配好于 70%的一个比较参数,表明具有对应偏移频率的带宽扩展信号112是对输入音频信号102 的最佳的三个匹配之一的一个比较参数,或者表明具有对应偏移频率的最佳匹配的带宽扩展信号112的一个比较参数。这涉及到生成具有不同偏移频率的多个带宽扩展高频信号 112的情况,以及仅有一个带宽扩展高频信号112生成并被移动不同偏移频率的情况,或者两种情况的结合。比较参数可以是交叉相关的结果或者表明具有特定偏移频率的带宽扩展高频信号112与输入音频信号102匹配得有多好的另一量。带宽扩展编码器100可以包括用于对输入音频信号102的低频带进行编码的核心编码器。该核心编码器可以包括对应于输入音频信号102的编码的低频带的上限截止频率 (upper cutoff frequency)的交叉频率。核心编码器的交叉频率可以是恒定的或随时间变化的。实施变化的交叉频率会增加核心编码器的复杂性,但也可以提高编码的灵活性。对于较高频带或插入码,可以重复图2和/或图3所示的处理。例如,输入音频信号102的低频带包括4kHz的上限截止频率。因此,如果将输入音频信号102的低频带移动低频带的上限截止频率,以生成带宽扩展高频信号112,则带宽扩展高频信号112包括具有 4kHz的下限截止频率以及8kHz的上限截止频率的高频带。可以通过将输入音频信号102 的低频带移动低频带的上限截止频率的两倍来重复该处理。因此,新生成的带宽扩展高频信号112包括具有SkHz的下限截止频率和12kHz的上限截止频率的高频带。这可以重复, 直至达到期望的最高频率。可选地,这还可以通过生成具有多个不同高频带的一个带宽扩展高频信号来实现。如在该实例中所示,输入音频信号的低频带的带宽和带宽扩展高频信号的高频带的带宽可以是相同的。可选地,输入音频信号的低频带可以展开并且移动,以生成带宽扩展
高频信号。确定具有对应于所确定的比较参数的偏移频率232的带宽扩展高频信号112会在输入音频信号102的低频带与带宽扩展高频信号112的高频带之间留下依赖于偏移频率 242的间隙。该间隙可以通过生成包含例如频带限制噪声的适合该间隙的频率部分来填充。 可选地,可以将间隙保留为空的,这是因为音频质量不会受到显著的影响。图4示出了根据本发明实施方式的使用输入信号102提供输出信号132的带宽扩展编码器400的框图。带宽扩展编码器400包括插入码生成器100、比较器120、输出接口 130、核心编码器410、带通滤波器420以及参数提取单元430。核心编码器410连接至输出接口 130以及插入码生成器110,插入码生成器110连接至比较器120,比较器120连接至参数提取单元430,参数提取单元430连接至输出接口 130,并且带通滤波器420连接至比较器120。插入码生成器110可以被实现为基于输入音频信号102来生成带宽扩展高频信号 112的调制器。比较器120可以通过由带通滤波器420滤波的输入音频信号102与所生成的带宽扩展高频信号112的交叉相关来执行它们的比较。满足预定标准的比较参数的确定还可以被称为滞后评估(lag estimation) 0输出接口 130还可以包括比特流格式器的功能,并且可以包括用于组合由核心编码器410提供的低频信号与由参数提取单元430提供的包括基于偏移频率的参数标识的参数信号432的组合器。此外,输出接口可以包括熵编码器或差分编码器,以降低输出信号 132的比特速率。组合器和熵或差分编码器可以是如该实例所示的输出接口 130的一部分, 或者可以是独立的单元。音频信号102可以被划分为低频部分和高频部分。这可以通过核心编码器410的低通滤波器和带通滤波器420来完成。低通滤波器可以是核心编码器410的一部分或者是连接至核心编码器410的独立的低通滤波器。低频部分通过核心编码器410 (其可以是例如与MPEGlA层3 “MP3”或MPEG 4AAC 标准一致的音频编码器或语音编码器)来处理。低频部分可以被移动一固定值,例如,通过频域内的边带调制或快速傅里叶变换 (FFT)来移动,从而其位于对应插入码的目标区域中的原始低频区域以上。可选地,可以直接从输入信号102获得低频部分。这可以通过连接至插入码生成器110的独立的低通滤波器来完成。以规则的时间间隔,可以计算(输入音频信号的)原始高频部分和所得的高频部分(带宽扩展高频信号)之间窗口化信号部分的振幅谱之间的交叉相关。这样,可以确定最大相关的滞后(偏移频率)。该滞后在原始单侧频带调制(single side band modulation) 方面可以具有相关因子(correction factor)的意义,即,单侧频带调制可以另外通过滞后来校正,以使交叉相关最大化。换言之,可以确定对应于满足预定标准的比较参数的偏移频率(也称为滞后),其中,比较参数对应于交叉相关,而预定标准可以是寻找最大相关。此外,可以确定振幅谱的绝对值的比率。通过这样做,可以推导出所获得的高频信号应当通过哪个因子被衰减或者放大。换言之,可以确定表示带宽扩展高频信号112的高频带和原始输入音频信号102的对应频带之间的功率比率、功率密度、振幅谱的绝对值或与功率密度比率相关的另外的值的功率密度参数。这可以通过功率密度比较器(其可以是如实例所示的参数提取单元430的一部分或者是独立的单元)来完成。为了确定功率密度参数,例如,可以使用通过将输入音频信号102的低频带移动恒定频率而生成的带宽扩展高频信号112、或者对应于确定的比较参数的带宽扩展高频信号112或者另一个所生成的带宽扩展高频信号112。在这种情况下,对应频带意味着,例如,具有相同频率范围的频带。 例如,如果带宽扩展高频信号的高频带包括从4kHz到8kHz的频率,则输入音频信号的对应频带也包括从4kHz到SkHz的范围。
所获得的对应于滞后以及对应于振幅的绝对值的校正因子(偏移频率、功率密度参数)可以随时间进行内插。换言之,为窗口化的信号部分(为时间帧)所确定的参数可以针对信号部分的每个时间步长进行内插。该调制(控制)信号(参数信号)或其参数化的表示可以存储或者传输至解码器。 换言之,参数信号432可以与由核心编码器410处理的输入音频信号102的低频带进行组合,以得到可以存储或传输至解码器的输出信号132。此外,可以确定用于调节例如噪声电平和/或音调的其他参数。这可以通过参数提取单元430来完成。可以将其他的参数添加至参数信号432。图4所示的实例示出了时变调制(time variable modulation)的编码器侧的计算。在这种情况下时变调制涉及具有不同偏移频率的带宽扩展高频信号112。对应于满足预定标准的确定的比较参数的偏移频率可以随时间变化。图5示出了根据本发明实施方式的用来基于输入音频信号502和参数信号504提供带宽扩展音频信号532的带宽扩展解码器500的框图。参数信号504包括偏移频率的标识(indication)以及功率密度参数的标识。带宽扩展解码器500包括插入码生成器510、 组合器520以及输出接口 530。插入码生成器510连接至组合器520,而组合器520连接至输出接口 530。插入码生成器510基于输入音频信号502产生包括高频带的带宽扩展高频信号 512。带宽扩展高频信号512的高频带基于输入音频信号502的频带的频移而产生,其中, 频移基于偏移频率。此外,插入码生成器510通过等于功率密度参数的值或等于功率密度参数的倒数值的因子对带宽扩展高频信号512的高频带进行放大或衰减。组合器520结合带宽扩展高频信号512和输入音频信号502,以获得带宽扩展音频信号532,输出接口 530提供带宽扩展音频信号532。例如,如果如上所述地确定偏移频率,则生成基于偏移频率的带宽扩展高频信号 512可以允许高频区域中的输入音频信号的频率范围的改善的连续性。此外,通过用功率密度参数对带宽扩展高频信号512的高频带进行放大或衰减, 输入音频信号502的高频连续(high-frequency continuation)的功率密度可以用非常高效的方式完成。这样,可以不需要归一化。插入码生成器510通过以恒定频率加上偏移频率来移动输入音频信号512的频带可以生成带宽扩展高频信号512。如果偏移频率表明频移向低频进行,则组合器可以忽略包括比输入音频信号502的上限截止频率低的频率的带宽扩展高频信号512的高频带的一部分。插入码生成器510可以在时域或频域中产生带宽扩展高频信号512。在时域中,插入码生成器510可以基于单侧频带调制生成带宽扩展高频信号512。此外,输出接口在提供输出信号之前可以放大输出信号。图6示出了根据本发明实施方式的基于输入音频信号502和参数信号504提供带宽扩展音频信号532的带宽扩展解码器600的框图。带宽扩展解码器600包括插入码生成器510、组合器520、输出接口 530、核心解码器610以及参数提取单元620。核心解码器610 连接至插入码生成器510和组合器520,参数提取单元620连接至插入码生成器510和输出接口 530,插入码生成器510连接至组合器520,组合器520连接至输出接口 530。核心解码器610可以对所接收的比特流602进行解码,并且将输入音频信号502 提供至插入码生成器501和组合器520。输入音频信号502可以包括等于核心解码器610 的交叉频率的上限截止频率。该交叉频率可以是恒定的或者随时间变换的。随时间变换意味着,例如,对于不同时间间隔或时间帧是变化的,但是对于一个时间间隔或时间帧是恒定的。参数提取单元620可以将参数信号504从所接收的比特流602中分离,并且将其提供至插入码生成器510。此外,可以将参数信号504或所提取的噪声和/或音调参数提供至输出接口 530。插入码生成器510可以基于偏移频率调制输入音频信号502,以获得带宽扩展高频信号512,并且可以基于包含在参数信号504中的功率密度参数放大或衰减带宽扩展高频信号512。将该带宽扩展高频信号512提供至组合器520。换言之,插入码生成器510可以基于偏移频率和功率密度参数调制输入音频信号502,以获得高频信号。这可以通过例如在时域中利用内插和/或滤波632对每个时间步长进行单侧频带调制634来完成。组合器520组合输入音频信号502和所生成的带宽扩展高频信号512,以获得带宽扩展音频信号532。输出接口 530提供带宽扩展音频信号532并且可以另外包括校正单元。校正单元可以基于由参数提取单元620提供的参数执行音调校正和/或噪声校正。校正单元可以是如图6所示输出接口 530的一部分,或者可以是独立的单元。校正单元还可以设置在插入码生成器与组合器520之间。这样,校正单元可以仅校正所生成的带宽扩展高频信号512的音调和/或噪声。因为输入音频信号502对应于原始音频信号,所以输入音频信号512的音调和噪声校正不是必需的。总之,带宽扩展解码器600通过传输调制功能,可以从音频解码器或核心解码器的输出信号(输入音频信号)合成并频谱地形成高频信号。传输调制功能(Transmitted modulation function),例如,意味着基于偏移频率并且基于功率密度参数的调制功能。然后可以组合高频信号和低频信号,并且可以施加调节噪声电平和音调的其他参数。图7示出了根据本发明实施方式的基于输入音频信号提供输出信号的方法700的流程图。该方法包括生成至少一个带宽扩展高频信号(710)、计算多个比较参数(720)、从多个比较参数确定一个比较参数(730)以及提供用于传输或存储的输出信号(740)。所生成的带宽扩展高频信号包括高频带。带宽扩展高频信号的高频带基于输入音频信号的低频带。如果生成不同的带宽扩展高频信号,则不同的带宽扩展高频信号在其高频带内包括不同的频率。基于输入音频信号与所生成的带宽扩展高频信号的比较来计算比较参数。基于输入音频信号与所生成的带宽扩展高频信号之间的不同偏移频率来计算多个比较参数的每个比较参数。所确定的比较参数满足预定标准。输出信号包括基于对应于所确定的比较参数的偏移频率的参数标识。图8示出了根据本发明实施方式的基于输入音频信号和参数信号提供带宽扩展音频信号的方法800的流程图。参数信号包括偏移频率的标识和功率密度参数的标识。该方法包括生成带宽扩展高频信号(810)、放大或衰减带宽扩展高频信号的高频带(820)、 组合带宽扩展高频信号和输入音频信号以获得带宽扩展音频信号(830)以及提供带宽扩展音频信号(840)。带宽扩展高频信号包括高频带。基于输入音频信号的频带的频移生成带宽扩展高频信号的高频带(810)。频移基于偏移频率。通过等于功率密度参数的值或者等于功率密度参数的倒数值的因子来放大或衰减带宽扩展高频信号的高频带(820)。图9示出了根据本发明实施方式的基于输入音频信号提供输出信号的方法900的流程图。该附图示出了编码器中的算法的顺序的一种可能性。这也可以是下述的数学形式。实时信号可以通过拉丁小写体字母来表示,希尔伯特变换后的信号用对应的希腊字母表示,傅里叶变换后的信号用拉丁大写字母或者可选地用希腊字母表示。输入信号可以被称为f(n),输出信号0(n)./ffFi =/*月<k<kmax表示变换
后的傅里叶,j表示虚数,通常将希尔伯特变换H(.)定义为
权利要求
1.一种音频编码器(100)、(400), (1500),所述音频解码器用于使用输入音频信号 (102)来提供输出信号(132),包括插入码生成器(110),被配置为生成至少一个带宽扩展高频信号(112),其中,带宽扩展高频信号(11 包括高频带,其中,带宽扩展高频信号(11 的所述高频带基于所述输入音频信号(102)的低频带,以及其中,如果生成不同的带宽扩展高频信号(112),则不同的带宽扩展高频信号(11 在它们的高频带内包括不同频率;比较器(120),被配置为计算多个比较参数,其中,基于所述输入音频信号(102)与所生成的带宽扩展高频信号(11 的比较来计算比较参数,其中,基于所述输入音频信号 (102)与所生成的带宽扩展高频信号(11 之间的不同偏移频率来计算多个比较参数中的每一个比较参数,并且其中,所述比较器(120)被配置为从所述多个比较参数中确定一比较参数,其中,所确定的比较参数满足预定的标准;以及输出接口(130),被配置为提供用于传输或存储的输出信号(132),其中,所述输出信号(13 包括基于与所确定的比较参数对应的偏移频率的参数标识。
2.根据权利要求1所述的音频解码器,包括功率密度比较器G30),被配置为基于所生成的带宽扩展高频信号(11 的高频带和所述输入音频信号(10 的对应的频带的功率密度来比较参数,以获得功率密度参数,其中,功率密度参数表示基于所生成的带宽扩展高频信号(11 的高频带和所述输入音频信号(10 的对应的频带的功率密度的比率,并且其中,输出信号(13 的参数标识基于所述功率密度参数。
3.一种带宽扩展解码器(500)、(600),其用于基于输入音频信号(50 和参数信号 (504)提供带宽扩展音频信号,其中,参数信号(504)包括偏移频率的标识和功率密度参数的标识,所述带宽扩展解码器包括插入码生成器(510),被配置为生成包括高频带的带宽扩展高频信号(512),其中,基于所述输入音频信号(50 的频带的频移来生成所述带宽扩展高频信号(51 的所述高频带,其中,所述频移基于所述偏移频率,以及其中,所述插入码生成器(510)被配置为通过等于所述功率密度参数值或等于所述功率密度参数的倒数值的因子分别放大或衰减所述带宽扩展高频带信号(512)的所述高频带;组合器(5 ),被配置为组合所述带宽扩展高频信号(51 和所述输入音频信号(502) 以获得带宽扩展音频信号(532);以及输出接口(530),被配置为提供所述带宽扩展音频信号(532)。
4.根据权利要求3所述的带宽扩展解码器,其中,所述组合器(520)被配置为忽略所述带宽扩展高频信号(51 的所述高频带的一部分,其中,所述带宽扩展高频信号(51 的所述高频带的被忽略部分包括低于所述输入音频信号(502)的上限截止频率的频率。
5.根据权利要求3或4所述的带宽扩展解码器,包括核心解码器(610),被配置为基于编码的输入音频信号(602)生成所述输入音频信号(502),其中,所述核心解码器(610)生成具有恒定的上限截止频率的所述输入音频信号(502),其中,所述插入码生成器(510)被配置为通过将所述输入音频信号(50 的所述频带移动与所述输入音频信号(50 的所述上限截止频率加上所述偏移频率相等的频率,来生成所述带宽扩展高频信号(512)的所述高频带(510)。
6.根据权利要求3 5中的任一项所述的带宽扩展解码器,其中,所述插入码生成器(510)被配置为在时域中生成所述带宽扩展高频信号(512)。
7.根据权利要求6所述的带宽扩展解码器,其中,所述插入码生成器(510)被配置为基于单侧频带调制来生成所述带宽扩展高频信号(512)。
8.一种带宽扩展解码器(1200),其用于基于输入音频信号(50 提供带宽扩展音频信号,包括插入码生成器(1210),被配置为基于所述输入音频信号(50 生成至少一个包括高频带的带宽扩展高频信号(1212),其中,带宽扩展高频信号(121 的所述高频带的下限截止频率低于所述输入音频信号(502)的上限截止频率,并且其中,如果生成不同的带宽扩展高频信号(1212),则不同的带宽扩展高频信号在它们的高频带内包括不同的频率;比较器(1220),被配置为计算多个比较参数,其中基于所述输入音频信号(50 和所生成的带宽扩展高频信号(121 来计算比较参数,其中,基于所述输入音频信号(502)和所生成的带宽扩展高频信号(121 之间的不同偏移频率来计算多个比较参数中的每个比较参数,并且其中,所述比较器(1220)被配置为从所述多个比较参数中确定一个比较参数,其中,所确定的比较参数满足预定的标准;组合器(1230),被配置为组合输入音频信号(51 和带宽扩展高频信号以获得带宽扩展音频信号(532),其中,用于获得所述带宽扩展音频信号(532)的所述带宽扩展高频信号基于与所确定的比较参数对应的偏移频率;以及输出接口(1240),被配置为提供所述带宽扩展音频信号(532)。
9.根据权利要求8所述的带宽扩展解码器,其中,所述插入码生成器(1210)被配置为通过等于所述功率密度参数值或等于所述功率密度参数的倒数值的因子分别放大或衰减所述带宽扩展高频信号(121 的高频带;其中,所述功率密度参数的标识包含在所述输入音频信号(502)中。
10.根据权利要求3 9中的任一项所述的带宽扩展解码器,包括内插装置,其中,时间帧包括多个时间步长,其中,每个时间帧包括对应的偏移频率,其中,所述内插装置被配置为对于每个时间帧的时间步长,内插时间帧的偏移频率或不同时间帧的多个偏移频率,以获得每个时间步长的内插偏移频率。
11.根据权利要求1、2、8或9所述的音频编码器或带宽扩展解码器,其中,所述比较器被配置为通过对所述输入音频信号和所生成的带宽扩展高频信号的交叉相关的结果进行计算,来执行所述输入音频信号和所生成的带宽扩展高频信号的比较,其中,被计算的所述比较参数基于交叉相关的结果,其中,所述交叉相关的参数是所述带宽扩展高频信号的偏移频率,并因此与所计算的比较参数相关联。
12.一种用于使用输入音频信号来提供输出信号的方法(700),所述方法包括生成至少一个带宽扩展高频信号(710),其中,带宽扩展高频信号包括高频带,其中,所述带宽扩展高频信号的高频带基于所述输入音频信号的低频带,以及其中,如果生成不同的带宽扩展高频信号,则不同的带宽扩展高频信号在它们高频带内包括不同的频率;计算多个比较参数(720),其中,基于所述输入音频信号与所生成的带宽扩展高频信号的比较来计算比较参数,其中,基于所述输入音频信号与所生成的带宽扩展高频信号之间的不同的偏移频率来计算多个比较参数中的每一个比较参数;从所述多个比较参数中确定一比较参数(730),其中,所确定的比较参数满足预定的标准;以及提供用于传输或存储的输出信号(740),其中,所述输出信号包括基于与所确定的比较参数对应的偏移频率的参数标识。
13.一种用于基于输入音频信号和参数信号来提供带宽扩展音频信号的方法(800), 其中,所述参数信号包括偏移频率的标识和功率密度参数的标识,所述方法包括生成包括高频带的带宽扩展高频信号(810),其中,基于所述输入音频信号的频带的频移来生成带宽扩展高频信号的高频带,其中,所述频移基于所述偏移频率;通过等于所述功率密度参数值或等于所述功率密度参数的倒数值的因子来放大或衰减所述带宽扩展高频信号的所述高频带(820);组合所述带宽扩展高频信号和输入音频信号以获得带宽扩展音频信号(830);以及提供所述带宽扩展音频信号(840)。
14.一种用于基于输入音频信号提供带宽扩展音频信号的方法(1300),所述方法包括基于所述输入音频信号生成至少一个包括高频带的带宽扩展高频信号(1310),其中, 所述带宽扩展高频信号的高频带的下限截止频率低于所述输入音频信号的上限截止频率, 并且其中,如果生成不同的带宽扩展高频信号,则不同的带宽扩展高频信号在它们的高频带内包括不同的频率;计算多个比较参数(1320),其中,基于所述输入音频信号和所生成的带宽扩展高频信号来计算比较参数,其中,基于所述输入音频信号和所生成的带宽扩展高频信号之间的不同偏移频率来计算所述多个比较参数中的每个比较参数,从所述多个比较参数中确定一个比较参数(1330),其中,所确定的比较参数满足预定的标准;组合所述输入音频信号和带宽扩展高频信号以获得带宽扩展音频信号(1340),其中, 用于获得所述带宽扩展音频信号的所述带宽扩展高频信号基于与所确定的比较参数对应的偏移频率;以及提供所述带宽扩展音频信号(1350)。
15.一种计算机程序,所述计算机程序具有用来当在计算机或微控制器上运行所述计算机程序时执行根据权利要求12至14之一所述的方法的程序代码。
全文摘要
一种用于使用输入音频信号来提供输出信号的音频编码器,包括插入码生成器、比较器以及输出接口。插入码生成器被配置为生成至少一个带宽扩展高频信号,其中,带宽扩展高频信号包括高频带。带宽扩展高频信号的高频带基于输入音频信号的低频带。比较器计算多个比较参数。基于输入音频信号与所生成的带宽扩展高频信号的比较来计算比较参数。基于输入音频信号与所生成的带宽扩展高频信号之间的不同偏移频率来计算多个比较参数中的每一个比较参数。此外,比较器从多个比较参数中确定一个比较参数,其中,所确定的比较参数满足预定的标准。
文档编号G10L19/08GK102246231SQ200980150442
公开日2011年11月16日 申请日期2009年12月11日 优先权日2008年12月15日
发明者于尔根·赫莱, 克里斯蒂安·格里贝尔, 福雷德里克·纳格尔, 纪尧姆·福奇斯, 萨沙·迪施 申请人:弗兰霍菲尔运输应用研究公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1