用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备的制作方法

文档序号：2824834阅读：368来源：国知局

专利名称：用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备的制作方法
技术领域：
本发明的示范实施例涉及一种用于对音频信号进行编码和解码的方法和设备；且更具体地，涉及一种用于通过分层正弦脉冲编码方案来对音频信号进行编码和解码的方法和设备。
背景技术：
由于数据传送带宽随着通信技术的发展而增加，所以用户对于使用多声道语音和音频的高质量通信服务的需求增加。需要一种能够对立体声语音和音频信号进行有效地压缩和解压的编码方案，以提供高质量的语音/音频通信服务。相应地，正在对于用于对窄带(NB，300 3，400Hz)信号、宽带(WB，50 7，OOOHz) 信号和超宽带(SWB，50 14，000Hz)信号进行编码的编解码器进行深入的研究。ITU-T G. 729. 1编解码器是基于G. 729窄带编解码器的宽带扩展编解码器的典型示例。ITU-T G. 729. 1宽带扩展编解码器提供8千比特每秒(Icbit/s)的与G. 7 窄带编解码器的比特流级别的兼容性，并且提供121cbit/S的提高质量的窄带信号。同样，ITU-T G.7^. 1宽带扩展编解码器可以对从141Ait/S到321cbit/S具有21cbit/S的比特率扩展性的宽带信号进行编码，并且可以利用比特率上的增加来提高输出信号的质量。近来，正在开发能够提供基于G. 729. 1的超宽带信号的扩展编解码器。此扩展编解码器可以对窄带、宽带和超宽带信号进行编码和解码。扩展编解码器可以使用正弦脉冲编码来提高合成信号的质量。可以通过多个层来执行正弦脉冲编码。如果针对较低层进行的正弦脉冲编码所分配的脉冲或比特的数目在逐帧的基础上变化，则必须提供一种用于在较高层进行的正弦脉冲编码中提高合成信号的质
量的方案。

发明内容
技术问题本发明的实施例针对一种用于对音频信号进行编码和解码的方法和设备，当通过分层正弦脉冲编码方案来对较高层中的音频信号进行编码或解码时，该方法和设备可以通过考虑较低层的正弦脉冲编码来进一步改善合成信号的质量。可以通过以下描述来理解本发明的其他目的和优点，并且通过参考本发明的实施例，它们变得明显。同样，对于本发明所属技术领域的技术人员显然的是，可以通过如所要求保护的手段及其组合来实现本发明的目的和优点。技术解决方案根据本发明的实施例，一种用于对音频信号进行编码的方法包括接收变换后的音频信号；将变换后的音频信号划分为多个子频带；对所述子频带执行第一正弦脉冲编码操作；基于该第一正弦脉冲编码操作的编码信息，在所述子频带之中确定第二正弦脉冲编码操作的执行区域；以及对所确定的执行区域执行该第二正弦脉冲编码操作，其中，根据该编码信息来变化地执行该第一正弦脉冲编码操作。根据本发明的另一实施例，一种用于对音频信号进行编码的设备包括输入单元，被配置为接收变换后的音频信号；操作单元，被配置为将变换后的音频信号划分为多个子频带；第一正弦脉冲编码单元，被配置为对所述子频带执行第一正弦脉冲编码操作；以及第二正弦脉冲编码单元，被配置为基于该第一正弦脉冲编码操作的编码信息，在所述子频带之中确定第二正弦脉冲编码操作的执行区域，并且对所确定的执行区域执行该第二正弦脉冲编码操作，其中，该第一正弦脉冲编码单元根据该编码信息来变化地执行该第一正弦脉冲编码操作。根据本发明的另一实施例，一种用于对音频信号进行解码的方法包括接收变换后的音频信号；将变换后的音频信号划分为多个子频带；对所述子频带执行第一正弦脉冲解码操作；基于该第一正弦脉冲解码操作的解码信息，在所述子频带之中确定第二正弦脉冲解码操作的执行区域；以及对所确定的执行区域执行该第二正弦脉冲解码操作，其中，根据该解码信息来变化地执行该第一正弦脉冲解码操作。根据本发明的另一实施例，一种用于对音频信号进行解码的设备包括输入单元，被配置为接收变换后的音频信号；操作单元，被配置为将变换后的音频信号划分为多个子频带；第一正弦脉冲解码单元，被配置为对所述子频带执行第一正弦脉冲解码操作；以及第二正弦脉冲解码单元，被配置为基于该第一正弦脉冲解码操作的解码信息，在所述子频带之中确定第二正弦脉冲解码操作的执行区域，并且对所确定的执行区域执行该第二正弦脉冲解码操作，其中，该第一正弦脉冲解码单元根据该解码信息来变化地执行该第一正弦脉冲解码操作。有益效果如上所述，当通过分层正弦脉冲编码方案来对较高层中的音频信号进行编码或解码时，本发明可以通过考虑较低层的正弦脉冲编码来进一步改善合成信号的质量。

图1是提供了与窄带(NB)编解码器的兼容性的超宽带(SWB)扩展编解码器的框图。图2是根据本发明实施例的音频信号编码设备的框图。图3是根据本发明实施例的音频信号解码设备的框图。图4图示了通过两个层来将正弦脉冲编码应用于与7_14kHz对应的211个MDCT 系数的结果。图5图示了根据本发明实施例的分层正弦脉冲编码的结果。图6图示了根据本发明另一实施例的分层正弦脉冲编码的结果。图7图示了根据本发明另一实施例的分层正弦脉冲编码的结果。图8是图示了通过传统的正弦脉冲编码方法所合成的MDCT系数和通过本发明的正弦脉冲编码方法所合成的MDCT系数的曲线图。图9是图示了根据本发明实施例的音频信号编码方法的流程图。图10是图示了根据本发明实施例的音频信号解码方法的流程图。
5
图11是根据本发明另一实施例的音频信号编码设备的框图。图12是根据本发明另一实施例的音频信号解码设备的框图。
具体实施例方式下面，将参考附图来更加详细地描述本发明的示范实施例。然而，本发明可以按照不同的形式来实施，并且不应被诠释为限于在这里提出的实施例。相反地，提供这些实施例，使得本公开将是彻底和完全的，并将向本领域技术人员充分地传达本发明的范围。贯穿整个公开，贯穿本发明的各个图形和实施例，同样的附图标记指代同样的部分。图1是提供了与窄带(NB)编解码器的兼容性的超宽带(SWB)扩展编解码器的框图。一般地，扩展编解码器被配置为将输入信号划分为多个频带，并且对每个频带的信号进行编码/解码。参考图1，通过初级低通滤波器(LPF) 102和初级高通滤波器 (HPF) 104来对输入信号进行滤波。初级LPF 102执行滤波和下采样，以输出输入信号的低频信号A(O-SkHz)。初级HPF 104执行滤波和下采样，以输出输入信号的高频信号 B(8-16kHz)。将从初级LPF 102输出的低频信号A输入到次级LPF 106和次级HPF108。次级 LPF 106执行滤波和下采样，以输出低低频信号Al (0-4kHz)，而次级HPF 108执行滤波和下采样，以输出低高频信号A2 (4-8kHz)。将低低频信号Al输入到窄带编码模块110。将低高频信号A2输入到宽带扩展编码模块112。将高频信号B输入到超宽带编码模块114。如果操作窄带编码模块110，则仅仅再现窄带信号。如果操作窄带编码模块110和宽带扩展编码模块112，则再现宽带信号。如果操作窄带编码模块110、宽带扩展编码模块112和超宽带扩展编码模块114，则再现超宽带信号。ITU-T G. 729. 1编解码器是图1所图示的扩展编解码器的典型示例。 ITU-TG. 729. 1编解码器是基于G. 729窄带编解码器的宽带扩展编解码器。G. 729. 1编解码器提供81Ait/S的与G. 729的比特流级别的兼容性，并且提供121Ait/S的具有更高质量的窄带信号。同样，G. 729. 1编解码器再现从14kbit/s到32kbit/s具有2kbit/s比特率扩展性的宽带信号，并且输出信号的质量随着比特率上的增加而改善。近来，正在开发能够提供基于G. 729. 1的超宽带质量的扩展编解码器。此扩展编解码器可以对窄带、宽带和超宽带信号进行编码和解码。在这种扩展编解码器中，可以根据频带来应用不同的编码方案，如图1所图示的。例如，G. 729. 1和G. 711. 1编解码器通过传统的窄带编解码器G 729和G 711来编码窄带信号，对于剩余的信号执行改进离散余弦变换(MDCT)操作，并且编码所输出的MDCT系数。MDCT域编码方案将MDCT系数划分为多个子频带，对每个子频带的形状和增益进行编码，并且通过ACELP (代数码激励线性预测)或正弦脉冲来对MDCT系数进行编码。一般地，扩展编解码器对用于带宽扩展的信息进行编码，并然后，对用于质量改善的信息进行编码。例如，扩展编解码器通过使用每个子频带的形状和增益来合成7-14kHz频带的信号，并然后通过使用ACELP或正弦脉冲编码方案来改善合成信号的质量。也就是说，用于提供超宽带质量的第一层通过使用诸如每个子频带的形状和增益之类的信息来合成与7-14kHz频带的信号。使用附加的比特，以应用用于提高合成信号的质量的正弦脉冲编码操作。此结构使得可能根据比特率上的增加来改善合成信号的质量。一般地，正弦脉冲编码方案按照预定的步长来编码最大脉冲的代码信息、尺寸和位置(即，可以对于质量施加最大影响的脉冲)。随着脉冲搜索步长的宽度增加，计算量增力口。相应地，在逐子帧的基础上或在逐子频带的基础上执行正弦脉冲编码操作比在整个帧上(在时域的情况下)或在整个频带上执行正弦脉冲编码操作更为可取。正弦脉冲编码方案需要更多的比特来传送一个脉冲，但是可以更加准确地表现影响信号质量的信号。编解码器的输入信号具有取决于频率的各种能量分布。具体地，音乐信号比语音信号具有更大的取决于频率的能量改变。更大能量的子频带信号对于合成信号的质量施加更大的影响。可以使用分层的正弦脉冲编码方案来在逐子频带的基础上执行正弦脉冲编码操作。分层的正弦脉冲编码方案通过多个层来执行正弦脉冲编码操作。例如，第一层在整个子频带的第一区域上执行正弦脉冲编码操作，而第二层在整个子频带的第二区域上执行正弦脉冲编码操作。当执行分层的正弦脉冲编码操作时，可能通过考虑如上所述的信号的能量或频带来改善音频信号的质量。本发明提供了音频信号的编码/解码方案，当在图1的扩展编解码器中执行分层的正弦脉冲编码操作时，所述方案可以通过在先前层的编码信息的基础上执行接下来的层上的正弦脉冲编码操作来进一步改善合成信号的质量。在本发明的以下描述中，将把语音和音频信号称作音频信号。图2是根据本发明实施例的音频信号编码设备的框图。参考图2，音频信号编码设备202包括输入单元204、操作单元206、第一正弦脉冲编码单元208、和第二正弦脉冲编码单元210。输入单元204接收变换后的音频信号，例如通过MDCT而从音频信号中变换的MDCT 系数。操作单元206将通过输入单元204所接收到的变换后的音频信号划分为多个子频
市ο第一正弦脉冲编码单元208对操作单元206所划分的子频带执行第一正弦脉冲编码操作。第一正弦脉冲编码单元208根据编码信息来变化地执行第一正弦脉冲编码操作。在这里，该编码信息可以是关于为第一正弦脉冲编码操作所分配的比特数目的信息、或者关于为第一正弦脉冲编码操作所分配的脉冲数目的信息。此外，变化地执行第一正弦脉冲编码操作可以意指在变更比特数目或脉冲数目的同时、执行第一正弦脉冲编码操作，或者可以意指按照每个子频带的能量的顺序、而不是按照频带的顺序来执行第一正弦脉冲编码操作。第二正弦脉冲编码单元210在第一正弦脉冲编码操作的编码信息的基础上，在所述子频带之中确定第二正弦脉冲编码操作的执行区域。在示范实施例中，如果编码信息小于预定的值，则第二正弦脉冲编码单元210将子频带的较低频带确定为第二正弦脉冲编码操作的执行区域，并且如果编码信息大于或等于预定的值，则将子频带的较高频带确定为第二正弦脉冲编码操作的执行区域。在另一示例实施例中，第二正弦脉冲编码单元210从没有应用第一正弦脉冲编码操作的最低频带，开始应用第二正弦脉冲编码操作。第二正弦脉冲编码单元210对所确定的执行区域执行第二正弦脉冲编码操作。图3是根据本发明实施例的音频信号解码设备的框图。参考图3，音频信号解码设备302包括输入单元304、操作单元306、第一正弦脉冲解码单元308、和第二正弦脉冲解码单元310。输入单元304接收变换后的音频信号，例如通过MDCT而从音频信号变换的MDCT 系数。操作单元306将通过输入单元304所接收到的变换后的音频信号划分为多个子频
市ο第一正弦脉冲解码单元308对操作单元306所划分的子频带执行第一正弦脉冲解码操作。第一正弦脉冲解码单元308根据解码信息来变化地执行第一正弦脉冲解码操作。在这里，该解码信息可以是关于为第一正弦脉冲解码操作所分配的比特数目的信息、或者关于为第一正弦脉冲解码操作所分配的脉冲数目的信息。同样，变化地执行第一正弦脉冲解码操作可以意指在变更比特数目或脉冲数目的同时、执行第一正弦脉冲解码操作，或者可以意指按照每个子频带的能量的顺序、而不是按照频带的顺序来执行第一正弦脉冲解码操作。第二正弦脉冲解码单元310在第一正弦脉冲解码操作的解码信息的基础上，在所述子频带之中确定第二正弦脉冲解码操作的执行区域。在示范实施例中，如果解码信息小于预定的值，则第二正弦脉冲解码单元310将子频带的较低频带确定为第二正弦脉冲解码操作的执行区域，并且如果解码信息大于或等于预定的值，则将子频带的较高频带确定为第二正弦脉冲解码操作的执行区域。在另一示例实施例中，第二正弦脉冲解码单元310从没有应用第一正弦脉冲解码操作的最低频带开始应用第二正弦脉冲解码操作。第二正弦脉冲解码单元310对所确定的执行区域执行第二正弦脉冲解码操作。可以将图2和图3所图示的音频信号编码设备202和音频信号解码设备302包括在图ι所图示的窄带编码模块110、宽带扩展编码模块112或超宽带扩展编码模块114中。在下文中，将参考图1到图8来描述根据本发明实施例的音频信号编码/解码方法。超宽带扩展编码模块114将与7_14kHz对应的MDCT系数划分为多个子频带，并且编码/解码每个子频带的形状和增益，以获得误差信号。超宽带扩展编码模块114对误差信号执行正弦脉冲编码/解码操作。在这里，假设正弦脉冲编码具有能够通过41Ait/S或 8kbit/s的单位来控制比特率的分层结构。超宽带扩展编码模块114将高频(7_14kHz)信号变换到MDCT域中，并且通过分层的正弦脉冲编码方案来编码MDCT系数。即，超宽带扩展编码模块114将MDCT系数划分为多个子频带，并且针对每个子频带来编码两个脉冲。在这里，假设第一层可以根据帧来编码上至10个脉冲，而第二层可以按照固定的方式来编码10个脉冲。即，第一层中的脉冲的数目从0变化到10。如果一个子频带的范围是0. 8kHz ( = 32个样本)，并且如果确定了子频带的开始点，则来自其的32个样本成为一个子频带。图4图示了通过两个层来将正弦脉冲编码应用于与7_14kHz对应的211个MDCT 系数的结果。在图4中，N表示用于在第一层中执行正弦脉冲编码的脉冲的数目。参考图4，第一层可以不执行正弦脉冲编码(N = 0)，或者可以通过使用上至10个脉冲(N = 10)来执行正弦脉冲编码。因为为每个子频带分配两个脉冲，所以用于正弦脉冲编码的子频带的数目根据用于执行正弦脉冲编码的脉冲的数目(即，N)来变化。如果N =2，则将正弦脉冲编码应用于仅仅一个子频带。如果N= 10，则将正弦脉冲编码应用于五个子频带，如图4所图示的。在图4中，第二层总是将正弦脉冲编码应用于相同范围的子频带，而与第一层无关。即，第二层总是从9. 4kHz ( = 96个样本)开始正弦脉冲编码，而与第一层中的正弦脉冲编码无关。当如图4所图示地执行正弦脉冲编码时，如果在第一层中N = 6，则在执行第二层的正弦脉冲编码之后，将正弦脉冲编码应用于7-13. 4kHz的整个频带。然而，如果在第一层中N = 2，则在执行了第二层的正弦脉冲编码之后，不能将正弦脉冲编码应用于7. 8-9. 4kHz 频带，因而使得合成信号的质量劣化。有关音频信号(特别地，语音信号)的能量分布，有声声音的能量位于较低频带中，并且无声声音或爆破声音的能量位于较高频带中。尽管它可以根据信号特性而不同，但是大部分音频信号在IOkHz或更小处具有大的能量。即，如图4所图示的，如果与第一层的正弦脉冲编码无关地执行第二层的正弦脉冲编码，则不将正弦脉冲编码应用于一些频带 (特别地，不影响语音质量的频带)，因而使得合成信号的质量劣化。为了解决以上问题，本发明提供了一种音频信号编码/解码方法，用于通过在第一层上的正弦脉冲编码操作的编码信息的基础上、执行第二层上的正弦脉冲编码操作来改善合成信号的质量。图5图示了根据本发明实施例的分层正弦脉冲编码的结果。参考图5，图2的操作单元204接收MDCT系数。操作单元206将所接收到的MDCT 系数划分为多个子频带，如图5所图示的。在这里，每个子频带具有32个采样。第一正弦脉冲编码单元208对第一层执行第一正弦脉冲编码操作。在这里，第一正弦脉冲编码单元208根据编码信息来变化地执行第一正弦脉冲编码操作。该编码信息可以是关于为第一正弦脉冲编码操作所分配的比特数目的信息、或者关于为第一正弦脉冲编码操作所分配的脉冲数目的信息。如果为第一正弦脉冲编码操作分配四个正弦脉冲(或对应的比特)，则第一正弦脉冲编码单元208使用这种信息来对两个子频带(N = 4)执行第一正弦脉冲编码操作。第二正弦脉冲编码单元210使用以上编码信息来在子频带之中确定正弦脉冲编码操作的执行区域。第二正弦脉冲编码单元210可以从第一正弦脉冲编码单元208接收编码信息，该编码信息包括关于为第一正弦脉冲编码操作所分配的比特数目的信息、关于所分配的脉冲数目的信息、和关于每个脉冲的代码、尺寸和位置的信息。参考图5，如果N小于 8，则第二正弦脉冲编码单元210对较低频带(7-llkHz)执行第二正弦脉冲编码操作。如果 N大于或等于8，则第二正弦脉冲编码单元210对较高频带(9. 75-13. 75kHz)执行第二正弦脉冲编码操作。执行这种分层的正弦脉冲编码操作可以解决传统编码方法的问题。例如，如果在第一层中N = 6，则第二层在较低层上执行正弦脉冲编码操作，如图5所图示的，因而使得可能改善在IOkHz或更小处具有大部分能量的音频信号的质量。
图6图示了根据本发明另一实施例的分层正弦脉冲编码的结果。此实施例的第二正弦脉冲编码单元210像参考图5所描述的第二正弦脉冲编码单元210 —样地执行第二正弦脉冲编码操作。然而，此实施例的第一正弦脉冲编码单元208 按照子频带的能量的顺序、而不是按照频带的顺序来变化地执行正弦脉冲编码操作。图7图示了根据本发明另一实施例的分层正弦脉冲编码的结果。此实施例的第一正弦脉冲编码单元208像图4的实施例一样地执行第一正弦脉冲编码操作。第二正弦脉冲编码单元210在编码信息的基础上执行第二正弦脉冲编码操作，所述编码信息包括关于在第一层中没有对于其执行第一正弦脉冲编码操作的最低频带的信息。例如，如果N = 4，如图7所图示的，则第二正弦脉冲编码单元210从与第64个样本对应的子频带开始正弦脉冲编码。可以将本发明的上述实施例相似地应用于解码，以及应用于编码。图8是图示了通过传统的正弦脉冲编码方法所合成的MDCT系数和通过本发明的正弦脉冲编码方法所合成的MDCT系数的曲线图。在图8中，蓝线表现了原始的MDCT系数，而红线表现了通过传统方法所编码/解码的MDCT系数。黄线表现了通过本发明的方法所编码/解码的MDCT系数。在这里，在第一层中N = 0，并且在第二层中编码10个脉冲。因而，在本发明的编码/解码方法中，第二层从7kHz开始正弦脉冲编码或解码。如图8所图示的，当与传统的方法比较时，本发明的编码/解码方法可以更好地表现可能对于音频信号的质量施加极大影响的、在较低频带中具有更高能量的信号。图9是图示了根据本发明实施例的音频信号编码方法的流程图。参考图9，在步骤S902中，音频信号编码方法接收变换后的音频信号，例如MDCT系数。在步骤S904中，音频信号编码方法将变换后的音频信号划分为多个子频带。在步骤S906中，音频信号编码方法对子频带执行第一正弦脉冲编码操作。音频信号编码方法根据编码信息来变化地执行第一正弦脉冲编码操作。在这里，该编码信息可以是关于为第一正弦脉冲编码操作所分配的比特数目的信息、或者关于为第一正弦脉冲编码操作所分配的脉冲数目的信息。同样，变化地执行第一正弦脉冲编码操作可以意指在变更比特数目或脉冲数目的同时、执行第一正弦脉冲编码操作，或者可以意指按照每个子频带的能量的顺序、而不是按照频带的顺序来执行第一正弦脉冲编码操作。在步骤S908中，音频信号编码方法在第一正弦脉冲编码操作的编码信息的基础上，在所述子频带之中确定第二正弦脉冲编码操作的执行区域。在示范实施例中，如果编码信息小于预定的值，则音频信号编码方法将子频带的较低频带确定为第二正弦脉冲编码操作的执行区域，并且如果编码信息大于或等于预定的值，则将子频带的较高频带确定为第二正弦脉冲编码操作的执行区域。在另一示例实施例中，音频信号编码方法从没有应用第一正弦脉冲编码操作的最低频带，开始应用第二正弦脉冲编码操作。在步骤S910中，音频信号编码方法对所确定的执行区域执行第二正弦脉冲编码操作。图10是图示了根据本发明实施例的音频信号解码方法的流程图。参考图10，在步骤S1002中，音频信号解码方法接收变换后的音频信号，例如MDCT 系数。在步骤S1004中，音频信号解码方法将变换后的音频信号划分为多个子频带。在步骤S1006中，音频信号解码方法对子频带执行第一正弦脉冲解码操作。音频信号解码方法根据解码信息来变化地执行第一正弦脉冲解码操作。在这里，该解码信息可以是关于为第一正弦脉冲解码操作所分配的比特数目的信息、或者关于为第一正弦脉冲解码操作所分配的脉冲数目的信息。此外，变化地执行第一正弦脉冲解码操作可以意指在变更比特的数目或脉冲的数目的同时、执行第一正弦脉冲解码操作，或者可以意指按照每个子频带的能量的顺序、而不是按照频带的顺序来执行第一正弦脉冲解码操作。在步骤S1008中，音频信号解码方法在第一正弦脉冲解码操作的解码信息的基础上，在所述子频带之中确定第二正弦脉冲解码操作的执行区域。在示范实施例中，如果解码信息小于预定的值，则音频信号解码方法将子频带的较低频带确定为第二正弦脉冲解码操作的执行区域，并且如果解码信息大于或等于预定的值，则将子频带的较高频带确定为第二正弦脉冲解码操作的执行区域。在另一示例实施例中，音频信号解码方法从没有应用第一正弦脉冲解码操作的最低频带，开始应用第二正弦脉冲解码操作。在步骤S1010中，音频信号解码方法对所确定的执行区域执行第二正弦脉冲解码操作。在下文中，将参考图11和12来描述根据本发明另一实施例的音频信号编码/解码方法和设备。图11是根据本发明另一实施例的音频信号编码设备的框图。参考图11，音频信号编码设备接收32kHz输入信号，并且在输出以前，合成宽带信号和超宽带信号。音频信号编码设备包括宽带扩展编码模块(1102、1108和112 以及超宽带扩展编码模块(1104、1106、1110和1112)。宽带扩展编码模块(即，G. 7 . 1核心编解码器)基于16kHz信号来操作，而超宽带扩展编码模块基于32kHz信号来操作。在MDCT域中执行超宽带扩展编码。使用两个模式(即，类模式1114和正弦脉冲模式1116)来对超宽带扩展编码模块的第一层进行编码。在所测量的输入信号的音调的基础上确定是使用类模式1114还是使用正弦脉冲模式1116。通过用于改善高频含量的质量的正弦脉冲编码单元 (1118和1120)，或者通过用于改善宽带含量的感知质量的宽带信号改善单元1122，来编码较高的超宽带层。将32kHz输入信号输入到下采样单元1102，并且下采样到16kHz。将所下采样的 16kHz信号输入到G. 729. 1编解码器1108。G. 729. 1编解码器1108对于16kHz输入信号执行宽带编码操作。将从G.729. 1编解码器1108输出的所合成的321cbit/S信号输入到宽带信号改善单元1122，并且宽带信号改善单元1122改善输入信号的质量。其间，将32kHz输入信号输入到MDCT单元1106，并且将它变换到MDCT域中。将变换到MDCT域中的输入信号输入到音调测量单元1104，并且确定输入信号是否是音调的 (1110)。即，在通过在MDCT域中比较输入信号的先前帧与当前帧的对数域能量所执行的音调测量的基础上，定义第一超宽带层的编码模式。音调测量是基于输入信号的先前帧与当前帧的频谱峰值之间的相关性分析。在从音调测量单元输出的音调信息的基础上，确定输入信号是否是音调的 (1110)。例如，如果音调信息大于阈值，则将输入信号确定为是音调的，并且如果不是这样，则将输入信号确定为不是音调的。还将音调信息包括在向解码器传输的比特流中。如果输入信号是音调的，则使用正弦脉冲模式1116 ；并且如果不是，则使用类模式1114。当输入信号的帧不是音调的(音调(tonal) = 0)时，使用类模式1114。类模式 1114使用G. 729. 1宽带编解码器1108的编码MDCT域表现来对高频进行编码。将高频频带(7-14kHz)划分为四个子频带，并且从编码后的、包络规格化的宽带含量中搜索用于每个子频带的所选择的相似性准则。为了获得合成的高频含量，通过两个定标因子(scaling factor)(即，线性域的第一定标因子和对数域的第二定标因子)来对最为相似的匹配进行定标。在正弦脉冲编码单元1118和类模式1114中，通过附加的脉冲来改善此含量。类模式1114可以通过本发明的音频编码方法来改善编码信号的质量。例如，比特预算允许在第一 Ibit/s超宽带层中将两个脉冲进行加和。在合成的高频信号的子频带能量的基础上选择用于搜索要加和的脉冲的轨道(track)的开始位置。可以将合成的子频带的能量表达为下面的等式1。
权利要求
1.一种用于对音频信号进行编码的方法，包括接收变换后的音频信号；将变换后的音频信号划分为多个子频带；对所述子频带执行第一正弦脉冲编码操作；基于该第一正弦脉冲编码操作的编码信息，在所述子频带之中确定第二正弦脉冲编码操作的执行区域；以及对所确定的执行区域执行该第二正弦脉冲编码操作，其中，根据该编码信息来变化地执行该第一正弦脉冲编码操作。
2.根据权利要求1的方法，其中，该编码信息是关于为该第一正弦脉冲编码操作所分配的比特数目的信息、或者关于为该第一正弦脉冲编码操作所分配的脉冲数目的信息。
3.根据权利要求1的方法，其中，所述基于该第一正弦脉冲编码操作的编码信息、在所述子频带之中确定第二正弦脉冲编码操作的执行区域的步骤包括如果该编码信息小于预定的值，则将所述子频带的较低频带确定为该第二正弦脉冲编码操作的执行区域；以及如果该编码信息大于或等于该预定的值，则将所述子频带的较高频带确定为该第二正弦脉冲编码操作的执行区域。
4.一种用于对音频信号进行编码的设备，包括输入单元，被配置为接收变换后的音频信号；操作单元，被配置为将变换后的音频信号划分为多个子频带；第一正弦脉冲编码单元，被配置为对所述子频带执行第一正弦脉冲编码操作；以及第二正弦脉冲编码单元，被配置为基于该第一正弦脉冲编码操作的编码信息，在所述子频带之中确定第二正弦脉冲编码操作的执行区域，并且对所确定的执行区域执行该第二正弦脉冲编码操作，其中，该第一正弦脉冲编码单元根据该编码信息来变化地执行该第一正弦脉冲编码操作。
5.根据权利要求4的设备，其中，该编码信息是关于为该第一正弦脉冲编码操作所分配的比特数目的信息、或者关于为该第一正弦脉冲编码操作所分配的脉冲数目的信息。
6.根据权利要求4的设备，其中，如果该编码信息小于预定的值，则该第二正弦脉冲编码单元将所述子频带的较低频带确定为该第二正弦脉冲编码操作的执行区域，并且如果该编码信息大于或等于该预定的值，则将所述子频带的较高频带确定为该第二正弦脉冲编码操作的执行区域。
7.一种用于对音频信号进行解码的方法，包括接收变换后的音频信号；将变换后的音频信号划分为多个子频带；对所述子频带执行第一正弦脉冲解码操作；基于该第一正弦脉冲解码操作的解码信息，在所述子频带之中确定第二正弦脉冲解码操作的执行区域；以及对所确定的执行区域执行该第二正弦脉冲解码操作，其中，根据该解码信息来变化地执行该第一正弦脉冲解码操作。
8.根据权利要求7的方法，其中，该解码信息是关于为该第一正弦脉冲解码操作所分配的比特数目的信息、或者关于为该第一正弦脉冲解码操作所分配的脉冲数目的信息。
9.根据权利要求7的方法，其中，所述基于该第一正弦脉冲解码操作的解码信息、在所述子频带之中确定第二正弦脉冲解码操作的执行区域的步骤包括如果该解码信息小于预定的值，则将所述子频带的较低频带确定为该第二正弦脉冲解码操作的执行区域；以及如果该解码信息大于或等于该预定的值，则将所述子频带的较高频带确定为该第二正弦脉冲解码操作的执行区域。
10.一种用于对音频信号进行解码的设备，包括输入单元，被配置为接收变换后的音频信号；操作单元，被配置为将变换后的音频信号划分为多个子频带；第一正弦脉冲解码单元，被配置为对所述子频带执行第一正弦脉冲解码操作；以及第二正弦脉冲解码单元，被配置为基于该第一正弦脉冲解码操作的解码信息，在所述子频带之中确定第二正弦脉冲解码操作的执行区域，并且对所确定的执行区域执行该第二正弦脉冲解码操作，其中，该第一正弦脉冲解码单元根据该解码信息来变化地执行该第一正弦脉冲解码操作。
11.根据权利要求10的设备，其中，该解码信息是关于为该第一正弦脉冲解码操作所分配的比特数目的信息、或者关于为该第一正弦脉冲解码操作所分配的脉冲数目的信息。
12.根据权利要求10的设备，其中，如果该解码信息小于预定的值，则该第二正弦脉冲解码单元将所述子频带的较低频带确定为该第二正弦脉冲解码操作的执行区域，并且如果该解码信息大于或等于该预定的值，则将所述子频带的较高频带确定为该第二正弦脉冲解码操作的执行区域。
全文摘要
本发明涉及一种用于对音频信号进行编码和解码的方法和设备。根据本发明一个实施例的用于对音频信号进行编码的方法包括接收转换后的音频信号；将转换后的音频信号划分为多个子频带；对所述多个子频带执行第一正弦脉冲编码；在所述多个子频带之中，确定其中要执行第二正弦脉冲编码的区块；以及在对应的区块上执行第二正弦脉冲编码，其中，取决于编码信息来变化地执行第一正弦脉冲编码步骤。根据本发明，当使用层级的正弦脉冲编码来对较高层中的音频信号进行编码或解码时，还考虑较低层的正弦脉冲编码，以用于更加提高合成信号的质量。
文档编号G10L19/02GK102460574SQ201080032331
公开日2012年5月16日申请日期2010年5月19日优先权日2009年5月19日
发明者成钟模, 李炳墡, 李美淑, 梁熙植, 裵贤珠, 金炫佑申请人:韩国电子通信研究院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李美淑;梁熙植;金炫佑;成钟模;裵贤珠;李炳墡
技术所有人：韩国电子通信研究院
我是此专利的发明人