使用基于残差信号调整解相关信号贡献的多声道音频解码器、多声道音频编码器、方法和...的制作方法

文档序号：9794126阅读：294来源：国知局

使用基于残差信号调整解相关信号贡献的多声道音频解码器、多声道音频编码器、方法和 ...的制作方法
【技术领域】
[0001] 根据本发明的实施例涉及用于在编码表示的基础上提供至少二个输出音频信号的多声道音频解码器。
[0002] 根据本发明的另一实施例涉及用于提供多声道音频信号的编码表示的音频编码器。
[0003] 根据本发明的另一实施例涉及用于在编码表示的基础上提供至少二个输出音频信号的方法。
[0004] 根据本发明的另一实施例涉及用于提供多声道音频信号的编码表示的方法。
[0005] 根据本发明的另一实施例涉及用于执行方法中一个的计算机程序。
[0006] -般来说，根据本发明的部分实施例涉及结合的残差与参数编码。
【背景技术】
[0007] 近年来，对于音频内容的储存和传输的需求一直在稳步地增加。此外，对于音频内容的储存和传输的质量需求也一直在稳步地增加。从而，对于音频内容的编码和解码的概念也已经被强化。例如，所谓的"高级音频编码(ACC)"已被建立，例如，其在国际标准ISO/ IEC 13818-7:2003 中被描述。
[0008] 此外，部分空间的延伸也已经被建立，例如，所谓的" MPEG环绕"概念，例如，其在国际标准IS0/IEC 23003-1:2007中被描述。此外，对于音频信号的空间信息的编码和解码的附加改进在国际标准IS0/IEC23003-2:2010中被描述，其涉及所谓的空间音频对象编码。此外，灵活的（可切换的）音频编码/解码概念提供了以高效率编码对一般音频信号和语音信号进行编码的可能性，也提供了处理多声道音频信号的可能性，其如定义在国际标准ISO/ IEC 23003-3:2012所描述的"统一语音及音频编码"概念中。
[0009] 然而，目前仍然期望能够提供一种对于多声道音频信号的高效率编码/解码的更高级概念。

【发明内容】

[0010] 根据本发明的实施例建立了用于在编码表示的基础上提供至少两个输出音频信号的多声道音频解码器。多声道音频解码器被配置用于执行降混合信号、解相关信号和残差信号的加权组合，以获得输出音频信号中的一个。多声道音频解码器被配置用于根据残差信号确定用来描述加权组合中残差信号的贡献的权重。
[0011] 根据本发明的该实施例基于以下发现，如果，用来描述降混合信号、解相关信号和残差信号的加权组合中解相关信号的贡献的权重根据残差信号而被调整，则能够在编码表示的基础上非常有效率地获得输出音频信号。从而，通过根据残差信号调整用来描述加权组合中解相关信号的贡献的权重，有可能在没有传输附加控制信息下在参数编码(或主要地参数编码）和残差编码（或主要地残差编码）之间进行混合（或衰退）。此外，还可发现的是，被包含至编码表示中的残差信号是针对权重的良好指示，该权重用来描述加权组合中解相关信号的贡献，一般较佳的作法是，如果残差信号是(相对地)微弱的（或者对于期望能量的再建是不必须的），则在解相关信号上置放(相对地)较高的权重，如果残差信号是(相对地)强大的（或者对于期望能量的再建是必须的），则在解相关信号上置放(相对地)较低的权重。从而，上述提及的概念允许在参数编码(其中，例如，期望能量特征和/或相关特征通过参数信号化以及通过增加解相关信号再建)和残差编码(其中，在部分情况下，残差信号用于再建以输出音频信号，其是降混合信号基础上的输出音频信号的波形)之间的渐近转变。从而，有可能地针对再建和再建的质量而改编该技术，以成为没有附加信号化负担的解码信号。
[0012] 在较佳的实施例中，多声道音频解码器被配置用于根据解相关信号确定用来描述加权组合中解相关信号的贡献的权重。通过根据残差信号和根据解相关信号来确定用来描述加权组合中解相关信号的贡献的权重，权重能够良好地调整至信号特征，使得在编码表示的基础上(特别是，在降混合信号、解相关信号和残差信号的基础上），至少二个输出音频信号的再建可以达到良好的质量。
[0013] 在较佳实施例中，多声道音频解码器被配置用于在编码表示的基础上获得升混合参数，并根据升混合参数确定用来描述加权组合中解相关信号的贡献的权重。通过考虑升混合参数，有可能再建输出音频信号的期望特征(例如，输出音频信号之间的期望相关性，和/或输出音频信号的期望能量特征），以得到期望值。
[0014] 在较佳实施例中，多声道音频解码器被配置用于确定用来描述加权组合中解相关信号的贡献的权重，使得解相关信号的权重随着一个或多个残差信号的能量的增加而减少。该机制允许根据残差信号的能量调整至少二个输出音频信号的再建的精准度。如果残差信号的能量相对地高，则解相关信号的贡献的权重相对地小，使得解相关信号不会长久有害地影响由使用残差信号所造成的再制的高质量。相反地，如果残差信号的能量相对地低，或者甚至为零，高权重被给予至解相关信号，使得解相关信号能有效地将输出音频信号的特征带至期望值。
[0015] 在较佳实施例中，多声道音频解码器被配置用于确定用来描述加权组合中解相关信号的贡献的权重，使得如果残差信号的能量为零，则解相关信号升混合参数所确定的最大权重关联至解相关信号，并且使得如果以残差信号加权系数进行加权的残差信号的能量大于或等于以解相关信号升混合参数进行加权的解相关信号的能量，则零权重关联至解相关信号。该实施例基于以下发现，应该被添加至降混合信号的期望能量根据以解相关信号升混合参数进行加权的解相关信号的能量所确定。进而，总结来说，如果以残差信号加权系数进行加权的残差信号的能量大于或等于以解相关信号升混合参数进行加权的解相关信号的能量，则不需要再加入解相关信号。换句话说，如果判断残差信号携带足够的能量(例如，足够到达必须的总能量），则解相关信号不再用于提供至少二个输出音频信号。
[0016] 在较佳实施例中，多声道音频解码器被配置用于计算以根据一个或多个解相关信号升混合参数进行加权的解相关信号的加权能量值，并且计算使用一个或多个残差信号升混合参数(其可等同于上述提及的残差信号加权系数)进行加权的残差信号的加权能量值，以根据解相关信号的加权能量值和残差信号的加权能量值来决定因子，并在因子的基础上获得用来描述解相关信号对于音频输出信号中（至少)一个的贡献的权重。在此可发现，该流程非常适合于用来描述解相关信号对于一个或多个输出音频信号的贡献的权重的高效率计算。
[0017] 在较佳实施例中，多声道音频解码器被配置用于将因子乘以解相关信号升混合参数，以获得用来描述解相关信号对于输出音频信号中的（至少)一个的贡献的权重。通过使用该流程，为了确定用来描述加权组合中解相关信号的贡献的权重，有可能考虑，用来描述至少二个输出音频信号（其根据解相关信号升混合参数进行描述）的期望信号特征的一个或多个参数，以及在解相关信号的能量以及残差信号的能量之间的关系。因此，当仍然考虑输出音频信号（由解相关信号升混合参数所反映）的期望特征时，在参数编码(或者主要地参数编码)和残差编码(或者主要地残差编码)之间的混合(或者衰退)是存在可能性的。
[0018] 在较佳实施例中，多声道音频解码器被配置用于在多个升混合声道和多个时隙上计算以使用解相关信号升混合参数进行加权的解相关信号的能量，以获得解相关信号的加权能量值。从而，有可能避免解相关信号的加权能量值的强烈变化。因此，多声道音频解码器的稳定调整可达成。
[0019] 类似地，多声道音频解码器被配置用于在多个升混合声道和多个时隙上计算以使用残差信号升混合参数进行加权的残差信号的能量，以获得残差信号的加权能量值。从而，由于避免了残差信号的加权能量值的强烈变化，多声道音频解码器的稳定调整可达成。然而，平均期间被选择地足够短，以允许加权的动态调整。
[0020] 在较佳实施例中，多声道音频解码器被配置用于根据解相关信号的加权能量值和残差信号的加权能量值之间的差异计算因子。一种计算，"比较"解相关信号的加权能量值和残差信号的加权能量值，允许使用（加权版本的）解相关信号补充残差信号（或者残差信号的加权版本），其中用来描述解相关信号的贡献的权重被调整到至少二个音频输出信号的提供的需求。
[0021] 在较佳实施例中，多声道音频解码器被配置用于根据比例计算因子，比例介于，解相关信号的加权能量值和残差信号的加权能量值之间的差异，和解相关信号的加权能量值之间。在此可发现，根据该比例的因子的计算带来长久特别的良好结果。此外，值得一提的是，为了达到良好的听觉印象(或是等价地，当相较于不存在残差信号的情况时，为了在输出音频信号中具有大体相同的信号能量），比例描述了解相关信号(使用解相关信号升混合参数进行加权)的全部能量的那部分在残差信号的出现是必须的。
[0022] 在较佳实施例中，多声道音频解码器被配置用于确定用来描述解相关信号对于两个或两个以上输出音频信号的贡献的权重。在此情况下，多声道音频解码器被配置用于在解相关信号的加权能量值和第一声道解相关信号升混合参数的基础上，确定解相关信号对于第一输出音频信号的贡献。此外，多声道音频解码器被配置用于在解相关信号的加权能量值和第二声道解相关信号升混合参数的基础上，确定解相关信号对于第二输出音频信号的贡献。于是，具有适度效果和良好音频质量的二个输出音频信号能够被提供，其中二个输出音频信号之间的差异通过第一声道解相关信号升混合参数和第二声道解相关信号升混合参数的运用而进行考虑的。
[0023] 在较佳实施例中，多声道音频解码器被配置用于如果残差能量超过解相关器能量 (即，解相关信号的能量，或其加权版本的能量），则禁止解相关信号对于加权组合的贡献。于是，如果残差信号携带足够的能量，如果残差信号超过解相关器能量，有可能不需要解相关信号的运用便可以切换至单纯残差编码。
[0024] 在较佳实施例中，音频解码器被配置用于根据残差信号的加权能量值的频带化决定，频带化地确定用来描述加权组合中解相关信号的贡献的权重。于是，有可能不需要附加信号化负担即可弹性地决定，其中，至少二个输出音频信号的细化的频带应该（或是主要地）以参数编码为基础，其中，至少二个输出音频信号的细化的频带应该(或是主要地）以残差编码为基础。如此一来，可以灵活地决定频带，当持续保持解相关信号的权重相对小时， (至少主要地)使用残差编码执行波形再建(或是至少部分的波形再建）。如此一来，便有可能根据选择性地应用参数编码(其主要根据解相关信号的提供)和残差编码(其主要根据残差信号的提供)以获得良好音频质量。
[0025] 在较佳实施例中，音频解码器被配置用于针对输出音频信号的每个帧，确定用来描述加权组合中解相关信号的贡献的权重。于是，可获得精细时间分辨率，其允许弹性地在参数编码(或主要地参数编码）以及随后的帧之间的残差编码(或主要地残差编码）之间进行切换。于是，音频解码可被调整至具有良好时间分辨率的音频信号的特征。
[0026] 根据本发明的另一实施例建立用于在编码表示的基础上提供至少二个输出音频信号的多声道音频解码器。多声道音频解码器被配置用于在降混合信号的编码表示、多个编码空间参数和残差信号的编码表示的基础上，获得输出音频信号中的（至少)一个。多声道音频解码器被配置用于根据残差信号在参数编码和残差编码之间进行混合。于是，非常灵活的音频解码概念达成，其中最佳解码模式(参数编码和解码对(versus)残差编码和解码)能够在没有额外信号化负担下被选择。此外，上述解释的考虑也被应用。
[0027] 根据本发明的实施例建立用于提供多声道音频信号的编码表示的多声道音频编码器。多声道音频编码器被配置用于在多声道音频信号的基础上获得降混合信号。而且，多声道音频编码器被配置用于提供用来描述多声道音频信号的声道之间的相依性的参数，并提供残差信号。此外，多声道音频编码器被配置用于根据多声道音频信号改变被包含至编码表示中的残差信号的数量。通过改变被包含至编码表示中的残差信号的数量，灵活地调整编码流程至信号特征是有可能的。例如，为了某部分（例如，为了暂时部分和/或频率部分），有可能包含相对而言大数量的残差信号至编码表示中，其中理想的是保留，至少部分地，解码音频信号的波形。因此，多声道音频信号的更多精确的基于残差信号的再建通过改变被包含至编码表示中残差信号的数量的可能性而被启用。此外，值得一提的是，结合如上所述的多声道音频解码器，高效率概念被建立，因为上述多声道音频解码器甚至不需要附件信号化地在(主要地)参数编码和（主要地)残差编码之间进行混合。于是，在此讨论的多声道编码器允许利用可能通过使用上述的多声道音频编码器的优点。
[0028] 在较佳实施例中，多声道音频编码器被配置用于根据多声道音频信号改变残差信号的带宽。于是，便有可能对残差信号进行调整，使得残差信号有助于再建心理声学上最重要的频带或频率范围。
[0029] 在较佳实施例中，多声道音频编码器被配置用于根据多声道音频信号选择残差信号被包含至编码表示中的频带。于是，对于必要或者最有益的频带，多声道音频编码器能决定其包含残差信号（其中残差信号典型地导致至少部分的波形再建）

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：萨沙·迪克;克里斯蒂安·赫尔姆里希;约翰内斯·希勒佩特;安德烈·赫尔策;
技术所有人：弗朗霍夫应用科学研究促进协会;
我是此专利的发明人

上一篇：多声道音频内容的编码的制作方法
上一篇：用于调整用于激活话音辅助功能的检测阈值的方法及设备的制造方法