对相关申请的交叉引用
本申请要求于2013年9月12日提交的美国临时专利申请no.61/877,189的优先权,其全部内容通过引用被结合于此。
本文所公开的发明一般而言涉及音频编码和解码。具体而言,它涉及适于通过执行多个立体声转换来编码和解码多声道音频系统的声道的音频编码器和音频解码器。
背景技术:
存在用于编码多声道音频系统的声道的现有技术。多声道音频系统的例子是包括中央声道(c)、左前方声道(lf)、右前方声道(rf)、左环绕声道(ls)、右环绕声道(rs)、以及低频效果(lfe)声道的5.1声道系统。编码这种系统的现有方法是单独地编码中央声道c,并且执行前方声道lf和rf的联合立体声编码,以及环绕声道ls和rs的联合立体声编码。lfe声道也被单独编码并且将在以下始终被假定为被单独编码。
现有方法存在若干个缺点。例如,考虑当lf和ls声道包括类似音量的类似音频信号时的情况。这种音频信号将听起来像来自位于lf和ls扬声器之间的虚拟声源。但是,上述方法不能高效地编码这种音频信号,因为它规定lf声道要与rf声道一起进行编码,而不是执行lf和ls声道的联合编码。因此,lf和ls扬声器的音频信号之间的相似性不能被利用以便实现高效的编码。
因此,当涉及多声道系统的编码时,存在对具有提高的灵活性的编码/解码框架的需要。
附图说明
在下文中,将参考附图更详细地描述示例实施例,其中附图中:
图1a示出了示例性双声道设置。
图1b和1c示出了根据例子的立体声编码和解码组件。
图2a示出了示例性三声道设置。
图2b和2c分别示出了根据例子的用于三声道设置的编码设备和解码设备。
图3a示出了示例性四声道设置。
图3b和3c分别示出了根据示例性实施例的用于四声道设置的编码设备和解码设备。
图4a示出了示例性五声道设置。
图4b和4c分别示出了根据示例性实施例的用于五声道设置的编码设备和解码设备。
图5a示出了示例性多声道设置。
图5b和5c分别示出了根据示例性实施例的用于多声道设置的编码设备和解码设备。
图6a、6b、6c、6d和6e示出了根据例子的五声道音频系统的编码配置。
图7示出了根据实施例的解码设备。
具体实施方式
鉴于以上所述,本文目的是提供编码设备和解码设备以及相关联的方法,其提供了多声道音频系统的声道的灵活和高效的编码。
i.概述–编码器
根据第一方面,提供了在多声道音频系统中的编码方法、编码设备和计算机程序产品。
根据示例性实施例,提供了在包括至少四个声道的多声道音频系统中的编码方法,包括:接收第一对输入声道和第二对输入声道;使第一对输入声道经历第一立体声编码;使第二对输入声道经历第二立体声编码;使从第一立体声编码得到的第一声道和与从第二立体声编码得到的第一声道相关联的音频声道经历第三立体声编码,以便获得第一对输出声道;使从第一立体声编码得到的第二声道和从第二立体声编码得到的第二声道经历第四立体声编码,以便获得第二对输出声道;以及输出第一和第二对输出声道。
第一对和第二对输入声道对应于要被编码的声道。第一对和第二对输出声道对应于编码后的声道。
考虑包括lf声道、rf声道、ls声道和rs声道的示例性音频系统。如果lf声道和ls声道与第一对输入声道相关联,并且rf声道和rs声道与第二对输入声道相关联,则以上示例性实施例将意味着第一lf和ls声道被联合编码,并且rf和rs声道被联合编码。换句话说,声道首先在前-后方向被编码。第一(前-后)编码的结果然后再次被编码,意味着编码被应用在左-右方向。
另一种选择是将lf声道和rf声道与第一对输入声道相关联,并且ls声道和rs声道与第二对输入声道相关联。这种声道的映射将意味着首先在左-右方向执行编码,随后在前-后方向编码。
换句话说,以上编码方法使得对如何联合编码多声道系统的声道增加了灵活性。
根据示例性实施例,与从第二立体声编码得到的第一声道相关联的音频声道是从第二立体声编码得到的第一声道。当对于四声道设置执行编码时,这种实施例是高效的。
根据其它示例性实施例,从第一立体声编码得到的第二声道在经历第四立体声编码之前被进一步编码。例如,编码方法还可以包括:接收第五输入声道;使第五输入声道和从第二立体声编码得到的第一声道经历第五立体声编码;其中与从第二立体声编码得到的第一声道相关联的音频声道是从第五立体声编码得到的第一声道;并且其中从第五立体声编码得到的第二声道作为第五输出声道输出。
以这种方式,第五输入声道因此与从第一立体声编码得到的第二声道联合编码。例如,第五输入声道可以对应于中央声道并且从第一立体声编码得到的第二声道可以对应于rf和rs声道的联合编码或lf和ls声道的联合编码。换句话说,根据例子,中央声道c可以相对于声道设置的左侧或右侧被联合编码。
以上所公开的示例性实施例涉及包括四个或五个声道的音频系统。但是,本文所公开的原理可以被扩展到六个声道、七个声道等。特别地,附加的一对输入声道可以被添加到四声道设置中,以达到六声道设置。类似地,附加的一对输入声道可以被添加到五声道设置中,以达到七声道设置,等等。
特别地,根据示例性实施例,编码方法还可以包括:接收第三对输入声道;使第一对输入声道的第二声道和第三对输入声道的第一声道经历第六立体声编码;使第二对输入声道的第二声道和第三对输入声道的第二声道经历第七立体声编码;其中,从第六立体声编码得到的第一声道和第一对输入声道的第一声道经历第一立体声编码;
其中从第七立体声编码得到的第一声道和第二对输入声道的第一声道经历第二立体声编码;并且使从第六立体声编码得到的第二声道和从第七立体声编码得到的第二声道经历第八立体声编码,以便获得第三对输出声道。
以上提供了向声道设置添加附加声道对的灵活的方法。
根据示例性实施例,当适用时,第一、第二、第三和第四立体声编码以及第五、第六、第七和第八立体声编码包括根据包含左-右编码(lr-编码)、和-差编码(或中间-侧编码,ms-编码)和增强型和-差编码(或增强型中间-侧编码,增强型ms-编码)的编码方案执行立体声编码。
因为它进一步增加了系统的灵活性,因此这是有利的。更具体而言,通过选择不同类型的编码方案,编码可以适于优化对正要处理的音频信号的编码。
不同的编码方案将在下面更详细地描述。但是,简而言之,左-右编码意味着让输入信号直通(输出信号等于输入信号)。和-差编码意味着输出信号中的一个是输入信号的和,而另一个输出信号是输入信号的差。增强型ms-编码意味着输出信号中的一个是输入信号的加权和,而另一个输出信号是输入信号的加权差。
当适用时,第一、第二、第三和第四立体声编码以及第五、第六、第七和第八立体声编码可以全部应用相同的立体声编码方案。但是,当适用时,第一、第二、第三和第四立体声编码以及第五、第六、第七和第八立体声编码也可以应用不同的立体声编码方案。
根据示例性实施例,可以对于不同的频带使用不同的编码方案。以这种方式,编码可以相对于在不同频带的音频内容进行优化。例如,更精细的编码(就在编码中所花费的比特数而言)可以在对耳朵最敏感的低频带处应用。
根据示例性实施例,可以对于不同的时间帧使用不同的编码方案。因此,编码可以适于在不同时间帧的音频内容并且相对于其进行优化。
第一、第二、第三、第四、第五、第六、第七和第八立体声编码,如果适用的话,在临界采样的改进离散余弦变换(modifieddiscretecosinetransform,mdct)域中执行。利用临界采样意味着编码信号的样本的数量等于原始信号的样本的数量。
mdct基于窗口序列将信号从时间域变换到mdct域。除了一些特殊情况之外,输入声道利用关于窗口尺寸和变换长度两者相同的窗口被变换到mdct域。这使得立体声编码能够应用信号的中间-侧编码和增强型ms-编码。
示例性实施例还涉及包括具有用于执行以上所公开的任何编码方法的指令的计算机可读介质的计算机程序产品。计算机可读介质可以是非临时性计算机可读介质。
根据示例性实施例,提供了在包括至少四个声道的多声道音频系统中的编码设备,包括:配置为接收第一对输入声道和第二对输入声道的接收组件;配置为使第一对输入声道经历第一立体声编码的第一立体声编码组件;
配置为使第二对输入声道经历第二立体声编码的第二立体声编码组件;配置为使从第一立体声编码得到的第一声道和与从第二立体声编码得到的第一声道相关联的音频声道经历第三立体声编码,以便提供第一对输出声道的第三立体声编码组件;配置为使从第一立体声编码得到的第二声道和从第二立体声编码得到的第二声道经历第四立体声编码,以便获得第二对输出声道的第四立体声编码组件;以及配置为输出第一和第二对输出声道的输出组件。
示例性实施例还提供了包括根据以上所述的编码设备的音频系统。
ii.概述–解码器
根据第二方面,提供了在多声道音频系统中的解码方法、解码设备和计算机程序产品。
第二方面通常可以具有与第一方面相同的特征和优点。
根据示例性实施例,提供了在包括至少四个声道的多声道音频系统中的解码方法,包括:接收第一对输入声道和第二对输入声道;使第一对输入声道经历第一立体声解码;使第二对输入声道经历第二立体声解码;使从第一立体声解码得到的第一声道和从第二立体声解码得到的第一声道经历第三立体声解码,以便获得第一对输出声道;使与从第一立体声解码得到的第二声道相关联的音频声道和从第二立体声解码得到的第二声道经历第四立体声解码,以便获得第二对输出声道;以及输出第一和第二对输出声道。
第一和第二对输入声道对应于要被解码的编码声道。第一和第二对输出声道对应于解码后的声道。
根据示例性实施例,与从第一立体声解码得到的第二声道相关联的音频声道可以等于从第一立体声解码得到的第二声道。
例如,该方法还可以包括接收第五输入声道;使第五输入声道和从第一立体声解码得到的第二声道经历第五立体声解码;其中,与从第一立体声解码得到的第二声道相关联的音频声道等于从第五立体声解码得到的第一声道;并且其中从第五立体声解码得到的第二声道作为第五输出声道输出。
该解码方法还可以包括:接收第三对输入声道;使第三对或输入声道经历第六立体声解码;使第一对输出声道的第二声道和从第六立体声解码得到的第一声道经历第七立体声解码;使第二对输出声道的第二声道和从第六解码得到的第二声道经历第八立体声解码;并且输出第一对输出声道的第一声道、从第七立体声解码得到的这对声道、第二对输出声道的第一声道和从第八立体声解码得到的这对声道。
根据示例性实施例,当适用时,第一、第二、第三和第四立体声解码以及第五、第六、第七和第八立体声解码包括根据包含左-右编码、和-差编码和增强型和-差编码的编码方案进行立体声解码。
不同的编码方案被用于不同的频带。不同的编码方案可以被用于不同的时间帧。
第一、第二、第三、第四、第五、第六、第七和第八立体声解码,如果适用的话,优选地在临界采样的改进离散余弦变换mdct域中执行。优选地,所有输入声道利用关于窗口形状和变换长度两者相同的窗口被变换到mdct域。
第二对输入声道可以具有对应于直到第一频率阈值的频带的频谱内容,由此从第二立体声解码得到的这对声道对于高于第一频率阈值的频带等于零。例如,第二对输入声道的频谱内容可能已在编码器侧被设为零,以便减少要被传送到解码器的数据量。
在第二对输入声道只具有对应于直到第一频率阈值的频带的频谱内容并且第一对输入声道具有对应于直到比第一频率阈值大的第二频率阈值的频带的频谱内容的情况下,该方法还可以对高于第一频率的频率应用参数上混技术,以补偿第二对输入声道的频率限制。特别地,该方法可以包括:将第一对输出声道表示为第一和信号和第一差信号,并且将第二对输出声道表示为第二和信号和第二差信号;通过执行高频重构将第一和信号和第二和信号扩展到高于第二频率阈值的频率范围;混合第一和信号和第一差信号,其中对于低于第一频率阈值的频率,混合包括执行第一和信号和第一差信号的逆和-差变换,而对于高于第一频率阈值的频率,混合包括执行第一和信号的对应于高于第一频率阈值的频带的部分的参数上混;以及混合第二和信号和第二差信号,其中对于低于第一频率阈值的频率,混合包括执行第二和信号和第二差信号的逆和-差变换,而对于高于第一频率阈值的频率,混合包括执行第二和信号的对应于高于第一频率阈值的频带的部分的参数上混。
将第一和信号和第二和信号扩展到高于第二频率阈值的频率范围、混合第一和信号和第一差信号、以及混合第二和信号和第二差信号的步骤优选地在正交镜像滤波器(quadraturemirrorfilter,qmf)域中执行。这与通常在mdct域执行的第一、第二、第三和第四立体声解码形成对照。根据示例性实施例,提供了包括具有用于执行根据以上申明中任何一项的方法的指令的计算机可读介质的计算机程序产品。计算机可读介质可以是非临时性计算机可读介质。
根据示例性实施例,提供了在包括至少四个声道的多声道音频系统中的解码设备,包括:配置为接收第一对输入声道和第二对输入声道的接收组件;配置为使第一对输入声道经历第一立体声解码的第一立体声解码组件;配置为使第二对输入声道经历第二立体声解码的第二立体声解码组件;配置为使从第一立体声解码得到的第一声道和从第二立体声解码得到的第一声道经历第三立体声解码,以便获得第一对输出声道的第三立体声解码组件;配置为使与从第一立体声解码得到的第二声道相关联的音频声道和从第二立体声解码得到的第二声道经历第四立体声解码,以便获得第二对输出声道的第四立体声解码组件;以及配置为输出第一和第二对输出声道的输出组件。
根据示例性实施例,提供包括根据以上所述的解码设备的音频系统。
iii.概述–信令格式
根据第三方面,提供了用于由编码器向解码器指示当解码表示多声道音频系统的音频内容的信号时使用的编码配置的信令格式,该多声道音频系统包括至少四个声道,其中所述至少四个声道能根据多个配置划分到不同的组中,每一组对应于被联合编码的声道,该信令格式包括指示出所述多个配置中的要被解码器应用的一个配置的至少两个比特。
因为它提供了高效的方式向解码器给出当解码时使用的多个可能编码配置中的编码配置的信号,因此这是有利的。
编码配置可以与识别号码相关联。由于这个原因,所述至少两个比特通过指示出所述多个配置中的一个配置的识别号码来指示所述多个配置中的这一个配置。
根据示例性实施例,多声道音频系统包括五个声道并且编码配置对应于:五个声道的联合编码;四个声道的联合编码和最后一个声道的单独编码;三个声道的联合编码和两个其它声道的单独联合编码;以及两个声道的联合编码、两个其它声道的单独联合编码和最后一个声道的单独编码。
在至少两个比特指示出两个声道的联合编码、两个其它声道的单独联合编码和最后一个声道的单独编码的情况下,所述至少两个比特还可以包括指示出哪两个声道要被联合编码以及哪两个其它声道要被联合编码的比特。
iv.示例性实施例
图1a示出了包括在这个例子中对应于左扬声器l的第一声道102和在这个例子中对应于右扬声器r的第二声道104的音频系统的声道设置100。第一102和第二104声道可以经历联合立体声编码和解码。
图1b示出了可以用来执行图1a的第一声道102和第二声道104的联合立体声编码的立体声编码组件110。通常,立体声编码组件110将这里通过ln表示的第一声道112(诸如图1a的第一声道102)和这里通过rn表示的第二声道114(诸如图1a的第二声道104)转换到这里通过bn表示的第一输出声道116和这里通过bn表示的第二输出声道118中。在编码过程期间,立体声编码组件110可以提取要在下文进行更详细讨论的包括参数的附带信息115。参数对于不同的频带可能是不同的。
编码组件110量化第一输出声道116、第二输出声道118和附带信息115并且以发送到对应的解码器的比特流的形式将它编码。
图1c示出了对应的立体声解码组件120。立体声解码组件120从编码设备110接收比特流并且解码和去量化第一声道116'an(对应于在编码器侧的第一输出声道116)、第二声道118'bn(对应于在编码器侧的第二输出声道118)和附带信息115'。立体声解码组件120输出第一输出声道112'ln和第二输出声道114'rn。立体声解码组件120还可以采用对应于在编码器侧提取的附带信息115的附带信息115'作为输入。
立体声编码/解码组件110、120可以应用不同的编码方案。要应用哪个编码方案可以由编码组件110在附带信息115中向解码组件120给出信号。编码组件110决定使用以下描述的三种不同编码方案中的哪一个。这一决定是信号自适应的,并且可以因此随着时间在每一帧之间变化。此外,它甚至可以在不同的频带之间变化。在编码器中的实际决策过程是相当复杂的,并且通常考虑在mdct域中的量化/编码以及感知方面的效果和附带信息的成本。
根据在本文中被称为左-右编码“lr-编码”的第一编码方案,立体声转换组件110和120的输入和输出声道按照以下表达式相关:
ln=an;rn=bn。
换句话说,lr-编码仅仅意味着让输入声道直通。如果输入声道非常不同,则这种编码会是有用的。
根据在本文中被称为中间-侧编码(或和-差编码)“ms-编码”的第二编码方案,立体声编码/解码组件110和120的输入和输出声道按照以下表达式相关:
ln=(an+bn);rn=(an-bn)。
从编码器的角度看,对应的表达式是:
an=0.5(ln+rn);bn=0.5(ln-rn)。
换句话说,ms-编码包括计算输入声道的和与差。由于这个原因,声道an(在编码器侧的第一输出声道116和在解码器侧的第一输入声道116')可以看作第一和第二声道ln和rn的中间-信号(和-信号),并且声道bn可以看作第一和第二声道ln和rn的侧-信号(差-信号)。如果输入声道ln和rn关于信号形状以及音量是相类似的,则ms-编码会是有用的,因为那样侧-信号bn将接近于零。在这种情况下,声源听起来像是它位于图1a的第一声道102和第二声道104之间的中间位置。
中间-侧编码方案可以被泛化为在本文被称作“增强型ms-编码”(或增强型和-差编码)的第三编码方案。在增强型ms-编码中,立体声编码/解码组件110和120的输入和输出声道按照以下表达式相关:
ln=(1+α)an+bn;rn=(1-α)an-bn,
其中α是可以形成附带信息115、115'的一部分的参数。以上的方程描述了从解码器角度的过程,即,从an、bn到ln、rn的过程。另外,在这个例子中,信号an可以被认为是中间-信号并且信号bn是修改的侧-信号。注意,对于α=0,增强型ms-编码方案退化为中间-侧编码。增强型ms-编码对于编码类似但不同音量的信号会是有用的。例如,如果图1a的左声道102和右声道104包括相同的信号,但是音量在左声道102中更高,则声源将听起来像是它位于更靠近左侧,如由图1a中的条目105所示出的。在这种情况下,中间-侧编码将生成非-零的侧-信号。但是,通过选择在零和一之间的适当的α值,修改的侧-信号bn可以等于或接近于零。类似地,在零和负一之间的α值对应于其中音量在右声道中更高的情况。
根据以上所述,立体声编码/解码组件110和120可以因此被配置为应用不同的立体声编码方案。立体声编码/解码组件110和120也可以对于不同的频带应用不同的立体声编码方案。例如,第一立体声编码方案可以应用于直到第一频率的频率并且第二立体声编码方案可以应用于高于第一频率的频带。此外,参数α可以是频率相关的。
立体声编码/解码组件110和120被配置为在临界采样的改进离散余弦变换(mdct)域中的信号上操作,其中mdct域是重叠窗口序列域。利用临界采样意味着在频域信号中的样本的数量等于在时域信号中的样本的数量。在立体声编码/解码组件110和120被配置为应用lr-编码方案的情况下,输入声道112和114可以利用不同的窗口进行编码。但是,如果立体声编码/解码组件110和120被配置为应用ms-编码或增强型ms-编码中的任何一个,则输入声道必须利用关于窗口形状以及变换长度相同的窗口进行编码。
立体声编码/解码组件110和120可以用作构建块,以便为包括多于两个声道的音频系统实现灵活的编码/解码方案。为了说明原理,多声道音频系统的三声道设置200在图2a中示出。该音频系统包括第一音频声道202(这里为左声道l)、第二音频声道204(这里为右声道r)、以及第三声道206(这里为中央声道c)。
图2b示出了用于编码图2a的三个声道202、204和206的编码设备210。编码设备210包括被级联耦合的第一立体声编码组件210a和第二立体声编码组件210b。
编码设备210接收第一输入声道212(例如对应于图2a的第一声道202)、第二输入声道214(例如对应于图2a的第二声道204)和第三输入声道216(例如对应于图2a的第三声道206)。第一声道212和第三输入声道216被输入到根据上述任何立体声编码方案执行立体声编码的第一立体声编码组件210a。因此,第一立体声编码组件210a输出第一中间输出声道213和第二中间输出声道215。如在本文所使用的,中间输出声道指立体声编码或立体声解码的结果。中间输出声道通常不是物理信号,在这个意义上,它有必要在实际实现方式中生成或者可以在实际实现方式中进行测量。相反,本文使用中间输出声道来说明不同的立体声编码或解码组件如何可以相对于彼此被组合和/或布置。利用中间输出声道意味着相对于表示编码声道的输出声道,输出声道213和215表示编码设备210的中间阶段。例如,第一中间输出声道213可以是中间-信号并且第二中间输出声道215可以是修改的侧-信号。
参考图1a的示例声道设置200,由第一立体声编码组件210a执行的处理可以例如对应于左声道202和中央声道206的联合立体声编码207。在不同音量的左声道202和中央声道206中的类似信号的情况下,这种联合立体声编码对于捕获位于左声道202和中央声道206之间的虚拟声源205会是高效的。
第一中间输出声道213和第二输入声道214然后被输入到根据上述任何立体声编码方案执行立体声编码的第二立体声编码组件210b。第二立体声编码组件210b输出第一输出声道217和第二输出声道218。参考图1a的示例声道设置,由第二立体声编码组件210b执行的处理可以例如对应于右声道204与由第一立体声编码组件210a生成的左声道202和中央声道206的中间信号的联合立体声编码208。
编码设备210输出第一输出声道217、第二输出声道218和作为第三输出声道的第二中间声道215。例如,第一输出声道217可以对应于中间-信号,并且第二和第三输出声道218和215可以分别对应于修改的侧-信号。
编码设备210将输出信号和附带信息一起量化和编码为要被传送到解码器的比特流中。
对应的解码设备220在图2c中示出。解码设备220包括第一立体声解码组件220b和第二立体声解码组件220a。在解码设备220中的第一立体声解码组件220b被配置为应用作为在编码器侧的第二立体声编码组件210b的编码方案的逆转的编码方案。同样,在解码设备220中的第二立体声解码组件220a被配置为应用作为在编码器侧的第一立体声编码组件210a的编码方案的逆转的编码方案。在解码器侧应用的编码方案可以通过在从编码设备210发送到解码设备220的比特流中给出信号来指示。这可以例如包括指示立体声解码器组件220b和220a应该应用lr-编码、ms-编码或增强型ms-编码中的哪一个。还可以存在指示中央声道是否要与左声道或右声道一起进行编码的一个或多个比特。
解码设备220接收、解码和去量化从编码设备210传送的比特流。以这种方式,解码设备220接收第一输入声道217'(对应于编码设备210的第一输出声道)、第二输入声道218'(对应于编码设备210的第二输出声道)和第三输入声道215'(对应于编码设备210的第三输出声道)。第一和第二输入声道217'和218'被输入到第一立体声解码组件220b。第一立体声解码组件220b按照在编码器侧的第二立体声编码组件210b中应用的逆编码方案执行立体声解码。作为其结果,第一中间输出声道213'和第二中间输出声道214'是第一立体声解码组件220b的输出。接着,第一中间输出声道213'和第三输入声道215'被输入到第二立体声解码组件220a。第二立体声解码组件220a按照作为在编码器侧的第一立体声编码组件210a中应用的编码方案的逆转的编码方案执行其输入信号的立体声解码。第二立体声解码组件220a输出第一输出声道212'(对应于编码器侧的第一输入信号212)、第二输出声道214'(对应于编码器侧的第二输入信号214)和作为第三输出声道216'的第二中间输出声道214'(对应于编码器侧的第三输入信号216)。
在以上给出的例子中,第一输入声道212可以对应于左声道202,第二输入声道214可以对应于右声道204并且第三输入声道216可以对应于中央声道206。但是,应该注意,第一、第二和第三输入声道212、214、216可以根据任何置换(permutation)对应于图2a的声道202、204和206。以这种方式,编码和解码设备210、220为如何编码/解码图2a的三个声道202、204和206提供了非常灵活的方案。而且,因为立体声编码组件210a和210b的编码方案可以以任何方式进行选择,因此更加地提高了灵活性。例如,立体声编码组件210a和210b可以两者都应用诸如增强型ms-编码的相同编码方案,或者应用不同的编码方案。此外,编码方案可以取决于要被编码的频带和/或取决于要被编码的时间帧不同。要应用的编码方案可以在从编码设备210到解码设备220的比特流中作为附带信息给出信号。
现在将参考图3a-c描述示例性实施例。图3a示出了多声道音频系统的四声道设置300。该音频系统包括这里对应于左前扬声器lf的第一声道302、这里对应于右扬声器rf的第二声道304、这里对应于左环绕扬声器ls的第三声道306和这里对应于右环绕扬声器rs的第四声道308。
图3b和3c分别示出了可用来编码/解码图3a的四个声道302、304、306、308的编码设备310和解码设备320。
编码设备310包括第一立体声编码组件310a、第二立体声编码组件310b、第三立体声编码组件310c和第四立体声编码组件310d。现在将解释编码设备310的操作。
编码设备310接收第一对输入声道。第一对输入声道包括第一输入声道312(其例如可以对应于图3a的lf声道302)和第二输入声道316(其例如可以对应于图3a的ls声道306)。编码设备310还接收第二对输入声道。第二对输入声道包括第一输入声道314(其例如可以对应于图3a的rf声道304)和第二输入声道318(其例如可以对应于图3a的rs声道308)。第一和第二对输入声道312、316、314、318通常以mdct频谱的形式表示。
第一对输入声道312、316被输入到使第一对输入声道312、316经历根据任何之前描述的立体声编码方案的立体声编码的第一立体声编码组件310a。第一立体声编码组件310a输出包括第一声道313和第二声道317的第一对中间输出声道。作为例子,如果应用了ms-编码或增强型ms-编码,则第一声道313可以对应于中间-信号并且第二声道317可以对应于修改的侧-信号。
类似地,第二对输入声道314、318被输入到使第二对输入声道314、318经历根据任何之前描述的立体声编码方案的立体声编码的第二立体声编码组件310b。第二立体声编码组件310b输出包括第一声道315和第二声道319的第二对中间输出声道。作为例子,如果应用了ms-编码或增强型ms-编码,则第一声道315可以对应于中间-信号并且第二声道319可以对应于修改的侧-信号。
考虑图3a的声道设置,由第一立体声编码组件310a应用的处理可以对应于执行lf声道302和ls声道306的联合立体声编码303。同样地,由第二立体声编码组件310b应用的处理可以对应于执行rf声道304和rs声道308的联合立体声编码305。
第一对中间输出声道的第一声道313和第二对中间输出声道的第一声道315然后被输入到第三立体声编码组件310c。第三立体声编码组件310c使声道313和315经历根据任何上述立体声编码方案的立体声编码。第三立体声编码组件310c输出包括第一输出声道322和第二输出声道324的第一对输出声道。
类似地,第一对中间输出声道的第二声道317和第二对中间输出声道的第二声道319被输入到第四立体声编码组件310d。第四立体声编码组件310d使声道317和319经历根据上述任何立体声编码方案的立体声编码。第四立体声编码组件310d输出包括第一输出声道326和第二输出声道328的第二对输出声道。
再次考虑图3a的声道设置,由第三和第四立体声编码组件310c和310d执行的处理可以类似于声道设置的左侧和右侧的联合立体声编码307。作为例子,如果第一和第二对中间输出声道的第一声道313和315分别是中间-信号,则第三立体声编码组件310c执行中间-信号的联合立体声编码。同样地,如果第一和第二对中间输出声道的第二声道317和319分别是(修改的)侧-信号,则第三立体声编码组件310c执行(修改的)侧-信号的联合立体声编码。根据示例性实施例,(修改的)侧-信号317和319对于较高的频率范围(具有中间-信号313和315所需的能量补偿),诸如对于高于某个频率阈值的频率,可以被设为零。作为例子,频率阈值可以是10khz。
编码设备310量化和编码输出信号322、324、326、328,以生成发送到解码设备的比特流。
现在参考图3c,对应的解码设备320被示出。解码设备320包括第一立体声解码组件320c、第二立体声解码组件320d、第三立体声解码组件320a和第四立体声解码组件320b。现在将解释解码设备320的操作。
解码设备320接收、解码和去量化从编码设备310接收到的比特流。以这种方式,解码设备320接收包括第一声道322'(对应于图3b的输出声道322)和第二声道324'(对应于图3b的输出声道324)的第一对输入声道。编码设备320还接收包括第一声道326'(对应于图3b的输出声道326)和第二声道328'(对应于图3b的输出声道328)的第二对输入声道。第一和第二对输入声道通常是mdct频谱的形式。
第一对输入声道322'、324'被输入到第一立体声解码组件320c,其中它经历根据作为由在编码器侧的第三立体声编码组件310c中应用的立体声编码方案的逆转的立体声编码方案的立体声解码。第一立体声解码组件320c输出包括第一声道313'和第二声道315'的第一对中间声道。
以类似的方式,第二对输入声道326'、328'被输入到第二立体声解码组件320d,其应用作为由编码器侧的第四立体声编码组件310d应用的立体声编码方案的逆转的立体声编码方案。第二立体声解码组件320d输出包括第一声道317'和第二声道319'的第二对中间声道。
第一和第二对中间输出声道的第一声道313'和317'然后被输入到第三立体声解码组件320a,其应用作为在编码器侧的第一立体声编码组件310a应用的立体声编码方案的逆转的立体声编码方案。第三立体声解码组件320a由此生成包括输出声道312'(对应于在编码器侧的输入声道312)和输出声道316'(对应于在编码器侧的输入声道316)的第一对输出声道。
以类似的方式,第一和第二对中间输出声道的第二声道315'和319'被输入到第四立体声解码组件320b,其应用作为在编码器侧的第二立体声编码组件310b应用的立体声编码方案的逆转的立体声编码方案。以这种方式,第三立体声解码组件320a生成包括输出声道312'(对应于编码器侧的输入声道312)和输出声道316'(对应于编码器侧的输入声道316)的第二对输出声道。
在以上给出的例子中,第一输入声道312对应于lf声道302、第二输入声道316对应于ls声道306、第三输入声道314对应于rf声道304并且第四声道对应于rs声道308。但是,图3a的声道302、304、306和308相对于图3b的输入声道312、314、316和318的任何置换都是一样可能的。以这种方式,编码/解码设备310和320构成用于选择哪些声道要成对编码以及以什么顺序编码的灵活的框架。选择可以例如基于与声道之间的相似性有关的考虑。
由于由立体声编码组件310a、310b、310c、310d应用的编码方案可以被选择,因此添加了附加的灵活性。编码方案被优选地选择,使得从编码器传送到解码器的数据的总量被最小化。要被解码器侧的不同立体声解码组件320a-d使用的编码方案的选择可以由编码器设备310作为附带信息向解码器设备320给出信号(参见图1b-c的条目115、115')。立体声转换组件310a、310b、310c、310d可以因此应用不同的立体声编码方案。但是,在一些实施例中,所有立体声转换组件310a、310b、310c、310d应用相同的立体声转换方案,例如增强型ms-编码方案。
立体声编码组件310a、310b、310c、310d还可以对不同频带应用不同的立体声编码方案。此外,不同的立体声编码方案可以被应用于不同的时间帧。
如以上所讨论的,立体声编码/解码组件310a-d和320a-d在临界采样的mdct域中操作。窗口的选择将受到所应用的立体声编码方案的限制。更具体地,如果立体声编码组件310a-d应用ms-编码或增强型ms-编码,则其输入信号需要利用关于窗口形状和变换长度两者相同的窗口进行编码。因此,在一些实施例中,输入信号312、314、316和318中所有的信号都利用相同的窗口进行编码。
现在将参考图4a-c描述示例性实施例。图4a示出了音频系统的五声道设置400。类似于参考图3a所讨论的四声道设置300,五声道设置包括第一声道402、第二声道404、第三声道406和第四声道408,这里分别对应于lf扬声器、rf扬声器、ls扬声器和rs扬声器。此外,五声道设置400包括对应于中央扬声器c的第五声道409。
图4b示出了编码设备410,其例如可以用来编码图4a的五声道设置的五个声道。图4b的编码设备410不同于图3a的编码设备310,因为它还包括第五立体声编码组件410e。此外,在操作期间,编码设备410接收第五输入声道419(其例如可以对应于图4a的中央声道409)。第五输入声道419和第二对中间输出声道的第一声道317被输入到第五立体声编码组件410e,其按照任何以上所公开的立体声编码方案执行立体声编码。第五立体声编码组件410e输出包括第一声道417和第二声道421的第三对中间输出声道。第三对中间输出声道的第一声道417和第一对中间声道的第一声道313然后被输入到第三立体声编码组件310c,以生成第一对输出声道422、424。编码器设备410输出五个输出声道,即,第一对输出声道422,424、作为第五立体声编码组件410e的输出的第三对中间输出声道的第二声道421、以及作为第四立体声编码组件310d的输出的第二对输出声道326,328。
输出声道422、424、421、326、328被量化和编码,以便生成要传送到对应的解码器的比特流。
考虑图4a的五声道设置和在输入声道312上映射lf声道402、在输入声道316上映射ls声道406、在输入声道419上映射c声道、在输入声道314上映射rf声道、以及在输入声道318上映射rs声道,获得以下实现方式:首先,第一和第二立体声编码组件310a和310b分别执行lf和ls声道以及rf和rs声道的联合立体声编码。其次,第五立体声编码组件410e执行中央声道c与rf和rs声道的联合编码的结果的联合立体声编码。第三,第三和第四立体声编码组件310c及310d执行声道设置400的左侧和右侧之间的联合立体声编码。根据一个例子,如果立体声编码组件310a和310b被设为直通,即,被设为应用lr-编码,则编码设备410联合编码三个前声道c、lf、rf并且两个环绕声道ls和rs将被联合编码。但是,如结合之前的实施例所讨论的,将声道设置400中的五个声道映射到输入声道312、314、316、318、419上可以根据任何置换来执行。例如,中央声道409可以与声道设置的左侧而不是声道设置的右侧一起联合编码。还应该注意,如果第五立体声编码组件410e执行lr-编码,即,使其输入信号直通,则编码设备410类似于编码设备310执行输入声道312、314、316、318的联合编码和输入声道419的单独编码。
图4c示出了对应于编码设备410的解码设备420。与图3c的解码设备320相比,解码设备420包括第五立体声解码组件420e。除了第一对输入声道422'、424'和第二对输入声道326'、328'之外,解码设备420还接收对应于在编码器侧的输出声道421的第五输入声道421'。在使第一对输入声道422'、424'在第一立体声解码组件320a中经历立体声解码之后,第一立体声解码组件320a的第二输出声道417'和第五输入声道421被输入到第五立体声解码组件420e。第五立体声解码组件420e应用作为由编码器侧的第五立体声编码组件410e应用的立体声编码方案的逆转的立体声编码方案。第五立体声解码组件420e输出包括第一声道315'和第二声道419'的第三对中间输出声道。第一声道315'然后与第二对中间输出声道的第二声道319'一起被输入到第四立体声解码组件320d。解码设备420输出第三立体声解码组件320c的输出声道312',316'、第三对中间输出声道的第二声道419'、以及第四立体声解码组件320d的输出声道314',318'。
在以上描述中,已使用中间输出声道的概念来解释立体声编码/解码组件如何可以相对于彼此被组合或布置。但是,如以上进一步讨论的,中间输出声道仅仅指立体声编码或立体声解码的结果。特别地,中间输出声道通常不是物理信号,在这个意义上,它有必要在实际实现方式中来生成或者可以在实际实现方式中进行测量。现在将解释基于矩阵运算的实现方式的例子。
参考图3a-c(四声道的情况)和图4a-c(五声道的情况)描述的编码/解码方案可以通过执行矩阵运算来实现。例如,第一解码组件320c可以与第一2x2矩阵a1相关联、第二解码组件320d可以与第二2x2矩阵b1相关联、第三解码组件320a可以与第三2x2矩阵a2相关联、第四解码组件320b可以与第四2x2矩阵b2相关联、并且第五解码组件420e可以与第五2x2矩阵a相关联。对应的编码组件310a、310b、410e、310c、310d可以以类似的方式与2x2矩阵相关联,这些矩阵是解码器侧的对应矩阵的逆矩阵。
在一般情况下,这些矩阵被定义如下:
以上矩阵的项取决于编码方案(lr-编码、ms-编码、增强型ms-编码)应用。例如,对于lr-编码,对应的2x2矩阵等于单位矩阵,即
对于ms-编码,对应的2x2矩阵如下:
对于增强型ms-编码,对应的2x2矩阵如下:
要被应用的编码方案作为附带信息从编码器向解码器给出信号。
现在将公开多个不同的例子。为了这些例子的目的,声道312、312'被识别为lf声道402,声道316、316'被识别为ls声道406,声道419被识别为c声道409,声道314、314'被识别为rf声道404,并且声道318、318'被识别为rs声道408。此外,声道422'、424'、421'、326'和328'将分别通过x1、x2、x3、x4和x5来表示。
例子1:四声道的联合编码和中央声道的单独编码
根据这个例子,lf、ls、rf和rs声道被联合编码并且c声道被单独编码。对于这种编码配置的图示,参见例如图6d。为了联合编码lf、ls、rf和rs声道,表示这些声道的mdct频谱应该利用关于窗口形状和变换长度共同(common)的窗口进行编码。
为了实现中央声道的单独编码,解码组件420e被设为直通(lr-编码),这意味着矩阵a等于单位矩阵。
lf、ls、rf和rs声道可以按照以下矩阵运算被联合解码:
例子2:四声道的成对编码和中央声道的单独编码
根据这个例子,lf和ls声道被联合编码。此外,rf和rs声道被联合编码(与rf和rs声道分离地)并且c声道被单独编码。对于这种编码配置的图示,参见例如图6b。(图6a的情况可以通过声道的置换来实现。)
为了实现中央声道的单独编码,解码组件420e被设为直通(lr-编码),这意味着矩阵a等于单位矩阵。
此外,为了实现lf/ls和rf/rs的单独编码,解码组件320c、320d被设为直通(lr-编码),这意味着矩阵a1和b1等于单位矩阵。此外,表示lf和ls声道的mdct频谱应该利用关于窗口形状和变换长度共同的窗口进行编码。此外,表示rf和rs声道的mdct频谱应该利用关于窗口形状和变换长度共同的窗口进行编码。但是,用于lf/ls的窗口可以与用于rf/rs的窗口不同。lf、ls、rf和rs声道可以按照以下矩阵运算来解码:
例子3:五个声道的联合编码
根据这个例子,lf、ls、rf、rs和c声道被联合编码。对于这种编码配置的图示,参见例如图6e。为了联合编码lf、ls、rf、rs和c通道,表示这些声道的mdct频谱应该利用关于窗口形状和变换长度共同的窗口进行编码。lf、ls、rf和rs声道可以按照以下矩阵运算来解码:
其中m通过矩阵a1、b1、a、a2、b2沿与以上例子1的矩阵m类似的方法来定义。
例子4:前声道的联合编码和环绕声道的联合编码
根据这个例子,c、lf和rf声道被联合编码并且rs、ls声道被联合编码。对于这种编码配置的图示,参见例如图6c。为了联合编码c、lf和rf声道,表示这些声道的mdct频谱应该利用关于窗口形状和变换长度共同的窗口进行编码。此外,表示rs和ls声道的mdct频谱应该利用关于窗口形状和变换长度共同的窗口进行编码。但是,用于c/lf/rf的窗口可以与用于rs/ls的窗口不同。
为了实现前声道和环绕声道的单独编码,矩阵a2和b2应该被设为单位矩阵。
前声道可以按照以下来解码:
其中m通过a1和a定义。环绕声道可以按照以下来解码:
在一些情况下,编码设备310和410可以将第二对输出声道326、328在高于某个频率时设为零,该频率在本文中被称为第一频率(具有第一对或输出声道322、324或422、424所需的能量补偿)。其原因是减少从编码设备310、410发送到对应解码设备320、420的数据的量。在这种情况下,在解码器侧的第二对输入声道326'、328'对于高于第一频率的频带将等于零。这意味着第二对中间声道317'、319'在高于第一频率时也没有频谱内容。根据示例性实施例,第二对输入声道326'、328'具有被(修改的)侧-信号的解释。因此,上述情况意味着对于高于第一频率的频率,没有(修改的)侧-信号输入到第三和第四解码组件320a、320b。
图7示出了解码设备720,它是解码设备320和420的变体。解码设备720补偿图3c和4c的第二对输入声道326'、328'的有限频谱内容。特别地,假定第二对输入声道326'、328'具有对应于直到第一频率的频带的频谱内容,并且第一对输入声道322'、324'(或422'、424')具有对应于直到比第一频率大的第二频率的频带的频谱内容。
解码设备720包括对应于解码设备320或420中任何一个的第一解码组件。解码设备720还包括被配置为将第一对输出声道312'、316'表示为第一和信号712和第一差信号716的表示组件722。更具体地,对于低于第一频率的频带,表示组件722将图3c或图4c的第一对输出声道312'、316'按照以上已描述的表达式从左-右格式变换为中间-侧格式。对于高于第一频率的频带,表示组件722将图3c或图4c的声道313'的频谱内容映射到第一和信号(并且第一差信号对于高于第一频率的频带等于零)。
类似地,表示组件722将第二对输出声道314'、318'表示为第二和信号714和第二差信号718。更具体地,对于低于第一频率的频带,表示组件722将图3c或图4c的第二对输出声道314、318按照以上已描述的表达式从左-右格式变换为中间-侧格式。对于高于第一频率的频带,表示组件722将图3c或图4c的声道315'的频谱内容映射到第二和信号(并且第二差信号对于高于第一频率的频带等于零)。
解码设备720还包括频率扩展组件724。频率扩展组件724被配置为通过执行高频重构将第一和信号和第二和信号扩展到高于第二频率阈值的频率范围。频率扩展的第一和第二和-信号通过728和730来表示。例如,频率扩展组件724可以应用频谱带复制技术将第一和第二和-信号扩展到更高的频率(参见例如ep1285436b1)。
解码设备720还包括混合组件726。混合组件726执行频率扩展和信号728和第一差信号716的混合。对于低于第一频率的频率,混合包括执行频率扩展的第一和信号和第一差信号的逆和-差变换。因此,对于低于第一频率的频带,混合组件726的输出声道732、734等于图3c和4c的第一对输出声道312'、316'。
对于高于第一频率阈值的频率,混合包括执行频率扩展的第一和信号的对应于高于第一频率阈值的频带的部分的参数上混(从一个信号到两个信号732、734)。可适用的参数上混过程在例如(ep1410687bl)中描述。参数上混可以包括生成频率扩展的第一和信号728的去相关版本,其然后根据输入到混合组件726的参数(在编码器侧提取的)与频率扩展的第一和信号728混合。因此,对于高于第一频率的频率,混合组件726的输出声道732、734对应于频率扩展的第一和信号728的上混。
以类似的方式,混合组件处理频率扩展的第二和信号730和第二差信号718。
在五声道系统(当解码设备720包括解码设备420时)的情况下,频率扩展组件724可以使第五输出声道419经历频率扩展,以生成频率扩展的第五输出声道740。
将第一和信号712和第二和信号714扩展到高于第二频率的频率范围、混合第一和信号728和第一差信号716、并且混合第二和信号730和第二差信号718的行为通常在正交镜像滤波器(qmf)域中执行。因此,解码设备720可以包括qmf变换组件,其在执行频率扩展和混合之前将和与差信号712、716、714、718(以及第五输出声道419)变换到qmf域。此外,解码设备720可以包括逆qmf变换组件,其将输出信号732、734、736、738(以及740)变换到时域。
图5a、5b和5c示出了附加声道对如何可以被包括到相对于图1a-c、图2a-c、图3a-c和图4a-c所描述的编码/解码框架中。图5a示出了多声道设置500,它包括第一声道设置502和两个附加的声道506和508。第一声道设置502包括至少两个声道502a和502b并且可以例如对应于在图1a、2a、3a和4a中示出的任何声道设置。在示出的例子中,第一声道设置502包括五个声道并且因此对应于图4a的声道设置。在示出的例子中,两个附加的声道506、508可以例如对应于左后环绕扬声器lbs和右后环绕扬声器rbs。
图5b示出了可以用来编码声道设置500的编码设备510。
编码设备510包括第一编码组件510a、第二编码组件510b、第三编码组件510c和第四编码组件510d。第一510a、第二510b和第四510d编码组件是立体声编码组件,诸如在图1b中所示出的组件。
第三编码组件510c被配置为接收至少两个输入声道并且将它们转换为相同数量的输出声道。例如,第三编码组件510c可以对应于图1b、2b、3b和4b的任何编码设备110、210、310和410。但是,更一般地,第三编码组件510c可以是被配置为接收至少两个输入声道并且将它们转换为相同数量的输出声道的任何编码组件。
编码设备510接收对应于第一声道设置502的声道数量的第一数量的输入声道。根据以上所述,第一数量因此至少等于二并且第一数量的输入声道包括第一输入声道512a和第二输入声道512b(以及可能还有剩余的声道512c)。在示出的例子中,第一和第二输入声道512a、512b可以对应于图5a的声道502a和502b。
编码设备510还接收两个附加的输入声道,第一附加输入声道516和第二附加输入声道518。输入声道512a-c、516、518通常被表示为mdct频谱。
第一输入声道512a和第一附加声道516被输入到第一立体声编码组件510a。第一立体声编码组件510a执行根据以上公开的任何立体声编码方案的立体声编码。第一立体声编码组件510a输出包括第一声道513和第二声道517的第一对中间输出声道。
类似地,第二输入声道512b和第二附加声道518被输入到第二立体声编码组件510b。第二立体声编码组件510b执行根据以上公开的任何立体声编码方案的立体声编码。第二立体声编码组件510a输出包括第一声道515和第二声道519的第二对中间输出声道。
考虑图5a的示例声道设置500,由第一和第二立体声编码组件510a、510b执行的处理分别对应于lbs声道506与ls声道502a的立体声编码和rbs声道508与rs声道502b的立体声编码。但是,应当理解,在其它示例性声道设置的情况下,获得其它解释。
第一对中间输出声道的第一声道513和第二对中间输出声道的第一声道515然后连同除第一输入声道512a和第二输入声道512b之外第一数量的输入声道512c一起被输入到第三编码组件510c。第三编码组件510c转换其输入声道513、515、512c,以产生相同数量的输出声道,包括第一对输出声道522、524,并且,如果适用的话,还包括输出声道521。类似于已相对于图1b、图2b、图3b和图4b所公开的,第三编码组件可以例如转换其输入声道513、515、512c。
类似地,第一对中间输出声道的第二声道517和第二对中间输出声道的第二声道519被输入到执行根据以上所讨论的任何立体声编码方案的立体声编码的第四立体声编码组件510d。第四立体声编码组件输出第二对输出声道526、528。
输出声道521、522、524、526、528被量化和编码,以形成要传送到对应的解码设备的比特流。
图5c示出了对应的解码设备520。解码设备520包括第一解码组件520c、第二解码组件520d、第三解码组件520a和第四解码组件520b。第二520d、第三520a以及第四520b解码组件是立体声解码组件,诸如在图1c中所示出的组件。
第一解码组件520a被配置为接收至少两个输入声道并将它们转换为相同数量的输出声道。例如,第一解码组件520c可以对应于图1b、2b、3b和4b的解码设备120、220、320、420中的任何一个。但是,更一般地,第一解码组件520c可以是被配置为接收至少两个输入声道并将它们转换为相同数量的输出声道的任何解码组件。
解码设备520接收、解码和去量化由编码设备510传送的比特流。以这种方式,解码设备520接收对应于编码设备510的输出声道521、522、524的第一数量的输入声道521'、522'、524'。根据以上所述,第一数量的输入声道包括第一输入声道522'和第二输入声道524'(以及可能还有的一些剩余声道521')。
解码设备520还接收两个附加的输入声道,第一附加输入声道526'和第二附加输入声道528'(对应于编码器侧的输出声道526、528)。
第一数量的输入声道521'、522'、524'被输入到第一解码组件520c。第一解码组件520c转换其输入声道521'、522'、524',以生成相同数量的输出声道,包括第一对中间输出声道513'、515',并且,如果适用的话,还包括输出声道512c'。类似于相对于图1c、图2c、图3c和图4c所公开的,第一解码组件520c可以例如转换其输入声道521'、522'、524'。特别地,第一解码组件520c被配置成执行作为由编码器侧的第三编码组件510c执行的编码的逆转的解码。
第一附加输入声道526和第二附加输入声道528被输入到第二立体声解码组件520d,其执行对应于由编码器侧的第四立体声编码组件510d执行的编码的逆转的立体声解码。第二立体声解码组件520d输出第二对中间输出声道517'、519'。
第一对中间输出声道的第一声道513'和第二对中间输出声道的第一声道517'被输入到第三立体声解码组件520a。第三立体声解码组件520a执行对应于由编码器侧的第一立体声编码组件510a执行的编码的逆转的立体声解码。第三立体声解码组件520a输出包括第一声道512a'和第二声道516'的第一对输出声道。
类似地,第一对中间输出声道的第二声道515'和第二对中间输出声道的第二声道519'被输入到第四立体声解码组件520b。第四立体声解码组件520b执行对应于由编码器侧的第二立体声编码组件510b执行的编码的逆转的立体声解码。第四立体声解码组件520a输出包括第一声道512b'和第二声道518'的第二对输出声道。
图6a、6b、6c、6d和6e示出了五声道系统的五个声道。五个声道可以被划分到不同的组中,以形成不同的编码配置。每组对应于通过利用根据以上所述的编码设备被联合编码的声道。
第一编码配置610在图6a中示出。第一编码配置610包括由一个声道(这里是中央声道c)组成的第一组612、由两个声道(这里是lf和rf声道)组成的第二组614、以及由两个声道(这里是ls和rs声道)组成的第三组616。第一组612的声道将被单独编码、第二组614的声道将被联合编码、并且第三组616的声道将被联合编码。这种编码可以例如通过在输入声道312上映射lf声道、在输入声道316上映射ls声道、在输入声道419上映射c声道、在输入声道314上映射rf声道、以及在输入声道318上映射rs声道由图4b的编码设备410来实现。此外,第一310a、第二310b、和第五410e立体声编码组件的编码方案应该被设为lr-编码(直通输入信号)。图6b示出了第一编码配置610的变体610'。在第一编码配置的变体610'中,第二组614'对应于lf和ls声道并且第三组616'对应于rf和rs声道。图6a和6b的编码配置在以下被称为1-2-2编码配置。
第二编码配置620在图6c中示出。第二编码配置620包括由三个声道(这里是中央声道c、lf声道和rf声道)组成的第一组622、以及由两个声道(这里是ls和rs声道)组成的第二组624。图6c的编码配置在以下被称为2-3编码配置。第一组622的声道将被联合编码并且第二组624的声道将与第一组622分离地被联合编码。这种编码可以例如通过在输入声道312上映射lf声道、在输入声道316上映射ls声道、在输入声道419上映射c声道、在输入声道314上映射rf声道、并且在输入声道318上映射rs声道由图4b的编码设备410来实现。此外,第一310a、第二310b立体声编码组件的编码方案应该被设为lr-编码(直通输入信号)。
第三编码配置630在图6d中示出。第三编码配置620包括由一个声道(这里是中央声道c)组成的第一组632和由四个声道(这里是ls和rs声道)组成的第二组634。图6d的编码配置在以下被称为1-4编码配置。第一组632的声道将被单独编码并且第二组634的声道将被联合编码。这种编码可以例如通过在输入声道312上映射lf声道、在输入声道316上映射ls声道、在输入声道419上映射c声道、在输入声道314上映射rf声道、并且在输入声道318上映射rs声道由图4b的编码设备410来实现。此外,第五立体声编码组件410e的编码方案应该被设为lr-编码(直通输入信号)。
第四编码配置640在图6e中示出。第四编码配置640包括由所有五个声道组成的单个组642,这意味着所有声道被联合编码。图6e的编码配置在以下被称为0-5编码配置。例如,声道可以由图4b的编码设备410通过在输入声道312上映射lf声道、在输入声道316上映射ls声道、在输入声道419上映射c声道、在输入声道314上映射rf声道、并且在输入声道318上映射rs声道被联合编码。
虽然以上编码配置已相对于五声道系统进行解释,但是它同样适用于具有四个或更多个声道的系统。
编码设备可以因此根据不同的编码配置610、610'、620、630、640编码多声道系统的音频内容。在编码器侧使用的编码配置必须被传递给解码器。为了这个目的,可以使用特定的信令格式。对于包括至少四个声道的音频系统,信令格式包括至少两个比特,其指示多个配置610、610'、620、630、640中的其中一个要在解码器侧应用。例如,每个编码配置可以与识别号码相关联并且所述至少两个比特可以指示要在解码器中应用的编码配置的识别号码。
对于在图6a-6e中示出的五声道系统,可以使用两个比特来在1-2-2配置、2-3配置、1-4或0-5配置之间进行选择。在这两个比特指示1-2-2配置的情况下,信令格式可以包括第三比特,其指示要选择1-2-2配置的哪个变体,是图6a的左-右编码配置还是图6b的前-后配置要被应用。以下伪码给出了这可以如何被实现的例子:
相对于以上伪码,信令格式使用两个比特来编码参数high_mid_coding_config,并且使用一个比特来编码参数1_2_channel_mapping。
等同物、扩展、可替代实施例及其它
本公开内容还有的实施例对本领域技术人员在研究上述说明之后将是清楚的。尽管本说明书和附图公开了实施例和例子,但是本公开内容并不限于这些具体的例子。在不脱离本公开内容的范围的情况下,可以做出许多修改和变化,这由所附权利要求来定义。权利要求中出现的任何标号不应该被理解为限制它们的范围。
此外,对所公开实施例的变体可以由技术人员在实践本公开内容时,根据对附图、公开内容和所附权利要求的研究来理解和影响。在权利要求中,词语“包括”不排除其它元素或步骤,并且不定冠词“一”或“一个”不排除多个。某些举措在相互不同的相关权利要求中被叙述的这一事实并不指示这些举措的组合不能被有利地使用。
上述公开的系统和方法可以被实现为软件、固件、硬件或其组合。在硬件实现中,在以上说明中引用的功能单元之间的任务分工不一定对应于物理单元的划分;相反,一个物理组件可以具有多种功能,并且一个任务可以通过合作的若干个物理组件来执行。某些组件或所有组件可以被实现为由数字信号处理器或微处理器执行的软件,或者被实现为硬件或者被实现为专用集成电路。这种软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或者非临时性介质)和通信介质(或临时性介质)。如对本领域技术人员众所周知的,术语计算机存储介质包括以任何方法或技术实现的用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息的易失性和非易失性、可拆卸和不可拆卸介质。计算机存储介质包括,但不限于,ram、rom、eeprom、闪存或其它存储器技术、cd-rom、数字多功能盘(dvd)或其它光盘存储、磁带盒、磁带、磁盘存储或其它磁存储设备、或可以用来存储期望信息并且可被计算机访问的任何其它介质。此外,对本领域技术人员众所周知的,通信介质通常以诸如载波或其它传输机制的调制数据信号体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。