专利名称:用于组合数字数据集的方法和编码器、用于这种组合式数字数据集的解码方法和解码器 ...的制作方法
技术领域:
本发明涉及一种方法,用于将具有第 一尺寸的第 一样本数字数据
集和具有第二尺寸的第二样本数字数据集组合成具有第三尺寸的第 三样本数字数据集,该第三尺寸小于该第一尺寸和该第二尺寸之和。
背景技术:
从EP1592008已知这种方法,在其中披露了一种用于将两个数 字数据集混合成第三数字数据集的方法。为了将两个数字数据集拟合 成具有小于该两个数字数据集的尺寸之和的尺寸的单一数字数据集, 需要缩减该两个数字数据集中的信息。通过在第一数字数据集中在第 一组预定位置之间的样本处和在第二数字数据集中在预定位置之间 的非一致的一組样本处定义内插,EP1592008实现了这种信息缩减。 在数字数据集的预定位置之间的样本数值(值)被设为内插数值。在 于该两个数字数据集中执行这种信息縮减之后,合并(总计)第一数 字数据集的每一个样本与第二数字数据集的相应样本。这产生了包括 该合并样本的第三数字数据集。虽然仅仅利用在预定位置之间的内插 样本,但是利用在第一数字数据集和第二数字数据集之间的预定位置 之间的已知偏移关系的、这种将样本一起地合并允许恢复第 一数字数 据集和第二数字数据集。当EP1592008的方法被用于音频流时,这种 内插并不明显并且能够作为所包括的两个数字数据集的混合表示而 播放第三数字数据集。为了使得能够利用内插样本恢复第一和第二数 字数据集,必须知道用于第一和第二数字数据集这两者的起始值,并 且因此在混合期间这两个数值也被存储,以允许在以后从第三数字数 据集分离该两个数字数据集。EP1592008的方法具有以下缺点,即,它要求在编码一侧上进行 集中处理。
发明内容
本发明的目的在于缩减在编码侧上要求的处理。 为了实现这个目的,本发明的方法包括以下步骤 -将第一数字数据集的第一样本子集等化成(equate)第一数字
数据集的第二样本子集中的相邻样本,其中该第一样本子集和该第二
样本子集交错,
-将第二数字数据集的第三样本子集等化成第二数字数据集的第 四样本子集中的相邻样本,其中该第三样本子集和该第四样本子集交 错,
-通过在时域中将第一数字数据集的样本与第二数字数据集的对 应样本相加而产生第三数字数据集的样本,
-在该第三数字数据集中嵌入该第一数字数据集的第一种子样本 和该第二数字数据集的第二种子样本。
通过利用以下步骤替代在EP1592008的方法中的内插步骤,即, 在预定位置之间的数值被设为相邻样本的数值,在编码侧的处理强度 被大大地降低。结果信号仍然允许从第三数字数据集分离(即提取) 该两个数字数据集。当将两个数字音频流组合成单一数字音频流时, 该第三数字数据集仍然是该两个已被組合的数字音频流的良好的单 音(mono )表示。
本发明是基于以下认识,即,在编码侧上内插是不必要的,这是 因为,由于本组合和分离方法保持第一和第二数字数据集的样本在它 们分別的预定位置处完好并且可被恢复,因此允许在第三数字数据集 解码之后在该完好样本之间的样本内插,所以能够同样好地在解码侧 上执行内插。本发明的独立权利要求的第三数字数据集不同于 EP1592008的第三数字数据集之处在于,在本发明的情形中,在第一 和第二数字数据集的真正合并和第三数字数据集之间通常存在更大将第一数字数据集的第一样本子集等化成第一数字数据集的第 二样本子集中的相邻样本,其中第 一样本子集和第二样本子集交错, 在第一数字数据集的信息中实现了容易被执行的缩减。
将第二数字数据集的第三样本子集等化成第二数字数据集的第 四样本子集中的相邻样本,其中第三样本子集和笫四样本子集交错, 在第二数字数据集的信息中实现了容易被执行的缩减。
通过使得来自第一和第二数字数据集的初始数值可得,其中该初 始数值能够用作种子数值,并且确保第二和第四子集也是交错的,在 其中第一数字数据集的第一样本子集被等化成第一数字数据集的第 二样本子集中的相邻样本并且笫二数字数据集的第三样本子集被等 化成第二数字数据集的第四样本子集中的相邻样本的状态中,能够从 第三数字数据集恢复第 一和第二数字数据集。 一旦在这种状态中第一 和第二数字数据集已被恢复,便能够使用内插或者滤波尽可能准确地 恢复第 一数字数据流的第 一样本子集和第二数字数据流的第三样本 子集的初始数值。因此将第 一数字数据流和第二数字数据流组合成第 三数字数据流的该方法允许以高的精度恢复第二和第四样本子集以 及重构第一和第三数值子集,并且在解码期间,如果需要,能够执行 内插步骤。,
包括解码器的终端用户设备能够决定该重构所实现的质量水平, 这是因为能够由解码器选择和执行内插而不是由编码器规定。
通过不对第一和第二数字数据集进行任何内插而是包括在第三 数字数据流的最低有效位中隐藏的误差近似,实现了以下优点,即,
解码步骤能够自由选择应用什么样的重构。然而,当在构建第3数字 集(是包括近似误差的第l和第2数字集的样本混合)期间也使用误 差近似时,在解码过程期间也必须使用在最低有效位中隐藏的误差近 似数值从而执行初始数字数据集,即初始数字音频通道的重构。
在解码期间的重构能够被选择以使用如在最低有效位中存储的
误差近似并且在预定位置处在样本数值之间执行线性内插,这是因
13为,除了在最低有效位中的信息损失,它们是完全可被恢复的。因此 能够更加灵活地使用编码和解码系统。
编码能够或者仅仅减少处理并且将第一和第二数字数据流融合 成第三数字数据流而不加上误差近似并且仅仅将在预定位置之间的 样本数值设为相邻样本的数值,或者误差近似能够被从一组有限的误 差近似选定并且被添加到第三数字数据集的最低有效位。
在该方法的一个实施例中,该第一数字数据集代表第一音频信号 并且该第二数字数据集代表第二音频信号。
通过将本发明应用于音频信号,不仅实现了能够以可接受的精度
恢复第一和第二音频信号而且实现了如由第三数字数据集代表的所 得组合式音频信号是当与第二音频信号混合时的第一音频信号的、在 可被感知方面可接受的表示。因此实现了在没有能力从第三数字数据 集提取第一或者第二数字音频信号的装备上能够正确地再现所得第 三数字数据集,而有能力执行提取的装备能够提取第一和第二音频信 号从而分离地进行再现或者进一步处理。当使用本发明組合,即混合 多于两个音频信号时,还能够提取仅仅其中一个音频信号,而保持另 一音频信号被组合。这些剩余的音频信号仍然给出代表仍被组合的音 频信号的混合的可再现的音频信号,同时能够单独地处理已被提取的
音频信号。
作为一种用于录音工程师的工具-对于成对音频通道到单一通道
的混音(混合,mix)的实时仿真是可能的。在作为认证过程的一个 部分的记录编辑期间,这将形成音频输出,该音频输出将代表最终混 音过程的最低保证质量以及解混音或者解码通道的最低质量。 一旦基 本AURO-phonic多通道PCM数据集得以产生,便可以离线计算用于 增加混音信号质量的另外的编码参数,从而无需实时处理。
在该方法进一步的实施例中,第一种子样本是第一数字数据集的 第 一样本并且第二种子样本是第二数字数据集的第二样本。
靠近数字数据集起点选择用于分离的种子样本允许一旦第三数 字数据集开始被读出^^更开始分离第一和第二数字数据集。该种子样本还能够被进一步地嵌入,即定位于第三数字数据集中从而将需要递归 方案以分离位于该种子样本之前的样本。在初始数字数据集开始时, 或者在这之前,从该初始数字数据集选择种子样本简化了用于恢复第 一和第二数字数据集的分离过程。
在该方法进一步的实施例中,第 一种子样本和第二种子样本被嵌 入第三数字数据集的样本的较低有效位中。
通过在样本的较低有效位中嵌入种子数值,受到影响样本将仅仅 从初始数值稍微地偏离,已经发现这实际上是觉察不到的,因为仅仅 很少的种子数值需被存储并且因此仅仅很少的样本受到影响。另外, 选择较低有效位保证了仅仅能够发生小的偏离。
即使当所有样本的最低有效位都被用于嵌入数据时,这个偏差也 不被察觉或者难以被察觉,这是因为最低有效位被从样本移除并且这 是难以被注意到的。
这种从样本移除最低有效位减少了用于存储在其中包括这些样
本的数字数据集所需的空间,并且因此在记录载体上或者在传输通道 中释放了更多空间或者例如为了控制的目的而允许嵌入另外的数据。
在从在PCM样本的较低有效位中编码的另外的数据读出或者甚 至作为用于音频的PCM样本的较高有效位的一个部分时,当读出误 差发生时,使用本发明的基本方法解混音PCM样本可以引起误差。 这个分离过程的本质是这样的,使得与一个(音频/数据)样本有关的 这些误差将引起随后的样本的解混音操作。然而,用于以优化方式使 用在PCM流中用于另外的数据的辅助数据区域,其中高级编码将使 用这个辅助数据区域以存储(样本频率降低)误差,并且使得所有的 这种校正数据被压缩,将在数据块的端部处添加CRC校验和以使得 解码器能够检验在这种块中的所有数据的完整性。通过以规则的间隔
存储种子数值,能够限制由于音频样本中的误差引起的影响。当误差 发生时,该误差将仅仅传播至它的种子数值已知的下一位置,这是因 为,在那个点处,能够重新开始分离过程,从而有效地终止误差传播。据误差时,基于那些坏的种子数值的分离将是错误的,但这仅仅限于 它的种子数值已知的下一位置之前,因为在那个点处,能够重新开始 分离过程。
通过在样本的较低有效位中的辅助数据区域中存储另外的数据,
本发明在BLU-RayDVD或者HD-DVD的情形中,已混音音频数据(较 高精度位)和编码/解码数据(通常每一样本2、 4或者6位)的混音 或者"复用"除了每一样本(已经可用的)24位之外并不要求任何额外 的记录空间,并且它也不从在光盘上的数据"导航"要求任何额外信息 (例如无需任何章节或者流的时间戳)。同样地,在读盘控制(如由 DVD播放器的嵌入软件执行地)中无需任何改变。进一步,无需为了 使用本发明而对于这些新的媒体格式的标准进行任何改变或者添加。 进而,音频样本位分辨率的降低和在最低有效位中存储音频解码/编码 数据在利用并不执行解码算法的设备或者系统(例如HD-DVD或者 BLU-RayDVD播放器)正常回放期间将使得用户感觉不到任何声响 伪迹(artifact)。
在该方法的进一步的实施例中,在相对于第一种子样本的位置界 定的位置处嵌入同步模式。
嵌入同步模式以允许恢复第一种子样本,这是因为,当探测到同 步模式时,便已知第一种子样本的位置。这也能够被应用于定傳第二 种子样本。通过在规则的间隔处重复该同步模式从而能够使用飞轮探 测以可靠地探测该同步模式,能够进一步改进该同步模式。这将在较 低有效位中的数据存储划分成块,这允许应用逐块处理。
在该方法的进一步的实施例中,在等化样本的步骤之前,通过从 一组误差近似中选择误差近似而近似样本等化所引起的误差。
等化样本的步骤在组合第 一和第二数字数据集期间是非常易于 执行的,但是也引入了误差。
为了减小这个误差,建立误差数值,从用于从中进行选择的一组 有限的误差近似中选择该误差数值。
这一组有限的误差近似允许减小误差,并同时节约了空间,这是因为,能够仅从一组有限的误差近似中选择该误差近似,该组有限的 误差近似能够利用在等化步骤期间实际误差遇到的更少的位来表示。 与在编码过程期间释放的位数相比,误差近似的索引对于每一样本要 求更少的位。对于保证数据的可压缩性而言,这是重要的。这个被得 以节约的空间允许嵌入另外的信息例如同步模式和种子样本。从
96kHz到48kHz或者从192kHz到96kHz的采样频率的降低可能成为 问题,这是因为,为了再形成音频的目的而引入了更高的采样速率, 其中为了高保真音频再现,与光盘音频记录相比,不仅这样的采样速 率而且主要地相位信息都是更加具体地需要的。
由于样本频率降低而引起的误差和用于(尽可能多地)消除这些 误差的校正数据(误差近似)能够是最优化算法的结果,其中,最优 化准则能够被定义成平方误差的最小和或者甚至可以包括基于感知 音频目标的准则。
在该方法进一步的实施例中,在已经为样本建立了误差近似之 后,该样本将被等化成的相邻样本的数值被修改,从而当从包括误差 近似的等化样本重构样本时,该样本更加接近地代表在等化之前的样 本。根据需要,通过修改相邻样本的数值从而当该样本被等化成相邻 样本时相邻数值和误差近似的组合更加准确地代表在执行到其相邻 样本的等化之前的初始样本数值,该误差能够被进一步降低。
在该方法进一步的实施例中,该组误差近似被索引并且在该误差 近似对应的样本中嵌入代表该误差近似的索引。
在该方法进一步的实施例中,样本被划分成块并且在包括该索引 对应的样本的第二块前面的笫一块中的样本中嵌入该索引。
通过索引 一组有限的误差近似并且仅仅在该索引对应的样本前 面的第三数字数据集的样本的较低有效位中存储适当的索引,进一步 实现了误差近似的尺寸的降低。通过在前一个块的样本中嵌入索引, 当相应样本的分离过程开始时,该索引并且因此该误差近似是可用 的。
在该方法进一步的实施例中,嵌入式误差近似被压缩。除了索引,能够采用用于压缩的其它方法,例如LempdZiff。误 差近似来自一组有限的误差近似并且因此能够被压缩,这允许当在样 本中嵌入误差近似时使用更少的空间。
如果其它嵌入数据也存在于样本的较低有效位中,这是特别有益 的。对于这个另外的数据,索引不必是可用的,并且能够使用普通压 缩格式。能够使用关于误差近似的索引和关于另外数据的压缩的组 合,或者能够使用对于在较低有效位中嵌入的所有数据,即误差近似 和另外的数据的总体压缩。
在该方法进一步的实施例中,以预定的偏移嵌入误差数值。
预定偏移在误差近似和该误差近似对应的样本之间建立了确定 的关系。
在使用索引存储误差近似的情形中,该索引适用于每一个块并且 适用的索引也被存储在每一个块中。
如果可能的,索引还能够对于每一数字数据集被选择或者是固定 的并且被存储于编码器和解码器中而不被存储于数据流中,这是以灵 活性为代价的。
当不使用任何误差近似改进所被提取的音频信号的质量时,无需 存储误差近似。这并不阻止在数字数据集的较低有效位中嵌入和压缩 其它数据。
在该方法进一步的实施例中,在相对于误差数值所对应的样本具 有变化位置的第 一可用位置处嵌入该误差数值。
通过一旦存在可用空间时便压缩样本中的误差数值,样本空间得 以节约,能够使用该空间以在以后允许扩展该组有限的误差数值,从 而由此允许更加准确的校正等化样本,这样实现了数字数据集的更好 再现。
这本能够成为对所获空间加以利用的方法,但是优选地采取一种 不同的方案。
从压缩误差数值&索引列表节约的空间实际上被用于限制将被 混音到一起的下一个块的样本数目。因为这个数目小于当前块,所以各种误差将会更小并且因此能够利用相同数目的误差近似数值而被 更好地近似。这些误差数值和参考索引再次被压缩并且所节约的空间 再次被继续用于限制在下一个块中的被混音样本的数目。
在该方法进一步的实施例中,未被用于嵌入误差近似或者其它控 制数据的、第三数字数据集的样本的任何较低有效位,被设为预定数 值或者被设为零。
较低有效位能够或者在组合数字数据集之前或者在嵌入嵌入式 信息例如种子数值,同步模式和误差数值之后被设为零。
预定数值或者零数值能够帮助辨别嵌入式数据,因为嵌入式数据 不再被看起来随机的数据包围。
它进一步允许简化组合和分离过程,因为显然这些位无需处理。
应该指出,在较低有效位中选择被释放的位数可以被动态地执 行,换言之,这是基于数字数据集在该瞬时的内容。例如古典音乐的 无声部分可能要求更多的位以用于信号分辨率,而流行音乐的高声部 分可能并不要求那么多的位
在本发明的一个实施例中,已被提取的信号或者嵌入式控制数据 能够被用于控制需与音频信号被同步地控制的外部设备,或者例如通 过相对于基础水平或者相对于未被从组合信号提取的其它音频通道, 或者相对于组合音频信号定义已被提取的音频信号的幅度而控制已 被提取的音频信号的再现。
本发明描述了一种技术,用于通常从3维音频记录,但是并不限 于这个用途-将音频PCM轨道(PCM轨道是代表数字音频通道的数 字数据集)-混音(并且存储)成一定数目的轨道,该数目小于在初始 记录中使用的轨道数目。这种通道组合是通过以支持反向操作即解码 操作的方式将成对音频轨道混音成单一轨道而实现的,该解码操作允 许分离组合信号,以重建初始的分离的音频轨道,该音频轨道将与来 自母带记录(主记录,master recording )的原始音频轨道是感知相同 的,而在同时,组合信号提供了一种能够经由规则回放通道再现并且 当被再现时与音频通道混音物感知相同的音频轨道。这样,当将3维音频记录(录音)的通道组合成一组通常用于2维环绕音频记录的通 道,.并且再现所被组合的通道而不应用反向操作时,已被组合的,即 (向下)混音的,音频记录仍然符合用于重建通常被称为立体声,4.0, 5.1或者甚至7.1环绕音频格式的、逼真的2维环绕音频记录的要求, 并且能够被原样地播放而不需要额外的设备、修改设备或者解码器。 这保证了所得组合通道的向下兼容性。
向多于2个的数字数据集或者两个音频信号的扩展是非常可行 的。关于2个数字数据集解释了该项技术,能够以类似的方式实现这 项技术向多于2个数字数据集的扩展,这是通过改变交错,从而对 于第三数字数据集的每一个样本,仅仅一个数字数据集提供将被与来 自其它数字数据集的已等化样本组合的非等化样本并且从提供样本 的数字数据集以交替的方式选择提供非等化样本的数字数据集。
如果多于2个数字数据集被组合,则每一个数字数据集的每第n 个样本被用作每n (相等)个数据集样本保持(ii-l)个样本的第一子 集的等化样本,而第二子集每n个数据集样本保持l个样本。对于每 一个数据集,等化样本的位置在时域中偏移1个位置。
这样,在由目前的数字音频标准提供的数据速率和分辨率内,已 经发现3通道数字音频到1通道数字音频混音物(3到1混音)是当 然可行的。以此方式,4到1混音也是可能的。
数字音频通道的这种混音允许使用具有第一数目的独立数字音 频通道的第一数字音频标准以存储、传输和再现具有第二数目的独立 数字音频通道的笫二数字音频标准,其中数字音频通道的第二数目高 于数字音频通道的第一数目。
本发明通过使用本发明的方法或者根据本发明的编码器将至少 两个数字音频通道组合成单一数字音频通道而实现了这一点。因为在 该方法中的添加步骤,所得数字音频流是相组合的两个数字音频通道 的感知满意表示。
对于多个通道执行这种组合降低了通道数目,例如从3D 9.1体 系到2D5.1体系。这能够通过例如将9.1系统的左下前通道和左上前
20通道组合成通常能够通过5.1系统的左前通道存储、传输和再现的一 个左前通道而得以实现。
因此,虽然使用本发明产生的信号允许通过分离组合信号而恢复 初始9.1通道,但是该組合信号同等地适用于由仅仅具有5.1系统的 用户使用。对于适当的向下混音5.1系统,可能要求在混音或者编码 之前衰减两个通道,从而在解码期间要求每一个通道的(反向)衰减 数据。
使用在本发明中形成的技术-但是并不限于这个用途-以产生能 够在现有的或者新的媒体载体例如仅仅作为实例给出的HD-DVD或 者BLU-RAYDVD上存储的AURO-phonic音频记录,而无需向它们 的媒体格式定义增加任何额外的媒体格式或者添加,因为这些标准已 经支持多通道音频PCM数据,例如96khz 24位PCM音频(HD-DVD ) 的6通道或者96khz 24位PCM音频(BLU-RayDVD )的8通道或者 192khz 24位PCM音频(BLU-RayDVD )的6通道。
对于AURO-phonic音频记录,与在这些现有或者新的媒体载体 上可用的通道相比,需要更多的通道。本发明允许使用其中存在通道 不足的这些媒体载体,或者其它传输装置并且使得能够在用于3D音 频存储或者传输的通道数目不足的情况下使用这种系统,并且同时保 证了与所有的现有回放装备向后兼容,从而自动地在2D系统中提供 3D音频通道,如同它是2D音频通道一样。如果存在适用的回放装备, 则能够使用根据本发明的解码方法或者解码器提取完整的该组3D音 频通道并且该系统能够在提取分离的数字音频通道并且再现这些个 体通道之后适当地提供完整的3D音频。
Aurophony指定了能够正确地提供-由它的x、 y和z轴定义的录 音室三维性的音频(或者音频+视频)回放系统。已经发现与(一种 或多种)特殊扬声器布局相组合的适当的声音记录提供了更加自然的 声音。
3D音频记录例如Aurophony还能够被定义成带有高度扬声器的 环绕设置。正是这种高度扬声器的添加引起了对于与目前通常使用的系统所能够提供的相比更多的通道的需求,这是因为目前使用的2D 系统仅仅提供在室内基本上处于相同水平的扬声器。因为Aurophony 融合并且掺合了两个空间的音调特征,所以它被关联到特定的知觉方 面。数目增加的通道和扬声器的定位允许在这个基础上进行任何记录 以实现使用音频的固有三维方面的全部潜能的回放。与特殊扬声器定 位相组合的多通道技术在听觉上将听众带到声音事件的实际场所-带到虛拟空间,并且使得它们能够在虚拟模式中感受到它的空间维 度。这个空间的宽度、深度和高度实际地和在情感上都是被首次感知 的。
进而,设备例如HD-DVD或者BLU-RayDVD播放器实现了一 种音频混音器,以在回放期间将外部音频通道(不是从盘读出的)混 音到音频输出中,或者通常根据用户导航操作混音音频效果以增加用 户的感受。然而,它们还具有"电影,,真实模式,该模式在回放期间消 除了这些音频效果。最后这种模式由这些播放器用来通过它们的音频 (A/D)转换器输出多通道PCM混音或者用来提供作为在包括例如 视频的数据中封装的音频多通道混音而被加密的多通道PCM混音并 且使用HDMI接口发出以进一步处理。对于在回放/记录期间使用的 无损压缩(例如位相同音频PCM数据)的要求对于任何设备提供或 者记录这些向下混音的多通道PCM音频轨道而言都是成立的,只要 该解码器-如在本发明中解释地被用于重建3维音频记录或者仅仅"空 间"增强音频记录。
除通过以可逆方式将多个通道组合成单一通道的、更加有效的或 者有效率的音频PCM存储之外, 一项目标应用或者使用是3维音频 记录和再现的音频PCM存储,它仍然保持与如由DVD、 HD-DVD或 者BLU-RayDVD标准提供的音频格式的兼容性。在控制环绕音频记 录或者多通道音频期间,记录工程师目前具有多个音频轨道可用并且 使用模板以使得它们的控制工具形成可以例如在CD、 SA-CD、 DVD、 BLU-RayDVD或者HD-DVD上创造的或者仅仅被以数字方式存储在 记录设备(如,例如硬驱动器)上的立体声或者(2维)环绕音频轨道。在真实世界中总是位于3维空间中的音频源至此已经主要被作为 在2维空间中限定的源记录,即使对于音频记录工程师而言,第3维 信息也是可用的或者能够已被容易地添加(例如,声音效果如在听众 头顶上掠过的飞机、或者小鸟在空中的"鸣唱")或者被从真实的生活 场景记录。
直至现在,除了以下系统,其中例如在电影院应用中另外的多个 音频轨道的系列被独立地存储于提供用于存储的充分数目的轨道的 系统中,没有任何通用音频格式已经是可用的。然而,这些另外的通 道不能被存储在记录媒体如HD-DVD或者BLU-RayDVD上,这是因 为,这些存储系统提供了数目不足的音频通道。本发明的目的在于, 以它们将不会干扰(或者打扰)(2D)标准多通道或者2通道音频信 息的方式,以对于记录工程师而言在完成3D音频记录之前基本实时
多通道轨道的方式形成这些额外的"虚拟"轨道。
应该指出,虽然针对音频应用描述了本发明,但是对于视频应用 而言,能够设想采用相同的原理,以例如形成3维视频再现,这是例 如通过使用每一个均被取自具有微小角度差异的照相机的2个同步视 频流(角度),从而形成3D效果,然而如本发明详细描述的那样组 合该两个视频流并且因此使得能够存储和传输3D视频从而它仍然能 够在普通的视频装备上回放。
应用实例
在环绕混音(SurroundMix )中包括的立体声(艺术)混音。 在控制音频记录期间,声音工程师定义或者使用混音模板,以从 多个音频轨道开始,形成"真实,,或者"艺术"立体声混音,以及环绕混 音(例如4.0, 5.1...)。虽然环绕混音到立体声混音的矩阵向下混音 是可能的,但是能够很容易地例示出这种向下混音矩阵技术的缺点。 矩阵向下混音立体声将充分地不同于"艺术,,立体声混音,因为来自这 种矩阵向下混音立体声信号的内容将通常位于L-R域(异相信号)中, 而真实"艺术"立体声混音将主要位于L+R域(同相信号)中,并且在L-R域中具有适度的数量。仅仅作为一个实例;在单音中,矩阵向 下混音立体声将听起来基本上更加寂静,这是由于异相信号的数量较 高。因此,利用大多数的目前音频编码/解码技术控制和编码的当前的 环绕音频记录通常提供-如果它们关心逼真的立体声再现-该记录的分 离的真实("艺术")立体声版本。
利用在本发明的技术上建立的应用,本领域技术人员能够容易地 建立一种系统,该系统将艺术记录的左(前)音频和右(前)音频通 道控制成左和右通道,并且使得这些通道中的每一个与(例如)24dB 衰减音频Delta通道(L-艺术-L-环绕)和(R-艺术-R-环绕)混音。 当不利用任何解码器地播放多通道记录的L/R通道时,将主要地存在 艺术左/右音频记录,但是当利用如在本发明中解释的解码器播放时, 混音通道将被首先解混音,接着,(delta)通道将被(例如)24dB 放大并且被从"艺术,,通道减除,以对于环绕混音根据需要形成左和右 通道,在此时还播》丈环绕(L/R )通道以及中心和超低音(Subwoofer) 通道0
3-维("AURO-phonic")混音被包括在环绕混音中。 使用如在本发明中解释的编码技术,能够容易地看到,简单地通 过在2维2.0, 4.0, 5.1或者甚至7.1环绕混音的每一个通道上混音, 代表如在高于那些2维扬声器的特定高度处记录的音频的另一音频通 道,第3维音频信息的混音能够得以实现。当未与如在本发明中限定 的这种解码器一起地使用多通道记录时,在混音期间,这些第3维音 频通道能够被衰减,以避免非理想的音频效果。在解码期间,这些通 道被解混音并且当需要时被放大,并且在顶部扬声器上提供这些通 道。
在环绕混音中包括的立体声("艺术")混音&3-D ("AURO-phonic")混音。
如果旨在产生对于艺术立体声再现,2-D环绕再现或者 3-DAURO-phonic再现而言是有用的多合一记录,例如在96kHz (HD-DVD)或者192kHz ( BLU-RayDVD )下的6通道,则能够使用基于本发明的应用。通过以因子3 (或者更大)降低"初始,,采样速 率,本发明能够被用于将3个通道(或者更多)混音成一个通道,并 且近似在这种降低期间产生的误差,以尽可能多地恢复初始信号。这 能够4皮用于混音96kHz左前-艺术通道,与96kHz (衰减)左前Delta (L-艺术-L-环绕),和与96kHz (衰减)左前顶部。类似的混音方案 可以被应用于右前通道。2-通道混音能够被应用于左环绕和被应用于 右环绕。甚至中心通道也能够被用于混音中心顶部音频通道。 从"古典"2-D记录提供自动化3-D音频。
大多数目前存在的音频或者视频制作具有2维(环绕)音频轨道。 除真实的第3维音频源位置之外,如在本发明中解释的编码器能够在 控制和混音期间使用该位置,以使用该信息作为被向下混音成2-维记 录的另外的通道,如存在于标准2维音频记录中的扩散音频是将在3 维音频设置的顶部扬声器上移动和提供的候选音频。能够想到自动化 (离线或者非实时)音频过程,该音频过程将从2维记录提取扩散音 频,并且可以使用该所被提取的音频以形成被与2-D环绕记录的"降 低,,音频轨道混音(根据本发明的格式)的通道,从而获得能够作为 3D音频而被解码的环绕多通道记录。根据计算要求,从2D-环绕通道 提取扩散音频的这种滤波技术能够被实时地应用。
本发明能够被用于形成3维音频系统的一部分的几种设备。 Aurophonic编码器-计算机应用(软件)插件。 通常可用于音频/视频记录和控制世界的控制和混音工具允许第 三方研制软件插件。它们通常提供公共数据/命令接口以启动在由混音 和控制工程师所使用的整套工具中的插件。因为AUROPHONIC编码 器的核心是一个简单的编码器事例,在一方面利用多个音频通道输入 和一个音频通道输出并且在另一方面对于作为另外的参数的用户设 置如质量和通道衰减/位置加以考虑,能够在这些音频控制/混音工具 中提供软件插件。
AUROPHONIC解码器-计算机应用(软件)插件。 能够以与编码器插件类似的方式研制作为利用控制和混音工具的检验工具的软件插件解码器。这种软件插件解码器还能够被集成到
消费者/终端用户PC的媒体播放器(如视窗媒体播放器Windows Media Player,或者DVD软件播放器并且最可能的HD-DVD/Blu-Ray 软件播放器)中。
AUROPHONIC解码器-内置于BLU-Ray或者HD-DVD播放器 中的专用ASIC/DSP。
几种新的媒体高清晰度格式定义了能够在它们的分别的(消费 者)播放器内部使用的多个高频/高位分辨率音频PCM流。当使用其 中没有任何音频PCM数据被混音/融合/衰减/…以被提供给内部音频 数字模拟转换器的模式从这些盘播放内容时,这些音频PCM数据(能 够是AURO编码数据)能够被专用ASIC或者DSP (加载有AURO 解码器固件)截取以解码所有的混音音频通道并且产生额外的一组音 频输出以传送例如艺术左/右音频或者例如另外的一组顶部L/R输出。
作为BLU-Ray或者HD-DVD固件的一个部分集成的 AUROPHONIC解码器。
在BLU-Ray或者HD-DVD盘回放期间,只要AUROPHONIC 解码过程具有意义,这些播放器的回放模式便需要被设为真实Film 模式,以防止播放器的音频混音器损坏/修改如在这个盘上控制的 PCM流的初始数据。在这种模式中,并不需要播放器的CPU或者 DSP的完全处理能力。这样,能够作为另外的解混音过程集成 AUROPHONIC解码器,作为播放器的CPU或者DSP的固件的一个 部分执行该另外的解混音过程。
AUROPHONIC解码器-ASIC/DSP附加在HDMI切换器,USB 或者FIREWIRE音频设备中。
HDMI (高清晰度媒体接口 )使得能够传输全带宽的多通道音频 流(8通道,192kHz, 24位)。HDMI切换器通过首先解扰而再生数 字音频/视频数据,从而在这种切换器中能够内部访问经由HDMI接 口传输的音频数据。可以利用实现AURO解码器的附加板来解码 AURO编码音频。类似的附加集成(通常在音频记录/回放工具中)
26能够被用于USB或者FIREWIRE多通道音频I/O设备。
如在这里描述的编码器能够被集成于更大的设备例如记录系统 中或者能够是一种被联接到记录系统或者混音系统的独立编码器。该 编码器还能够被实现为计算机程序以例如当在适用于运行所述计算 机程序的计算机系统上运行时执行本发明的编码方法。
如在这里描述的解码器能够被集成于更大的设备例如在回放设 备中的输出模块,在放大设备中的输入模块中或者能够是一种独立解 码器,该解码器经由它的输入被联接(耦接)到已被编码的组合数据 流源并且经由它的输出被联接到放大器。
数字信号处理设备在该文献中应该被理解成在记录/传输/再现链 条的记录部分中的设备,例如音频混音表格、用于在记录介质例如光 盘或者硬盘上记录的记录设备、信号处理设备或者信号捕捉设备。
再现设备在本文中应该被理解成是在记录/传输/再现链条的再现 部分中的设备,例如音频放大器或者回放设备,用于从存储介质恢复 (取回,retrieve)数据。
再现设备或者解码器能够被有利地集成于车辆例如小汽车或者 公共汽车中。在车辆中,乘客通常被乘客厢包围。
该隔室允许容易地定位扬声器,将通过该扬声器再现多通道音 频。因此,设计者能够专门地将音频环境定制成适合于在乘客厢内部 再现3维或者其它多通道音频。
另一个益处在于,正如其它配线被隐藏那样,能够容易地隐藏扬 声器所需的配线。在乘客厢的下部中定位3维扬声器系统的下部组扬 声器,正如很多的扬声器目前被安装在例如门板中,在仪表板中或者 靠近底板。能够例如靠近车顶或者在高于汽车仪表板或者仪表板或者 至少高于下部组扬声器的另一位置处而在乘客厢的上部中定位该3维 扬声器系统的上部组扬声器。
允许用户将再现设备从其中解码器分离音频通道并且将已被分 离的音频通道传送到放大器的第一状态切换到其中已被组合的音频 通道到达放大器的第二状态也是有益的。能够通过绕过解码器而实现在3维再现和2维再现之间的切换。
在另一种配置中,还设想到在2维再现和立体声再现之间的切换。
对于2和3维音频再现的要求,例如扬声器的定位,并不是本发 明的一个部分并且因此将不与详细描述。然而应该记住的是,本发明 能够适应于多通道音频再现设备的设计者例如当将小汽车配置成正 确地再现多通道音频时可以选择的任何通道配置。
现在将基于附图描述本发明。
图1示出用于组合两个通道的、根据本发明的编码器。
图2示出被等化样本转换的第一数字数据集。
图3示出被等化样本转换的第二数字数据集。
图4示出将两个所得数字数据集编码成第三数字数据集。
图5示出将第三数字数据集解码回(成)两个分离的数字数据集。
图6示出改进的对第一数字数据集的转换。
图7示出改进的对第二数字数据集的转换。
图8示出将两个所得数字数据集编码成第三数字数据集。
图9示出将第三数字数据集解码回两个分离的数字数据集。
图10示出一个实例,其中描绘了如利用如在图6中描述的编码
而获得的第一个流A的样本。
图11示出一个实例,其中描绘了如利用如在图7中描述的编码
而获得的第一个流B的样本。
图12示出已被混音的流C的样本。
图13示出由本发明引入到PCM流的误差。
图14示出在组合式数字数据集的样本的较低有效位中的辅助数
据区域的格式。
图15示出该辅助数据区域的更多细节。
图16示出其中适应导致可变长度AURO数据块的一种情形。图17给出如在以前的部分中解释的处理步骤组合的概况。 图18示出Aurophonic编码器i殳备。 图19示出Aurophonic解码器设备。
具体实施例方式
图1示出用于组合两个通道的、根据本发明的编码器。编码器 10包括第一等化单元lla和第二等化单元llb。每一个等化单元lla、 llb均从编码器10的分别的输入接收数字数据集。
第一等化单元lla选择第一数字数据集的第一样本子集并且将
这个第一子集的每一个样本等化成第一数字数据集的第二样本子集 的相邻样本,其中,如将在图2中详细解释地,第一样本子集和第二
样本子集交错。包括第二子集的未受影响的样本和第一子集的等化样 本的所得数字数据集能够被传递到第一可选样本尺寸降低器12a或者 能够被直接地传送到组合器13。
第二等化单元lib选择第二数字数据集的笫三样本子集并且将 这个第三子集的每一个样本等化成第二数字数据集的第四样本子集 的相邻样本,其中,如将在图3中详细解释地,第三样本子集和第四 样本子集交错。包括第四子集的样本和第三子集的等化样本的所得数 字数据集能够被传递到第二可选样本尺寸降低器12b或者能够被直接 地传送到组合器13。
第 一和第二样本尺寸降低器均从它们的分别的数字数据集的样 本移除确定(定义)数目的下位,例如通过移除四位的最低有效位而 将24位样本降低成20位样本。
如由等化单元lla、 llb执行的样本等化引入了误差。可选地, 通过比较等化样本与初始样本而由误差近似器15近似这个误差。如 在下面解释的那样,这种误差近似能够由解码器使用以更加准确地恢
复初始数字数据集。组合器13将第一数字数据集的样本添加到第二 数字数据集的相应的样本,如提供到它的输入,并且经由它的输出将 第三数字数据集的所得样本供应到格式化器14,格式化器14在第三数字数据集的较低有效位中嵌入另外的数据例如来自两个数字数据
集的种子数值和如从误差近似器15接收到的误差近似并且将所得数 字数据集提供到编码器10的输出。
为了解释原理,使用两个输入流对实施例进行解释,但是本发明 能够同等地使用被组合成一个单一输出流的三个或者更多输入流。
图2示出由等化样本转换的第一数字数据集。第一数字数据集 20包括样本数值Ao, An A2, A3, A4, A5, A6, A7, A8,入9的序列。 第一数字数据集被划分成第一样本子集A" A3, A5, A7, A9和笫二 样本子集A。, A2, A4, A6, A8。
随后,如由图2中的箭头所示意地,第一样本子集的每一个样本 A15 A3, A5, A7, A9的每一个数值被等化成来自第二子集的相邻样本 A0, A2, A4, A6, As的数值。具体地,这意味着样本Ai的数值被相 邻样本A。的数值替代,即样本Ai的数值被等化成样本A。的数值。这 产生了如图所示的第一中间数字数据集21,该第一中间数字数据集包 括样本数值A。", Ar, A2", A3", A4", A5", A6", A7", A8", A9", 等,其中数值A。"等于数值A。并且A '等于数值A。等。在图6中, 将示出一个实施例,其中由于样本中的位数降低,A。"不再等于Ao。
图3示出被等化样本转换的第二数字数据集。第二数字数据集 30包括样本数值B。, Bn B2, B3, B4, B5, B6, B7, B8, Bg的序列。 第二数字数据集被划分成第三样本子集B。, B2, B4, B6, Bg和第四样 本子集Bp B3, Bs, B7, B9。
随后,如由图3中的箭头所示意地,第三样本子集的每一个样本 B0, B2, B4, B6, Bs的每一个数值被等化成来自笫四子集的相邻样本 B19 B3, B5, B7, 89的数值。
具体地,这意味着样本B2的数值被相邻样本Bi的数值替代,即 样本B2的数值被等化成样本Bi的数值。这产生了如图所示的第二中 间数字数据集31,第二中间数字数据集包括样本数值Bo", Bi", B2", B3", B4", B5", B6", B7", B8,,, B9",其中数值B,等于数值并 且B2,,等于数值Bn等。在图7中,将示出一个实施例,其中由于样本中的位数降低,B '不再等于Bi。
图4示出将两个所得数字数据集编码成第三数字数据集。
现在通过相加相应的样本而组合第一中间数字数据集21和第二 中间数字数据集31。
例如,第一中间数字数据集21的第二样本A^与第二中间数字 数据集31的第二样本B '相加。所得第一组合样本d被置于第三数 字数据集40的第二位置处并且具有数值A '+Br。
第一中间数字数据集21的第三样本A2"与第二中间数字数据集 31的第三样本B2"相加。所得第二组合样本C2被置于第三数字数据 集40的第三位置处并且具有数值A2"+B2"。
图5示出将第三数字数据集解码回两个分离的数字数据集。
第三数字数据集40被提供给解码器以分离在第三数字数据集40 中包括的两个数字数据集31、 32。
第三数字数据集40的第一位置被示为保持数值AQ",这是在解
码期间需要的种子数值。这个种子数值能够被存储在任何位置,但是 在解释期间为了方便起见被在第 一位置中示出。第二位置保持具有数
值A。"+B。"的第一组合样本。因为解码器知道如从第一位置恢复到的 种子数值A。",能够通过相减<formula>formula see original document page 31</formula>而建立第 二中间数字数据集的样本数值。
这个恢复样本数值B。"被用于重构第二中间数字数据集,但是也 被用于恢复第一中间数字数据集的样本。因为数值A。"现在已知,并 且已知它的相邻样本A/'具有相同数值,所以现在能够计算第2中间 数字数据集的样本
<formula>formula see original document page 31</formula>
这个恢复样本数值Bi"被用于重构第二中间数字数据集,但是也 被用于恢复第一中间数字数据集的样本。
因为数值B广现在已知,并且已知它的相邻样本B2"具有相同数 值,所以现在能够计算第一中间数字数据集的样本<formula>formula see original document page 31</formula>这个恢复样本数值A '被用于重构第 一 中间数字数据集,但是也 被用于恢复第二中间数字数据集的样本。
能够对于其余的样本如在图5中所示那样重复这一点。 为了近似第一初始数字数据集20,能够使用系统已知的有关信 号的信息处理恢复第一中间数字数据集,例如对于音频信号,能够通 过内插或者其它已知信号重构方法重构被编码和解码(等化样本)损 失的样本。如将在以后示出的那样,还能够存储有关通过在信号中等 化而被引入的误差的信息并且使用这个误差信息接近于它们在等化 之前所具有的数值,即接近于它们在初始数字数据集21中具有的数 值地重构,羊本。
当然能够对于每一个恢复中间数字数据集执行这一点以将等化 样本恢复成与在初始数字数据集中的样本的初始数值尽可能接近的 数值。
在下面对图6、 7和8的说明中,2个初始通道在位分辨率中例 如从每样本24位降低到18位。接着在降低样本分辨率之后,采样频 率被降低为初始采样频率的一半(在该实例中从2个音频通道开始, 其每一个均具有相同的位分辨率和采样频率)。其它组合也是可能的,
例如从X位开始并且降低到Y位(例如X/Y-24/22, 24/20, 24/16等… 或者20/18, 20/16,或者16/15, 16/14...),根据高保真音频的要求, 不应该在位分辨率中将样本降至低于14位…。如果更多的通道被混 音,则在这里描述的基本技术要求将采样频率除以需被混音成一个通 道的通道的数目。所被混音的通道越多,则通道(在混音之前)的实 际采样频率将越低。在HD-DVD或者BLU-RayDVD中,初始采样频 率能够高达96kHz或者甚至(BLU-Ray)高达192kHz。在每一个采 样频率均为96kHz时从2个通道开始,并且二者均降低至48kHz,这 仍然保留了在高保真音频的范围中的采样频率。对于电影/TV音频质 量而言,甚至混音3个通道,并且被降低至32kHz也是可接受的(这 是如由NICAM数字广播TV音频所使用的频率)。从真实的192kHz 记录开始,给出混音4个通道的方式,将采样频率降至48kHz。图6示出第一数字数据集的一种改进的转换。在该改进转换中, 样本的较低有效位不再代表初始样本而是被用于存储另外的信息例
如种子数值、同步模式、有关通过样本等化引起的误差的信息或者其 它控制信息。
第一数字数据集20包括样本数值序列A。, A" A2, A3, A4, A5, A6, A7, A8, A9。每一个样本A。, A" A2, A3, A4, A5, A6, An A8, A9均被截断从而产生截断或者舍入样本A。', A2', A3',
A4', A5,, A6, A7', A8', A9,。随后如在图2中解释的那样处理这组 60截断样本A。', A,, A2,, A3', A4', A5', A6', A7', A8', A9,,其 中较低有效位得到考虑,或者实际上确实不再带有有关样本的信息。 该组60截断样本3皮划分成第一样本子集A , A3', A5', A7', A9'和第 二样本子集A。', A2', A4,, A6', A8'。
随后,如在图6中的箭头所示意地,第一样本子集的每一个样本 A , A3,, A5', A7', a9'的每一个数值被等化成来自第二子集的相邻 样本A。', A2', A4', A6,, As'的数值。
具体地,这意味着样本A/的数值被相邻样本A。的数值替代,即 样本A 的数值被等化成样本An'的数值。这产生了如所示的第 一 中间 数字数据集61,它包括样本数值Ao", A,, A2", A3", A4", A5", A6", A7", A8", A9",等,其中数值An"等于数值A。'并且Ar等于 数值A。'等。
应该指出,因为截断,即样本舍入,在第一中间数字数据集61 中产生保留区域62。
图7示出第二数字数据集的一种改进的转换。以与用于第一数字 数据集的方式相同的方式,该转换能够被改进,即,样本的较低有效 位不再代表初始样本而是被用于存储另外的信息例如种子数值、同步 模式、有关通过样本等化引起的误差的信息或者其它控制信息。
第一数字数据集30包括样本数值序列Bq, Bn B2, B3, B4, B5, B6, B7, B8, B9。每一个样本B。, B" B2, B3, B4, B5, B6, B7, B8, B9均被截断,从而产生截断或者舍入样本B。', B , B2', B3', B4',B5', B6', B,', Bs', B9'。
随后如在图3中解释的那样处理这组70截断样本B。', B。 B2,, B3', B4', B5', B6', B7', B8,, B9',其中较低有效位得到考虑,或者 实际上确实不再带有有关样本的信息。
该组70截断样本Bo', B厶B2', B3', B4', B5', B6', B7', B8', B9'被划分成第三样本子集B。', B2', B4,, B6,, Bs,和第四样本子集Br, B3', B5', B7', B9'。
随后,如由图3中的箭头所示意地,第三样本子集的每一个样本 B0,, B2', B4', B6,, Bs'的每一个数值被等化成来自第四子集的相邻样 本B , B3,, B5,, B7', B9'的数值。具体地,这意味着样本82'的数值 被相邻样本B 的数值替代,即样本B 的数值被等化成样本B 的数 值。
这产生了如所示的第二中间数字数据集71,它包括样本数值 B。", Br, B2", B3", B4", B5", B6", B7", B8", B9",其中数值 B2"等于数值B广并且B广等于数值B。等。应该指出,因为截断,即 样本舍入,在第二中间数字数据集71中产生保留区域72。
通过如在图6和7中解释的舍入而被引入的分辨率降低在原理上 是"不可恢复的",但是能够应用增加感知样本频率的技术。如果要求 更多的位分辨率,则本发明允许增加Y的数值(实际上被使用的位), 其代价是用于编码数据或者每样本的X位的可用"空间"更少。当然, 在辅助数据区域中的数据块中存储的误差近似允许显著降低分辨率 的感知损失。
对于24位PCM音频流,利用18/6格式并且混音2个通道,我 们得到18位音频样本和6位数据样本,每一个数据块均以6个数据 样本(每一个6位)的同步信号(sync )开始,2个数据样本(总共 12位)被用于存储数据块的长度并且最终2x3数据样本(2x18位) 被用于存储副本音频样本。关于其它格式(实例)
-16/8: 8个数据样本的同步信号,2个数据样本(16位,仅仅使 用12位)用于长度,并且2x2个数据样本(2xl6位)用于副本音频样本;
-20/4: 4个数据样本的同步信号,3个数据样本(总共12位, 比特)用于长度,并且2x5个数据样本(2x20位)用于副本音频样本
-22/2: 2个数据样本的同步信号,6个数据样本(总共12个位) 用于长度,并且2x11个数据样本(2x22位)用于副本音频样本。
关于其它格式(例如16位PCM音频,具有14/2格式),能够 定义类似的结构。
图8示出将两个所得数字数据集编码成第三数字数据集。
以与在图4中所述相同的方式执行编码。
既然第 一中间数字数据组61具有保留区域62并且第二中间数字 数据集71也具有保留区域72,现在将两个数字数据集相加产生了具 有辅助数据区域81的第三数字数据集80。
在这个辅助数据区域81中,能够放置另外的数据。
当利用并不知晓存在这个辅助数据区域81的装备再现第三数字 数据集80时,在这个辅助数据区域81中的数据将被这种装备解释成 是将被再现的数字数据集的较低有效位。
被置于这个辅助数据区域81中的数据将因此向信号引入在很大 程度上觉察不到的、轻微的噪音。这个觉察不到性当然依赖于被选择 为这个辅助数据区域81保留的较低有效位的数目,并且本领域技术 人员易于选择的将被使用的较低有效位的适当数量从而平衡在辅助 数据区域81中的数据存储要求和所导致的在数字数据集中的质量损 失。显然,在24位音频系统中,专用于辅助数据区域81的较低有效 位的数目能够高于在16位音频系统中的数目。
为了使得能够对这些混音音频通道进行逆(或者解混音)操作, 有限数目的样本的副本拷贝被存储。
虽然在以上实例中,仅仅单一种子数值样本即样本的副本拷贝被 使用和存储,但是存储多个种子数值样本是有利的,因为这样提供了 冗余。这个冗余是由于所被存储的种子数值的重复性质,该重复性质 允许通过在流中提供新的开始点而从误差恢复,同时由于以下事实,即能够存储用于每一个开始位置的两个种子数值。种子数值AO和Bl 允许检验开始位置,这是因为以AO开始的计算将产生数值BO,数值 BO然后能够被与所被存储的种子数值相比较以进行检验。进一步的 优点在于,AO和Bl这两者的存储允许搜索两个种子数值属于它的 正确的开始位置,允许在种子数值和数字数据集C之间自动同步,这 是因为很可能在于其中使用种子数值AO解码的位置处将准确地产生 等于所被存储的种子数值Bl的数值Bl。
当开始时,例如,从24 (Z)位96kHz采样信号降低到18 (Y) 位48kHz,并且每毫秒(msec)产生一个样本的副本,即每毫秒一个 种子数值,每个通道混音IOOO个18位样本副本,即种子数值。如果 这个混音包括2个通道,则每秒将需要用于样本副本"存储,,的 2x1000x18位或者36K个位。因为产生了第 一额外"空间"-在每秒 96K下,每一样本6 (X)位,所以在由较低有效位形成的辅助数据 区域中,每秒6x96-576K位是可用的,其中能够容易地存储样本数值 的这些副本拷贝。事实上,存在可被用于存储这些拷贝的16x存储器, 并且因此如果在这个辅助数据区域中将不存储任何其它信息,则能够 以每毫秒16次的速率存储这2个通道的副本样本。如果选择了用于 Z/Y/X的其它数值,例如在96kHz下24/20/4或者在44.1kHz下 16/14/2,则通过使用最低有效位产生的"自由"辅助数据区域的数量 将是不同的。以实例形式给出下面的情形,但是本发明不限于这些其 它的4吏用情形;在在96kHz下24/20/4的2个通道,并且每秒 4x96=392K位存储器要求每毫秒2xl000x20=40K位用于副本样本, 能够以每毫秒9.6次的速率存储副本样本。在在44.1kHz下16/14/2 的2个通道,并且每秒2x44.1=88.2K位存储器要求每毫秒 2xl000xl4=28K位用于副本样本,能够以每毫秒3.15次的速率存储 副本样本。在这里述及的实例将由样本的较低有效位形成的辅助数据 区域专门地用于从初始(分辨率和频率降低)音频流再现样本。由于 如在这里使用的技术的性质和特征,不仅仅使用这个"自由"辅助数据 区域用于存储—副本样本是有益的,虽然这些样本副本是由解混音过程或者解码器使用的基本信息。
在基本技术中,如在图2-8中解释地,首先降低2个PCM音频 流A(Ao, A!, Aj和B(Bo, Bn 82)的位分辨率,以产生2个新 的流A' (A'。, A、, A'2)和B' (B'。, B、, B'2)。接着,这些流的采 样频率被降低为初始采样频率的一半,从而给出A"(A"。, A、, A"2) 和B" (B"o, B、, B"2)。这个最后的操作引入了误差,其中 A"2产A"2i+产A'2i产生了误差E2i+1=A'2i+1-A'2i并且B"2i+1=B"2i+2=B'2i+1 (B"0=B'0)产生了误差E2i+2=B, 2i+2画D 2i+l (E0=0)。这个误差系列(E0, En E2, E3...)含有由于音频流B的采样降低而产生的具有偶数索 引的误差和因为音频流A的采样降低而产生的具有奇数索引的误差。 高级编码将近似这些误差并且使用这些近似以在混音之前减小误差。 作为混音的一个部分,作为在样本的较低有效位中的辅助数据区域中 建立的分离的通道添加近似误差(被表示成真正误差的倒数)E'。这 样,利用样本(Z-A"+B"+E'),混音信号被定义成Z产Ai"+Bi"+Ei'。 如果误差流能够被准确地近似,则 E'=E ,其中
Z2严A2i"+B"2i+E2产A'2i+B'2M+BVB'2i.产A,2i+B,2i , 并 且
Z2i+1=A2i+1"+B"2i+1+E2i+1=A'2i+B'2i+1+A'2i+1-A'2i=A'2i+1+B'2i+1。在这种情 形中,在最终混音流中不产生任何采样降低误差。
图9示出将第三数字数据集解码回两个分离的数字数据集。 正如在图5中描述的常规解码那样,执行通过增强编码,即较低 有效位81被用于存储另外的数据而获得的数字数据集80的解码,但 是解码器仅仅提供每一个样本的有关的位A。", A,', A2", A3", A4", A5", A6,,, A7", A8", A9", B0,,, B!", B2", B3", B4", B5", B6", B7", B8", B9",即并非较低有效位。解码器能够进一步恢复在较低 有效位中的辅助数据区域81中存储的另外的数据。如在图20中解释 地,这个另外的数据能够随后被传送到另外的数据的目标。
一旦解码器将这些副本样本、种子数值重构,则这些副本样本(种 子数值)然后便被用于解混音混音通道。混音通道例如是PCM流A" 和B"的混音,其中A"2尸A"2i+产A'2i并且B"2i+1=B"2i+2=B'2i+1。 A'。和B、将被用作副本样本并且被编码成数据块。
作为在图5中解释的方法的替代,其中仅仅使用一个种子数值, 能够如下地实现从A"+B"解混音(单音)信号A"+B"样本是 A"o+B"。, A'、+BV A"2+B"2, A"3+B"3, A"4+B"4, A"s+B"5。因为 我们具有A"。-A'。&B"尸B、的拷贝,所以我们能够重构A"&B"流。
1. 利用A"。+B'V ( A"。-A'。),我们从副本样本得到B"o并且得 到A"o;
2. 利用A、+B'V (B"产B'J ,我们从副本样本得到A、并且得 到B""
3. 利用A,,2+B,,2- (B"尸B,、),我们得到A"2和B"2-B"r,
4. 利用A"3+B"3- (A"3=A"2),我们得到B"3和A"3=A"2;
5. 利用A"4+B'V (B"4=B"3),我们得到A"4和B"4=B"3;
6. 利用A"5+B'V (A"5=A"4),我们得到B"5和A"5=A"4; 7....
在媒体格式如HD-DVD或者BLU-RayDVD上,能够作为复用 PCM音频流存储多通道音频。在这些通道的每一个上使用如在以上 解释的混音/解混音技术,能够容易地再现该多个通道(从6或者8 到12或者16)。这允许通过在每一个地面扬声器上方增加顶部扬声 器而存储或者形成第3维度的音频记录或者再现,而不要求用户具有 解码器来收听该音频的"2维"版本,这是因为在多通道音频轨道上存 储的音频仍然是100%的PCM"可播放"音频。在这最后一种再现模式 中,将不产生第3维度的效果,但是它也不会降低2维音频记录的可 察觉质量。
图10示出一个实例,其中描绘了如通过在图6中描述的编码获
得的第一个流A的样本。
例如,^假设将对2个单音96kHz24位数字音频流A&B进行处理。 A-初始样本(24位),A'—皮舍入样本(18H有效位&6L位=0 ),
A"-采样频率降低样本。
在图10中,在图表中以暗灰线示出第一音频流A。 A的样本是A0, Al5 A2, A3, A4, A5...每一个样本的分辨率是被表示成24位带符号整数数值的每样本24 (Z)位,所以数值范围从-2(z")到(2(z-"-1)。从这个样本系列,我们将分辨率降至18 (Y)位,清除6 (x)最低有效位以形成用于编码数据的"空间,,。降低是通过使用总共Z个中的仅仅Y个最高有效位将所有的Z位样本舍入成它们的最接近的表示而实现的。至此,每一个样本被加上(2(x")-l),每一个总数被限制为(2(z-"-l)或者被表示成[(2(z")-l)。接着,利用逐位AND((2(Y)-1)向左逐位移位X位),我们将6 (X)个最低有效位设为0,这样,我们产生了一个新的流A'(浅灰)。A'的样本是A'o,AV A'2…其中A'尸[Ai十(2(x-"國l)""."-I) AND ( (2(Y)-1)《X)。
在降低样本分辨率之后,我们还以因子2降低采样频率(在我们将混音多于2个通道的情形中,我们需要以等于所被混音的通道数目的因子降低采样频率)。至此,我们重复初始流A'的每一个偶数样本。在样本频率降低之后,我们得到新的流A"。 A"的样本是A'V A、,A"2,…其中A"2i = A'2i+1= A'2i。
在索引(下标)2i处的A"的所有偶数样本与在索引2i处的A'的初始数据相同,并且在索引2i+l处的A"的所有的奇数样本是在索引2i处的A"的先前样本的副本。
图11示出一个实例,其中描绘了如通过如在图7中描述的编码获得的第一个流B的样本。
B-初始样本(24位),B'-被舍入样本(18H有效位&6L位=0 ),B"-采样频率降低样本。
在图ll中,在图表中以暗灰线示出第二音频流B。同一样本分辨率降低被应用于这个流。B的样本是B。, Bp B2, B3, B4, B5,...从这个样本系列,我们产生新的流B'(浅灰)。B'的样本是B'o,B\, B'2,...其中
8、=, (2(x")画l) ] (2(z-"-l) AND ( (2(Y)-1) X)。在降低样本分辨率之后,我们也类似地以因子2降低采样频率并且我们得到新的流B"。 B"的样本是B"。, B、, B'V..其中
B,'2i+l=B''2i+2=B'2i+l 。
在索引2i+l处的B"的所有奇数样本均与在索引2i+l处的B'的初始数据相同,并且在索引2i+2处的B"的所有偶数样本都是在索引2i+l处的B"的先前样本的副本。
图12示出混音流C的样本。
A+B-初始样本(24位),A'+B'-被舍入样本(18H有效位&6L位=0) , A"+B'^釆样频率降低样本。
两个流A+B被混音(被相加)以得到新的流(暗灰)。将流A"和B"混音(相加)则我们得到另一个流(浅灰)。对于每一个样本,A"+B"将不同于A+B并且不同于A,+B',这是因为,由于位分辨率降低(舍入),A"或者B"可以不同于初始样本A和B,并且由于样本降低而可以不同于分辨率降低样本,但是通常,由于初始的高位分辨率和高采样频率,我们仍然具有初始A+B(暗灰)流的良好感知近似。
图13示出被本发明引入PCM流的误差。
由于舍入样本,而Error-Errors,由于舍入样本+频率降低,而Error'=Errors。
图14示出组合式数字数据集的样本的较低有效位中的辅助数据区域的格式。
最终,为了使得解码器能够解混音混音音频PCM数据,解码器要求在它接收到音频PCM样本之前具有音频PCM样本的副本样本,从而能够利用流式音频PCM实时地执行解混音操作。至此,我们需要将数据块的这个数据(保持音频样本的副本样本、同步信号模式、长度参数...)置于也带有与先前数据块有关的音频PCM信息的样本(Z位)中。为了给予解码器解码这些数据块的时间,它们甚至可以在被用于从其釆取副本的音频PCM样本之前结束几个音频PCM样本。在数据块的末端和被用于作为副本样本拷贝的音频PCM样本之间的音频PCM样本的数目是Offset (偏移),这是在数据块中存储的另一个参数。有时这个偏移可以是负的,这说明在音频PCM流中的副本样本的位置位于用于携带那个数据块的音频PCM样本中。对于偏移,我们也将使用12位数值(带符号整数数值)。数据块包括
1. 同步信号才莫式
2. 数据块长度
3. 参考那个数据块的终端的音频PCM样本偏移。
4. 音频PCM样本的副本(对于每一个混音通道存在一个)。通过包括允许(部分)否定通过样本等化引入的误差的校正信息
而实现了进一步优点。
在图14中,在时间0,编码器开始读出2xU X位样本,它们被降至Y位(比特)以形成用于保持数据块的辅助数据区域。样本频率降低产生了误差,该误差被近似并且被参考这些近似的列表替代。除了被有效地压缩的这个数据之外—产生数据块头(同步信号、长度、偏移…等),从而形成U,个样本的数据块长度。这些数据样本被置于第一U个样本的数据段中。在下面的步骤中,编码器读出U'(〈U)个样本,从而产生(未被压缩地)要求U个样本、而在压缩之后要求U"个样本的数据块。同样,这个数据块被联结到先前的数据块并且在该实例中(仍然)使用初始U (X位)样本中的一些样本。编码器读出U'"'X位样本并且产生相应的数据块的过程继续,直至所有的数据均已4皮处理。
图15示出辅助数据区域的更多细节。
AUROPHONIC Data Carrier Format (数据载体格式)符合下面的结构。
它是位精确音频/数据流150,通常为PCM流150,其中数据被划分成Z个样本的段158、 159。在段158、 159中的每一个样本均由X个位构成。(对于音频CD/DVD数据,X通常将是16位,或者对于BIu-Ray/HDDVD音频数据,是24位)。最高有效位(Y个第一位,对于例如Blu-Ray,通常是18或者20个位)保持音频数据(能够是PCM音频数据),最低有效位(Q个最后的位,例如对于Blu-Ray ,通常是6或者4位)保持AURO解码数据。
以如下方式地組织在每一个数据块156、 157中如在解码期间使用的AURO另外的数据
它包括同步信号段151、通用解码数据段154、可选地索引列表152和误差表格153,并且最后是CRC数值155。
同步信号部分151被预定义成滚动位模式(尺寸依赖于用于AURO数据宽度的Q位数目)。通用数据154包括有关AURO数据块的长度的信息,须在其上应用AURO解码数据156的第一音频(PCM)数据158的准确偏移(相对于同步信号位置151),第一音频(PCM)数据样本(对于每一个通道编码存在一个)的拷贝,衰减数据和其它数据。可选地(根据在编码过程期间的AURO质量选择),这个AURO解码数据156、 157也可以包括索引列表152和保持在编码步骤期间产生的所有误差近似的误差表格153。此外,也可选地,索引列表152和误差表格153可被压缩。通用解码数据段154将指示这种索引列表152和误差表格153是否存在,包括有关所应用的压缩的信息。最后,CRC数值155是使用音频PCM数据(Y位)和AURO数据(Q位)这两者计算的CRC。
AURO解码器的一个特征在于它的极低等待时间。解码仅需2个AURO ( PCM )样本的处理延迟。必须在传输AURO解码数据需:波应用到其中的PCM音频数据158之前传输和处理(例如解压缩)AURO数据块156、 157信息。结果,AURO数据块156、 157 (最低有效位)被与音频PCM数据159 (最高有效位)融合使得来自 一个块的最后的AURO数据信息154、 155总是不晚于AURO数据信息被应用于其中的第一 (PCM)音频数据样本。
执行通道的解混音操作的解码器使用同步信号模式以允许它定位例如副本样本并且将它们关联到匹配初始样本。对于每个样本,这些同步信号模式也能够被置于6 (X)位中,并且应该是能够被解码器容易探测到的。"sync(同步信号)"模式能够是几个6(X)位长"keys(密钥),,的序列的重复模式。例如,通过使得单一位从最低有效位置移位到最高有效位置,或者二进制3皮表示成000001, 000010, 000100, 001000, 010000, 100000。能够基于样本的特征选择其它位
模式从而避免该同步信号模式以可感知方式影响样本,或者该样本影 响同步信号模式探测。这样,能够对于所有不同的样本分辨率组合
(24/22/2, 24/20/4/, 24/18/6, 24/16/8, 16/14/2...)定义一致的同步 信号模式。这些模式还能够被优化以消除当被不使用这种 AURO-Phonic解码器的DVD-播放器播放时从音频样本的最低有效 位产生的"噪音"。
图16示出一种情形,其中适配导致可变长度AURO数据块。进
一步要求解码器在它处理混音音频样本之前接收数据块的信息,这是 因为,它必须解码数据块(包括解压缩)并且需要访问这些(近似) 误差从而执行解混音操作。将利用包含近似的表格和参考列表对误差 流样本(从那个第2"块)近似(使用K-中值或者Facility Location 设施定位算法)以将那个误差流段的每一个样本关联到那个近似表格 的一个元素。这个参考列表构成近似误差流。这个列表和具有近似数 值的表格均被压缩器压缩,数据结构的其它剩余元素由格式化器定义 (如同步信号模式、数据块长度、偏移、副本音频样本、衰减等。) 从而(极有可能地)将以少于U的数据样本结束,我们将该样本数目 称为W(W<=U)。可以预期数值W通常比U小20%到50%。接着, 这个数据块被格式化器置于第一 U个样本的数据空间中。这保证了在 它接收到匹配音频样本之前解码器将能够使用这些数据样本。因为我 们可以已经节约了 (U-W)个数据样本以便以后的使用,所以将被编 码(这是混音和误差近似)的下一个音频段应该仅仅包含W个音频 样本(<=U)。即便用于这个段(W个音频样本的)的数据块应该要 求U个数据样本,也保证了在它参考的第 一音频样本之前终结这个数 据块。进而,因为更小数目音频样本(W<=U),所以我们可以预期 对于样本频率降低误差的近似是更好的,这是因为必须近似更小数目 的误差数值。这样,由音频样本的下一个段的更好近似来使用压缩增 益。再次地,数据块的这个最后的段能够小于U,例如W'(《U)从而下一个将被编码的音频样本的数目能够进而也被限制为w'。
进一步应该理解,根据压缩质量,数据块的尺寸将改变。因此, 偏移参数(数据块结构的一个部分)是用于将尺寸变化的数据块关联 到相应的第一音频样本的重要参数。从已经利用偏移参数而被关联到 数据块的第一音频样本开始,数据块自身的长度匹配在解码期间需要 的音频样本的数目。当在特定情形中解码器相对于它接收到第一匹配 音频样本的瞬时可能需要更多时间开始数据块解码时,如果需要则甚 至可以加上这个偏移参数(并且数据块在时间上更加向后地移位)。 进一步应该理解,解码器应该至少实时地执行数据块解码,这是因为 这种延迟可以不增加。
本发明的另 一个特征在于,解码器将容易地停留在带有同步信号 参考的同步信号中并且进而自动地探测已被使用的编码格式(探测被 用于同步信号模式/样本副本的音频样本的位数)。至此,我们作为编 码数据的一个部分在同步信号模式的每一个第一字之间包括样本数
目。我们还要求同步信号模式在至多4096 x 2 (2=混音通道数目)个 样本之后重复。这将数据块(同步信号模式+样本副本数据)的最大 长度降至4096 x 2个样本,从而要求12个位来存储每一个数据块的 这个长度。使用这个信息,并且给定不同编码分辨率例如对于24位 PCM样本22/2, 20/4, 18/6, 16/8,解码器应该能够容易地自动识 别编码格式,探测同步信号模式及其重复。
由样本的较低有效位形成的数据区域中嵌入辅助数据能够与组 合/分离机构独立地使用。同样在单一音频流中,能够产生这个数据区 域而不在听觉上影响辅助数据被嵌入其中的信号。如果没有进行任何 组合,对由于样本频率降低(样本等化)引起的误差嵌入误差近似仍 然是有益的,这是因为它也允许降低样本频率(因此节约存储空间), 仍允许如解释的那样使用误差近似良好地重构初始信号以应对样本 频率降低的影响。
图17示出包括所有的实施例改进的编码。
所示的框对应于方法步骤并且同等地对应于编码器的硬件块并且示出在硬件块之间的以及在方法步骤之间的数据流。 编码处理步骤。
在第一步骤中,首先通过舍入(rounding)音频样本(24—18/6 ) 将音频流A, B降至A,, B,。
在第二步骤中,在这些流上应用动态压缩而预混音(使用衰减数 据)已被降低的流以避免音频限幅(A'、 B'c)。
在第三步骤中,以等于混音通道(A'c', B'c')数目的因子降低 样本频率从而引入误差流E。在第四步骤中,利用E'近似误差流E: 使用2(z-"个中心(例如K-中值近似)和用于这些中心的参考列表。
在第五步骤中,表格和参考被压缩,定义了采样衰减(音频样本 开始),块头(同步信号,长度......,crc)。在第六步骤中,流(A,c,,
B'c', E,)被混音,包括最终对于限幅(音频过冲)进行检查,这个 检查可能要求微小变化。在第七步骤中,数据块段(6位样本)与音 频才羊本融合。
图17给出如在前面部分中解释的处理步骤组合的概略示意。应 该理解,当在离线状况中应用时,这个编码过程最容易工作,编码器 能够访问它必须在任何时候处理的所有的流的相应的部分的样本。所 以,要求音频流的部分至少被暂时地存储在例如硬盘上从而編码器过 程能够搜寻(前后地)以使用它为了处理那个部分而需要的数据。在 图17的解释中,作为实例使用这样一种情形,其中24位样本(X/Y/Z) =(24/18/6 )被划分成18位样本数值和6位数据数值,该6位数据数 值是保持控制数据和种子数值的辅助数据区域的部分。
块长度-为了一般化,将被称作U。
编码过程的第一步骤<1> (如在关于基本技术的部分中解释的) 是通过将每一个样本舍入成它的最接近的18位表示,,而利用样本尺 寸降低器在两个流A161a和流B161b上将样本分辨率例如从24降低 到18位。作为这种舍入的结果的这些流163a、 163b纟皮称作流A,163a 和流B'163b。同时地,利用从输入接收所期望的衰减数值161c的衰 减器控制器来确定衰减。
45第二步骤<2>是利用衰减操纵器在这些流163a, 163b上进行混 音模拟以分析混音是否可能引起限幅(clip)。如果需要在混音之前 衰减一个流163b,在AURO-PHONIC编码的情形中通常是第3维音 频流,则衰减操纵器应该在这个混音模拟中对这个衰减加以考虑。如 果尽管这种衰减,混音两个(96kHz)流163a、 163b仍将产生限幅, 则由衰减操纵器执行的编码过程的这个步骤将执行平滑压缩(朝向限 幅点逐渐地增加音频样本的衰减并且接着逐渐地将其降低)。这个压 缩可以被衰减操纵器应用于流163a、 163b这两者,但是这不是必要 的,因为在一个流163b上的(更多)压缩也能够消除这个限幅。当 :故应用于这些流A'163a和流B'163b时,衰减控制器产生新的流 A'ei65a和流B'ei65b。用于防止限幅的这个衰减的效果将存留于最终 的混音流169中,以及解混音流中。换言之,解码器将不会补偿这个 衰减以产生初始流A'163a或者初始流B'163b,而是它的目标将是产 生A,c165a和B,c165b。在控制这种(Aurophonic )记录期间,如果 需要,记录工程师能够定义衰减水平161c并且经由输入而将其提供 给衰减控制器以控制当被向下混音成2维音频再现时期望的第二流 163b (通常第3维音频流)的衰减。
在下面的步骤<3>中,频率降低器以等于通道混音(A,c', B'c') 的数目的因子降低样本频率,从而引入误差流E167。能够例如如在 图2和3,或者6和7中解释的那样执行频率降低。
在下面的步骤<4>中,利用由误差近似器产生的E'162近似误差 流E167:使用2(z")个中心(例如K-中值近似)和用于这些中心的 参考列表。
在高级编码/解码部分中,解释了在能够无误差地近似这个误差 流167的条件下,在混音和解混音操作中的误差167 (由于样本频率 降低)能够得以避免。在这个具体实例(X/Y/Z) = ( 24/18/6 )和V=32 (2""))近似中,很有可能的是,当我们在数据块中仅仅具有V个 样本时,不存在任何误差(除了由于误差的12位表示引起的限制), 从而存在这些谟差到这些"近似" --映射。在另一方面,我们还定义了数据块的最大长度u,这在任何情况下将保证在这种数据块中误
差参考列表和近似表格将是"能够被编码的"。因此这个编码步骤将起
初地从两个流A'e'165a和B'e'165b并且从误差流E167要求数目为U 的样本。
首先,选择误差样本的宽度(这是用于代表这个误差信息的位 数)。因为基本流是来自音频记录的PCM数据,所以可以预期在2 个相邻样本之间的误差或者差异与最大(或者最小)样本相比是较小 的。对于(例如)96kHz音频信号,仅当音频流含有具有非常高的频 率的信号时,这个误差才能够是较大的。如之前解释的那样,在本说 明中,使用24位PCM流,对于每一样本被降低成用于音频的18个 位并且产生用于6个数据位的空间。如在基本技术中解释的那样,使 用这些数据位以存储同步信号模式、数据块的长度、偏移、将被确定 的参数、2个副本样本(当混音2个通道时),被压缩的"误差索引列 表"、被压缩的误差表格和校验和。将在下面解释"误差索引列表"和 误差表格。在24/18/6的实例中,每样本6个位可用于辅助数据区域 并且每样本6个位根据需要在理论上能够定义具有26=64个误差的表 格。在24/18/6的这个实例中,误差表示将被限制为带符号的2x6位 整数。
带有6位的U个样本的辅助数据区域中的数据块的部分内容 (24/18/6-对于数据块的每一个样本,存在一个音频(混音)样本) 是具有由于这些流的样本频率降低而产生的误差近似的表格。如之前 述及的那样,将使用2个6位数据样本近似误差。因为没有足够的"空 间,,以存储用于每一个误差的近似,所以需要定义尽可能地接近所有 的这些误差的误差,数值的有限数字。接着,产生列表,该列表包括用 于辅助数据区域中的数据块中的误差,流'的每一个元素的对于这些近 似误差的引用。除同步信号、长度、偏移、样本副本等...之外,需要 空间以在数据块中存储具有近似误差'的表格。这个表格能够被压缩, 以限制用于数据块的存储器,并且进而参考列表也能够被压缩。
首先,将探究从误差流近似这些元素的方式。需要被定义的是数目为K的数值,从而流的每一个元素(但通常是在数据块中的数据所 对应的该流的一个部分)能够被与这些数值之一关联并且从而误差总 和(这是误差流的每一个元素与它的最好(最接近)近似数值误差的 绝对差异)尽可能小。能够使用其它"加权,,因子以代替绝对值,例如 这个绝对值的平方或者定义对于感知音频特征加以考虑的定义。从一 系列数值-在此情形中被定义成由于2个混音通道的样本频率降低而 产生的误差发现这样的K个数字被定义成K-中值目标。来自误差流 的元素的組需被聚集,并且需要识别K个中心使得从每一个点到它的 最近中心的距离之和最小。
在文献例如设施定位算法中,类似的问题及其方案也是已知的。 进而,在本文中需要考虑"流化,,方案以及非流化方案。前者将意味着 "编码器,,对于从寿命音频流混音产生的寿命(和实时)误差仅仅具有
一次和一遍访问。后者(非流化)将意味着编码器对于它要求处理的 数据具有"离线,,和连续访问。由于输出数字数据流(具有18位音频 样本和6位数据的音频PCM流)的结构,来自辅助数据区域的数据 块在它所对应的音频样本之前被发出,产生用于非流化使用K-中值或 者设施定位算法情形的状态。因为在公开文献中很多的这些算法都是 可用的,所以本发明的目的并非定义一种新的数据分组算法,而是作 为用于技术实施人员的方案参考这些算法。例如见Clustering Data Streams: Theory and Practice (分组数据流理论和实践),IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, VOL. 15, NO. 3, 2003年5月/6月。
一旦这K个中心或者误差近似已被确定,便产生列表,其中来 自混音的误差流的L个元素被对于那个表格中的元素的L个参考替 代,从而包含K个近似(或者中心)。因为对于每一个音频样本,数 据的6个位是可用的,所以对于误差流的特定部分能够对于在那个部 分中的所有不同误差定义K=64个不同的近似。然后能够依赖于具有 L个参考的列表的无损压缩,从而在压缩之后最终产生Mx6位数据 样本,和N个"自由"6位数据样本,其中L=M+N。辅助数据区域的自由空间本可被用于存储误差近似以及同步信号模式、数据块的长
度,等。然而,因为在这个具有L个参考的列表中的数值能够是一系 列的真实随机数字,所以不应该依赖于对于这个列表的压缩,而是实 际上保证这个列表是可压缩的。因此,在X/Y/Z的情形中,并且在该 实例中X=24, Y=I8, Z=6,使用不多于32-2(z")个近似。这样,为 了参考这个表格,仅仅需要(Z-l)个位,并且能够容易地证明这种 参考列表是可压缩的;5*6位数据样本能够保持对于这个表格个6个 参考(每一个需要5位)。在24/18/6的情形中,如在基本技术部分 中解释的那样,总共至少需要86个数据样本来存储不包括参考列表 的所有的数据。(6个(6比特)样本用于同步信号,2个(6比特) 样本用于数据块长度,2个(6比特)样本用于偏移,6个(6比特) 样本用于每一个18位的2个音频样本副本,2个(6比特)用于衰减, 将被限定的2个(6比特)数据,至多64个(6比特)样本用于32 个误差近似...如果不可压缩,则2个(6比特)样本用于CRC)。 给定至少将6个压缩成5个的压缩比(给出l个自由数据样本),需 要至多6x86=516个样本。这个总和还为24/18/6的这个模式限定了 最大数据块长度。将近似数目限制为例如16,产生了总共86到54的 降低,至少6个被压缩成4个的参考列表的最小压缩比和3 x 54=162 个数据样本的最大数据块长度。或者,通过将误差宽度延伸到3x6位, 产生了 118个数据样本以存储除了参考列表之外的所有的数据(这将 要求总共708=6 x 118 )。然而,在大多数情形中,因为在上面仅仅考 虑了一种最差的情形,所以进一步压缩这个数据的压缩是现实的;例 如以25% (4位降低到3位)压缩,这是用于误差近似表格的典型压 缩比。对于具有32个误差近似的近似,这个特大比率会将数据块长 度降低超过50%;来自(32)个误差近似的64个数据样本将被降至 48个数据样本,从而总计(不含参考列表)被降至70。进一步,对 于参考列表的另外的20%-25%的压缩,将这个列表从6位压缩到5 位,进一步压缩至4位,从而产生总共具有3x70=210个数据样本的 数据块长度。结果,能够利用对于32个误差近似的参考流近似具有
49由于混音音频流样本降低而产生的210个误差的误差流。
对于具有仅仅16个误差近似的24/18/6的情形,并且采取相当的 压缩比,产生了要求3x46=138个数据样本的误差流。
最后-基于以上实例-但是并不限于这些实例-在这里介绍的压缩 格式使得能够以如此方式近似误差流,使得在混音样本频率被降低的 音频流时,能够对这个近似加以考虑,这将显著地减小由于这个样本 频率降低而引起的误差。使用这些压缩误差近似允许以显著的精度重 构这两个,皮混音的PCM流,从而<吏得由于组合和分离这两个PCM流 而引入的误差很大程度上是觉察不到的。
进一步要求,解码器在它处理混音音频样本之前接收数据块的信 息,因为它必须解码数据块(包括解压缩)并且需要访问这些(近似) 误差从而执行解混音操作。这样,在这个编码步骤的第一阶段中,还 将需要来自流A'"165a和B'e'165b以及来自误差流E167的具有数目 为U的样本(=段)的第二个块。将利用含有V (=32)个12位近似 的表格和参考列表近似(使用K-中值或者设施定位算法)误差流样本 (来自该第2n块),以将这个误差流部分的每一个样本关联到那个近 似表格的元素。这个参考列表构成近似误差流E'162。
在组合步骤<6>中,利用组合器/格式化器混音流(A'", B'e', E')。这个组合器/格式化器包括另外的限幅分析器以关于限幅(音频 过冲)执行最终检查,这个检查可能要求微小的变化。
组合器/格式化器将另外的数据例如衰减,种子数值和误差近似 添加到在由样本尺寸降低器产生的组合数据流中的适当数据块的辅 助数据区域,并且向编码器的输出提供包括組合流的输出流169,与 音频样本融合的数据块部分。
降低将通过限幅而被引入的误差。
本发明的另一个方面在于在被有效地混音之前预处理音频流。当 这些信号被混音到一起时,两个或者更多的流能够产生限幅。在这种 情形中,预处理步骤在被混音通道之一上或者甚至在两个通道上包括 动态音频压缩器/限制器。这能够通过在这些特殊事件之前逐渐地增加衰减,并且在那些事件之后逐渐地降低衰减而得以实现。这个方案将 主要被应用于编码处理器的非流化模式中,这是因为,它要求(提前) 将产生这些过冲/限幅的样本数值。能够在音频流自身上处理这些衰减 并且因此以当被解混音时这些压缩器效果将仍然是解混音流的一个 部分的方式避免限幅。除避免(混音)音频的限幅之外,被向下混音
的3D到2D音频记录必须是当不存在任何解码器(如在本发明中描 述地)时是可使用的。因此,在混音音频流上使用动态音频信号压缩 (或者衰减)以减少过多地干扰基本的2维音频的另外的音频(从第 3维),但是通过存储这些衰减参数,在解混音之后能够执行逆操作 从而恢复正确的信号水平。如上所述,由样本的较低有效位形成的辅 助数据区域的数据块结构含有至少8位的用于保持这个动态音频压缩 参数(衰减)的部分。此外,根据分析(见样本频率降低误差校正), 能够推出,关于具有32个元素和12位误差宽度的误差表格的24/18/6 的典型情形,数据块的最大长度是大致500个样本。在96kHz的采样 速率下,这个部分是大约5毫秒的音频,它因此成为衰减参数的定时 间隔尺寸。衰减数值自身利用8位数值表示,当不同的dB衰减水平 被分配给每一个数值(例如0=OdB, l=(-0.1)dB, 2= (-0.2 ) dB…) 时,能够依赖于这些数值和时间步长以实现平滑的压缩曲线,在解码 操作期间该压缩曲线能够被反向地使用以恢复正确的相对信号水平。
在音频流的较低有效位中存储衰减数值当然也能够被应用于单 一流,其中 一些分辨率位在该情形中被牺牲掉以在流中增加信号的总 体动态范围。可替代地,在混音流中,能够在数据块中存储多个衰减 数值从而每一个数据流均具有相关的衰减数值,因此对于每一个信号 各自地限定回放水平,然而对于每一个信号即使在低信号水平下也保 持分辨率。
另外,衰减参数能够以如此方式用于混音3维音频信息,使得不 使用这些3维音频信息的消费者听不到另外的3维音频信号,这是因 为这个另外的信号相对于主要的2维信号被衰减,同时知道该衰减数 值允许恢复(retrieve )另外的3维信号的解码器将已被衰减的3维信号分量恢复(复原,restore)成它的初始信号水平。通常这要求在将 其混音成2维音频PCM流之前,例如以18dB衰减第3维音频流, 以避免这个音频信息"控制,,"正常,,的音频PCM流。这要求另外的(8 位)参数以定义在它与另一音频流混音之前在第3维音频流上使用的 衰减(对于音频流的每一个部分-被定义成数据块的长度)。在通过 放大第3维音频流解码之后,该18位衰减能够被取消。 图18示出AUROPHONIC编石马器i殳备。
AUROPHONIC编码器设备184包括AURO编码器的多个实例 181、 182、 183,每一个均使用在图1-17中描述的技术混音1个或者 更多音频PCM通道。对于每一个Aurophonic输出通道, 一个AURO 编码器181、 182、 183实例被启动。当提供仅仅l个通道时,没有任 何通道需^^皮混音并且编码器实例应该不#1启动。
Aurophonic编码器184的输入是多个音频(PCM)通道(音频 通道1到音频通道X)。对于每一个通道,附加关于它的位置(3D) 及其当被向下混音成更少的通道时使用的衰减的信息(位置/衰减)。 Aurophonic编码器的其它输入包括决定哪些音频PCM通道被向下混 音成什么Aurophonic输出通道的音频矩阵选择180和被提供给每一 个AURO编码器181、 182、 183的Aurophonic编码器性质指示器。
3D编码器的典型输入通道是L (前左)、Lc (前左中心)、C (前中心)、Rc (前右中心)、R (前右)、LFE (低频率效果)、 Ls (左环绕)、Rs (右环绕)、UL (上前左)、UC (上前中心)、 UR (上前右)、ULs (上左环绕)、URs (上右环绕)、AL (艺术-左)、AR (艺术-右) 。
如由编码器提供并且能够与2D再现格式相兼容的典型输出通道 是AURO國L (left左)(Aurophonic通道1) 、 AURO國C ( center中 心)(Aurophonic通道2 ) 、 AURO-R ( right右)(Aurophonic通 道… )、AURO-Ls (left surround左环绕)(Aurophonic通道...)、 AURO腸Rs (right surround右环绕)(Aurophonic通道...)、 AURO-LFE ( Low Frequency Effects 4氐频效果)(Aurophonic通道Y)。
如由编码器184的输出提供的AURO编码通道的实例 (AURO画L、 AURO-R、 AURO丄s、 AURO画Rs)。
AURO-L可以包含初始L (前左)、UL (前上左)&AL (艺术 -左)PCM音频通道,AURO-R将是类似的但是用于前右音频通道, AURO-Ls保持Ls (左环绕)&ULs (上左环绕)音频PCM通道, AURO-Rs是等价的右通道。
图19示出Aurophonic解码器设备。
AUROPHONIC解码器194包括使用在图5和10中描述的技术 解混音1个或者更多音频PCM通道的、AURO解码器的多个实例191、 192、 193。对于每一个AURO输入通道,AURO解码器191、 192、 193实例被启动。当AURO通道包括仅仅l个音频通道的混音时,解 码器实例应该不^皮启动。
AUROPHONIC解码器的输入接收Aurophonic (PCM)通道 Aurophonic通道I... Aurophonic通道X。对于每一个通道Aurophonic 通道l...Aurophonic通道X,作为解码器的一个部分的辅助数据区域 解码器将自动探测是否存在PCM通道的AURO数据块的同步信号模 式。当探测到一致的同步信号时,AURO解码器191、 192、 193开始 解混音AURO ( PCM)通道的音频部分,并且同时解压缩(如果需要) 索引列表和误差表格,并且将这个校正应用于解混音音频通道。 AURO数据还包括参数如衰减(由解码器予以补偿)和3D位置。3D 位置在音频输出选择部分190中被用于将解混音音频通道重定向到解 码器194的正确输出。用户选择音频输出通道的组。
图20示出根据本发明的解码器。
既然已经解释了本发明的所有方面,解码器能够得以描述,包括 有利的实施例。
用于解码如由本发明获得的信号的解码器200应该优选地自动 地探测"音频,,(例如24位)是否已经根据在先前部分中详述的技术 而4皮编石马。这能够例如利用同步信号(同步)探测器201而被实现,同步信 号探测器201在所接收到的数据流中搜索在较低有效位中的同步模 式。同步信号探测器201具有通过发现同步模式而对于在由样本的较 低有效位形成的辅助数据区域中的数据块同步化的能力。如以上所解 释地,使用同步模式是可选地但是是有利的。同步信号模式能够例如 对于24位样本尺寸是2、 4、 6或者8位(Z-位)宽,和2、 4、 6或 者8个样本长。(2位(比特)LSB=01, 10; 4位:LSB=0001, 0010, 0100, 1000; 6位:000001..., 100000; 8位:OOOOOOOl.", 10000000)。 一旦同步信号探测器201已经发现这些匹配模式中的任何一个,它便 "等待"直至探测到类似的模式。 一旦该模式已被探测到,同步信号探 测器201便进入SYNC-候选-状态。基于所探测到的同步模式,同步 信号探测器201还能够确定每一样本是否2、 4、 6或者8个位被用于 辅助数据区域。
在第2同步信号模式上,解码器200将对数据块进行扫描以解码 块长度,并且利用下一同步信号模式检验在块长度和下一同步信号模 式的起点之间是否存在匹配。如果这两者匹配,则解码器200进入 Sync状态。如果这个测试失败,则解码器200将一直从开始重启它的 同步syncing过程。在解码操作期间,解码器200将总是比较块长度 与在每一个相继同步信号块的始点之间的样本数目。 一旦已经探测到 差异,解码器200便离开Sync状态并且syncing过程必须重新开始。
如在图15和16中解释地,误差校正代码能够被应用于在辅助数 据区域中的数据块以保护所存在的数据。如果误差校正代码块的格式 是已知的,并且辅助数据在误差校正代码块中的位置是已知的,则这 个误差校正代码还能够被用于同步。因此,在图20中,为了方便起 见,同步信号探测器和误差探测器被示为在块201中组合,但是它们 也可以被单独地实现。
误差探测器计算CRC数值(使用来自这个数据块的所有的数据, 除了同步信号)并且将这个CRC数值与在数据块终端处发现的数值 相比较。如果存在失配,则认为解码器处于CRC误差状态中。同步信号探测器向种子数值恢复器202,误差近似恢复器203和 辅助控制器204提供信息,该信息允许种子数值恢复器202、误差近 似恢复器203和辅助控制器204从如从解码器200的输入接收到的辅 助数据区域中提取有关数据。
一旦同步信号探测器与数据块同步信号头同步,种子数值恢复器 便扫描数据块中的数据以确定偏移,即在数据块的终端和第 一副本音 频样本之间的样本数目(这个数目在理论上能够是负的)并且读出这 些副本(音频)样本。
种子数值恢复器202从所接收到的数字数据集的辅助数据区域 恢复一个或者多个种子数值并且将恢复到的种子数值提供给分离器 206。分离器206如在图5和9中解释地使用种子数值(一个或多个) 执行数字数据集的基本分离(unraveling)。这个分离的结果或者是 多个数字数据集,或者是单一数字数据集,其中从组合式数字数据集 移除了一个或者多个数字数据集。这在图20中利用将分离器206连 接到解码器200的输出的三个箭头示意出。
如以上解释地,使用误差近似是可选的,因为如被分离器206 分离的音频已经是非常可接受的,而不用使用误差近似以减小通过由 编码器执行的等化而引入的误差。
如果需要,误差近似恢复器203将解压缩参考列表和近似表格。 如果误差近似将被用于改进被分离的数字数据集(一个或多个),则 分离器206将从误差近似恢复器203接收到的误差近似应用于相应的 数字数据集(一个或多个)并且将所得数字数据集(一个或多个)提 供给解码器的输出。
只要解码器200保持与数据块头同步,误差近似恢复器203便将 继续解压缩参考列表和近似表格,并且将这些数据供应到分离器206 以根据C-A"+B"+E'或者C-E,-A"+B"来解混音已被混音的音频样 本。分离器206使用副本音频样本以开始解混音成A"样本和B"样本。 对于在其中两个数字数据集已被组合的组合式数字数据集,通过加上 E,2i+1来校正与A'w和A"2i+1的那些偶数索引样本匹配的A"2i的偶数索引样本。类似地,通过加上E'2j+i来校正与B'2w和B"2i+2d的那些奇数
索引样本匹配的B"2i+1的奇数索引样本。在第二音频流(B)上应用 逆衰减,并且通过将这些样本向左移位Z位同时在最低有效位侧中充 零,两个音频样本(A,&B')均被转换成它们的初始位宽度。重构样 本作为独立的非关联音频流而被发出。
解码器200的另一可选元件是辅助控制器204。辅助控制器204 从辅助数据区域恢复辅助控制数据以及处理恢复到的辅助控制数据 并且例如以用于控制机械启动器,乐器或者灯的控制数据的形式向解 码器的辅助输出提供结果。
事实上,在解码器仅仅需要提供辅助控制数据,以例如用于以对 应于组合式数字数据集中的音频流的方式控制机械启动器的情形中, 解码器能够被从分离器206,种子数值恢复器202和误差近似恢复器 203去除。
当解码器进入CRC-误差状态时,用户能够限定解码器的行为, 例如他可以希望使得第二输出衰弱成静噪水平,并且一旦解码器从它 的CRC-误差状态恢复,便使得第二输出再次衰弱。另一种行为能够 是将混音信号复现到两个输出,但是在解码器的输出处提供的这些音 频变化应该绝对不会引起不理想的音频坠落(plopping)或者裂化 (cracking )
权利要求
1.一种方法,用于将具有第一尺寸的第一样本(A0,A1,A2,A3,A4,A5,A6,A7,A8,A9)数字数据集(20)和具有第二尺寸的第二样本(B0,B1,B2,B3,B4,B5,B6,B7,B8,B9)数字数据集(30)组合成具有第三尺寸的第三样本(C0,C1,C2,C3,C4,C5,C6,C7,C8,C9)数字数据集(40),该第三尺寸小于该第一尺寸和该第二尺寸之和,所述方法包括以下步骤-将第一数字数据集(20)的第一样本子集(A1,A3,A5,A7,A9)等化成第一数字数据集(20)的第二样本子集(A0,A2,A4,A6,A8)中的相邻样本,其中该第一样本子集(A1,A3,A5,A7,A9)和该第二样本子集(A0,A2,A4,A6,A8)交错,-将第二数字数据集(30)的第三样本子集(B0,B2,B4,B6,B8)等化成第二数字数据集(30)的第四样本子集(B1,B3,B5,B7,B9)中的相邻样本,其中该第三样本子集(B0,B2,B4,B6,B8)和该第四样本子集(B1,B3,B5,B7,B9)交错,其中第四样本子集(B1,B3,B5,B7,B9)和第二样本子集(A0,A2,A4,A6,A8)不具有任何时间相应样本,-通过在时域中将等化的第一数字数据集的样本(A0″,A1″,A2″,A3″,A4″,A5″,A6″,A7″,A8″,A9″)与等化的第二数字数据集的对应样本(B0″,B1″,B2″,B3″,B4″,B5″,B6″,B7″,B8″,B9″)相加而产生第三数字数据集的样本(C0,C1,C2,C3,C4,C5,C6,C7,C8,C9),-在该第三数字数据集(40)中嵌入该第一数字数据集(20)的第一种子样本(A0)和该第二数字数据集(30)的第二种子样本(B1)。
2. 根据权利要求1的方法,其中,笫一数字数据集(20)代表 第一音频信号,第二数字数据集(30)代表第二音频信号,并且第三 数字数据集(40)代表是第一音频信号和第二音频信号的组合的第三音频信号。
3. 根据权利要求2的方法,其中代表第四音频信号的第四数字 数据集被与第一 (20)和第二数字数据集(30)組合成代表笫三音频 信号的第三数字集(40),所述第三音频信号是第一音频信号、第二 音频信号和第四音频信号的組合。
4. 根据权利要求1的方法,其中第一种子样本是第一数字数据 集的第一样本并且第二种子样本是第二数字数据集的第二样本。
5. 根据权利要求1的方法,其中第一种子样本(A。)和第二种 子样本(BJ被嵌入第三数字数据集(40)的样本(Q, d, C2, C3, C4, C5, C6, C7, C8, C9)的较低有效位中。
6. 根据权利要求1的方法,其中在相对于第一种子样本(A0) 的位置确定的位置处嵌入同步模式SYNC。
7. 根据权利要求1的方法,其中,在等化样本的步骤之前,通 过从一组误差近似中选择误差近似而近似样本等化所引起的误差。
8. 根据权利要求7的方法,其中,该组误差近似被索引并且在 通过该误差近似对应的样本的较低有效位形成的辅助数据区域(81) 中嵌入代表该误差近似的索引。
9. 根据权利要求7的方法,其中该组误差近似被索引并且在由 该样本的较低有效位形成的辅助数据区域(81)中的数据块中嵌入代 表该误差近似的索引,该数据块位于该索引所对应的样本前面。
10. 根据权利要求9的方法,其中样本被划分成块并且在包括该索引对应的样本的第二块前面的第一块中的样本中嵌入该索引。
11. 根据权利要求9的方法,其中被嵌入的误差近似数值被压缩。
12. 根据权利要求11的方法,其中在相对于误差数值所对应的 样本具有变化位置的第 一可用位置处嵌入该误差数值。
13. 前面权利要求任何一项的方法,其中未被用于嵌入的、第三 数字数据集的样本的任何较低有效位,被设为预定数值或者被设为 零。
14. 根据权利要求5到13中任何一项的方法,其中所述最低有 效位被进一步用于嵌入控制数据。
15. 根据权利要求14的方法,其中嵌入所述控制数据以控制乐器。
16. 根据权利要求14的方法,其中嵌入所述控制数据以控制光 线发射设备。
17. 根据权利要求14的方法,其中所述控制数据代表在编码或 者解码期间将被应用于第二数字数据集(30)的一个或者多个增益因 子。
18. 根据权利要求14的方法,其中嵌入所述控制数据以控制机 械启动器。
19. 一种方法,用于从利用根据权利要求l的方法获得的第三样 本(C。, d, C2, C3, C4, C5, C6, C7, C8, C9)数字数据集(40)提取第一样本(Ao, An A2, A3, A4, A5, A6, A7, A8, A9)数字数 据集(20)和第二样本(B。, Bp B2, B3, B4, B5, B6, B7, B8, B9) 数字数据集(30),所述方法包括以下步骤-从第三数字数据集(40)恢复第一数字数据集(20)的第一种 子样本(A。)和第二数字数据集(30)的第二种子样本(BJ ,-恢复包括第一样本子集(An A3, A5, A7, A9)和第二样本子 集(An, A2, A4, A6, A8)的第一数字数据集(20)以及包括第三样 本子集(Bn, B2, B4, B6, B8)和第四样本子集(B" B3, Bs, B7, B9)的第二数字数据集(30),这是通过从第三数字数据集(40)的 相应样本减去第一数字数据集(20)的已知样本数值而提取第二数字 数据集(30)的样本(Bn),并且通过从第三数字数据集(31)的相 应样本减去第二数字数据集(30)的已知样本数值而提取第一数字数 据集(20)的样本来进行的,其中第四样本子集(B" B3, B5, B7, B9)和第二样本子集(A。, A2, A4, A6, A8)不具有任何时间相应样 本,其中第一样本子集(An A3, A5, A7, A9)具有等于第二样本子 集(A。, A2, A4, A6, AJ的相邻样本的数值,其中第一样本子集(A" A3, A5, A7, A9)和第二样本子集(A。, A2, A4, A6, A8)交错,其 中第三样本子集(Bo, B2, B4, B6, B8)具有等于第四样本子集(B" B3, B5, B7, B9)的相邻样本的数值,并且其中第三样本子集(B0, B2, B4, B6, B8)和第四样本子集(Bn B3, B5, B7, B9)交错。
20. 根据权利要求19的方法,其中第一数字数据集(20)代表 第一音频信号,第二数字数据集(30)代表第二音频信号,并且第三 数字数据集(31)代表是第一音频信号和第二音频信号的组合的第三 音频信号。
21. 根据权利要求20的方法,其中代表第四音频信号的第四数 字数据集被提取,所述第四数字数据集被与第一和第二数字数据集(20, 30)組合成代表第三音频信号的第三数字集(31),所述第三音频信号是第一音频信号、第二音频信号和第四音频信号的组合。
22. 根据权利要求19的方法,其中第一种子样本是第一数字数 据集的第一样本(AQ)并且笫二种子样本(BJ是第二数字数据集的 第二样本。
23. 根据权利要求19的方法,其中第一种子样本(A。)和第二 种子样本(Bj从第三数字数据集(40)的样本(Q, d, C2, C3, C4, C5, C6, C7, C8, C9)的较低有效位提取。
24. 根据权利要求19的方法,其中同步模式(SYNC)被用于限 定第一种子样本(A。)的位置。
25. 根据权利要求19的方法,其中,在恢复笫一数字数据集的 步骤之后,通过加上恢复误差近似而补偿在编码期间由于样本等化引 起的误差。
26. 根据权利要求25的方法,其中从由第三数字数据集的样本 的较低有效位形成的辅助数据区域(81)恢复误差近似。
27. 根据权利要求26的方法,其中辅助数据区域(81)被划分 成块并且误差近似被嵌入辅助数据区域(81)的在所述误差近似所对 应样本前面的块中。
28. 根据权利要求25、 26或者27的方法,其中所述嵌入误差数 值被压缩。
29. 根据权利要求25、 26或者27的方法,其中利用代表误差近 似的索引代表该组误差近似。
30. 根据权利要求25的方法,其中从相对于所述误差数值所对 应的样本具有变化位置的第 一可用位置恢复所述误差数值。
31. 根据权利要求23到30中任何一项的方法,其中从较低有效 位恢复辅助控制数据。
32. 根据权利要求31的方法,其中提供所述辅助控制数据以控 制乐器。
33. 根据权利要求31的方法,其中提供所述辅助控制数据以控 制光线发射设备或者机械启动器。
34. 根据权利要求31的方法,其中所述辅助控制数据代表将被 应用于第一数字数据集的一个或者多个增益因子。
35. —种编码器(10),被布置成执行根据权利要求1到18中 任何一项的方法,包括画第一等化装置(lla),用于将第一数字数据集(20)的第一样 本子集(A" A3, A5, A7, A9)等化成第一数字数据集(20)的第二 样本子集(A。, A2, A4, A6, A8)中的相邻样本,其中该第一样本子 集(A" A3, A5, A7, A9)和该第二样本子集(A。, A2, A4, A6, A8)交错,-第二等化装置(lib),用于将第二数字数据集(30)的第三样 本子集(B。, B2, B4, B6, B8)等化成第二数字数据集(30)的第四 样本子集(Bp B3, B5, B7, B9)中的相邻样本,其中该第三样本子 集(Bq, B2, B4, B6, B8)和该第四样本子集(Bp B3, B5, B7, B9) 交错,其中第四样本子集(B" B3, B5, B7, b9)和第二样本子集(Ao, A2, A4, A6, A8)不具有任何时间相应样本,-组合器(13),用于通过在时域中将第一数字数据集的样本与 第二数字数据集的对应样本相加而产生第三数字数据集的样本,和-格式化装置(14),用于在该第三数字数据集中嵌入该第一数 字数据集的第一种子样本和该第二数字数据集的第二种子样本。
36. —种数字信号处理设备,包括根据权利要求35的编码器 (10)。
37. 根据权利要求36的数字信号处理设备,其中所述数字信号 处理设备适于记录多通道音频。
38. 根据权利要求37的数字信号处理设备,其中所述数字信号 处理设备适于记录具有第一数目的音频通道的3维音频并且利用^^设 计用于具有第二数目的音频通道的2维音频的格式存储所被记录的3 维音频,所述第二音频通道数目低于所述第一音频通道数目。
39. —种解码器,被布置成执行根据权利要求19到34中任何一 项的方法,包括-种子数值恢复器(202),用于从第三数字数据集(40)恢复笫 一数字数据集(20)的第一种子样本(A。)和第二数字数据集(30) 的第二种子样本(BJ ,-处理器(206 ),用于恢复包括第一样本子集(An A3, A5, A7, A9)和第二样本子集(A。, A2, A4, A6, A8)的第一数字数据集 (20)以及包括第三样本子集(B。, B2, B4, B6, B8)和第四样本子 集(Bn B3, B5, B7, B9)的第二数字数据集(30),包括用于提取 第二数字数据集(30)的样本(Bn)的第一提取器和用于从第三数字 数据集(40)的相应样本减去第一数字数据集(20)的已知样本数值 的第一减法器的第一处理装置,所述处理器进一步包括用于提取第一 数字数据集(20 )的样本的第二提取器和用于从第三数字数据集(31)的相应样本减去第二数字数据集(30 )的已知样本数值的第二减法器, 其中第四样本子集(Bl, B3, B5, B7, B9)和第二样本子集(A。, A2, A4, A6, A8)不具有任何时间相应样本,其中第一样本子集(An A3, A5, A7, A9)具有等于第二样本子集(Ao, A2, A4, A6, A8)的相邻 样本的数值,其中第一样本子集(Ap A3, A5, A7, A9)和第二样本 子集(A0, A2, A4, A6, A8)交错,其中第三样本子集(B0, B2, B4, B6, B8)具有等于第四样本子集(Bn B3, Bs, B7, B9)的相邻样本 的数值,并且其中第三样本子集(Bo, B2, B4, B6, B8)和第四样本 子集(B15 B3, B5, B7, B9)交4晉,以及用于输出所被恢复的第一数字数据集的输出装置。
40. 根据权利要求39的解码器(200 ),其中所述输出装置被布 置成输出代表未从数字数据流恢复的数字数据集的组合的数字数据 集。
41. 一种再现设备,包括根据权利要求39的解码器(200 )。
42. 根据权利要求41的再现设备,其中所述再现设备适于再现 多通道音频。
43. 根据权利要求42的再现设备,其中所述多通道音频是以被 设计用于2维音频的格式存储的3维音频,其中所述3维音频具有第 一音频通道数目并且所述2维音频具有低于所述第 一音频通道数目的 第二音频通道数目。
44. 根据权利要求42的再现设备,其中所述多通道音频是以被 设计用于2通道音频的格式存储的2维音频,其中所述2维音频具有 数目高于两个的音频通道。
45. 根据权利要求41, 42, 43或者44的再现设备,其中所述再 现设备能够在立体声再现和多通道音频再现之间切换。
46. —种具有乘客厢的车辆,所述乘客厢包括根据权利要求41、 42、 43、 44或者45的再现设备,所述再现装备包括用于带有音频信 息的数据载体的读出器和放大器。
47. 根据权利要求46的车辆,包括在乘客厢中位于不同高度处 的扬声器,由此利用从数据载体上的音频信息由解码器恢复的不同音 频通道驱动每一个扬声器。
48. 根据权利要求47的车辆,其中在高于仪表板处定位所述至 少一个扬声器。
49. 一种记录介质,包括利用根据权利要求1到18中任何一项 的方法获得的数字数据集。
50. —种计算机程序,包括当在为计算机程序执行提供适当环境 的计算机上执行时,用于执行根据权利要求1到34中任何一项的方 法的代码装置。
全文摘要
本发明涉及用于组合数字数据集的方法和编码器、用于这种组合式数字数据集的解码方法和解码器以及用于存储这种组合式数字数据集的记录载体。其中,通过将第一样本子集等化成与第一样本子集交错的来自第二子集的相邻样本并且通过随后将来自两个数字数据集的相应样本相加而组合两个数字数据集,其中该两个数字数据集的等化样本并不时间对应。这产生了允许分离该两个数字数据集的第三数字数据集。当将两个数字音频流组合成单一数字音频流时,该第三数字数据集仍然是该两个组合数字音频流的良好的单音表示并且因此能够被在普通再现装备上再现,然后使用根据本发明的解码器允许将该两个数字数据集从该第三数字数据集分离。
文档编号H04S3/00GK101641970SQ200780046045
公开日2010年2月3日 申请日期2007年10月15日 优先权日2006年10月13日
发明者吉多·范登·贝格, 维尔弗里德·万·巴埃伦 申请人:银河工作室股份有限公司;吉多·范登·贝格;维尔弗里德·万·巴埃伦