音频通道空间转换的制作方法
【专利说明】
[0001] 本申请是申请号为200980151223. 5、申请日为2009年12月16日、发明名称为"音 频通道空间转换"的发明专利申请的分案申请。
[0002] 相关申请的交叉引用
[0003] 本申请要求在2008年12月18日提交的美国专利临时申请No. 61/138823的优先 权,在此并入其全部内容作为参考。
技术领域
[0004] 本发明设及音频信号处理。更特别地,本发明设及将表示声场的多个音频输入通 道转换成表示同一声场的一个或多个音频输出通道,其中,各通道是表示从某方向到达的 音频的单个音频流。
【背景技术】
[0005] 虽然人只有两个耳朵,但是我们依赖于诸如头相关传递函数(HRT巧和头移动的 多个局部提示作为=维实体收听声音。因此,完全保真声音再现需要完全3D声场的保持和 再现或者至少其知觉提示。不幸的是,声音记录技术不面向3D声场的捕获、不面向声音的 2D平面的捕获,甚至不面向声音的1D线的捕获。当前的声音记录技术严格地面向音频的零 维度、离散通道的捕获、保存和呈现。
[0006] 自从爱迪生的声音记录的原创发明W来对于提高保真度的大多数努力着眼于改 善他的原始模拟调制沟槽圆柱/盘介质的缺点。该些缺点包含有限的、不均匀的频率响应、 噪声、失真、变音、颤振、速度精度、磨损、灰尘和复制产生损失。虽然存在多个零星的对于孤 立的改善的尝试(包含电子放大、带记录、噪声减少和成本高于一些汽车的记录播放器), 但是,个体通道质量的传统问题没有被最终解决,直到卓越的总体数字记录的开发,特别是 音频光盘的引入。从那里起,除了进一步将数字记录的质量扩展到24位/96曲Z采样的一 些努力之外,音频再现研究的主要努力着眼于主要通过使用知觉编码器减少保持个别通道 质量所需要的数据量W及增加空间保真度。后一种问题是本文件的主题。
[0007] 提高空间保真度的努力沿两个前沿进展;尝试传输全声场的知觉提示,W及尝试 传输对于实际原声场的近似。使用前一种方法的系统的例子包含双耳记录和基于二扬声器 的虚拟环绕声系统。该些系统表现大量的不幸的缺点,特别是在沿一些方向将声音可靠地 局部化W及需要使用头戴听筒或固定的单个收听者位置方面。
[0008] 为了向多个收听者呈现空间声音,不管是在客厅还是在诸如电影院的商业场所, 唯一可行的替代方案已尝试近似实际原声场。考虑到声音记录的离散通道本质,目前为 止的大多数的努力设及可被认为是保守的通道的数量的增加就不令人惊讶了。代表性 系统包含早期50年代的盘形单声道=扬声器胶片声带、常规的立体声、60年代的四声道 系统、70mm胶片上的五通道离散磁性声带、70年代的使用矩阵的Do化y环绕声、90年代 的AC-35. 1通道声音W及最近的Surround-EX6. 1通道声音。"Do化y"、"ProLogic"和 "SurroundEX"是Do化yL油oratoriesLicensingCo巧oration的商标。或多或少地,与单 声道呈现相比,该些系统提供增强的空间呈现。但是,混合大量的通道在内容产生器上导致 更多的时间和更大的成本代价,并且,得到的感觉典型地是数个散射、离散通道中的一个而 不是连续的声场。在美国专利4799260中描述了Do化yProLogic解码的各方面,在此加入 其全部内容作为参考。在"DigitalAudioCompressionStandard(AC-3,E-AC-3),Revision B,AdvancedTelevisionSystemsCommittee, 14June2005 中阐述了AC-3 的细节。
[0009] 当声场被表征时,原则上解码器能够对于任何输出扬声器导出最佳信号馈送。该 里,被提供给该种解码器的通道将被不同地称为"主要的"、"被传送的"和"被输入的"通道, 并且,具有不与输入通道中的一个的位置对应的位置的任何输出通道将被称为"中间"通 道。输出通道也可具有与输入通道的位置一致的位置。
【发明内容】
[0010] 编码或下混合
[0011] 根据本发明的编码或下混合方面,一种用于将M个音频输入通道转换至N个音频 输出通道的方法,所述M个音频输入通道中的每一个与一空间方向相关联,所述N个音频 输出通道中的每一个与一空间方向相关联,其中M和N全部是正整数,M是3或更大,并且 N是3或更大,该方法包括从所述M个音频输入通道导出所述N个音频输出通道,其中所述 M个音频输入通道中的一个或多个与不同于与所述N个音频输出通道中的任一个相关联的 空间方向的空间方向相关联,所述M个音频输入通道中的所述一个或多个中的至少一个被 映射到所述N个输出通道中的至少=个输出通道的对应集合。该至少=个输出通道的集合 可与连续空间方向相关联。N可是5或更大,并且所述导出可将所述M个音频输入通道中的 所述一个或多个中的所述至少一个映射到所述N个输出通道中的=个、四个或五个输出通 道的对应集合。所述N个输出通道中的至少=个、四个或五个输出通道的集合可与连续空 间方向相关联。
[0012] 在具体实施例中,M可至少为6,N可至少为5,并且M个音频输入通道可分别和与 和N个音频输出通道相关联的五个空间方向对应的五个空间方向、W及不与所述N个音频 输出通道相关联的至少一个空间方向相关联。
[0013] 所述N个音频输出通道中的每一个可与公共平面中的空间方向相关联。M个音频 输入通道的相关联空间方向中的至少一个可位于与所述N个音频输出通道相关联的平面 上方或者位于所述平面下方。M个音频输入通道的相关联空间方向中的至少一些可相对于 基准空间方向改变距离。
[0014] 在具体实施例中,与N个音频输出通道相关联的空间方向可包括左、中屯、、右、左 环绕和右环绕。与M个音频输入通道相关联的空间方向可包括左、中屯、、右、左环绕、右环 绕、抬高的左前部、抬高的中前部、抬高的右前部、抬高的左环绕、抬高的中屯、环绕和抬高的 右环绕。与M个音频输入通道相关联的空间方向可进一步包括抬高的顶部。
[0015] 解码或上混合
[0016] 根据本发明的解码或上混合方面,一种用于将N个音频输入通道转换至M个音频 输出通道的方法,所述N个音频输入通道中的每一个与一空间方向相关联,所述M个音频输 出通道中的每一个与一空间方向相关联,其中M和N全部是正整数,N是3或更大,并且M是 1或更大,该方法包括从所述N个音频输入通道导出所述M个音频输出通道,其中所述M个 音频输出通道中的一个或多个与不同于与所述N个音频输入通道中的任一个相关联的空 间方向的空间方向相关联,所述M个音频输出通道中的所述一个或多个中的至少一个被从 所述N个输入通道中的至少=个输入通道的对应集合导出。可至少部分地通过近似所述N 个输入通道中的至少=个输入通道的互相关性,从所述N个输入通道中的所述至少=个输 入通道的对应集合导出所述M个音频输出通道中的所述一个或多个中的至少一个。近似所 述互相关性可包括计算所述N个输入通道中的所述至少=个输入通道中的每一对的公共 能量。任何所述对的公共能量可具有最小值。导出的M个音频输出通道的幅值可基于所述 N个输入通道中的所述至少=个输入通道的任一对的公共能量的最低估计幅值。当所述N 个输入通道中的所述至少=个输入通道的任一对的公共能量为零时,导出的M个音频输出 通道的幅值可被取为零。
[0017] 可从共享N个输入通道中的公共对的各组N个输入通道导出多个被导出的M个音 频输出通道,其中计算公共能量可包括补偿N个输入通道的被共享的公共对的公共能量。
[0018] 所述近似可包括按层级顺序处理多个被导出的M个音频通道,使得每个导出的音 频通道可根据由中导出该音频通道的输入通道的数量分级,最大的输入通道的数量具有最 高的等级,该近似根据多个被导出的M个音频通道的层级顺序依次处理多个被导出的M个 音频通道。
[0019] 计算公共能量可进一步包括补偿与具有较高层级等级的被导出的音频通道有关 的N个输入通道的被共享的公共对的公共能量。
[0020] 所述N个输入通道中的至少S个输入通道的集合可与连续空间方向相关联。
[0021]N可是5或更大,并且所述导出可将所述M个音频输入通道中的所述一个或多个中 的所述至少一个映射到所述N个输入通道中的=个、四个或五个输入通道的对应集合。所 述N个输入通道中的至少=个、四个或五个输入通道的集合可与连续空间方向相关联。
[0022] 在具体实施例中,M可至少为6,N可为5,并且至少六个输出音频输入通道可分别 和与和N个音频输入通道相关联的五个空间方向相对应的五个空间方向、W及不与所述N 个音频输入通道相关联的至少一个空间方向相关联。
[0023] 所述N个音频输入通道中的每一个可与公共平面中的空间方向相关联。M个音频 输入通道的相关联空间方向中的至少一个可位于与所述N个音频输出通道相关联的平面 上方或者位于所述平面下方。M个音频输入通道的相关联空间方向中的至少一些可相对于 基准空间方向改变距离。
[0024] 在具体实施例中,与N个音频输出通道相关联的空间方向可包括左、中屯、、右、左 环绕和右环绕。与M个音频输出通道相关联的空间方向可包括左、中屯、、右、左环绕、右环 绕、抬高的左前部、抬高的中前部、抬高的右前部、抬高的左环绕、抬高的中屯、环绕和抬高的 右环绕。与N个音频输入通道相关联的空间方向可进一步包括抬高的顶部。
[0025] 根据本发明的其他方面的第一方面,一种用于将M个音频输入信号转换至N个音 频输出信号的方法,所述M个音频输入信号中的每一个与一方向相关联,所述N个音频输出 信号中的每一个与一方向相关联,其中N大于M,M为2或更大,并且N是等于3或更大的正 整数,该方法包括提供M:N可变矩阵,将M个音频输入信号施加到所述可变矩阵,从所述可 变矩阵导出所述N个音频输出信号,并且响应于输入信号控制所述可变矩阵W使得当输入 信号高度相关时由输出信号产生的声场在输入信号的标称前进主方向上具有紧凑声音图 像,该图像随着相关性降低而从紧凑向宽扩散,并且随着相关性继续降低至高度不相关而 逐渐拆分成多个紧凑声音图像,所述多个紧凑声音图像中的每一个位于与一输入图像相关 联的方向上。
[0026] 根据本发明的其他方面的此第一方面,该可变矩阵可响应于(1)输入信号的相