音频通道空间转换的制作方法

文档序号：8514910阅读：909来源：国知局

音频通道空间转换的制作方法
【专利说明】
[0001] 本申请是申请号为200980151223. 5、申请日为2009年12月16日、发明名称为"音频通道空间转换"的发明专利申请的分案申请。
[0002] 相关申请的交叉引用
[0003] 本申请要求在2008年12月18日提交的美国专利临时申请No. 61/138823的优先权，在此并入其全部内容作为参考。
技术领域
[0004] 本发明设及音频信号处理。更特别地，本发明设及将表示声场的多个音频输入通道转换成表示同一声场的一个或多个音频输出通道，其中，各通道是表示从某方向到达的音频的单个音频流。
【背景技术】
[0005] 虽然人只有两个耳朵，但是我们依赖于诸如头相关传递函数（HRT巧和头移动的多个局部提示作为=维实体收听声音。因此，完全保真声音再现需要完全3D声场的保持和再现或者至少其知觉提示。不幸的是，声音记录技术不面向3D声场的捕获、不面向声音的 2D平面的捕获，甚至不面向声音的1D线的捕获。当前的声音记录技术严格地面向音频的零维度、离散通道的捕获、保存和呈现。
[0006] 自从爱迪生的声音记录的原创发明W来对于提高保真度的大多数努力着眼于改善他的原始模拟调制沟槽圆柱/盘介质的缺点。该些缺点包含有限的、不均匀的频率响应、噪声、失真、变音、颤振、速度精度、磨损、灰尘和复制产生损失。虽然存在多个零星的对于孤立的改善的尝试（包含电子放大、带记录、噪声减少和成本高于一些汽车的记录播放器），但是，个体通道质量的传统问题没有被最终解决，直到卓越的总体数字记录的开发，特别是音频光盘的引入。从那里起，除了进一步将数字记录的质量扩展到24位/96曲Z采样的一些努力之外，音频再现研究的主要努力着眼于主要通过使用知觉编码器减少保持个别通道质量所需要的数据量W及增加空间保真度。后一种问题是本文件的主题。
[0007] 提高空间保真度的努力沿两个前沿进展；尝试传输全声场的知觉提示，W及尝试传输对于实际原声场的近似。使用前一种方法的系统的例子包含双耳记录和基于二扬声器的虚拟环绕声系统。该些系统表现大量的不幸的缺点，特别是在沿一些方向将声音可靠地局部化W及需要使用头戴听筒或固定的单个收听者位置方面。
[0008] 为了向多个收听者呈现空间声音，不管是在客厅还是在诸如电影院的商业场所，唯一可行的替代方案已尝试近似实际原声场。考虑到声音记录的离散通道本质，目前为止的大多数的努力设及可被认为是保守的通道的数量的增加就不令人惊讶了。代表性系统包含早期50年代的盘形单声道=扬声器胶片声带、常规的立体声、60年代的四声道系统、70mm胶片上的五通道离散磁性声带、70年代的使用矩阵的Do化y环绕声、90年代的AC-35. 1通道声音W及最近的Surround-EX6. 1通道声音。"Do化y"、"ProLogic"和 "SurroundEX"是Do化yL油oratoriesLicensingCo巧oration的商标。或多或少地，与单声道呈现相比，该些系统提供增强的空间呈现。但是，混合大量的通道在内容产生器上导致更多的时间和更大的成本代价，并且，得到的感觉典型地是数个散射、离散通道中的一个而不是连续的声场。在美国专利4799260中描述了Do化yProLogic解码的各方面，在此加入其全部内容作为参考。在"DigitalAudioCompressionStandard(AC-3,E-AC-3),Revision B,AdvancedTelevisionSystemsCommittee, 14June2005 中阐述了AC-3 的细节。
[0009] 当声场被表征时，原则上解码器能够对于任何输出扬声器导出最佳信号馈送。该里，被提供给该种解码器的通道将被不同地称为"主要的"、"被传送的"和"被输入的"通道，并且，具有不与输入通道中的一个的位置对应的位置的任何输出通道将被称为"中间"通道。输出通道也可具有与输入通道的位置一致的位置。

【发明内容】

[0010] 编码或下混合
[0011] 根据本发明的编码或下混合方面，一种用于将M个音频输入通道转换至N个音频输出通道的方法，所述M个音频输入通道中的每一个与一空间方向相关联，所述N个音频输出通道中的每一个与一空间方向相关联，其中M和N全部是正整数，M是3或更大，并且 N是3或更大，该方法包括从所述M个音频输入通道导出所述N个音频输出通道，其中所述 M个音频输入通道中的一个或多个与不同于与所述N个音频输出通道中的任一个相关联的空间方向的空间方向相关联，所述M个音频输入通道中的所述一个或多个中的至少一个被映射到所述N个输出通道中的至少=个输出通道的对应集合。该至少=个输出通道的集合可与连续空间方向相关联。N可是5或更大，并且所述导出可将所述M个音频输入通道中的所述一个或多个中的所述至少一个映射到所述N个输出通道中的=个、四个或五个输出通道的对应集合。所述N个输出通道中的至少=个、四个或五个输出通道的集合可与连续空间方向相关联。
[0012] 在具体实施例中，M可至少为6,N可至少为5,并且M个音频输入通道可分别和与和N个音频输出通道相关联的五个空间方向对应的五个空间方向、W及不与所述N个音频输出通道相关联的至少一个空间方向相关联。
[0013] 所述N个音频输出通道中的每一个可与公共平面中的空间方向相关联。M个音频输入通道的相关联空间方向中的至少一个可位于与所述N个音频输出通道相关联的平面上方或者位于所述平面下方。M个音频输入通道的相关联空间方向中的至少一些可相对于基准空间方向改变距离。
[0014] 在具体实施例中，与N个音频输出通道相关联的空间方向可包括左、中屯、、右、左环绕和右环绕。与M个音频输入通道相关联的空间方向可包括左、中屯、、右、左环绕、右环绕、抬高的左前部、抬高的中前部、抬高的右前部、抬高的左环绕、抬高的中屯、环绕和抬高的右环绕。与M个音频输入通道相关联的空间方向可进一步包括抬高的顶部。
[0015] 解码或上混合
[0016] 根据本发明的解码或上混合方面，一种用于将N个音频输入通道转换至M个音频输出通道的方法，所述N个音频输入通道中的每一个与一空间方向相关联，所述M个音频输出通道中的每一个与一空间方向相关联，其中M和N全部是正整数，N是3或更大，并且M是 1或更大，该方法包括从所述N个音频输入通道导出所述M个音频输出通道，其中所述M个音频输出通道中的一个或多个与不同于与所述N个音频输入通道中的任一个相关联的空间方向的空间方向相关联，所述M个音频输出通道中的所述一个或多个中的至少一个被从所述N个输入通道中的至少=个输入通道的对应集合导出。可至少部分地通过近似所述N 个输入通道中的至少=个输入通道的互相关性，从所述N个输入通道中的所述至少=个输入通道的对应集合导出所述M个音频输出通道中的所述一个或多个中的至少一个。近似所述互相关性可包括计算所述N个输入通道中的所述至少=个输入通道中的每一对的公共能量。任何所述对的公共能量可具有最小值。导出的M个音频输出通道的幅值可基于所述 N个输入通道中的所述至少=个输入通道的任一对的公共能量的最低估计幅值。当所述N 个输入通道中的所述至少=个输入通道的任一对的公共能量为零时，导出的M个音频输出通道的幅值可被取为零。
[0017] 可从共享N个输入通道中的公共对的各组N个输入通道导出多个被导出的M个音频输出通道，其中计算公共能量可包括补偿N个输入通道的被共享的公共对的公共能量。
[0018] 所述近似可包括按层级顺序处理多个被导出的M个音频通道，使得每个导出的音频通道可根据由中导出该音频通道的输入通道的数量分级，最大的输入通道的数量具有最高的等级，该近似根据多个被导出的M个音频通道的层级顺序依次处理多个被导出的M个音频通道。
[0019] 计算公共能量可进一步包括补偿与具有较高层级等级的被导出的音频通道有关的N个输入通道的被共享的公共对的公共能量。
[0020] 所述N个输入通道中的至少S个输入通道的集合可与连续空间方向相关联。
[0021]N可是5或更大，并且所述导出可将所述M个音频输入通道中的所述一个或多个中的所述至少一个映射到所述N个输入通道中的=个、四个或五个输入通道的对应集合。所述N个输入通道中的至少=个、四个或五个输入通道的集合可与连续空间方向相关联。
[0022] 在具体实施例中，M可至少为6,N可为5,并且至少六个输出音频输入通道可分别和与和N个音频输入通道相关联的五个空间方向相对应的五个空间方向、W及不与所述N 个音频输入通道相关联的至少一个空间方向相关联。
[0023] 所述N个音频输入通道中的每一个可与公共平面中的空间方向相关联。M个音频输入通道的相关联空间方向中的至少一个可位于与所述N个音频输出通道相关联的平面上方或者位于所述平面下方。M个音频输入通道的相关联空间方向中的至少一些可相对于基准空间方向改变距离。
[0024] 在具体实施例中，与N个音频输出通道相关联的空间方向可包括左、中屯、、右、左环绕和右环绕。与M个音频输出通道相关联的空间方向可包括左、中屯、、右、左环绕、右环绕、抬高的左前部、抬高的中前部、抬高的右前部、抬高的左环绕、抬高的中屯、环绕和抬高的右环绕。与N个音频输入通道相关联的空间方向可进一步包括抬高的顶部。
[0025] 根据本发明的其他方面的第一方面，一种用于将M个音频输入信号转换至N个音频输出信号的方法，所述M个音频输入信号中的每一个与一方向相关联，所述N个音频输出信号中的每一个与一方向相关联，其中N大于M，M为2或更大，并且N是等于3或更大的正整数，该方法包括提供M:N可变矩阵，将M个音频输入信号施加到所述可变矩阵，从所述可变矩阵导出所述N个音频输出信号，并且响应于输入信号控制所述可变矩阵W使得当输入信号高度相关时由输出信号产生的声场在输入信号的标称前进主方向上具有紧凑声音图像，该图像随着相关性降低而从紧凑向宽扩散，并且随着相关性继续降低至高度不相关而逐渐拆分成多个紧凑声音图像，所述多个紧凑声音图像中的每一个位于与一输入图像相关联的方向上。
[0026] 根据本发明的其他方面的此第一方面，该可变矩阵可响应于（1)输入信号的相

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：M·F·戴维斯;
技术所有人：杜比实验室特许公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。