针对任意扬声器布局的音频对象的平移的制作方法_6

文档序号:9673301阅读:来源:国知局
系统1105。接口系统1105可W包括诸如无线网络接口的网络接口。作为替代或者 附加地,接口系统1105可W包括通用串行总线化SB)接口或其他运样的接口。
[0142] 音频处理系统1100包括逻辑系统1110。逻辑系统1110可W包括处理器,诸如通用 单忍片或多忍片处理器。逻辑系统1110可W包括数字信号处理器(DSP)、专用集成电路 (ASIC)、现场可编程口阵列(FPGA)或其它可编程逻辑器件、分立的口或晶体管逻辑、分立的 硬件组件、和/或其组合。逻辑系统1110可W被配置成控制音频处理系统1100的其它组件。 尽管在图11中示出了音频处理系统1100的组件之间没有接口,但逻辑系统1110可W被配置 成具有与其他组件通信的接口。适宜地,其他组件可W被配置为或可W不被配置为相互通 信。
[0143]逻辑系统1110可W被配置成执行音频处理功能,包括但不限于本文中描述的那些 类型的功能。在一些运样的实现中,逻辑系统1110可W被配置成根据一个或多个非暂态介 质中存储的软件进行操作(至少部分)。非暂态介质可W包括与逻辑系统1110相关联的存储 器,诸如随机存取存储器(RAM)和/或只读存储器(ROM)。非暂态介质可W包括存储系统1115 的存储器。存储系统1115可W包括一种或多种合适类型的非暂态存储介质,诸如闪存存储 器、硬盘驱动等。
[0144] 根据音频处理系统1100的表现形式,显示系统1130可W包括一种或多种合适类型 的显示器。例如,显示系统1130可W包括液晶显示器、等离子体显示器、双稳态显示器等。
[0145]用户输入系统1135可W包括被配置成从用户接受输入的一个或多个装置。在一些 实现中,用户输入系统1135可W包括覆在显示系统1130的显示器上的触摸屏。用户输入系 统1135可W包括鼠标、跟踪球、姿势检测系统、操纵杆、在显示系统1130上呈现的一个或多 个GUI和/或菜单、按钮、键盘、开关等。在一些实现中,用户输入系统1135可W包括麦克风 1125:用户可W借助麦克风1125提供针对音频处理系统1100的语音命令。逻辑系统可W被 配置用于识别语音并且根据运些语音命令控制音频处理系统1100的至少一些操作。在一些 实现中,用户输入系统1135可W被认为是用户接口,因此被认为是接口系统1105的部分。
[0146] 电源系统1140可W包括诸如裡-儒电池或裡离子电池的一个或多个合适的能量存 储装置。电源系统1140可W被配置成从电插座接收电力。
[0147] 对于本领域的普通技术人员,可W容易地明白本公开中描述的实现的各种修改形 式。在不脱离本公开的精神或范围的情况下,本文中定义的总体原理可W应用于其它实现。 因此,权利要求书不意图限于本文中示出的实现,而是应被给予与本公开、本文中公开的原 理和新颖特征一致的最广范围。
【主权项】
1. 一种方法,所述方法包括: 接收包括N个音频对象的音频数据,音频对象包括音频信号和相关联的元数据,所述元 数据至少包括音频对象位置数据;以及 执行用于从所述N个音频对象产生Μ个群集的音频对象集群过程,Μ是小于N的数,其中, 所述集群过程包括: 选择Μ个代表性音频对象; 根据所述Μ个代表性音频对象中的每一个的音频对象位置数据来确定所述Μ个群集中 的每一个的群集质心位置,各群集质心位置是代表与群集关联的所有音频对象的位置的单 个位置;以及 确定所述Ν个音频对象中的每一个的音频信号对于所述Μ个群集中的至少一个的增益 贡献,其中,确定增益贡献包含: 确定作为群集质心位置和分派给各群集的增益的函数的响度中心位置;以及 确定成本函数的最小值,所述成本函数的第一项代表响度中心位置和音频对象位置之 间的差异。2. 根据权利要求1所述的方法,其中,确定响度中心位置包含借助加权过程对群集质心 位置进行组合,在加权过程中,赋予群集质心位置的权重对应于分派给群集质心位置的增 益。3. 根据权利要求1或权利要求2所述的方法,其中,确定响度中心位置包含: 确定各群集质心位置和分派给各群集质心位置的增益的乘积; 计算乘积之和; 确定所有群集质心位置的增益之和;以及 将乘积之和除以增益之和。4. 根据权利要求1至3中的任一项所述的方法,其中,所述成本函数的第二项代表对象 位置和群集质心位置之间的距离。5. 根据权利要求4所述的方法,其中,所述成本函数的第二项与音频对象位置和群集质 心位置之间的距离的平方成比例。6. 根据权利要求4或权利要求5所述的方法,其中,所述成本函数的第三项设置所确定 的增益贡献的尺度。7. 根据权利要求1至6中的任一项所述的方法,其中,所述成本函数是分派给各群集的 增益的二次函数。8. 根据权利要求1至7中的任一项所述的方法,还包括根据对应群集中的音频对象的增 益贡献来修正至少一个群集质心位置。9. 根据权利要求1至8中的任一项所述的方法,其中,至少一个群集质心位置是随时间 变化的。10. -种方法,所述方法包括: 接收包括Ν个音频对象的音频数据,音频对象包括音频信号和相关联的元数据,所述元 数据至少包括音频对象位置数据;以及 确定所述Ν个音频对象中的每一个的音频信号对于Μ个扬声器中的至少一个的增益贡 献,其中,确定增益贡献包含: 确定作为扬声器位置和分派给各扬声器的增益的函数的响度中心位置;以及 确定成本函数的最小值,所述成本函数的第一项代表响度中心位置和音频对象位置之 间的差异。11. 根据权利要求10所述的方法,其中,确定响度中心位置包含借助加权过程对扬声器 位置进行组合,在加权过程中,赋予扬声器位置的权重对应于分派给扬声器位置的增益。12. 根据权利要求10或权利要求11所述的方法,其中,确定响度中心位置包含: 确定各扬声器位置和分派给各对应扬声器的增益的乘积; 计算乘积之和; 确定所有扬声器的增益之和;以及 将乘积之和除以增益之和。13. 根据权利要求10至12中的任一项所述的方法,其中,所述成本函数的第二项代表音 频对象位置和扬声器位置之间的距离。14. 根据权利要求13所述的方法,其中,所述成本函数的第二项与音频对象位置和扬声 器位置之间的距离的平方成比例。15. 根据权利要求13或权利要求14所述的方法,其中,所述成本函数的第三项设置所确 定的增益贡献的尺度。16. 根据权利要求9至14中的任一项所述的方法,其中,所述成本函数是分派给各扬声 器的增益的二次函数。17. -种非暂态介质,在所述非暂态介质上存储有软件,所述软件包括用于控制至少一 个设备执行根据权利要求1至16中的任一项所述的方法的指令。18. -种设备,所述设备包括: 接口系统;以及 逻辑系统,所述逻辑系统适于执行根据权利要求1至16中的任一项所述的方法。19. 一种设备,所述设备包括: 接口系统;以及 逻辑系统,所述逻辑系统能够: 通过所述接口系统接收包括N个音频对象的音频数据,音频对象包括音频信号和相关 联的元数据,所述元数据至少包括音频对象位置数据;以及 确定所述N个音频对象中的每一个的音频信号对于Μ个扬声器中的至少一个的增益贡 献,其中,确定增益贡献包含: 确定作为扬声器位置和分派给各扬声器的增益的函数的响度中心位置;以及 确定成本函数的最小值,所述成本函数的第一项代表响度中心位置和音频对象位置之 间的差异。20. 根据权利要求19所述的设备,其中,确定响度中心位置包含借助加权过程对扬声器 位置进行组合,在加权过程中,赋予扬声器位置的权重对应于分派给扬声器位置的增益。21. -种设备,所述设备包括: 接口系统;以及 逻辑系统,所述逻辑系统能够: 通过所述接口系统接收包括Ν个音频对象的音频数据,音频对象包括音频信号和相关 联的元数据,所述元数据至少包括音频对象位置数据;以及 执行用于从所述N个音频对象产生Μ个群集的音频对象集群过程,Μ是小于N的数,其中, 所述集群过程包括: 选择Μ个代表性音频对象; 根据所述Μ个代表性音频对象中的每一个的音频对象位置数据来确定所述Μ个群集中 的每一个的群集质心位置,各群集质心位置是代表与群集关联的所有音频对象的位置的单 个位置;以及 确定所述Ν个音频对象中的每一个的音频信号对于所述Μ个群集中的至少一个的增益 贡献,其中,确定增益贡献包含: 确定作为群集质心位置和分派给各群集的增益的函数的响度中心位置;以及 确定成本函数的最小值,所述成本函数的第一项代表响度中心位置和音频对象位置之 间的差异。22. 根据权利要求21所述的设备,确定响度中心位置包含借助加权过程对群集质心位 置进行加权,在加权过程中,赋予群集质心位置的权重对应于分派给所述群集质心位置的 增益。23. 根据权利要求19至22中的任一项所述的设备,其中,所述成本函数的第二项代表对 象位置和扬声器位置或群集质心位置之间的距离。24. 根据权利要求23所述的设备,其中,所述成本函数的第二项与音频对象位置和扬声 器位置或群集质心位置之间的距离的平方成比例。25. 根据权利要求23或权利要求24所述的设备,其中,所述成本函数的第三项设置所确 定的增益贡献的尺度。26. 根据权利要求21至25中的任一项所述的设备,其中,至少一个群集质心位置是随时 间变化的。27. 根据权利要求19至26中的任一项所述的设备,其中,所述成本函数是分派给各扬声 器或群集的增益的二次函数。28. 根据权利要求19至27中的任一项所述的设备,还包括存储设备,其中,所述接口包 括所述逻辑系统和所述存储设备之间的接口。29. 根据权利要求19至28中的任一项所述的设备,其中,所述接口包括网络接口。30. 根据权利要求19至29中的任一项所述的设备,其中,所述逻辑系统包括选自由通用 单芯片或多芯片处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列 (FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件组成的元件组中 的至少一个元件。
【专利摘要】可以确定N个音频对象中的每一个的音频信号对于M个扬声器中的至少一个的增益贡献。确定增益贡献可以包含确定作为扬声器(或者群集)位置和分派给各扬声器(或者群集)的增益的函数的响度中心位置。确定增益贡献还可以包含确定成本函数的最小值。成本函数的第一项可以代表响度中心位置和音频对象位置之间的差异。
【IPC分类】H04S7/00
【公开号】CN105432098
【申请号】CN201480042832
【发明人】A·玛蒂奥斯索尔, G·圣高尔, D·杰洛恩-布里巴特, N·R·茨恩高斯
【申请人】杜比国际公司, 杜比实验室特许公司
【公开日】2016年3月23日
【申请日】2014年6月17日
【公告号】EP3028476A1, US20160212559, WO2015017037A1
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1