个性化三维音频的制作方法

文档序号:39545358发布日期:2024-09-30 13:08阅读:13来源:国知局
个性化三维音频的制作方法

所公开的实施方案总体上涉及计算机软件和音频工程,并且更具体地涉及个性化三维音频。


背景技术:

1、人类听觉系统执行称为“声音定位”的生物过程,以识别声音在三维(3d)空间中的来源。在执行声音定位时,普通人的听觉系统会分析给定声音的不同特性,包括压力水平、到达时间和频率等,并将这些特性的变化解释为表明声音源自的特定3d位置。例如,假设特定声音在人的左耳处的压力水平比在人的右耳处的该声音的压力水平更大。人的听觉系统会将压力水平的变化解释为表明声音源自人左侧的位置。

2、通常,声音定位取决于生理机能。例如,假设某个人的外耳具有特定的形状,所述形状会衰减源自该人身后的声音中的某些频率,但不会衰减源自该人前方的声音中的那些频率。当执行相对于给定声音的声音定位时,人的听觉系统会将声音中这些频率的存在解释为表明声音源自人前方的位置。相反,人的听觉系统会将声音中没有这些频率解释为表明声音源自人身后的位置。一般来说,声音定位是一个复杂的过程,涉及多种不同的机制。

3、在音频工程领域,已经开发了各种信号处理算法,这些算法依赖于上述不同的声音定位机制,以便合成似乎源自任意3d位置的声音。这些类型的信号处理算法通常实施头部相关传递函数(hrtf)。对于给定的用户,hrtf描述了当这些声音源自不同位置时,用户的物理属性如何引起声音的不同特性发生变化。例如,给定的hrtf可以表明用户的外耳在一个或多个频率中引起可预测的衰减,如以上示例所示。hrtf和对应的信号处理算法可用于沉浸式纯音频娱乐环境以及另外视听娱乐环境,以便使得用户将视频元素生成的声音感知为源自与这些元素对应的空间位置。使用户以所描述的方式感知声音通常被称为“3d音频”。在视频娱乐中实施3d音频可以增加沉浸感和用户参与度,尤其是在视频游戏环境中。

4、为了为给定用户实施准确的3d音频,必须确定用户的hrtf。用于确定给定用户的hrtf的各种技术在本领域中是已知的。一种用于为给定用户确定hrtf的技术包括将用户置于消声室中,并且然后执行各种声学测试,所述声学测试包括在用户处测量源自不同位置的声音变化。然而,这种技术需要用户访问专门的设施,并且因此对于庞大的消费者群来说,在大规模上执行是不可行的。

5、如上所述,在本领域中有用的是一种用于生成既准确又能够大规模部署的个性化hrtf的技术。


技术实现思路

1、各种实施方案包括一种用于为用户生成个性化头部相关传递函数(hrtf)的计算机实施的方法,其包括:基于刺激信号和响应信号生成响应数据,其中耳机系统内的第一音频驱动程序向所述用户的第一只耳朵传输所述刺激信号,并且其中响应于所述刺激信号而在所述用户的所述第一只耳朵处捕获所述响应信号;基于所述响应数据生成目标hrtf,其中所述目标hrtf表征所述用户的至少一种物理属性;基于所述响应数据并基于与所述耳机系统相关联的耳机传递函数(hptf)生成逆滤波器;以及基于所述逆滤波器和所述目标hrtf为所述用户生成所述个性化hrtf。

2、所公开的技术相对于现有技术的至少一个技术优势在于,所公开的技术允许为用户生成准确的hrtf,而无需用户亲自访问专门设施参与声学测试。因此,所公开的技术可以部署在面向广泛受众的消费产品中。



技术特征:

1.一种用于为用户生成个性化头部相关传递函数(hrtf)的计算机实施的方法,所述方法包括:

2.根据权利要求1所述的计算机实施的方法,还包括确定与所述用户的耳朵相关联的局部近场hrtf。

3.根据权利要求1所述的计算机实施的方法,其中所述刺激信号包括正弦波扫描。

4.根据权利要求3所述的计算机实施的方法,其中所述正弦波扫描跨一定频率范围和一定振幅范围。

5.根据权利要求1所述的计算机实施的方法,其中确定所述第一hrtf包括:

6.根据权利要求1所述的计算机实施的方法,其中确定所述第一hrtf包括:

7.根据权利要求1所述的计算机实施的方法,其中,所述逆滤波器被配置为减少由所述耳机系统引起的声学伪影。

8.根据权利要求7所述的计算机实施的方法,其中,所述声学伪影是由与耳杯相关联的位置变化或泄漏中的至少一个引起的,其中,所述耳杯包括所述音频驱动程序,并且佩戴在所述用户的耳朵上。

9.根据权利要求1所述的计算机实施的方法,其中,所述响应信号由设置在所述用户的耳朵内部的传声器捕获。

10.如权利要求9所述的计算机实施的方法,其中,所述传声器耦接到所述耳机系统,取代被配置为捕获由用户产生的声音的吊杆传声器。

11.根据权利要求1所述的计算机实施的方法,还包括基于个性化hrtf修改由所述音频驱动程序发出的声音的感知原点。

12.根据权利要求1所述的计算机实施的方法,还包括使用一个或多个传感器捕获所述用户的至少一个物理属性。

13.根据权利要求12所述的计算机实施的方法,其中,基于与图形用户界面的用户交互来确定所述用户的至少一个物理属性。

14.一种存储程序指令的非暂时性计算机可读介质,当所述程序指令被处理器执行时,使得所述处理器通过执行权利要求1至13中任一项所述的方法来为用户生成个性化头部相关传递函数(hrtf)。

15.一种系统,包括:


技术总结
一种耳机系统包括用于与用户执行校准例程的校准传声器。所述校准传声器接收由所述耳机系统发出的刺激信号并且生成响应信号,所述响应信号指示由于所述用户的生理属性而引起的所述刺激信号的变化。基于所述刺激信号和所述响应信号,所述校准引擎生成响应数据。所述校准引擎基于与所述耳机系统相关联的耳机传递函数(HPTF)处理所述响应数据,以便创建可以减少或去除由所述耳机系统引起的声学变化的逆滤波器。所述校准引擎基于所述响应数据和所述逆滤波器为所述用户生成个性化HRTF。所述个性化HRTF可用于实施高度准确的3D音频,并且因此非常适合沉浸式音频和视听娱乐。

技术研发人员:J·莱昂斯,J·里格斯,A·F·弗朗哥
受保护的技术使用者:哈曼国际工业有限公司
技术研发日:
技术公布日:2024/9/29
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1