自动声学切换的制作方法

文档序号：31322696发布日期：2022-08-31 02:56阅读：来源：国知局

技术特征：
1.一种在本地耳机与远程耳机之间进行通信的方法，所述方法包括：由所述本地耳机处理佩戴所述本地耳机的本地通话者的近场语音信号和由所述本地耳机接收的远程通话者的远场语音信号以估计声学参数；基于所估计的声学参数确定所述本地耳机与所述远程通话者佩戴的所述远程耳机之间的通信模式，所述通信模式包括以下中的一者：由所述本地耳机的麦克风捕获所述远场语音信号的声学透明模式、对等射频(rf)模式或电话模式，所述对等rf模式或所述电话模式使用rf信号在本地耳机与所述远程耳机之间进行通信；以及向所述本地耳机的扬声器输出所述声学透明模式下的所述远场语音信号、所述对等rf模式下的基于所述远场语音信号的增强的语音信号，或所述电话模式下的基于所述远场语音信号的电话语音信号。2.根据权利要求1所述的方法，其中所述麦克风包括麦克风阵列。3.根据权利要求1所述的方法，其中确定所述通信模式包括：基于所估计的声学参数生成携载所述远场语音信号的声学信号的可理解性指数，所述远场语音信号由所述本地耳机的麦克风捕获；确定所述可理解性指数是否超过第一可理解性阈值；响应于所述可理解性指数超过所述第一可理解性阈值，将所述声学透明模式确定为所述通信模式；以及在所述声学透明模式下将携载所述远场语音信号的所述声学信号输出到所述本地耳机的所述扬声器。4.根据权利要求3所述的方法，还包括：响应于所述可理解性指数不超过所述第一可理解性阈值，确定所述可理解性指数是否超过第二可理解性阈值；响应于所述可理解性指数超过所述第二可理解性阈值，将所述对等rf模式确定为所述通信模式，其中在所述对等rf模式下，所述本地耳机通过与所述远程耳机的对等rf链路接收携载所述远场语音信号的rf信号；以及响应于所述可理解性指数不超过所述第二可理解性阈值，将所述电话模式确定为所述通信模式，其中在所述电话模式下，所述本地耳机通过与所述远程耳机的网络链路接收携载所述远场语音信号的rf信号。5.根据权利要求4所述的方法，还包括：当所述对等rf模式被确定为所述通信模式时，基于用携载所述远场语音信号的所述rf信号来增强携载所述远场语音信号的所述声学信号而生成所述增强的语音信号。6.根据权利要求5所述的方法，其中生成所述增强的语音信号包括：使用所估计的声学参数生成所述远程通话者的空间化元数据；基于由所述rf信号携载的所述远场语音信号和所述空间化元数据，生成具有在空间上模拟所述远程通话者的水平和到达方向的空间化远场语音信号；以及基于用所述空间化远场语音信号来增强携载所述远场语音信号的所述声学信号以增加所述远场语音信号的信噪比(snr)来生成所述增强的语音信号。7.根据权利要求6所述的方法，其中所述空间化远场语音信号与携载所述远场语音信号的所述声学信号在空间上一致，并且其中所述方法还包括：
基于将所述声学信号与所述空间化远场语音信号在时间上对准来生成所述增强的语音信号。8.根据权利要求1所述的方法，还包括：估计所述远场语音信号的功率谱；以及当所述电话模式被确定为所述通信模式时，生成通过所述远场语音信号的所述功率谱被均衡化的所述电话语音信号。9.根据权利要求1所述的方法，其中处理所述本地通话者的所述近场语音信号和所述远程通话者的所述远场语音信号包括：处理由所述本地耳机从所述远程耳机接收的rf信号以估计所述声学参数，其中所述rf信号包含关于由所述远程耳机声学接收的所述本地通话者的往复远场语音信号的信息。10.根据权利要求9所述的方法，其中关于所述往复远场语音信号的所述信息包括由所述远程耳机估计的往复声学参数。11.根据权利要求1所述的方法，还包括：由所述本地耳机向所述远程耳机传输所估计的声学参数以辅助所述远程耳机确定所述本地耳机与所述远程耳机之间的通信模式。12.根据权利要求1所述的方法，其中所估计的声学参数包括以下中的一者或多者：所述近场语音信号与所述远场语音信号之间的语音水平差或所述语音水平差的变化率；所述远场语音信号的直达分量和混响分量的语音水平的直达混响比(drr)；所述drr的变化率；所述远场语音信号的能量分布量度；所述能量分布量度的变化率；所述近场语音信号的语音水平的变化；所述近场语音信号的所述语音水平的变化率；所述远场语音信号的估计到达方向；所述估计到达方向的变化率；所述远场语音信号的可理解性量度；以及所述可理解性量度的变化率。13.一种本地耳机与远程耳机之间的通信方法，所述方法包括：处理佩戴所述本地耳机的本地通话者的近场语音信号和远程通话者的远场语音信号以估计声学参数，使用所述本地耳机的麦克风将所述远场语音信号捕获为声学信号；基于所述声学参数确定是否用由所述本地耳机从由所述远程通话者佩戴的所述远程耳机接收的rf信号来增强所述声学信号，其中所述rf信号还携载所述远场语音信号；响应于确定增强所述声学信号，由所述本地耳机向所述远程耳机传输信号以指示所述远程耳机使用所述rf信号来传输所述远场语音信号；接收携载所述远场语音信号的所述rf信号；通过处理所述声学信号和在所述rf信号上接收的所述远场语音信号来生成增强的声学信号；以及将所述声学信号或所述增强的声学信号中的一者输出到所述本地耳机的扬声器。
14.根据权利要求13所述的方法，其中确定增强所述声学信号包括：基于所估计的声学参数生成所述声学信号的可理解性指数；确定所述可理解性指数是否下降到低于第一可理解性阈值；以及响应于所述可理解性指数下降到低于所述第一可理解性阈值，确定增强所述声学信号。15.根据权利要求14所述的方法，其中生成所述增强的声学信号包括：使用所述声学参数生成所述远程通话者的空间化元数据；基于在所述rf信号上接收的所述远场语音信号和所述空间化元数据，生成具有在空间上模拟所述远程通话者的水平和到达方向的空间化远场语音信号；将所述声学信号与所述空间化远场语音信号在时间上对准；以及基于用所述空间化远场语音信号来增强所述声学信号以增加所述远场语音信号的信噪比(snr)来生成所述增强的声学信号。16.一种耳机的处理器，所述处理器被配置为执行操作，所述操作包括：处理佩戴所述耳机的本地通话者的近场语音信号和由所述耳机接收的远程通话者的远场语音信号以估计声学参数；基于所估计的声学参数确定所述耳机与所述远程通话者佩戴的远程耳机之间的通信模式，其中所述通信模式包括以下中的一者：由所述耳机的麦克风捕获所述远场语音信号的声学透明模式、对等射频(rf)模式或电话模式，所述对等rf模式或所述电话模式被配置为使用rf信号在本地耳机与所述远程耳机之间进行通信；以及向所述耳机的扬声器输出所述声学透明模式下的所述远场语音信号、所述对等rf模式下的基于所述远场语音信号的增强的语音信号，或所述电话模式下的基于所述远场语音信号的电话语音信号。17.根据权利要求16所述的处理器，其中确定所述通信模式的所述操作包括用于以下的操作：基于所估计的声学参数生成携载所述远场语音信号的声学信号的可理解性指数，所述远场语音信号由所述耳机的麦克风捕获；确定所述可理解性指数是否超过第一可理解性阈值；响应于所述可理解性指数超过所述第一可理解性阈值，将所述声学透明模式确定为所述通信模式；在所述声学透明模式下将携载所述远场语音信号的所述声学信号输出到所述耳机的所述扬声器；响应于所述可理解性指数不超过所述第一可理解性阈值，确定所述可理解性指数是否超过第二可理解性阈值；响应于所述可理解性指数超过所述第二可理解性阈值，将所述对等rf模式确定为所述通信模式，其中在所述对等rf模式下，所述耳机通过与所述远程耳机的对等rf链路接收携载所述远场语音信号的rf信号；以及响应于所述可理解性指数不超过所述第二可理解性阈值，将所述电话模式确定为所述通信模式，其中在所述电话模式下，所述耳机通过与所述远程耳机的网络链路接收携载所述远场语音信号的rf信号。
18.根据权利要求17所述的处理器，其中所述操作还包括：当所述对等rf模式被确定为所述通信模式时，基于用携载所述远场语音信号的所述rf信号来增强携载所述远场语音信号的所述声学信号以增加所述远场语音信号的信噪比(snr)来生成所述增强的语音信号，其中所述增强的语音信号与所述声学信号在空间上一致且时间对准。19.根据权利要求16所述的处理器，其中处理所述本地通话者的所述近场语音信号和所述远程通话者的所述远场语音信号的所述操作包括用于以下的操作：处理由所述耳机从所述远程耳机接收的rf信号以估计所述声学参数，其中所述rf信号包含由所述远程耳机估计的关于由所述远程耳机声学接收的所述本地通话者的往复远场语音信号的往复声学参数。20.一种耳机，所述耳机被配置为执行包括以下的操作：处理佩戴所述耳机的本地通话者的近场语音信号和远程通话者的远场语音信号以估计声学参数，其中所述远场语音信号由所述耳机的麦克风捕获为声学信号；基于所述声学参数确定是否用由所述耳机从由所述远程通话者佩戴的远程耳机接收的rf信号来增强所述声学信号，其中所述rf信号还携载所述远场语音信号；响应于确定增强所述声学信号，向所述远程耳机传输信号以指示所述远程耳机使用所述rf信号来传输所述远场语音信号；接收携载所述远场语音信号的所述rf信号；基于所述声学信号和在所述rf信号上接收的所述远场语音信号来生成增强的声学信号；以及将所述声学信号或所述增强的声学信号中的一者输出到所述耳机的扬声器。

技术总结
本公开涉及自动声学切换。本发明公开了用于仅基于声学分析在可穿戴音频输出设备的通信模式之间自动转换的系统和方法。音频输出设备可以在三种电声模式中的一种电声模式下操作。在透明模式下，音频输出设备可以传递附近用户的语音信号。在对等模式下，音频输出设备可以建立到另一音频输出设备的直接低延时射频(RF)链路。在电话模式下，音频输出设备可以使用联网的电话与另一音频输出设备通信。所公开的方法和系统对音频输出设备的本地佩戴者的近场语音信号和远程通话者的远场语音信号执行声学分析以确定音频输出设备要使用的最佳模式，并且随着佩戴者之间的声学环境改变而在模式之间无缝地转换。在模式之间无缝地转换。在模式之间无缝地转换。

技术研发人员：J
受保护的技术使用者：苹果公司
技术研发日：2022.02.25
技术公布日：2022/8/30

完整全部详细技术资料下载

当前第2页1 2