本公开内容的各方面涉及音频信号处理。
背景技术:
1、以计算机为媒介的现实系统正在被开发以允许计算设备根据由用户所体验的来增强或增加、去除或减去、替代或替换或通常修改现有的现实。举几个示例,以计算机为媒介的现实系统可以包括虚拟现实(vr)系统、增强现实(ar)系统和混合现实(mr)系统等。以计算机为媒介的现实系统的感知的成功通常涉及以下这样的系统的能力:在视频和音频两者方面提供现实沉浸式体验,使得视频和音频体验以由用户认为是自然的和期望的方式来对齐。尽管人类的视觉系统比人类的听觉系统更敏感(例如,在场景内的各种物体的感知的定位方面),确保足够的听觉体验是确保现实沉浸式体验的越来越重要的因素,特别是随着视频体验得到改善以允许使得用户能够更好地识别音频内容的来源的对视频对象的更好的定位。
2、在vr技术中,虚拟的信息可以是使用头戴式显示器来呈现给用户的,使得用户可以在其眼前的屏幕上视觉地体验人工的世界。在ar技术中,现实世界是通过可以叠加(例如,覆加)在现实世界中的物理对象上的视觉对象来增强的。增强可以在现实生活的环境中插入新的视觉对象和/或掩饰视觉对象。在mr技术中,在真实的或合成的/虚拟的与由用户视觉地体验的之间的界限正在变得难以辨别。
3、用于vr、ar和/或mr的硬件可以包括向用户呈现视觉的场景的一个或多个屏幕和用于提供相应的音频环境的一个或多个发出声音的换能器(例如,扬声器)。这样的硬件还可以包括用于捕获用户的声环境和/或用户的讲话的一个或多个麦克风,和/或可以包括用于确定用户的位置、方位和/或移动的一个或多个传感器。
技术实现思路
1、根据通用配置进行音频信号处理的方法包括确定至少一个麦克风信号中的第一音频活动是语音活动;确定语音活动是否是在设备上活动的应用会话中的参与者的语音活动;至少基于确定所述语音活动是否是应用会话中的参与者的语音活动的结果,来生成用于消除第一音频活动的抗噪声信号;以及通过扬声器来产生是基于抗噪声信号的声信号。还公开了包括当由至少一个处理器执行时使得至少一个处理器执行这样的方法的代码的计算机可读存储介质。
2、根据通用配置的装置包括被配置为存储至少一个麦克风信号的存储器;以及耦合到该存储器的处理器。该处理器被配置为取回所述至少一个麦克风信号以及执行用于以下操作的计算机可执行指令:确定所述至少一个麦克风信号中的第一音频活动是语音活动;确定该语音活动是否是在设备上活动的应用会话中的参与者的语音活动;至少基于确定语音活动是否是应用会话中的参与者的语音活动的结果,来生成用于消除第一音频活动的抗噪声信号;以及使得扬声器产生是基于抗噪声信号的声信号。
1.一种用于音频信号处理的装置,所述装置包括:
2.根据权利要求1所述的装置,其中,所述处理器还被配置为执行用于进行以下操作的计算机可执行指令:
3.根据权利要求1所述的装置,其中,所述处理器还被配置为执行用于进行以下操作的计算机可执行指令:
4.根据权利要求3所述的装置,其中,所述处理器还被配置为执行用于响应于至少所述关于所述第二音频活动是所述应用会话中的参与者的语音活动的确定,来决定不消除所述第二音频活动的计算机可执行指令。
5.根据权利要求1所述的装置,其中,所述处理器还被配置为执行用于进行以下操作的计算机可执行指令:
6.根据权利要求1所述的装置,其中,所述处理器还被配置为执行用于进行以下操作的计算机可执行指令:
7.根据权利要求6所述的装置,其中,所述检测模式改变条件是基于脸部识别操作或目光检测操作中的至少一者的结果。
8.根据权利要求6所述的装置,其中,所述检测模式改变条件是基于关键字检测或对位置或方位中的至少一者的改变的检测中的至少一者的结果。
9.根据权利要求1所述的装置,其中,所述处理器还被配置为执行用于进行以下操作的计算机可执行指令:
10.根据权利要求1所述的装置,其中,所述活动的应用会话是游戏应用的会话。
11.根据权利要求1所述的装置,其中,所述确定所述语音活动是否是参与者的语音活动的所述结果是关于所述语音活动是参与者的语音活动的确定,并且
12.根据权利要求11所述的装置,其中,所述上下文指示所述参与者是对手。
13.根据权利要求11所述的装置,其中,所述上下文指示所述参与者的语音当前是禁用的。
14.根据权利要求11所述的装置,其中,所述上下文指示所述参与者处于与另一参与者的隐私模式。
15.根据权利要求11所述的装置,其中,所述上下文指示所述参与者的语音是通过虚拟的屏障来阻止的。
16.根据权利要求1所述的装置,其中,所述活动的应用会话是用于共享虚拟空间的应用的会话。
17.一种音频信号处理的方法,所述方法包括:
18.根据权利要求17所述的方法,其中,所述方法还包括:
19.根据权利要求17所述的方法,其中,所述方法还包括:
20.根据权利要求19所述的方法,其中,所述方法还包括:响应于至少所述确定所述第二音频活动是所述应用会话中的参与者的语音活动,来决定不消除所述第二音频活动。
21.根据权利要求17所述的方法,其中,所述方法还包括:
22.根据权利要求17所述的方法,其中,所述方法还包括:
23.根据权利要求22所述的方法,其中,所述检测模式改变条件是基于脸部识别操作或目光检测操作中的至少一者的结果。
24.根据权利要求22所述的方法,其中,所述检测模式改变条件是基于关键字检测和对位置或方位中的至少一者的改变的检测中的至少一者的结果。
25.根据权利要求17所述的方法,其中,所述方法还包括:
26.根据权利要求17所述的方法,其中,所述活动的应用会话是游戏应用的会话。
27.根据权利要求17所述的方法,其中,所述确定所述语音活动是否是参与者的语音活动的所述结果是关于所述语音活动是参与者的语音活动的确定,以及
28.根据权利要求27所述的方法,其中,所述上下文指示所述参与者是对手。
29.根据权利要求17所述的方法,所述活动的应用会话是用于共享虚拟空间的应用的会话。
30.一种非暂时性计算机可读存储介质,其包括当由至少一个处理器执行时使得所述至少一个处理器执行音频信号处理的方法的代码,所述方法包括: