相关申请案的交叉参考
本申请案主张共同拥有的2014年12月12日申请的第62/091,383号美国临时专利申请案和2015年7月24日申请的第14/808,746号美国非临时专利申请案的优先权,以上申请案的内容明确地以全文引用的方式并入本文中。
背景技术:
当音频输入(例如麦克风)与音频输出(例如扩音器)之间存在声音循环时,发生反馈(或“声学正反馈”)。举例来说,麦克风接收到的信号可放大并从扩音器穿出。来自扩音器的声音可接着再次由麦克风接收、进一步放大,且接着再次通过扩音器穿出。所得声音的频率由麦克风、放大器和扩音器中的共振频率;房间的声学、麦克风和扩音器的定向拾取和发射模式;以及其间的距离决定。对于小公用地址(pa)系统,反馈的声音容易被辨识为大声啸叫、尖叫或嚎叫。
两个人之间的会话在共享声学空间中可能较困难,在共享声学空间中,其它人也在说话,存在其它噪声源(语音和非语音),和/或另外环境的物理局限性使语音难以实现。对于使用麦克风和扩音器的共享声学空间中的两个人之间的通信,反馈可能特定不利。
技术实现要素:
本文所揭示的各种实施方案是针对用于通过消除原本将由扩音器产生的声音信号中的一些或所有部分将共享声学空间中的反馈最大限度地减少为仅由麦克风捕获的串扰消除技术,所述部分将递归地致使这些声音信号在扩音器上再次复制为反馈。若干此类实施方案专门是针对使用包括麦克风和扩音器的布置以及多声道声学处理器(map)的多声道声学系统(mas)中的串扰消除,来一起增强共享声学空间中之间的交谈式语音。为了实现串扰消除,处理器(例如mas中的map)分析每一麦克风的输入,将其与相对于每一此类麦克风较远的扩音器的输出进行比较,且消除麦克风接收到的与仅远扩音器产生的信号匹配的声频信号的任何部分,并仅将其余声音信号(如果存在)发送到此类远扩音器。
各种实施方案是针对通过共享声学空间内的多声道声学系统操作、包括多个麦克风和多个扩音器的多声道声学系统、具有包括至少一第一区域和一第二区域的多个区域的共享声学空间来提供共享声学空间中的串扰消除,其包括:在第一区域中的第一扩音器处,产生第一组声音信号;在第一区域中的第一麦克风处,检测所述第一组声音信号;通过所述第一麦克风,将所述第一组声音信号发送到第一自适应滤波器,作为第一参考声音输出;在所述第一自适应滤波器处,接收所述第二区域中的第二麦克风所检测到的第二组声音信号,所述第二组声音信号包括第二麦克风所检测到的第一组声音信号的分量;在所述第一自适应滤波器处,对所述第二组声音信号进行滤波以消除所述第一组声音信号的包含于所述第二组声音信号中的分量,所述滤波是基于从第一麦克风接收到的第一参考声音输出;通过所述第一自适应滤波器,将所述经滤波的第二组声音信号发送到所述第一扩音器;以及在所述第一扩音器处,产生所述经滤波的第二组声音信号。
各种实施方案还可包括:在第二区域中的第二扩音器处,产生第三组声音信号;在第二麦克风处,检测第三组声音信号;通过第二麦克风,将所述第三组声音信号发送到第二自适应滤波器,作为第二参考声音输出;在第二自适应滤波器处,接收所述第一麦克风所检测到的第四组声音信号,所述第四组声音信号包括所述第一麦克风所检测到的第三组声音信号的分量;在第二自适应滤波器处,对所述第四组声音信号进行滤波,以消除第三组声音信号的包含于第四组声音信号中的分量,所述滤波是基于从第二麦克风接收到的第二参考声音输出;通过第二自适应滤波器将所述经滤波的第四组声音信号发送到第二扩音器;以及在第二扩音器处,产生所述经滤波的第四组声音信号。
因为所述第二组声音信号将导致第一扩音器上的反馈,而经滤波的所述组声音信号将导致第一扩音器上的较少反馈,因此对于若干实施方案,在第一区域中的第一麦克风处检测到的声音信号是在来自所述多个扩音器中的每一扩音器(除了第一区域中的第一扩音器以及任何其它扩音器)上产生。
另外,本文所揭示的某些实施方案可既定用于作为在个人的交通工具的内部乘客室以及非交通共享声学空间中的一者的共享声学空间。交通工具的内部乘客室的共享声学空间可进一步包括所述多个扩音器的分布对应于交通工具中的多个座椅,其中所述多个麦克风的分布也对应于所述多个座椅。对于选择实施方案,多声道声学系统可使坐在汽车前排的第一乘客能够与坐在除汽车的第一排之外的排中的第二乘客交谈。
提供此发明内容是为了以简化形式引入下文在具体实施方式中进一步描述的概念的选择。此概述无意识别所主张的标的物的关键特征或基本特征,也无意用来限制所主张的主题的范围。
附图说明
当结合附图阅读时,更好地理解前述发明内容以及说明性实施例的以下详细描述。出于说明实施例的目的,图式中展示实施例的实例构造;然而,所述实施例不限于所揭示的特定方法和工具。在图中:
图1是说明其中可实施本文所揭示的各种实施方案的示范性共享声学空间100(具体地说,具有布置三排的七个座椅的汽车)的框图;
图2是说明并入到本文所揭示的表示各种实施方案的多声道声学系统(mas)中的图1的汽车的共享声学空间的框图;
图3是说明一起工作以执行表示本文所揭示的各种实施方案并由所述实施方案利用的(半双工)串扰消除技术的系统组件的框图;
图4是说明一起工作以执行表示本文所揭示的各种实施方案并由所述实施方案利用的全双工串扰消除技术的系统组件的框图;
图5是执行表示本文所揭示的各种实施方案的mas的共享声学空间中的串扰消除的方法的过程流程图;
图6是用于将图5中所说明的半双工处理扩展到表示本文所揭示的各种实施方案的全双工处理的过程流程图;
图7是由包括多个麦克风、多个扩音器以及多个回波消除和反馈消除滤波器,且表示本文所揭示的若干实施方案的多声道声学系统所执行的用于增强共享声学空间(例如图1和2中所说明的汽车的共享声学空间)中的交谈式语音的方法的过程流程图;
图8是表示本文所揭示的实施方案的对原本将由共享声学空间中的多个扩音器所产生的回波信号(例如在可适应声音滤波器处)进行滤波或消除的方法的过程流程图;
图9是表示本文所揭示的实施方案的对来自共享声学空间中的麦克风接收到的将由同一共享声学空间中的远扩音器再现的声音信号的反馈信号(例如在可适应声音滤波器)进行滤波或消除的方法的过程流程图;
图10是表示若干替代实施方案的说明用于在个别移动装置基础上对装置辅助的会议情形中的本地反馈信号进行滤波或消除的方法的过程流程图;
图11是表示若干替代实施方案的说明用于在个别移动装置基础上对pa系统情形中的本地反馈信号进行滤波或消除的方法的过程流程图;
图12是说明其中可实施(至少部分地)本文所揭示的各种实施方案的方面的无线通信装置的一个配置的框图;以及
图13说明可包含在用于实施本文所揭示的(至少部分地)各种实施方案的电子装置内的某些组件。
具体实施方式
除非通过其上下文明确限制,否则在本文中使用术语“信号”来指示其一般含义中的任一者,包含如在导线、总线或其它传输媒体上表达的存储器位置的状态(或存储器位置的集合)。除非通过其上下文明确地限制,否则在本文中使用术语“产生”来指示其一般含义中的任一者,例如计算或以其它方式产生。除非通过其上下文明确限制,否则在本文中使用术语“计算”来指示其一般含义中的任一者,例如计算、评估、估计,和/或从多个值进行选择。除非明确地受其上下文限制,术语“获得”用以指示其普通含义中的任一者,例如计算、导出、接收(例如从外部装置)和/或检索(例如从存储元件阵列)。除非通过其上下文明确地限制,否则使用术语“选择”来指示其一般含义中的任一者,例如识别、指示、应用和/或使用一组两个或两个以上中的至少一者和少于所有者。在本发明描述及权利要求书中使用术语“包括”时,并不排除其它元素或操作。使用术语“基于”(如在“a是基于b”中)来指示其普通含义中的任一者,包含情况(i)“从...导出”(例如“b是a的前驱体”),(ii)“至少基于”(例如“a至少是基于b”),且如果在特定上下文中适当,(iii)“等于”(例如“a等于b”或“a与b相同”)。类似地,使用术语“响应于”来指示其一般含义中的任一者,包含“至少响应于”。对麦克风的“位置”的参考指示所述麦克风的声学敏感面的中心的位置,除非上下文另有指示。根据特定上下文,有时使用术语“声道”来指示信号路径,且在其它时候指示由此路径运载的信号。
除非另有指示,否则对具有特定特征的设备的操作的任何揭示内容还明确地希望揭示具有类似特征的方法(且反之亦然),且对根据特定配置的设备的操作的任何揭示内容还明确地希望揭示根据类似配置的方法(且反之亦然)。术语“配置”可参考由其特定上下文指示的方法、设备和/或系统来使用。除非特定上下文另有指示,否则术语“方法”、“过程”、“程序”和“技术”通用地且可互换地使用。除非特定上下文另有指示,否则术语“设备”与“装置”也通用地且可互换地使用。术语“元件”和“模块”通常用以指示较大配置的一部分。除非通过其上下文明确地限制,否则术语“系统”在此用以指示其一般含义中的任一者,包含“相互作用以用于共同目的的一群组元件”。
通过参考文献的一部分的任何并入也应理解为并入了在所述部分内参考的术语或变量的定义,其中此些定义出现在文献中的其它地方,以及并入了在所并入部分中参考的任何图。除非起初通过定冠词引入,否则用于修饰权利要求元素的序数术语(例如,“第一”、“第二”、“第三”等)本身不指示所述权利要求元素相对于另一权利要求元素的任何优先级或次序,而是仅区别所述权利要求元素与具有同一名称(如果没有序数术语)的另一权利要求元素。除非其上下文明确地限制,本文使用术语“多个”和“组”中的每一者来指示大于一的整数数量,而本文使用术语“子集”来指示大于或等于一的整数数量。
两个人之间的会话在共享声学空间中可能较困难,在共享声学空间中,其它人也在说话,存在其它噪声源(语音和非语音),和/或另外环境的物理局限性使语音难以实现。举例来说,在移动的汽车的情境中,前排乘客座椅中的人可能难以容易地且清楚地与第三排乘客座椅中的人对话,因为车辆中的其他人(其可较接近前排座椅乘客或在前排座椅乘客和第三排座椅乘客之间)之间正发生语音。此外,移动交通工具普遍的其它噪声源(例如,引擎噪声、道路噪声、交通噪声、音乐等)也可使对话难以实现,这是因为环境的物理局限性,例如各方之间的距离以及前排座椅乘客远离第三排座椅乘客的定向(不考虑前排座椅乘客的身体和头部朝向车辆背后的不适和非安全转向)。
本文揭示一种用于通过以下步骤来增强共享声学空间中的交谈式语音的多声道声学系统:在第一扩音器处,产生第一组声音信号;在相对靠近第一扩音器的第一麦克风处,检测所述第一组声音信号;通过所述第一麦克风,将所述第一组声音信号发送到第一自适应滤波器,作为第一参考声音输出;在第一自适应滤波器处,接收相对远离所述第一扩音器的第二麦克风所检测到的第二组声音信号,所述第二组声音信号包括所述第二麦克风所检测到的第一组声音信号的分量;在所述第一自适应滤波器处,对所述第二组声音信号进行滤波,以消除所述第一组声音信号的包含于所述第二组声音信号中的分量,所述滤波是基于从所述第一麦克风接收到的第一参考声音输出;通过所述第一自适应滤波器,将所述经滤波的第二组声音信号发送到所述第一扩音器;以及在所述第一扩音器处,产生经滤波的第二组声音信号。
还揭示以下方面:在相对靠近第二麦克风且相对远离第一麦克风的第二扩音器处,产生第三组声音信号;在第二麦克风处,检测第三组声音信号;通过第二麦克风,将所述第三组声音信号发送到第二自适应滤波器,作为第二参考声音输出;在第二自适应滤波器处,接收所述第一麦克风所检测到的第四组声音信号,所述第四组声音信号包括所述第一麦克风所检测到的第三组声音信号的分量;在第二自适应滤波器处,对所述第四组声音信号进行滤波,以消除第三组声音信号的包含于第四组声音信号中的分量,所述滤波是基于从所述第二麦克风接收到的第二参考声音输出;通过第二自适应滤波器将所述经滤波的第四组声音信号发送到第二扩音器;以及在第二扩音器处,产生经滤波的第四组声音信号。
产生所述第一组声音信号以及检测并滤波所述第二组声音信号可独立于产生第三组声音信号以及检测和滤波第四组声音信号而执行。同样地,对于若干实施方案,通过第一自适应滤波器对第二组声音信号进行滤波可大体上与第二自适应滤波器对第四组声音信号进行滤波同时发生。
所述共享声学空间可包括:多个麦克风,其遍及所述共享声学空间分布,且包含第一麦克风和第二麦克风;多个扩音器,其遍及所述共享声学空间分布,且包含第一扩音器;以及多个自适应滤波器,其包含第一自适应滤波器。对于包括来自所述多个扩音器中的一个扩音器、来自所述多个麦克风中的一个附近麦克风,以及来自所述多个麦克风的耦合到来自所述多个自适应滤波器的一个自适应滤波器的一个远麦克风的每个组合,本文归于第一扩音器、第一麦克风、第二麦克风和第一自适应滤波器的组合的相同功能性可为每一此类组合复制。
所述共享声学空间可为人的交通工具的内部乘客室以及非交通共享声学空间中的一者。对于其中共享声学空间是汽车交通工具的内部乘客室的这些实施方案中的若干实施方案,所述多个扩音器的分布对应于交通工具中的多个座椅,且所述多个麦克风的分布也对应于所述多个座椅。因此,所述多声道声学系统使坐在汽车的前排中的第一乘客能够与坐在除汽车的第一排之外的排中的第二乘客交谈;而第二组声音信号将导致第一扩音器上的反馈,经滤波的所述组声音信号将导致第一扩音器上的较少反馈。
图1是示范性共享声学空间100的说明,例如具有布置成三排106a到106c的七个座椅104a到104g的汽车102的内部乘客室。如图1中所示,在任何给定时间(或旅行)可配置(即,坐)在有限数目的相对固定位置中的乘客的总数从一到七变动。因此,物理座椅配置(即,所占用座椅对未占用座椅)的数目是有限且受限的,且此共享声学空间100是界限分明的。
举例来说,在如图1中所示的一个配置中,四个乘客112a到112d可占用座椅104a(其在针对汽车102示出的配置中是驾驶员座椅)、104b(用于前排座椅乘客)、104d(针对中间排中心座椅乘客),以及104g(针对交通工具右侧的第三排座椅乘客)。此外,因为此特定共享声学空间100是汽车102,因此乘客112a到112d通常面向前(即,朝向交通工具的前面)。出于此原因,乘客112d可具有清楚且容易地倾听乘客112b的困难时间。由此,乘客112b和112d可能难以彼此交谈,且此形式可能因为来自其它乘客的噪声、交通工具的引擎和移动、在中心提供的音乐等而恶化。
图2说明并入到本文所揭示的表示各种实施方案的多声道声学系统(mas)中的图1的汽车102的共享声学空间100。如所说明,汽车102的共享声学空间100进一步包括多个麦克风202a到202g,以及扩音器204a到204f,其为mas的可见或暴露组件,其以通信方式耦合到遍及交通工具集成(且因此未图示)的多声道声学处理器(map),所述多声道声学处理器处理声音输入,且产生增强型输出以实现改进的声学体验。对于本文所揭示的各种实施方案,map用以通过获取从交通工具的任何一部分产生的声音(在麦克风202a到202g中的一或多者处作为输入接收),且在类似于多输入/多输出公用地址系统的交通工具的其它部分中的一组扩音器204a到204f或子集上再现这些声音,来平衡交通工具上的声音。
对于某些实施方案,每一排中的所述对扩音器(例如第一排106a中的扩音器204a和204b)可提供用于音乐播放器的立体声输出,且对于某些其它实施方案,所述组六个扩音器204a到204f一起操作,以向乘客提供音乐的环绕声、电影声道,或其它环绕声媒体。同样地,对于某些实施方案(且如图2所示),可为驾驶员提供多于一个麦克风,例如麦克风202a和202g,和/或不专门为座椅104d(中间排中心座椅)中的乘客112c提供麦克风,其可改为利用麦克风202c和202d两者,其中mas能够使用这两个麦克风来服务第二排106b中的所有三个座椅位置(且同样地,如果将具有第三中间座椅,那么用于其它排)。
然而,应注意,在与多个扩音器共享的声学空间中使用多个麦克风可导致反馈和回波的非所要效应(后者在本文后面简要论述)。
当音频输入(例如麦克风)与音频输出(例如扩音器)之间存在声音循环时,发生反馈(或“声学正反馈”)。举例来说,麦克风接收到的信号可放大并从扩音器穿出。来自扩音器的声音可接着再次由麦克风接收、进一步放大,且接着再次通过扩音器穿出。所得声音的频率由麦克风、放大器和扩音器中的共振频率;房间的声学、麦克风和扩音器的定向拾取和发射模式;以及其间的距离决定。对于小公用地址(pa)系统,反馈的声音容易被辨识为大声啸叫、尖叫或嚎叫声音。
一种用于减少反馈的方法是利用可仅拾取受限范围(以及理想地小于到任何扩音器的距离的范围)内的声音的低灵敏度定向麦克风的选择性输入技术。此解决方案可对其中所利用的麦克风例如由设计成靠近人的嘴操作(或当语音在比扩音器产生的声音更加接近处发源时)的个人通信装置提供。
当人和麦克风与扩音器和麦克风之间的距离的差异不是显著的(其通常是不靠近嘴使用(例如那些建构到汽车中的麦克风,如图2所示)的相对受限共享声学空间和/或麦克风的情况)时,一种用于减少反馈的更有效方法是其中当在一附近麦克风(或若干附近麦克风)处接收到时扩音器不复制声音的选择性再现。举例来说,对于图2的扩音器204a,由附近麦克风202a和/或202g接收到的声音可不在此扩音器204a上复制,从而减少可能的反馈;然而,来自扩音器204a的声音仍可在远麦克风202e处接收,其仍可在扩音器204a上复制,从而导致反馈。
一种用于减少扩音器(例如扩音器204a)上的反馈的替代方法是串扰消除技术。此方法特别可用于因仍可检测本发明的扩音器204a所产生的声音(明确地说,较响的声音)的远麦克风(例如麦克风202e)而产生的反馈。所述方法使用扩音器附近的麦克风(例如麦克风202a)来收集扩音器(包括产生声音信号以及附近麦克风202a可检测的任何其它声音的扩音器204a)的参考声音输出,其接着可用以前瞻性地确定和滤除原本可针对扩音器204a且在其上复制的远麦克风202e的相同声音输出(且到由所述远麦克风检测的程度)。此方法可单独或结合先前段落中所描述的选择性输入方法而使用。
用于扩音器204a的附近麦克风202a所收集的参考声音输出是自动排除由扩音器204a在上文所述的选择性再现技术中直接复制的相同输出。
图3是说明一起工作以执行表示本文所揭示的各种实施方案并由所述实施方案利用的串扰消除技术的系统组件的框图300。图3中(且参考图1和2),扩音器204a产生声音信号,其由附近麦克风202a检测以产生发送到自适应滤波器302a的参考声音输出。所述声音信号还至少部分地由远麦克风202e检测,且此部分检测到的声音通常将(连同也由麦克风202e检测到的本地声音)发送到扩音器204a并复制(产生反馈)。然而,自适应滤波器302a使用附近麦克风202a所检测到的参考声音输出,滤出部分检测到的声音,使得仅远麦克风202e所检测到的本地声音在扩音器204a上再现。
对于某些实施方案,所述自适应滤波器可为固定的经校准滤波器。举例来说,在共享声学空间中仅具有两个固定麦克风和两个固定扩音器的实施方案中,固定的经校准滤波器可事先在其中每一扩音器正播放且由每一麦克风捕获的校准模式期间配置,以确定所述系统随后将执行消除。使用固定的经校准滤波器来执行串扰消除不仅限于汽车环境,而是可在对应于共享声学空间的任何相对固定环境中利用。因此,自适应滤波器对本文所揭示的各种实施方案的任何使用应理解为还实现固定的经校准滤波器的使用,且用于特征为麦克风和扩音器的固定配置的共享声学空间(但不限于此)。
此外,对于某些实施方案,可结合自适应滤波器来使用固定的经校准滤波器。在此类配置中,可使用自适应滤波器来进一步优化固定的经校准滤波器所执行的滤波。此方法可在其中条件在校准时可改变的动态环境中有效。举例来说,对于在汽车为空时在汽车中进行的校准,相同共享声学空间可归因于乘客的存在而巧妙地改变,且对所述改变的空间的声学的效应无法经补偿以用于使用固定的经校准滤波器而无再校准。由此,结合固定的经校准滤波器使用动态滤波器是重新校准的一个替代校准。
图3中说明的串扰消除是半双工(仅在一个方向上操作),但可容易地扩展到分别在每一麦克风附近的两个人之间的双向交谈的全双工。此外,对于具有多个麦克风和多个扩音器的共享声学空间,可针对扩音器、附近麦克风和远麦克风的每一组合,形成类似的全双工串扰消除配置。在这些各种实例中,从收听者的角度来看,所得消除导致较高音质的减弱或减少的串扰。
图4是说明一起工作以执行表示本文所揭示的各种实施方案并由所述实施方案利用的全双工串扰消除技术的系统组件的框图。如在图3中,此处在图4中(且再次参考图1和2),扩音器204a产生声音信号,其由附近麦克风202a检测,以产生发送到自适应滤波器302a的参考声音输出。所述声音信号还至少部分地由远麦克风202e检测,且发送到自适应滤波器302a,其使用附近麦克风202a所检测到的参考声音输出,滤除部分检测到的声音,使得仅远麦克风202e所检测到的本地声音在扩音器204a上再现。另外,扩音器204e产生由麦克风202e检测的单独声音信号,所述麦克风是此环境中的附近麦克风,以产生发送到自适应滤波器302e的单独参考声音输出。此单独声音信号还至少部分地由麦克风202a(此环境中的远麦克风)检测,且发送到自适应滤波器302e,其接着使用所述参考声音输出,滤除部分检测到的声音,使得仅远麦克风202a所检测到的本地声音在扩音器204e上再现。
图5是执行表示本文所揭示的各种实施方案的mas的共享声学空间中的串扰消除的方法的过程流程图500。在图5中,在502处,mas在第一扩音器处产生第一组声音信号。在504处,mas在相对靠近所述第一扩音器的第一麦克风处,检测第一组声音信号。在506处,mas通过第一麦克风,将第一组声音信号发送到第一自适应滤波器,作为第一参考声音输出。在508处,mas在第一自适应滤波器处,接收相对远离第一扩音器的第二麦克风检测到的第二组声音信号,所述第二组声音信号包括由第二麦克风检测到的所述第一组声音信号的分量。在510处,mas在第一自适应滤波器处,对第二组声音信号进行滤波,以消除第一组声音信号的包含于第二组声音信号中的分量,所述滤波是基于从第一麦克风接收到的第一参考声音输出。在512处,mas通过第一自适应滤波器将经滤波的第二组声音信号发送到第一扩音器。在514处,mas在第一扩音器处,产生经滤波的第二组声音信号。
图6是用于将图5中所说明的半双工处理扩展到表示本文所揭示的各种实施方案的全双工处理的过程流程图600。在图6中(且从图5中的过程流的结尾继续),在616处,mas在相对靠近第二麦克风且相对远离第一麦克风的第二扩音器处,产生第三组声音信号。在618处,mas在第二麦克风处,检测第三组声音信号,且在620处,mas通过第二麦克风,将第三组声音信号发送到第二自适应滤波器,作为第二参考声音输出。在622处,mas在第二自适应滤波器处,接收第一麦克风所检测到的第四组声音信号,所述第四组声音信号包括由第一麦克风检测到的第三组声音信号的分量。在624处,mas在第二自适应滤波器处,对第四组声音信号进行滤波,以消除第三组声音信号的包含于第四组声音信号中的分量,所述滤波是基于从第二麦克风接收到的第二参考声音输出。在626处,mas通过第二自适应滤波器将经滤波的第四组声音信号发送到第二扩音器。在628处,mas在第二扩音器处,产生经滤波的第四组声音信号。
对于若干实施方案,所述自适应滤波器可仅操作以在参考声音输入较响且声音信号较软(不响)时,将参考声音输出从对应的接收到的声音信号滤除。举例来说,对于某些实施方案,可适应滤波器可量化参考声音输入的声学转移函数,量化声音信号的声学转移函数,且在前者与后半的比率超过预定阈值的情况下,仅接着基于参考声音输入对声音信号进行滤波。对于其它实施方案,前述比率可改为用以执行与所确定的比率成比例的局部滤波。在又其它实施方案中,当参考声音输入的声学转移函数超过“响”的预定义最大阈值时,当声学转移函数声音信号超过“软”的预定义最小阈值时,或这两者,还可仅应用滤波(通过包含两个先前所描述的技术的任何技术)。
因此,如图5和6中所示,利用在共享声学空间内操作的多声道声学系统(所述多声道声学系统包括多个麦克风和多个扩音器,所述共享声学空间具有包括至少第一区域和第二区域的多个区域)所提供的串扰消除来增强共享声学空间中的交谈式语音可通过以下步骤,通过本文所揭示的各种实施方案来实现:在第一区域中的第一扩音器处,产生第一组声音信号;在第一区域中的第一麦克风处,检测所述第一组声音信号;通过所述第一麦克风,将所述第一组声音信号发送到第一自适应滤波器,作为第一参考声音输出;在第一自适应滤波器处,接收第二区域中的第二麦克风所检测到的第二组声音信号,所述第二组声音信号包括由第二麦克风所检测到的所述第一组声音信号的分量;在第一自适应滤波器处,对第二组声音信号进行滤波,以消除第一组声音信号的包含于第二组声音信号中的分量,所述滤波是基于从第一麦克风接收到的第一参考声音输出;通过第一自适应滤波器,将经滤波的第二组声音信号发送到第一扩音器;以及在第一扩音器处,产生经滤波的第二组声音信号(共同称为“半双工串扰消除”)。
若干实施方案还通过以下操作来进一步提供串扰消除:在第二区域中的第二扩音器处,产生第三组声音信号;在第二麦克风处检测所述第三组声音信号;通过第二麦克风,将所述第三组声音信号发送到第二自适应滤波器,作为第二参考声音输出;在第二自适应滤波器处,接收所述第一麦克风所检测到的第四组声音信号,所述第四组声音信号包括由第一麦克风检测到的第三组声音信号的分量;在第二自适应滤波器处,对第四组声音信号进行滤波,以消除第三组声音信号的包含于第四组声音信号中的分量,所述滤波是基于从第二麦克风接收到的第二参考声音输出;通过第二自适应滤波器,将经滤波的第四组声音信号发送到第二扩音器;以及在第二扩音器处,产生经滤波的第四组声音信号。
另外,对于某些实施方案,在第一区域中的第一麦克风处检测到的声音信号可在来自所述多个扩音器中的每一扩音器(第一区域中的第一扩音器和任何其它扩音器除外)上产生。无论如何,第二组声音信号将导致第一扩音器上的反馈,而经滤波的所述组声音信号将导致第一扩音器上的较少反馈。
对于各种实施方案,共享声学空间可为人的交通工具的内部乘客室以及非交通共享声学空间中的一者。此外,对于作为交通工具的内部乘客室的共享声学空间,所述多个扩音器的分布可对应于交通工具中的多个座椅,和/或多个麦克风的分布也对应于所述多个座椅。在任何情况下,多声道声学系统可使坐在汽车前排的第一乘客能够与坐在除汽车的第一排之外的排中的第二乘客交谈。
另一方面,回波(也被称作“环绕音回波”)是与反馈分开的问题,因为因从不同扩音器发射的特定声音借此行进不同路径且在不同时间到达收听者,从而产生双重、重复或模糊音效的任何条件产生回波。对于多扩音器系统,每一扩音器促成回波效应,因为由每一扩音器产生的声音将在某一程度上行进唯一声学路径,然后到达收听者的耳朵。此外,尽管回波效应的发生并不需要麦克风,但对于使用多个麦克风的本文中所揭示的各种实施方案,这些各种麦克风可部分检测这些声音,且以进一步增强回波效应(与本文稍后论述的任何反馈效应相异且分离)的方式在一或多个扩音器处再现这些声音。
为补偿回波效应,且对于本文所揭示的特定实施方案,一种方法是mas相对于声学空间内发现的特定目标收听位置从扩音器中的每一者主动地习得声学路径。此有效方法可包括校准模式,其在每一扩音器处个别地产生一或多个测试声音,使用一或多个麦克风测量这些声音,且相对于目标收听位置针对每一此类扩音器确定习得的声学路径。mas可接着通过使用习得的声学路径混合个别测试声音信号来产生单声道远端参考信号。此单声道远端参考信号可用以通过恰当地修改(延迟、安静等)每一扩音器产生的声音信号以有效地消除回波来消除所述回波。
另外,举例来说,由于七座环境中一个人与七个人之间的有限配置,有可能回波效应基于人的每一不同配置而不同。因此,对于选定实施方案,mas可习得各种回波消除方案,针对每一配置一个,且接着当为其确定的特定配置再次发生时,使用本文稍后论述的主动或被动配置确定技术来部署先前习得的回波消除方案。
此外,对于选定实施方案,还可针对每一配置基于不同目标收听位置作出回波效应校准,所述不同目标收听位置对应于特定有利的目标座椅位置(例如,驾驶员座椅)或有利于基于各种准则(例如,当对应座椅被占据时)自动选择的特定座椅位置(例如,驾驶员座椅和前排乘客的座椅之间)的子集的目标位置,或对于特定实施方案,可能由驾驶员或乘客相应地直接可选择。且对于一些实施方案,可基于一或多个乘客的特定身份(例如,车辆所有者或“vip乘客”)(基于其在车辆内的位置)选择特定配置,所述身份由系统使用本文稍后论述的主动或被动识别确定技术自动确定。
将回波消除和反馈消除并入到本文所揭示的mas的各种实施方案中使共享声学空间的一个部分中的语音能够在共享声学空间的另一单独部分中再现,以增强位于共享声学空间的每一部分中的两个人之间的交谈式通信。
图7是由表示本文所揭示的若干实施方案的包括多个麦克风、多个扩音器以及多个回波消除和反馈消除滤波器的多声道声学系统所执行的用于增强共享声学空间(例如图1和2中所说明的汽车102的共享声学空间100)中的交谈式语音的方法的过程流程图700。在图7中,方法在710处开始,其中在遍及共享声学空间分布的多个麦克风处接收大体上源自相对于每一麦克风的附近声音源的声音信号。在720处,使用多个可调适声音滤波器(或其它回波消除装置)来对声音信号进行滤波,以消除确定在声音信号中的回波信号。在730处,再次使用多个可调适声音滤波器(或其它反馈消除装置)来对声音信号进行进一步滤波,以消除在声音信号中检测到的反馈信号。在740处,在来自遍及共享声学空间分布的所述多个扩音器中的扩音器子集上再现经滤波的声音信号,所述扩音器子集仅对应于相对不在每一源麦克风附近(即,相对远离)的那些扩音器。
图8是表示本文所揭示的实施方案的对原本将由共享声学空间中的多个扩音器所产生的回波信号(例如在自适应声音滤波器处)进行滤波或“消除”的方法的过程流程图800。在图8中,在810处,滤波器接收既定由共享声学空间中的多个扩音器当中的一扩音器再现的声音信号。独立地,在820处(且通常在820处接收到声音信号之前很久),相同滤波器接收(和/或从存储器召回)因关于扩音器的共享声学空间的先前执行的校准而产生的经预校准的系数。在830处,滤波器调适所述声音信号,以有效地消除原本将由声音信号产生的“回波”。在840处,将“经滤波”的声音信号(其中回波信号已经“消除”)发送到扩音器以供再现。
图9是表示本文所揭示的实施方案的对来自共享声学空间中的麦克风接收到的将由同一共享声学空间中的远扩音器再现的声音信号的反馈信号(例如在自适应声音滤波器)进行滤波或消除的方法的过程流程图900。在图9中,在910处,滤波器接收由麦克风检测到的既定由相对较远的扩音器再现的声音信号。独立地,在920处,相同滤波器接收(大体上与声音信号同时)来自相对靠近远扬声器的第二麦克风的评估信号,所述评估信号对应于所述声音信号。在930处,滤波器基于所述接收到的评估信号,确定所述声音信号是否包含反馈信号。如果是,那么在940处,滤波器消除来自所述声音信号的反馈信号,且在950处,将经滤波的声音信号发送到相对较远的扩音器以供再现。如果否,那么将声音信号发送到相对较远的扩音器,以供再现为由滤波器接收(即,未经滤波)。
关于图7、8和9,术语“滤波器”可为能够执行回波消除和反馈消除两者的单个滤波器,且此滤波器的能力可包含多声道声学处理器和/或其它组件所提供的处理能力。
对于若干实施方案,还可使用接收到的话音增强(rve)来扩增反馈消除,所述接收到的话音增强提供心理声学模型中的噪声等级估计,且可从其确定用于自动捕获(或避免捕获)远用户话音的扩音器的最佳音量。通过为具有话音和不具有话音两者的有噪声情形建立所感知响度,可将话音分量从所述信号隔离并消除。在交谈中,每一参与者因此将不感知其它参与者的任何响度改变,不管噪声条件如何,交谈是面对面的还是间接的(例如前排座椅乘客对后排座椅乘客,如上文所论述)。可通过(1)计算共享声学空间内部的流动平均噪声等级(使用回波消除情况的等级差异信息和远端活动,以排除非背景噪声帧),(2)用rve模块计算所要的增益,和(3)相应地更新音量,来实现这些结果。
除前述内容之外,本文所揭示的某些实施方案可利用主动或被动配置确定技术和/或主动或被动识别确定技术。主动或被动配置确定和/或主动或被动识别确定技术(如应用于本申请案中所揭示的各种实施方案)概括如下:
关于主动或被动配置确定,本文所揭示(且为方便起见,在图1和2的汽车102的上下文中论述)的各种实施方案可经配置以使用用于确定共享声学空间中的乘客的当前配置的若干技术中的任一者。举例来说,对于某些实施方案,mas可通过监视来自交通工具的特定座椅位置的声音以确定哪些座椅被占用且哪些座椅未被占用,来确定乘客的当前配置。类似地,还可利用并入到共享声学空间中的图像或视频捕获裝置来确定哪些座椅被占用,且哪些座椅未被占用。同样地,还可利用其它检测技术,例如集成到座椅底部中的重量传感器,例如或类似于已经用于前排乘客座椅中的那些,来检测是否停用安全气囊来保护儿童乘客。并且,这些和其它方法的组合可用于主动地或被动地确定哪些座椅被占用且哪些座椅未被占用,且从而使mas能够(基于被占用的座椅)确定乘客的当前配置,且基于此特定配置,执行关于所述特定配置的回波消除、反馈消除和多种其它功能。
同样地,关于主动或被动识别确定,本文所揭示(且为方便起见,在图1和2的汽车102的上下文中再次论述)的各种实施方案可经配置以使用用于确定共享声学空间的每一所占用座椅中的乘客的特定身份的若干技术中的任一者。举例来说,对于某些实施方案,mas可通过监视源自每一座椅的语音声音来确定乘客的特定身份,其中人与人之间的语音的差异是唯一地识别每一乘客的基础。类似地,并入到共享声学空间中且利用面部辨识软件或一些类似装置的图像或视频捕获裝置还可用于唯一地识别所占用座椅中的乘客。同样地,还可利用其它检测技术(即使较不精确的装置,例如集成到座椅底部中的重量传感器,例如或类似于前排乘客座椅中已经使用的那些装置,来检测是否停用安全气囊来保护儿童乘客),来在潜在乘客的数目充分小且适度不同以实现唯一识别时,大体上区分不同乘客。并且,这些和其它方法的组合可用于主动地或被动地以较大准确性来确定每一所占用座椅中的乘客的特定唯一身份。
以此方式,不仅的确唯一地识别每一乘客,还提供在所占用座椅基础上的乘客的配置的广泛确定(类似于上文所述的较一般配置确定),但其还使个人化配置确定的额外等级的特定性(其另外基于哪些座椅被占用)能够基于哪些座椅被特定已知个人占用而进一步细化。这又允许基于谁坐在那些被占用座椅中的每一者中,来以额外维度来区分图1和2中所反映的特定基于四人座位配置(其为基于其占用座椅的许多可能配置中的一个配置)。对于图1和2中所反射的基于四人座位配置,基于身份的此额外维度基本上是无限的(即,整个人类的身份);然而,由于大多数个人车辆常常运输来自小得多的个人子集的人,所以考虑身份维度的可能额外配置的实际数目大于不考虑乘客身份的配置,但仍是相对有限的(且可通过引入滤波器,例如仅考虑已在最小数目的旅行,或在特定时间窗内的最小数目的旅行等中占用了座椅的乘客,来使其更加有限)。
如本文所使用,所提及的(所占用座椅配置和/或乘客身份的)“被动”确定是mas在无来自乘客的直接用户输入的情况下,通过其功能的正常和典型操作执行的那些确定,而“主动”确定是还并入有用户或乘客提供直接或故意用户输入的那些确定,所述用户输入例如说出其自身名字、提供访问码,或指示偏好或选择特定配置、设定等。然而,这些区别无意从本文所揭示的本发明概念减损或限制所述本发明概念,且因此如本文所使用的“被动”的任何解译包含“主动”等效物,且反之亦然。
除前述内容之外,反馈消除的若干替代实施方案用于且针对共享声学空间(交通和非交通两者),其中多个用户(或乘客)使用其自身的移动通信装置来进行针对“群组会议”的交谈,其中共同麦克风和共同扩音器类似于mas的麦克风和扩音器操作,但缺乏map所提供的集中化方面。然而,在共享声学空间(本文中统称为“装置辅助的会议”)中使用多个无线装置还可遭受回波和反馈。
图10是表示本文的若干替代实施方案的说明用于在个别移动装置基础上对装置辅助的会议情形中的本地反馈信号进行滤波或消除的方法的过程流程图。在1010处,近端话音信号由无线装置接收,且用作所述装置的参考信号(“所估计信号”)。在1020处,无线装置调适滤波器,以最大限度地再现近端话音信号的扩音器信号。在1030处,无线装置将所估计的信号从扩音器信号减去。在1040处,无线装置可任选地执行后处理,例如维纳滤波(取决于实施方案)。在1050处,扩音器信号由无线装置的扩音器产生。以此方式,如果近端话音信号被充分抑制,那么不仅反馈被消除,并且原本因接收到话音信号的时间与话音信号原本将在装置的扩音器上重放的时间之间的处理延迟而产生的近端话音的回波也被取消。此方法还可与也由无线装置执行的常规回声消除器组合。此方法的特征还可为功率节省模式,其中当将话音信号识别为无线装置的拥有者(且可能主要用户)的话音时,仅接通滤波器。
另一情形在使用多个无线装置与公用地址(pa)系统介接的环境中,例如在城镇会议的环境中发生,在城镇会议中,个人可利用其自身的个人无线装置在集中式pa系统上广播舞台上的扬声器的问题。在此上下文中,当第二用户的无线装置的麦克风拾取第一用户的话音信号(使用第一无线装置来在集中pa系统上广播话音信号)时,可出现反馈。因为pa系统趋向于以可能由附近的任何麦克风拾取的方式投射声音信号,所以此pa系统情形中的反馈的可能性相当大。
图11是表示本文所揭示的若干替代实施方案的说明用于在个别移动装置基础上对pa系统情形中的本地反馈信号进行滤波或消除的方法的过程流程图。在1110处,pa系统的动态滤波器接收两个信号。在1120处,动态滤波器确定两个接收到的信号包括话音信号。在1130处,动态滤波器确定哪些接收到的信号具有较低声学转移函数,且在1140处,滤除具有较低声学转移函数的接收到的信号。在1150处,扩音器产生经滤波的信号(仅具有有较高声学转移函数的接收到的信号)。
图12为说明无线通信装置1202的一个配置的框图,其中可(至少部分)在例如汽车环境、房间或任何其它共享声学空间中等各种位置中的任一者中单独或作为此类环境的组成部分而实施本文所揭示的各种实施方案的方面。图12中说明的无线通信装置1202可为本文所描述的电子装置中的一或多者的实例。无线通信装置1202可包含应用程序处理器1221。应用程序处理器1221通常处理指令(例如,运行程序)以执行无线通信装置1202上的功能。应用程序处理器1221可耦合到音频译码器/解码器(编解码器)1219。
音频编解码器1219可用于对音频信号进行译码和/或解码。音频编解码器1219可耦合到至少一个扬声器1211、耳机1213、输出插孔1215和/或至少一个麦克风1217。扬声器1211可包含一或多个将电或电子信号转换为声学信号的电声转换器。举例来说,扬声器1211可用于播放音乐或输出扬声器电话交谈等。耳机1213可为可用以向用户输出声学信号(例如语音信号)的另一扬声器或电声换能器。举例来说,可使用耳机1213,使得仅用户可可靠地听到所述声学信号。输出插孔1215可用于将其它装置(例如头戴式耳机)耦合到无线通信装置1202以用于输出音频。扬声器1211、耳机1213和/或输出插孔1215可通常用于从音频编解码器1219输出音频信号。至少一个麦克风1217可为将声学信号(例如用户的话音)转换为提供到音频编解码器1219的电或电子信号的声电换能器。在一些配置中,音频编解码器1219可执行本文所述的第一级处理和第二级处理中的一或多者(和/或其它功能或程序中的一或多者)。
应用程序处理器1221还可耦合到电力管理电路1294。电力管理电路1294的一个实例是电力管理集成电路(pmic),其可用于管理无线通信装置1202的电力消耗。电力管理电路1294可耦合到电池1296。电池1296可通常将电力提供到无线通信装置1202。举例来说,电池1296和/或电力管理电路1294可耦合到包含于无线通信装置1202中的元件中的至少一者。
应用程序处理器1221可耦合到至少一个输入装置1298以用于接收输入。输入装置1298的实例包含红外传感器、图像传感器、加速度计、触摸传感器、小键盘等。输入装置1298可允许用户与无线通信装置1202交互。应用程序处理器1221还可耦合到一或多个输出装置1201。输出装置1201的实例包含打印机、投影仪、屏幕、触觉装置等。输出装置1201可允许无线通信装置1202产生可由用户体验的输出。
应用程序处理器1221可耦合到应用程序存储器1203。应用程序存储器1203可为能够存储电子信息的任何电子装置。应用程序存储器1203的实例包含双数据速率同步动态随机存取存储器(3ram)、同步动态随机存取存储器(sdram)、快闪存储器等。应用程序存储器1203可提供用于应用程序处理器1221的存储器。举例来说,应用程序存储器1203可存储在应用程序处理器1221上运行的程序的作用的数据和/或指令。
应用程序处理器1221可耦合到显示器控制器1205,所述显示器控制器又可耦合到显示器1207。显示器控制器1205可为用于在显示器1207上产生图像的硬件块。举例来说,显示器控制器1205可将来自应用程序处理器1221的指令和/或数据转译为可呈现在显示器1207上的图像。显示器1207的实例包含液晶显示器(lcd)面板、发光二极管(led)面板、阴极射线管(crt)显示器、等离子显示器等。
应用程序处理器1221可耦合到基带处理器1223。基带处理器1223通常处理通信信号。举例来说,基带处理器1223可对接收到的信号进行解调和/或解码。另外或替代地,基带处理器1223可对信号进行编码和/或调制以准备发射。
基带处理器1223可耦合到基带存储器1209。基带存储器1209可为能够存储电子信息的任何电子装置,例如sdram、3ram、快闪存储器等。基带处理器1223可从基带存储器1209读取信息(例如指令和/或数据),和/或将信息写入到基带存储器1209。另外或替代地,基带处理器1223可使用存储在基带存储器1209中的指令和/或数据来执行通信操作。
基带处理器1223可耦合到射频(rf)收发器1225。rf收发器1225可耦合到功率放大器1227以及一或多个天线1229。rf收发器1225可发射和/或接收射频信号。举例来说,rf收发器1225可使用功率放大器1227以及至少一个天线1229发射rf信号。rf收发器1225还可使用所述一或多个天线1229接收rf信号。
图13说明可包含在用于实施本文所揭示的(至少部分地)各种实施方案的电子装置1302内的某些组件。结合图13所描述的电子装置1302可为本文所述的电子装置中的一或多者的实例,和/或可根据本文所述的电子装置中的一或多者来实施。
电子装置1302包含处理器1347。处理器1347可为通用单芯片或多芯片微处理器(例如arm)、专用微处理器(例如数字信号处理器(dsp))、微控制器、可编程门阵列等。处理器1347可被称作中央处理单元(cpu)。虽然在图13的电子装置1302中仅示出单个处理器1347,但在替代配置中,可使用处理器(例如,arm与dsp)的组合。
电子装置1302还包含与处理器1347电子通信的存储器1331(即,处理器1347可从存储器1331读取信息和/或将信息写入到存储器1331)。存储器1331可为能够存储电子信息的任何电子组件。存储器1331可为随机存取存储器(ram)、只读存储器(rom)、磁盘存储媒体、光学存储媒体、ram中的快闪存储器装置、随处理器一起包含的机载存储器、可编程只读存储器(prom)、可擦除可编程只读存储器(eprom)、电可擦除prom(eeprom)、寄存器等,包含其组合。
数据1333和指令1335可存储在存储器1331中。指令1335可包含一或多个程序、例程、子例程、功能、程序、代码等。指令1335可包含单个计算机可读语句或许多计算机可读语句。指令1335可由处理器1347执行,以实施本文所描述的方法中的一或多者。执行指令1335可涉及使用存储在存储器1331中的数据1333。图13示出一些指令1335a和数据1333a加载到处理器1347。
电子装置1302还可包含发射器1343和接收器1345以允许在电子装置1302与远程位置(例如基站)之间发射和接收信号。发射器1343和接收器1345可统称为收发器1341。天线1339可电耦合到收发器1341。电子装置1302还可包含(未图示)多个发射器、多个接收器、多个收发器和/或多个天线。
电子装置1302的各种组件可通过一或多个总线耦合在一起,所述总线可包含电力总线、控制信号总线、状态信号总线、数据总线等。为简单起见,各种总线在图13中说明为总线系统1337。
提供对所描述的配置的呈现以使所属领域的技术人员能够制作或使用本文中揭示的方法和其它结构。本文中所示出并描述的流程图、框图和其它结构仅为实例,且这些结构的其它变型也在本发明的范围内。对这些配置的各种修改均为可能的,且本文中所呈现的一般原理还可应用于其它配置。因此,本发明无意限于上文所示的配置,而是将被赋予与本文中(包含在形成原始揭示内容的部分的所申请的所附权利要求书中)以任何方式所揭示的原理和新颖特征一致的最广范围。
应注意,在兼容的情况下,结合本文中所描述的配置中的任一者所描述的特征、功能、程序、组件、元件、结构等中的一或多者可与结合本文中所描述的其它配置中的任一者所描述的功能、程序、组件、元件、结构等中的一或多者组合。换句话说,可根据本文中揭示的系统和方法来实施本文中所描述的功能、程序、组件、元件等的任何相容的组合。
本文中所揭示的方法包括用于实现所描述的方法的一或多个步骤或动作。在不脱离所附权利要求书的范围的情况下,所述方法步骤和/或动作可彼此互换。换句话说,除非正描述的方法的适当操作需要步骤或动作的特定次序,否则在不脱离所附权利要求书的范围的情况下,可修改特定步骤和/或动作的次序和/或使用。除非以其它方式明确地指定,否则短语“基于”并不表示“仅基于”。换句话说,短语“基于”描述“仅基于”与“至少基于”两者。
在以上描述中,有时结合各种术语而使用参考编号。在术语结合参考编号使用的情况下,这可意味着指代图中的一或多者中所示的特定元件。在无参考标号而使用术语的情况下,这可意味着大体指代所述术语,而不限于任何特定图。
所属领域的技术人员将理解,可使用多种不同技术和技法中的任一者来表示信息和信号。举例来说,可通过电压、电流、电磁波、磁场或磁粒子、光场或光粒子或其任何组合来表示在整个上文描述中可能参考的数据、指令、命令、信息、信号、位和符号。
本文所揭示的配置的实施方案的设计要求可包含最小化处理延迟和/或计算复杂性(通常以每秒数百万个指令或mips来测量),尤其是针对计算密集型应用程序,例如经压缩音频或视听信息(例如根据压缩格式编码的文件或流,例如本文所识别的实例中的一者)的重放,或宽带通信(例如高于八个千赫兹,例如12、16、32、44.1、48或192khz的取样率的话音通信)的应用。
本文所揭示的设备(例如被配置成执行本文所述的技术的任何装置)可用硬件与软件和/或与固件的任何被视为适合于既定应用的组合实施。举例来说,可将此设备的元件制造为(例如)驻留在同一芯片上或芯片组中的两个或更多个芯片当中的电子和/或光学装置。此类装置的一个实例是逻辑元件(例如,晶体管或逻辑门)的固定或可编程阵列,且这些元件中的任一者可实施为一或多个此类阵列。这些元件中的任何两个或更多个或甚至全部可实施于同一个(一些)阵列内。此类一或多个阵列可在一或多个芯片内(例如,包含两个或更多个芯片的芯片组内)实施。
本文中揭示的设备的各个实施方案的一或多个元件可完全或部分实施为一或多个指令集,所述一或多个指令集经布置以在逻辑元件的一或多个固定或可编程阵列上执行,例如微处理器、嵌入式处理器、ip核心、数字信号处理器、fpga(现场可编程门阵列)、assp(专用标准产品)和asic(专用集成电路)。如本文所揭示的设备的实施方案的各种元件中的任一者还可体现为一或多个计算机(例如,包含经编程以执行一或多个指令集或序列的一或多个阵列的机器,还被称为“处理器”),且这些元件中的任何两者或两者以上或甚至全部可在相同的此类一或多个计算机内实施。
可将如本文所揭示的处理器或用于处理的其它装置制造为(例如)驻留在相同芯片上或芯片组中的两个或更多个芯片当中的一或多个电子和/或光学装置。此类装置的一个实例是逻辑元件(例如,晶体管或逻辑门)的固定或可编程阵列,且这些元件中的任一者可实施为一或多个此类阵列。此类一或多个阵列可在一或多个芯片内(例如,包含两个或更多个芯片的芯片组内)实施。此类阵列的实例包含逻辑元件的固定或可编程阵列,例如微处理器、嵌入式处理器、ip核心、dsp、fpga、assp和asic。如本文所揭示的处理器或其它用于处理的装置还可体现为一或多个计算机(例如,包含经编程以执行指令的一或多个集合或序列的一或多个阵列的机器)或其它处理器。有可能使用如本文所述的处理器来实施任务或执行不与相对于各种图所描述的方法的实施方案的程序直接有关的其它指令集,例如与处理器嵌入其中的装置或系统(例如音频感测装置)的另一操作有关的任务。如本文所揭示的方法的一部分还有可能由音频感测装置的处理器执行,且方法的另一部分还有可能在一或多个其它处理器的控制下执行。
所属领域的技术人员将了解,结合本文所揭示的配置而描述的各种说明性模块、逻辑块、电路以及测试和其它操作可实施为电子硬件、计算机软件或两者的组合。可使用通用处理器、数字信号处理器(dsp)、asic或assp、fpga或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件、或其经设计以产生如本文所揭示的配置的任何组合来实施或执行所述模块、逻辑块、电路和操作。举例来说,可将此类配置至少部分地实施为硬连线电路、实施为制造到专用集成电路中的电路配置,或实施为加载到非易失性存储装置的固件程序或作为机器可读代码从数据存储媒体加载或加载到数据存储媒体中的软件程序,此类代码为可由例如通用处理器或其它数字信号处理单元等逻辑元件阵列执行的指令。通用处理器可为微处理器,但在替代方案中,处理器可为任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如dsp与微处理器的组合、多个微处理器的组合、一或多个微处理器结合dsp核心,或任何其它此类配置。软件模块可驻留在非暂时性存储媒体中,所述非暂时性存储媒体例如为ram(随机存取存储器)、rom(只读存储器)、非易失性ram(nvram)(例如,快闪ram、可擦除可编程rom(eprom)、电可擦除可编程rom(eeprom))、寄存器、硬盘、可装卸式磁盘或cd-rom;或驻留在此项技术中已知的任何其它形式的存储媒体中。说明性存储媒体耦合到处理器,使得处理器可从存储媒体读取信息且将信息写入到存储媒体。在替代方案中,存储媒体可与处理器成一体式。处理器和存储媒体可驻存于asic中。asic可驻留于用户终端中。在替代例中,处理器和存储媒体可作为离散组件驻留于用户终端中。
应注意,本文所揭示的各种方法可通过逻辑元件阵列(例如处理器)执行,并且本文所述的设备的各种元件可实施为经设计以在此阵列上执行的模块。如本文所使用,术语“模块”或“子模块”可指包含呈软件、硬件或固件形式的计算机指令(例如,逻辑表达式)的任何方法、设备、装置、单元或计算机可读数据存储媒体。将理解,可将多个模块或系统组合为一个模块或系统,且可将一个模块或系统分离成多个模块或系统以执行相同功能。在以软件或其它计算机可执行指令实施时,过程的元件基本上是用以例如使用例程、程序、对象、组件、数据结构及其类似者执行相关任务的代码段。术语“软件”应理解为包含源代码、汇编语言代码、机器代码、二进制代码、固件、宏码、微码、可由逻辑元件阵列执行的任何一或多个指令集或序列以及此类实例的任何组合。所述程序或代码段可存储于处理器可读存储媒体中或由体现在传输媒体或通信链路上的载波中的计算机数据信号传输。
本文所揭示的方法、方案和技术的实施方案还可(例如在如本文所列的一或多个计算机可读存储媒体的有形、计算机可读特征中)有形地实施为可由包含逻辑元件(例如处理器、微处理器、微控制器或其它有限状态机)的阵列的机器可执行的一或多个指令集。术语“计算机可读媒体”可包含可存储或传送信息的任何媒体,包含易失性、非易失性、可装卸式以及非可装卸式媒体。计算机可读媒体的实例包含电子电路、半导体存储器装置、rom、快闪存储器、可擦除rom(erom)、软盘或其它磁性存储装置、cd-rom/dvd或其它光学存储装置、硬盘或可用来存储所要信息的任何其它媒体、光纤媒体、射频(rf)链路或可用来运载所要信息并可存取的任何其它媒体。计算机数据信号可包含可经由传输媒体传播的任何信号,所述传输媒体例如为电子网络通道、光纤、空气、电磁、rf链路等。可经由例如因特网或企业内部网等计算机网络下载代码段。在任何情况下,不应将本发明的范围解释为受此类实施例限制。
本文中所描述的方法的任务中的每一者可直接以硬件、以由处理器执行的软件模块,或以所述两者的组合体现。在本文所揭示的方法的实施方案的典型应用中,逻辑元件(例如逻辑门)的阵列经配置以执行所述方法的各种任务中的一个、多于一个或甚至所有。还可将所述任务中的一或多者(可能全部)实施为体现在计算机程序产品(例如,一或多个数据存储媒体,例如磁盘、快闪或其它非易失性存储器卡、半导体存储器芯片等)中的代码(例如,一或多个指令集),所述计算机程序产品可由包含逻辑元件阵列(例如,处理器、微处理器、微控制器或其它有限状态机)的机器(例如,计算机)读取和/或执行。如本文所揭示的方法的实施方案的任务还可由一个以上此阵列或机器执行。在这些或其它实施方案中,所述任务可在用于无线通信的装置(例如,蜂窝式电话或具有此类通信能力的其它装置)内执行。此装置可经配置以与电路交换和/或包交换网络(例如使用一或多个协议,例如voip)通信。举例来说,此装置可包含经配置以接收和/或发射经编码帧的rf电路。
明确地揭示本文所揭示的各种方法可(至少部分地)由便携式通信装置执行,例如手持机、头戴式耳机或便携式数字助理(pda),且本文所述的各种设备可包含在此装置内。典型的实时(例如,在线)应用是使用此移动装置进行的电话交谈。
在一或多个示范性实施例中,本文中描述的操作可在硬件、软件、固体或其任何组合中实施。如果实施于软件中,那么可将此类操作作为一或多个指令或代码存储在计算机可读媒体上或经由计算机可读媒体进行发射。术语“计算机可读媒体”包含计算机可读存储媒体和通信(例如发射)媒体两者。作为实例而非限制,计算机可读存储媒体可包括存储元件阵列,例如半导体存储器(其可包含(不限于)动态或静态ram、rom、eeprom和/或快闪ram),或铁电、磁阻、双向、聚合物或相变存储器;cd-rom或其它光盘存储装置;和/或磁盘存储器或其它磁性存储装置。此类存储媒体可以可由计算机存取的指令或数据结构的形式存储信息。通信媒体可包括可用于运载呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何媒体,包含促进将计算机程序从一处传送到另一处的任何媒体。并且,任何连接被恰当地称作计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(dsl)或无线技术(例如红外线、无线电和/或微波)从网站、服务器或其它远程源传输软件,那么所述同轴电缆、光纤电缆、双绞线、dsl或无线技术(例如红外线、无线电和/或微波)包含在媒体的定义中。如本文中所使用的磁盘和光盘包含压缩光盘(cd)、激光光盘、光学光盘、数字多功能光盘(dvd)、软性磁盘和蓝光disctm(蓝光光盘协会,环球城,加州),其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。
如本文所述的设备可并入到电子装置(例如通信装置)中,其接受语音输入,以便控制某些操作,或可另外受益于所要噪声与背景噪声的分离。许多应用可受益于从源自多个方向的背景声音促进或分离清楚的所要声音。此类应用可包含并入有例如话音辨识和检测、语音增强和分离、话音激活控制等能力的电子或计算装置中的人机接口。可能需要实施在仅提供有限处理能力的装置中合适的此类声学信号处理设备。
本文所描述的模块、元件和装置的各种实施方案的元件可制造为驻留在(例如)相同芯片上或芯片组中的两个或更多个芯片当中的电子和/或光学装置。此类装置的一个实例为固定的或可编程逻辑元件阵列,例如晶体管或门。本文描述的设备的各种实施方案的一或多个元件还可完全地或部分地实施为经布置以在一或多个固定的或可编程逻辑元件阵列(例如,微处理器、嵌入式处理器、ip核心、数字信号处理器、fpga、assp和asic)上执行的一或多个指令集。
如本文所描述的设备的实施方案的一或多个元件有可能用于实施任务或执行不直接与所述设备的操作有关的其它指令集,例如与其中嵌入有所述设备的装置或系统的另一操作有关的任务。此类设备的实施方案的一或多个元件还有可能具有共同的结构(例如,用以执行对应于不同时间的不同元件的代码的部分的处理器、经执行以执行对应于不同时间的不同元件的任务的指令集,或执行不同时间的不同元件的操作的电子及/或光学装置的布置)。
提供本发明的前述描述来使所属领域的技术人员能够制作或使用本发明。所属领域的技术人员将易于了解对本发明的各种修改,且本文中界定的一般原理可应用于其它变体而不脱离本发明的范围。因此,本发明无意限于本文中所描述的实例和设计,而是应被赋予与本文中所揭示的原理和新颖特征相一致的最广范围。
尽管示范性实施方案可参考利用在一或多个独立计算机系统的上下文中的当前揭示的标的物的方面,所述标的物不限于此,而是可结合任何计算环境(例如网络或分布式计算环境)来实施。再者,目前揭示的标的物的方面可在多个处理芯片或装置中或跨越多个处理芯片或装置实施,且可类似地跨越多个装置实现存储。此些装置可包含例如pc、网络服务器和手持式装置。术语“确定”涵盖广泛多种动作,且因此“确定”可包括计算、运算、处理、导出、调查、查找(例如,在表、数据库或另一数据结构中查找)、查明等。并且,“确定”可包含接收(例如,接收信息)、存取(例如,在存储器中存取数据)等。并且,“确定”可包括解析、选择、挑选、建立等等。换句话说,应理解,所附权利要求书不限于上文所说明的精确配置和组件,且可在不脱离所附权利要求书的范围的情况下,在本文所述的系统、方法和设备的布置、操作和细节中进行各种修改、改变和变化。
尽管已经以特定地针对结构特征和/或方法动作的语言来描述标的物,但应理解,所附权利要求书中所定义的标的物未必限于上文所描述的具体特征或动作。实际上,揭示上文所描述的具体特征和动作以作为实施所附权利要求书的实例形式。