专利名称:统一标准的麦克风预处理系统和方法
技术领域:
本发明涉及声音处理,尤其是在车内的声音处理。
背景技术:
目前,对于汽车应用,不同的麦克风和处理元件可用于通话、语音识别和主动噪声消除。例如,单个的单向心形麦克风可放置在驾驶员上方的车顶内衬里从而为通话提供最佳接收;和全向麦克风可放置在后视镜上从而为自动语音识别(ASR)提供最佳接收。另外的麦克风(通常是每个乘客一个)可放置在驾驶员和乘客头部上方以使得主动噪声消除能消除例如发动机噪声的影响。多个麦克风和处理元件的使用可能很贵,而且可能质量会打折,原因在于可用于每个目的的麦克风的数量受到成本和设计条件的限制。
发明内容
方案I. 一种统一标准的麦克风预处理系统包括布置在车辆乘客舱内的多个麦克风;构造为接收来自多个麦克风的信号的处理系统;并且该处理系统构造为处理信号以产生增强信号以由通话处理应用、自动语音识别处理应用和噪声消除处理应用中的至少两个使用。方案2.方案I的系统,该处理系统包括构造为转换来自多个麦克风的模拟信号的模拟-数字转换器;构造为储存已转换的模拟信号的存储单元;和构造为在已转换的模拟信号上实施预处理增强技术的控制处理器。方案3.方案I的系统,其中该处理系统包括构造为成形多个麦克风的一个或多个接收波束的波束形成器单元。方案4.方案3的系统,其中波束形成器单元用于成形多个接收波束,并基于车辆乘客舱的声音条件中的变化自适应性地成形多个接收波束。方案5.方案I的系统,该处理系统包括构造为在已接收的信号上实施模拟-数字转换的预处理单元;声音回声消除预处理单元;和以下预处理单元中的至少两个构造为增强数字化的已接收的信号以便增加在电话通信中噪声和残余回声的衰减的通话预处理单元;构造为增强数字化的已接收的信号以
3便优化包括Mel对数倒频谱距离或字诃识别率的语音识别指标的语音识别预处理单元;和构造为获得声压的精确测量值以及将测量值提供给主动噪声消除系统的噪声消除预处理单元。方案6.方案I的系统,其中多个麦克风以几何图案布置。方案7.方案6的系统,其中几何图案是半球形。方案8.方案I的系统,其中该处理是构造为通过以下步骤处理信号以产生由噪声消除处理应用所使用的增强信号的方法定位目标车内人员;重新得到用于目标车内人员附近位置的麦克风排列参数;内插排列参数。方案9. 一种用于统一标准的麦克风预处理的方法,该方法包括接收来自车辆乘客舱内布置的多个麦克风的信号;和增强已接收的信号以由通话处理应用、自动语音识别处理应用和噪声消除处理应用中的至少两个使用。方案10.方案9的方法,进一步包括在信号上实施预处理增强技术;和成形多个麦克风的多个接收波束。方案11.方案10的方法,进一步包括将已成形的多个接收波束引导至驾驶员和车辆乘客舱内的一个或多个乘客中的至少一个。方案12.方案9的方法,进一步包括实施用于声音回声消除的已接收的信号。方案13.方案9的方法,进一步包括通过引导多个接收波束中的至少一个到说话者的嘴部而实施噪声和残余回声衰减;和施加信号增强和信号重建技术。方案14.方案9的方法,进一步包括在已接收的信号上实施语音识别增强预处理以优化包括Mel对数倒频谱距离或字词识别率的语音识别指标。方案15.方案9的方法,其中多个麦克风以几何图案布置。方案16.方案9的方法,包括通过以下步骤产生由噪声消除处理应用所使用的增强信号定位目标车内人员;重新得到用于目标车内人员附近位置的麦克风排列参数;内插排列参数。方案17. —种方法包括接收来自空间位置完全不同的多个麦克风的信号;处理信号以产生已处理的信号;和将已处理的信号提供给多个音频应用,多个音频应用包括通话应用、自动语音识别应用和噪声消除应用中的至少两个。方案18.方案17的方法,包括成形用于一个或多个预处理增强技术的多个麦克风的多个接收波束。
方案19.方案18的方法,包括将已成形的多个接收波束引导到驾驶员和车辆乘客舱内的一个或多个乘客中的至少一个。方案20.方案17的方法,包括实施用于声音回声消除的已接收的信号的增强;通过引导多个接收波束中的至少一个到说话者的嘴部而实施噪声和残余回声衰减,并施加信号增强和信号重建技术;使用Mel对数倒频谱距离或字词识别率指标在已接收的信号上实施语音识别增强预处理;和在车内人员的头部附近实施声压测量。
被认为是本发明的主题内容在说明书的最后部分特别地指出并清楚地要求保护。 但是,本发明,关于操作的组织和方法,以及目标、特征及其优点,在结合附图阅读时参考以下详细说明可以得到最好地理解。图I示出了根据本发明实施例的系统;图2示意地示出了根据图I中系统的部件;图3A和3B描述了用于根据本发明的一个实施例的主动噪声消除方法和系统的噪声测量方法和系统;和图4示出了根据本发明实施例的过程。可以理解,为了说明的简化和清楚,图中所示元件没有必要按比例画出。例如,为了清楚起见一些元件的尺寸相对于其它元件被夸大了。此外,在适当考虑的情况下,在图中的参考数字可重复以表示相应或相似元件。
具体实施例方式在以下详细说明中,提出许多特定细节以便提供对本发明完整的理解。然而,可以理解,对于本领域技术人员来说,本发明在没有这些特定细节时也可实施。在其它例子中, 已知的方法、过程和部件将不详细描述以不会模糊本发明。除非特别说明,否则对于以下讨论显然的是,在整个说明书讨论中使用的术语如 “处理”、“用计算机计算”、“存储”、“计算”、“确定”、“估算”、“测量”、“提供”、“转移”、“输出”、
“输入”等等,是指计算机或计算系统或相似的电子计算装置的操作和/或处理,其将表示为计算系统寄存器和/或存储器内物理(如电子的)量的数据处理和/或转换成类似地表示为计算系统的存储器、寄存器或其它这样的信息储存、传输或显示装置内的物理量的其它数据。根据本发明实施例的系统可提供一种统一标准的麦克风处理系统,以提供音频数据并能实现通话(例如,蜂窝电话装置)、语音识别、主动噪声控制和/或其它功能。在一个实施例中,相同或重叠的麦克风组,例如以诸如部分球形、半球体或半球形的几何图案布置,可在相同或基本相同的时间或同时地向在车辆内的不同音频处理功能(例如,通话、语音识别、主动噪声控制等等)并发地平行提供输入。可选地,重叠的麦克风组可在不同的时间使用相同的麦克风向不同的音频处理功能提供输入。不同种类的输入信号可以是并发平行地在相同的或基本相同的时间或同时地被处理和产生并提供给这些应用,例如,音频应用或首频定向应用。图I示出了根据本发明实施例的统一标准的麦克风处理(UMP)系统100。UMP系统100可以输出增强的或处理后的信号给相关应用(例如,音频应用或音频定向应用)如通话处理应用、ASR处理应用和噪声消除处理应用。使用相同或重叠的处理或使用相同或重叠的麦克风组已形成的分开的已处理的信号(例如,三个不同的信号)或其它数量的已处理的信号可以被提供给各应用。UMP系统100可包括布置在车辆乘客舱内或周围的麦克风 130a-h的排列130。根据本发明的实施例,麦克风130a-h的排列130可以布置在放置在乘客舱的内饰顶或车顶内衬上的半球体或半球形单元130内,例如在驾驶员和乘客之间,或在通常的座位位置或供车内人员(例如,驾驶员和零个或多个乘客)使用的座椅之间。虽然麦克风130a-h可共同定位在一个单元内,但它们可分开一些距离以便在空间位置上完全不同。在一个实施例中,使用八个麦克风,但是也可使用其它数量的麦克风。可以使用其它麦克风位置、布置形状或布置以及麦克风的数量。在一个实施例中,半球形单元可以是大约10-15厘米的直径。麦克风130a-h可以例如通过诸如有线连接、网络或其它系统之类的连接装置135连接到处理电路110。在一个单元中包括用于多个目的的多个麦克风与具有展开的均要求其自身配线系统的麦克风的系统相比可以减少配线。在其它实施例中,麦克风130a-h可以不在同一单元中的情况下在车辆内分配。处理电路110可包括信号放大器122以增加麦克风信号电平。根据本发明的实施例,麦克风130a_h均可包括放大器或与放大器连接。根据本发明的实施例,处理电路可在硬件中(例如,离散模拟电路、包括现场可编程门阵列(FPGA)的数字电路、特殊应用集成电路(ASIC)、数字信号处理器(DSP)和/或处理单元)、软件中或硬件和软件的结合中(例如, 由诸如中央处理器单元118之类的处理器或控制器执行的代码或指令)实现。处理电路110可包括模拟-数字(A/D)转换器112、闪存单元114、随机存取存储单元116、控制或中央处理器单元118和连接这些部件的内部总线120。存储单元116可包括存储例如在噪声消除或其它功能校准期间产生的数据的表或数据库124。在操作中,可以确定使用者或使用者的耳朵的实际位置。来自相机410、排列130和/或A/D转换器112的输入可以接收来自一个或多个麦克风130a_h的模拟信号。接收的模拟信号可以被转换为例如适合在RAM单元116或闪存单元114内处理或储存的数字信号。控制处理器单元118 可存取已储存的数字信号并实施音频预处理信号增强技术以改善例如通话、主动噪声衰减或消除、ASR和/或其它应用的性能。这些增强的信号可制成能在数据总线140上获取以由这些或其它应用存取。在处理电路110内的波束形成器可接收来自N麦克风的信号并输出单个增强质量的信号。在这个实施例中输出信号包括例如用于通话的信号、用于ASR的信号和用于主动噪声消除的一个或多个信号;可选择地,统一标准的波束形成信号可以被提供给多个单元,且波束形成可以不用于所有应用。统一标准的波束形成可以不应用在噪声消除处理应用的预处理中。—个或多个扬声器145可输出例如噪声消除声音、电话或收音机输出或其它输出 (不同的或相同的或重叠的扬声器可以与每个应用相关联)的声音。根据本发明的实施例,数字信号可以由控制处理器单元118处理,原因在于从麦克风130a-h接收的信号已通过A/D单元112转换。后处理数字信号可以例如储存在RAM单元116和/或闪存单元114内和/或传递到其它单元或应用。闪存单元114或RAMl 16可储存或容纳软件代码,当由控制处理器单元118执行时,其可使得控制处理器执行本文所述过程,例如处理已储存的或正输入的数字信号、波束形成、噪声消除、ASR等等。在一个实施例中,闪存114可包括通过控制处理器118经由输入/输出端口(未示出)存取的外部闪存。闪存单元114或RAM116可储存或容纳中间信号或数据,或用于其它单元(例如应用)的数据。根据本发明实施例的多个麦克风的紧凑布置可通过形成或成形多个引导向车内人员(例如,驾驶员和乘客)的接收波束使得能进行空间滤波,其中每一个接收波束可以同时使用所有麦克风。波束形成、空间滤波或其它信号处理技术可以通过例如在某种程度上组合麦克风输入用来达到定向声音接收,其中在特定角度的信号经历相长干涉而其它信号经历相消干涉。可以使用其它技术,例如使用来自一个麦克风的噪声信号去消除或清理来自另一麦克风的噪声。分开的接收波束式样可以形成用于每个目的,例如,通话、ASR、主动噪声衰减或消除等等。这些分开的接收波束式样中的每个可以构造为使用所有麦克风以便获得用于每个目的的最佳接收的信号以实现优化的处理性能。在一些实施例中,可以使用附属组的麦克风用于特定应用。如本发明实施例中使用的空间滤波、波束形成和信号增强可以自适应于乘客舱内音频条件的变化并可由乘客舱内音频条件的变化作出反应或控制,例如,乘员的实际数量、 他们在乘客舱内的准确位置、噪声条件等等。图2示意地示出了根据本发明实施例的UMP系统100的部件。这些部件可以是处理电路100的一部分,或由控制处理器118执行或处于其内。因此部件210、220、230、240、250可以在硬件中、软件中或硬件和软件的组合中实现。虽然在一个实施例中一组麦克风向通话、主动噪声衰减或消除ASR应用提供输入,但在其他实施例中,可以使用不同的一组应用。预处理单元210可以构造为执行从麦克风130a_h接收的麦克风信号的A/D转换。 (A/D转换也可以或可选择地由图I中的A/D单元112实施)预处理单元210可以包括例如增益控制、分解成处理结构、信号转换为频率域、声音活跃性检测和/或其它功能性。预处理可以例如通过由处理器(例如,执行存储在RAMl 16内的软件的处理器118)执行的软件或专门硬件单元或两者组合实施。回声消除预处理单元220可以通过例如使用利用实时扬声器信号的扬声器反馈、 消除在乘客舱内由扬声器产生的音频来增强数字化的麦克风信号。声音回声消除预处理单元220可被供给来自预处理单元210的输出信号以及来自乘客舱内一个或多个扬声器的输入222,例如扬声器输入或扬声器反馈信号。在一个实施例中声音回声消除预处理单兀220 向ASR预处理或ASR应用和通话预处理或通话应用提供输出但不向噪声消除预处理或应用提供输出;可以使用其它配置。波束形成步骤或过程可以通过由处理器(例如,执行存储在RAM116内的软件的处理器118)执行的软件或通过专门硬件单元或通过两者组合实施。波束形成步骤或过程可以接受输入和接收到的声音数据并且可以形成特定的接收波束样式。在一个实施例中, 分开的接收波束样式可以成形或形成用于每个相关的目的,例如,通话和ASR;在其它实施例中仅仅使用一个波束样式。在一个实施例中,统一标准的波束形成单元使用相同的波束形成步骤输出到通话(例如,经由电话预处理单元230)和ASR(例如,经由ASR预处理单元 240)但不输出到主动噪声控制。在其它实施例中,波束形成可以输入到不同组应用。可以使用统一标准的波束形成,用于多个应用的一个波束形成过程。在其它实施例中,某些应用可以包括或使用分开的波束形成。用于通话或其它单元增强的波束形成可以包括利用所有麦克风130a_h或附属组的麦克风,并且可以具有被导向(例如,使用波束形成)车内人员嘴部期望位置的初始缺省接收样式。根据本发明的实施例,波束的方向可以是自适应的,以便车内人员声音的信号质量被优化。最小方差无失真响应波束形成可以用来尽可能减少干扰而不在排列注视方向弓I 入失真。电话预处理单元230可以构造为执行用于通话应用的数字化麦克风信号的预处理增强。电话预处理单元230可以在通过构建在乘客车舱内的通话系统、连接上的个人电话和/或智能电话执行的电话通信中衰减噪声和残余回声。通过通话预处理单元230的处理可以包括例如其中波束被朝向说话者的嘴部引导的波束形成(统一标准的或其它方式);信号增强;信号重建和/或其它功能。通过通话增强单元230的信号重建可以将语音从频率域转换到时间域,例如使用傅立叶转换技术。通过通话预处理单元230的处理可以包括噪声衰减过滤器,如单通道噪声衰减。 通话预处理单元230可使用诸如功率谱或对数谱幅度的指标进行优化。通话预处理单元 230可以是自适应的,如在广义旁瓣对消器中。通话预处理单元230可以使用后置过滤器以衰减由回声消除剩下的残余回声。可以使用不同的处理,或各自用于不同的目的或应用的不同的处理模块。可以使用除通话、ASR和噪声衰减或消除之外的与应用相关的处理模块。当可以使用统一标准波束形成时,ASR预处理单元240可实施不同的波束形成,或与通过电话预处理单元230完成但是为了不同的目的和指标(例如,字词识别率或精确度) 的处理相似的波束形成器和信号增强算法。ASR预处理单元240可以使用与语音识别前端相关的信号特征,其可以不同于用于通话增强的信号特征。ASR预处理单元240可以包括噪声衰减过滤器如单通道噪声衰减。ASR预处理单元240可以在mel对数倒频谱域内的过滤器优化指标信号失真时使用。mel对数倒频谱经常用于语音识别系统的前端。ASR预处理单元240可以优化包括字词识别率的语音识别指标。语音重建技术如音乐噪声、残余回声和全双工性能对于语音识别不那么重要。ASR 增强单元240可以最大化字词识别精确度。噪声消除预处理单元250可以构造为执行预处理以获得声压、噪声或残余噪声的精确测量,并为主动噪声消除系统提供信号以增强其性能。外部或集成主动噪声消除系统可以使用该信号。噪声消除可在例如20-250Hz的范围或其他范围内执行。主动噪声消除增强可包括在耳朵附近测量由例如汽车发动机产生的典型的低频噪声或其它噪声。噪声测量可通过由麦克风130a-h形成的一组麦克风来执行。消除可通过经由扬声器产生“反相噪声”来执行。声压可以在车内人员(例如,驾驶员和乘客)的头部(例如,耳朵)附近测量以获得良好的消除。各种位置的测量,每个位置对应于驾驶员或乘客,可以例如使用相机大致获得。可以使用其它定位方法,例如,波束形成。不同的波束可以形成用于每个乘客和用于驾驶员。
图3A和3B描述了根据本发明一个实施例的用于主动噪声消除方法和系统的噪声测量方法和系统。噪声消除预处理单元250 (图2)或噪声消除系统255 (图2)可以在使用前在工厂或其它地方校准。在工厂,参考麦克风400、402和404(可以使用其它数量的麦克风,并用通常使用多于三个的麦克风)可以如在栅格上或虚拟栅格上放置在特定位置。车辆也可包括麦克风130a-h的排列130。车辆可以是用来校准如用于许多其它车辆的噪声消除预处理单元的系统的测试车辆,或车辆可以是将要单独校准的个别车辆。通常,麦克风 400,402和404根据栅格(相应于或位于点401、403、405处)布置在期望被定位的使用者头部附近的位置,以模拟可选的使用者的位置。(可以使用多于三个的栅格点和麦克风数量)。实时噪声(例如,发动机噪声)可以在如20-250HZ的频率范围内或其它范围内由一个或多个噪声源415提供。每个点401、403和405的噪声衰减参数可以使用由麦克风130a_h 获得的输入进行计算。对于每个点401、403和405和相应的麦克风400、402和404点位置, 可以优化噪声衰减系统参数如波束形成参数,并存储在表或数据库中或可存取到噪声消除预处理单元250。优化可包括优化用于每个点401、403和405和相应的麦克风400、402和 404位置的参数以便使用排列130的信号最接近麦克风400、402和404的信号。在这样的表中的每条记录可包括对应于栅格或排列点401、403和405的参数G(例如,G可以是由三维坐标定义的点),并且对于每个参数G,相应组的排列参数H对应于位置G。G和H均是针对这些参数的索引或指示器。例如,以下的表I可以存储在数据库124内并可包括
权利要求
1.统一标准的麦克风预处理系统,包括布置在车辆乘客舱内的多个麦克风;构造为接收来自多个麦克风的信号的处理系统;并且该处理系统构造为处理信号以产生增强信号以由通话处理应用、自动语音识别处理应用和噪声消除处理应用中的至少两个使用。
2.如权利要求I所述的系统,所述处理系统包括构造为转换来自多个麦克风的模拟信号的模拟-数字转换器;构造为储存已转换的模拟信号的存储单元;和构造为在已转换的模拟信号上实施预处理增强技术的控制处理器。
3 如权利要求I所述的系统,其中所述处理系统包括构造为成形多个麦克风的一个或多个接收波束的波束形成器单元。
4.如权利要求3所述的系统,其中波束形成器单元用于成形多个接收波束,并基于车辆乘客舱的声音条件中的变化自适应性地成形多个接收波束。
5.如权利要求I所述的系统,所述处理系统包括构造为在已接收的信号上实施模拟-数字转换的预处理单元;声音回声消除预处理单元;和以下预处理单元中的至少两个构造为增强数字化的已接收的信号以便增加在电话通信中噪声和残余回声的衰减的通话预处理单元;构造为增强数字化的已接收的信号以便优化包括Mel对数倒频谱距离或字词识别率的语音识别指标的语音识别预处理单元;和构造为获得声压的精确测量值以及将测量值提供给主动噪声消除系统的噪声消除预处理单元。
6.如权利要求I所述的系统,其中多个麦克风以几何图案布置。
7.如权利要求6所述的系统,其中几何图案是半球形。
8.如权利要求I所述的系统,其中所述处理是构造为通过以下步骤处理信号以产生由噪声消除处理应用所使用的增强信号的方法定位目标车内人员;重新得到用于目标车内人员附近位置的麦克风排列参数;内插排列参数。
9.用于统一标准的麦克风预处理的方法,所述方法包括 接收来自车辆乘客舱内布置的多个麦克风的信号;和增强已接收的信号以由通话处理应用、自动语音识别处理应用和噪声消除处理应用中的至少两个使用。
10.一种方法包括接收来自空间位置完全不同的多个麦克风的信号;处理信号以产生已处理的信号;和将已处理的信号提供给多个音频应用,多个音频应用包括通话应用、自动语音识别应用和噪声消除应用中的至少两个。
全文摘要
统一标准的麦克风预处理系统和方法。所述系统包括布置在车辆乘客舱内的多个麦克风,构造为从多个麦克风中的一个或多个接收信号的处理电路或系统,并且该处理电路构造增强已接收的信号以由通话处理应用、自动语音识别处理应用和噪声消除处理应用中的至少两个所使用。该方法包括接收来自布置在车辆乘客舱内的多个麦克风中的一个或多个的信号;并且增强已接收的信号以由通话处理应用、自动语音识别处理应用和噪声消除处理应用中的至少两个所使用。还描述了包含可执行指令以使得处理器执行根据本发明实施例的方法的计算机可读介质。
文档编号H04R3/02GK102595281SQ20121005157
公开日2012年7月18日 申请日期2012年1月13日 优先权日2011年1月14日
发明者E·齐尔克尔-汉科克, O·尖霍尼 申请人:通用汽车环球科技运作有限责任公司