小尺度麦克风阵列语音增强系统和方法

文档序号：2822393阅读：379来源：国知局

专利名称：小尺度麦克风阵列语音增强系统和方法
技术领域：
本发明属于信号处理技术领域，具体涉及一种基于小型麦克风阵列的抗噪系统及方法，包括抗噪系统和相关技术。
背景技术：
随着通讯技术和数字信号处理技术日新月异的发展，人们对多媒体通信的要求越来越高，车载免提通话、视频会议等技术越来越多地得到广泛应用。在这些应用中，视频信号虽然能加大通信的信息量，使得交流更加自然，但人们之间的交流主要还是依靠语言完成，如果声音的质量没有保证，通讯也将变得毫无意义。所以音频信号质量的好坏决定了整个通讯系统的性能，语音是否清晰易懂，是判别这些多媒体系统的基本指标。
然而，现实中的背景噪声，房间混响和其它干扰源发出的声音会极大地破坏语音信号的质量。传统的频域降噪方法根据信号频谱和噪声频谱的特征，在频域上对信号进行滤波，把平稳噪声信号和非平稳的语音信号分离开来。但是，如果噪声信号也是非平稳的，传统的降噪方法遇到了困难。如在嘈杂的鸡尾酒会中，其他人说话的声音就成了噪声，这和主说话人的语音在频域上的统计特性很相似，仅从频域入手分离出有用的语音信号十分困难。但是，应用传声器阵列的语音增强系统则可以通过一些方法使得整个系统的接收增益在空间上形成指向性，也就是在空间上选择感兴趣的信号进行加强，即进行所谓的“空间滤波”。
近几年来，应用阵列信号处理的方法进行语音增强的技术发展迅速，越来越多的应用在语音通讯、人机交互等系统中。
应用阵列信号方法进行信号增强所要解决的问题是在复杂的声学环境中，通过调节各通道滤波器系数来提高整个阵列在特定方向上的接收增益，同时降低其他方向上干扰信号的接收增益，从而提高输出信号的信噪比。
基于上述问题，很多人进行了这方面的研究。目前面临如下两个问题1.只能对固定方向的声源信号进行增强，这样就使增强系统有了很大的局限性。在声源位置变化的时候，必须通过调整阵列的角度使阵列的指向性对准声源位置。但在很多场合，这种人工调整是非常不便的，如远程的视频会议等。
2.阵列的尺度问题。以往的麦克风阵列尺度较大(一般为50cm以上)，这使得携带不方便，无法在移动设备上应用。
如果上述问题得到解决，则麦克风阵列语音增强系统就可以得到以下应用1.作为助听器采集语音信号的前端，提高采集信号的可懂度；2.运用在移动手持语音采集设备中，比如手机，对讲机，手持录音机等；3.在车载的语音交互控制系统中，运用麦克风阵列可以使驾驶者通过口令控制车的某些部件动作，如开关车窗，反光镜的角度调节等，大大方便了驾驶者；4.运用在采访设备中时，无需移动采集系统的位置，就可以在一定距离内跟踪被采访人的信号，使得语音采集效果提高。

发明内容
本发明的目的就是解决麦克风阵列的上述问题，提出了一种基于小尺度的麦克风阵列语音增强系统和方法，可以去除采集过程中引入的环境噪声，使得采集到的声源信号信噪比提高，从而获得更好的声源信号。在大多情况之下声源信号为语音信号，经过去噪处理对语音的可懂度有所提高。
本发明的小尺度麦克风阵列语音增强系统主要分为信号采集和信号处理两个子部分。
信号采集部分由麦克风阵列和AD转换器组成。含噪语音信号由麦克风采集为模拟信号，通过AD转换器转化成数字信号，在DSP处理芯片中进行信号增强，然后再通过usb口传输到计算机上进行保存。
麦克风阵列由3个成等边三角形放置的全指向性麦克风组成，负责采集模拟的语音信号。所谓全指向性，就是麦克风在空间各个方向上的接收增益都相同。这样摆放可以通过自适应方法得到6组不同的指向性增益，从而当声源位置自适应模块得到声源位置时，可以按照该位置方向选择合适的指向性增益。
AD转换器则负责将该模拟信号转化为数字信号，供DSP进行处理。
信号处理部分由麦克风一致性校正模块，自适应噪声消除模块，信噪比估计模块和声源位置自适应模块等组成。
麦克风一致性校正模块由三个FIR滤波器组成，其中一个滤波器为全通滤波器，作用只是使得三个通道的信号经过此模块后的延时相同，另外两个滤波器是通过测量三个麦克风的传递函数，基于三个麦克风的传递函数构造而成；。
自适应噪声消除模块由自适应噪声消除滤波器组成，其中构造是基于改进的自适应零限波束形成方法；自适应滤波器的阶数可以根据信噪比估计模块得到的噪声强度设定。
信噪比估计模块是通过计算噪声的能量，然后通过和设定的门限阈值进行比较，输出是对自适应噪声消除模块中滤波器长度的控制信号。
声源位置自适应模块由波束形成器，和语音能量分析器组成，通过构造不重制向性的波束，然后分析各个波束中的语音能量，得到生源的大致位置，然后发出控制信号，使自适应噪声消除模块的指向性增益指向声源方向。
另一方面，本发明的小尺度麦克风阵列语音增强方法主要分为两大步骤信号采集和信号处理。
含噪语音信号由麦克风采集为模拟信号，通过AD转换器转化成数字信号，在DSP处理芯片中进行信号增强，然后再通过usb口传输到计算机上进行保存。
信号处理则由麦克风一致性校正、自适应噪声消除、信噪比估计和声源位置自适应等步骤。
麦克风一致性校正该步骤首先通过播放校准信号，采用最小均方(LMS)方法获得两个麦克风之间的相对传递函数，然后使采集到的信号通过此函数，去除麦克风传递函数对信号接受的影响，从而有效的校正了麦克风之间的不一致性，使得增强方法对麦克风的差异不敏感，提高了增强方法的鲁棒性。
自适应噪声消除通过可变滤波器阶数的自适应零限波束形成模块可以构造前向心形和后向心形的指向性，得到包含噪声的语音信号和不含语音的噪声信号，然后通过自适应滤波器滤除语音信号中包含的噪声信号，得到纯净的语音信号。
信噪比估计在低信噪比的条件下，将会使多阶的自适应滤波器难以收敛。此模块通过对信号的信噪比进行粗略估计，在低信噪比的情况下将滤波器的阶数降低，使得滤波器在任何信噪比情况下都可以成功收敛，这一步骤确保了自适应噪声消除的准确性。
声源位置自适应处理首先通过调节麦克风阵列的指向性获得不同方向增益最大时的接收信号，然后对其中的语音成分进行分析，找到声源的大致位置，并将该位置信息传递给自适应噪声消除模块，调整阵列的指向性增益，使信号增强方向对准声源位置。
本发明主要的特点在于1.独特的三麦克风语音增强技术，比以往的双麦克风增强效果更加理想；2.将Null-Forming方法进行改进，使用改变长度的自适应滤波器，使得系统获得更好的增强效果；3.加入麦克风一致性校正技术，使得尽管用很少的麦克风数量，仍旧可以得到很好的增强效果。这就使小尺度的麦克风阵列得以实现；4.通过构造不同的麦克风指向性，采集不同方向上的信号，然后分析信号特性，找出目标声源的位置，然后对阵列的指向性进行调整，达到跟踪声源信号的目的；5.通过对噪声能量的检测来实时调节自适应滤波器的长度，可以对非平稳的噪声进行很好的去除。

下面结合附图对本发明进一步详细地说明图1是信号采集部分系统构架示意图；图2是麦克风阵列形状示意图；图3是信号处理流程图；图4是改进的自适应零限波束形成方法示意图；图5是麦克风阵列指向性示意图。
具体实施例方式
下面参照本发明的附图，更详细地描述本发明的最佳实施例。
本发明的小尺度麦克风阵列语音增强系统主要分为信号采集和信号处理两个子部分。
图1所示为信号采集部分系统构架示意图，信号采集部分由麦克风阵列和AD转换器组成。含噪语音信号由麦克风采集为模拟信号，通过AD转换器转化成数字信号，在DSP处理芯片中进行信号增强，然后再通过usb口传输到计算机上进行保存。
1.信号采集部分实施原理和方法本系统通过3个全指向性的麦克风对声源进行信号采集，麦克风阵列成等边三角形，三角形的边长为2.54cm，如图2所示麦克风阵列采集到的模拟信号经过Ti公司的AD芯片转化为16kHz采样，16bit量化的数字信号.然后通过多路信号处理板进行信号处理。其中，麦克风一致性校正，自适应噪声消除，信噪比估计和声源位置自适应等模块都通过板上的TI 5509DSP芯片实现。最后通过系统板的USB接口传输到电脑进行播放或者数据保存。
2.信号处理部分的实施原理和方法信号处理部分方法流程为由三个麦克风采集三路信号，对其中两路使用改进的自适应零限波束形成方法，进行自适应噪声消除，同时进行噪声能量的估计，将估计结果传递给自适应噪声消除模块，调节滤波器的长度。
同时通过三个麦克风构造差分麦克风阵列，通过改变指向性，获得各个方向的信号，分析得出大致的声源位置，然后传递给自适应噪声消除模块，选择增强方向。图3所示为信号处理部分的方法流程1)麦克风一致性校正模块由于制造工艺和和其他多方面原因，两个麦克风的频响和时延特性都有一些差别，这可能会导致方法计算结果的误差，使得方法性能下降。为了适应各种不同的麦克风，提高方法的普适性，本文通过测量两个麦克风输入信号的相关性，考察两通道之间的差异，利用自适应方法，得到被校准通道相对于参考通道的冲击响应曲线，从而使两个麦克风在与声源距离相等的时候，输出的信号完全相同。
由于现实中麦克风的频响曲线不会很平，不能认为是一个全通滤波器。所以在这里设H1，H2为他们各自的冲击响应。本发明中在H2后面加入一个滤波器F，使输出信号最小。
设输入信号为s(t)，麦克风的传递函数分别为h1(t)，h2(t)。
设最后得到的补偿滤波器传递函数c(t)，则有s(t)*h1(t)＝s(t)*h2(t)*c(t)h1(t)＝h2(t)*c(t)c(t)=h2-1(t)*h1(t)]]>为了求得c(t)，我们不去直接求h2-1(t)，而是采用自适应滤波的方法。如图所示，令两通道输出之差e(t)的功率最小化，即Min|e(t)|2＝(sout1(t)-sout2(t)*c(t))2通过最小均方(LMS)方法即可得到c(t)系数。通过上述方法得到3个麦克风中2个相对与另一麦克风的传递函数c1(t)，c2(t)。将这两个麦克风的输入经过以c1(t)，c2(t)为系数的滤波器，另外一个麦克风经过长度和c1(t)相同的全通滤波器，这样作的目的是为了不引入附加的时延。
2)噪声能量估计模块在改进的Nullforming方法中，后向心形指向性所得到的信号y(n)为噪声参考信号，本模块通过计算y(n)的能量，来控制自适应滤波器的长度，将信号分帧处理，410个样点为一帧，取10帧的归一化能量作为判据，并且每隔1s进行一次噪声估计，这样做一方面是为了避免由于频繁改动滤波器的长度，使得滤波器的收敛受到影响，另一方面也节省了计算量。
若AD转换的最大值为A，则有E(n)=Σn=110Σm=0410(y(n)/A)2]]>若E(n)＞500，则调整自适应滤波器的阶数为1。原因在于此时噪声很大，长阶的滤波器VAD估计不准确，导致收敛效果不好，需采用自适应零限滤波器。
若200＜E(n)＜500，则调整自适应滤波器的阶数为12。
若E(n)＜200，则调整自适应滤波器的阶数为16。
3)声源位置自适应模块通过运用差分方法，调节两个麦克风信号相减后的时延差，可以控制麦克风最大增益方位和零点的方向。
由双通道麦克风差分输入的增益公式H(θ)＝τ+d/ccosθ通过调节τ获得不同方向的指向性，本发明通过改变τ值得到空间中不同的8组指向性增益，对获得的信号分析语音在其中占有的能量成分，通过VAD检测，认为语音信号能量最大的方向是声源信号的方向。本模块将此信息传递给自适应噪声消除模块，控制增强的方向。
4)改进的自适应零限波束形成(Null-Forming)本系统采用改进的Null-Forming方法，这是一种基于差分麦克风阵列技术的自适应语音增强方法。在如图4所示的原理图中，前端传声器(front microphone)和后端传声器(back microphone)收到的信号分别是f(n)和b(n)，d是两传声器的间距，相应的d/c是两通道的延迟时间，W(n)自适应滤波器的系数，a(n)是自适应滤波器的输出，z(n)是整个系统的输出。
b(n)的信号经过延迟d/c后，与前端f(n)相减。x(n)的指向性为前向的心形，零点在180°。相反地，y(n)的指向性为后向的心形，零点在0°。在这个方法中，我们认为y(n)为噪声参考信号，x(n)为含噪声源信号。
整个系统的输出z(n)对应的极坐标图形由x(n)和y(n)经过自适应滤波器W(n)得到。与传统的Null-Forming方法不同，本发明采用的自适应滤波器W(n)不是简单的开环形式一阶LMS滤波器，而是一个阶数可变的自适应滤波器，根据噪声估计模块的输出阶数在1阶，12阶和16阶之间变化，从而使滤波器可以在非平稳的噪声中获得很好的效果。
在强噪声情况下，W(n)是一个简单的开环形式一阶LMS滤波器。因为不需要语音端点检测，可以对噪声有很快的反应；在弱噪声情况下，W(n)是闭环高阶LMS滤波器，这种滤波器的指向性更强，也有更好的抗混响能力。
当本模块收到声源位置信息时，选择三个麦克风中的两个，通过改进的Null-Forming方法，使增强方向对准声源的方向。且三个麦克风呈等边三角形分布，根据Null-Forming的特点可以得到(A-F)6组不同的增强方向，如图5所示。这样就比双麦克风的Null-Forming方法有了更多的灵活性。
尽管为说明目的公开了本发明的具体实施例和附图，其目的在于帮助理解本发明的内容并据以实施，但是本领域的技术人员可以理解在不脱离本发明及所附的权利要求的精神和范围内，各种替换、变化和修改都是可能的。因此，本发明不应局限于最佳实施例和附图所公开的内容。
权利要求
1.一种小尺度麦克风阵列语音增强系统，包括信号采集和信号处理两个子部分，具体结构如下1)信号采集部分由麦克风阵列和AD转换器组成，麦克风阵列由3个成等边三角形放置的全指向性麦克风组成；2)信号处理部分由麦克风一致性校正模块、自适应噪声消除模块、信噪比估计模块和声源位置自适应模块组成麦克风一致性校正模块，由三个FIR滤波器组成，其中一个滤波器为全通滤波器，另外两个滤波器基于三个麦克风的传递函数构造而成；自适应噪声消除模块，由自适应噪声消除滤波器组成，它基于改进的自适应零限波束形成方法构造而成；信噪比估计模块，用于计算噪声的能量，并将计算结果与设定的门限阈值进行比较，输出对自适应噪声消除模块中滤波器长度的控制信号；声源位置自适应模块，由波束形成器和语音能量分析器组成。
2.如权利要求1所述的小尺度麦克风阵列语音增强系统，其特征在于所述的全指向性，是指麦克风在空间各个方向上的接收增益都相同。
3.如权利要求1所述的小尺度麦克风阵列语音增强系统，其特征在于自适应滤波器的阶数根据信噪比估计模块得到的噪声强度设定。
4.一种小尺度麦克风阵列语音增强方法，包括信号采集和信号处理两大步骤，具体步骤如下信号采集是由麦克风将含噪语音信号采集为模拟信号，通过AD转换器转化成数字信号，在DSP处理芯片中进行信号增强，然后传输到计算机上进行保存；信号处理包括对采集的信号进行麦克风一致性校正，自适应噪声消除，信噪比估计，声源位置自适应处理。
5.如权利要求4所述的小尺度麦克风阵列语音增强方法，其特征在于，麦克风一致性校正采用的方法是首先通过播放校准信号，采用最小均方方法获得两个麦克风之间的相对传递函数，然后使采集到的信号通过此函数，去除麦克风传递函数对信号接受的影响。
6.如权利要求4所述的小尺度麦克风阵列语音增强方法，其特征在于，自适应噪声消除采用的方法为通过可变滤波器阶数的自适应零限波束形成构造前向心形和后向心形的指向性，得到包含噪声的语音信号和不含语音的噪声信号，然后通过自适应滤波器滤除语音信号中包含的噪声信号，得到纯净的语音信号。
7.如权利要求4所述的小尺度麦克风阵列语音增强方法，其特征在于，信噪比估计采用的方法为在低信噪比的情况下将滤波器的阶数降低，使滤波器在任何信噪比情况下都可以成功收敛。
8.如权利要求4所述的小尺度麦克风阵列语音增强方法，其特征在于，声源位置自适应处理采用的方法为首先通过调节麦克风阵列的指向性获得不同方向增益最大时的接收信号，然后对其中的语音成分进行分析，找到声源的位置范围，并根据该位置信息调整阵列的指向性增益，使信号增强方向对准声源位置。
全文摘要
本发明提出一种小尺度麦克风阵列语音增强系统和方法，根据本发明的系统主要分为信号采集和信号处理两个子部分。信号采集部分由麦克风阵列和AD转换器组成。含噪语音信号由麦克风采集为模拟信号，通过AD转换器转化成数字信号，在DSP处理芯片中进行信号增强，然后再通过usb口传输到计算机上进行保存。信号处理部分由麦克风一致性校正模块，自适应噪声消除模块，信噪比估计模块和声源位置自适应模块等组成。本发明的系统和分可以去除采集过程中引入的环境噪声，使得采集到的声源信号信噪比提高，从而获得更好的声源信号，在大多情况之下声源信号为语音信号，经过去噪处理对语音的可懂度有所提高。
文档编号G10L21/02GK1967658SQ20051008687
公开日2007年5月23日申请日期2005年11月14日优先权日2005年11月14日
发明者迟惠生, 吴玺宏, 曲天书, 赵硕申请人:北京大学科技开发部

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：迟惠生;吴玺宏;曲天书;赵硕
技术所有人：北京大学科技开发部
我是此专利的发明人

上一篇：一种支持多语种放音的实现方法及其系统的制作方法
上一篇：一种amr语音编码的源控制速率实现方法