一种用于拾音器的基于递归最小追踪的噪声估计方法与流程

文档序号:13289898阅读:286来源:国知局
技术领域本发明涉及应用于拾音器语音增强系统的噪声估计方法,尤其涉及一种基于递归最小追踪的噪声互功率谱估计方法,属于语音信号处理中语音增强技术领域。

背景技术:
二元麦克风语音增强系统,应用于免提系统、助听器以及人工耳蜗等系统中时,具有独特的优势。目前,相干性滤波器已被很好的应用于二元麦克风语音增强系统中。然而,当两个麦克风之间的距离比较近时,两个通道将的噪声将呈现出相关性,此时相干性滤波器的消噪性能将大为降低。此时,若能求出噪声间的互功率谱密度(crosspowerspectraldensity,CPSD)将有效的解决这一问题。Fathi以二元麦克风系统为基础提出了一种改进最小追踪(improvedminimumtracking,IMT)噪声CPSD估计方法(KALLELF,GHORBELM,FRIKHAM,etal.AnoisecrossPSDestimatorbasedonimprovedminimumstatisticsmethodfortwo-microphonespeechenhancementdedicatedtoabilateralcochlearimplant[J].AppliedAcoustics,2012,73(3):256-264.),无需借助语音检测技术,无论在有声或无声时都能对噪声CPSD进行更新。但是该算法所估计的噪声CPSD无法快速跟踪噪声的变化,在语音的活动期会出现噪声过估计的现象。信号模型:两个麦克风接收到的带噪语音信号可表示为:(1)其中“i”表示麦克风的序号,yi(n),si(n)和vi(n)分别表示带噪语音,纯净语音信号和噪声信号。对式(1)两边做短时傅里叶变换使其变成频域形式:(2)其中ω表示频率因子,k表示帧因子。IMT噪声CPSD估计算法:IMT噪声CPSD估计算法是基于这样一个假设,即哪怕在语音活动期间,单个频带的带噪语音信号功率通常都会衰减到噪声的功率水平。因此通过在每个频带跟踪带噪语音的最小值,可以得到该频带噪声水平的一个粗略估计。图1展示的就是一个基于IMT算法的语音增强系统。IMT算法首先通过以下递归式对带噪语音进行短时平滑:(3)然后IMT算法在每个频点对带噪语音CPSD的最小值(RV1V2min(ω,k))进行跟踪,用公式表达为:(4)带噪语音CPSD的最小值RV1V2min(ω,k)与噪声CPSD的估计值PV1V2(ω,k)之间的关系为:(5)其中Bmin为偏置参数。对IMT算法的研究发现,IMT算法会连续的对带噪语音CPSD进行平滑,而不管是否有语音存在。因此无论噪声CPSD是否增加,只要带噪语音的CPSD变大,噪声CPSD估计也会跟着变大。这主要是由于公式(4)的第二项,它实现了一个一阶差分运算,可以视为离散情况下对求导的一种近似。当带噪语音CPSD出现很窄的峰值的时候,此时会有很大的导数值,噪声估计会突然的大幅变大。因而在语音活动期间,IMT算法会对噪声过估计。而在语音高能量段的噪声过估计会导致其后紧跟的低能量的语音段被抑制。有鉴于此,有必要提供一种用于拾音器的基于递归最小追踪的噪声估计方法,以解决上述问题。

技术实现要素:
本发明的目的是:针对上述问题,本发明通过引入时间递归平均算法予以克服,提出一种基于递归最小追踪的噪声互功率谱估计方法。该方法在估计噪声CPSD时,其迭代公式中的平滑因子采用递归平均技术,会根据每个频点的实际信噪比而自适应的改变。不同环境下的仿真结果表明,与IMT噪声CPSD估计算法相比,本发明提出的方法估计的噪声CPSD更加准确,应用于语音增强系统中对语音的增强效果也更好。本发明所采用的技术方案是:一种用于拾音器的基于递归最小追踪的噪声估计方法,其特征在于,包括如下步骤:1)建立信号模型:两个麦克风接收到的带噪语音信号可以表示为:(1)其中,“i”表示麦克风的序号,yi(n),si(n)和vi(n)分别表示带噪语音,纯净语音信号和噪声信号;对式(1)两边做短时傅里叶变换使其变成频域形式:(2)其中,ω表示频率因子,k表示帧因子;2)采用IMT噪声CPSD估计算法:其原理是通过在每个频带跟踪带噪语音的最小值,可以得到该频带噪声水平的一个粗略估计,其中:IMT算法首先通过以下递归式对带噪语音进行短时平滑:(3)然后IMT算法在每个频点对带噪语音CPSD的最小值(RV1V2min(ω,k))进行跟踪,用公式表达为:(4)带噪语音CPSD的最小值RV1V2min(ω,k)与噪声CPSD的估计值PV1V2(ω,k)之间的关系为:(5)其中,Bmin为偏置参数;3)将步骤2)中IMT算法的平滑因子替换为后验信噪比的sigmoid函数:(6)其中,β参数的一般的取值范围为15≤β≤30,但在实际情况中可能会远远超出这个范围;λ(ω,k)为平滑因子,而γ(ω,k)则是后验信噪比的近似:(7)式(7)中的分母为过去10帧的噪声功率谱估计值的平均;对公式(7)进行调整以用于二元麦克风系统中:(8)将上述递归平均技术用于步骤2)中的IMT算法中可得:(9)。本发明的有益效果是:将本方法应用于拾音器中,相比已有的语音增强系统的噪声估计方法,本发明针对IMT噪声CPSD估计方法为基础,引入递归平滑技术,得出了一种基于递归最小追踪的噪声CPSD估计方法。因为采用了递归平滑因子,该方法克服了IMT方法所存在的噪声过估计的问题,所得到的噪声CPSD估计更加准确。仿真结果表明,较之于IMT方法,无论是噪声CPSD估计的准确性还是增强后语音的质量,本发明提出的方法都取得了更好的仿真结果。附图说明图1是IMT噪声CPSD估计方法的原理图。图2是本发明的平滑因子λ(ω,k)和后验信噪比γ(ω,k)间的函数关系曲线。具体实施方式为了更好地理解本发明,下面结合实施例进一步阐明本发明的内容,但本发明的内容不仅仅局限于下面的实施例。本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样在本申请所列权利要求书限定范围之内。为克服背景技术的问题,本发明采用一种递归最小追踪的改进算法。该算法利用了噪声对语音频谱影响不均匀的现象。这一现象是指语音的有些频谱区域受噪声影响比其他一些区域所受影响更大,不同频谱的分量极有可能具有不同的实际信噪比。因此,可以对噪声的CPSD按单个频带进行估计和更新。LIN以单通道为基础提出一种递归平均技术(LINL,HOLMESWH,AMBIKAIRAJAHE.Adaptivenoiseestimationalgorithmforspeechenhancement[J].ElectronicsLetters,2003,39(9):754-755.),平滑因子使用了后验信噪比的sigmoid函数:(6)其中β参数的一般的取值范围为15≤β≤30,但在实际情况中可能会远远超出这个范围。而γ(ω,k)则是后验信噪比的近似:(7)式(7)中的分母为过去10帧的噪声功率谱估计值的平均。对公式(7)进行调整以用于二元麦克风系统中:(8)将上述递归平均技术用于IMT算法中可得:(9)公式(6)中所描述的平滑因子λ(ω,k)和后验信噪比γ(ω,k)间的函数关系曲线如图2所示。虽然采用不同的β值计算得到的λ(ω,k)与γ(ω,k)的函数曲线不同,但是他们却有一个共同的特征:当后验信噪比γ(ω,k)较大的时候,λ(ω,k)→1;当后验信噪比γ(ω,k)取较小值的时候,λ(ω,k)→0。所以公式(9)可以做如下解释:如果存在语音,即在语音的活动期,后验信噪比估计γ(ω,k)取为大值,此时λ(ω,k)≈1。而当λ(ω,k)≈1时,根据公式(9)可以得到,噪声的CPSD估计会在语音的活动期噪声会暂时停止更新。相反,如果不存在语音,即语音处于静默期,在这种情况下认为后验信噪比估计γ(ω,k)取小值。根据图1所示可知此时λ(ω,k)≈0。根据公式(9)可以知道,此时噪声的CPSD估计值会紧跟带噪语音的CPSD变化。相对于公式(3)使用的固定平滑因子λ,信噪比相关的平滑因子λ(ω,k)的优点在于这些平滑因子与时间和频率相关。这意味着噪声的CPSD会根据不同频点的后验信噪比λ(ω,k),在不同的频点以不同的速率做自适应,这对于背景噪声为有色噪声的情况特别适用。仿真分析:为衡量上述方法性能,将本发明方法应用到基于先验信噪比的相干性滤波器中。仿真测试中,采样率为8kHz,窗函数采用hamming窗,每帧长度为32ms,帧移为50%。麦克风阵列放置于长6m宽4m高3m的房间里。两个麦克风的坐标分别位于(2:0.94:1)和(2:1.06:1),目标声源位于(3:1.03:1.7),噪声源位于(1:2:1.5),目标语音为中科院的测试语音库,语音内容为女声“沉舟侧畔千帆过,病树前头万木春”和男声“农业生产合作社”。噪声是取自noisex92噪声库的汽车噪声(volvo)、工厂噪声(factory2)、轮机噪声(destroyerops)以及装甲车驾驶舱噪声(m109),将这4种噪声与上述语音段合成信噪比为?5dB,0dB以及5dB的带噪语音。IMT算法参数的设置为:α=0.997,χ=0.96,γ=0.01,Bmin=2。本发明提出的递归最小追踪的参数设置为α=0.997,β=0.177,χ=0.96,γ=0.01,Bmin=2。为了更加直观的知道噪声CPSD估计与真实噪声CPSD间的差距。表1给出了本发明算法与IMT估计算法的均方误差(MeanSqua-redError,MSE)对比测试,均方误差计算方式如下:(10)其中K为信号的帧数,PV(ω,k)和PV1V2(ω,k)分别为实际和估计的噪声CPSD值。均方误差值越小说明所估计的噪声CPSD越接近实际的CPSD。从仿真数据可看出,不同的噪声环境和不同的输入信噪比的试验中,相对于IMT估计算法,本发明方法均取得了更低的均方误差。这说明本发明方法估计出的噪声CPSD更接近真实的噪声CPSD。需要注意到的是在factory2、destroyerops以及m109三种噪声中,IMT的均方误差值很大,这表明IMT算法在对噪声CPSD估计时出现了严重的噪声过估计值。表1两种算法的均方误差。然而,评判语音质量的一个更重要的评价标准还是语音听觉质量评估,这里进一步采用语音质量客观评估值(PESQ)来对增强语音进行评估。增强算法这里采用了基于先验信噪比的相干性滤波器,其参数的设置为:λv=0.9,λd=0.97,λv=0.9,λy=0.7。表2给出了本发明算法与IMT估计算法的PESQ对比测试。仿真结果表明,与IMT估计算法相比,本发明提出的递归最小追踪算法在不同的噪声和不同信噪比下取得了更高的PESQ得分。即使用递归最小追踪算法的语音增强系统可以获得质量更高的增强语音。表2两种算法的PESQ得分。结论:本发明针对IMT噪声CPSD估计算法为基础,引入递归平滑技术,得出了一种基于递归最小追踪的噪声CPSD估计方法。因为采用了递归平滑因子,该方法克服了IMT算法所存在的噪声过估计的问题,所得到的噪声CPSD估计更加准确。仿真结果表明,较之于IMT算法,无论是噪声CPSD估计的准确性还是增强后语音的质量,本发明提出的方法都取得了更好的仿真结果。本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1