一种噪声检测装置和方法

文档序号:7628846阅读:265来源:国知局
专利名称:一种噪声检测装置和方法
技术领域
本发明涉及信号分析技术领域,具体涉及一种噪声检测装置和方法。
背景技术
目前,在移动终端通讯中,噪声是造成通话语音质量降低的主要问题移动终端的麦克风在录制用户语音的同时,也把背景噪声采集入移动终端的通讯模块。由于用户所处环境是复杂、变化的,因而背景噪声信号通常是不稳定的,其频谱特性也是变化多端的,另外,与语音信号相比,背景噪声信号的能量也随环境不同而有较大差异,如办公室通常存在较小的背景噪声,而地铁站等通常存在很强的背景噪声。
目前,通常在语音送入通讯模块前通过语音增强方法对其进行降噪处理,达到提高语音质量的目的。适用于移动终端通讯中的语音增强技术必须有以下特性时延很小,以便不干扰正常通讯;可适应背景噪声的变化,有效抑制噪声;避免引入人工处理带来的噪声如音乐噪声等,并不损坏语音质量。另外,该语音增强技术必须满足在数字信号处理(DSP)芯片或其它专用芯片中运行的需要。噪声检测是单声道语音增强技术中必不可少的部分。噪声检测,即通过估计噪声信号的频谱特性值,如频谱能量等,来检测信号是否为噪声。通过对噪声频谱特性值的估计可以区分信号中的语音和噪声,从而可跟踪不断变化的背景噪声,达到消除信号中的噪声的目的。
现有技术中进行噪声检测的流程如图1所示,其主要步骤如下步骤101对当前帧输入信号在频率点i上的频谱能量Y[i,n]进行平滑,得到当前帧输入信号在频率点i上的平滑频谱能量Sf[i,n]。
平滑公式为Sf[i,n]=Σj=-wwb[i+j]|Y[i+j,n]|2----(1)]]>
其中,w为频率值,(2w+1)表示汉宁窗的长度,b[i+j]为在频率点(i+j)上的汉宁窗值,j为频率值,n为整数,表示当前输入信号的总帧数,Y[i+j,n]为当前帧即第n帧输入信号在频率点(i+j)上的频谱能量如在频率点(i+j)上的FFT系数。
步骤102对Sf[i,n]进行时间递归运算,得到当前帧输入信号在频率点i上的递归平滑频谱能量S[i,n]。
时间递归公式为S[i,n]=αsS[i,n-1]+(1-αs)Sf[i,n](2)其中,S[i,n]为当前帧的前一帧输入信号在频率点i上的递归平滑频谱能量,αs为常数且满足0<αs<1。
步骤103计算当前帧输入信号的局部最小递归平滑频谱能量Smin[i,n] 其中,Smin[i,n-1]为当前帧的前一帧即第(n-1)帧输入信号在频率点i上的局部最小递归平滑频谱能量,Stmp[i,n-1]为当前帧的前一帧输入信号在频率点i上的临时最小递归平滑频谱能量,Stmp[i,n]为当前帧输入信号在频率点i上的临时最小递归平滑频谱能量。
步骤104判断S[i,n]Smin[i,n]<δ]]>是否成立,若是,判定当前帧输入信号为纯净噪声,同时令噪声检测因子I[i,n]=0;否则,判定当前帧输入信号不为纯净噪声,即当前帧输入信号上存在语音,同时令I[i,n]=1。其中,δ是常数。
此后,可根据以下公式计算当前帧输入信号在频率点i上存在语音的概率 p~[i,n]=αpp~[i,n-1]+(1-αp)I[i,n]---(5)]]>其中, 为当前帧的前一帧输入信号在频率点i上存在语音的概率,αp为常数且满足0<αp<1。可以看出,当I[i,n]=0时,p~[i,n]=0.]]>之后,根据以下公式计算当前帧输入信号在频率点i上的噪声频谱能量λd[i,n]α~d[i,n]=αd[i,n]+(1-αd[i,n])p~[i,n];]]>λd[i,n]=α~d[i,n]λd[i,n-1]+(1-α~d[i,n])|Y[i,n]|2---(6)]]>其中,λd[i,n-1]为当前帧的前一帧输入信号在频率点i上的噪声频谱能量,αd[i,n]为常数且满足0<αd[i,n]<1。
由上述步骤可知在寻找当前帧输入信号的局部最小递归平滑频谱能量Smin[i,n]时,在输入信号的总帧数n为L的整数倍时,要根据公式(4)中的Stmp[i,n]=S[i,n]计算当前帧输入信号的临时最小递归平滑频谱能量Stmp[i,n]。假设m为整数且n=mL,且设定在第(n-1)帧输入信号中不存在语音,那么,根据公式(3)可知第(n-1)帧输入信号的局部最小递归平滑频谱能量Smin[i,n-1]=min{Smin[i,n-2],S[i,n-1]},即Smin[i,n-1]≤S[i,n-1]此时,若在第n帧输入信号中存在能量较高的语音,那么根据公式(4)得到第n帧输入信号的临时最小递归平滑频谱能量Stmp[i,n]=S[i,n],而S[i,n]>S[i,n-1],所以根明显Stmp[i,n]>S[i,n-1]≥Smin[i,n-1],此后若在第n~(n+L)帧输入信号中都存在语音,那么在第n~(n+L)帧输入信号时计算得到的临时最小递归平滑频谱能量Stmp[i,n]~Stmp[i,n+L]都会大于Smin[i,n-1],而在(n+L)帧时会根据公式(4)得到第(n+L)帧输入信号的局部最小递归平滑频谱能量Smin[i,n+L]=min{Stmp[i,n+L-1],S[i,n+L]},而S[i,n+L]>S[i,n-1],很明显Smin[i,n+L]>S[i,n-1]Smin[i,n-1],因此,根据上述过程可知,现有技术中的噪声检测方法会造成局部最小递归平滑频谱能量的取值偏大,从而造成有一部分语音被错误地估计为噪声,将该噪声检测方法应用在语音增强中,会使得语音信号被错误地从原始输入信号中减去,从而导致某些时间域上的语音突然减弱,或听起来不自然。

发明内容
有鉴于此,本发明的主要目的在于提供一种噪声检测装置和方法,以避免语音被错误地估计为噪声,提高噪声检测的精度。
为达到上述目的,本发明的技术方案是这样实现的一种噪声检测装置,该装置包括频谱能量计算模块,用于接收信号,并将计算得到的当前帧信号的频谱能量输出到最小频谱能量计算模块和噪声检测模块;语音预测判断模块,用于接收信号,且在当前频率点上每收到一帧信号将自身模块的计数值加一步长,在自身模块的当前计数值与预定常数满足固定比例关系时,判断当前帧信号是否预测为语音,若是,将自身模块的当前计数值减一步长,并向最小频谱能量计算模块输出一个语音指示信号;最小频谱能量计算模块,用于接收频谱能量计算模块输出的当前帧信号的频谱能量,且在当前频率点上每收到一个频谱能量值,将自身模块的计数值加一步长,在自身模块的当前计数值与预定常数不满足固定比例关系时,将根据前一帧信号的局部最小频谱能量和当前帧信号的频谱能量,得到的当前帧信号的局部最小频谱能量输出到噪声检测模块;在自身模块的当前计数值与预定常数满足固定比例关系、且没收到语音预测判断模块输出的语音指示信号时,将根据前一帧信号的临时最小频谱能量和当前帧信号的频谱能量,得到的当前帧信号的局部最小频谱能量输出到噪声检测模块;在收到语音预测判断模块输出的语音指示信号时,将根据前一帧信号的局部最小频谱能量和当前帧信号的频谱能量,得到的当前帧信号的局部最小频谱能量输出到噪声检测模块,并将自身模块的当前计数值减一步长;噪声检测模块,用于根据频谱能量计算模块输出的当前帧信号的频谱能量和最小频谱能量计算模块输出的当前帧信号的局部最小频谱能量,判断当前帧信号是否为纯净噪声。
所述装置进一步包括语音存在概率计算模块,用于根据噪声检测模块输出的纯净噪声指示信号或非纯净噪声指示信号计算当前帧信号的语音存在概率,且,所述噪声检测模块进一步用于,在当前帧信号为纯净噪声时,将纯净噪声指示信号输出到语音存在概率计算模块;在当前帧信号不为纯净噪声时,将非纯净噪声指示信号输出到语音存在概率计算模块。
所述语音存在概率计算模块进一步用于,将当前帧信号的语音存在概率输出到语音预测判断模块,所述语音预测判断模块进一步用于,接收并保存语音存在概率计算模块输出的当前帧信号的语音存在概率,且在当前计数值与预定常数满足固定比例关系时,判断自身保存的前一帧信号的语音存在概率是否大于自身保存的常数,若大于,向最小频谱能量计算模块输出一个语音指示信号。
所述装置进一步包括噪声频谱能量计算模块,用于根据语音存在概率计算模块输出的当前帧信号的语音存在概率和频谱能量计算模块输出的当前帧信号的频谱能量,计算当前帧信号的噪声频谱能量。
所述语音预测判断模块包括语音存在后验概率计算模块和判断模块,其中语音存在后验概率计算模块,用于接收信号,且在当前频率点上每收到一帧信号将自身模块的计数值加一步长,在自身模块的当前计数值与预定常数满足固定比例关系时,计算前一帧信号上存在语音的后验概率,并将该前一帧信号上存在语音的后验概率输出到判断模块,用于在收到判断模块输出的语音指示信号后,将自身模块的当前计数值减一步长;判断模块,用于判断语音存在后验概率计算模块输出的前一帧信号上存在语音的后验概率是否大于自身保存的常数,若大于,向最小频谱能量计算模块和语音存在后验概率计算模块输出语音指示信号。
所述语音预测判断模块包括先验信噪比计算模块和判断模块,其中
先验信噪比计算模块,用于接收信号,且在当前频率点上每收到一帧信号将自身模块的计数值加一步长,在自身模块的当前计数值与预定常数满足固定比例关系时,计算当前帧信号的先验信噪比,并将该前帧信号的先验信噪比输出到判断模块,用于在收到判断模块输出的语音指示信号后,将自身模块的当前计数值减一步长;判断模块,用于判断先验信噪比计算模块输出的前帧信号的先验信噪比是否大于自身保存的常数,若大于,向最小频谱能量计算模块和先验信噪比计算模块输出语音指示信号。
一种噪声检测装置,该装置包括计数器模块,用于对当前频率点上的信号的帧数计数,每收到一帧信号,将计数值加一步长,将该帧信号输出到频谱能量计算模块和语音预测判断模块,将计数值输出到语音预测判断模块和最小频谱能量计算模块;并在收到语音预测判断模块输出的中断信号时,将当前计数值减一步长;频谱能量计算模块,用于计算计数器模块输出信号的频谱能量,并将该频谱能量输出到最小频谱能量计算模块和噪声检测模块;语音预测判断模块,用于在计数器模块输出的计数值与预定常数满足固定比例关系时,判断计数器模块输出的信号是否预测为语音,若是,向计数器模块发送一个中断信号,并向最小频谱能量计算模块输出一个语音指示信号;最小频谱能量计算模块,用于在计数器模块输出的计数值与预定常数不满足固定比例关系时,将根据前一帧信号的局部最小频谱能量和当前帧信号的频谱能量,得到的当前帧信号的局部最小频谱能量输出到噪声检测模块;在计数器模块输出的计数值与预定常数满足固定比例关系、且没收到语音预测判断模块输出的语音指示信号时,将根据前一帧信号的临时最小频谱能量和当前帧信号的频谱能量,得到的当前帧信号的局部最小频谱能量输出到噪声检测模块;在收到语音预测判断模块输出的语音指示信号时,将根据前一帧信号的局部最小频谱能量和当前帧信号的频谱能量,得到的当前帧信号的局部最小频谱能量输出到噪声检测模块;噪声检测模块,用于根据频谱能量计算模块输出的频谱能量和最小频谱能量计算模块输出的局部最小频谱能量,判断当前帧输入信号是否为纯净噪声。
所述装置进一步包括语音存在概率计算模块,用于根据噪声检测模块输出的纯净噪声指示信号或非纯净噪声指示信号计算当前帧信号的语音存在概率,且,所述噪声检测模块进一步用于,在当前帧信号为纯净噪声时,将纯净噪声指示信号输出到语音存在概率计算模块;在当前帧信号不为纯净噪声时,将非纯净噪声指示信号输出到语音存在概率计算模块。
所述语音存在概率计算模块进一步用于,将当前帧信号的语音存在概率输出到语音预测判断模块,所述语音预测判断模块进一步用于,接收并保存语音存在概率计算模块输出的当前帧信号的语音存在概率,且在当前计数值与预定常数满足固定比例关系时,判断自身保存的前一帧信号的语音存在概率是否大于自身保存的常数,若大于,向最小频谱能量计算模块输出一个语音指示信号。
所述装置进一步包括噪声频谱能量计算模块,用于根据语音存在概率计算模块输出的当前帧信号的语音存在概率和频谱能量计算模块输出的当前帧信号的频谱能量,计算当前帧信号的噪声频谱能量。
所述语音预测判断模块包括语音存在后验概率计算模块和判断模块,其中语音存在后验概率计算模块,用于接收信号,并在计数器模块输出的当前计数值与预定常数满足固定比例关系时,计算前一帧信号上存在语音的后验概率,并将该前一帧信号上存在语音的后验概率输出到判断模块;判断模块,用于判断语音存在后验概率计算模块输出的前一帧信号上存在语音的后验概率是否大于自身保存的常数,若大于,向最小频谱能量计算模块输出语音指示信号。
所述语音预测判断模块包括先验信噪比计算模块和判断模块,其中先验信噪比计算模块,用于接收信号,且在计数器模块输出的当前计数值与预定常数满足固定比例关系时,计算当前帧信号的先验信噪比,并将该前帧信号的先验信噪比输出到判断模块;判断模块,用于判断先验信噪比计算模块输出的前帧信号的先验信噪比是否大于自身保存的常数,若大于,向最小频谱能量计算模块输出语音指示信号。
一种噪声检测方法,对每一频率点上的所有信号帧都进行如下步骤,该方法包括A、接收到当前帧信号,将计数值加一步长,计算并保存当前帧信号的频谱能量,并判断当前计数值是否与预定常数满足固定比例关系,若否,执行步骤B;否则,判断当前帧信号是否预测为语音,若预测为语音,将当前计数值减一步长并执行步骤B;若不被预测为语音,执行步骤C;B、根据前一帧信号的局部最小频谱能量与当前帧信号的频谱能量,计算并保存当前帧信号的局部最小频谱能量;根据前一帧信号的临时最小频谱能量与当前帧信号的频谱能量,计算并保存当前帧信号的临时最小频谱能量,然后执行步骤D;C、根据前一帧信号的临时最小频谱频谱能量与当前帧信号的能量,计算并保存当前帧信号的局部最小频谱能量;根据当前帧信号的频谱能量计算并保存当前帧信号的临时最小频谱能量,然后执行步骤D;D、判断当前帧信号的频谱能量和局部最小频谱能量的比值是否小于预设值,若是,判定当前帧信号为纯净噪声,否则,判定当前帧信号不为纯净噪声。
该方法进一步包括预设一语音存在后验概率;步骤A所述判断当前帧信号是否预测为语音具体为计算前一帧信号上存在语音的后验概率,然后判断所述后验概率是否大于所述预设语音存在后验概率,若是,判定当前帧信号预测为语音;否则,判定当前帧信号不被预测为语音。
该方法进一步包括预设一语音存在先验信噪比;步骤A所述判断当前帧信号是否预测为语音具体为计算当前帧信号上存在语音的先验信噪比,然后判断所述先验信噪比是否大于所述预设语音存在先验信噪比,若是,判定当前帧信号预测为语音;否则,判定当前帧信号不被预测为语音。
该方法进一步包括预设一语音存在概率;步骤A所述判断当前帧信号是否预测为语音具体为计算前一帧信号上存在语音的概率,并判断该前一帧信号上存在语音的概率是否大于所述预设语音存在概率,若是,判定当前帧信号预测为语音;否则,判定当前帧信号不被预测为语音。
所述步骤B具体为比较前一帧信号的局部最小频谱能量与当前帧信号的频谱能量,取其中的小者作为当前帧信号的局部最小频谱能量,并保存该当前帧信号的局部最小频谱能量;比较前一帧信号的临时最小频谱能量与当前帧信号的频谱能量,取其中的小者作为当前帧信号的临时最小频谱能量,并保存该当前帧信号的临时最小频谱能量,然后执行步骤D。
所述步骤C具体为比较前一帧信号的临时最小频谱能量与当前帧信号的频谱能量,取其中的小者作为当前帧信号的局部最小频谱能量,并保存该当前帧信号的局部最小频谱能量;将当前帧信号的频谱能量作为当前帧信号的临时最小频谱能量,并保存该当前帧信号的临时最小频谱能量,然后执行步骤D。
本发明所记载的技术方案避免了语音被错误地估计为噪声,提高了噪声检测的精度。将本发明应用在带噪信号的噪声谱估计和降噪处理中,可以有效地估计噪声谱并有效地消除噪声。


图1为现有技术中进行噪声检测的流程图;图2为本发明提供的进行噪声检测的流程图;图3为本发明提供的噪声检测的具体实施例一的装置框图;图4为本发明提供的噪声检测的具体实施例二的装置框图;图5为本发明提供的语音预测判断模块的组成框图一;图6为本发明提供的语音预测判断模块的组成框图二;图7为本发明提供的噪声检测的具体实施例三的装置框图;图8为本发明提供的噪声检测的具体实施例四的装置框图;图9为本发明提供的语音预测判断模块的组成框图三;图10为本发明提供的语音预测判断模块的组成框图四。
具体实施例方式
下面结合附图及具体实施例对本发明再作进一步详细的说明。
图2是本发明提供的进行噪声检测的流程图,如图2所示,其具体步骤如下步骤201在频率点i上设置一个计数器,每接收到一帧输入信号,计数值加1,设当前计数值为F[i],计算并保存当前帧输入信号在频率点i上的频谱能量S[i,n]。
这里,n为整数,表示当前输入信号的总帧数,S[i,n]可根据当前帧输入信号在频率点i上的频谱能量Y[i,n]和公式(1)和(2)计算得到。
步骤202判断F[i]是否为预定常数L的整数倍,若是,执行步骤203;否则,执行步骤204。
L的取值可根据经验确定,例如在采样率为8千比特/秒时,通常L=60。
步骤203根据公式(3)计算并保存当前帧输入信号的局部最小频谱能量Smin[i,n]和临时最小频谱能量Stmp[i,n],即比较当前帧的前一帧输入信号在频率点i上的局部最小频谱能量与当前帧输入信号的能量,取其中的较小者作为当前帧输入信号的局部最小频谱能量Smin[i,n],同时比较当前帧的前一帧输入信号在频率点i上的临时最小频谱能量与当前帧输入信号的频谱能量,取其中的较小者作为当前帧输入信号的临时最小频谱能量Stmp[i,n],然后执行步骤207。
步骤204判断当前帧输入信号是否预测为语音,若是,执行步骤205;否则,执行步骤206。
判断当前帧输入信号是否预测为语音可通过以下三种方式之一方式一计算当前帧的前一帧输入信号在频率点i上存在语音的后验概率p[i,n-1],然后判断p[i,n-1]≥C1是否成立,若成立,则判定当前帧输入信号在频率点i上被预测为语音;否则,判定当前帧输入信号在频率点i上不被预测为语音。这里,C1为常数,且满足0<C1<1,具体值可根据经验确定;n-1表示当前帧的前一帧。
方式二计算当前帧输入信号的先验信噪比ζ[i,n],然后判断ζ[i,n]≥C2是否成立,若成立,则判定当前帧输入信号在频率点i上被预测为语音;否则,判定当前帧输入信号在频率点i上不被预测为语音。这里,C2为常数,通常情况下满足0<C2<10,具体值可根据经验确定。
方式三计算当前帧的前一帧输入信号在频率点i上存在语音的概率 判断p~[i,n-1]≥C3]]>是否成立,若成立,则判定当前帧输入信号在频率点i上被预测为语音;否则,判定当前帧输入信号在频率点i上不被预测为语音。这里,C3为常数,且满足0<C3<1,具体值可根据经验确定。
这里, 可根据公式(5)得到p~[i,n-1]=αpp~[i,n-2]+(1-αp)I[i,n-1],]]>其中, 为当前帧的前两帧输入信号上存在语音的概率,I[i,n-1]的取值如下在S[i,n-1]Smin[i,n-1]<δ]]>成立时,I[i,n-1]=0;在S[i,n-1]Smin[i,n-1]<δ]]>不成立时,I[i,n-1]=1,其中,S[i,n-1]为当前帧的前一帧输入信号的频谱能量,Smin[i,n-1]为当前帧的前一帧输入信号的局部最小频谱能量。
步骤205根据公式(3)计算并保存Smin[i,n]和Stmp[i,n],并以(F[i]-1)更新F[i],然后执行步骤207。
步骤206根据公式(4)计算并保存Smin[i,n]和Stmp[i,n],即比较当前帧的前一帧输入信号在频率点i上的临时最小频谱能量与当前帧输入信号的频谱能量,取其中的较小者作为当前帧输入信号的局部最小频谱能量Smin[i,n],同时将当前帧输入信号的频谱能量作为当前帧输入信号的临时最小频谱能量Stmp[i,n],然后执行步骤207。
步骤207判断S[i,n]Smin[i,n]<δ]]>是否成立,若是,判定当前帧输入信号为纯净噪声;否则,判定当前帧输入信号不为纯净噪声。
δ的取值由经验确定,通常满足δ>1。
若S[i,n]Smin[i,n]<δ]]>成立,则I[i,n]=0;若S[i,n]Smin[i,n]<δ]]>不成立,I[i,n]=1,此后可根据公式(5)计算得到当前帧输入信号在频率点i上存在语音的概率 之后可根据公式(6)计算得到当前帧输入信号在频率点i上的噪声频谱能量λd[i,n]。
需要指出的是,在具体应用中,对频率点i上的每一帧输入信号都要进行以上步骤201~207所述的处理。
图3是本发明提供的噪声检测装置框图,如图3所示,其主要包括频谱能量计算模块31用于接收输入信号,并计算当前帧输入信号在当前频率点上的频谱能量,并将该频谱能量输出到最小频谱能量计算模块33和噪声检测模块34。
语音预测判断模块32用于接收输入信号,并在当前频率点上设定一计数器,在当前频率点上每接收到一帧输入信号将自身计数器的计数值加1,在当前自身模块的计数器计数值为预定常数L的整数倍时,判断当前帧输入信号是否预测为语音,若是,将当前自身模块的计数器计数值减一,并向最小频谱能量计算模块33输出一个语音指示信号。
最小频谱能量计算模块33用于接收频谱能量计算模块31输出的当前帧输入信号在当前频率点上的频谱能量,并在当前频率点上设定一个计数器,在当前频率点上每接收到一个频谱能量值将自身计数器的计数值加1,并在当前自身模块的计数器计数值不为L的整数倍时,根据公式(3)计算当前帧输入信号在当前频率点上的局部最小频谱能量和临时最小频谱能量,并将得到的局部最小频谱能量输出到噪声检测模块34;在当前自身模块的计数器计数值为L的整数倍、且没收到语音预测判断模块32输出的语音指示信号时,根据公式(4)计算当前帧输入信号在当前频率点上的局部最小频谱能量和临时最小频谱能量,并将得到的局部最小频谱能量输出到噪声检测模块34;在收到语音预测判断模块32输出的语音指示信号时,根据公式(3)计算当前帧输入信号在当前频率点上的局部最小频谱能量和临时最小频谱能量,并将当前自身模块的计数器计数值减一,同时将得到的局部最小频谱能量输出到噪声检测模块34。
噪声检测模块34用于接收频谱能量计算模块31输出的当前帧输入信号在当前频率点上的频谱能量,并根据该频谱能量和最小频谱能量计算模块33输出的局部最小频谱能量,判断当前帧输入信号在当前频率点上是否为纯净噪声,并将该判断结果输出到外部。
由上所述可以看出语音预测判断模块32和最小频谱能量计算模块33的计数器的计数值保持一致。
进一步地,如图4所示,该装置包括语音存在概率计算模块35,用于根据噪声检测模块34输出的信号值和自身保存的常数αp,计算当前帧输入信号在当前频率点上的语音存在概率,并将该语音存在概率输出到外部。
且,噪声检测模块34进一步用于,在当前帧输入信号在当前频率点上判定为纯净噪声时,将信号0输出到语音存在概率计算模块35,在当前帧输入信号在当前频率点上判定不为纯净噪声时,将信号1输出到语音存在概率计算模块35。
进一步地,如图4所示,该装置包括噪声频谱能量计算模块36用于根据语音存在概率计算模块35输出的当前帧输入信号在当前频率点上的语音存在概率和频谱能量计算模块31输出的当前帧输入信号在当前频率点上的频谱能量,计算当前帧输入信号在当前频率点上的噪声频谱能量,并将该噪声频谱能量输出到外部。
进一步地,如图4所示,语音存在概率计算模块35进一步用于将得到的当前帧信号在当前频率点上的语音存在概率输出到语音预测判断模块32,同时,语音预测判断模块32进一步用于接收并保存语音存在概率计算模块35输出的当前帧信号在当前频率点上的语音存在概率,且在当前自身模块的计数器计数值为L的整数倍时,判断自身保存的当前帧的前一帧输入信号在当前频率点上的语音存在概率是否大于自身保存的常数C3,若大于,向最小频谱能量计算模块33输出一个语音指示信号。
或者,进一步地,如图5所示,语音预测判断模块32包括语音存在后验概率计算模块3211和判断模块3212,其中语音存在后验概率计算模块3211用于接收输入信号,并在当前频率点上设定一计数器,在当前频率点上每接收到一帧输入信号将自身计数器的计数值加1,在当前自身模块的计数器计数值为L的整数倍时,计算当前帧的前一帧输入信号在当前频率点上存在语音的后验概率,并将该后验概率输出到判断模块3212,在收到判断模块3212发来的语音指示信号后,将当前自身模块的计数器计数值减一。
语音存在后验概率计算模块3211的计数器的计数值与语音预测判断模块32、最小频谱能量计算模块33的计数器的计数值保持一致。
判断模块3212用于判断语音存在后验概率计算模块3211输出的后验概率是否大于自身保存的常数C1,若大于,向最小频谱能量计算模块33和语音存在后验概率计算模块3211输出一个语音指示信号。
或者,进一步地,如图6所示,语音判断模块32包括先验信噪比计算模块3221和判断模块3222,其中先验信噪比计算模块3221用于接收输入信号,并在当前频率点上设定一计数器,在当前频率点上每接收到一帧输入信号将自身计数器的计数值加1,在当前自身模块的计数器计数值为L的整数倍时,计算当前帧输入信号在当前频率点上的先验信噪比,并将该先验信噪比输出到判断模块3222,在收到判断模块3222发来的语音指示信号后,将当前自身模块的计数器计数值减一。
先验信噪比计算模块3221的计数器的计数值与语音预测判断模块32、最小频谱能量计算模块33的计数器的计数值保持一致。
判断模块3222用于判断先验信噪比计算模块3221输出的当前帧输入信号在当前频率点上的先验信噪比是否大于自身保存的常数C2,若大于,向最小频谱能量计算模块33和先验信噪比计算模块3221输出一个语音指示信号。
图7是本发明提供的噪声检测的具体实施例三的装置框图,如图7所示,其主要包括计数器模块40用于对当前频率点上的输入信号的帧数进行计数,每接收到一帧输入信号,将计数值加1,并将该帧输入信号输出到频谱能量计算模块41和语音预测判断模块42,将计数值输出到语音预测判断模块42和最小频谱能量计算模块43;并在收到语音预测判断模块42输出的中断信号时,将当前计数值减1。
频谱能量计算模块41用于接收计数器模块40输出的当前频率点上的当前帧输入信号,并计算该当前帧输入信号在当前频率点上的频谱能量,并将该频谱能量输出到最小频谱能量计算模块43和噪声检测模块44。
语音预测判断模块42用于接收计数器模块40输出的当前频率点上的当前帧输入信号,在计数器模块40输出的计数值为预定常数L的整数倍时,判断当前帧输入信号是否预测为语音,若是,向计数器模块40发送一个中断信号,并向最小频谱能量计算模块43输出一个语音指示信号。
最小频谱能量计算模块43用于接收频谱能量计算模块41输出的当前帧输入信号在当前频率点上的频谱能量,在计数器模块40输出的计数值不为L的整数倍时,根据公式(3)计算当前帧输入信号在当前频率点上的局部最小频谱能量和临时最小频谱能量,并将得到的局部最小频谱能量输出到噪声检测模块44;在计数器模块40输出的计数值为L的整数倍、且没收到语音预测判断模块42输出的语音指示信号时,根据公式(4)计算当前帧输入信号在当前频率点上的局部最小频谱能量和临时最小频谱能量,并将得到的局部最小频谱能量输出到噪声检测模块44;在收到语音预测判断模块42输出的语音指示信号时,根据公式(3)计算当前帧输入信号在当前频率点上的局部最小频谱能量和临时最小频谱能量,将得到的局部最小频谱能量输出到噪声检测模块44。
噪声检测模块44用于接收频谱能量计算模块41输出的当前帧输入信号在当前频率点上的频谱能量,并根据该频谱能量和最小频谱能量计算模块43输出的局部最小频谱能量,判断当前帧输入信号在当前频率点上是否为纯净噪声,并将该判断结果输出到外部。
图8是本发明提供的噪声检测的具体实施例四的装置框图,如图8所示,该装置与图7相比,进一步包括语音存在概率计算模块45,用于根据噪声检测模块44输出的信号值和自身保存的常数αp,计算当前帧输入信号在当前频率点上的语音存在概率,并将该语音存在概率输出到外部。
且,噪声检测模块44进一步用于,在当前帧输入信号在当前频率点上判定为纯净噪声时,将信号0输出到语音存在概率计算模块45,在当前帧输入信号在当前频率点上判定不为纯净噪声时,将信号1输出到语音存在概率计算模块45。
如图8所示,该装置进一步包括噪声频谱能量计算模块46用于根据语音存在概率计算模块45输出的当前帧输入信号在当前频率点上的语音存在概率和频谱能量计算模块41输出的当前帧输入信号在当前频率点上的频谱能量,计算当前帧输入信号在当前频率点上的噪声频谱能量,并将该噪声频谱能量输出到外部。
进一步地,如图8所示,语音存在概率计算模块45进一步用于将得到的当前帧信号在当前频率点上的语音存在概率输出到语音预测判断模块42,同时,语音预测判断模块42进一步用于接收并保存语音存在概率计算模块45输出的当前帧信号在当前频率点上的语音存在概率,且在计数器模块40输出的计数值为L的整数倍时,判断自身保存的当前帧的前一帧输入信号在当前频率点上的语音存在概率是否大于自身保存的常数C3,若大于,向最小频谱能量计算模块43输出一个语音指示信号。
或者,进一步地,如图9所示,语音预测判断模块42包括语音存在后验概率计算模块4211和判断模块4212,其中语音存在后验概率计算模块4211用于接收并保存计数器模块40输出的当前频率点上的当前帧输入信号,并在计数器模块40输出的计数值为L的整数倍时,计算当前帧的前一帧输入信号在当前频率点上存在语音的后验概率,并将该后验概率输出到判断模块4212。
判断模块4212用于判断语音存在后验概率计算模块4211输出的后验概率是否大于自身保存的常数C1,若大于,向最小频谱能量计算模块43输出一个语音指示信号。
或者,进一步地,如图10所示,语音判断模块42包括先验信噪比计算模块4221和判断模块4222,其中先验信噪比计算模块4221用于接收并保存计数器模块40输出的当前频率点上的当前帧输入信号,并在计数器模块40输出的计数值为L的整数倍时,计算当前帧输入信号在当前频率点上的先验信噪比,并将该先验信噪比输出到判断模块4222。
判断模块4222用于判断先验信噪比计算模块4221输出的当前帧输入信号在当前频率点上的先验信噪比是否大于自身保存的常数C2,若大于,向最小频谱能量计算模块43输出一个语音指示信号。
在本发明中,在当前频率点上每收到一帧输入信号时,可将计数值加一预设步长,在上述具体实施例中,该步长取值为1;另外,在本发明中,要判断计数值F[i]是否与预定常数L满足固定比例关系,在上述具体实施例中,该固定比例取值为整数。
在实际中,本发明提供的噪声检测装置和方法,可应用于带噪信号如语音信号等的噪声谱估计及降噪处理中。
以上所述仅为本发明的过程及方法实施例,并不用以限制本发明,凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种噪声检测装置,其特征在于,该装置包括频谱能量计算模块,用于接收信号,并将计算得到的当前帧信号的频谱能量输出到最小频谱能量计算模块和噪声检测模块;语音预测判断模块,用于接收信号,且在当前频率点上每收到一帧信号将自身模块的计数值加一步长,在自身模块的当前计数值与预定常数满足固定比例关系时,判断当前帧信号是否预测为语音,若是,将自身模块的当前计数值减一步长,并向最小频谱能量计算模块输出一个语音指示信号;最小频谱能量计算模块,用于接收频谱能量计算模块输出的当前帧信号的频谱能量,且在当前频率点上每收到一个频谱能量值,将自身模块的计数值加一步长,在自身模块的当前计数值与预定常数不满足固定比例关系时,将根据前一帧信号的局部最小频谱能量和当前帧信号的频谱能量,得到的当前帧信号的局部最小频谱能量输出到噪声检测模块;在自身模块的当前计数值与预定常数满足固定比例关系、且没收到语音预测判断模块输出的语音指示信号时,将根据前一帧信号的临时最小频谱能量和当前帧信号的频谱能量,得到的当前帧信号的局部最小频谱能量输出到噪声检测模块;在收到语音预测判断模块输出的语音指示信号时,将根据前一帧信号的局部最小频谱能量和当前帧信号的频谱能量,得到的当前帧信号的局部最小频谱能量输出到噪声检测模块,并将自身模块的当前计数值减一步长;噪声检测模块,用于根据频谱能量计算模块输出的当前帧信号的频谱能量和最小频谱能量计算模块输出的当前帧信号的局部最小频谱能量,判断当前帧信号是否为纯净噪声。
2.如权利要求1所述的装置,其特征在于,所述装置进一步包括语音存在概率计算模块,用于根据噪声检测模块输出的纯净噪声指示信号或非纯净噪声指示信号计算当前帧信号的语音存在概率,且,所述噪声检测模块进一步用于,在当前帧信号为纯净噪声时,将纯净噪声指示信号输出到语音存在概率计算模块;在当前帧信号不为纯净噪声时,将非纯净噪声指示信号输出到语音存在概率计算模块。
3.如权利要求2所述的装置,其特征在于,所述语音存在概率计算模块进一步用于,将当前帧信号的语音存在概率输出到语音预测判断模块,所述语音预测判断模块进一步用于,接收并保存语音存在概率计算模块输出的当前帧信号的语音存在概率,且在当前计数值与预定常数满足固定比例关系时,判断自身保存的前一帧信号的语音存在概率是否大于自身保存的常数,若大于,向最小频谱能量计算模块输出一个语音指示信号。
4.如权利要求2或3所述的装置,其特征在于,所述装置进一步包括噪声频谱能量计算模块,用于根据语音存在概率计算模块输出的当前帧信号的语音存在概率和频谱能量计算模块输出的当前帧信号的频谱能量,计算当前帧信号的噪声频谱能量。
5.如权利要求1所述的装置,其特征在于,所述语音预测判断模块包括语音存在后验概率计算模块和判断模块,其中语音存在后验概率计算模块,用于接收信号,且在当前频率点上每收到一帧信号将自身模块的计数值加一步长,在自身模块的当前计数值与预定常数满足固定比例关系时,计算前一帧信号上存在语音的后验概率,并将该前一帧信号上存在语音的后验概率输出到判断模块,用于在收到判断模块输出的语音指示信号后,将自身模块的当前计数值减一步长;判断模块,用于判断语音存在后验概率计算模块输出的前一帧信号上存在语音的后验概率是否大于自身保存的常数,若大于,向最小频谱能量计算模块和语音存在后验概率计算模块输出语音指示信号。
6.如权利要求1所述的装置,其特征在于,所述语音预测判断模块包括先验信噪比计算模块和判断模块,其中先验信噪比计算模块,用于接收信号,且在当前频率点上每收到一帧信号将自身模块的计数值加一步长,在自身模块的当前计数值与预定常数满足固定比例关系时,计算当前帧信号的先验信噪比,并将该前帧信号的先验信噪比输出到判断模块,用于在收到判断模块输出的语音指示信号后,将自身模块的当前计数值减一步长;判断模块,用于判断先验信噪比计算模块输出的前帧信号的先验信噪比是否大于自身保存的常数,若大于,向最小频谱能量计算模块和先验信噪比计算模块输出语音指示信号。
7.一种噪声检测装置,其特征在于,该装置包括计数器模块,用于对当前频率点上的信号的帧数计数,每收到一帧信号,将计数值加一步长,将该帧信号输出到频谱能量计算模块和语音预测判断模块,将计数值输出到语音预测判断模块和最小频谱能量计算模块;并在收到语音预测判断模块输出的中断信号时,将当前计数值减一步长;频谱能量计算模块,用于计算计数器模块输出信号的频谱能量,并将该频谱能量输出到最小频谱能量计算模块和噪声检测模块;语音预测判断模块,用于在计数器模块输出的计数值与预定常数满足固定比例关系时,判断计数器模块输出的信号是否预测为语音,若是,向计数器模块发送一个中断信号,并向最小频谱能量计算模块输出一个语音指示信号;最小频谱能量计算模块,用于在计数器模块输出的计数值与预定常数不满足固定比例关系时,将根据前一帧信号的局部最小频谱能量和当前帧信号的频谱能量,得到的当前帧信号的局部最小频谱能量输出到噪声检测模块;在计数器模块输出的计数值与预定常数满足固定比例关系、且没收到语音预测判断模块输出的语音指示信号时,将根据前一帧信号的临时最小频谱能量和当前帧信号的频谱能量,得到的当前帧信号的局部最小频谱能量输出到噪声检测模块;在收到语音预测判断模块输出的语音指示信号时,将根据前一帧信号的局部最小频谱能量和当前帧信号的频谱能量,得到的当前帧信号的局部最小频谱能量输出到噪声检测模块;噪声检测模块,用于根据频谱能量计算模块输出的频谱能量和最小频谱能量计算模块输出的局部最小频谱能量,判断当前帧输入信号是否为纯净噪声。
8.如权利要求7所述的装置,其特征在于,所述装置进一步包括语音存在概率计算模块,用于根据噪声检测模块输出的纯净噪声指示信号或非纯净噪声指示信号计算当前帧信号的语音存在概率,且,所述噪声检测模块进一步用于,在当前帧信号为纯净噪声时,将纯净噪声指示信号输出到语音存在概率计算模块;在当前帧信号不为纯净噪声时,将非纯净噪声指示信号输出到语音存在概率计算模块。
9.如权利要求8所述的装置,其特征在于,所述语音存在概率计算模块进一步用于,将当前帧信号的语音存在概率输出到语音预测判断模块,所述语音预测判断模块进一步用于,接收并保存语音存在概率计算模块输出的当前帧信号的语音存在概率,且在当前计数值与预定常数满足固定比例关系时,判断自身保存的前一帧信号的语音存在概率是否大于自身保存的常数,若大于,向最小频谱能量计算模块输出一个语音指示信号。
10.如权利要求8或9所述的装置,其特征在于,所述装置进一步包括噪声频谱能量计算模块,用于根据语音存在概率计算模块输出的当前帧信号的语音存在概率和频谱能量计算模块输出的当前帧信号的频谱能量,计算当前帧信号的噪声频谱能量。
11.如权利要求7所述的装置,其特征在于,所述语音预测判断模块包括语音存在后验概率计算模块和判断模块,其中语音存在后验概率计算模块,用于接收信号,并在计数器模块输出的当前计数值与预定常数满足固定比例关系时,计算前一帧信号上存在语音的后验概率,并将该前一帧信号上存在语音的后验概率输出到判断模块;判断模块,用于判断语音存在后验概率计算模块输出的前一帧信号上存在语音的后验概率是否大于自身保存的常数,若大于,向最小频谱能量计算模块输出语音指示信号。
12.如权利要求7所述的装置,其特征在于,所述语音预测判断模块包括先验信噪比计算模块和判断模块,其中先验信噪比计算模块,用于接收信号,且在计数器模块输出的当前计数值与预定常数满足固定比例关系时,计算当前帧信号的先验信噪比,并将该前帧信号的先验信噪比输出到判断模块;判断模块,用于判断先验信噪比计算模块输出的前帧信号的先验信噪比是否大于自身保存的常数,若大于,向最小频谱能量计算模块输出语音指示信号。
13.一种噪声检测方法,其特征在于,对每一频率点上的所有信号帧都进行如下步骤,该方法包括A、接收到当前帧信号,将计数值加一步长,计算并保存当前帧信号的频谱能量,并判断当前计数值是否与预定常数满足固定比例关系,若否,执行步骤B;否则,判断当前帧信号是否预测为语音,若预测为语音,将当前计数值减一步长并执行步骤B;若不被预测为语音,执行步骤C;B、根据前一帧信号的局部最小频谱能量与当前帧信号的频谱能量,计算并保存当前帧信号的局部最小频谱能量;根据前一帧信号的临时最小频谱能量与当前帧信号的频谱能量,计算并保存当前帧信号的临时最小频谱能量,然后执行步骤D;C、根据前一帧信号的临时最小频谱频谱能量与当前帧信号的能量,计算并保存当前帧信号的局部最小频谱能量;根据当前帧信号的频谱能量计算并保存当前帧信号的临时最小频谱能量,然后执行步骤D;D、判断当前帧信号的频谱能量和局部最小频谱能量的比值是否小于预设值,若是,判定当前帧信号为纯净噪声,否则,判定当前帧信号不为纯净噪声。
14.如权利要求13所述的方法,其特征在于,该方法进一步包括预设一语音存在后验概率;步骤A所述判断当前帧信号是否预测为语音具体为计算前一帧信号上存在语音的后验概率,然后判断所述后验概率是否大于所述预设语音存在后验概率,若是,判定当前帧信号预测为语音;否则,判定当前帧信号不被预测为语音。
15.如权利要求13所述的方法,其特征在于,该方法进一步包括预设一语音存在先验信噪比;步骤A所述判断当前帧信号是否预测为语音具体为计算当前帧信号上存在语音的先验信噪比,然后判断所述先验信噪比是否大于所述预设语音存在先验信噪比,若是,判定当前帧信号预测为语音;否则,判定当前帧信号不被预测为语音。
16.如权利要求13所述的方法,其特征在于,该方法进一步包括预设一语音存在概率;步骤A所述判断当前帧信号是否预测为语音具体为计算前一帧信号上存在语音的概率,并判断该前一帧信号上存在语音的概率是否大于所述预设语音存在概率,若是,判定当前帧信号预测为语音;否则,判定当前帧信号不被预测为语音。
17.如权利要求13所述的方法,其特征在于,所述步骤B具体为比较前一帧信号的局部最小频谱能量与当前帧信号的频谱能量,取其中的小者作为当前帧信号的局部最小频谱能量,并保存该当前帧信号的局部最小频谱能量;比较前一帧信号的临时最小频谱能量与当前帧信号的频谱能量,取其中的小者作为当前帧信号的临时最小频谱能量,并保存该当前帧信号的临时最小频谱能量,然后执行步骤D。
18.如权利要求13所述的方法,其特征在于,所述步骤C具体为比较前一帧信号的临时最小频谱能量与当前帧信号的频谱能量,取其中的小者作为当前帧信号的局部最小频谱能量,并保存该当前帧信号的局部最小频谱能量;将当前帧信号的频谱能量作为当前帧信号的临时最小频谱能量,并保存该当前帧信号的临时最小频谱能量,然后执行步骤D。
全文摘要
本发明公开了一种噪声检测装置和方法,接收当前帧信号,且每收到一帧信号将计数值加一步长,在计数值与预定常数满足固定比例关系时,或满足固定比例关系、但当前帧信号预测为语音时,根据前一帧信号的局部最小频谱能量和当前帧信号的频谱能量,计算当前帧信号的局部最小频谱能量,且在满足固定比例关系、且当前帧信号预测为语音时,将当前计数值减一步长;在满足固定比例关系、且当前帧信号不被预测为语音时,根据前一帧信号的临时最小频谱能量和当前帧信号的频谱能量,计算当前帧信号的局部最小频谱能量,此后根据当前帧信号的频谱能量和局部最小频谱能量,判断当前帧信号是否为纯净噪声,避免了语音被错误地估计为噪声,提高了噪声检测的精度。
文档编号H04M9/08GK1787079SQ20051013016
公开日2006年6月14日 申请日期2005年12月19日 优先权日2005年12月19日
发明者林中松, 邓昊, 王箫程, 冯宇红 申请人:北京中星微电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1