专利名称:噪声抑制装置的制作方法
技术领域:
本发明涉及在各种噪声环境下使用的语音通信系统及语音识别系统等中,抑制目的信号以外噪声的噪声抑制装置。
背景技术:
作为通过从混入了噪声的输入信号抑制作为目的外信号的噪声,强调作为目的信号的语音信号等的噪声抑制装置,在比如特开2000-347688公报中有披露。其以如文献(Steven F.Boll,“Suppressionof Acoustic noise in speech using spectral subtraction利用频谱相减抑制语音中的噪声”,IEEE Trans.ASSP,Vol.ASSP-27,No.2,April 1979)所示的通过从振幅谱减去另外估算的平均噪声谱进行噪声抑制的所谓频谱相减法为基本。
图1是表示特开2000-347688公报中公开的现有的噪声抑制装置构成的方框图,图中,1是输入端子,2是时间·频率转换部,3是噪声相似度分析部,4是噪声谱估算部,5是频带SN比计算部,6是听觉权重计算部,7是听觉权重修正部,8是频谱相减部,9是频谱抑制部,10是频率·时间转换部,11是输出端子。此外在图1的噪声相似度分析部3中,12是低通滤波器,13是反向滤波器,14是自相关分析部,15是线性预测分析部,16是更新速度决定部。
以下对动作作以说明。
混入了噪声的输入信号S[t]被按规定的取样频率(比如8kHz)取样,在规定的帧周期(比如20ms)被帧分割并被输入。时间·频率转换部2利用比如256点FFT(Fast Fourier Transform高速傅立叶变换),对输入信号s[t]进行频率分析,转换为振幅谱S[f]及相位谱P[f]。此外由于FFT是周知的方法,因而省略说明。
在噪声相似度分析部3中,首先,由低通滤波器12进行输入信号s[t]的滤波处理,得到低通滤波信号s1[t]。接下来,由线性预测分析部15进行低通滤波信号s1[t]的线性预测分析,得到比如10次的α参数的线性预测系数及帧功率POWfr。反向滤波器13利用线性预测系数对低通滤波信号s1[t]进行反向滤波处理,输出低通线性预测残余信号(以下简称为低通残余信号)res[t]。接着,由自相关分析部14进行低通残余信号res[t]的自相关分析,从自相关系数系列rac[t]求出自相关系数的正的峰值,将其设为RACmax。
更新速度决定部16使用比如自相关系数的正峰值RACmax和低通残余信号res[t]的功率POWres、帧功率POWfr,决定噪声相似度信号Noise,并决定与所决定的噪声相似度信号Noise对应的噪声谱更新速度系数r并输出。图2是表示噪声相似度信号Noise与噪声谱更新速度系数r的关系的附图。更新速度决定部16从比如图2所示的5个量级中决定1个噪声相似度信号Noise,决定出与所决定的噪声相似度信号Noise对应的噪声谱更新速度系数r并输出。
噪声谱估算部4从噪声相似度分析部3输出的噪声谱更新系数r、时间·频率转换部2输出的振幅谱S[f]、内部保存的过去的平均噪声谱Nold[f],如下列式(1)所示进行噪声谱N[f]的更新。
N[f]=(1-r)·Nold[f]+r·S[f] (1)频带SN比计算部5从时间·频率转换部2输出的振幅谱S[f]和噪声谱估算部4输出的噪声谱N[f],根据下列式(2)计算每个频带f的信噪比(频带SN比)SNR[f]。但在SNR[f]为负值的场合下设为0。
SNR[f]=20·log10(S[f]/N[f]) (dB);S[f]>N[f]=0(dB);上述以外 (2)听觉权重计算部6输入规定的常数α、α′(比如α=1.2,α′=0.5)、β,β′(比如β=0.8,β′=0.1)以及γ,γ′(比如γ=0.25,γ′=0.4),根据下列式(3)计算在频率方向被加权了的第1听觉权重αw(f)、第2听觉权重βw(f)及第3听觉权重γw[f]。此外式(3)中的Fc是尼奎斯特频率。
αw[f]=(α′-α)·f/fc+αβw[f]=(β′-β)·f/fc+βγw[f](γ′-γ)·f/fc+γ (3)听觉权重修正部7对第1听觉权重αw[f]及第2听觉权重βw[f],基于频带SN比计算部5输出的频带SN比SNR[f],通过比如下列式(4),在频带SN比SNR[f]小的场合下,将第1听觉权重αw[f]、第2听觉权重βw[f]修正为小值,按照随频带SN比SNR[f]的增大而增大的原则,修正为与各频带的SN比对应的值,把修正后的第1听觉权重αc[f]和第3听觉权重γw[f]向频谱相减部8输出,把修正后的第2听觉权重βc[f]向频谱抑制部9输出。
αc[f]=αw(f)·SNR[f]-MIN_GAINαβc[f]=βw(f)·SNR[f]-MIN_GAINβ(4)此外在上述式(4)中,MIN_GAINα,MIN_GAINβ是规定的常数,分别表示第1听觉权重αw(f)、第2听觉权重βw(f)的最大抑制量[dB]。
图3是表示后述的频谱相减及频谱振幅抑制用的第1听觉权重αc[f]及第2听觉权重βc[f]的频率方向加权控制一例的附图,图中,101表示作为第1听觉权重的频谱相减量αc[f],102表示作为第2听觉权重的频谱振幅抑制量βc[f],103表示语音频谱,104表示噪声谱。听觉权重修正部7在下列式(5)所示的当前帧的平均SN比SNRave高的场合下,按照αc
与αc[fc]值之差增大的原则设定。即,图3中的αc[f]的斜率变大。此外听觉权重修正部7在平均SN比SNRave高的场合下,按照βc[f]缩小βc
与βc[fc]之差的原则设定。即,图3中的βc[f]的斜率变小。这样,随着当前帧的平均SN比SNRave变小,减小αc
与αc[fc]之差,即αc[f]的斜率变小,反之βc
与βc[fc]之差变大,即βc[f]的斜率变大。
SNRave=∑(SNR[f])/fc,f=0,……,fc(5)频谱相减部8对噪声谱N[f]乘以被修正了的第1听觉权重αc[f],按下列式(6)进行振幅谱S[f]的相减,输出噪声消除频谱Ss[f]。此外在作为频谱相减的结果,噪声消除频谱Ss[f]为负值的场合下,进行置换为对比如输入信号的振幅谱S[f]相乘了第3听觉权重γw[f]的频谱,并将其设为噪声消除频谱Ss[f]的回填处理。
Ss[f]=S[f]-αc[f]·N[f];S[f]>αc[f]·N[f]=γw[f]·S[f];上述以外的场合 (6)频谱抑制部9根据下列式(7),对噪声消除频谱Ss[f]乘以被修正了的第2听觉权重βc[f],输出减小了噪声振幅的噪声抑制频谱Sr[f]。
Sr[f]=10^(-βc[f])·Ss[f] (7)
这里,10^(-βc[f])=10-βc[f]。
频率·时间转换部10采用与上述的时间·频率转换部2所进行的处理相反的顺序,进行比如反向FFT,利用噪声抑制频谱Sr[f]及时间·频率转换部2输出的相位谱P[f]转换为时间信号,进行与前帧的部分时间信号成分叠加的处理,从输出信号端子11输出噪声抑制信号sr[t]。
这样,现有的噪声抑制装置在基于频带SN比SNR[f]修正的同时,基于当前帧的平均SN比SNRave利用在频率方向上被加权了的第1听觉权重αc[f]及第2听觉权重βc[f]进行频谱相减及频谱振幅抑制。即由于按照在频带SN比SNR[f]大的频率区域内,第1听觉权重αc[f]及第2听觉权重βc[f]增大,在频带SN比SNR[f]小的频率区域内,第1听觉权重αc[f]及第2听觉权重βc[f]变小的原则进行控制,因而在频谱相减处理中,在SN比大的区域(主要是低频带)较多地减去噪声,在SN比小的区域(主要是高频带)较少地相减,从而对在低频带具有大的成分的汽车行驶噪声等可有效地进行噪声抑制,同时防止频谱的过度相减。此外由于在频谱振幅抑制中,在低频带减弱振幅抑制,随着趋于高频带,增强振幅抑制,因而可防止被称为音乐噪声(musical noise)的不自然而且不愉快的残留噪声的发生。
由于现有的噪声抑制装置具有上述构成,因而比如在根据第1听觉权重αc[f]进行了某一定量以上的噪声相减的场合下,由于在现有的噪声抑制装置中没有在基于第2听觉权重βc[f]的噪声振幅抑制中附加限制的机构,第1听觉权重αc[f]及第2听觉权重βc[f]分别独立被控制,因此基于第1听觉权重αc[f]及第2听觉权重βc[f]的综合的噪声抑制量(以下称总噪声抑制量)在各帧内不是一定的,存在在输出信号中发生时间方向上的不稳定感,听觉上令人不快的课题。
本发明旨在解决上述课题,其目的是得到一种可进行在听感上令人满意的噪声抑制,而且即使在高噪声下质量劣化也较少的噪声抑制装置。
发明内容
本发明涉及的噪声抑制装置具备了振幅抑制量计算部,其从噪声相似度信号及噪声谱计算作为当前帧的噪声抑制水平的振幅抑制量;听觉权重模式调整部,其从振幅抑制量及噪声相似度信号决定作为第1听觉权重的频谱相减量与作为第2听觉权重的频谱振幅抑制量的频率特性分配模式即听觉权重分配模式;听觉权重修正部,其依据频带SN比对由听觉权重分配模式提供的作为第1听觉权重的频谱相减量与作为第2听觉权重的频谱振幅抑制量进行修正,输出被修正了的频谱相减量和被修正了的频谱振幅抑制量;频谱相减部,其从振幅谱减去对噪声谱相乘了被修正了的频谱相减量的频谱,求出噪声消除频谱;频谱抑制部,其对噪声消除频谱乘以被修正了的频谱振幅抑制量,求出噪声抑制频谱。
这样,由于噪声抑制后的输出信号在时间方向上稳定,因而具有在可进行听感上令人满意的噪声抑制的同时,即使在高噪声下也可进行质量劣化较少的噪声抑制的效果。
在本发明涉及的噪声抑制装置中,听觉权重修正部在频带SN比大的低频带,在增大作为第1听觉权重的频谱相减量的同时,减小作为第2听觉权重的频谱振幅抑制量,在频带SN比小的高频带,在减小作为第1听觉权重的频谱相减量的同时,增大作为第2听觉权重的频谱振幅抑制量。
这样,其效果为在可有效抑制在低频带具有大的噪声成分的汽车行驶噪声,在高频带可防止频谱的过度消除从而防止语音频谱变形的同时,对叠加了在低频带具有大的成分的汽车行驶噪声的语音信号,可抑制在频谱相减处理中未完全除去的高频带残留噪声。
在本发明涉及的噪声抑制装置中,听觉权重模式调整部具备听觉权重基本分配模式,其由成为用于决定听觉权重分配模式的基本的、与噪声相似度信号对应的多个频率特性模式组成,从该听觉权重基本分配模式中选择与由噪声相似度分析部输出的噪声相似度信号对应的频率特性模式,决定听觉权重分配模式。
这样,其效果为在噪声相似度信号的噪声相似度小的场合下,在通过在低频带增大频谱相减的程度,可获得大的噪声抑制量的同时,通过随着噪声相似度的增大,减小低频带的频谱相减的程度,可防止频谱变形。
在本发明涉及的噪声抑制装置中,听觉权重模式调整部具备了听觉权重基本分配模式,其由根据使用环境被任意变更的多个频率特性模式组成。
这样,其效果为可提高被修正了的频谱相减量与被修正了的频谱振幅抑制量的精度,进一步进行质量劣化少的噪声抑制。
本发明涉及的噪声抑制装置具备听觉权重模式变更部,其求出振幅谱的高频带功率对低频带功率之比,听觉权重模式调整部根据振幅谱的高频带功率对低频带功率之比决定听觉权重分配模式。
这样,其效果为可使听觉权重分配模式适应语音区间的频谱形状,进一步进行听感上令人满意的噪声抑制。
本发明涉及的噪声抑制装置具备听觉权重模式变更部,其求出噪声谱的高频带功率对低频带功率之比,听觉权重模式调整部根据噪声谱的高频带功率对低频带功率之比决定听觉权重分配模式。
这样,其效果为可稳定地使听觉权重分配模式适应噪声区间的平均频谱形状,进一步进行听感上令人满意的噪声抑制。
本发明涉及的噪声抑制装置具备听觉权重模式变更部,其求出根据振幅谱及噪声谱的加权平均获得的平均频谱的高频带功率对低频带功率之比,听觉权重模式调整部根据平均频谱的高频带功率对低频带功率之比决定听觉权重分配模式。
这样,其效果为可在听觉权重分配模式中加进输入信号的振幅谱和噪声谱的形状,进一步进行听感上令人满意的噪声抑制。
在本发明涉及的噪声抑制装置中,频谱相减部在相减结果为负值的场合下,根据振幅谱、振幅抑制量以及越趋于高频带权重越大的第3听觉权重,求出噪声消除频谱。
这样,其效果为由于在可抑制被认为是音乐噪声发生原因之一的在频率轴上孤立的尖锐频谱的生成的同时,在语音区间可使高频带的残留噪声的频谱形状与输入信号的振幅谱类似,因而高频带的残留噪声与语音信号类似,自然性提高,可进行听感上令人满意的噪声抑制。
在本发明涉及的噪声抑制装置中,频谱相减部在相减结果为负值的场合下,根据噪声谱、振幅抑制量以及越趋于高频带权重越大的第3听觉权重,求出噪声消除频谱。
这样,其效果为在可抑制被认为是音乐噪声发生原因之一的在频率轴上孤立的尖锐频谱的生成的同时,可实现高频带的残留噪声的时间·频率方向的稳定化,可进行听感上令人满意的噪声抑制。
在本发明涉及的噪声抑制装置中,频谱相减部在相减结果为负值的场合下,根据由听觉权重模式变更部所求出的平均频谱、振幅抑制量以及越趋于高频带权重越大的第3听觉权重,求出噪声消除频谱。
这样,其效果为由于在可抑制被认为是音乐噪声发生原因之一的在频率轴上孤立的尖锐频谱的生成的同时,在子音等过渡部区间也可在高频带的残留噪声谱中加进输入信号的振幅谱及噪声谱,因而残留噪声的自然性提高,可进行听感上令人满意的噪声抑制。
在本发明涉及的噪声抑制装置中,听觉权重修正部根据由听觉权重模式变更部所求出的振幅谱的高频带功率对低频带功率之比,变更越趋于高频带权重越大的第3听觉权重。
这样,其效果为在可抑制音乐噪声的发生的同时,可进一步进行听感上令人满意的噪声抑制。
在本发明涉及的噪声抑制装置中,听觉权重修正部根据由听觉权重模式变更部所求出的噪声谱的高频带功率对低频带功率之比,变更越趋于高频带权重越大的第3听觉权重。
这样其效果为在可抑制音乐噪声的发生的同时,可进一步进行听感上令人满意的噪声抑制。
在本发明涉及的噪声抑制装置中,听觉权重修正部根据由听觉权重模式变更部所求出的振幅谱及噪声谱的加权平均获得的平均频谱的高频带功率对低频带功率之比,变更越趋于高频带权重越大的第3听觉权重。
这样其效果为在可抑制音乐噪声的发生的同时,可进一步进行听感上令人满意的噪声抑制。
在本发明涉及的噪声抑制装置中,听觉权重模式变更部基于噪声相似度信号求出平均频谱。
这样其效果为可进一步进行听感上令人满意的噪声抑制。
图1是表示现有的噪声抑制装置构成的方框图。
图2是表示噪声相似度信号Noise与噪声谱更新速度系数r的关系的附图。
图3是表示现有的噪声抑制装置中的频谱相减及频谱振幅抑制的控制方法一例的附图。
图4是表示基于本发明实施方式1的噪声抑制装置构成的方框图。
图5是表示基于本发明实施方式1的噪声抑制装置中的听觉权重基本分配模式的一例的附图。
图6A至图6C是表示基于本发明实施方式1的噪声抑制装置中的频谱相减量及频谱振幅抑制量的分配模式调整的一例的附图。
图7是表示基于本发明实施方式3的噪声抑制装置构成的方框图。
图8A及图8B是表示基于本发明实施方式3的噪声抑制装置中的听觉权重分配模式的变更控制方法一例的附图。
图9是表示基于本发明实施方式4的噪声抑制装置构成的方框图。
图10是表示基于本发明实施方式5的噪声抑制装置构成的方框图。
图11是表示基于本发明实施方式6的噪声抑制装置构成的方框图。
图12是表示基于本发明实施方式6的噪声抑制装置中的第3听觉权重的频率方向模式一例的附图。
图13A及图13B是表示基于本发明实施方式6的噪声抑制装置中的未进行听觉加权场合下的噪声消除频谱一例的附图。
图14A及图14B是表示基于本发明实施方式6的噪声抑制装置中的进行听觉加权场合下的噪声消除频谱一例的附图。
图15是表示基于本发明实施方式8的噪声抑制装置构成的方框图。
图16是表示基于本发明实施方式9的噪声抑制装置构成的方框图。
图17是表示基于本发明实施方式10的噪声抑制装置构成的方框图。
图18是表示基于本发明实施方式11的噪声抑制装置构成的方框图。
实施方式以下为更详细地说明本发明,按附图对实施本发明的最佳方式作以说明。
实施方式1图4是表示基于本发明实施方式1的噪声抑制装置构成的方框图。图中,1是输入输入信号S[t]的输入端子,2是对输入信号S[t]进行频率分析,转换为振幅谱s[f]及相位谱P[f]的时间·频率转换部,3是在从输入信号S[t]判定噪声相似度,输出噪声相似度信号Noise的同时,输出与噪声相似度信号Noise对应的噪声谱更新速度系数r的噪声相似度分析部。
此外在图4中,4是从噪声谱更新系数r、振幅谱S[f]、内部保存的过去的平均噪声谱Nold[f]对噪声谱N[f]进行更新并输出的噪声谱估算部,5是从振幅谱S[f]及噪声谱N[f]计算作为各频带f的信噪比的频带SN比SNR[f]的频带SN比计算部。
此外在图4中,20是振幅抑制量计算部,其从噪声相似度信号Noise及噪声谱N[f]计算作为当前帧的噪声抑制水平的振幅抑制量min_gain,21是听觉权重模式调整部,其从振幅抑制量min_gain及噪声相似度信号Noise决定系作为第1听觉权重的频谱相减量α[f]与作为第2听觉权重的频谱振幅抑制量β[f]的频率特性分配模式的听觉权重分配模式min_gain_pat[f],7是听觉权重修正部,其依据频带SN比SNR[f]对由听觉权重分配模式min_gain_pat[f]提供的作为第1听觉权重的频谱相减量α[f]与作为第2听觉权重的频谱振幅抑制量β[f]进行修正,输出作为被修正了的第1听觉权重的频谱相减量αc[f]与作为被修正了的第2听觉权重的频谱振幅抑制量βc[f]。
此外在图4中,8是频谱相减部,其从振幅谱S[f]减去对噪声谱N[f]相乘了被修正了的频谱相减量αc[f]的频谱,求出噪声消除频谱Ss[f],9是频谱抑制部,其对噪声消除频谱Ss[f]乘以被修正了的频谱振幅抑制量βc[f],求出噪声抑制频谱Sr[f],10是频率·时间转换部,其依据相位谱P[f]把噪声抑制频谱Sr[f]转换为时间信号,输出噪声抑制信号sr[t],11是噪声抑制信号sr[t]的输出端子。
以下对动作作以说明。
时间·频率转换部2与现有的一样,对输入信号s[t]进行频率分析,转换为振幅谱S[f]及相位谱P[f]并输出。噪声相似度分析部3在从输入信号s[t]判定噪声相似度,输出噪声相似度信号Noise的同时,输出与噪声相似度信号Noise对应的噪声谱更新速度系数r。
噪声谱估算部4与现有的同样,从来自噪声相似度分析部3的噪声谱更新系数r、来自时间·频率转换部2的振幅谱S[f]、内部保存的过去的平均噪声谱Nold[f],对噪声谱N[f]进行更新并输出。此外频带SN比计算部5也与现有的同样,根据来自时间·频率转换部2的振幅谱S[f]和来自噪声谱估算部4的噪声谱N[f],计算作为每个频带f的信噪比的频带SN比SNR[f]。
振幅抑制量计算部20从来自噪声相似度分析部3的噪声相似度信号Noise、来自噪声谱估算部4的噪声谱N[f],按以下方法计算作为当前帧的噪声抑制水平的振幅抑制量min_gain。首先,振幅抑制量计算部20根据下列式(8)进行噪声谱N[f]的功率计算,获得当前帧的噪声功率Npow。此外式(8)中的fc是尼奎斯特频率。
Npow=10·log10(∑N[f]),f=0,……,fc (8)接下来,振幅抑制量计算部20根据下列式(9),将作为规定的常数的最大振幅抑制量MIN_GAIN与由上述式(8)获得的噪声功率Npow进行比较,在噪声功率Npow超过最大振幅抑制量MIN_GAIN的场合下,将振幅抑制量min_gain限制到MIN_GAIN。此外在把最大振幅抑制量MIN_GAIN设定到了比如10dB的较小值的场合下,除了在式(9)中Npow<MIN_GAIN时(在输入信号s[t]中几乎没有噪声时),振幅抑制量min_gain被设定到MIN_GAIN。即,在有噪声的场合下,噪声抑制水平固定为MIN_GAIN值。此外在输入信号s[t]中几乎没有噪声时,振幅抑制量min_gain被设定为Npow。
min_gain=MIN_GAIN (dB);Npow>MIN_GAIN=Npow(dB);上述以外(9)听觉权重模式调整部21从由上述式(9)求出的振幅抑制量min_gain、来自噪声相似度分析部3的噪声相似度信号Noise、成为决定作为第1听觉权重的频谱相减量α[f]与作为第2听觉权重的频谱振幅抑制量β[f]的范围的听觉权重分配模式的基本的听觉权重基本分配模式MIN_GAIN_PAT[i][f],决定作为第1听觉权重的频谱相减量α[f]与作为第2听觉权重的频谱振幅抑制量β[f]的频率特性分配模式即听觉权重分配模式min_gain_pat[f]并输出。
图5是表示用于决定听觉权重分配模式min_gain_pat[f]的听觉权重基本分配模式MIN_GAIN_PAT[i][f]的示例的附图。这里,i随噪声相似度信号Noise的值变化,比如i=0~4。在图5中,101表示频谱相减量αc[f],102表示频谱振幅抑制量βc[f],150表示存储器。如图5所示,作为听觉权重基本分配模式MIN_GAIN_PAT[i][f],与噪声相似度信号Noise对应,准备具有各种频率特性的振幅抑制量,被存储到听觉权重模式调整部21内的ROM表等的存储器(未图示),与来自噪声相似度分析部3的噪声相似度信号Noise对应的听觉权重基本分配模式MIN_GAIN_PAT[Noise][f]被从存储器输出。
接下来,听觉权重模式调整部21根据下式(10),对与噪声相似度信号Noise对应的听觉权重基本分配模式MIN_GAIN_PAT[Noise][f],乘以来自振幅抑制量计算部20的振幅抑制量min_gain,决定作为第1听觉权重的频谱相减量α[f]与作为第2听觉权重的频谱振幅抑制量β[f]的频率特性分配模式的听觉权重分配模式min_gain_pat[f]并输出。
min_gain_pat[f]=min_gain·MIN_GAIN_PAT[Noise][f] (10)听觉权重修正部7利用来自频带SN比计算部5的频带SN比SNR[f]及由上述式(10)求出的来自听觉权重模式调整部21的听觉权重分配模式min_gain_pat[f],通过下式(11)~(13),决定作为被修正了的第1听觉权重的频谱相减量αc[f]和作为被修正了的第2听觉权重的频谱振幅抑制量βc[f]并输出。
首先,听觉权重修正部7根据下式(11)对频带SN比SNR[f]进行稳定化处理,求出稳定化了的SN比SNRlim[f]。在式(11)中,SNR_THLD[f]是用于在频带SN比SNR[f]极小的场合下,使后述的式(12)的频谱振幅抑制量β[f]稳定到听觉权重分配模式min_gain_pat[f]值,以实现稳定化的规定的常数阈值。
SNRlim[f]=SNR_THLD[f];SNR[f]<SNR_THLD[f]=SNR[f];上述以外(11)接下来,听觉权重修正部7根据下式(12),求出被修正了的频谱振幅抑制量βc[f]。在式(12)中,GAIN[f]是规定的常数,按照比如随着趋于高频带增大的原则设定,被修正了的频谱相减量αc[f]和被修正了的频谱振幅抑制量βc[f]是用于按照越趋于高频带对SNR[f]的变化反应越敏感的原则动作的加速系数。根据式(12),如果频带SN比SNR[f]增大,式(12)的第1项((SNRlim[f]-SNR_THLD[f])·GAIN[f])增大,在第1项(如果SNRlim[f]>SNR_THLD[f]则为正值)小于第2项(min_gain_pat[f])的场合下,被修正了的频谱振幅抑制量βc[f]取负数,但由于随着第1项的增大,βc[f]的绝对值变小,因而负增益变小。即振幅抑制减弱。反之如果频带SN比SNR[f]减小,由于被修正了的频谱振幅抑制量βc[f]增大,因而负增益增大。即振幅抑制增强。此外在被修正了的频谱振幅抑制量βc[f]超过0(dB)的场合下,限制到0(dB),不进行振幅抑制。此外在频带SN比SNR[f]小于SNR_THLD[f]的场合下,根据上述式(11),因为SNRlim[f]被限制到SNR_THLD[f],因而被修正了的频谱振幅抑制量βc[f]成为稳定到min_gain_pat[f]的定值。
βc[f]=(SNRlim[f]-SNR_THLD[f])·GAIN[f]-min_gain_pat[f]=0(dB);βc[f]>0 (12)听觉权重修正部7在利用上述式(12)求出被修正了的频谱振幅抑制量βc[f]后,通过下式(13),利用被修正了的频谱振幅抑制量βc[f]求出被修正了的频谱相减量αc[f]。
αc[f]=min_gain-βc[f] (13)在图5的示例中,在噪声相似度信号Noise的噪声相似度最小的场合下(Noise=3,4的场合),在低频带频谱相减的程度最大,随着噪声相似度的增大(Noise=2,1),低频带的频谱相减程度减小,频谱振幅抑制的程度相对增大。这里,图5中的(a)表示Noise=3,4的场合,(b)表示Noise=2的场合,(c)表示Noise=0的场合。这样在噪声相似度小的场合下(有音的概率高的场合),由于当前帧的全频带的平均SN比大,因而由频谱相减可得到大的噪声抑制量。另一方面,在噪声相似度大的场合下(噪声的概率高的场合),由于当前帧的全频带的平均SN比小,因而通过频谱相减程度的变小,频谱振幅抑制程度相对增大,可防止频谱变形。
图6A是表示当前帧为有音场合下在噪声相似度信号Noise=4,min_gain为10dB场合下的作为被修正了的第1听觉权重的频谱相减量αc[f]及作为被修正了的第2听觉权重的频谱振幅抑制量βc[f]的分配模式调整一例的附图,图中,103表示语音频谱,104表示噪声谱,105表示min_gain=10dB,对于表示与图5相同的要素的部分附加同一符号,省略其说明。此外图6B表示可按图6A中的频谱相减量αc[f]的所分配的SN比修正的范围,图6C表示可按图6A中的频谱振幅抑制量βc[f]的所分配的SN比修正的范围。在图6A的示例中,虽然与现有的图3所示的噪声抑制装置的频谱相减量·振幅抑制量控制同样,在低频带后述的频谱相减的程度增大,随着趋于高频带后述的频谱振幅抑制程度增大,但与图3所示的以往技术的控制的不同点在于,被修正了的频谱相减量αc[f]及被修正了的频谱振幅抑制量βc[f]相互不会大到超过图6A中的听觉权重分配模式min_gain_pat[f]的程度。
即,在整个频带内,由于基于被修正了的频谱相减量αc[f]及被修正了的频谱振幅抑制量βc[f]的总的噪声抑制量稳定在min_gain,因而在可防止过度的频谱相减及频谱振幅抑制的同时,帧间的振幅抑制量可达到稳定,不连续感可降低。
频谱相减部8根据下式(14),从振幅谱S[f],减去对噪声谱N[f]相乘了被修正了的频谱相减量αc[f]的频谱,输出噪声消除频谱Ss[f]。在噪声消除频谱Ss[f]成为负值的场合下,进行把振幅抑制量计算部20输出的振幅抑制量min_gain(dB)转换为线性值min_gain_lin,把对其乘以输入信号的振幅谱S[f]的乘积作为噪声消除频谱Ss[f]的回填处理。
Ss[f]=S[f]-αc[f]·N[f];S[f]>αc[f]·N[f]=S[f]·min_gain_lin;上述以外 (14)频谱抑制部9把由上述式(12)求出的被修正了的频谱振幅抑制量βc[f](dB值)转换为线性值β_1[f],通过下式(15),对噪声消除频谱Ss[f]乘以频谱振幅抑制量β_1[f],输出噪声抑制频谱Sr[f]。
Sr[f]=β_1[f]·Ss[f] (15)频率·时间转换部10利用时间·频率转换部2输出的相位谱P[f]把噪声抑制频谱Sr[f]转换为时间信号,与前帧的部分信号叠加,从输出端子11输出噪声抑制信号sr[t]。
如上所述,根据本实施方式1,如图6A至图6C及式(13)所示,由于根据作为被修正了的第2听觉权重的频谱振幅抑制量βc[f]的值,决定作为被修正了的第1听觉权重的频谱相减量αc[f]的值,因而基于被修正了的频谱振幅抑制量αc[f]和被修正了的频谱相减量βc[f]的总的噪声抑制量成为稳定的min_gain,由于噪声抑制后的输出信号在时间方向上稳定,因而可得到在可进行听感上令人满意的噪声抑制的同时,即使在高噪声下也可进行较少质量劣化的噪声抑制的效果。
比如,在利用被修正了的频谱振幅抑制量βc[f]进行了至振幅抑制量min_gain的频谱振幅抑制的场合下,由于不再进行基于被修正了的频谱相减量αc[f]的频谱相减,因而总噪声抑制量在各帧成为定值。
此外基于本实施方式1,根据噪声谱的形状其数值有差异,由于有声语音的低频带成分较大,因而一般低频带的SN比将较大,因此如图6A所示,在听觉权重分配模式min_gain_pat[f]中,在低频带增大作为被修正了的第1听觉权重的频谱相减量αc[f]的程度,随着趋于高频带减小该程度,通过在SN比大的低频带大幅减去噪声,可有效抑制在低频带具有大的噪声成分的汽车行驶噪声,同时通过在SN比小的高频带降低相减量,可防止频谱的过度消除,取得可防止高频带成分的语音频谱变形的效果。
此外根据本实施方式1,如图6A至图6C所示,通过对于作为被修正了的第2听觉权重的频谱振幅抑制量βc[f],在SN比大的低频带,减小频谱振幅抑制的程度,随着趋于SN比变小的高频带,增大频谱振幅抑制的程度,可得到对于叠加了在低频带具有大的成分的汽车行驶噪声的语音信号,可抑制在频谱相减处理中未完全除去的高频带残留噪声的效果。
此外根据本实施方式1,通过从比如图5所示的多个频率特性中按照噪声相似度信号Noise选择第1及第2听觉权重的听觉权重基本分配模式MIN_GAIN_PAT[i][f],在噪声相似度信号Noise的噪声相似度小的场合下,通过在低频带增大频谱相减程度,可得到大的噪声抑制量,同时通过随着噪声相似度增大减小低频带的频谱相减程度,取得能防止频谱变形的效果。
实施方式2表示基于本发明的实施方式2的噪声抑制装置构成的方框图与实施方式1的图4相同。在本实施方式中可根据使用环境任意变更实施方式1的图5所示的听觉权重基本分配模式MIN_GAIN_PAT[i][f]。
以下对动作作以说明。
通过比如预先调查与使用环境对应的噪声谱N[f]的平均频率特性及频带SN比的分布等,对听觉权重基本分配模式MIN_GAIN_PAT[i][f]进行修正,或根据从使用环境获得的输入信号数据最佳学习听觉权重基本分配模式MIN_GAIN_PAT[i][f],使听觉权重基本分配模式MIN_GAIN_PAT[i][f]适应使用环境。
如上所述,根据本实施方式2,通过根据使用环境任意变更听觉权重基本分配模式MIN_GAIN_PAT[i][f],被修正了的频谱相减量αc[f]及被修正了的频谱振幅抑制量βc[f]的精度可被提高,获得可进一步进行较少质量劣化的噪声抑制的效果。
实施方式3图7是表示基于本发明实施方式3的噪声抑制装置构成的方框图。图中,22是求出振幅谱S[f]的低频带功率与高频带功率之比的听觉权重模式变更部,由于其它构成与图4同样,因而省略说明。在该实施方式3中,在语音区间,把从当前帧的输入信号s[t]获得的振幅谱S[f]分割为低频带和高频带,分别求出低频带功率和高频带功率,根据该低频带功率与高频带功率之比,变更第1及第2听觉权重的听觉权重分配模式min_gain_pat[f]。
以下对动作作以说明。
听觉权重模式变更部22从由时间·频率转换部2输出的振幅谱S[f],根据下式(16),把比如0~63点以下作为低频带频谱,把64点~127点以下作为高频带频谱,分别计算低频带功率Pow_1及高频带功率Pow_h,从所获得的低频带功率Pow_1及高频带功率Pow_h求出高频带/低频带功率比Pv并输出。但在高频带/低频带功率比Pv超过规定的上限阈值pv_H的场合下,Pv限制到Pv_H,在高频带/低频带功率比低于规定的下限阈值Pv_L的场合下,Pv限制到Pv_L。
Pow_1=∑S[f];f=0,……,63
Pow_h=∑S[f];f=64,……,127Pv=Pow_h/Pow_1但,Pv=Pv_H;Pv>Pv_HPv=Pv_L;Pv<Pv_L (16)听觉权重模式调整部21从来自振幅抑制量计算部20的振幅抑制量min_gain、来自噪声相似度分析部3的噪声相似度信号Noise、来自听觉权重模式变更部22的高频带/低频带功率比Pv,根据下式(17),决定作为第1听觉权重的频谱相减量α[f]和作为第2听觉权重的频谱振幅抑制量β[f]的听觉权重分配模式min_gain_pat[f]。式(17)中的MIN_GAIN_PAT[Noise][f]是噪声相似度信号Noise选择的基本分配模式,Pv_inv是被通过上式(16)求出的高频带/低频带功率比Pv的倒数。此外在听觉权重分配模式min_gain_pat[f]超过振幅抑制量min_gain的场合下,把数值限制到振幅抑制量min_gain。此外式(17)中的fc是尼奎斯特频率。
min_gain_pat[f]=min_gain·MIN_GAIN_PAT[Noise][f](1.0·(fc-f)+Pv_inv·f)/fc但,Pv_inv=1.0/Pvmin_gain_pat[f]=min_gain;min_gain_pat[f]>min_gain (17)图8A及图8B是表示听觉权重分配模式的变更控制方法一例的附图,是根据上述方法,变更了第1及第2听觉权重的听觉权重分配模式min_gain_pat[f]的场合的附图。图8A是高频带功率Pow_h大于低频带功率Pow_1的场合,图8B是低频带功率Pow_1大于高频带功率Pow_h的场合,在各自的附图中,对与图5相同的要素附加同一符号,省略其说明。
由于一般在高频带功率Pow_h大于低频带功率Pow_1的场合下高频带的SN比增大,因而如图8A所示,使听觉权重分配模式min_gain_pat[f]的斜率变缓,更高频带的频谱相减程度增大。另一方面,由于在低频带功率Pow_1大于高频带功率Pow_h的场合下低频带的SN比增大,因而如图8B所示,使听觉权重分配模式min_gain_pat[f]的斜率变陡,增大高频带的频谱振幅抑制程度。
如上所述,根据本实施方式3,在语音区间,输入信号的振幅谱S[f]中含有较多的语音信号成分,通过根据振幅谱S[f]变更听觉权重分配模式min_gain_pat[f],使听觉权重分配模式min_gain_pat[f]适应语音区间的频谱形状,通过进行适应了语音信号的频率特性的频谱相减及频谱振幅抑制,取得能进一步进行在听感上令人满意的噪声抑制的效果。
实施方式4图9是表示基于本发明实施方式4的噪声抑制装置构成的方框图。图中,22是在噪声区间,求出噪声谱N[f]的低频带功率与高频带功率之比的听觉权重模式变更部,其它构成与实施方式3的图7同样。在该实施方式中,在噪声区间,取代振幅谱S[f],把噪声谱N[f]分割为低频带和高频带,求出低频带功率Pow_1和高频带功率Pow_h,根据该低频带功率Pow_1与高频带功率Pow_h之比Pv,变更第1及第2听觉权重的听觉权重分配模式min_gain_pat[f]。
接下来对动作作以说明。
在噪声区间,输入信号的振幅谱S[f]随时间·频率剧烈变动,不适合于根据不稳定的输入信号的振幅谱S[f]变更听觉权重分配模式min_gain_pat[f]。因此,根据保持平均的噪声谱形状的在时间·频率方向上稳定的噪声谱N[f],听觉权重模式调整部21进行听觉权重分配模式min_gain_pat[f]的变更。
如上所述,根据该实施方式4,通过在噪声区间,根据在时间·频率方向上稳定的噪声谱N[f]的低频带功率Pow_1与高频带功率Pow_h之比Pv,变更第1及第2听觉权重的听觉权重分配模式min_gain_pat[f],稳定地使听觉权重分配模式min_gain_pat[f]适应噪声区间的平均频谱形状,通过进行适应了噪声区间的频率特性的频谱相减及频谱振幅抑制,取得可进一步进行听感上令人满意的噪声抑制的效果。
实施方式5图10是表示基于本发明实施方式5的噪声抑制装置构成的方框图。图中,22是在子音等语音过渡部区间,基于噪声相似度信号Noise,求出由振幅谱S[f]及噪声谱N[f]的加权平均得到的平均频谱A[f]的低频带功率与高频带功率之比的听觉权重模式变更部,其它构成与实施方式4的图9相同。
在该实施方式中,在子音等的语音过渡部区间,取代振幅谱S[f],把由振幅谱S[f]和噪声谱N[f]的加权平均得到的平均频谱A[f]分割为低频带和高频带,求出低频带功率Pow_1和高频带功率Pow_h,根据该低频带功率Pow_1与高频带功率Pow_h之比Pv,变更第1及第2听觉权重的听觉权重分配模式min_gain_pat[f]。
以下对动作作以说明。
听觉权重模式变更部22首先输入由时间频率转换部2输出的128点振幅谱S[f]及由噪声谱估算部4输出的噪声谱N[f],由下式(18)求出平均频谱A[f]。式(18)中的Cn是比如由上述图2所示的噪声相似度信号Noise的形态决定的规定的加权系数,如果图2中的噪声相似度信号Noise处于0~2的范围,由于当前帧处于噪声区间的可能性较高,因而设为Cn=0.7,在噪声谱N[f]设置权重。另一方面,如果噪声相似度信号Noise为3或4,由于当前帧处于语音区间的可能性较高,因而设为Cn=0.3,在输入信号的振幅谱S[f]设置权重。
A[f]=(1-Cn)·S[f]+Cn·N[f] (18)听觉权重模式变更部22从由上式(18)得到的平均频谱A[f],根据下式(19),把比如0~63点以下作为低频带频谱,把64点~127点以下作为高频带频谱,分别计算低频带功率Pow_1及高频带功率Pow_h。听觉权重模式变更部22从所获得的低频带功率Pow_1及高频带功率Pow_h求出高频带/低频带功率比Pv并输出。但在高频带/低频带功率比Pv超过规定的上限阈值Pv_H的场合下,把Pv限制到Pv_H,在高频带/低频带功率比Pv低于规定的下限阈值Pv_L的场合下,把Pv限制到Pv_L。
Pow_1=∑A[f];f=0,......,63Pow_h=∑A[f];f=64,......,127Pv=Pow_h/Pow_1但,Pv=Pv_H;Pv>Pv_HPv=Pv_L;Pv<Pv_L (19)如上所述,根据该实施方式5,通过根据输入信号的振幅谱S[f]及噪声谱N[f]的平均频谱A[f]的低频带功率Pow_1与高频带功率Pow_h之比Pv,变更第1及第2听觉权重的听觉权重分配模式min_gain_pat[f],可通过在许多被误判定为噪声区间的难以作为语音区间判定的子音及语音过渡部等的区间内,在听觉权重分配模式min_gain_pat[f]中附加输入信号的振幅谱S[f]及噪声谱N[f]的形状,与过渡部区间的频率特性相适应,进行频谱相减及频谱振幅抑制,得到可进一步进行听感上令人满意的噪声抑制的效果。
此外根据本实施方式5,由于基于噪声相似度信号Noise,求出输入信号的振幅谱S[f]和噪声谱N[f]的平均频谱A[f],因而与把加权系数Cn设为固定值的场合相比,可得到更适应了当前帧的有音·噪声的形态的平均频谱A[f],此外得到可进行听感上令人满意的噪声抑制的效果。
实施方式6图11是表示基于本发明实施方式6的噪声抑制装置构成的方框图。图中,7是输出作为被修正了的第1听觉权重的频谱相减量αc[f]、作为被修正了的第2听觉权重的频谱振幅抑制量βc[f]、第3听觉权重γc[f]的听觉权重修正部。其它构成与实施方式1的图4所示的构成相同。在该实施方式中,在频谱相减部8中,在噪声消除频谱Ss[f]成为负值的场合下的回填处理中所采用的频谱信号中,采用比如在语音区间在输入信号的振幅谱S[f]中进行了频率方向的加权的信号。
频谱相减部8根据下式(20),从振幅谱S[f],减去对噪声谱N[f]相乘了被修正了的频谱相减量αc[f]的频谱,输出噪声消除频谱Ss[f]。在噪声消除频谱Ss[f]成为负值的场合下,进行使振幅抑制量min_gain与振幅谱S[f]相乘,并把与越趋于高频带权重越大的听觉权重修正部7输出的第3听觉权重γc[f]相乘的乘积作为噪声消除频谱Ss[f]的回填处理。
Ss[f]=S[f]-αc[f]·N[f];S[f]>αc[f]·N[f]=γc[f]·min_gain·S[f];上述以外(20)此外上式(20)中的第3听觉权重γc[f]由下式(21)生成。
SNR_g=(SNR_MAX-SNR[f])·C_snrγc[f]=γH[f];γw[f]·SNR_g>γH[f]=γw[f]·SNR_g;γL[f]<=γw[f]·SNR_g<=γH[f]
=γL[f];γw[f]·SNR_g<γL[f](21)上式(21)中的SNR_MAX及C_snr是取规定的正值的常数,用于掌握基于第3听觉权重γc[f]的SN比的控制。此外γH[f]及γL[f]是按各频带f确定的常数,取0<γL[f]<γH[f],f=0,...,fc等关系。即根据上式(21),如果频带SN比增大,γc[f]的值变小,反之如果频带SN比变小,γc[f]的值增大。
虽然汽车行驶时的输入语音信号一般随着趋于高频带其SN比将变小,但噪声的频谱成分功率的绝对值也变小。因此频谱相减的结果,由于随着趋于高频带SN比变小,因而频谱成分成为负值的场合增多,被认为是音乐噪声发生原因之一的孤立的尖锐频谱成分的发生可能性增大。因此,如图12所示,通过对在用于回填的输入信号的振幅谱S[f]中听觉加权的第3听觉权重γc[f],随着趋于高频带而增大权重,越趋于高频带越增大回填量,可防止尖锐频谱成分的发生。在此,在图12中,103表示语音频谱,106表示第3听觉权重γc[f]的频率方向模式一例。
图13A至图14B是表示噪声消除频谱Ss[f]一例的附图,图13A、图13B是通过对输入信号的振幅谱S[f]未加权的频谱回填的场合,图14A、图14B是通过用图12所示的第3听觉权重γc[f]加权了的频谱回填的场合。在图13A、图14A中,104表示噪声谱,107表示基于频谱相减S[f]-αc[f]·N[f]的频谱形状,108表示频谱成分为负的部分,109表示对输入振幅谱相乘了min_gain的回填频谱,112表示对输入振幅谱相乘了min_gain和第3听觉权重的回填频谱。此外在图13B、图14B中,110表示噪声消除频谱Ss[f],111表示孤立的频谱成分。图13B是对图13A的频谱成分为负的部分进行了回填处理的附图,图14B是对图14A的频谱成分为负的部分进行了回填处理的附图。
如果将图13B与图14B作以比较,在图13B中发生的高频带的尖锐频谱成分在图14B中消失,由此得知可减轻音乐噪声。
如上所述,根据该实施方式6,通过对回填处理用的振幅谱S[f]进行随着趋于高频带而增大权重的听觉加权,由于随着趋于高频带而增大回填频谱成分的振幅,即增大回填量,因而,得到可抑制被认为是音乐噪声发生原因之一的在频率轴上孤立的尖锐频谱的生成的效果。
此外根据该实施方式6,在语音区间,由于可使高频带的残留噪声的频谱形状与输入信号的振幅谱S[f]类似,因而得到使高频带的残留噪声与语音信号类似,提高自然性,可进行听感上令人满意的噪声抑制的效果。
实施方式7表示基于本发明的实施方式7的噪声抑制装置构成的方框图与实施方式6的图11所示构成相同。在该实施方式中,在频谱相减部8中,比如在噪声区间,取代回填处理用的输入信号的振幅谱S[f],采用噪声谱N[f]。
接下来对动作作以说明。
在噪声区间,由于输入信号的振幅谱S[f]随时间·频率发生大的变动,因而在频谱相减部8中,取代上述式(20)中的振幅谱S[f],通过把在保持平均的噪声谱形状的时间·频率方向上稳定的噪声谱N[f]作为回填频谱,把γc[f]·min_gain·N[f]作为噪声消除频谱Ss[f],实现残留噪声的时间·频率方向上的稳定化。
如上所述,根据该实施方式7,通过对回填处理用的噪声谱N[f]进行随着趋于高频带而增大权重的听觉加权,由于随着趋于高频带而增大回填频谱成分的振幅,即增大回填量,因而,得到可抑制被认为是音乐噪声发生原因之一的在频率轴上孤立的尖锐频谱的生成的效果。
此外根据该实施方式7,由于在噪声区间,可使高频带的残留噪声的频谱形状与保持平均的噪声谱形状并在时间·频率方向上稳定的噪声谱N[f]类似,因而得到可实现高频带的残留噪声的时间·频率方向上的稳定化,可进行听感上令人满意的噪声抑制的效果。
实施方式8图15是表示基于本发明实施方式8的噪声抑制装置构成的方框图。图中,听觉权重模式变更部22除了实施方式5的图10所示的听觉权重模式变更部22的功能外,还向频谱相减部8输出所求出的平均频谱Ag[f]。此外听觉权重修正部7与实施方式6的图11所示的听觉修正部7相同,频谱相减部8在子音等的语音过渡部区间,取代回填处理用的输入信号的振幅谱S[f],采用从输入信号的振幅谱S[f]和噪声谱N[f]的加权平均得到的平均频谱Ag[f]。
接下来对动作作以说明。
听觉权重模式变更部22通过比如与上述实施方式5中记述的同样的方法,输入时间·频率转换部2输出的128点的振幅谱S[f]和噪声谱估算部4输出的噪声谱N[f],从下式(22)求出平均频谱Ag[f]。式(22)中的Cng是比如由图2所示的噪声相似度信号Noise的形态决定的规定的加权系数,如果图2中的噪声相似度信号Noise处于0~2范围,由于当前帧处于噪声区间的可能性高,因而设为Cng=0.7,在噪声谱N[f]设置权重。另一方面,如果噪声相似度信号Noise为3或4,由于当前帧处于语音区间的可能性高,因而设为Cng=0.3,在输入信号的振幅谱S[f]设置权重。
Ag[f]=(1-Cng)·S[f]+Cng·N[f] (22)频谱相减部8根据下式(23),从振幅谱S[f],减去对噪声谱N[f]相乘了被修正了的频谱相减量αc[f]的频谱,输出噪声消除频谱Ss[f]。在噪声消除频谱Ss[f]为负的场合下,进行使振幅抑制量min_gain与通过上式(22)得到的平均频谱Ag[f]相乘,并把与越趋于高频带权重越大的第3听觉权重γc[f]相乘了的乘积作为噪声消除频谱Ss[f]的回填处理。
Ss[f]=S[f]-αc[f]·N[f];S[f]>αc[f]·N[f]=γc[f]·min_gain·Ag[f];上述以外 (23)如上所述,根据该实施方式8,通过对回填处理用的输入信号的振幅谱S[f]和噪声谱N[f]的平均频谱Ag[f]进行随着趋于高频带而增大权重的听觉加权,由于可随着趋于高频带而增大回填频谱成分的振幅,即增大回填量,因而,得到可抑制被认为是音乐噪声发生原因之一的在频率轴上孤立的尖锐频谱的生成的效果。
此外根据该实施方式8,即使在难以作为语音区间判定,许多被误判定为噪声区间的子音等过渡部区间,由于可以在高频带的残留噪声谱中附加输入信号的振幅谱S[f]及噪声谱N[f],因而残留噪声的自然性提高,得到可进一步进行听感上令人满意的噪声抑制的效果。
此外根据本实施方式8,由于基于噪声相似度信号Noise,求出输入信号的振幅谱S[f]和噪声谱N[f]的平均频谱Ag[f],因而与把加权系数Cng设为固定值的场合相比,可得到更适应了当前帧的有音·噪声的形态的平均频谱Ag[f],得到可进一步进行听感上令人满意的噪声抑制的效果。
实施方式9图16是表示基于本发明实施方式9的噪声抑制装置构成的方框图。这里,听觉权重模式变更部22向听觉权重调整部21和听觉权重修正部7输出振幅谱S[f]的低频带功率与高频带功率之比Pv,听觉权重修正部7根据振幅谱S[f]的低频带功率与高频带功率之比Pv,变更第3听觉权重γc[f],输出被修正了的频谱相减量αc[f]、被修正了的频谱振幅抑制量βc[f]、被变更了的第3听觉权重γc[f]。在该实施方式中,比如在语音区间,把从当前帧输入信号得到的振幅谱S[f]分割为低频带和高频带,分别求出低频带功率Pow_1和高频带功率Pow_h,根据该低频带功率与高频带功率之比Pv,变更第3听觉权重γc[f]。
接下来对动作作以说明。
听觉权重修正部7利用听觉权重模式变更部22输出的振幅谱S[f]的高频带/低频带功率之比Pv,通过下式(24)变更第3听觉权重γc[f]。此外式(24)中的fc是尼奎斯特频率。
γc[f]=γc[f]·(1.0·(fc-f)+v_inv·f)/fc但,Pv_inv=1.0/Pvγc[f]=1.0;γc[f]>1.0 (24)如上所述,根据本实施方式9,在语音区间,输入信号的振幅谱S[f]中含有较多的语音信号成分,通过根据该振幅谱S[f]的低频带功率与高频带功率之比Pv,变更第3听觉权重γc[f],对回填频谱成分按照近似于语音信号的频率特性的原则进行听觉加权,使被回填了的频带的信号成分更类似于语音信号,进行适应了语音区间的频率特性的频谱相减及频谱振幅抑制,由此在可抑制音乐噪声的发生的同时,得到可进一步进行听感上令人满意的噪声抑制的效果。
实施方式10图17是表示基于本发明实施方式10的噪声抑制装置构成的方框图。这里,听觉权重模式变更部22向听觉权重调整部21和听觉权重修正部7输出噪声谱N[f]的低频带功率与高频带功率之比Pv,听觉权重修正部7根据噪声谱N[f]的低频带功率与高频带功率之比Pv,变更第3听觉权重γc[f],输出被修正了的频谱相减量αc[f]、被修正了的频谱振幅抑制量βc[f]、被变更了的第3听觉权重γc[f]。在该实施方式中,比如在噪声区间,取代输入信号的振幅谱S[f],把噪声谱N[f]分割为低频带和高频带,求出低频带功率Pow_1和高频带功率Pow_h,通过该低频带功率Pow_1与高频带功率Pow_h之比Pv,变更第3听觉权重γc[f]。
如上所述,根据该实施方式10,通过在噪声区间,根据取代在时间·频率方向上不稳定的输入信号的振幅谱S[f],保持平均的噪声谱形状的在时间·频率方向上稳定的噪声谱N[f]的低频带功率与高频带功率之比Pv,变更第3听觉权重γc[f],对回填频谱成分,按照近似于噪声谱N[f]的频率特性的原则进行听觉加权,使回填频谱在时间·频率方向上稳定化,进行适应了噪声区间的频率特性的频谱相减及频谱振幅抑制,由此在可抑制音乐噪声的发生的同时,得到可进一步进行听感上令人满意的噪声抑制的效果。
实施方式11图18是表示基于本发明实施方式11的噪声抑制装置构成的方框图。这里,听觉权重模式变更部22向听觉权重调整部21和听觉权重修正部7输出由振幅谱S[f]和噪声谱N[f]的加权平均得到的平均频谱Ag[f]的低频带功率与高频带功率之比Pv,听觉权重修正部7根据平均频谱Ag[f]的低频带功率与高频带功率之比Pv,变更第3听觉权重γc[f],输出被修正了的频谱相减量αc[f]、被修正了的频谱振幅抑制量βc[f]、被变更了的第3听觉权重γc[f]。在该实施方式中,比如在子音等语音过渡部区间,取代输入信号的振幅谱S[f],把通过由上述实施方式8求出的振幅谱S[f]和噪声谱N[f]的加权平均获得的平均频谱Ag[f]分割为低频带和高频带,利用该低频带功率Pow_1和高频带功率Pow_h,通过该低频带功率与高频带功率之比Pv变更第3听觉权重。
如上所述,根据本实施方式11,通过利用输入信号的振幅谱S[f]和噪声谱N[f]的平均频谱Ag[f]的低频带功率与高频带功率之比Pv变更第3听觉权重γ[f],在难以作为语音区间判定的,许多被作为噪声区间误判定的子音等语音过渡部区间,对回填频谱,按照近似于输入信号的振幅谱S[f]和噪声谱N[f]的频率特性的原则进行听觉加权,使回填频谱在时间·频率方向上稳定化,并与语音信号的频率特性相类似,进行适应了过渡部区间的频率特性的频谱相减及频谱振幅抑制,由此在可抑制音乐噪声的发生的同时,得到可进一步进行听感上令人满意的噪声抑制的效果。
此外根据本实施方式11,由于基于噪声相似度信号Noise,求出输入信号的振幅谱和噪声谱的平均频谱Ag[f],因而与把加权系数Cng设为固定值的场合相比,可得到更适应了当前帧的有音·噪声的形态的平均频谱,得到可进一步进行听感上令人满意的噪声抑制的效果。
产业上的可利用性如上所述,本发明涉及的噪声抑制装置适于在各种噪声环境下应用的语音通信系统及语音识别系统等中抑制目的信号以外的噪声。
权利要求
1.一种噪声抑制装置,其特征在于具备了时间·频率转换部,其对输入信号进行频率分析,转换为振幅谱和相位谱;噪声相似度分析部,其在从上述输入信号判定噪声相似度,输出噪声相似度信号的同时,输出与该噪声相似度信号对应的噪声谱更新速度系数;噪声谱估算部,其从上述噪声谱更新系数、上述振幅谱、在内部保存的过去的平均噪声谱来更新噪声谱并输出;频带SN比计算部,其从上述振幅谱及上述噪声谱计算作为每个频带的信噪比的频带SN比;振幅抑制量计算部,其从上述噪声相似度信号及上述噪声谱计算作为当前帧的噪声抑制水平的振幅抑制量;听觉权重模式调整部,其从上述振幅抑制量及上述噪声相似度信号决定作为第1听觉权重的频谱相减量与作为第2听觉权重的频谱振幅抑制量的频率特性分配模式即听觉权重分配模式;听觉权重修正部,其依据上述频带SN比对由上述听觉权重分配模式提供的作为第1听觉权重的频谱相减量与作为第2听觉权重的频谱振幅抑制量进行修正,输出被修正了的频谱相减量和被修正了的频谱振幅抑制量;频谱相减部,其从上述振幅谱减去对上述噪声谱相乘了上述被修正了的频谱相减量的频谱,求出噪声消除频谱;频谱抑制部,其对上述噪声消除频谱乘以上述被修正了的频谱振幅抑制量,求出噪声抑制频谱;频率·时间转换部,其依据上述相位谱把上述噪声抑制频谱转换为时间信号,输出噪声抑制信号。
2.权利要求1中记载的噪声抑制装置,其特征在于听觉权重修正部在频带SN比大的低频带,在增大作为第1听觉权重的频谱相减量的同时,减小作为第2听觉权重的频谱振幅抑制量,在上述频带SN比小的高频带,在减小作为上述第1听觉权重的频谱相减量的同时,增大作为上述第2听觉权重的频谱振幅抑制量。
3.权利要求1中记载的噪声抑制装置,其特征在于听觉权重模式调整部具备听觉权重基本分配模式,其由成为用于决定听觉权重分配模式的基本的、与噪声相似度信号对应的多个频率特性模式组成,从该听觉权重基本分配模式中选择与由噪声相似度分析部输出的噪声相似度信号对应的频率特性模式,决定听觉权重分配模式。
4.权利要求3中记载的噪声抑制装置,其特征在于听觉权重模式调整部具备了听觉权重基本分配模式,其由根据使用环境被任意变更的多个频率特性模式组成。
5.权利要求1中记载的噪声抑制装置,其特征在于具备听觉权重模式变更部,其求出振幅谱的高频带功率对低频带功率之比,听觉权重模式调整部根据上述振幅谱的高频带功率对低频带功率之比决定听觉权重分配模式。
6.权利要求1中记载的噪声抑制装置,其特征在于具备听觉权重模式变更部,其求出噪声谱的高频带功率对低频带功率之比,听觉权重模式调整部根据上述噪声谱的高频带功率对低频带功率之比决定听觉权重分配模式。
7.权利要求1中记载的噪声抑制装置,其特征在于具备听觉权重模式变更部,其求出根据振幅谱及噪声谱的加权平均获得的平均频谱的高频带功率对低频带功率之比,听觉权重模式调整部根据上述平均频谱的高频带功率对低频带功率之比决定听觉权重分配模式。
8.权利要求1中记载的噪声抑制装置,其特征在于频谱相减部在相减结果为负值的场合下,根据振幅谱、振幅抑制量以及越趋于高频带权重越大的听觉权重修正部输出的第3听觉权重,求出噪声消除频谱。
9.权利要求1中记载的噪声抑制装置,其特征在于频谱相减部在相减结果为负值的场合下,根据噪声谱、振幅抑制量以及越趋于高频带权重越大的听觉权重修正部输出的第3听觉权重,求出噪声消除频谱。
10.权利要求7中记载的噪声抑制装置,其特征在于频谱相减部在相减结果为负值的场合下,根据由听觉权重模式变更部所求出的平均频谱、振幅抑制量以及越趋于高频带权重越大的听觉权重修正部输出的第3听觉权重,求出噪声消除频谱。
11.权利要求5中记载的噪声抑制装置,其特征在于听觉权重修正部根据由听觉权重模式变更部所求出的振幅谱的高频带功率对低频带功率之比,变更越趋于高频带权重越大的第3听觉权重。
12.权利要求6中记载的噪声抑制装置,其特征在于听觉权重修正部根据由听觉权重模式变更部所求出的噪声谱的高频带功率对低频带功率之比,变更越趋于高频带权重越大的第3听觉权重。
13.权利要求7中记载的噪声抑制装置,其特征在于听觉权重修正部根据由听觉权重模式变更部所求出的振幅谱及噪声谱的加权平均获得的平均频谱的高频带功率对低频带功率之比,变更越趋于高频带权重越大的第3听觉权重。
14.权利要求7中记载的噪声抑制装置,其特征在于听觉权重模式变更部基于噪声相似度信号求出平均频谱。
全文摘要
振幅抑制量计算部(20)计算作为当前帧的噪声抑制水平的振幅抑制量,听觉权重模式调整部(21)决定频谱相减量及频谱振幅抑制量的听觉权重分配模式,听觉权重修正部(7)根据频带SN比修正由听觉权重分配模式提供的频谱相减量和频谱振幅抑制量,频谱相减部(8)根据振幅谱、噪声谱及被修正了的频谱相减量求出噪声消除频谱,频谱抑制部(9)根据噪声消除频谱和被修正了的频谱振幅抑制量求出噪声抑制频谱。
文档编号G10L21/02GK1463422SQ02802017
公开日2003年12月24日 申请日期2002年5月24日 优先权日2001年6月6日
发明者古田训 申请人:三菱电机株式会社