噪声抑制装置的制作方法

文档序号：2823291阅读：139来源：国知局

专利名称：噪声抑制装置的制作方法
技术领域：
本发明涉及噪声抑制装置，在各种噪声环境下使用的语音通信系统、语音存储系统、语音识别系统等中，抑制语音·声音信号等目的信号以外的噪声，进行车载导航系统·移动电话·内部电话等语音通信系统·免提通话系统· TV会议系统·监视系统等的音质改善、语音识别系统的识别率的提高等。
背景技术：
作为通过从混入了噪声的输入信号中抑制作为目的外信号即噪声，来强调作为目的信号的语音信号等的噪声抑制处理的代表性手法，例如有谱减(Spectral Subtraction SS)法，这是通过从振幅频谱中减去另行推定的平均噪声频谱来进行噪声抑制的方法(例如，参照非专利文献1)。作为将输入信号转换为频域信号后分割为规定的小频带，按照不同频带进行噪声抑制的以往方法例如有专利文献1所记载的方法。另外，作为切换采样频率不同的方式(切换窄带噪声抑制方式与宽带噪声抑制方式)的以往方法例如有专利文献2所记载的方法。专利文献1所记载的方法的目的在于通过以非专利文献1所公开的方法为基础，将输入信号分割为低频分量与高频分量，在各自的频带中进行适当的噪声抑制，从而以较少的处理量得到能够使语音失真减少、且扩大噪声抑制量的噪声抑制装置。另外，专利文献2所记载的方法的目的在于通过包括与多个采样转换率相应的噪声抑制处理和切换单元，切换对于语音解码处理适合的采样频率与噪声抑制装置，从而改善解码语音的品质。专利文献1 日本特开2006-201622号公报(第4页 9页、图1)专利文献2 日本特开2000-206995号公报(第6页 16页、图4)非专利文献 1 :Steven F. Boll, "Suppression of Acoustic noise in speech using spectral subtraction", IEEE Trans. ASSP, Vol. ASSP-27, No. 2,April 1979.但是，上述的以往方法中存在以下所述的课题。例如，在专利文献1所公开的以往的噪声抑制装置中存在以下课题由于形成了低频用、高频用的独立的结构，在低频用、高频用中，需要各自的语音·噪声区间判定单元，因此虽然比全频带处理少，但是处理量和存储量仍然较大。另外，存在以下课题需要在低频·高频中分别独立地调整用于在噪声抑制装置中作为重要的结构的语音·噪声区间判定、噪声谱推定的控制参数，控制、调整复杂。另外，在专利文献2所公开的接收装置所涉及的以往的噪声抑制装置中存在以下课题具有按照不同的多个采样频率独立的噪声抑制处理，与专利文献1的情况同样地，需要分别独立地调整控制参数，以及需要按照各自的噪声抑制处理保持程序存储器等，导致存储量变大。本发明是为了解决上述问题而作出的，其目的在于提供一种能够以较小的处理量和存储量抑制噪声、且品质劣化较少的噪声抑制装置，并且其目的在于提供一种易于控制
3和调整的噪声抑制装置。

发明内容
本发明所涉及的噪声抑制装置将输入信号分割为多个频带，按照分割后的多个频带之中的规定的频带分量的分析结果，进行规定的频带分量的噪声抑制、以及规定的频带以外的频带分量的噪声抑制。据此，能够提供能够削减处理量和存储量、并且易于控制和调整的噪声抑制装置。

图1是本发明所涉及的噪声抑制装置的实施方式1的整体结构图。图2是本发明的实施方式1所述的噪声谱推定部的内部结构图。图3是表示本发明的实施方式1所述的噪声频谱的子带化的一例的说明图。图4是本发明所涉及的噪声抑制装置的实施方式2的整体结构图。图5是本发明所涉及的噪声抑制装置的实施方式4的整体结构图。
具体实施例方式下面，为了更详细地说明本发明，根据附图对实施本发明的优选方式进行说明。实施方式1.图1表示本实施方式的噪声抑制装置的整体结构。在图1中，噪声抑制装置200包括时间·频率转换部1、语音·噪声区间判定部 2、噪声谱推定部3、低频抑制量控制部4、高频抑制量控制部5、低频噪声抑制部6、高频噪声抑制部7、频带合成部8、第一频率·时间转换部9、第二频率·时间转换部10。另外，由语音·噪声区间判定部2、低频抑制量控制部4和低频噪声抑制部6构成低频处理部201，由高频抑制量控制部5和高频噪声抑制部7构成高频处理部202，并且噪声谱推定部3被设为这些低频处理部201和高频处理部202的共同结构要素。作为与以往的噪声抑制装置的结构的不同点在于仅在低频处理部201内具有语音·噪声区间判定部2 ；以及噪声谱推定部3作为低频处理部201和高频处理部202的共
享结构要素。下面，对图1所示的噪声抑制装置的动作原理进行说明。首先，作为目的信号的语音·乐音等中混入了噪声的输入信号100经A/D (模拟/ 数字)转换之后，以规定的采样频率(例如，16kHz)被进行采样，以规定的帧周期(例如， 20msec)被进行帧分割，并输入到噪声抑制装置200内的时间·频率转换部1。时间·频率转换部1对上述的以帧周期分割的输入信号100进行加窗处理(根据需要也会实施填零处理)，对该加窗后的信号使用例如512点的FFTO^ast Fourier Transform:快速傅里叶变换)，将时间轴上的信号转换为频率轴上的信号(频谱)。从时间频率转换部1得到的第η帧的输入信号100的振幅谱S(n，k)与相位谱P(n，k)可以由下式(1)表示。\s(n,k) = jRQ{X(n,k)}2 +lm{X(n,k)}2 [_ Ua)=kV”.。0<512/2式⑴
5这里，k为频谱编号，Re{X(n，k)}和^i{X(n，k)}分别为FFT后的输入信号的频谱实数部和虚数部。以下只要没有特别示出的必要，在表示当前帧的信号时就省略帧编号。关于以上得到的振幅谱S (k)，例如频带分割为0 4kHz与4kHz 8kHz这两个频带，分别输出0 4kHz的低频分量作为低频振幅谱102、输出4 SkHz的高频分量作为高频振幅谱103，并且输出相位谱101。得到的低频振幅谱102分别输出到低频处理部201内部的语音噪声区间判定部 2、噪声谱推定部3、低频抑制量控制部4、低频噪声抑制部6。另外，高频振幅谱103分别输出到高频处理部202内部的噪声谱推定部3、高频抑制量控制部5、高频噪声抑制部7。在本实施方式中的加窗处理中，例如可以使用汉宁窗、梯形窗等公知的手法。另外，由于FFT为周知的手法，因此省略说明。首先，对低频处理部201内部的结构要素的动作进行说明。此外，将在后面描述语音噪声区间判定部2、以及作为低频处理部201和高频处理部202的共享结构要素的噪声谱推定部3的动作，其中，上述语音噪声区间判定部2进行输入信号100的形态“是否相似语音”的判定。首先，低频抑制量控制部4由低频振幅谱102、以及噪声谱推定部3输出的低频噪声谱105，根据下式( 计算每个频谱分量的信号对噪声比SMY (k)。这里，SJk)为低频振幅谱102的第k个频谱，队(k)为低频噪声谱105的第k个频谱，k为频谱编号，&为频谱编号数，例如FFT点数为512点、且频带分割点为4kHz，则& = 128。使用得到的每个频谱分量的信号对噪声比SMY(k)，计算低频噪声抑制量107。作为具体的计算方法，例如可以使用非专利文献1所公开的频谱减法、或J. S. Lim and A V. Oppenheim,"Enhancement and Bandwidth Compression of Noisy Speech," Proc. of the IEEE, vol.67, pp. 1586-1604, Dec. 1979(以下称为非专利文献2)所公开的所谓Wiener Filter (维纳滤波)法等公知的手法。
\20\o^w{SL{k)lNL{k)\ SL{k)>NL{k)=Sl(U)^Nl(U) .0<k<KL 式⑵
，低频噪声抑制部6对从时间频率转换部1输入的低频振幅谱102使用低频噪声抑制量107进行噪声抑制处理，将得到的结果作为噪声被抑制的低频振幅谱109输出到第一频率·时间转换部9，并且输出到频带合成部8。这里，作为低频噪声抑制部6中的噪声抑制处理的手法，除了例如非专利文献1所公开的基于频谱减法的手法、或者非专利文献2所公开的根据每个频谱分量的信号对噪声比针对每个频谱分量给予衰减量的频谱振幅抑制等公知的方法以外，还可以使用组合了频谱减法与频谱振幅抑制的手法(例如，日本专利第34M190号公报中记载的方法)等。第一频率·时间转换部9使用从低频噪声抑制部6输入的噪声被抑制的低频振幅谱109和相位谱101，进行与由时间·频率转换部1实施的FFT点数(512点)对应的逆 FFT处理而返回到时域信号，进行用于与前后帧的平滑连接的加窗处理的同时进行连接，并将得到的信号作为噪声被抑制的低频输出信号113进行输出。此外，在上述逆FFT处理中，关于4kHz SkHz的高频频谱分量进行填零。
频带控制信号111是分别对后述的频带编码部12和宽带编码部13的切换控制、后述的采样转换部11和频带合成部8的动作进行控制的信号，例如是按照无线有线通信线路的状况自动切换编码方法、传输频带的控制信号、用于根据用户的请求(编码品质或语音数据的压缩率的变更等)手动切换编码方法、频带的控制信号。在本实施方式中，由于切换窄带编码部12中的窄带编码与宽带编码部13中的宽带编码这两种方式，因此在用窄带编码方法对噪声被抑制的输入信号进行编码时，即，使窄带编码部12动作时，具有表示“窄带模式”的值(例如0 [零])，在使宽带编码部13动作时，具有表示“宽带模式”的值 (例如1)。采样转换部11输入噪声被抑制的低频输出信号113和频带控制信号111，在用于切换连接于噪声抑制装置200的语音编码部的频带控制信号111的值为“窄带模式”时，从作为输入信号1的采样频率的16kHz例如向SkHz进行降采样，向窄带编码部12输出窄带输出信号114。窄带编码部12输入窄带输出信号114和频带控制信号111，在频带控制信号111 为“窄带模式”时，例如使用AMR(Adaptive Multi-Rate,自适应多速率)语音编码方式等公知的编码方法，进行窄带输出信号114的压缩·编码。被编码的窄带输出信号114例如通过无线·有线通信线路作为编码数据送出，或者蓄积在IC记录器等存储器之后，作为语音·声音信号数据读出并利用。接着，对高频处理部202内部的结构要素的动作进行说明。高频抑制量控制部5由高频振幅谱103、以及后述说明的噪声谱推定部3输出的
高频噪声谱106，根据下式C3)计算每个频谱分量的信号对噪声比SI^h(k)。这里，为
高频振幅谱103的第k个频谱， (k)为高频噪声谱106的第k个频谱，k为频谱编号，1^和
Kh为频谱编号数，例如在FFT点数为512点、且频带分割点为4kHz，则Kl = 128、以及Kh =
256。使用得到的每个频谱分量的信号对噪声比SNRH(k)，计算高频噪声抑制量108。作为
具体的计算方法，与低频处理部201的情况同样地，例如可以使用非专利文献1所公开的频
谱减法、非专利文献2所公开的Wiener Filter法等公知的手法。
权利要求
1.一种噪声抑制装置，其特征在于，将输入信号分割为多个频带，按照该分割后的多个频带之中的规定的频带分量的分析结果，进行所述规定的频带分量的噪声抑制、以及所述规定的频带以外的频带分量的噪声抑制。
2.根据权利要求1所述的噪声抑制装置，其特征在于，包括噪声分量推定单元，该噪声分量推定单元从输入信号中提取属于多个频带的各频带的推定噪声分量，所述推定噪声分量的内部分量的细分程度针对每个所述频带而不同。
3.根据权利要求2所述的噪声抑制装置，其特征在于，作为推定噪声分量的内部分量的细分程度，在低频部分中非均等地细分所述推定噪声分量，在高频部分中均等地细分所述推定噪声分量。
4.一种噪声抑制装置，其特征在于，包括分析单元，分析输入信号的全频带分量；多个噪声抑制单元，进行对所述输入信号进行频带分割而得到的多个频带分量的噪声抑制；以及切换单元，切换全频带分量或者一部分频带分量的噪声抑制单元，其中，按照所述分析单元的分析结果，进行全频带分量或者一部分频带分量的噪声抑制处理。
全文摘要
通过语音·噪声区间判定部(2)根据低频振幅谱(102)判定输入信号(100)是否相似语音。噪声谱推定部(3)根据语音·噪声区间判定部(2)的输出推定低频噪声谱和高频噪声谱。低频处理部(201)和高频处理部(202)根据从噪声谱推定部(3)输出的噪声谱进行噪声抑制。
文档编号G10L11/00GK102356427SQ20098015807
公开日2012年2月15日申请日期2009年4月2日优先权日2009年4月2日
发明者古田训, 田崎裕久申请人:三菱电机株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：古田训
技术所有人：三菱电机株式会社
我是此专利的发明人