用于抑制语音信号噪声的方法和装置的制作方法

文档序号：2819409阅读：438来源：国知局

专利名称：用于抑制语音信号噪声的方法和装置的制作方法
技术领域：
本发明涉及用于尤其是受干扰语音信号的语音处理的一种方法和一种装置。
近年来移动通信领域中的迅速的技术发展已导至对语音处理，尤其对语音编码和抑制干扰噪声的持续增高的要求，这尤其归因于带宽的越来越短缺和对语音质量的持续增长的要求。
所述语音处理的主要组成部分在于，估算和必要时在输入信号中抑制干扰信号或干扰噪声，以便尽可能仅仅传输语音信号，例如由拾音器所拾取的语音信号通常伴有该干扰信号或干扰噪声。不过在用于抑制干扰噪声的通常的方法中，常常在背景信号中产生不受欢迎的人工因素(Artefakt)，也称为音乐声。
本发明的任务是说明一种用于语音处理的技术原理，该原理使以低的数据速率和高的质量来传输语音成为可能。
通过独立权利要求的所述特征来解决该任务。由从属权利要求中产生有利的和合理的改进方案。
因此本发明首先基于以下思路，在通过低速率的语音编解码器编码之前，将伴有干扰信号的语音信号的频率分量与时间上变化的与频率有关的加权系数相乘，其中，将一个频率分量与一个当前的加权系数相乘，如果该当前加权系数小于所述最后针对该频率分量所计算出的加权系数，并且其中，将一个频率分量与所述最后针对该频率分量所计算出的加权系数相乘，如果该加权系数小于所述当前的加权系数。人们在此将低速率的语音编解码器尤其理解为一种提供数据速率小于每秒5kBit的语音编解码器。
因此达到了如此来衰减加在语音信号上的干扰信号，使得在微小的计算工作量或存储工作量的情况下可以用良好的质量来传输语音。
本发明在此首先基于以下的认识，只有当尽可能避免或减少了-上面已阐述的-人工因素时，才可能在采用低速率的语音编解码器时达到良好的语音质量。这曾可以通过采用费事的本来为该目的所制定的模拟工具来识别。
此外本发明还基于以下的认识，-正如也是费事的模拟所表明的那样-通过专门采用当前或最后计算的加权系数来减少背景信号中的，尤其是在语音间歇期间的人工因素。
最后也通过范围广泛的模拟已证实本发明的这种有利的作用，即用于抑制干扰噪声的特殊方法与低速率的语音编解码器相组合，该语音编解码器尤其提供在每秒3kBit和每秒5kBit之间的数据速率。
在其它或从属权利要求中，所阐述的改进方案、扩展方案和实施变型既包含在与所述方法的组合中，也包含在与本发明装置的组合中。
以下借助优选的实施例来详述本发明，其中，包含在其中的特征也可以包含在基于本发明的其它的组合中。下列的附图应该用来阐述这些实施例

图1为用于语音处理方法的简化的方框电路图；图2为用于抑制干扰噪声方法的流程图；图3为用于语音处理装置的简化的方框电路图。
图1展示了用于语音处理方法的方框电路图。该方法可以粗略地划分为共同起作用的方框抑制干扰噪声和连接在其后的低速率语音编解码器NSC。作为这种语音编解码器的一种例如提供每秒4kBit数据速率的低速率语音编解码器是公知的，因此在此不进一步叙述。
所述用于抑制干扰噪声的方法可以细分为多个以下要阐述的功能块。
方框分析AN和方框合成SY形成了所述用于抑制干扰噪声的方法的框架。输入信号在分析AN之前所进行的(图中未示出的)分段，以及所采用的块大小是如此来与所述的低速率语音编解码器协调的，使得信号由于抑制干扰噪声所引起的算法滞后保持尽可能小。输入信号x(k)的分段，在8kHz的扫描速率时例如在20ms时的块中进行。用规定的块长度也可以逐段地来实现将所处理的数据转交给语音编解码器。
所述的分析AN在此可以包括窗口(Fensterung)、零填充(Zero-Padding)、和通过傅里叶变换来变换成频率范围，而所述的合成SY可以包括通过反傅里叶变换来反变换成时间范围，以及按重叠相加(Overlap Add)法的信号重组。
来自分析AN的频率分量具有一个实数部分和一个虚数部分，或具有一个幅度和一个相位。为了减小工作量，例如借助Bark表(Barktabelle)首先将相邻的不同频率分量的幅度汇总成频率组FGZU1。
针对每个频率组借助先验和后验的信噪比来执行增益计算VB，该增益计算所得出的结果为各个频率组的幅度的加权系数。从受干扰输入信号的功率密度谱和先验噪声估算GS中可以导出所述的先验信噪比。从受干扰输入信号的功率密度谱和缓冲存储器(Pufferung)P的输出信号中可以计算出所述的后验信噪比，又通过频率组汇总FGZU2给该缓冲存储器输送汇总的已修正的频率分量。
在分解FGZE事先汇总成频率组的频率分量之前，并在所述的频率组与各自的用于抑制干扰噪声的针对相应频率组所计算的加权系数相乘之前，所述的加权系数经受所谓的最小滤波(Minimum-Filterung)MF，稍后将借助附图2详述该最小滤波。
因此为了估算干扰噪声，主要进行对来自所述输入信号的背景噪声的功率密度的估算。为了降低所需要的计算功能以及存储器占用，仅在少数的部分频带(Teilband)中执行先验噪声估算、增益计算、暂存为了干扰信号抑制而修改的信号幅度、和最小滤波器(Minium-Filter)。为此，使用用于频率组汇总的两个方框，将被变换成频率范围的输入信号的幅度和为了干扰信号抑制而修改的信号的幅度汇总成部分频带。所述部分频带的宽度在此以Bark刻度为依据，并因此随频率而变化。通过所述的方框频率组分解，将最小滤波器的每个频率组的输出信号分布到相应的频率分量或傅里叶系数上。为了计算出缓冲存储器方框的输入信号，在另一个实施变型中，也可以替代为了抑制干扰信号而修改的信号的频率组汇总，而将输入信号的汇总成频率组的幅度逐单元地与最小滤波器的输出信号相乘。
在干扰噪声估算之外还进行语音信号分量的后验估算。为此在方框缓冲存储器中，存储了为了降低噪声而修改的幅度值的汇总成频率组的信号。除了汇总成频率组的输入信号的幅度值之外，先验噪声估算的输出信号和缓冲存储器的输出信号用来计算增益计算。从所述的增益计算中得出加权系数，将这些加权系数输送给一个-下面将详述的-最小滤波器。所述的最小滤波器最终求出所述的加权系数，这些加权系数安排用于与频率组的频率分量相乘。
借助附图2中所示出的流程图，现在来详述一个用于语音信号的抑制干扰噪声的简化的实施变型。在此不采用附图1中所示出的方框频率组汇总FGZU1，FGZU2和方框频率组分解。
通过扫描装置和连接在其后的模数转换器，将由拾音器所拾取的受干扰的语音信号转换成伴有干扰n(k)的输入的数字式语音信号s(k)。将该输入信号在时间上分段(segmentieren)成块(块，m)(101)，并将所述的块(块，m)按时间顺序通过变换成频率范围而分别映射到I频率分量f(i，m)上(102)，其中，m代表时间，而i代表频率。这例如可以通过傅里叶变换来实现。如果用X(i，m)来表示输入信号的傅里叶系数，则值|X(i，m)|^2可以称为频率分量。
在上述的分段101和变换成频率范围102之后，将语音信号的频率分量f(i，m)与加权系数H(i，m)相乘，其中，该加权系数例如可以从上面已经阐述的所估算的先验和后验信噪比中导出。从受干扰输入信号的功率密度谱和先验噪声估算中可以导出所述的先验信噪比。从受干扰输入信号的功率密度谱和缓冲存储器的输出信号中可以计算出所述的后验信噪比。
与频率或与频率分量有关的加权系数在此是随时间变化的，并按照随时间变化的频率分量来不断更新地求出。为了避免背景信号中的不受欢迎的人工因素，不过为了实现最小滤波器，不总是将所述当前针对该频率分量计算出的加权系数H(i，m)用于与一个频率分量f(i，m)的相乘，而是如果所述最后，即在上一个步骤中，针对该频率分量所计算出的加权系数H(i，m-1)小于所述当前的加权系数，才采用所述最后，即在上一个步骤中，针对该频率分量所计算出的加权系数H(i，m-1)。
本发明的一个实施变型规定，将一个频率分量与当前的加权系数相乘，如果与频率有关的加权系数位于一个阈值之上，甚至于如果最后针对该频率分量所计算出的加权系数小于当前的加权系数。
这可以通过一个滤波器来实现，该滤波器将当前的加权系数分别与在同样频率时的时间上位于前面的加权系数相比较，并选出两个值中的较小者用于所述的频率分量。如果由当前加权系数超过固定的阈值0.76，则不进行频率分量修改。
附图4展示了一个譬如微控制器那样的程控处理器装置PE，该处理器装置也可以包括一个处理器CPU和一个存储器装置SPE。
按实施变型不同，在此在处理器装置PE之内或之外，可以布置其它的-分配给处理器装置的、属于处理器装置的、由处理器装置控制的或控制处理器装置的-组件，这些组件的功能与处理器装置相结合对于专业人员是足够已知的，并因此在此对这些组件不再详述。所述不同的组件可以通过总线系统BUS、或输入/输出接口IOS、和必要时(未示出的)合适的控制器来与所述处理器装置PE交换数据。所述处理器装置PE在此可以是譬如通信终端设备或移动电话那样的电子设备的组成部分，并也可以控制其它的专门用于所述电子设备的方法和应用程序(Anwendungen)。
按实施变型不同，也可以将可能涉及一个或多个易失或非易失RAM或ROM存储器模块的存储器装置SPE，或存储器装置SPE的部分来实现为(附图中示出的)处理器装置的部分，或可以实现为(附图中未示出的)外部的存储器装置，该存储器装置定位在处理器装置PE之外，或甚至定位在含有所述处理器装置PE的设备之外，并通过导线或总线系统与所述的处理器装置PE相连接。
在存储器装置SPE中存放了程序数据，将这些程序数据用于控制设备，以及控制用于语音处理的和用于干扰信号抑制的方法。通过程控的处理器或本来为该目的而安排的微电路来实现上述的功能组件，这属于专业人员的工作范围。
通过输入/输出接口IOS可将伴有干扰的数字式语音信号输送给所述的处理器装置PE。除处理器CPU外还可以安排一个数字式信号处理器DSP，以便完全或部分地实施上述方法的步骤。
权利要求
1.用于语音处理的方法，-其中，将一个输入的数字式语音信号s(k)按时间分段成块(块，m)(101)，-其中，将所述的块(块，m)按时间顺序通过变换成所述的频率范围来分别映射到频率分量(f，i)上(102)，-将所述的频率分量与随时间变化的与频率有关的加权系数相乘，-其中，将一个频率分量与所述当前的加权系数相乘，如果该加权系数小于所述最后针对该频率分量所计算出的加权系数，-其中，将一个频率分量与所述最后针对该频率分量所计算出的加权系数相乘，如果该加权系数小于所述当前的加权系数，和-其中，在反变换成所述的时间范围之后将所述如此加权的频率分量输送给低速率的语音编解码器。
2.按权利要求1的方法，其中将一个频率分量与所述当前的加权系数相乘，如果所述与频率有关的加权系数位于一个阈值之上，甚至于如果所述最后针对该频率分量所计算出的加权系数小于所述当前的加权系数。
3.用于抑制干扰噪声的装置-具有数字式语音信号用的一个输入端(IOS)，和-具有一个如此设置的处理器装置(PE)，使得-将一个输入的数字式语音信号s(k)按时间分段成块(块，m)(101)，-将所述的块(块，m)按时间顺序通过变换成所述的频率范围来分别映射到频率分量(f，i)上(102)，-将所述的频率分量与随时间变化的与频率有关的加权系数相乘，-其中，将一个频率分量与所述当前的加权系数相乘，如果该加权系数小于所述最后针对该频率分量所计算出的加权系数，和-其中，将一个频率分量与所述最后针对该频率分量所计算出的加权系数相乘，如果该加权系数小于所述当前的加权系数，以及使得-在反变换成所述的时间范围之后，所述如此加权的频率分量经受低速率的语音编码。
4.按权利要求3的装置，其中-将一个频率分量与所述当前的加权系数相乘，如果所述的与频率有关的加权系数位于一个阈值之上，甚至于如果所述最后针对该频率分量所计算出的加权系数小于所述当前的加权系数。
全文摘要
在低速率语音编码之前，将输入的数字式语音信号s(k)按时间分段成块(块，m)(101)，将所述的块(块，m)按时间顺序通过变换成所述的频率范围来分别映射到频率分量f(i，m)上(102)，并将所述的频率分量与随时间变化的与频率有关的加权系数相乘，其中，如果该加权系数小于所述当前的加权系数，则将一个频率分量与所述最后针对该频率分量所计算出的加权系数相乘。
文档编号G10L21/0208GK1568503SQ02820101
公开日2005年1月19日申请日期2002年10月2日优先权日2001年10月12日
发明者M·伊勒, F·瓦尔特申请人:西门子公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：M.伊勒;F.瓦尔特
技术所有人：西门子公司
我是此专利的发明人