专利名称:舒适噪声生成器、方法及回声抵消装置的制作方法
技术领域:
本发明涉及语音通信技术领域,尤其涉及一种舒适噪声生成器、方法及回声抵消
直O
背景技术:
在现代语音通信系统(如VOIP、手机、视频会议系统等)中,经常存在回声现象,目 前是通过在语音通信系统中设置AEC (Acoustic Echo Cancellation,声学回声抵消器)模 块来解决回声及提高双讲能力。目前如
图1所示的通信系统中应用的AEC模块如图2所示,包括=Adaptive Filter (自适应滤波器)、NLP(Non-Linear Process,非线性处理)与 CNG(Comfort NoiseGenerator,舒适噪声生成器)等子模块,其中,Adaptive Filter消除的是线性回声, NLP消除的是非线性回声及残留的线性回声。CNG的功能是补偿被抑制掉的背景噪声,使语 音中的背景噪声连续一致,避免背景噪声“断断续续”的现象。在图2中,y (η)表示回声,ν (η)表示near-end(语音通话中的远端)语音,ζ (η) 则表示near-end (语音通话中的近端)的背景噪声,near-end的语音信号由这三个分量组 成。经过NLP模块处理后,回声分量y (η)被抑制,同时背景噪声分量ζ (η)也被抑制,ζ (η) 被抑制后,导致near-end语音中的背景噪声出现“断断续续”的现象,严重影响语音质量, 因此,在NLP模块后需要CNG模块来补偿被抑制掉的背景噪声,使near-end语音中的背景 噪声连续一致,避免出现背景噪声“断断续续”的现象。现有技术提供的CNG实现方案是在时域生成一定能量水平的hoth噪声(根据室 内环境噪声描述模型建立的舒适噪声,命名的hoth为研究者D. F Hoth的名字),用hoth噪 声来填充被抑制的背景噪声。其原理如图3所示,首先使用白噪声生成器生成白噪声,白噪 声生成器可使用组合线性同余法生成白噪声,然后,将生成的白噪声通过hoth滤波器,生 成hoth噪声,Hoth滤波器是一个2阶UR滤波器,其系统传递函数如公式1所示
权利要求
1.一种舒适噪声生成器,其特征在于,包括背景噪声估计模块,用于判断输入信号的当前帧信号是否是背景噪声,若是,则在频域 对所述当前帧信号的频谱特征与能量水平进行估计,得到频谱特征估计值和能量水平估计 值;白噪声生成模块,用于在频域生成白噪声;白噪声整形模块,用于根据所述背景噪声估计模块得到的所述频谱特征估计值和能量 水平估计值,对所述白噪声生成模块生成的所述白噪声进行整形后得到舒适噪声,得到的 所述舒适噪声的频谱特征和能量水平均与是背景噪声的所述当前帧信号相匹配;舒适噪声填充模块,用于在确认需用舒适噪声填充时,用整形后得到的所述舒适噪声 对残留回声抑制后输出的频域信号的当前帧信号进行填充。
2.根据权利要求1所述的舒适噪声生成器,其特征在于,所述背景噪声估计模块包括 判断子模块,用于判断输入信号的当前帧信号是否是背景噪音;估计处理子模块,用于在所述判断子模块判断当前帧信号是背景噪音时,在频域对所 述当前帧信号的频谱特征与能量水平进行估计,得到频谱特征估计值和能量水平估计值。
3.根据权利要求2所述的舒适噪声生成器,其特征在于,所述判断子模块包括 能量计算子模块,用于计算得出输入信号的当前帧信号的能量值;最大值计算子模块,用于计算得出当前帧信号所处的滑窗的帧信号中的最大能量值; 所述滑窗包括所述当前帧信号,以及所述当前帧信号之前的N-I个帧信号;最小值计算子模块,用于计算得出当前帧信号所处的滑窗中的最小能量值;所述窗包 括当前帧信号,以及所述当前帧信号之前的N-I个帧信号;判断处理子模块,用于根据计算得出的所述当前帧信号的能量值、所述当前帧信号所 处的滑窗的帧信号中的最大能量值、、所述当前帧信号所处的滑窗的帧信号中的最小能量 值,确定输入信号的当前帧信号是否是背景噪声。
4.根据权利要求2所述的舒适噪声生成器,其特征在于,所述估计处理子模块包括 频谱特征估计值处理子模块,用于在判断子模块判断当前帧信号是背景噪音时,按下述公式 2 :noise—band (w) k = (1-alpha) Xnoise—band (w) k—JalphaXminP (w),1 < = w < = 64,计算得出所述当前帧信号的频谱特征估计值;所述公式2中,n0ise_band(w)k为所述当 前帧信号的频谱特征估计值,noise_band (W)k^1为过去一帧信号的频谱特征估计值,w表示 子带序号,k表示当前帧信号的序号,alpha为设定的平滑系数,minP(w)为当前帧信号所处 的滑窗中的最小能量值的帧信号的第w个子带的能量值;能量水平估计值处理子模块,用于在判断子模块判断当前帧信号是背景噪音时,按下 述公式 3 :noise_floork= (1-alpha) Xnoise—floorH+alphaXminE,计算得出所述当前帧 信号的能量水平估计值;所述公式3中,noise_floork为所述当前帧信号的能量水平估计 值,noise.floor^过去一帧信号的能量水平估计值,k表示当前帧信号的序号,alpha为设 定的平滑系数,minE为当前帧信号所处的滑窗的帧信号中的最小能量值。
5.根据权利要求1所述的舒适噪声生成器,其特征在于,所述白噪声生成模块在频域 生成白噪声包括采用线性同余法生成3个独立的均勻分布随机序列 w0 (η) = [aOXwO (n-l)+b0]M0D (MO);wl (n) = [alXwl(n-l)+bl]M0D (Ml); w2 (η) = [a2Xw2(n-l)+b2]M0D(M2);对上述生成的3个独立的均勻分布随机序列wO (n)、wl (η)、w2 (η)进行线性组合(η) =alphaOXwO(n)+alphalXwl(n)+alpha2Xw2(n),得到时域的白噪声序列 w(n) (1 <= η <=128);其中,MOD为取模操作,MO、Ml、M2为取模运算的分母,均为常量;aO、al、a2为取模 运算的分子中的步长因子,均为常量;b0、bl、b2为取模运算的分子的初始值,均为常量; alphaO、alphal、alpha2 为加权系数,均为常量,alphaO、alphal、alpha2 三者之和为 1. 0 ; 在上述生成时域的白噪声序列w(n) (1 <= η <= 128)后,按下述公式将时域的白噪 声序列w (η)赋值给频域的作为白噪声序列的复数信号wn (w),包括 w = η ;wn(w)的实部=w (η), 1 < = η < = 64 ; wn(w)的虚部=w(n) ,65 < = η < = 1沘。
6.根据权利要求1所述的舒适噪声生成器,其特征在于,所述白噪声整形模块通过公式4
7.—种舒适噪声生成方法,其特征在于,包括判断输入信号的当前帧信号是否是背景噪声,若是,则在频域对所述当前帧信号的频 谱特征与能量水平进行估计,得到频谱特征估计值和能量水平估计值; 在频域生成白噪声;根据得到的所述频谱特征估计值和能量水平估计值,对在频域生成的所述白噪声进行 整形后得到舒适噪声,所述舒适噪声的频谱特征和能量水平均与是背景噪声的所述当前帧 信号相匹配;在确认需用舒适噪声填充时,用整形后得到的所述舒适噪声对残留回声抑制后输出的 频域信号的当前帧信号进行填充。
8.根据权利要求7所述的舒适噪声生成方法,其特征在于,所述判断输入信号的当前 帧信号是否是背景噪音包括计算输入信号的当前帧信号的能量值、输入信号的当前帧信号所处的滑窗的帧信号中 的最大能量值、所述当前帧信号所处的滑窗的帧信号中的最小能量值;其中,所述滑窗包括 所述当前帧信号,以及所述当前帧信号之前的N-I个帧信号;根据计算得出的所述当前帧信号的能量值、所述当前帧信号所处的滑窗的帧信号中的 最大能量值、所述当前帧信号所处的滑窗的帧信号中的最小能量值和设定的常数门限值, 确定输入信号的当前帧信号是否是背景噪声。
9.根据权利要求8所述的舒适噪声生成方法,其特征在于,所述计算输入信号的当前帧信号的能量值包括以80个采样点作为一帧信号,按下述公式计算当前帧信号的能量E(k)iFk*80-lE(k)二〉e(n)2n=k*80-80其中,k为当前帧信号的序号,e(n)为当前帧信号的时域采样点信号,η为采样点序号。
10.根据权利要求9所述的舒适噪声生成方法,其特征在于,所述计算输入信号的当前 帧信号所处的滑窗的帧信号中的最大能量值包括按下述公式计算当前帧信号所处的包括当前帧信号以及所述当前帧信号之前的N-I 个帧信号的滑窗的帧信号中的最大能量值maxE maxE = max (Ε (i)),k < = i < = k- (N-I) 其中,k为当前帧信号序号,N为常数。
11.根据权利要求9所述的舒适噪声生成方法,其特征在于,所述输入信号的当前帧信 号所处的滑窗的帧信号中的最小能量值包括按下述公式计算当前帧信号所处的包括当前帧信号以及所述当前帧信号之前的N-I 个帧信号的滑窗的帧信号中的最小能量值minE minE = min (E ⑴),k < = i < = k- (N-I) 其中,k为当前帧信号的序号,N为常数。
12.根据权利要求9所述的舒适噪声生成方法,其特征在于,所述判断输入信号的当前 帧信号是否是背景噪音还包括按下述公式计算得出当前帧信号所处滑窗中的最小能量值的帧信号的每个子带信号 的能量minP(w)的步骤,公式为
13.根据权利要求9所述的舒适噪声生成方法,其特征在于,所述根据计算得出的所述 当前帧信号的能量值、所述当前帧信号所处的滑窗的帧信号中的最大能量值、所述当前帧 信号所处的滑窗的帧信号中的最小能量值和设定的常数门限值,确定输入信号的当前帧信 号是否是背景噪声包括通过下述判断式进行判断,若判断结果为是,则当前帧信号是背景噪声,若判断结果为 否,则当前帧信号不是背景噪声,判断式如下 ((maxE-minE) < Thl)&&(E(k) < Th2)上述判断式中,Thl与Th2为常数门限值,maxE为输入信号的当前帧信号所处的滑窗的 帧信号中的最大能量值,minE为输入信号的当前帧信号所处的滑窗的帧信号中的最小能量 值,E(k)为输入信号的当前帧信号的能量值。
14.根据权利要求7所述的舒适噪声生成方法,其特征在于,所述得到频谱特征估计值 和能量水平估计值包括频谱特征估计值按公式 2 :noise_band(w)k = (1-alpha) Xnoise_band(w) ^+alphaXminP(w), 1 <= w <= 64,计算得出;所述公式 2 中,noise_band(w)k 为当前帧信号的频谱特征估计值,noise_band (W)k^1为过去一帧信号的频谱特征估计值,w表示子带 序号,k表示当前帧信号的序号,alpha为设定的平滑系数,minP(w)为计算得出的当前帧信 号所处的滑窗中的最小能量值的帧信号的第w个子带的能量值;能量水平估计值按公式 3 :noise_floork= (1-alpha) Xnoise—floorH+alphaXminE, 计算得出;所述公式3中,n0iSe_fl0OTk为当前帧信号的能量水平估计值,noise.floor^ 过去一帧信号的能量水平估计值,k表示当前帧信号的序号,alpha为设定的平滑系数, minE为计算得出的输入信号的当前帧信号所处的滑窗的帧信号中的最小能量值。
15.根据权利要求7所述的舒适噪声生成器,其特征在于,所述在频域生成白噪声包括采用线性同余法生成3个独立的均勻分布随机序列 w0 (η) = [aOXwO (n-l)+b0]M0D (MO); wl (η) = [alXwl(n-l)+bl]M0D (Ml); w2 (η) = [a2Xw2(n-l)+b2]M0D(M2);对上述生成的3个独立的均勻分布随机序列wO (n)、wl (η)、w2 (η)进行线性组合(η) =alphaOXwO(n)+alphalXwl(n)+alpha2Xw2(n),得到时域的白噪声序列 w(n) (1 <= η <=128);其中,MOD为取模操作,MO、Ml、M2为取模运算的分母,均为常量;aO、al、a2为取模 运算的分子中的步长因子,,均为常量;b0、bl、b2为取模运算的分子的初始值,均为常量; alpha0、alphal、alpha2 为加权系数,均为常量,alphaO、alphal、alpha2 三者之和为 1. 0 ; 在上述生成时域的白噪声序列w (η) (1 <= η<= 128)后,按下述公式将时域的白噪 声序列w (η)赋值给频域的作为白噪声序列的复数信号To(W),包括 w = η ;wn(w)的实部=w (η), 1 < = η < = 64 ; wn(w)的虚部=w(n) ,65 < = η < = 1沘。
16.根据权利要求7所述的舒适噪声生成方法,其特征在于,所述根据得到的频谱特征 估计值和能量水平估计值,对在频域生成的所述白噪声进行整形舒适噪声,所述舒适噪声 的频谱特征和能量水平均与是背景噪声的所述当前帧信号相匹配包括按公式 4 cn(w) =//noise_floork X wn(w) x7noise_band(w)k 1 < = w < = 64,对所述白,噪声进行整形处理后,得到频谱特征和能量水平均与是背景噪声的所述当前帧信号相匹配 的舒适噪声;所述公式4中,w表示子带序号,Cn(W)为得到的当前帧信号的第w个子带的舒适噪 声,noise_floork为当前帧信号的能量水平估计值,wn(w)为在频域生成的白噪声,noise_ band(W)k为当前帧信号的频谱特征估计值。
17.一种回声抵消装置,其特征在于,包括自适应滤波器,用于对输入信号的时域信号进行线性回声抑制后输出; 频域转换处理模块,用于将所述自适应滤波器处理后输出的时域信号转换成频域信号 后输出;非线性处理器,用于对所述频域转换处理模块转换后输出的频域信号进行残留回声抑制后输出;舒适噪声生成器,采用上述权利要求1 6任一项所述的舒适噪声生成器,用于在确定 输入信号的当前帧信号是背景噪声时,生成与是背景噪声的所述当前帧信号的频谱特征、 能量水平相匹配的舒适噪声,并在确定非线性处理器输出的信号中需用舒适噪声填充处, 用生成的所述舒适噪声填充后输出;时域转换处理模块,用于将所述舒适噪声生成器填充所述舒适噪声后输出的频域信号 转换成时域信号后输出。
18.根据权利要求17所述的回声抵消装置,其特征在于,所述频域转换处理模块为采 用快速傅里叶变换方式将所述自适应滤波器处理后输出的时域信号转换成频域信号。
19.根据权利要求17所述的回声抵消装置,其特征在于,所述时域转换处理模块为采 用快速傅里叶逆变换方式将所述舒适噪声生成器填充所述舒适噪声后输出的频域信号转 换成时域信号。
全文摘要
本发明实施方式提供一种舒适噪声生成器、方法及回声抵消装置,属语音通信技术领域。该生成器包括背景噪声估计模块,用于判断输入信号的当前帧信号是背景噪声时,在频域对当前帧信号的频谱特征与能量水平进行估计,得到频谱特征估计值和能量水平估计值;白噪声生成模块,用于在频域生成白噪声;白噪声整形模块,用于根据得到的所述频谱特征估计值和能量水平估计值,对白噪声生成模块生成的白噪声进行整形后得到舒适噪声,得到的舒适噪声的频谱特征和能量水平均与背景噪声的相匹配;舒适噪声填充模块,用于用整形后得到的所述舒适噪声对残留回声抑制后输出的频域信号的当前帧信号进行填充。该生成器可保证语音的质量。
文档编号G10L19/00GK102136271SQ201110037768
公开日2011年7月27日 申请日期2011年2月9日 优先权日2011年2月9日
发明者邱洪 申请人:华为技术有限公司