专利名称:自适应时基噪声抑制的制作方法
技术领域:
本发明涉及电子通信领域,而且更具体地说,本发明涉及基于声频信号的电子通信。
背景技术:
噪声可能降低任何信号的质量。在利用蜂窝电话或者其它基于语音的通信装置调制并传送声频信号的电子通信的情况下,噪声可能使信号失真,以致信号变得不清晰,或者至少使通信的接听者感到不适。通常困扰这些通信装置用户的普通形式的噪声是背景噪声。背景噪声包括被称为多路重合噪声的外来语音,它通常充斥在诸如餐馆或者其它公共场所的公共环境。背景噪声还包括其它外来声音,例如,可能干扰或者使声频信号承载的语音分量失真的音乐等。
传统装置往往依靠老式噪声抑制器来处理噪声。老式噪声抑制器的工作方法通常取决于实现基于频率的算法。尽管这种方法可以成功降低白噪声,但是它几乎不能作为一种用于处理其它类型的噪声,例如,以背景噪声为特征的噪声的有效技术。这可能是因为,由背景噪声所代表的这种噪声通常与该信号的语音分量占用相同的声频信号频谱。然而,老式噪声抑制器主要集中于降低占据该频谱低端的白噪声。
因此,当前技术没有可以充分地抑制噪声,尤其是以背景噪声为特征的噪声的高效、实用装置或技术。此外,传统装置和技术,尤其是基于频率的传统装置和技术,主要是没有根据与声频信号相关的噪声的估计电平的抑制噪声的能力。也就是说,传统装置和技术往往不估计与声频信号相关的噪声电平,因此,根据将噪声电平估计得较高还是较低,而将声频信号抑制得较多或者较少。
发明内容
本发明的一个方面是用于降低与声频信号相关的噪声的自适应时基(time-based)系统。该系统可以包括估计器模块,该估计器模块用于确定与该声频信号相关的估计的噪声电平。此外,该系统还包括扩展器模块,如果该声频信号的电平低于信号阈值,则该扩展器模块使该声频信号衰减。该扩展器模块可以自适应调谐,以致该扩展器模块使该声频信号实现的衰减取决于该估计器模块估计的噪声电平。根据一个实施例,对于较高的估计噪声电平,该扩展器模块可以使基础声频信号实现较高程度的衰减。相反,根据该实施例,对于较低的估计噪声电平,该扩展器模块可以实现较低程度的衰减。
本发明的另一个方面是用于降低与声频信号相关的噪声的方法。该方法可以包括确定估计的与该声频信号相关的噪声的电平;以及如果该声频信号的电平低于信号阈值,则使该声频信号衰减。该声频信号的衰减取决于估计的噪声电平。更具体地说,根据另一个实施例,估计的噪声电平越高,衰减越大。
本发明的又一个方面是包括计算机可读存储介质的设备。该存储介质可以包括用于降低与声频信号相关的噪声的指令。该计算机指令可以包括用于确定估计的与该声频信号相关的噪声电平的指令。该计算机指令进一步包括用于以下的指令如果该声频信号的电平低于信号阈值,则使该声频信号衰减,该声频信号的衰减取决于估计的噪声电平。
图中示出了几个实施例,然而,应该明白,本发明并不局限于所示的具体配置和方法。
图1是根据本发明实施例,包括用于降低与声频信号相关的噪声的系统的通信装置原理图。
图2是图1所示系统的详细原理图。
图3示出根据本发明实施例,基于被衰减的声频信号的放大曲线图。
图4a至4c示出根据本发明又一实施例,基于被衰减的声频信号的放大曲线图。
图5是示出根据本发明又一实施例,β参数和与声频信号相关的估计的噪声电平之间的函数关系的曲线图。
图6是根据本发明又一个实施例的降低与声频信号相关的噪声的方法的流程图。
具体实施例方式
图1是根据在此公开的发明性结构的实施例的用于降低与声频信号相关的噪声的系统100的原理图。如图所示,系统100可以包括在诸如蜂窝电话的通信装置102内,用于改善使用该装置的个人104进行通过远程站点106与通信网络通信的通信。根据随后的讨论,容易看出,作为一种选择,系统100可以与用于传送、处理或者同样采用声频信号的其他类型的通信与电子装置集成、连接或者可通信地链接在一起,如在此所述。
该声频信号可以包括任意调制的电信号,在利用诸如扬声器(未示出)的声频输出装置放大并将它转换为声振动时,它变成声音。更具体地说,声频信号可以是与通信装置102,例如,位于伊利诺斯州沙夫堡市的摩托罗拉公司生产的集成数字增强网络(iDEN)装置相关的电信号。作为一种选择,通信装置102可以是通过利用声频信号进行各种模式通信的其它任意类型的电子装置,输入/输出形式的声频信号包括被处理以产生声音的调制电信号。
与该声频信号相关的噪声可以包括任意外来信号分量,该外来信号分量往往干扰和扰乱通信装置102内存在的或者通过该通信装置102的信号的声音或质量。例如,在通信装置的情况下,噪声可能包括诸如音乐或者所谓多路重合(babble)噪声的背景噪声,例如,充斥诸如餐馆或其它公共场所的公共环境的外来语音。
此外,参考图2,作为示例,系统100包括用于确定与该声频信号相关的噪声的估计电平的估计器模块108。作为示例,系统100还包括扩展器模块110,如果该声频信号的电平低于信号阈值,则该扩展器模块110用于使声频信号衰减。从根据噪声的估计电平衰减该声频信号的意义上说,可自适应调谐扩展器模块110。
根据下面更详细描述的一个实施例,在与声频信号相关的噪声较小时,自适应调谐使系统100较小地衰减或者抑制声频信号,而在与声频信号相关的噪声较大时,较多地衰减或抑制该声频信号。根据下面详细描述的另一个实施例,根据噪声的估计电平调节阈值。因此,阈值设置的越严格,估计的噪声电平越高,阈值设置的越不严格,估计的噪声越小。
估计器模块108估计与通信装置102作为示例接收的声频信号相关的噪声的电平。根据一个实施例,通过分析多采样语音帧,可以估计噪声的电平。本技术领域内的普通技术人员容易明白,可以利用采用语音编码器(未示出)的通信装置102产生多采样语音帧。该语音编码器对该声频信号进行采样,然后,使用该采样产生表示该声频信号的编码数据。接着,将该编码数据集合在一起,以形成各异的多采样语音帧。
例如,现在,速率可变编码器通常用于无线通信装置,因为速率可变语音编码器可以提高为该装置提供能量的电池的寿命,而且因为它们在对可感语音质量具有较小影响的情况下,提高系统容量。电信工业协会已经编制了最普及的速率可变语音编码器标准,例如,过渡性标准IS-96和过渡性标准IS-733。根据语音活动性,这些速率可变语音编码器以被称为全速率、半速率、1/4速率或1/8速率的四种可能速率对语音信号进行编码,该速率对应于用于编码语音帧的比特数。该速率可以逐帧不同。对于许多这种通信装置,对应每帧,语音帧可以包括180个采样。
根据一个实施例,通过计算包括多采样帧的每个采样的信号电平的绝对值的平均值,或者均值,估计器模块108估计噪声电平。本技术领域内的普通技术人员容易明白,信号电平对应于信号的能量。在本说明书中,作为示例,该信号电平对应于与多采样帧的每个采样相关的能量。因此,对于180个采样的语音帧,由估计器模块108估计的噪声电平基于180个信号电平绝对值的和,该和被除以180。
根据又一个实施例,估计器模块108以实时、动态方式更新估计的噪声电平。例如,利用下面的方程定义动态估计的噪声电平EBNi=EBNi-1+(1-β)*AVSF其中EBNi表示当前估计的与通信装置102接收的声频信号相关的噪声的电平,EBNi-1表示先前估计的噪声电平,AVSF表示当前语音帧的绝对值,以及β表示用于表示以其动态估计该估计的噪声电平的速率的参数。
方程EBNi=EBNi-1+(1-β)*AVSF中的关键参数就是β。参数β确定以其更新或者修改噪声电平EBNi的当前估计值的速率。通过将当前语音帧的绝对值AVSF与差分方程EBNi=EBNi-1+(1-β)*AVSF确定的估计的噪声电平进行比较,计算β值。是否更新β以及多大程度上更新β取决于声频信号处理期间通信装置102获得的三个各异条件中存在哪个条件。
首先,如果当前语音帧的绝对值至少等于估计的噪声电平的某个倍数(大于1倍),则可以假定该帧,或者,更准确地说该帧表示的一部分声频信号不仅包含噪声,它还包含实际语音。在这种情况下,设置β等于1。与基础声频信号包含实际语音的假设一致,有效方法是是将大于1的倍数设置为2,以使估计的噪声电平乘以2。因此,只要AVSF>2*EBNi,则将β设置为1。
相反,如果当前语音帧的绝对值小于估计的噪声电平,则修改或者更新β。由于如果它不仅仅包含噪声,则假定该基础信号至少等于估计的噪声电平,所以这是必然结果。在这种情况下,可以将β设置为反映要求以其更新参数的速率的预定值。在第三种也是最后一种情况下,如果语音帧的绝对值位于估计的噪声电平与大于1倍(例如2倍)的某个倍数的估计的噪声电平之间,则可以根据下面的方程更新ββ=max[clip(2*EBNi)-param1,param2]其中,可以根据要求的用于更新参数β的速率,再一次选择param1和param2。所给出的方程保证β小于最大值(因为包括param1)而仍保持大于0(如果β为0,则停止更新)。一般地说,该方程保证更新β的速率与估计的噪声电平成反比;高噪声电平导致更慢更新β值,反之亦然。图5是示出根据上述数学公式,参数β与由估计器模块108估计的噪声电平之间存在的不同函数关系之一的曲线图。
如果该声频信号的电平降低到阈值以下,则扩展器模块110使对基础声频信号的放大缩小。一般地说,将阈值设置为低于要求的电平,而高于最低噪声的电平。当该声频信号降低到该阈值以下时,放大器模块110使该声频信号衰减或者进一步降低。由于假定该信号电平的降低表示没有声音内容是合理的,所以抑制低于阈值的信号试图减小剩余信号分量、噪声。因此,设置该信号阈值,以使其低于某个要求的最低电平,阈值,而高于噪声“最低”。当该声频信号降低到该阈值以下时,扩展器模块110抑制或者衰减该声频信号,以使其信号电平进一步降低。根据一个实施例,信号抑制量或者衰减量是估计器模块108确定的估计噪声电平的函数。也就是说,由估计器模块108估计的噪声电平确定扩展器模块110抑制或者衰减该基础声频信号的程度。
图3示出根据其,根据与该声频信号相关的噪声是更大还是更小,扩展器模块110使得衰减更大或者更小的实施例。如曲线A(BN)所示,存在由角点C表示的阈值,低于其,扩展器模块110使该声频信号衰减。作为示例,该阈值是-10分贝(dB)的信号电平。超过该点,则该声频信号(即,输入)-10dB的电平变化产生该声频信号中每一dB的降低就衰减-2dB的衰减信号(即,输出)。该衰减率取决于与该声频信号相关的估计的噪声电平BN。
根据该实施例,如图3所示,如果与该声频信号相关的估计的噪声电平为BN′,其中BN′>BN,则衰减率较大。在这种情况下,如曲线A(BN′)所示,一旦该声频信号降低到阈值-10dB(角点C)以下,则该声频信号每降低1dB,扩展器模块就产生-4dB的衰减。因此,根据该实施例,估计器模块108估计的噪声电平BN的增大导致自适应可调谐扩展器模块110使该声频信号衰减较大。
根据又一个实施例,如图4a至图4c示出的不同放大曲线图所示,通过根据由估计器模块108估计的噪声电平建立的信号阈值,扩展器模块110使该声频信号衰减。作为示例,图4a示出阈值被设置为-20dB的信号电平的基准,如角点C所示。如果与该声频信号相关的估计的噪声电平升高,则作为示例,扩展器模块110设置-10dB的阈值,如图4b示出的角点C′所示。相反,如图4c,如果估计的噪声电平较低,则扩展器模块110相应地设置-30dB的阈值,如角点C″所示。
请注意每个放大曲线图、图4a至图4c,角点表示的阈值取决于估计的噪声电平。更具体地说,噪声电平越高,扩展器模块110设置的阈值就越严格;也就是说,对于适中噪声电平,使扩展器工作需要声频信号降低-20dB。对于较高的噪声电平,只需要降低-10dB,而对于较低的噪声电平,需要在扩展器模块110使声频信号进一步衰减之前,降低-30dB或者更多。
利用基于估计器模块108确定的估计噪声电平的数学关系确定扩展器模块110确定的信号阈值。例如,可以利用下面的线性关系确定该信号阈值,其中C还表示角点,BN表示估计的噪声电平,而S表示移位参数C=BN+S下面的方程利用数学方法描述了上面的典型放大曲线,其中y表示衰减声频信号(即,输出),x表示声频信号(即,输入),α表示对应于低于该阈值的输入信号电平的一部分曲线的斜率,而C的定义如上y=αx-C(α-1)因此,利用下面的方程表示扩展模块110根据估计器模块108确定的估计噪声电平产生的衰减量,其中衰减量对应于衰减声频信号(输出)与声频信号(输入)之差,利用Δ表示它Δ=y-x=(α-1)(x-C)利用BN-S代替上面方程中的C,得出Δ=(α-1)(x-BN-S)值得注意的是,如果该声频信号只包括噪声,例如,背景噪声,则没有基于声频的输入导致最后的方程简化为下面的公式Δ=-(α-1)S还可以计算与该信号相关的增益量。对于时间指数i,增益为G(i)。一般地说,我们知道,dB域中的比例因数等于线性(时间)域的压缩比,因此,dB域中的a*X(t)等于线性(时间)域中的x(t)a。根据上述内容,在dB域中,Δ=(α-1)(x-c)。因此,如下可以求得该增益G(i)=10Δ/10=10(α-1)(x-c)/1010[x(α1)+c(1-α)]=10x(α1)/1010c(1-α)/10=Clog(1-α)·|x(i)|(α-1)考虑到|x(i)|>Clog,所以增益是一,我们可以得到增益的如下通用方程G(i)=Clog(1-α)min(Clog,|x(i)|)(α-1),其中Clog=10c/10图6是根据又一个实施例用于降低与该声频信号相关的噪声的方法600的流程图。该方法包括,在步骤602,确定与该声频信号相关的估计噪声电平。在步骤604,确定该声频信号是否低于预定阈值。如果如此,则在步骤606,使该声频信号衰减,其中该衰减取决于在步骤602估计的噪声电平。作为示例,方法600应用于多采样语音帧表示的声频信号。因此,可以逐帧进行每个步骤。因此,在步骤608,确定是否存在到目前为止还没有对其应用该方法的多采样帧。如果如此,则通过返回步骤602并重复剩余步骤,继续执行该方法600。重复这些步骤,直到对对应于被处理的特定声频信号的每个多采样帧都应用了方法600,这时,方法600在步骤610停止。
可以以硬件、软件或者硬件和软件组合的方式实现本发明。可以在一个计算机系统中以集中方式实现本发明,也可以以将不同单元分布在几个互联的计算机系统中的分布式方式实现本发明。本发明适合适于实现在此描述的方法的任何类型的计算机系统或者其它设备。硬件和软件的典型结合可以是具有计算机程序的通用计算机系统,在装载并执行该计算机程序时,该计算机程序控制该计算机系统,以致该计算机系统执行在此描述的方法。
还可以将本发明嵌入计算机程序产品中,该计算机程序产品包括能够实现在此描述的方法的所有特征,而且在将该产品装装载到计算机系统时,该计算机程序产品能够执行这些方法。本说明书中的计算机程序指一组意在使系统具有信息处理的能力的指令的任意表达式、任意语言、代码或者记数法,以便直接执行,或者在完成如下之一或者二者a)转换成另一种语言、代码或记数法;b)以不同介质形式再现,之后执行特定功能。
在不脱离本发明的实质属性或者本质属性的情况下,可以以其他方式实现本发明。因此,应该以下面的权利要求为准指出本发明范围,而不以上面的说明书为准。
权利要求
1.一种用于降低与声频信号相关的噪声的自适应时基系统,该系统包括估计器模块,用于确定估计的与该声频信号相关的噪声的电平;以及扩展器模块,如果该声频信号的电平低于信号阈值,则使该声频信号衰减,所述扩展器模块可以自适应地调谐,以致该声频信号的衰减取决于估计的噪声电平。
2.根据权利要求1所述的系统,其中通过根据估计的噪声电平设置信号阈值,扩展器模块使得根据估计的噪声电平进行衰减。
3.根据权利要求2所述的系统,其中该信号阈值与估计的噪声电平具有线性关系。
4.根据权利要求3所述的系统,其中利用C=BN+S确定信号阈值,C表示信号阈值,BN表示估计的噪声电平,而S表示移位参数。
5.根据权利要求4所述的系统,其中利用Δ=(α-1)(x-C)=(α-1)(x-BN-S)确定该声频信号的衰减,Δ表示衰减,x表示声频信号的电平,α表示该声频信号的电平与基于该声频信号的输出之间的量化关系,BN表示估计的噪声电平,而S表示移位参数。
6.根据权利要求1所述的系统,其中根据先前估计的噪声电平和对应于由该声频信号获得的当前语音帧的平均值,动态地估计该估计的噪声电平。
7.根据权利要求6所述的系统,其中利用EBNi=EBNi-1+(1-β)*AVSF确定动态地估计的噪声电平,EBNi表示当前估计的噪声电平,EBNi-1表示先前估计的噪声电平,AVSF表示对应于当前语音帧的平均值,而β表示用于表示动态地估计该估计的噪声电平的速率的参数。
8.一种用于自适应降低与声频信号相关的噪声的时基方法,该方法包括确定与该声频信号相关的估计的噪声电平;以及如果该声频信号的电平低于信号阈值,则使该声频信号衰减,该声频信号的衰减取决于估计的噪声电平。
9.根据权利要求8所述的方法,其中该衰减包括根据估计的噪声电平,确定信号阈值。
10.根据权利要求9所述的方法,其中根据该信号阈值与估计的噪声电平之间的线性关系,确定信号阈值。
全文摘要
提供了用于降低与声频信号相关的噪声的系统、设备和方法。用于降低与声频信号相关的噪声的系统(100)包括估计器模块(108)。该估计器模块确定与该声频信号相关的估计的噪声电平。该系统还包括扩展器模块(110)。如果该声频信号的电平低于信号阈值,则该扩展器模块使该声频信号衰减。该扩展器模块自适应可调谐,以使该扩展器模块进行(606)的衰减取决于该估计器模块估计(602)的噪声电平。
文档编号H04R15/00GK101060820SQ200580039383
公开日2007年10月24日 申请日期2005年11月8日 优先权日2004年11月18日
发明者阿里·拜布迪安, 马克·A·布瓦洛, 普拉蒂克·V·德赛, 钦·P·翁 申请人:摩托罗拉公司