专利名称:鲁棒噪声估计的制作方法
技术领域:
本发明涉及噪声,具体而言,涉及用于估计噪声的系统。
背景技术:
某些通信设备接收并传送语音。语言信号可以通过传播介质从一个系统传递到另一个系统。在某些系统中,语音的清楚程度取决于伴随着信号的噪声级。这些系统可以通过在特定时间测量噪声级的方式来估计噪声。在某些系统中,由于有时甚至掩盖语音的噪声的时变特征导致系统的性能很差。
在其他系统中,在语音的暂停期间监视噪声。当发生暂停时,记录平均噪声条件。通过频谱相减的方式,去除平均噪声级以改善信号的感知质量。在车辆及其他的动态噪声环境中,系统不能识别噪声,特别是在语音期间发生的噪声。例如当窗户打开,防冻系统开启,或者当从柏油路变换到混凝土路时所发生的噪声级的突变不能够被识别,特别是在当有人正在讲话时发生所述那些变化的情况下。
某些替换的系统跟踪最小噪声阈值。当检测没有信号内容时,监视噪声并调整最小噪声阈值。如果噪声级发生突变,那么某些系统将调整最小噪声阈值以与噪声级的变化相匹配。这些系统在高信噪比条件下能够改善系统的性能,但是当系统试图去除可能发生的语音时例如会在回波抵消(echo cancellation)方面受到影响。在某些系统中,回波被替换为跟踪最小噪声阈值的舒适噪声(comfort noise)。在最坏的情况下,感知语音质量可能下降为跟踪起伏的噪声阈值的背景噪声。因此需要一种用于改善噪声估计的系统。
发明内容
增强系统改善对来自接收信号的噪声的估计。所述系统包括频谱监视器,用于以多于一个的频率分辨率将信号的一部分进行划分。自适应逻辑导出接收信号的噪声自适应系数。一个或多个设备跟踪接收信号中所估计的噪声的特征,并修改多个噪声自适应率。逻辑将从以第一频率分辨率进行划分的信号中推导的修改的噪声自适应率施加到以第二频率分辨率划分的信号上。
增强方法估计来自接收信号的噪声。该方法将接收信号的一部分划分为宽频带和窄频带,并可以将对接收信号的估计标准化为近似正态分布。该方法导出接收信号的噪声自适应系数,并通过利用诸如方差和瞬时特征之类的统计信息的方式来根据频谱特征修改多个噪声自适应率。该方法修改多个噪声自适应率,并根据趋势特征和修改的噪声自适应率来修改多个噪声自适应率和窄频带噪声估计值。
通过对下文中附图以及详细说明的解释,本发明的其他系统、方法、特征和优点对本领域的技术人员来说都将是显而易见的。旨在所有这类另外的系统、方法、特征和优点都包含在该说明书内,在本发明的范围之内,并受下述的权利要求保护。
参照下面的附图和说明书可以更好地理解本发明。在举例说明本发明的原理时,图中的组件不必按比例,而是强调其设置。此外,在附图中,遍及不同的图,相同的附图标记指示对应的部分。
图1是增强方法的流程图;图2是替换增强方法的流程图;图3是频域中噪声的立方根;图4是频域中噪声的四次方根;图5是信号估计时噪声(noise-as-an-estimate-of-the-signal)的反平方函数(inverse square function);
图6是瞬时变化的反平方函数;图7是瞬时函数中的多个时间;图8是增强系统的框图;图9是与车辆相连接的增强系统的框图;图10是与网络相通信的增强系统的框图;图11是与电话、导航系统或者声频系统相通信的增强系统的框图。
具体实施例方式
一种增强方法,改善背景噪声估计,并可以改善语音重构。该增强方法可以迅速地针对噪声突变进行自适应。该方法可以跟踪在连续或者间断语音期间的背景噪声。某些方法在高信噪比条件期间很稳定。某些方法具有很低的计算复杂性和内存需求,其可以使费用和能量消耗最小化。
在通信方法中,噪声可能包括自然发生或者由传播介质生成或者接收的非期望信号。噪声的级别和振幅可能很稳定。在某些情况下,噪声级可能迅速改变。噪声级和振幅可能在宽频带方式上有所改变,并可以具有许多不同的结构,诸如空值(nulls)、音调(tones)和阶跃函数(step functions)之类。一种方法通过光谱分析和瞬时变化分析来区分背景噪声和语音。
为了分析噪声的频谱变化或者其他性能,如图1所述可以将频谱划分为的多于一个的频率分辨率。某些增强系统分析一种频率分辨率的信号并修改第二频率分辨率的信号。例如,根据所观察的宽频带中的信号的特征来分析和/或修改窄频带信号(可以包括未压缩频率单元(frequency bin))。宽频带可以包括预定数目的频带(例如,在某些方法中大约四至大约六个频带),该频带基本上是等距的或者不等距的(诸如对数、Mel或者Bark比例),也可以是不相重叠的或者相重叠的。为了达到最佳,某些宽频带可以具有不同的单元(bin)分辩率,和/或某些窄频带可以具有不同的分辩率。较高频带可以比较低频带具有更大的带宽。分辩率可以由语音或者背景噪声的特征和时间表示例如,在某些系统中宽频带的宽度能够获得语音共振峰(voicedformants)。由于在102中频谱被分成宽频带和窄频带单元(bin),所以在104中逻辑对宽频带的特征进行分析以修改所选择的宽频带的噪声自适应率以前,标准化逻辑可以将信号和噪声转换为近似正态分布或者其他优选分布。初始噪声自适应率可以是预定的,或者可以通过逻辑来源于一部分频谱。在106中,宽频带噪声自适应率可以被施加到窄频带单元上。
宽频带噪声自适应率可以利用一个逻辑设备或多个逻辑设备或者这样的模块来修改,所述模块编程或者配置有跟踪所估计噪声的特征的功能,并且某些可以将不精确的变化补偿到宽频带噪声自适应率中。在图1中单个或者多个逻辑设备可以包括信号估计时噪声的逻辑、瞬时变化逻辑、短暂时间逻辑、和/或同等压力逻辑中的一个或多个,其中一些例如可以具有反平方函数。因为对每个窄频带单元而言每个宽频带噪声自适应率不是同等重要的,所以该函数可以被施加到与每个窄频带单元相对应的宽频带的噪声自适应率上。在自适应率并非对每个窄频带单元同样重要的某些情况下,可以使用加权逻辑,所述加权逻辑例如被配置或者编程为具有三角形、矩形或者其他形式或者加权函数的组合。
图2举例说明了用于估计噪声的一种增强方法。该方法可以涵盖存储在存储器中的软件,或者与一个或多个处理器通信的编程硬件。处理器可以运行一个或多个操作系统或者未必涉及操作系统。所述方法修改每个宽频带的全局自适应率。全局自适应率可以包括对所导出或者所设置的各个宽频带噪声估计的原始调整。
某些方法在202中导出全局自适应率。该方法可以瞬时逐块地运行,其中每块都包括时间帧。当帧的数目少于既定编程的或者预定的帧数目(例如,在某些方法中为大约两个)时,增强方法可以通过向一部分信号频谱施加连续平滑函数的方式导出初始噪声估计值。在某些方法中,频谱可以利用两、三或多点平滑函数被平滑不止一次(例如,两次、三次等)。当帧数目大于或等于既定编程的或者预定的帧数目时,可以通过具有快速自适应率的漏积分函数(leaky integrationfunction)、指数平均函数或者其它函数来导出初始噪声估计值。全局自适应率可以包括在所导出的噪声估计值和帧内部分频谱之间的信号强度的差值。
利用可能包括基本上等距的不重叠矩形窗或者Mel空间重叠窗的开窗功能,在204中频谱被分成预定数目的宽频带。利用自动导出或者手动设置的全局自适应率,该增强方法通过统计法来分析原始信号的特征。每个宽频带中的平均信号和噪声功率可以被计算并被转换为分贝(dB)。在功率域中的平均信号强度和噪声级之间的差值包括信噪比(SNR)。如果在宽频带方面信号强度的估计值和噪声估计值相等或者近似相等,则不用对宽频带执行进一步的统计分析。例如,在处理下一个宽频带以前,可以将诸如SNR的偏差(例如信号估计时噪声)、瞬时变化或者其它测量值之类的统计结果设置为预定值或者最小值。如果在信号强度和噪声级之间有一点差别或者没有差别,那么某些方法将不会招致收集另外的统计信息的处理成本。
在206中,在包括在信号和噪声估计值之间的有意义信息的宽频带中(例如,具有超出预定能级的功率系数),某些方法将信号和噪声估计值转换为近似标准正态分布或者标准正态分布。在正态分布中,SNR的计算和增益的改变可以通过加减法来计算。如果分布是负斜交的,则某些方法将信号转换为近似正态分布。一个方法在信号被转换为dB以前通过利用功率域中的先前信号平均信号的方式接近近似正态分布。另一种方法将信号的功率谱同在先的功率谱相比较。通过选择每个单元中的最大功率,然后将该选择转换为dB的方式,该替代方法接近标准正态分布。图3和图4分别所示的能量的立方根(P^1/3)或者四次方根(P^1/4)是能够接近标准正态分布的其他替换方式。
对每个宽频带而言,该增强方法可以通过计算信号强度和所估计的噪声级的和与信号强度和所估计的噪声级的平方差值的和的方式来分析频谱变化。如果需要方差测量,则还可以计算平方和。由这些统计值,可以计算信号估计时噪声。信号估计时噪声可以是SNR的方差。在替换方法中,还存在许多其他不同的用于计算指定随机变量的方差的方式。公式1显示了一种计算指定宽频带“j”中全部“i”单元的SNR估计值方差的方法。
Vj=Σ0N-1(Si-Di)2N-(Σ0N-1Si-Σ0N-1DiN)2]]>公式1在公式1中,Vj是所估计SNR的偏差,Si是宽频带“j”内单元“i”的信号的dB值,Di是宽频带″j″内单元″i″的噪声(或者干扰)的dB值。D包括噪声估计值。在S和D之间的均方差的相减值或者在S和D之间的平均差包括标准化系数。如果S和D具有基本相同的形状,那么V将等于零或者近似零。
漏积分函数可以跟踪每个宽频带的平均信号成分。在每个宽频带中,在不平滑和平滑值之间的差值可以计算。差值或者余量(R)可以通过公式2来计算。
R=(S-S‾)]]>公式2在公式2中,S包括信号的平均能量, 包括临时平滑的信号,在第一帧中其被初始化为S。
接下来,利用漏积分器进行瞬时平滑,其中自适应率被编程遵循具有比在语音段中可以看到的变化具有更低比率的信号的变化。
S‾(n+1)=S‾(n)SBAdaptRate*R]]>公式3在公式3中,更新“ ”,平滑信号值“ ”是当前平滑信号值,R包括余量,SBAdaptRate包括以预定值初始化的自适应率。虽然预定值可以变化并具有不同的初始值,但是一种方法将SBAdaptRate初始化为大约0.061。
一旦计算出暂时平滑信号 ,就可以计算在平均或进行中的瞬时变化和该差值的任何变化之间的差值(例如,第二导数)。瞬时变化、TV度量有多少信号随着时间的流逝而上下浮动变化。瞬时变化可以利用公式4来计算。
TV(n+1)=TV(n)+TVAdaptRate*(R2-TV)公式4在公式4中,TV(n+1)是更新后的值,TV(n)是当前值,R包括余量,TVAdaptRate包括初始化为预定值的自适应率。虽然预定值也可能发生变化并具有不同的初始值,但是一种方法将TVAdaptRate初始化为0.22。
在某些增强方法中可以追踪宽频带信号估计值超出宽频带噪声估计值的时间长度。如果信号估计值保持超出噪声估计一预定能级,那么在信号估计值超出预定能级一段时间的情况下,该信号估计值可以被认为是″短暂的″。短暂时间可以由计数器来监视,计数器可以在信号估计值低于预定能级或者另一个适当阈值时被清零或者重置。虽然预定能级可以变化并对每个应用而言具有不同的值,但是一种方法将所述能级预编程至大约2.5dB。当宽频带的SNR低于那个能级时,重置计数器。
利用诸如上面所导出的那些的每个宽频带的数字说明,增强方法分别修改每个宽频带的宽频带自适应系数。每个宽频带自适应系数可以来源于全局自适应率。在一些增强方法中,可以导出全局自适应率,或者作为替换,可以将全局自适应率预编程为诸如大约4dB/秒的预定值。这意味着不进行其他修改,宽频带噪声估计也适合于大约4dB/秒或者预定值的增加率或者减少率的宽频带信号估计。
在修改各个宽频带的宽频带自适应系数以前,在208中所述增强方法判断宽频带信号是否低于其宽频带噪声估计预定能级,诸如大约-1.4dB。如果宽频带信号低于宽频带噪声估计值,那么在210中宽频带自适应系数可以被编程为预定比率或负SNR的函数。在一些增强方法中,宽频带自适应系数可以被初始化为“-2.5xSNR”。这意味着如果宽频带信号比其宽频带噪声估计值小大约10dB,那么以比一些方法中未修改的宽频带自适应率快大约二十五倍的比率来修改噪声估计值。一些增强方法限制对宽频带自适应系数的调整。增强方法可以确保当乘以修改的宽频带自适应系数时,大于宽频带信号的宽频带噪声估计值将不会在宽频带信号下方(例如,不会下冲(undershoot))。
如果宽频带信号超出其宽频带噪声估计值预定能级,诸如大约1.4dB,那么宽频带自适应系数可以利用两个、三个、四个或更多系数来修改。在图2所示的增强方法中,信号估计时噪声、瞬时变化、短暂时间以及同等压力可能分别影响每一个宽频带的自适应率。
当判断信号是噪声还是语音时,增强方法可以判断噪声估计能够多好地预测信号。如果噪声估计被偏移或者度量到信号,那么信号与所估计噪声的平方偏差的平均值判断信号是噪声还是语音。如果信号包括噪声,那么偏差可能很小。如果信号包括语音,那么偏差可能很大。据统计,这可能类似于所估计SNR的方差(variance)。如果估计SNR的方差很小,那么所述信号可能仅包括噪声。另一方面,如果所述方差很大,那么信号可能包括语音。遍及全部宽频带的所估计SNR的方差随后可以被合并或者被加权然后与阈值相比以指示是否存在语音。例如,A-加权或者其他种类的加权曲线可以被使用以将遍及全部宽频带的SNR方差合并到单个值中。该单个的、加权的SNR估计方差可以直接、或者临时平滑后再同预定或者也可能是动态取得的阈值进行比较,从而提供声音检测能力。
宽频带自适应系数的放大系数也可以包括所估计SNR方差的函数。因为宽频带自适应率可以与适合的比率(fit)成反比,所以在212中宽频带自适应系数例如可以乘以信号估计时噪声的反平方函数。该函数返回乘以宽频带自适应系数的系数,从而得到修改的宽频带自适应系数。
因为信号和偏移噪声估计是不同的,所以随着所估计SNR方差的增加,对自适应率的修改将缓慢适应。因为察觉到当前的信号与当前的噪声估计更匹配,所以随着方差减小,乘法器增加适应。因为一些噪声取决于统计值或者所计算的值而在所估计的SNR中有大约20到大约30的方差,所以表示函数返回大约1.0的放大系数的点的单位乘数(identity multiplier)可以在该范围之内或者接近其范围极限值。在图5中单位乘数被置于大约20的估计值方差。
最大乘数包括信号与噪声估计值最相似的点,因此估计SNR的方差很小。这允许宽频带噪声估计以适应于诸如阶跃函数之类的信号突变,并在声音段期间保持稳定。如果在一个宽频带内宽频带信号生成诸如大约20 dB的大的跳跃,但是例如十分接近于偏移宽频带噪声估计,那么由于在信号和噪声估计之间的少量变化和离差将导致自适应率迅速增加。最大放大系数可以从大约30到大约50之间变动,或者可以设置在这些范围的界限附近。在替换增强方法中,最大乘数可以是明显大于1的任何值,并可以例如随着在信号和噪声估计中所使用的单元而改变。放大系数的最大值还可以随噪声估计的实际利用而变,平衡宽频带背景信号的瞬时平滑性和自适应速度或另一特征或者特征的组合。标准最大放大系数的范围从的大约1到大约2的量级变动,其大于初始宽频带自适应系数。在图5中在接近0的估计方差中最大乘数包括大约40的编程的乘数。
最小乘数包括信号基本上根据噪声估计改变的点,因此所估计SNR的方差很大。随着在信号和噪声估计之间的差异或者变化的增加,乘数减小。最小乘数可以具有从1到0范围内的任何值,在一些方法中一个通用值在大约0.1到大约0.01的范围之内。在图5中,最小乘数包括在近似80的方差估计中的大约0.1的乘数。在替换增强方法中,最小乘数被初始化为大约0.07。
利用单位乘数、最大乘数和最小乘数的数值,信号估计时噪声的反二次方函数可以由等式5获得。
Min+Range1+Alpha*(VCritVar)2]]>公式5在公式5中,V是所估计SNR的方差,Min是最小乘数,Range是最大乘数减去最小乘数,CritVar是单位乘数,Alpha是等式6。
Range1-Min-1]]>公式6当每个宽频带的每一宽频带自适应系数都已经由信号估计时噪声的函数(例如,SNR的方差)修改时,在214中所修改的宽频带自适应系数可以乘以瞬时变化的反平方函数。图6的函数返回乘以所修改的宽频带系数的系数,从而控制每个宽频带中的自适应速度。该度量包括平滑宽频带信号附近的变化。平滑宽频带噪声估计可以具有接近零的瞬时平均变化,但是其强度也可以在6dB2到大约8dB2之间变换,尽管其仍然是标准背景噪声。在语音中,瞬时变化可能接近于在大约100dB2到大约400dB2之间的能级。同样,函数可以具有三个独立参数,包括单位乘数、最大乘数和最小乘数。
反二次方瞬时变化函数的单位乘数包括其中函数返回1.0的放大系数的点。在该点瞬时变化对宽频带自适应率具有最小的影响或者根本没有影响。比较高的瞬时变化是信号中存在语音的可能标志,只要瞬时变化增加,那么对自适应率的修改就缓慢进行自适应。因为察觉到信号更可能是噪声而非语音,所以随着信号的瞬时变化的减小,自适应率乘数增加。因为一些噪声可能具有关于从大约5dB2到大约15dB2的方差估计的最佳配合线的变化,所以单位乘数位于范围内或者接近范围界限值。在图6中,单位乘数被置于大约为8的估计方差。在替换增强方法中,单位乘数被置于大约10的估计方差。
最大放大系数的范围是从大约30到大约50,或者可以被置于该范围的界限值附近。在替换增强方法中,最大乘数可以具有明显大于1的任何值,并可以例如随着在信号和噪声估计中所使用的单元而改变。放大系数的最大值可以随噪声估计的实际利用而变,平衡宽频带背景信号的瞬时平滑和自适应速度。标准的最大放大系数的范围在大约1到大约2的量级的范围内,其大于初始宽频带自适应。在图6中,在接近0的瞬时变化中最大乘数包括大约40的编程的乘数。
最小乘数包括其中任一个特殊宽频带的瞬时变化比较大的点,可能表示声音或者高度瞬态噪声的存在。随着宽频带估计的瞬时变化的增加,乘数减小。最小乘数可以具有从大约1到大约0范围内的任何值,或者接近该范围,通用值在大约0.1到大约0.01的范围之内,或者接近该范围。在图6中,在接近大约80的方差估计处,最小乘数包括大约0.1的乘数。在替换增强系统中,最小乘数被初始化为大约0.07。
当每个宽频带的每一宽频带自适应系数都已经利用瞬时变化函数修改时,所修改的宽频带自适应系数乘以与宽频带信号估计已经大于宽频带估计噪声级预定级的时间量相关联的函数,其中所述预定级诸如216处的大约2.5dB(例如短暂时间)。图7所示的放大系数被初始化为大约0.5的低预定值。这意味着当宽频带信号最初大于宽频带噪声估计值时所修改的宽频带自适应系数较缓慢地进行自适应。宽频带信号超出宽频带噪声估计值预定级越长,则瞬时函数中每一时间的局部抛物线状自适应得越快。瞬时函数中一些时间可以没有上限或具有很高的上限,以便例如所述增强方法可以弥补宽频带自适应系数中被另一个系数施加的不适当的或者不精确的减少,其中另一个系数在该增强方法中是诸如信号估计时噪声的函数和/或瞬时变化函数。在一些增强方法中,当不适当时,信号估计时噪声的反平方函数和/或瞬时变化可以减少自适应乘数。这可能在宽频带噪声估计跳跃时发生,与信号估计时噪声的比较指示宽频带噪声估计值相差很悬殊,和/或当宽频带噪声估计不稳定时,仍仅包括背景噪声。
虽然可以选择和施加瞬时函数中的许多时刻,但是图7中显示了瞬时函数的三个示例性时间。函数的选择可以取决于增强方法的应用和宽频带信号和/或宽频带噪声估计的特征。在图7中大约2.5秒的位置,例如,瞬时函数的在上限时间的自适应几乎比瞬时函数中的在下限的自适应快30倍。示例性函数可以通过公式7获得。
F=Min+(Slope*Time)2公式7在公式7中,Min是最小短暂自适应率,Time累积每帧宽频带大于预定阈值的持续时间,Slope是初始瞬时斜率。在一个增强方法中,Min被初始化为大约0.5,Time的预定阈值被初始化为大约2.5dB,Slope被初始化为大约0.001525,其中时间以毫秒计。
当已经由一个或多个频谱形状相似性(例如,所估计SNR的方差)、瞬时变化和短暂时间修改了每个宽频带的每一宽频带自适应系数时,任何宽频带的全部自适应系数都能够被限制。在所述增强方法的一种执行过程中,最大乘数限于大约30dB/秒。在替换增强方法中,对升降自适应而言可以对最小乘数给以不同的限制,或者仅在一个方向上进行限制,例如限制宽频带的上升不快于大约25dB/秒,但是允许其下降差不多大约40dB/秒。
利用为每个宽频带所获得的修改的宽频带自适应系数,可能存在宽频带信号明显大于宽频带噪声的宽频带。因为该差异,信号估计时噪声的函数和瞬时变化函数以及短暂时间函数的反平方函数未必总能精确地预测在那些高SNR频带中的宽频带噪声的变化率。如果一些邻近的低SNR宽频带中的宽频带噪声估计下降,那么一些增强方法可以判断高SNR宽频带中的宽频带噪声也将下降。如果一些邻近的低SNR宽频带中的宽频带噪声上升,那么一些或者相同的增强方法可以判断在高SNR宽频带中的宽频带噪声也可能上升。
为了标识趋势,在218中,一些增强方法监视低SNR频带以标识同等压力的变化趋势。优选方法首先可以判断整个低SNR宽频带(例如,具有信噪比<大约2.5dB的宽频带)的最大噪声级。最大噪声级可以存储在存储器中。在另一个高SNR宽频带上利用最大噪声级可以取决于高SNR宽频带中的噪声是大于还是小于最大噪声级。
在每一个低SNR频带中,所修改的宽频带自适应系数被用于宽频带的每个元素单元(member bin)。如果宽频带信号大于宽频带噪声估计值,那么加上所修改的宽频带自适应系数,否则减去所修改的宽频带自适应系数。该临时计算结构可以供一些增强方法使用以预测当施加修改的自适应系数时宽频带噪声估计会有什么后果。如果噪声增加预定量(例如,诸如大约0.5dB),那么可以将修改的宽频带自适应系数增加到低SNR增益系数平均值中。低SNR增益系数平均值可以是在具有低SNR的宽频带中的噪声趋势的标志,或者可以指示可以在哪里查找到最大量的关于宽频带噪声的信息。
接下来,一些增强方法标识不考虑低SNR的宽频带,并且在所述宽频带中宽频带信号已经超过宽频带噪声预定时间。在一些增强方法中,预定时间可以是大约180毫秒。计算这些宽频带的每一个的同等系数(Peer-Factor)和同等压力(Peer-Pressure)。同等系数包括低SNR增益系数,同等压力包括对已经贡献的宽频带数目的指示。例如,如果存在过6个宽频带并且除了1个之外的所有宽频带都具有低SNR,并且所有5个低SNR同等包括正在增加的噪声信号,那么一些增强方法可以断定高SNR频带中的噪声正在上升并具有比较高的同等压力。如果仅有1个频带具有低SNR,那么所有其他高SNR频带将具有相对低的同等压力感应系数。
在220中,利用所计算的自适应后的宽频带系数,以及利用所计算的同等系数和同等压力,一些增强方法计算每个窄频带单元的修改后的自适应系数。利用加权函数,所述增强方法分配包括父宽频带及其最接近的一个或多个邻近宽频带的加权值的值。这可以包括重叠三角形的加权系数或者其他加权系数。因此,当使用一个示例性的三角形加权函数时,如果一个单元位于两个宽频带的接界,那么其可以从低频带接收一半或者大约一半的宽频带自适应系数,以及从高频段接收一半或者大约一半的宽频带自适应系数。如果单元几乎处于宽频带的正中心,那么其可以从父宽频带接收全部或者几乎全部的权重。
首先频率单元可以接收正的自适应系数,其最后被加到噪声估计中。但是如果窄频带单元中的信号低于宽频带噪声估计值,那么可以令为窄频带单元的所修改的宽频带自适应系数为负。利用为每个频率单元自适应系数所确定的正负特征,在同等压力率下利用单元的自适应系数来调合同等系数。例如,如果同等压力仅为1/6,那么由其同等体判断指定单元的自适应系数仅为1/6th。利用为每个窄频带单元(例如,每个单元的正负dB值)确定的每一自适应系数,可以表示矢量的这些值被添加到窄频带噪声估计中。
为了确保精确度,某些增强方法可以确保窄频带噪声估计不在诸如大约0dB的预定基底之外。某些增强方法将窄频带噪声估计转换为振幅。虽然可以使用任何方法,但是所述增强方法可以通过查找表格或宏命令,组合,或者另一个方法来执行转换。因为某些窄频带噪声估计可以通过dB形式的中值平滑函数来度量,并且在先的窄频带噪声振幅估计可以以振幅的平均来计算,所以当前窄频带噪声估计可以偏移一预定能级。在一个应用中,一种增强方法可以临时将窄频带噪声估计偏移预定量,诸如大约1.75dB,以便与在先窄频带噪声估计的平均振幅相匹配,其中其他阈值基于所述在先窄频带噪声估计。当集成在降噪模块中时,所述偏移是不必要的。
窄频带噪声的能量可以被计算作为振幅的平方。对后续的处理而言,窄频带频谱可以复制到先前的频谱或者存储在供统计计算使用的存储器中。作为这些可选行为的结果,窄频带噪声估计可以被计算并被以dB、振幅或者能量的方式来存储,从而供任何其他方法或者系统来使用。某些增强方法也将宽频带结构存储到存储器中,因此其他系统和方法可以访问所述宽频带信息。例如,声音活动检测器(VAD)可以通过导出宽频带SNR的方差的暂时平滑的加权和,以及通过将所生成的值同阈值进行比较的方式表明在信号内存在语音。
在替换增强方法中,上述方法还可以通过瞬时惯性修改来修改宽频带自适应系数、宽频带噪声估计和/或窄频带噪声估计。该替换方式可以根据认为像车辆噪声这样的某些背景噪声具有惯性的思想来修改噪声自适应率和噪声估计。如果例如在超过预定数目的帧,诸如大约10帧上,宽频带或者窄频带噪声没有改变,那么就可以令随后帧保持不变。如果在超过预定数目的帧(例如,在本申请中大约为10帧)上,噪声已经增加,那么在某些替换增强方法中下一帧可能甚至更高。并且,如果在预定数目的帧之后(例如大约10帧),噪声已经下降,那么某些增强方法可以将所修改的宽频带自适应系数修改得更低。该替换增强方法可以从先前预定数目的帧中外推以预测当前帧内的估计值。为了防止过冲(overshoot),某些替换的增强方法还可以对自适应系数的增加或者减小进行限制。该限制可以以测定值的形式出现,诸如振幅(例如以dB计)、速度(例如以dB/秒计)、加速度(例如以dB/秒2计)或者以任何其它度量单位。当有人一边行走一边说话时,诸如当加速车辆中的司机说话时,这些替换增强方法可以提供更精确的噪声估计。
包括所描述方法的每个增强方法或者单独行为可以被代码化存储在信号承载介质、诸如存储器的计算机可读取介质中,被编程在诸如一个或多个集成电路的设备内,或者由控制器或者计算机进行处理。如果由软件执行包括所述方法的行为,那么软件可以存在于这样的存储器中,所述存储器驻留在或接口于噪声检测器、处理器、通信接口或者任何其他种类的非易失性或者易失性存储器接口,或者驻留在增强系统中。所述存储器可以包括用于实现逻辑函数的可执行指令的序列。所描述的逻辑函数或者任何系统元件可以通过光学电路、数字电路,通过源编码,通过模拟电路,通过诸如模拟电信号、音频或者视频信号或者组合的模拟信源来实现。软件可以被具体化为任何计算机可读取或者信号承载介质,供指令执行系统、装置或设备使用,或者同指令执行系统、装置或设备相连接。这种系统可以包括基于计算机的系统、包含处理器的系统、或者从也可以执行指令的指令执行系统、装置或设备中有选择地选取指令的另一个系统。
“计算机可读取介质”、“机器可读取介质”、“传送信号介质”和/或“信号承载介质”可以包括任何设备,这些设备包含、存储、传递、传送或者输送软件以供指令执行系统、装置或设备使用,或者与指令执行系统、装置或设备连接。机器可读取介质可以是、但不限于是电、磁、光、电磁、红外线或者半导体系统、装置设备或者传播介质。机器可读取介质的非穷举实例将包括具有一个或多个电线的电连接的“电子设备”、便携式磁盘或者光盘、诸如随机存取存储器“RAM”(电)之类的易失性存储器、只读存储器“ROM”(电)、可擦可编程序只读存储器(EPROM或者闪速存储器)(电),或者光纤(光)。机器可读取介质还可以包括软件所依附的有形介质,所述软件可以被电子地存储为图像或者其他格式(例如通过光学扫描),然后编译,和/或解释,或者另外的处理。所处理的介质可以被存储在计算机和/或机器存储器中。
图8举例说明了估计噪声的增强系统800。该系统可以包括存在于存储器中的逻辑或软件,或者包括与一个或多个处理器通信的编程硬件。在软件中,术语逻辑指的是由计算机执行的操作;在硬件中,术语逻辑指的是硬件或者电路。处理器可以运行一个或多个操作系统或者可能不涉及操作系统。系统修改每个宽频带的全局自适应率。全局自适应率可以包括初始调至所导出或者设置的各个宽带噪声估计值。
某些增强系统利用全局自适应逻辑802导出全局自适应率。全局自适应逻辑可以瞬时逐块地运行,其中每块包括一个时间帧。当帧数少于既定或者预定的帧数(例如大约两个)时,那么全局自适应逻辑可以通过向一部分信号频谱施加连续平滑函数的方式来导出初始噪声估计值。在某些系统中,频谱可以利用两个、三个或更多点平滑设备被平滑不止一次(例如,两次、三次等)。当帧数大于或等于既定或者预定的帧数时,可以通过编程或者配置有快速自适应率或者指数平均数的漏积分器来导出初始噪声估计,其在全局自适应逻辑802内或者与全局自适应逻辑802相连接。全局自适应率可以包括在所导出的噪声估计和帧内部分频谱之间的信号强度的差值。
利用可能包括不重叠的等距的基本矩形窗或者Mel间隔重叠的窗的窗函数,通过频谱监视器804将频谱分成预定数目的宽频带。利用由全局自适应逻辑所自动导出或者手动设置的全局自适应率,增强系统可以利用统计系统来分析原始信号的特征。每一宽频带中的平均信号和噪声功率可以被计算并被转换器转换为分贝(dB)形式。在功率域中平均信号强度和噪声级之间的差值包括信噪比(SNR)。如果频谱监视器804内或者同频谱监视器804相连接的比较器判断宽频带内的信号强度估计值和噪声估计值是相等的或者几乎相等的,那么将不再对宽频带执行进一步的统计分析。在标准化逻辑806接收到下一个宽频带之前,诸如SNR方差(例如,信号估计时噪声),瞬时变化或者其它测量值之类的统计结果例如可以被设置成预定值或者最小值。如果在信号强度和噪声级之间有一点差值或者根本无差值,那么一些系统就不会承担收集其他统计信息所需的处理成本。
在包含信号和噪声估计之间的有意义信息(例如,具有超出预定级的能量比)的宽频带中,某些系统利用标准化逻辑806将信号和噪声估计转换为近似正态分布或者标准正态分布。在正态分布中,SNR计算和增益改变可以通过加减法来计算。如果分布是负斜交的,那么某些系统将信号转换为近似正态分布。在信号被转换到dB以前,一个系统通过利用平均逻辑来功率域中对信号与先前信号求平均的方式来接近近似正态分布。另一个系统利用比较器将信号的功率谱同在先的功率谱进行比较。通过选择每个单元中的最大功率然后将所选择的功率转换为dB的方式,该替换系统接近标准正态分布。图3和图4分别所示的功率的立方根(P^1/3)或者四次方根(P^1/4)是其它的选择,其可以被编程在可以接近标准正态分布的标准化逻辑806中。
对每个宽频带而言,增强系统可以利用处理器或者控制器通过计算估计的信号强度和所估计的噪声级的和与信号强度和所估计的噪声级的平方差值的和的方式分析频谱变化。如果需要方差测量,那么也可以计算平方和。根据这些统计值可以计算信号估计时噪声。信号估计时噪声可以是SNR的方差。即使替换系统以许多不同的方式来计算指定随机变量的方差,但是公式1仅显示了一种用于计算指定宽频带“j”的全部“i”单元的SNR估计方差的方式。″Vj=Σ0N-1(Si-Di)2N-(Σ0N-1Si-Σ0N-1DiN)2]]>公式1在公式1中,Vj是所估计SNR的方差,Si是宽频带“j”内单元“i”的信号的dB值,Di是宽频带“j”内单元“i”的噪声(或者干扰)的dB值。D包括噪声估计值。在S和D之间的均方差的相减包括标准化系数,或者在S和D之间的平均差包括标准化系数。如果S和D具有基本相同的形状,那么V将等于零或者近似零。
漏积分器可以跟踪每个宽频带的平均信号内容。在每个宽频带中,在不平滑和平滑值之间的差值可以计算。差值或者余量(R)可以通过公式2来计算。
R=(S-S‾)]]>公式2在公式2中,S包括信号的平均能量, 包括临时平滑信号,在第一帧中其被初始化为S。
接下来,通过漏积分器,进行平滑,其中自适应率被编程遵循具有比在语音段中可以看到的变化具有更低比率的信号的变化。
S‾(n+1)=S‾(n)+SBAdaptRate*R]]>公式3在公式3中,更新“ ”,平滑信号值“ ”是当前平滑信号值,R包括余量,SBAdaptRate包括以预定值初始化的自适应率。虽然预定值可以变化并具有不同的初始值,但是一种系统将SBAdaptRate初始化为大约0.061。
一旦计算出暂时平滑信号 ,就可以利用减法器计算在平均或进行中的瞬时变化和该差值的任何变化之间的差值(例如,第二导数)。瞬时变化、TV度量有多少信号随着时间的流逝而上下浮动变化。瞬时变化可以利用公式4来计算。
TV(n+1)=TV(n)+TVAdaptRate*(R2-TV)公式4在公式4中,TV(n+1)是更新后的值,TV(n)是当前值,R包括余量,TVAdaptRate包括初始化为预定值的自适应率。虽然预定值也可能发生变化并具有不同的初始值,但是一个系统将TVAdaptRate初始化为0.22。
在某些增强系统中可以追踪宽频带信号估计值超出宽频带噪声估计值的持续时间。如果信号估计值保持超出噪声估计一预定能级,那么在信号估计值超出预定能级一段时间的情况下,信号估计值可以被认为是“短暂的”。短暂时间可以由与存储器相连接的计数器来监视,该计数器在信号估计值低于预定能级或者另一个适当阈值时被清零或者重置。虽然预定能级可以变化并对每个应用而言具有不同的值,但是一种系统将该能级预编程至大约2.5dB。当宽频带的SNR低于那个能级时,重置计数器和存储器。
利用诸如上面所导出的那些的每个宽频带的数字说明,增强系统分别修改每个宽频带的宽频带自适应系数。每个宽频带自适应系数可以来源于由全局自适应逻辑802所生成的全局自适应率。在一些增强系统中,可以导出全局自适应率,或者作为替换,可以将全局自适应率预编程为预定值。
在修改各个宽频带的宽频带自适应系数以前,一些增强系统利用比较器808来判断宽频带信号是否低于其宽频带噪声估计一预定能级,诸如大约1.4dB。如果宽频带信号低于宽频带噪声估计值,那么宽频带自适应系数可以被编程为预定比率或负SNR的函数。在一些增强系统中,宽频带自适应系数可以被初始化为“-2.5xSNR”或者以“-2.5xSNR”被存储在存储器中。这意味着如果宽频带信号比其宽频带噪声估计值小大约10dB,那么以比未修改的宽频带自适应率快大约二十五倍的速率来修改噪声估计值。一些增强系统限制对宽频带自适应系数的调整。增强系统可能确保当乘以修改的宽频带自适应系数时,大于宽频带信号的宽频带噪声估计值将不会在宽频带信号下方(例如,不会下冲(undershoot))。
如果宽频带信号超出其宽频带噪声估计值一预定能级,诸如大约1.4dB,那么宽频带自适应系数可以利用两个、三个、四个或更多逻辑设备来修改。在图8所示的增强系统中,信号估计时噪声逻辑、瞬时变化逻辑、短暂时间逻辑以及同等压力逻辑可能分别影响每一个宽频带的自适应率。
当判断信号是噪声还是语音时,增强系统可以判断噪声估计能够多好地预测信号。也就是说,如果噪声估计被能级偏移器偏移或者度量到信号,那么信号同所估计噪声的平方偏差的平均值判断信号是噪声还是语音。如果信号包括噪声,那么偏差可能很小。如果信号包括语音,那么偏差可能很大。如果估计SNR的方差很小,那么所述信号多半仅包括噪声。另一方面,如果所述方差很大,那么信号多半包括语音。遍及全部宽频带的所估计SNR的方差随后可以被通过逻辑合并或者被加权然后通过比较器与阈值相比以指示是否存在语音。例如,A-加权或者其他的加权逻辑可以被使用以将遍及全部宽频带的SNR方差合并到单个值中。该单个的、加权的SNR估计方差可以直接通过比较器被比较、或者由逻辑临时平滑后再由比较器同预定或者也可能是动态取得的阈值进行比较,从而提供声音检测能力。
宽频带自适应系数的放大系数也可以包括所估计SNR的方差的函数。因为宽频带自适应率可以和适合的(fit)比率成反比,所以宽频带自适应系数例如可以乘以在信号估计时噪声逻辑810中配置的反平方函数。信号估计时噪声逻辑810返回通过乘法器乘以宽频带自适应系数的系数,从而得到修改的宽频带自适应系数。
因为信号和偏移宽频带噪声估计是不同的,所以随着所估计SNR方差的增加,对自适应率的修改将缓慢进行自适应。因为察觉到当前的信号与当前的噪声估计更匹配,所以随着差异减小,乘法器增加自适应。因为一些噪声取决于所计算的统计值而在所估计的SNR上有大约20到大约30的方差,所以其中表示函数返回大约1.0的放大系数的点的单位乘数可以在该范围之内或者接近其范围极限值。在图5中单位乘数被置于大约20的估计值方差处。
最大乘数包括信号最类似于噪声估计值的点,因此估计的SNR的方差很小。这允许宽频带噪声估计以适应于诸如阶跃函数的信号突变,并在声音段期间保持稳定。如果在一个宽频带内宽频带信号生成诸如大约20dB的大的跳跃,但是例如十分类似于偏移宽频带噪声估计,那么由于在信号和噪声估计之间的少量方差和离差将导致自适应率迅速增加。最大放大系数可以从大约30到大约50之间变动,或者可以设置在这些范围极限附近。在替换增强系统中,最大乘数可以是明显大于1的任何值,并可以例如利用在信号和噪声估计中所使用的单元而被改变。最大放大系数的值还可以随噪声估计的实际利用而变,平衡宽频带背景信号的瞬时平滑性和自适应速度。通用的最大放大系数的范围是大约1到大约2量级内,其大于初始宽频带自适应系数。在图5中在接近0的估计的方差中最大乘数包括大约40的被编程的乘数。
最小乘数包括信号基本上根据噪声估计改变的点,因此所估计SNR的方差很大。随着在信号和噪声估计之间的离差或者方差的增加,乘数减小。最小乘数可以具有从1到0范围内的任何值,在一些系统中一个通用值在大约0.1到大约0.01的范围之内。在图5中,最小乘数包括在近似80的方差估计中的大约0.1的乘数。在替换增强系统中,最小乘数被初始化为大约0.07。
利用单位乘数、最大乘数和最小乘数的数值,在信号估计时噪声逻辑810中被编程或者设置的反平方函数可以由等式5获得。
Min+Range1+Alpha*(VCritVar)2]]>公式5在公式5中,V是所估计SNR的方差,Min是最小乘数,Range是最大乘数减去最小乘数,CritVar是单位乘数,Alpha包括等式6。
Range1-Min-1]]>公式6当每个宽频带的每一宽频带自适应系数都已经由在信号估计时噪声逻辑810中所编程或者设置的函数修改时,所修改的宽频带自适应系数可以利用乘法器来乘以在瞬时变化逻辑812中编程或配置的函数。图6的函数返回乘以所修改的宽频带系数的系数,从而控制每个宽频带中的自适应速度。该度量包括平滑宽频带信号附近的变化。平滑宽频带噪声估计可以具有接近零的瞬时平均变化,但是其强度也可以在6dB2到大约8dB2之间变换,尽管其仍然是标准背景噪声。在语音中,瞬时变化可能接近于在大约100dB2到大约400dB2之间的能级。同样,函数可以具有三个独立参数,包括单位乘数、最大乘数和最小乘数。
在瞬时变换逻辑812中所编程的反二次方的单位乘数包括其中逻辑返回1.0的放大系数的点。在该点瞬时变化对宽频带自适应率具有最小的影响或者根本没有影响。比较高的瞬时变化是信号中存在语音的可能标志,只要瞬时变化增加,那么对自适应率的修改就缓慢进行自适应。因为察觉到信号更可能是噪声而非语音,所以随着信号的瞬时变化的减小,自适应率乘数增加。因为一些噪声可能具有关于从大约5dB2到大约15dB2的方差估计的最佳配合线的变化,所以单位乘数位于范围内或者接近范围极限值。在图6中,单位乘数被置于大约8的估计方差。在替换增强系统中,单位乘数被置于大约10的估计的方差。
最大放大系数的范围是从大约30到大约50,或者可以被置于该范围的极限值附近。在替换增强方法中,最大乘数可以具有明显大于1的任何值,并可以例如利用在信号和噪声估计中所使用的频率单元(bin)而改变。放大系数的最大值可以随噪声估计的实际利用而变,平衡宽频带背景信号的瞬时平滑和自适应速度。标准的最大放大系数的范围在大约1到大约2量级内,其大于初始宽频带自适应系数。在图6中,在接近0的瞬时变化中最大乘数包括大约40的编程的乘数。
最小乘数包括其中任一个特定宽频带的瞬时变化比较大的点,可能表示声音或者高瞬态噪声的存在。随着宽频带能量估计的瞬时变化的增加,乘数减小。最小乘数可以具有从大约1到大约0范围内的任何值,或者接近该范围,具有的通用值在大约0.1到大约0.01的范围之内,或者接近该范围。在图6中,在接近大约80的方差估计处,最小乘数包括大约0.1的乘数。在替换增强系统中,最小乘数被初始化为大约0.07。
当每个宽频带的每一宽频带自适应系数都已经利用在瞬时变化逻辑812中编程或者配置的函数修改时,所修改的宽频带自适应系数通过乘法器乘以短暂时间逻辑814中的时间,所述短暂时间逻辑被编程或被设置有与宽频带信号估计已经大于宽频带估计噪声级预定级的时间数相关联的函数,其中所述预定级诸如大约2.5dB(例如短暂时间)。图7所示的放大系数被初始化为大约0.5的低预定值。这意味着当宽频带信号最初大于宽频带噪声估计值时所修改的宽频带自适应系数较缓慢地自适应。宽频带信号超出宽频带噪声估计值预定级越长,则在短暂时间逻辑814的时间中所编程或设置的函数中每一时间的局部抛物线状自适应得越快。短暂时间逻辑814中的一些时间可以被编程或配置成可以没有上限或具有很高的上限,以便所述增强系统可以弥补由另一个逻辑施加的宽频带自适应系数中不适当的或者不精确的减少,其中另一个逻辑例如在该增强系统800中诸如信号估计时噪声的逻辑810和/或瞬时变化逻辑812。在一些增强系统中,当不适当时,在信号估计时噪声逻辑810和/或瞬时变化逻辑812中编程或配置的反平方函数可以减少自适应乘数。这可能在宽频带噪声估计跳跃时发生,由信号估计时噪声逻辑810所执行的比较可以指示宽频带噪声估计值相差很悬殊,和/或当宽频带噪声估计不稳定时,仍仅包括背景噪声。
虽然在短暂时间逻辑814中可以编程或设置瞬时函数中的许多时间,然后在某些增强系统中选择和施加,但是图7中显示了短暂时间逻辑814的时间内编程或配置的瞬时函数的三个示例性时间。逻辑内函数的选择可以取决于增强系统的应用和宽频带信号和/或宽频带噪声估计的特征。在图7中大约2.5秒的位置,例如,瞬时函数中的较早时间自适应得比瞬时函数中的较晚时间快30倍。在短暂时间逻辑814内所编程或设置的一些函数可以通过公式7获得。
F=Min+(Slope*Time)2公式7在公式7中,Min是最小短暂自适应率,Time累积每帧宽频带大于预定阈值的持续时间,Slope是初始瞬时斜率。在一个增强系统中,Min被初始化为大约0.5,Time的预定阈值被初始化为大约2.5dB,Slope被初始化为大约0.001525,其中时间以毫秒计。
当已经由一个或多个形状相似性(所估计SNR的方差)、瞬时变化和短暂时间修改了每个宽频带的每一宽频带自适应系数时,任何宽频带的全部自适应系数都能够被限制。在增强系统的一种执行过程中,最大乘数被限于大约30dB/秒。在替换增强系统中,可以对最小乘数给以不同的限制来升降自适应,或者仅在一个方向上进行限制,例如限制宽频带的上升不快于大约25dB/秒,但是允许其下降差不多达到大约40dB/秒。
利用为每个宽频带所获得的修改的宽频带自适应系数,可能存在宽频带信号明显大于宽频带噪声的宽频带。因为该差异,在信号估计时噪声逻辑810和瞬时变化逻辑812中编程或设置的反平方函数未必总能精确地预测在那些高SNR频带中的宽频带噪声的变化率。如果一些邻近的低SNR宽频带中的宽频带噪声估计下降,那么一些增强系统可以判断高SNR宽频带中的宽频带噪声也将下降。如果一些邻近的低SNR宽频带中的宽频带噪声上升,那么一些或者相同的增强系统可以判断在高SNR宽频带中的宽频带噪声也可能上升。
为了标识趋势,一些增强系统监视低SNR频带以通过同等压力逻辑816来标识趋势。增强系统800的任选部件首先可以判断整个低SNR宽频带(例如,具有信噪比<大约2.5dB的宽频带)的最大噪声级。最大噪声级可以存储在存储器中。在另一个高SNR宽频带上利用最大噪声级可以取决于高SNR宽频带中的噪声是大于还是小于最大噪声级。
在每一个低SNR频带中,所修改的宽频带自适应系数被用于宽频带的每个元素单元(member bin)。如果宽频带信号大于宽频带噪声估计值,那么通过加法器增加所修改的宽频带自适应系数,否则利用减法器减去所修改的宽频带自适应系数。该临时计算可以供一些增强系统使用以预测当施加修改的自适应系数时宽频带噪声估计会有什么后果。如果噪声增加预定量(例如,诸如大约0.5dB),那么可以利用加法器将修改的宽频带自适应系数增加到低SNR增益系数平均值中。低SNR增益系数平均值可以是在具有低SNR的宽频带中的噪声趋势的标志,或者可以指示可以在哪里查找到关于宽频带噪声的最大量信息。
接下来,一些增强系统标识不考虑低SNR的宽频带,并且通过比较器在所述宽频带中宽频带信号超过宽频带噪声预定时间。在一些增强系统中,预定时间可以是大约180毫秒。利用同等压力逻辑816计算这些宽频带的每一个的同等系数和同等压力,并将其存储在与同等压力逻辑816相连接的存储器中。同等系数包括低SNR增益系数,同等压力包括对已经被贡献的宽频带数目的指示。例如,如果存在过6个宽频带并且除了1个之外的所有宽频带都具有低SNR,并且所有5个低SNR同等包括正在增加的噪声信号,那么一些增强系统可以断定高SNR频带中的噪声正在上升并具有比较高的同等压力。如果仅有1个频带具有低SNR,那么所有其他高SNR频带将具有相对低的同等压力。
利用所计算的修改的宽频带系数,以及利用所计算的同等系数和同等压力,一些增强系统计算每个窄频带单元的修改后的自适应系数。利用加权逻辑818,所述增强系统分配包括母带及其邻近频带的加权值的值。因此,当使用一个示例性的三角形加权函数时,如果一个单元位于两个宽频带的接界,那么其可以从左边频带接收一半或者大约一半的宽频带自适应系数,以及从右边频带接收一半或者大约一半的宽频带自适应系数。如果单元几乎处于宽频带的正中心,那么其可以从母带接收全部或者几乎全部的权重。
首先频率单元可以接收正自适应系数,其最后被加到噪声估计中。但是如果窄频带单元中的信号低于宽频带噪声估计值,那么可以令窄频带单元的所修改的宽频带自适应系数为负。利用为每个频率单元自适应系数所确定的正负特征,利用具有同等压力比的单元自适应系数来调合同等系数。例如,如果同等压力仅为1/6,那么由其同等判断指定单元的自适应系数仅为1/6th。利用为每个窄频带单元(例如,每个单元的正负dB值)确定的每一自适应系数,可以表示矢量的这些值通过使用加法器被添加到窄频带噪声估计中。
为了确保精确度,某些增强方法可以通过比较器确保窄频带噪声估计不在诸如大约0dB的预定基底之外。某些增强系统将窄频带噪声估计转换为振幅。虽然可以使用任何系统,但是所述增强系统可以通过查找表格或宏命令,组合,或者另一个系统来执行转换。因为某些窄频带噪声估计可以通过dB的中值滤波器来度量,并且在先的窄频带噪声振幅估计可以以振幅被计算为平均值,所以当前窄频带噪声估计可以通过能级偏移器移动一预定能级。一种增强系统可以利用用于偏移窄频带噪声估计的能级偏移器临时将窄频带噪声估计偏移预定数量,诸如大约1.75dB,以便同也可以基于其他阈值的在先窄频带噪声估计的平均振幅相匹配。当集成在降噪模块中时,所述偏移是不必要的。
窄频带噪声的能量可以被计算作为振幅的平方。对后续的处理而言,窄频带频谱可以复制到先前的频谱或者存储在供统计计算使用的存储器中。作为结果,窄频带噪声估计可以被计算并被以dB、振幅或者功率来存储,从而供任何其他系统或者系统来使用。某些增强系统也将宽频带结构存储到存储器中,因此其他系统和系统可以访问宽频带信息。在一些增强系统中,例如,声音活动检测器(VAD)可以通过导出暂时平滑、加权宽频带SNR的方差的和的方式来表明在信号内存在语音。
在替换增强系统中,上述增强系统还可以通过瞬时惯性逻辑来修改宽频带自适应系数、宽频带噪声估计和/或窄频带噪声估计。该替换系统可以根据认为像车辆噪声这样的某些背景噪声具有惯性的思想来修改噪声自适应率和噪声估计。如果宽频带或者窄频带噪声例如没有改变超过预定数目的帧,诸如大约10帧,那么就可以令随后的帧保持不变。如果噪声已经增加超过预定数目的帧(例如10帧),那么在某些替换增强系统中下一帧可能甚至更高,并且瞬时惯性逻辑增加该帧中的噪声估计。并且,如果在噪声已经下降预定数目的帧之后(例如大约10帧),那么某些增强系统可以将所修改的宽频带自适应系数修改得比所述噪声估计更低。该替换增强系统可以从先前预定数目的帧中外推以预测当前帧内的估计值。为了防止过冲,某些替换的增强系统还可以对自适应系数的增加或者减小进行限制。该限制可以发生于测定值,诸如振幅(例如以dB计)、速度(例如以dB/秒计)、加速度(例如以dB/秒2计)或者以任何其它度量单位。当有人一边行走一边说话时,诸如当加速的车辆中的司机说话时,这些替换增强系统可以提供更精确的噪声估计。
其它的替换增强系统包括如上所述的结构和功能的组合。这些增强系统由如上所述或者在附图内所举例说明的结构和功能的任意组合组成。该系统可以在包括软件或电路的逻辑中实现,所述软件包括程序所执行的算术和/或非算术操作(例如,分类、比较、匹配等),所述电路处理信息或者执行一个或多个功能。所述硬件可以包括一个或多个控制器,电路或者处理器或者组合,其具有易失性和/或非易失性存储器或者同易失性和/或非易失性存储器相连接,并还可以包括通过无线和/或硬连线介质到外围设备的接口。
增强系统能够很容易地适合于任何技术或设备。一些增强系统或组件如图9所示同车辆相连接,如图10所示能够公开或者私人可访问的网络,将声音及其他语音转换到可以被传送到远处的形式的工具,诸如如图11所示的陆上线路和无线电话,视频系统、个人降噪系统、像导航系统之类的话音激活系统、及其他对噪声敏感的移动或者固定系统。通信系统可以包括便携式模拟或者数字音频和/或视频播放器(例如,诸如iPod),或者包括或接合语音增强系统的多媒体系统,该多媒体系统在诸如袖珍式超轻硬盘驱动器的硬盘驱动器上、在诸如闪速存储器之类的存储器上、或者存储并检索数据的存储介质上保存语音增强逻辑或软件。所述增强系统可以同便携产品或者附件相连接或者可以整合到便携产品或者附件中,诸如眼部用品(例如眼镜,护目镜等),其可以包括用于无线通信和音乐听取(例如蓝牙立体声或者伴音技术)夹克、帽子或者其他实现或者简化了免提接听或者免提通信的衣服的无线连接。所述逻辑可以包括离散电路和/或分布电路或者可以包括处理器或者控制器。
增强系统通过改善的噪声估计来改善在重建和未处理的语音之间的相似性。增强系统可以迅速适应噪声中的突变。系统可以在连续或者间断的语音期间跟踪背景噪声。一些系统在噪声很稳定的高信噪比条件期间非常稳定。一些系统具有低计算复杂性和内存需求,这可以最小化成本和能源消耗。
虽然已经描述了本发明的各种各样的实施方式,但是对本领域普通技术人员来说在本发明的范畴内存在很多实施方式和执行过程。因此,本发明只受到所附权利要求及其等效内容的限制。
权利要求
1.一种用于估计来自接收信号的噪声的增强系统,包括频谱监视器,可操作用于以多于一个的频率分辨率对接收信号的一部分进行划分;全局自适应逻辑,可操作用于导出所述接收信号的噪声自适应系数;多个逻辑设备,被编程用于跟踪所述接收信号中所估计噪声的特征,并修改以第一频率分辨率进行划分的信号的部分的多个噪声自适应率;应用于所述接收信号中所估计噪声的一个或多个跟踪的特征的加权逻辑,所述加权逻辑可操作用于导出与预定阈值相比较时表示语音存在的值;以及限制逻辑,可操作用于约束所修改的多个噪声自适应率。
2.根据权利要求1所述的系统,其中所述频谱监视器被配置成以至少两个频率分辨率对所述接收信号的所述部分进行划分。
3.根据权利要求1所述的系统,其中多个逻辑设备中的一些逻辑设备将不精确变化补偿至所修改的多个噪声自适应率。
4.根据权利要求1所述的系统,其中多个逻辑设备之一包括信号估计时噪声的逻辑。
5.根据权利要求1所述的系统,其中所述多个逻辑设备之一包括瞬时变化逻辑。
6.根据权利要求1所述的系统,其中所述多个逻辑设备之一包括短暂时间逻辑。
7.根据权利要求1所述的系统,其中所述多个逻辑设备之一包括同等压力逻辑。
8.根据权利要求1所述的系统,其中所述多个逻辑设备之一包括可操作用于通过惯性预测来检测频谱改变的设备。
9.根据权利要求1所述的系统,其中所述多个逻辑设备包括信号估计时噪声逻辑、瞬时变化逻辑、短暂时间逻辑、同等压力逻辑或瞬时惯性逻辑。
10.根据权利要求1所述的系统,其中所述加权逻辑被配置成或安排成具有三角形或者矩形加权函数。
11.根据权利要求1所述的系统,其中所述加权逻辑包括A-加权逻辑和平滑单元,其可操作用于瞬时地平滑信号估计时噪声,并导出用于指示语音存在的指示信号。
12.根据权利要求1所述的系统,还包括与所述频谱监视器连接的车辆。
13.根据权利要求1所述的系统,还包括与所述频谱监视器相连接的话音激活系统。
14.一种可操作用于估计来自接收信号的噪声的增强系统,包括频谱监视器,可操作用于将接收信号的一部分划分为宽频带和窄频带;全局自适应逻辑,可操作用于导出所述接收信号的噪声自适应系数;配置有反平方函数的第一和第二逻辑,可操作用于根据方差修改多个噪声自适应率;短暂时间逻辑,可操作用于根据瞬时特征修改多个噪声自适应率;同等压力逻辑,可操作用于根据趋势特征和所修改的噪声自适应率来修改所述多个噪声自适应率和窄频带噪声估计值;以及瞬时惯性逻辑,可操作用于根据所预测的自适应趋势来修改所述多个噪声自适应率和窄频带噪声估计值。
15.根据权利要求14所述的系统,其中所述第一逻辑包括信号估计时噪声逻辑。
16.根据权利要求14所述的系统,其中所述第二逻辑包括瞬时变化逻辑。
17.根据权利要求14所述的系统,其中第三逻辑包括短暂时间逻辑。
18.根据权利要求14所述的系统,其中所述瞬时特征包括宽频带信号估计值已经超出宽频带噪声估计值一预定级的时间量。
19.根据权利要求14所述的系统,其中所述同等压力逻辑包括加权逻辑。
20.一种可操作用于估计来自接收信号的噪声的增强系统,包括频谱监视器,可操作用于将接收信号的一部分划分为宽频带和窄频带;标准化逻辑,可操作用于将所述接收信号的估计转换为近似正态分布;全局自适应逻辑,可操作用于导出所述接收信号的噪声自适应系数;以及用于根据反平方函数和瞬时特征修改宽频带噪声自适应率和窄频带噪声估计值的装置。
21.一种可操作用于估计来自接收信号的噪声的增强方法,包括将接收信号的一部分划分为宽频带和窄频带;将对所述接收信号的估计标准化为近似正态分布;导出所述接收信号的噪声自适应系数;根据方差修改多个噪声自适应率;根据瞬时特征修改所述多个噪声自适应率;以及根据趋势特征和所修改的噪声自适应率来修改所述多个噪声自适应率以及窄频带噪声估计值。
22.根据权利要求20所述的增强系统,其中所述方差与反平方函数相对应。
全文摘要
本发明提供一种增强系统改善对来自接收信号的噪声的估计。该系统包括频谱监视器,其将部分信号划分为多于一个的频率分辨率。自适应逻辑导出接收信号的噪声自适应系数。多个设备跟踪接收信号中所估计噪声的特征,并修改多个噪声自适应率。加权逻辑将源自于划分为第一频率分辨率的信号的修改噪声自适应率施加到划分为第二频率分辨率的信号。
文档编号G10L21/02GK101071567SQ20071010299
公开日2007年11月14日 申请日期2007年5月8日 优先权日2006年5月12日
发明者P·A·赫瑟林顿 申请人:Qnx软件操作系统(威美科)有限公司