专利名称:减少话音通信网中残余远端回声的方法和设备的制作方法
技术领域:
本发明涉及处理通信网中话音信号的技术,更具体地是涉及处理远端回声的抑制的方法和设备。
早已知道在许多话音通信网中,远端有一种令人烦恼的趋向,把他的话音传输的延迟复制品返回到近端扬声器。当这种现象发生在延迟时间约为40ms或更多时,这种远端回声更是特别麻烦,因为在这种延迟时间,回声容易使近端扬声器明显地感觉为干扰噪声。因此,对于需要相当大的延迟的那些网络,远端回声造成了特别严峻的问题。这包括卫星网络,以及至少某些实行话音编码和太缩的网络。
事实上,能使远端扬声器抑制或作非故意返回近端的近话音分量的装置是可以得到的。可是还是会有远端扬声器不使用这种装置的情况,此外,即使在远端使用了这种回声抑制或回声消除装置,或许也不会完全有效地消除回声。因此,在许多情况下,至少将会有残余回声返回到近端。
因此,对于近端扬声器通常希望操纵一个能减少那些近语音分量的装置,该分量是通过远程通信网往返回程后返回到近端扬声器的。
早期用于减少回声的非线性处理器在O.M.Mracek Mitchell和D.A.Berkley的论文中作了说明,论文的题目是“一个使用中心限幅的全双向回声抑制器”发表于贝尔系统技术杂志50(1971)1619-1630页。当这篇论文发表时,回声消除器尚未使用。在该论文中,作者说明了一个分频带中心限幅器用作一个独立装置来取代在远(即接收)端常规的(在发表的当时)回声抑制器。这个中心限幅器不能适用于有实际回声延迟的情况。
授予Younce等人的美国专利No.5,274,705,说明了运用远(接收)端的一个装置抑制残余回声的最新成果。用传统回声消除器不能完全消除的回声可进一步用一个非线性处理器来消除。在这个非线性处理器中,背景噪声电平的估值用来设置一个全频带的噪声透明度阈值。发送低于此阈值的传输是为了掩蔽残余回声,并避免背景噪声的不自然的声音阻断。这个技术是根据估计的回声路径的增益并使用回声复制中的能量来建立一个用于全频带中心限幅的时变阈值。
在某些情况下,Younce技术或许不能实现满意的回声抑制。例如,经受住中心限幅处理的残余回声将扩展到全部频带,即使在非常低的信噪比的情况下,也可能识别为话音(因此形成干扰)。此外,全带噪声透明度是不利的,因为窄带噪声,如电源线路交流声将会在整个频带趋向于提高噪声透明度阈值,这可能引起不希望的回声传输,而回声只在有限的频率范围内被噪声掩没。
这个领域的专业人员已经认识到位于近(发送)端的一个装置如果它能补偿由于通过本地和远程网的往返回程由回波传输所引起的延迟,则该装置就能用来减少远端回声。例如,J.Portelli提出的国际专利申请PCT/AU93/00626(国际刊物WO94/14248),说明了在近(发送)端常规的回声消除器的使用。由于在近话音的传输和要消除的回声的到达之间可能有实际上的延迟,在安装前,这个回声消除器与一个已编程的延迟装置一起工作来提供一个固定的补偿性的延迟。在回声消除器中,一个全带自适应横向滤波器产生一个相减的回声复制。然而,某些因素可能会妨碍这个系统提供一个完全满意的补偿。例如,回声复制的精度就受到线路噪声的限制,这可能减少回声消除器的有效性。此外,本地和远程网间的线路倍增或压缩设备能使回声信号部分发生失真,引向不完善的抑制。由于相位滚动(例如,由于模拟传输设备),或由于量化噪声以及数字传输系统中话音编码器引起的非线性等,这个系统也可能具有恶化的性能。
所以,回声控制领域的专业人员至今还不能提供一个可用于本地网来减少残余远端回声的完全满意的方法。
我们已发明了一种改进的能在本地网内实行的非线性处理的设备和方法。我们的方法对于减少来自远程通信网的残余回声是非常有效的,即使在回声返回时带有大的传输延迟。对于线路噪声和可能由远程非线性处理引入远程网的失真我们的方法都是强有力的。而对于相位滚动以及可能使常规回声消除器的收敛恶化的各种常遇到的问题,我们的方法也可使其相对地不太敏感。
从广义上,我们的发明包括减少话音通信中的回声,这是从远方传输到一个网络,并且从近方网络接收到的回声。(“远”和“近”两个词不受限制,它不意味着双向通信路径的相对端。在本文几个地方, “本地”可代替“近”而“远程”可代替“远”)。
按照本发明的实践,概括地说,传输到近位置网络的信号被一个合宜的信号处理装置接收到作为“近输入”。从远方传输到网络的信号被相同的处理装置接收到作为“远输入”。比较近输入和远输入,因而产生一个称为“回声路径延迟”量的值EPD。EPD是含有相同信息的近输入和远输入那些部分间相对时延的一个度量。
近输入经历一个等于EPD的延迟,因而在时间上匹配近输入和远输入信号。然后近输入和远输入各自分别地被分解为多个分频带分量。
然后从近输入的每个分频带分量中引出一个模信号。也就是说,这些分频带信号的每个信号的绝对值得以平滑,结果产生个比例于分频带信号rms能量包络的波形。这些波形的每一个按照回声损耗估值得到衰减。总的波形,下面称为“样板”,表示所预期回声波形的包络。
远输入的每个分频带分量经过一个中心限幅操作,试图消除假定是回声的微弱信号。样板是用于鉴别这些微弱信号的阈值(由于下面说明的理由这里称为“高阈值”)。也就是说,如果远输入分频带信号的每个信号超过了它的相应样板的同时发生的值,那么它至少将部分地被发送。
中心限幅后,远输入分频带分量得到组合,因而产生一个合成的全频带的输出信号。
本发明的优选实施例包括一个这里称为“低”阈值的第二阈值。一个低阈值是用来抑制有时称为“噪声泵送”的令人烦恼的背景效应。这是发生在线路噪声或来自远端的其他背景噪声受到近端话音调制的时候,这时产生的间断声音可能象往复运动泵的声音。在限幅操作后注入一个受控的噪声量来掩蔽这个效应是大家熟知的。然而,注入的噪声通常不能很好地匹配实际背景噪声的频率分布,因此很少有完全有效的掩蔽效果。
通过对比,在我们优选的方法中,我们设置一个中心限幅器来传输低于低阈值(它表示噪声的最低限度)的分频带分量。因为低阈值是对于每个分频带分量分别确定的,所以,即使存在有窄带噪声的情况,也可能实现对实际噪声谱的良好匹配。
每个低阈值是从远输入的一个相应分频带分量引出的。运用一个缓慢上升、快速衰减的平滑器使远输入信号的绝对值得以平滑。这个过程产生了一个分频带噪声最低限度的估值,并设置它等于低阈值。那些降到低于此低阈值的相应的远输入分频带信号被中心限幅器发送并组合成全频带输出信号。
图1描述一个通信网一般的结构特点,它包括回声控制装置的常规应用。
图2以概括的形式说明在一个通信网中残余远端回声控制(RFEC)系统的应用。
图3是在按照本发明的一个实施例中一个回声控制系统的简图。
图4是由图3分频带信号处理块所实现的功能的简图。
图5是在按照本发明的一个实施例中一个中心限幅器的传递函数图。
图6是在按照本发明的一个实施例中测量回声路径延迟过程的简图。
图1的通信网包括一个本地网10,一个远程网20和互连网络干线30。每个网10,20通常包括一个电话混合器32,以及一个或多个接线器或交换机34。互连网络干线可能包括国内和国际网络间的通信链路,还可能包括往来于通信卫星的链路。用于长途通信的通信网络通常还将包括利用话音编码或话音压缩的其它处理来减少传输带宽的电路倍增系统40。本地和远程网络还可能包括常规的回声控制系统50,55。例如,在远程网络中,系统55用来减小近端话音(起源于本地系统),这是通过远程网络再循环并且返回到近端扬声器,作为他自己声音的回声。
至少在某些情况下,可能没有这样的系统55,或者该系统不能胜任减少回声的任务。在此情况下,使用一个按装在本地网内残留的远端回声控制(RFEC)的系统可能对于近端扬声器是有利的。如图2所示,对于进一步减小从远端返回到近端扬声器的回声一个RFEC系统60是有利的。
图3所描述的是一个RFEC系统,它处理全频带近端话音信号y(n)和全频带远端话音信号x(n)(变量“n”表示一个离散化的时间度量)。该系统有利于在数字信号处理器上实现。
在图中的方框100,该系统评价一个量EPD(n),它是发送的和返回的近端信号间回声路径延迟的估值。如下所述,在导出EPD(n)的中间步骤包含计算近端和远端信号的全频带,平均的谱能量。在发送的和返回的信号间一个任选的损耗测量可以容易地从远端谱能量对近端谱能量的比导出。在此比例中,由于估计的回声路径延迟,近端谱能量是延迟的。
这个任选的损耗测量很好地图示在图6的方框425内。损耗测量可以用于调节要加在样板(见下面)上的衰减量,也可用作控制信号来确定图3的方框130中分频带信号处理何时工作。
在方框110中,输出的近话音带分接头的部分受到EPD(n)延迟的控制,产生一个延迟的全频带近话音信号y〔n-EPD〕。这个延迟的信号用来产生样板,前已指出,它表示衰减后所预期的回声包络。
在方框120,延迟的近话音信号被分解为编号从1到M的许多频率的分频带。每个分频带信号,示范性地如第K个分频带信号yak(n),是分别地受到分频带信号处理。如图所示,每个分频带信号是在相应的处理方框130中得到处理。在现在优选的实施例中,由频率分析方框120所代表的处理器是带有采样率减少的多相分析滤波器组,它产生抽取的分频带信号。
多相滤波器组的使用是特别有吸引力的,因为它提供了相当高的计算效率。这些滤波器组在技术上是众所周知的,在这里无需详细说明。这方面一本有用的参考书是P.P.Vaidyanathan,“多速率系统和滤波器组”,第8章,Prentice Hall,1993。
我们现在优选的方法使用了余弦调制滤波器组,它们是在计算有效的多相结构中实现的。这个方法导致简单的设计,相对低的计算要求,以及优良的频响特性,它使在全频带信号的重建上有极小的失真。这方面一篇有用的参考文献是K.Nayebi等的论文,“高计算效率的FIR分析-综合滤波器组的设计”发表在IEEE.信号处理论文集42(1994年4月)。
作为一般情况,我们相信个别频率分频带的选择性调节比起为减小回声采用常规全频带非线性处理器所完成的情况能得到更高的工作稳定性,更好的话音质量。此外,分频带方法有更大可能性给出全双向连接的效果,因为对于远端扬声器最有效的频带可能不同于本地扬声器回声的频带。更进一步,即使没有上述的次阈值噪声透明度的特点,噪声泵送效应对于分频带比对于全频带处理更不显著。
在方框140中由分解远输入信号X(n)得到的M分频带信号也在相应的方框130中进行处理。在现在的优选实施例中,方框140代表的处理器也是一个带有采样率减少的多相分析滤波器组,它产生抽取的分频带信号。对于每个K值(假设K是从1到M的整数值),第K项分频带远端信号Xak〔n〕在方框130中受到中心限幅控制,这取决于分频带远端信号和样板同时值的比较。
分频带处理方框130的每个输出是一个分别经过处理的分频带信号Xek〔n〕。M个经过处理的分频带信号在频率合成方框150中再组合以产生一个全频带输出信号Xpo〔n〕。在现在的优选实施例中,方框150的处理器是一个多相综合滤波器组。对这类滤波器组已有描述,例如在上述的Vaidyanathan和Nayebi等人的著作中。
在方框135,可任选地采用全频带话音检测器,当检测远话音时,它使方框130的分频带处理不能工作,而在其他时间,它使分频带处理能够工作。这些使能和使不能的功能典型地通过合宜地设置一个具PERMIT状态和DEDY状态的标志来实现的。回声损耗的一个全频带估值可能是有用的。在这方面,用于确定输入X〔n〕中的能量何时是实际的远话音而不是近话音的回声。也就是说,和单独根据回声损耗的预期值相比,如果x〔n〕的能量包络能代表y〔n〕延迟能量包络的更多的部分,则X〔n〕,可归入远话音而不是回声。图中所示方框135具有一个信号输入,它代表这种回声损耗估值。适当的估值可由图6的方框425提供。
一个现在优选的用于此目的的话音检测器可从GSM06.32VAD标准得到,该标准在论文“用于泛欧数字蜂窝移动电话业务的话音活动性检测器”中已有说明,论文作者D.K.Freeman等,发表在IEEE Conf.ICASSP,1989,S7.6节,369-372页。这个话音检测器是优选的,因为已知它在噪声存在时工作是可靠的。可是,技术上熟知的其它话音检测器也容易地用于此目的。
根据本发明现在优选的实施例,现在将参考图4对方框130中抽取的第K项分频带信号Yak〔n〕和Xak〔n〕的处理作更详细的说明。
在方框200中,近端信号波形Yak〔n〕的幅度是确定的并传递到方框210。类似地,在方框220中,远端信号波形Xak〔n〕的幅度是确定的并传递到方框230。方框210和230的每一个代表一个峰值保持的、带有相对快速上升时间和缓慢衰减的平滑操作。至少在方框210中,希望该衰减近似于所预期的回声混响尾部。
典型地,方框210的经平滑的输出Ybk〔n〕可用递归平均来表示如果|Yak〔n〕|≥Ybk〔n〕(上升情况)Ybk〔n〕=A2·|Yak〔n〕|+(1-A2)·Ybk〔n-1〕;如果|Yak〔n〕|<Ybk〔n〕(下降情况)Ybk〔n〕=A3·|Yak〔n〕|+(1-A3)·Ybk〔n-1〕,这里选择A2近于一以保证一个快速上升时间,选择A3具有40-50ms时级的延迟。
我们已发现我们的系统能够作成对于估计回声路径延迟的误差较少敏感,这是由于给Ybk〔n〕公式增加一个规定,在一个预定的保持期间保存Yak〔n〕中的峰值的缘故。通常为20-40ms的这个保持期间通过远程网优先地设置给预计延迟。在我们现在优选的实施例中,所用的保持的规定是根据以下原则(i)如果是上升情况,则更新Ybk〔n〕并开始一个保持期间;(ii)如果是下降情况,只在最后保持期间已经期满时更新Ybk〔n〕。
对于预期的回声路径损耗EPLk〔n〕的随意调节在方框240内进行。关于这点应该注意,在传统的中心限幅器中,最小预期损耗的固定值是预定的。在远程通信网内用于残留回声控制的目的这个值通常约为18dB。例如,假若样板能量电平表明有可能超过所接收的回声信号的实际能量电平,则在这个预期的损耗数字上作调整可能是很有利的。
我们现在的作法就是预先决定一个固定通过全部分频带的最小预期损耗,它通常为10-12dB,并且设置EPL等于这个值。通过监测互连网络干线经过一个适宜的时间长度,从所取得的网络测量结果就能很容易地确定这个损耗值。
可是,至少在某些情况下,可能希望对于每个频带K使用不同的固定的EPLK值。这就允许损耗值的形成例如是根据感性标准或网络测量的结果。
另一方案是自适应地确定EPL〔n〕,或是通过全频分频带,或是分别在各自的分频带内。根据这个方案,由于损耗计算结果导出的EPL调节量预定的量小预期损耗可作为EPL的低端边界。以上讨论的是一个适宜的全频带损耗计算。
在另一方案里,损耗可通过有效地探测具有已知信号的远程网并分析其返回的回声来确定。
在方框250内,来自方框210的近端包络乘上损耗估计值以产生一个波形跟踪阈值CL1K〔n〕CL1k〔n〕=EPL〔n〕+Ybk〔n〕在方框230内,对远输入以类似于方框210内对近输入平滑的方式进行平滑。已平滑的远输入信号可用于实现方框240的任意损耗调节,并可用于实现方框260和265的噪声最低限度的估计,这将在下面说明。
方框230的已平滑的输出Xbk〔n〕典型地可用递归平均值来表示如果|Xak〔n〕|≥Xbk〔n〕Xbk〔n〕=A4·| Xak〔n〕|+(1-A4)·Xbk〔n-1〕如果|Xak〔n〕|<Xbk〔n〕Xbk〔n〕=A5·|Xak〔n〕|+(1-A5)·Xbk〔n-1〕,这里选择A4近于1以保证快速上升时间,而选择A5具有40-50ms量级的衰减时间。
方框230的输出Xbk〔n〕代表一个已平滑的远端包络,它在方框260内进行处理以产生一个来自远程网的噪声电平的估计算XCk〔n〕。作为例子,方框230输出Xbk〔n〕服从下式定义的递归平均值如果|Xbk〔n〕|≥Xck〔n〕Xck〔n〕=A6·|Xbk〔n〕|+(1-A6)·Xck〔n-1〕如果|Xbk〔n〕|<Xck〔n〕Xck〔n〕=A7·|Xbk〔n〕|+(1-A7)·Xck〔n-1〕,这里选择A6是相当小以保证一个缓慢的上升时间,而选择A7有一个量级为1-5ms的很短的衰减时间。
从远端噪声估计值Xck〔n〕,得到一个波形跟踪低阈值(即一个噪声最低限度),如图4方框265中所示。作为例子,这个阈值可将噪声估计算与一任意标度因子NFACk〔n〕相乘而导出,通常假定这个因子的值在0.5和1.5之间。此外,阈值CL2k〔n〕被有利地限制在决不超过预期的回声电平。因此,一个典型的低阈值由下式确定CL2k〔n〕=min(NFA Ck〔n〕×XCk〔n〕,CL1k〔n〕)我们已经发现如果远输入仅包含噪声而不含有话音时才进行平滑Xak〔n〕和Xbk〔n〕,则噪声最低限度估计值还可进一步改善。方框135的远端话音检测器可容易地用来区分话音(或回声)所在位置以及仅有噪声的位置,因而,噪声最低限度估计值在第一情况是无效的,而在第二情况是有效的。
在方框270中,远端分频带输入信号Xak〔n〕受中心限幅的控制。根据本发明现在优选的实施例,每当输入信号的绝对值处在阈值CL2k〔n〕和CL1k〔n〕+CL2k〔n〕之间,则该信号受到衰减,但是如果该信号或者(1)处在CL1k〔n〕+CL2k〔n〕之上,或者(2)处在CL2k〔n〕之下,则该信号可以无衰减地通过。
我们现在优选的中心限幅器的传递函数示于图5。从图显然可见,如果该信号绝对值小于低阈值CL2或大于高阈值CL1+CL2(图中为简略计,注脚K和量化时间n的明显关系已被略去),则这个限幅器基本上可无衰减地通过该输入信号。然而,在这些阈值的中间区,输入信号被限制在一个平坦的输出电平CL2。
我们已经观察到当噪声在一给定的分频带K内相当高时,某些减小的和失真的回声可由中心限幅器在分频带中传输。为了掩蔽这些回声分量,我们发现,将所传的分频带信号与白噪声分量(即在给定的分频带K内有一平坦频谱的噪声分量)相混合是有益的。根据我们现在优选的方法,一个分频带信号电平(1-FFAC)×Xak与一个白噪声电平FFAC×CL2k〔n〕相混合。我们通常选择FFAC的值在25%-50%的范围内。由于所增加的噪声频谱只在每个分频带内是平坦的,所以总的合成的全频带输出将全近似于全频带噪声频谱。
在方框275中,一个任选的后平滑功能消除了限幅器270输出的寄生脉冲。根据类似于中值滤波器的一个后平滑过程。作出决定在远端话音期间是否存在信号Xdk〔n〕的电流采用。如上述,这个决定是根据话音检测器320的输出连同损耗测量一起作出的。如果没有远端话音,并且电流信号区段包含信号的限幅采样所限制的分离的峰值,则整个区段受到限幅。另一方面,如果检测到远端话音,则已限幅的值在整个区段中复原。为此目的,现在优选的区段大小约为10-20ms。
另外,方框275可提供对于仅包含噪声的限幅的远端信号那些区段的进一步衰减。
如上所述,回声路径延迟的全频带估值EPD〔n〕是在图3的方框100内进行计算。现在参考图6来讨论计算这个延迟的现在优选的方法。这个方法是基于频域相干度量的计算。这个度量由近端和远端信号自动谱的周期图估值以及它们相应的交义谱的周期图估值来评价。这个方法G.Clifford Carter编辑的论文“相干和时延估计”中说明,IEEE出版社出版,1993年。然而,和常规方法不同,我们的方法计算相干度量,并在从时域反回频域进行反FFT变换之前,以归一化的能量度量结束。比起Carter说明的全估值的方法这种改进的方法在时间估计上精度较小,但它降低了我们的计算要求和存贮器的使用,并且可以满足我们现有的目的。
近端输入y〔n〕和远端输入x〔n〕是分别在图内方框300和310中实时接收的,相应地这些输入信号被分段为重叠的区段。像汉明宫那样的一个时间宫在每个区段内对样本加权。我们现在优先采用240个样本的区段尺寸,重叠33%即80个样本。
延迟计算是用来仅在近端话音上而且是在假定含有近端话音回声的那部分返回远端信号上进行的。因此,只在检测出近端话音信号时,才开始延时计算。为此目的,当话音检测器确定近端用户正在讲话时,它就给出一个“前进”信号。我们现在采用一个话音检测器它使用一个简单的能量测量来识别来自近端的话音活动。这种话音检测器在技术上是熟知的,因而无需在此详细说明。
在预期没有回声的间隔期间,希望避免不需要的计算。跟随近话音已知脉冲开始的所有回声,预期将会在某些时期内发生。我们选择期间T2来代表这个期间,它通常约为1000ms。此外,预期第一回声发生在某些最小传输延迟之后。我们选择期间T1来代表这个延迟。虽然可任意地将T1设置为0,但我们更愿使用一个非零(有限)值,通常约为150ms。
期间T1和T2存贮是计时器330内。相对于过程中现在的近端区段,这个计时器将远端信号的处理限定在得到T1和T2间延迟期的那些远端区段。
当话音检测器320确定了第K项近端信号区段的话音能量超过了预置的阈值时,则话音检测器发出前进信号。在响应中,将近信号区段装入零,并将它用快速付利叶变换(FFT)变换为一频域信号Y(f),如图内方框340所示。作为例子,我们现在希望使用长度为256个点的FFT并要求填入16个零。取Y(f)的模平方即组成|Y(f)|2,就得到了近端信号的自动谱,如图中方框350所示。
同样地,在近端话音检测后,在T1和T2毫秒间接收的哪些远端信号区段也填入零并须经过FFT360,它和FFT340有同样大小。可是,这个远端频域信号是在变化的时间延迟τ的许多离散值的每个值上计的,τ处在T1到T2的间隔内。连续的τ值例如由160个样本(区段长度的2/3)所分离。总的频域信号表示为X(τ,f)。。远端自动谱(对于每个离散延迟τ)通过取模平方|X(τ,f)|2组成,如图中方框370所示。
对于T1和T2间每个延迟的区段组成交叉谱,如图中方框380所示。这个交叉谱是近端频域信号与远端频域信号复数共轭的乘积。和远端自动谱一样,这个交叉谱YX*(τ,f)与延迟τ有关。
我们不断地更新整组的谱Y(f),X(τ,f),以及YX*(τ,f)。根据我们现在优选的方法,在近端话音的每J个检测区段后,产生一个经平滑的周期图估值,设置J等于25。每个所得到的非周期性的周期图在全部J个检测的区段是自动谱和交叉谱的平均值(典型的直接平均)。下面,得到的平均谱分别地用SY(f),SX(τ,f)以及SYX(τ,f)来表示。
近端自动谱的平均示于图中方框390。远端自动谱的平均示于方框400中,而交叉谱的平均示于方框410中。
为了增加这个方法的速度和减少存储器的要求,对自动谱和交叉谱的频率监测是很有益的。可容许的抽取程度将取决于近端话音的所期望的谱平滑性。在我们现在的试验中,我们使用谱抽取因数为2,话音频带跨度为187-3187Hz,但我们相信话音频带187-2000Hz可能是合宜的。
在J个近端话音区段每个序列的尾部,对每个延迟值τ组成一个平方的相干度量,如图方框420所示,这个度量可由下式表示C(τ,f)=|SYX(τ,f)|2SY(f)×SX(τ,f)]]>这个归一化的平方的相干度量在有关的抽取的谱带(现在是187-3187Hz应用于有关的电话话音)范围内相加以产生一个取决于离散时间延迟τ的相干能量函数C(τ)。频率相加过程示于该图的方框430中。
如图的方框440中所示,C(τ)经历一个过程以求出该函数的峰值。这个过程确定回声路径延迟EPD。如同那个离散值τ,那里C(τ)有一局部峰值。当接收到另外的信号区段时,再计算平方的相干度量。这允许所估计的回声路径延迟在全部通话时间内受到跟踪。可能出现多于一个EPD的情况,每个EPD按照C(τ)的本地阈值受到检测和跟踪,该阈值高于一个予前规定的检测阈值。
在延迟估值或估计EPD时,如果需要更大的精度,可对函数C(τ)进行反付利叶变换,并对总的自相关估值寻求在每个离散τ的子区间内最大值的时间位置。对于我们已采用的区段大小和重叠,为了得到EPD的足够延迟精度,看来没有必要通过这最后的的变换过程来进行延迟计算。C(τ)的和有足够的测试度量来检测EPD。
有意义的是,确定C(τ)至少有一个局部峰值本身表明回声是存在的。因此,这个回声延迟测量技术本身就能成为通信系统中回声检测器的基础。
在经受某些延迟后到达的回声的各种通信系统中,我们的发明将是很用处的,这个延迟通常将包括由于通过回声路径的传播时间引起的分量。可是,在某些应用中,或许有更多的甚至是主要的由于信号处理引起的分量。这类延迟包括峰窝通信系统和电话会议系统中的编码延迟。我们相信我们的发明在这些应用中将是有益的。
特别是,我们相信我们的发明在和远端的会议通信设备(例如一个扬声器电话或一个电话会议系统)的连接中是有益的。在这方面,我们的发明对于消除残余回声是有价值的。该回声是由于在会议通信设备中不完善的回声消除所引起的。
当我们的发明是用来减少国际电话呼叫中的回声时,本文所说明的要进行信号处理的一个优选的地点是在国际交换中心内,并优选在国际干线线路上刚好在国际接口局外的一点(即在国际端上)。这就将处理设备安放在唯一的传输点上,它用于通过往来于该干线线路的所有电话呼叫。
当我们的发明是用来减少国内峰窝电话呼叫中的回声时,设置该处理设备的一个希望的方法就是将它与链接到峰窝管理处的干线相连接。
当我们的发明是用来减少国内卫星链路中的回声时,将该处理设备连接到来自卫星的接收信道是有利的。
作为实例,本发明的工作原型运行在Analog Devices ADSP-21020数据信号处理器上。然而应该注意,即使实际上更小计算能力的信号处理器也可有效地使用作为这里所说的方法中的主机。
权利要求
1.用于在第一网接收的来自第二网的通信信号中(上述接收的信号称为FAR-1N信号),减少来自第二网并传送到第一网的信号回声(上述传送的信号称为NEAR-IN信号)所引起的能量值的方法,该方法包含a)测量NEAR-IN信号和FAR-IN信号中相应回声到达间的延迟时间;b)处理NEAR-IN信号的复制来产生一个时变信号,它表示按照测量延迟所滞后的以及按照估计回声传输损耗所衰减的NEAR-IN信号经平滑的能量值,上述时变信号称为TEMPLATE;c)在一个非线性处理器中,如果FAR-IN信号超过TEMPLATE,则基本上可无衰减地通过该信号;d)在一个非线性处理器中,如果FAR·IN信号处在低于TEMPLATE规定的范围内,则处理器将衰减该信号。
2.权利要求1的方法,其中测量延迟的步骤包含计算NEAR-IN和FAR-IN信号的频域相干度量C(τ,f),上述度量是频率f和上述信号间相对延迟τ的函数;在有关的频带上将上述度量C(τ,f)相加,就得到一个相干能量函数C(τ);并且鉴别上述函数C(τ)的局部峰值。
3.权利要求2的方法,其中度量C(τ,f)表示为C(τ,f)=|SYX(τ,f)|2SY(f)×SX(τ,f)]]>其中f表示频率,SY(f)是NEAR-IN信号的平均自动谱,SX(f)是FAR-IN信号的平均自动谱,而SXY(τ,f)是NEAR-IN和FAR-IN信号的交叉谱的平均值。
4.用于在本地网接收的来自远程网的通信信号中(上述接收的信号称为FAR-IN信号),减少传送到本地网的信号回声(上述传送的信号称为NEAR-IN信号)所引起的能量值的方法,该方法包含a)测量NEAR-IN信号和FAR-IN信号中相应回声到达间的延迟;b)将FAR-IN信号分解为多个称为FAR-IN分频带信号的分频带频率分量,将NEAR-IN信号分解为多个称为NEAR-IN分频带信号的分频带频率分量;c)处理每个NEAR-IN分频带信号的复制来产生一个时变信号,它表示按照测量延迟所滞后的以及按照估计回声传输损耗所衰减的NEAR-IN分频带信号经平滑的能量值,该时变信号称为TEMPLATE;d)在一个非线性处理器中,如果每个FAR-IN分频带信号超过相应的TEMPLATE,则基本上无衰减地通过该信号;e)在一个非线性处理器中,如果每个FAR-IN分频带信号处在低于相应TEMPLATE的规定范围内,则处理器将衰减该信号;并且f)综合非线性处理的FAR-IN分频带信号,以组成一个回声减少的全频带FAR-IN信号。
5.权利要求4的方法,其中测量延迟的步骤包含计算NEAR-IN和FAR-IN信号的频域相干度量C(τ,f),该度量是频率f和上述信号间相对延迟τ的函数;在有关的频带上将上述度量C(τ,f)相加,就得到一个相干能量函数C(τ),并且鉴别上述函数C(τ)的局部峰值。
6.权利要求5的方法,其中度量C(τ,f)可表示为C(τ,f)=SYX(τ,f)2SY(f)×SX(τ,f)]]>其中f代表频率,SY(f)是NEAR-IN信号的平均自动谱,SX(f)是FAR-IN信号的平均自动谱,而SXY(τ,f)是NEAR-IN和FAR-IN信号的交叉谱的平均值。
7.权利要求4的方法,其中该方法还包含对于每个FAR-IN分频带信号设置一个噪声水平的步骤,在每个有关的时间它小于或等于相应的TEMPLATE信号;并且对于每个FAR-IN分频带信号,执行步骤(d)和(e)使得如果上述信号下降到低于噪声水平,上述信号也不衰减。
8.权利要求7的方法,其中对于每个FAR-IN分频带信号,设置相应噪声水平的步骤包含求得FAR-IN分频带信号的能量包络;以及平滑平均过程中的上述包络,该过程对谷值的加权更重于对峰值的加权。
9.权利要求8的方法,还包含测试FAR-IN信号能量存在的步骤,而其中求得每个FAR-IN分频带信号能量包络的步骤只在没有检测出大的FAR-IN信号能量时才执行。
10.权利要求7的方法,其中衰减步骤包含将FAR-IN分频带信号限制在一个予定的电平。
11.权利要求10的方法,其中予定的电平基本上等于噪声水平。
12.权利要求10的方法,其中衰减步骤还包含使限幅的FAR-IN分频带信号与噪声分量相混合,噪声分量在有关的分频带内有一个基本上平坦的频谱;而执行混合步骤使得总的混合信号的电平基本上等于噪声水平。
13.在一个通信系统中,来自远程位置发送器的称为FAR SPEECH的传输被发送器引入一个远程网中,然后作为来自远程网的FAR-IN信号。被本地网所接收,一种用于减少FAR-IN信号能量值的方法,该能量值的衰减是传送到本地网信号的回声(该被传送的信号称为NEAR-IN信号),该方法包含a)测量NEAR-IN信号和FAR-IN信号中相应回声到达间的延迟;b)测试起因于FAR SPEECH的FAR-IN信号中的能量,当检测该能量时设置一个标志给DENY状态,而当没有检测到该能量时设置一个标志给PERMIT状态;c)将FAR-IN信号分解为多个称为FAR-IN分频带信号的分频带频率分量,并将NEAR-IN信号分解为多个称为NEAR-IN分频带信号的分频带频率分量;d)处理每个NEAR-IN分频带信号的复制来产生一个时变信号,它表示按照测量延迟所滞后的以及按照估计回声传输损耗所衰减的NEAR-IN分频带信号经平滑的能量值,该时变信号称为TEMPLATE;e)将每个FAR-IN分频带信号通过一个非线性处理器,如果该信号超过相应的TEMPLATE,则可基本上无衰减地通过;f)将每个FAR-IN分频带信号通过该非线性处理器,如果该信号处在低于相应TEMPLATE的规定范围内,则受到衰减;g)综合所通过的FAR-IN分频带信号以组成一个回声减少的全频带FAR-IN信号;其中h)只有当标志设置到PERMIT状态时,才执行步骤(c)-(g)。
14.权利要求13的方法,其中在通过非线性处理器后的每个FAR-IN分频带信号被再分为许多区段,每个上述区段有10~20ms的持续期间,而每个上述区段包含多个信号样本,在通过的步骤之后,该方法还包含以下步骤如果在相应于任何区段的一段时间间隔内检测出FAR-SPEECH,则恢复那个区段中的所有样本到他们在通过的步骤之前的幅度。如果在相应于任何区段的一段时间间隔内没有检测出FAR-SPEECH,则衰减代表信号幅度弧立峰值的那个区段中的所有样本。
15.用于在一个本地电话用户接收来自远程位置一个会议通信装置的信号中(该接收的信号称为FAR-IN信号),减少本地用户话音回声引起的能量值的方法,该回声是由于在会议通信装置中不完善的回声消除而返回到本地用户的,该方法包含a)测量由本地用户传送到电话网的信号(该传送的信号称为NEAR-IN信号)和FAR-IN信号中相应回声到达间的延迟;b)处理NEAR-IN信号的复制来产生一个时变信号,它表示按照测量延迟所滞后的以及按照估计回声传输损耗所衰减的NEAR-IN信号经平滑的能量值,该时变信号称为TEMPLATE;c)在一个非线性处理器中,如果FAR-IN信号超过TEMPLATE,则可基本上无衰减地通过该信号;以及d)在一个非线性处理器中,如果FAR-IN信号处在低于TEMPLATE的规定范围内,处理器将衰减该FAR-IN信号。
16.用于在第一网接收来自第二网的通信信号中(该接收的信号称为FAR-IN信号),减少来自第二网并传送到第一网的信号回声(该传送的信号称为NEAR-IN信号)引起的能量值的设备,它包含a)用于测量NEAR-IN信号和FAR-IN信号中相应回声到达间的延迟的装置;b)用于接收NEAR-IN信号的复制以及用于处理上述复制以产生一个时变输出信号的装置,该输出信号称为TEMPLATE,它表示按照测量的延迟所滞后的以及按照估计回声传输损耗所衰减的NEAR-IN信号经平滑的能量值;以及c)一个非线性处理器,如果FAR-IN信号超TEMPLATE,则处理器基本上无衰减地通过该信号;如果FAR-IN信号处在低于TMPLATE的规定范围内,则处理器将衰减该信号。
17.权利要求16的设备,其中测量延迟装置包含计算NEAR-IN和FAR-IN信号的频域相干度量C(τ,f)的装置,上述度量是频率f和上述信号间相对延迟τ的函数。在有关的频带相加上述度量C(τ,f)的装置,由此得到一个相干能量函数C(τ);以及鉴别上述函数C(τ)局部峰值的装置。
18.用于在本地网接收来自远程网的通信信号(该接收的信号称为FAR-IN信号)中,减少传送到本地网的信号回声(该传送的信号称为NEAR-IN信号)引起的能量值的设备,它包含a)用于测量在NEAR-IN信号和FAR-IN信号中相应回声到达间的延迟的装置;b)用于将FAR-IN信号分解为多个称为FAR-IN分频带信号的分频带频率分量、以及用于将NEAR-IN信号分解为多个称为NEAR-IN分频带信号的分频带频率分量的装置;c)用于接收每个NEAR-IN分频带信号的复制以及用于处理每个上述复制以产生一个时变输出信号的装置,该输出信号称为TEMPLATE,它表示按照测量延迟所滞后的以及按照估计回声传输损耗所衰减的NEAR-IN分频带信号经平滑的能量值;d)一个非线性处理器,如果每个FAR-IN分频带信号超过相应的TEMPLATE,则处理器基本上无衰减地通过该信号,而如果每个FAR-IN分频带信号处在低于相应TEMPLATE的规定范围内,则处理器将衰减该信号。e)用于综合非线性处理的FAR-IN分频带信号以组成一个回声减少的全频带FAR-IN信号的装置。
19.权利要求18的设备,其中该设备还包含对于每个FAR-IN分频带信号设置噪声水平的装置,在有关的每一时刻,它总是小于或等于相应的TEMPLATE信号,以及采用非线性处理器,即使每个FAR-IN分频带信号下降到低于噪声水平,处理器也会基本上无衰减地通过该信号。
20.权利要求19的设备,其中采用非线性处理器,通过限制FAR-IN分频带信号到预定的电平来衰减该信号。
21.权利要求20的设备,其中所预定的电平基本上等于噪声水平。
22.权利要求20的设备,还包含将每个限幅的FAR-IN分频带信号与在有关的分频带内具有基本上平坦频谱的噪声分量进行混合的装置,这样所得的混合信号的电平基本上等于噪声水平。
23.用于在本地电话用户接收来自远程位置的会议通信装置的信号中(该接收的信号称为FAR-IN信号),减少本地用户话音回声引起的能量值的设备,回声是由于在会议通信装置中不完善的回声消除而返回到本地用户的,该设备包含a)用于测量在本地用户传输到电话网的信号(该传输信号称为NEAR-IN信号)和FAR-IN信号中相应回声到达间延迟的装置;b)用于接收NEAR-IN信号的复制并用于处理上述复制以产生一个时变输出信号的装置,该输出信号称为TEMPLATE,它表示按照测量延迟所滞后的以及按照估计回声传输损耗所衰减的NEAR-IN信号经平滑的能量值;以及c)一个非线性处理器,如果FAR-IN信号超过TEMPLATE,则处理器基本上无衰减地通过该信号;如果FAR-IN信号处在低于TEMPLATE的规定范围内,则处理器将衰减该信号。
24.一种通信系统,包含通过通信介质连接的第一网和第二网,其中称为FAR-IN信号的来自第二网的通信信号被第一网接收,而称为NEAR-IN信号的通信信号被传输到第一网,该系统还包含用于减少来自第二网的并由NEAR-IN信号回声引起的FAR-IN信号能量值的设备,其中上述设备包含a)用于测量在NEAR-IN信号和FAR-IN信号中相应回声到达间延迟的装置;b)用于接收NEAR-IN信号的复制和用于处理上述复制来产生一个时变输出信号的装置,该输出信号称为TEMPLATE,它表示按照测量延迟所滞后的以及按照估计回声传输损耗所衰减的NEAR-IN信号经平滑的能量值;以及c)一个非线性处理器,如果FAR-IN信号超过TEMPLATE,则处理器基本上无衰减地通过该信号,如果FAR-IN信号处在低于TEMPLATE的规定范围内,则处理器衰减该信号。
25.权利要求24的通信系统,其中通信信号是电话信号,而第一网和第二网是电话网。
26.权利要求25的通信系统,其中至少第一电话网是一个蜂窝式电话网。
27.权利要求25的通信系统,其中至少第二电话网是一个蜂窝式电话网。
28.权利要求25的通信系统,其中第一网和第二网通过卫星线路互连。
29.权利要求25的通信系统,其中第一网和第二网通过国际干线互连。
30.在包含有通过传输介质连接的第一网和第二网的通信系统中,其中称为NEAR-IN的信号被传输到第一网,而称为FAR-IN信号的来自第二网的信号被第一网所接收,一种用于检测NEAR-IN信号回声的方法,该信号是通过第二网返回到第一网的,该方法包含计算NEAR-IN和FAR-IN信号的频域相干度量C(τ,f),上述度量是频率f和上述信号间相对延迟τ的函数;在有关的频带相加上述度量C(τ,f),由此得到一个相干能量函数C(τ);以及鉴别上述函数C(τ)的局部峰值。
31.权利要求30的方法,其中度量C(τ,f)可表示为C(τ,f)=SYX(τ,f)2SY(f)×SX(τ,f)]]>其中f表示频率,SY(f)是NEAR-IN信号的平均自动谱,SX(f)是FAR-IN信号的平均自动谱,而SXY(τ,f)是NEAR-IN和FAR-IN信号的交叉谱的平均值。
32.用于检测通信系统中回声的设备,该系统包含通过传输介质连接的第一网和第二网,其中称为NEAR-IN的信号被传输到第一网,称为FAR-IN信号的来自第二网的信号被第一网所接收,而上述回声是通过第二网返回到第一网的NEAR-IN信号的回声,该设备包含用于计算NEAR-IN和FAR-IN信号的频域相干度量C(τ,f)的装置,上述度量是频率f和上述信号间相对延迟τ的函数;在有关的频带,将上述度量C(τ,f)相加的装置,由此可得到一个相干能量函数C(τ,f);以及用于鉴别上述函数C(τ)局部峰值的装置。
全文摘要
说明了在本地网接收的来自远程网的通信信号中(FAR-IN信号),减少传送到本地网信号回声(NEAR-IN信号)所引起能量值的一种方法和设备,部分地,这是通过产生一个时变TEMPLATE信号来实现的,该信号表示依照回声路径所延迟的以及根据一个估计回声传输损耗所衰减的NEAR-IN信号经平滑的能量值。如果FAR-IN信号超过TEMPLATE,则一个非线性处理器可基本上无衰减地通过该信号,如果FAR-IN信号处在低于TEMPLATE的规定范围内,则处理器将衰减该信号。
文档编号H04B3/23GK1149945SQ96190291
公开日1997年5月14日 申请日期1996年1月11日 优先权日1995年3月3日
发明者帕吉米·米切尔·维拉杜, 沃德森·达勒·韦恩 申请人:美国电报电话Ipm公司