消除在扬声器电话中包括非线性失真的声学回声的装置和方法

文档序号：2820025阅读：505来源：国知局

专利名称：消除在扬声器电话中包括非线性失真的声学回声的装置和方法
技术领域：
本发明涉及电话领域，更确切地涉及在扬声器电话中抑制回声。
背景技术：
一扬声器电话系统包括一输出换能器，例如扬声器，一输入换能器，例如麦克风。扬声器产生相应于从远方接收来的代表希望的声压波的输入信号的声压波，而麦克风接收声压波并转换为输出信号再将输出信号传输到远方。因为扬声器将声压波广播到扬声器电话周围环境，存在一个从扬声器到麦克风的声学通道，这可能产生回声。典型的，这一声学通道包括多个通道，(代表多个反射)因此多个回声在不同的时间到达麦克风。
如果不采取措施补偿这一声学通道，由扬声器产生的声压波将通过麦克风作为回声传回远方用户。实际上，这意味着当远方用户说话时，语音将通过扬声器广播，然后传输回来，使得通话困难，这样，在现有技术中有很多努力来减少这些回声。
例如，在由Park等给出的，题目为“在衰落信道上全双工语音传输的声学回声消除”的参考文献中讨论了自适应声学回声消除器的实现，该消除器用于操作在衰落信道的免提蜂窝电话，发表于国际移动卫星会议会刊(该会议于1990年6月18-20号在加拿大安大略省渥太华市举行)。自适应格形结构被用在初始化阶段，该结构比传统的分组延时线(TDL)收敛得更快。收敛后；格形系数被转化为TDL结构的系数，由于它计算上的简单性，TDL结构可以在实时操作中容纳更多的抽头。
在由Burnett等给出的题目为“移动无线电环境下的回声消除”的参考文献中也讨论了其它回声消除的方法。该参考文献发表于1988年12月19日英国伦敦IEE通过移动无线电进行数字化语音通信研讨会(文摘号为139)页码为7/1-4。提供回声消减的传统方法是采用语音开关消减器。正如下面所描述的，由这样的语音控制开关强行加入的半双工通道以及现有的话音激活探测器的不完善将导致对话的不自然。另一种解决方案是采用自适应回声消除器消减回声。同样正如下面所描述的这一过程也是不完善的，因为在回声通道中任何非线性将引起内在的不可消除的谐波分量。麦克风和放大器有足够线性的特性，而扬声器通常就没有线性特性。
尽管有前面提到的参考文献，在现有技术中仍然继续存在改进扬声器电话系统和方法以便减少从扬声器到麦克风的回声的需求。
发明概述本发明的一个目标是提供改善的扬声器电话回声消除系统和方法。
本发明的另一个目标是提供改进的用于移动蜂窝无线电话回声消除的系统和方法。
这些以及其它目标将通过本发明的扬声器电话系统得以实现，扬声器电话系统包括含有一个含有产生估计回声信号的扬声器模型的回声滤波器。大多数扬声器产生的实际声压波与代表输入信号的输入的声压波不同。这一不同部分原因是扬声器的非线性。例如，扬声器的膜片可能有非线性的压力应变曲线，而且膜片的运动可能引起低频分量对高频分量的延时调制。然而，就申请者所知，现有技术的回声消除器没有考虑到扬声器产生回声的非线性部分，意味着这些非线性部分将传输给远方的对话者。
这样，本发明的估计回声信号包括相应于由扬声器非线性特性产生的回声非线性部分的非线性分量，因此当估计回声信号被从由麦克风产生的输出信号中减去时，由扬声器产生的回声的非线性部分将会减少。回声滤波器也包括产生从扬声器到麦克风的声学通道的估计的声学通道模型，从而减少由声学通道产生的回声效应。
在按照本发明的优选实施例中，回声消除扬声器电话包括产生相应于输入信号的声压波的输出换能器，输入信号是施加于一音频输入的。声压波包括输入信号线性函数的希望的线性分量，以及输入信号的非线性函数的不希望的非线性分量。声压波沿着声学通道传输，而且一输入换能器被放置到声学通道上，将声压波转换为输出信号。
回声滤波器响应输入信号并产生估计的回声信号。输出滤波器包括用来产生声压波估计的输出换能器模型，声压波估计包括线性分量估计和非线性分量估计。回声滤波器还包括产生从输出换能器到输入换能器的声学通道估计的声学通道模型。一混合器将估计回声信号与输出信号混合，从而减少输出信号中的回声部分。
该回声消除扬声器电话系统减少了由声学通道引起的回声，声学通道是从输出换能器到输入换能器，回声是输入信号的线性函数。该系统也减少由扬声器非线性所引起的回声部分，这些回声是输入信号的非线性函数。这样，该系统在减少输出信号回声方面大大优于没有输出换能器模型的系统。
回声消除扬声器电话也可能包括回声滤波器调节装置，该调节装置根据输出信号和估计回声信号来调节回声滤波器，以便进一步减少输出信号中的回声部分。这样，本系统能够最大限度的调整操作、来根据声学通道变化环境的不同进行回声消除。回声滤波器调节装置可以包括调节声压波估计的输出换能器模型的调节装置，该声压波包括线性分量和非线性分量。该回声滤波调节装置也可以包括用于改善从输出换能器到输入换能器声学通道估计的声学通道模型装置。
声学通道优选的是一个有限冲激响应滤波器，回声滤波器优选的是一个数字信号处理器并允许在现有硬件上实现。而且，输出换能器模型优选的包括对输入信号进行变换的装置。该变换优选的是输出换能器传输函数的估计，该传输函数优选的包括一个非线性分量，从而提供输出换能器传输函数相对精确的近似。
声压波的非线性分量代表输出换能器的延时调制和/或输出换能器膜片压力应变曲线之一。在优选的实施例中，输出换能器为一扬声器，而输入换能器为一麦克风。输出换能器模型和声学通道模型将在声学输入和混合剂之间被顺序连接。而且，声学通道模型可以包括产生声压波非线性分量的声学通道估计的第一处理模块，以及产生声压波线性分量声学通道估计的第二处理模块。而且，混合器可以是一减法器，以便从输出信号中减去估计的回声信号。
本发明上述以及其它目标与方面在下面的附图和说明中详细解释。
附图的简要描述

图1是按照本发明的回声消除扬声器电话系统的示意图，该系统包括扬声器，麦克风和回声滤波器，回声滤波器包括串联的扬声器模型和声学通道模型。
图2是图1中扬声器的电器特性模型的示意图。
图3是按照本发明的回声消除电话系统的示意图。该系统包括扬声器，麦克风，和回声滤波器，回声滤波器包括与两个用于模拟声学通道的分别的滤波器串联的扬声器模型。
图4是按照本发明的回声消除扬声电话系统的示意图，该系统包括扬声器，麦克风和回声滤波器，回声滤波器包括两个用来为扬声器建模的处理模块和两个为声学通道建模的处理模块。
发明的详细描述本发明将参照附图在以下做详细描述，附图中表示了本发明的几个优选的实施例，然而本发明可以有许多不同的方式实施，并不局限于下面例举的实施例；这些提供的实施例将使本发明的公开充分而完全，并对本领域技术人员完整地表达本发明的范围。在整个文本中相同的数字表示相同的元件。
图1表示的回声消除系统可以在扬声器电话中实现，例如用在汽车上的免提扬声器蜂窝无线电话。当作为免提蜂窝无线电电话实现时，从远方谈话者接收的语音信号被从蜂窝基站(没有画出)传输，被蜂窝电话收发器(没有画出)接收，并作为输入波形w(t)施加于输入节点36。
如图1所示，波形w(t)以模拟形式施加到节点36，被A/D转换器30转化为数字形式，以便给扬声器模型12使用。然后，D/A转换器26被用来将波形转化为模拟形式。模拟信号被放大器27放大，代表远方谈话者语音的声压波被例如扬声器14的输出换能器播出。这样，无线电话用户听到代表远方谈话者语音的声压波形。可替换的，在节点36的模拟信号w(t)可以直接施加于放大器27。如果波形w(t)以数字形式施加于节点36，它便可直接施加于扬声器模型和D/A转换器26。
然而，声压波也沿着可能包括多个通道的声学通道广播，一个通道是从扬声器到麦克风的反射(或回声)路径。结果，声压波的回声被例如麦克风20的输入换能器接收。这样就希望减少由麦克风20产生的输出信号z(t)中的回声，以便使远方的谈话者不被他自己的语音的延时回声所迷惑。减少回声优选的采用由数字信号处理器(DSP)实现的回声滤波器，以便产生估计的回声信号，并从麦克风20输出信号中减去估计的回声信号。这样，放大器37和A/D转换器28可用来把输出波形z(t)转换为合适的数字格式。
回声滤波器优选的由数字信号处理器(DSP)实现，来根据输入波形w(t)产生估计的回声信号z′(t)。如果输入波形以模拟形式施加A/B转换器30可用来将波形转换为数字形式。(如果w(t)以数字形式施加，D/A转换器30便不需要)。然后，输入波形被施加到回声滤波器中的扬声器模型12，该模型包括一个表示扬声器的传输函数。该传输函数同时对扬声器14的线性和非线性分量建模。从扬声器模型12出来的输出被施加到在回声滤波器中实现的声学通道模型34，该模型代表声学通道18。声学通道模型34优选的由自适应有限冲激响应(FIR)滤波器实现。这样，从声学通道模型34中来的估计的回声信号z′(t)可以很好地逼近来自于扬声器由麦克风接收的回声。
用在回声消除的自适应滤波器在例如授予Fujii的美国专利No.5,237,562，名称为“回声路径传输检测”中讨论。其它包括自适应回声估计或包括有限冲激响应滤波器的回声消除器，分别在授予Esaki的美国专利5,131,032题目为“回声消除器和使用它的通信装置”以及授予Koike的美国专利5,084,865等，题目为“用于消除长尾回声的具有FIR和IIR的回声消除器”。三个上述参考文献在此被引为本发明的参考文献。
估计回声信号z′(t)与麦克风20输出信号z′(t)在减法器22中混合，减法器也在DSP中实现并从输出信号中减去估计的回声信号。这样，仅仅在无线电话中产生的声音被传输到远方的谈话者。在一个蜂窝无线电话应用中，在节点38的输出波形z(t)(减去估计噪声信号z′(t))被施加到无线电话收发器(未画出)并传输给远程蜂窝基站(未画出)。如果收发器需要模拟输出波形，D/A转换器32可用来将信号转换为模拟形式。如果收发器需要数字波形，D/A转换器32则不需要。
回声滤波器优选的也包括回声滤波调节装置16，该装置调节回声滤波器的操作，以便进一步减少输出信号中的回声部分。回声滤波器调节装置监测回声滤波器中的各种信号，并调节扬声器模型和声学通道模型的操作，以便进一步减少输出波形中的回声。这样，回声滤波器调节其操作以便适应声学通道的变化以及系统的老化。
图2表示例如扬声器14的输出换能器电气特性的模拟模型。一电输入信号施加到输入节点A并产生通过扬声器线圈的电流，电流沿着线圈电阻40和线圈电感42以及由线圈在磁场中运动引起的后向EMF反向流动。适当选择模型的单位和尺度，节点C的电压可以等于后向EMF并代表线圈的速度，从节点C的后向EMF通过连结到差分运算放大器44的正向输入被引入到输入A的驱动电压相反的位置。放大器44的输出是从节点C的后向EMF和与线圈中电流成比例的一项的和。放大器46减去后向EMF以便得到仅仅代表线圈中电流的电压。适当选取任意单位，这一电压也可以代表线圈施加在扬声器膜片上的力，这一力是电流与扬声器磁铁产生的磁场相互作用产生的。本领域技术人员会明白，本说明书中的名词膜片具有最广泛的意义，例如包括平面膜片，球形膜片，或锥形膜片。
该力将扬声器膜片加速到一定速度，该速度会被膜片的质量或惯性以及遇到的空气阻力所阻碍。运算放大器48有一个代表膜片质量的反馈电容器50以及一个代表膜片受到的空气阻力，也许是非线性的反馈电阻52。流过电阻52的电流与加速力的方向相反，并与膜片运动产生的空气压力波相关。电流传感器54在节点c′产生一信号，代表由膜片运动产生的这一空气压力波。
然而，压力波从运动物体，膜片，发出。当膜片瞬时偏置到扬声器前端，它便与扬声器前方的听者更接近。这样，声波将以比膜片偏置向扬声器后端更短的时间延迟到达听者。膜片偏置在低频时产生最大幅度，这产生低频对高频的延迟调制(也称为相位调制)的非线性现象。膜片偏置的信号表示在节点D，由电阻60，电容62和运算放大器64产生，这三者一起构成积分器65。这样，在节点C′产生的膜片的压力波信号将受到延时调制器66根据在节点D产生的膜片偏置信号而产生的延迟调制，以便，在输出节点B产生净声压波形，并传送给听者。
在节点D产生的膜片偏置信号也需要为膜片弹簧的恢复力建模，恢复力与施加在线圈上的由运算器放大器46产生的线圈力信号代表的力相反。膜片弹簧很可能表现出由非线性电阻56建模的非线性压力应变曲线。运算放大器58在其反馈路径上有非线性电阻56，并将在节点D产生的偏置相关信号转化为恢复力，恢复力加在运算放大器48的输入并与线圈力信号相反。标志为R0的电阻可以等于1ohm。
这样，采用在图2描述的模型中，适当的参数和尺度选择，在扬声器输出节点B产生的声压波可以根据扬声器输入节点A上施加的电信号估计出来。
按照本发明的优选实施例，包括扬声器非线性估计的扬声器模型12，被包括在全双工回声消除器的回声消除路径上，以便改进对回声的预测，该回声将由扬声器电话中的麦克风20接收回来。图1表示回声消除器的方框图中包括了这一模型12。输入的语音波形w(t)被从电话系统中接收，经适当处理后施加于输入节点36以及扬声器14。在移动电话系统中，这样的处理可以包括无线数字调制信号的解调、差错纠正解码以及语音解码，采用例如残留激励线性预测(RELP)或者矢量码激励线性预测(VSELP)语音合成器。波形w(t)是这种处理的输出，而且可能为数字形式以便更适于本发明回声消除器的处理。在这种情况下，w(t)可以被D/A转换器26转换，并被放大器27放大之后再施加于扬声器14。扬声器14广播包括非线性失真分量的声压波到环境中，有些声压波沿着不同的声学路径18的声学通道到达麦克风20。麦克风输出波形z(t)被放大器37放大并优选的用A/D转换器28采样和A/D转换来产生波形z(t)的数字样本。原始语音波形w(t)也用一扬声器模型12和一扬声器到麦克风的多径声学耦合模型34处理，以便产生麦克风输出信号z(t)的估计z′(t)。这一估计被减法器22相减来保留残留回声信号E(t)，E(t)是希望被减少的。
如果近端谈话者在讲话，E(t)也包括传输到电话网络上的近端语音。如果是数字形式，信号E(t)在需要时可被采用D/A转换器32转化为模拟形式以进行传输。在移动蜂窝电话系统中，例如RELP或VSELP语音编码的其它处理可被用来产生信号的降低码率表示，差错纠正编码以及无线电的无线频率载波上的数字调制。
回声滤波器调节装置16被用来更新声学通道模型34的系数以便得到残留信号E(t)的最小均方值。这是通过计算线性通道模型输入的波形V(t)和残留误差E(t)之间的相关性完成的，并确定需要对每个系数改变多少来产生更好的消除，例如，如果E(t)表现出与延时23个样本后的V(t)强烈相关，则延时23个抽头的滤波器的FIR系数将被调整以便从减法器22输出中消除这一相关分量。这一过程对于本领域技术人员来说很清楚，将不再赘述。然而，包含为产生波形V(t)的换能器模型12允许更好的回声消除效果。
扬声器模型12或声学通道模型34的任何调整优选的仅当远方谈话者说话时进行。这一条件允许在没有由扬声器以外产生的其它声音干扰下比较输入波形w(t)与残留回声。在一个实施例中，这一条件是由比较扬声器中的信号强度与麦克风中的信号强度来决定的。决定何时麦克风信号主要来自于声学反馈的装置，在例如授予Chu的美国专利5,263,019，名称为“估计扬声器与麦克风之间声学反馈幅度的方法和装置”的专利中讨论，该专利的全部公开内容在此被引为参考文献。
本专利也包括采用回声滤波器调节装置16调节扬声器模型12的参数以便进一步通过消除残留失真分量提高回声消除效果，这一残留失真分量没有被声学通道模型34的线性FIR滤波器建模。
波形V(t)被换能器模型12从波形w(t)中计算出来。假设这些波形用数字样本代表…，w(i-1)，w(i)，w(i+1)，…，以及…v(i-1)，v(i)，v(i+1)…。同样由图2所示的节点B，C，C′，D和I上的内部波形可由离散时间样本表示。计算输出样本波形w(i)可以用下面公式I(i)＝(A(i)+Y*I(i-1)-C(i-1))/(R+Y) (1)C(i)＝C(i-1)+(G(D(i-1))-U(i-1)-I(i))/X (2)D(i)＝D(i-1)-C(i)(3)U(i)＝F(C(i))(4)W(i)＝U(i)-0.5(U(i+1)-U(i-1))*D(i)*dT (5)其中Y等于线圈电感L除以样本时间间隔；R为线圈电阻；G为代表膜片弹簧应力形变关系的非线性函数；X代表膜片质量参数52除以样本时间间隔；以及F为代表将膜片速度波形C(i)转化为声压波v(i)的非线性函数。
公式(5)表示由膜片运动产生的压力波U(i)的延时调制，这一计算是通过采用导数0.5(U(i+1)-U(i-1))，对样本U(i)进行内插，其数量依赖于膜片瞬时偏置D(i)以及代表延时调制数量的比例因子dT。
例如，如果采样率为8K样本两秒，样本…，(i-1)，(i)，(i+1)，…之间的间隔为125μs。在125μs中声音大约运动1.5英寸，因此如果膜片偏置D被积分器65以1.5英寸为单位计算，D＝1将代表整个样本延迟。公式将变成w(i)＝U(i-1)对于D(i)＝1或w(i)＝U(i+1)对于D(i)＝-1因为D通常小于0.5，所以公式5更为合适。
在上面讨论的公式中，延时调制的符号被任意假设。也许需要改变延时调制的符号，因此引入了可正可负的比例因子dT。引入比例因子的另一个原因是允许D(i)采用1.5英寸之外的单位计算。选择的单位是为了适于计算公式G(D(i))。
假设膜片速度转化为压力是线性的，是可以接收的，在这种情况下C(i)＝U(i)。这里任意的比例因子表示没有特定的单位被定义来转化电信号到声波，因此产生下面四个公式I(i)＝(A(i)+Y*I(i-1)-C(i-1))/(R+Y) (6)C(i)＝(G(D(i-1))+X*C(i-1)-I(i))/(1+X) (7)D(i)＝D(i-1)-C(i)(8)W(i)＝C(i)-0.5(C(i+1)-C(i-1))*D(i)*dT. (9)在这些公式里仅建模两个非线性效应。这些效应呈延时调制和膜片压力应变曲线，延时调制由数量dT乘以失真波形表示。失真波形为差分与C(t)积分之积，膜片压力应变曲线由函数G(t)表示。
G(t)可以划分为一个斜率为Go的线性压力应变曲线加上非线性余项G′(D)＝G(D)-Go*D。其目的为使公式(7)由下列小信号情形的公式代替C(i)＝C(i-1)+(Go*D(i-1)-U(i-1)-I(i))/X(10)此公式可与公式(6)和(8)一起使用，来预测扬声器的小信号行为。然后扬声器的小信号和线性参数可以通过测量来决定。
本领域技术人员会明白线圈电阻40和电感42参数R和Y的确定方法，膜片质量和膜片压力应变曲线G10的线性部分可通过把扬声器放在指定的壳体中，测量膜片的机械共振频率和Q值来决定。
然后小信号参数被混合起来；代表压力应变曲线非线性部分的G′，代表延时调制的非线性参数dT可以通过大信号测量。延时调制可以通过例如频谱分析仪观察双频测试产生的互调制决定的，双频测试是在引起大的膜片偏置的低频正弦信号和对由低频膜片偏置产生的相位调制最为敏感的高频正弦信号之间进行的。
压力应变曲线的非线性部分可通过采用频谱分析仪观察大的低频正弦信号的谐波失真作为幅度的函数，并通过“尝试法”找到函数G′并加以解释来得到的。该函数可用数字信号处理器中的查表表示。可替换的这一曲线也可直接通过对需要偏置膜片到一个可测量的数量的力或DC电流的物理测量来决定。本发明也可以包括膜片偏置或运动传感器的限定，以便帮助时模型参数的实时决定或自适应刷新。
实际上，应力应变曲线G′可以除了对于特定扬声器的比例因子外假设为已知。类似的，可以假设产生特定膜片机械共振的线性模型参数对于特定的扬声器大小是已知的。影响小信号频率响应的小信号参数的小错误不会产生重大后果，因为任何系统都假设具有调整补偿线性频率响应的能力。例如，可以采用手动均衡器或音调控制。
在扬声器电话中，从扬声器14到麦克风20的声学通道18的线性频率响应包括附近物体的反射和可能的房间混响，通常称为环境。这样，这一响应可以用包括复线性FIR滤波器的声学通道模型34来建模。然而，回声或回响由于上述讨论的非线性效应没有被线性FIR滤波器完善地建模，由此产生了回声消除的不完备。然而，采用图1所示的非线性回声消除系统，从电输入到扬声器放大器，到扬声器，通过声学通道到麦克风，最后到麦克风放大器的通道更为精确地与扬声器模型12和声学通道模型34的组合相匹配，因此提供了更好的回声消除效果。下面将要参照图1和上述公式描述非线性换能器模型参数，怎样实施调整来连续的减少残留的未消除回声失真残余。
参照公式(9)，扬声器模型12的输出V(t)包括两个波形的和，C(i)和B(i)＝0.5(C(i+1)-C(i-1)*D(i))，后者用-dT标度。因为上述讨论FZR滤波器34是线性的，它的输出是两个独立的对C(i)，B(i)滤波以后的波形之和，并加上滤波以后的波形，对B(i)的滤波输出的比例因子为-dT。
因为波形C(t)和D(t)是从w(t)中计算出来的，B(i)可以预先计算，C(t)和B(t)可以分别滤波得到波形Z1(t)和Z2(t)的样本。Z′(t)等于Z1(t)-dT*Z2(t)，dT的值可以计算出来以便增加回声消除的效果。即，dT可以计算出来以便减少残留波形E(t)的均方值，其中E(i)＝Z(i)-Z1(i)+dT*Z2(i)的平方和被减少。
dT的值由下列公式给出dT=-1NΣ(Z(i)*(Z(i)-Z1(i)),]]>其中Z2(i)与Z(i)-Z1(i)相关，对于i＝1到N。
波形Z1(t)的数量ALPHA与波形Z2(t)的BETA可以组合在一起优化得到ALPHA=de-bfad-bc;]]>BETA=af-cead-bc]]>其中a=Σi[Z12(i)]]]>d=Σi[Z22(i)]]]>b=c=Σi[Z1(i)*Z2(i)]]]>e=Σi[Z1(i)*Z(i)]]]>f=Σi[Z2(i)*Z(i)]]]>因为改变数量Z1和Z2大约相当于调整FIR系数的比例因子，ALPHA和BETA的值可以用总体调整FIR比例因子乘以ALPHA来实现，并设定dT＝-BETA/ALPHA。
减少残留E(t)的额外自由度可以通过分别适应地优化用于B(t)波形和C(t)波形的FIR滤波器来得到，以便得到两个波形Z1(t)和Z2(t)分别依赖于FIR系数的不同集合。然而，希望找到不同于比例因子-dT的一套参数是缺乏物理基础的。在此考虑的问题中通常认为基于物理可实现的模型，在复杂性上是最为经济的。然而有时也要牺牲复杂性，以便采用现成的，已经偏移的自适应FIR算法，来达到快速实现。采用分开的FIR滤波器34A1和34B1的回声消除系统如图3所示。
图3中的换能器模型121产生两个输出波形。非延时调制波形C(t)(用VA1(t)表示)和失真波形B(t)(用VB1(t)表示)。C(t)和B(t)通过分开的声学通道模型34A1和34B1表示，两个都包含FIR滤波器，它们的参数都由回声滤波器调节装置161调节以便在减法器221之外减少残留波形E1(t)。本领域的技术人员可以排列设计出这种排列的其它变种。例如，两个FIR滤波器可以在部分路径上分开，而在剩余路径上合并进入一个共同的FIR滤波器。在图3的下列实施例中，采用系数ALPHA和BETA，实际上是这一原理的极端情况，其中滤波器的分开部分被分别缩减为加权ALPHA和BETA的单一抽头。然而，ALPHA和BETA的所有值以及滤波器公共部分的参数可以一起来进行优化而不是在得到先前优化的FIR系数后分别仅优化ALPHA和BETA。这是一个设计实施和复杂性折衷的问题，本领域技术人员可以在遵照回波消除基本原理的情况下做出各自的选择。
另外的滤波器(没有画出)可以在图1和图3中包括在扬声器模型12和121之前。这一滤波器的目的是为D/A转换器中的防混叠滤波器建模该滤波器会对于驱动扬声器的模型有些影响，如果关心与驱动实际扬声器波形相同的扬声器模型12和121，这一滤波器的模型便可被包括。这里也可以包括扬声器放大器27的频率响应模型。这一模型不必自适应，可以在厂家设置好，来为防混叠滤波器和音频放大器响应和建模。相应于从麦克风输入20到A/D转换器28的防混叠滤波器可以被FIR滤波器或滤波器组充分建模以便为声学通道建模。
上面讨论的技术照顾了扬声器的一种非线性失真机制，由膜片弹簧引起的非线性也可以用相似的方式更新。膜片弹簧非线性可以用一个多项式建模，如G0*D(t)+G1*D(t)2+G2*D(t)3....
图2中从放大器58的二阶三阶或更高阶的失真波形进入放大器48，且经受一定的频率响应之后出现在输出B。失真波形也进一步的失真，但是这些高阶的效应可被忽略而并不太影响模型。
举例来说，频率响应的三次失真项可以被有抽头加权因子t0，t1，t2，t3，……的FIR滤波器表示。即输出失真波形将为y0*G2*D3(i)+t1*G2*D3(i-1)+t2*G2*D3(i-2) ....
然后波形通过声学通道18到达麦克风，也通过声学通道34的FIR滤波器来减少回声。
因为声学通道34的FIR滤波器是线性的，上面列出的各项可以独立地滤波并相加。因为每一项实际上仅是前面项的延迟，只有一个波形通过了FIR滤波器。这个波形是
...，D3(i-1)，D3(i)，D3(i+1)，...
经过滤波的波形表示为...，Z3(i-1)，Z3(i)，Z3(i+1)，...
该波形被加权系数为T0，T1，T2……，的FIR滤波器处理，并从残留回声中减去以减少它。可以最有效减少噪声的残留抽头系数T0，T1，T2……可以采用与发现声学通道模型FIR滤波器的抽头系数相同的办法来发现，以便通过减去波形w(t)的加权延迟来减少残留。最佳抽头T0，T1，T2……只是由于因子G2而与模型的已知频率响应t0，t1，t2……不同。这样失真系数G2的更新值便能被找出。同理膜片弹簧非线性的任意多项式系数可以赋予能减少非线性回声残留的一个更新值。
按照图1所讨论的，本发明的回声滤波器可以用数字信号处理器21实现，包括扬声器模型12，声学通道模型34，减法器22，以及回声滤波器调节装置16。在本实施例中，扬声器模型和声学通道模型各自含有一处理模块，这些处理模块按顺序排列。然而，处理函数可以有其它排列。
例如，如图3所示声学通道模型可以拆成两个处理模块，声学通道模型A34A1和声学通道B34B1，两者都在DSP211中。在本实施例中，扬声器模型121有为扬声器14输出的非线性分量建模的第一输出VA1(t)，以及为扬声器输出的线性分量建模的第二输出VB1(t)。这样，声学通道模型A34A1为声压波的非线性分量的声学通道建模，而声学通道模型B34B1为声压波的线性分量的声学通道建模。每个声学通道模型可以分别调节，以便提供回声信号每一部分更精确的估计。
这样如果声学通道18在声压波的线性和非线性分量方面表现出不同，分开的声学通道模型处理模块可以适应这种不同，这种组合提供了用于为声学通道模型建模的参数的灵活性，以及用回声滤波器调节装置161调节这些参数的灵活性。图3表示在单一处理步骤中，用减法器221相减非线性回声估计ZA1与线性回声估计ZB1。本领域的技术人员明白，这些回声估计也可以用多个减法器来处理。
在另一实施例中，如图4所示在DSP212中，扬声器模型可以拆成分开的处理模块12A2和12B2。这里扬声器模型A12A2为扬声器产生的声压波的非线性分量建模，扬声器模型B12B2为扬声器产生的声压波的线性分量建模。这种排列提供了用于表征声压波参数的灵活性以及用回声滤波调节装置162调节这些参数的灵活性。
在本实施例中，声学通道模型被拆成多个处理模块，为声压波的线性与非线性分量的声学通道建模。这一点与图3所讨论的一致。图3和图4的实施例表明扬声器模型和声学通道模型可被拆成多个处理模块，以便分别为回声的线性和非线性分量建模。然而，本发明也可以设计将这些模型拆成分开的处理模块，以便分别为回声的其它分量建模。例如可以提供分开的处理模块来为回声的高频和低频分量，回声的高幅度和低幅度分量等建模。
这样就描述了扬声器14的非线性扬声器模型12如何被包括在全双工扬声器电话的回声消除路径中，来通过消除非线性失真值达到更好的回声消除。这一技术可以用换能器的固定的，非自适应模型实现。这些非线性参数可以用测量来决定，或者本技术也可以包括采用上面描述的技术和自适应信号处理领域中的技术人员所能提供的其它技术来自适应地决定换能器的非线性参数。
这样本发明的许多改进和其它实施例可以在相关的描述和图示的提示下，由本领域的技术人员给出。因此本发明不局限于公开的具体实施例可以按照所附的权利要求的精神提出改进。
权利要求
1.一种回声消除扬声器电话，包括一个产生相应于加在音频输入端的输入信号的声压波的扬声器，上述的声压波包括作为上述输入信号线性函数的一个希望的线性分量，以及作为上述输入信号非线性函数的一个不希望的非线性分量，上述声压波将沿着一个声学通道传播；一个被放置到上述声学通道上，用来将上述声压波转换为一输出信号的扬声器；一个响应上述输入信号并产生估计的回声信号的回声滤波器，上述回声滤波器包括一个产生声压波估计的扬声器模型，声压波估计包括一个上述线性分量的估计和一个上述非线性分量的估计，上述回声滤波器还包括一个产生从扬声器到麦克风的声学通道估计的声学通道模型；和一个用于从输出信号中减去估计的回声信号的减法器，从而减少上述的输出信号中的回声部分，其中上述的扬声器模型和上述的声学通道模型被顺序的连接着。
2.根据权利要求1的回声消除扬声器电话，进一步包括一个回声滤波器调节装置，该调节装置根据输出信号，输入信号和估计的回声信号调节上述回声滤波器，以便进一步减少输出信号中的回声部分。
3.根据权利要求2的回声消除扬声器电话，其中上述回声滤波器调节装置包括一个扬声器模型调节装置，扬声器模型调节装置调节包括线性分量估计和非线性分量估计的声压波估计。
4.根据权利要求2的回声消除扬声器电话，其中上述回声滤波器调节装置包括一个用于改进从扬声器到麦克风的声学通道的估计的声学通道模型调节装置。
5.根据权利要求1的回声消除扬声器电话，其中声学通道模型包括一个有限冲激响应滤波器。
6.根据权利要求1的回声消除扬声器电话，其中上述回声滤波器包括一个数字信号处理器。
7.根据权利要求1的回声消除扬声器电话，其中扬声器模型包括用于完成上述输入信号的一个变换的装置，上述变换为扬声器传输函数的一个估计，上述传输函数包括非线性分量。
8.根据权利要求7的回声消除扬声器电话，其中上述非线性分量代表扬声器的一个延时调制和扬声器的一个膜片的压力-应变曲线之一。
9.一种回声消除扬声器电话，包括一个产生相应于加在音频输入上的输入信号的声压波的扬声器，上述的声压波包括成为上述输入信号线性函数的一个希望的线性分量，以及作为上述输入信号非线性函数的一个不希望的非线性分量，上述声压波将沿着一个声学通道传播；一个被放置到上述声学通道上，用来将上述声压波转换为一输出信号的扬声器；一个响应上述输入信号并产生估计的回声信号的回声滤波器，上述回声滤波器包括一个产生声压波估计的扬声器模型，声压波估计包括一个上述线性分量的估计和一个上述非线性分量的估计，上述回声滤波器还包括一个声学通道模型，声学通道模型包括产生声压波非线性分量的声学通道估计的第一处理模型，以及产生声压波线性分量的声学通道估计的第二处理模块；和一个用于从输出信号中减去估计的回声信号的减法器，从而减少上述的输出信号中的回声部分。
10.根据权利要求9的回声消除扬声器电话，进一步包括一个回声滤波器调节装置，该调节装置根据输出信号，输入信号和估计的回声信号调节上述回声滤波器，以便进一步减少输出信号中的回声部分。
11.根据权利要求10的回声消除扬声器电话，其中上述回声滤波器调节装置包括一个扬声器模型调节装置，扬声器模型调节装置调节包括线性分量估计和非线性分量估计的声压波估计。
12.根据权利要求10的回声消除扬声器电话，其中上述回声滤波器调节装置包括一用于改进从扬声器到麦克风的上述声学通道的估计的声学通道模型调节装置。
13.根据权利要求9的回声消除扬声器电话，其中声学通道模型包括一个有限冲激响应滤波器。
14.根据权利要求9的回声消除扬声器电话，其中上述回声滤波器包括一个数字信号处理器。
15.根据权利要求9的回声消除扬声器电话，其中扬声器模型包括完成上述输入信号的一个变换的装置，上述变换为扬声器传输函数的一个估计，上述传输函数包括非线性分量。
16.根据权利要求15的回声消除扬声器电话，其中上述非线性分量代表扬声器的一个延时调制和扬声器的一个膜片压力-应变曲线之一。
17.一种回声消除扬声器电话，包括响应于加在音频输入端的输入信号产生声压波的输出换能器装置，上述的声压波包括作为输入信号线性函数的一个希望的线性分量，以及作为输入信号非线性函数的一个不希望的非线性分量，上述声压波将沿着一个声学通道传播；被放置到上述声学通道上，用来将上述声压波转换为一输出信号的输入换能器装置；响应上述输入信号并产生估计的回声信号的回声滤波装置，上述回声滤波装置包括一个产生声压波估计的输出换能器模型，声压波估计包括一个上述线性分量的估计和一个上述非线性分量的估计，上述回声滤波装置还包括一个产生从输出换能器装置到输入换能器装置的声学通道估计的声学通道模型；和用于混合上述估计的回声信号和上述输出信号的混合装置，从而减少上述的输出信号中的回声部分。
18.根据权利要求17的回声消除扬声器电话，进一步包括一个回声滤波器调节装置，该调节装置根据输出信号，输入信号和估计的回声信号调节上述回声滤波器，以便进一步减少输出信号的回声部分。
19.根据权利要求18的回声消除扬声器电话，其中上述回声滤波器调节装置包括一个输出换能器模型调节装置，输出换能器模型调节装置用于调节包括线性分量估计和非线性分量估计的声压波估计。
20.根据权利要求18的回声消除扬声器电话，其中上述回声滤波器调节装置包括一个改进从输出换能器到输入换能器的声学通道的估计的调节装置。
21.根据权利要求17的回声消除扬声器电话，其中声学通道模型包括一个有限冲激响应滤波器。
22.根据权利要求17的回声消除扬声器电话，其中上述回声滤波器装置包括一个数字信号处理器。
23.根据权利要求17的回声消除扬声器电话，其中输出换能器模型包括完成上述输入信号的一个变换的装置，上述变换输出换能器传输函数的一个估计，上述传输函数包括非线性分量。
24.根据权利要求23的回声消除扬声器电话，其中上述非线性分量代表输出换能器装置的一个延时调整和扬声器的一个膜片压力-应变曲线之一。
25.根据权利要求17的回声消除扬声器电话，其中上述的输出换能器装置包括一个扬声器。
26.根据权利要求17的回声消除扬声器电话，其中输入换能器装置包括一个麦克风。
27.根据权利要求17的回声消除扬声器电话，其中上述的输出换能器模型和上述的声学通道模型被顺序连接在上述音频输入端和上述混合装置之间。
28.根据权利要求17的回声消除扬声器电话，其中上述声学通道模型包括产生声压波非线性分量的声学通道估计的第一处理模块，以及产生声压波线性分量的声学通道估计的第二处理模块。
29.根据权利要求17的回声消除扬声器电话，其中混合装置包括一个从上述输出信号中减去上述估计的回声信号的减法器。
30.一种在包括一扬声器的电话系统中减少回声的方法，上述方法包括以下步骤将输入信号施加给上述扬声器，从而产生一沿着声学通道传输的声压波，上述声压波包括作为上述输入信号线性函数的一个希望的线性分量，以及作为上述输入信号非线性函数的一个不希望的非线性分量；将上述声学通道中的上述声压波转换来产生一包括回声部分的输出信号；产生响应于输入信号的一估计的回声信号；其中上述估计的回声信号包括对由扬声器引入的失真的估计和对由声学通道引入的失真的估计，由扬声器引入的失真包括线性和非线性分量；以及混合上述输出信号和上述估计的回声信号，来减少输出信号中的回声部分。
31.根据权利要求30的方法，其中在上述的混合步骤之后有以下步骤确定在上述混合步骤之后残留的上述输出信号中的残留回声部分；以及响应于上述残留回声部分，调整由上述扬声器和上述声学通道引入的失真估计，以便进一步减少上述输出信号中的上述回声部分。
32.根据权利要求31的方法，进一步包括比较上述输入信号和上述输出信号的步骤，以便决定何时上述输出信号基本只包括上述回声部分，并且在输出信号基本上只包含上述回声部分时完成上述调整步骤。
33.根据权利要求32的方法，其中上述输入信号包括一输入测试信号。
全文摘要
回声消除扬声器电话包括一个产生相应于加在音频输入端的输入信号的声压波的扬声器。该声压波包括作为输入信号线性函数的一个希望的线性分量,以及作为输入信号非线性函数的不希望的非线性分量,而且声压波将沿着声学通道传播。一个麦克风被放置到声学通道上并将声压波转换为一个输入信号。一个回声滤波器负责响应输入信号并产生估计的回声信号。回声滤波器包括一个产生声压波估计的扬声器模型,声压波估计包括一个线性分量的估计和一个非线性分量的估计。回声滤波器也包括产生从扬声器到麦克风的声学通道的估计的声学通道模型。而且,一个减法器从输出信号中减去估计的回声信号,从而减少上述的声音信号中的回声部分。
文档编号G10L21/02GK1176034SQ96192119
公开日1998年3月11日申请日期1996年2月20日优先权日1995年2月24日
发明者P·W·登特, T·W·索尔维申请人:艾利森公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：P·W·登特、T·W·索尔维
技术所有人：艾利森公司
我是此专利的发明人

上一篇：在电信系统中处理语音编码参数的制作方法
上一篇：声音活动检测的制作方法