专利名称:对语音编码的随时间变化的频谱按内插法进行分析的方法
技术领域:
本发明涉及按在毗邻的信号帧之间插入一些参数的内插法对随时间而变化的频谱进行分析的一种分析算法,可应用于低位速率(lowbitrate)的语音编码中。
在现代的数字通信系统中,语音编码装置和算法起主要作用。用这些语音编码装置和算法,可以将语音信号压缩,从而将其以单位时间较少的信息位数目在数字通信信道上传输。这样做的结果降低了语音信道在带宽方面的要求,从而提高了例如移动电话系统的容量。
为进一步提高容量,需要有能够在较低的位速率下对语音作优质编码的语音编码算法。最近,在优质和低位速率这两方面提出的要求有时导致在语音编码算法中要增加所使用的帧长。信号帧中含有若干语音样本,这些样本处在当时正在处理中以计算一组语音参数的时间间隔中。帧长增加的幅度一般是从20至40毫秒。
作为帧长增加的一个后果,语音信号的快速转变过程就不能象原先那样精确地加以跟踪。举例说,通常假定在语音分析时模拟声道运动的线性频谱滤波器模型在一帧期间是不变的。但帧长达40毫秒时,这个假定可能不成立,因为频谱会以较快的速率变化。
在许多语音编码器中,声道的影响是用线性滤波器模拟的,即用线性预测性编码(LPC)的分析算法求出的。1978年PrenticeHall公司出版的L.R.Rabiner和R.W.Schafer著的《语音信号的数字处理》一书第8章中介绍了线性预测性编码,这里也将其包括进来,以供参考。LPC分析算法是在语音信号的一些数字化样本的一帧上运算的,运算结果产生了说明声道对语音信号影响的线性滤波器模型,然后线性滤波器模型的各参数被数量化,并传送到译码器,在译码器中,它们连同其它信息一起用来再生语音信号。大多数LPC分析算法采用不随时间而变化的滤波器模型,再加上对滤波器各参数的快速更新。滤波器各参数通常是每帧发送一次,一般为20毫秒长。当LPC参数的更新速率因LPC分析帧长扩大到20毫秒以上而下降时,译码器的响应速率就慢下来,因而再生的语音声就不太清晰。估计的滤波器各参数的精确度也因频谱随时间的变化而下降。此外,语音译码器的其它部分也受到频谱滤波器模拟作用的失准而产生的坏影响。因此,为了降低语音译码器的位速率而需要增加分析帧长时,传统的那种以不随时间而变的线性滤波器模型为基础的LPC分析算法在跟踪语音中的构形成分(formants)方面会有困难。另一缺点是在对非常嘈杂的语音进行编码时产生的。这时为了获取足够精确的语音模型参数,可能需要使用含有许多语音样本的长语音帧。在不随时间变化的语音模型的情况下,由于上述跟踪构形成分的能力而可能做不到。将线性滤波器模型做成能明显地随时间变化可以克服上述缺点。
随时间变化的频谱估算算法可以根据下列文章中介绍的各种变换技术编制“Wigner分布-时频信号分析用的工具”T.A.C.G.Claasen和W.F.G.Mecklenbrauker著,PhilipsJ.Res.,1980年第35卷,217-250页,276-300页,372-389页;和“紧密支撑成分波的标准化基础(OrthonormalBasesofCompactlySupportedWavelats)”I.Daubechies著,Comm.Pure.Appl.Math.,1988年第41卷,第929-996页,这里也将这两篇文章包括进来,以供参考。然而,这些算法用来进行语音编码不太合适,因为它们不具备上述线性滤波器结构。因此,这些算法在现行的语音编码方案中并不是可以直接替代的。有些时候也可以采用传统的不随时间变化的算法与一些所谓遗忘的因素结合起来,或者采用与此等效的方法-开指数窗口法(exponentialwindowing),该方法在A.Benveniste的1987年第1卷第1期“Int.J.AdaptiveControlSignalProcessing”杂志上第3-29页发表的题为“跟踪随时间变化的系统的自适应算法的设计”一文中作了介绍,这里也把该文章包括进来,以供参考。
基于明显随时间变化的语音模型的已知LPC分析算法采用了两个或多个参数(即偏差和斜率)来模拟最低次随时间变化情况下的一个滤波参数。这类算法由Y.Grenier在1983年第ASSP-31卷第4期《电气与电子工程师学会声学、语音和信号处理会刊(IEEETransactionsonAcoustics,SpeechandSignalProcessing)》的第899-911页上发表的题为“非静止信号与时间有关的ARMA模拟”的文章中作了介绍,这里也将该文章包括进来,以供参考。这种方法的缺点是,模型的阶次数提高了,因而计算的复杂性也增加了。对于固定的语音帧长,语音样本/自由参数的数目减少意味着估算的精确度降低。由于在毗邻的语音帧之间不采用内插法,因而不同语音帧中的各参数之间没有联系,因此不能利用拖延到一个语音帧以上的编码延迟来改善现行语音帧中的LPC参数。此外,不应用毗邻各帧之间的内插法的算法不能控制各帧界上参数的变化。结果可能出现瞬态过程,这会降低语音的质量。
本发明的目的在于解决上述问题。方法是采用以毗邻各语音帧之间的内插法为基础的随时间变化的滤波器模型,也就是说,由此产生的随时间变化的LPC算法采用了毗邻各帧参数之间的内插法。与不参时间变化的LPC分析算法相比较,本发明公开的LPC分析算法改进了特别是语音帧长较长时的语音质量。由于这种以内插法为基础的新型随时间变化的LPC分析算法可用于帧长较长的情况,因而可以在极其嘈杂的情况下改进质量。应该指出的是,为获得这些优点,并不需要提高位速率,这一点很重要。
本发明比起其它的以明显随时间变化的滤波器模型为基础的装置具有下列优点。数学问题的阶次减小了,因而减小了计算的复杂性。阶次的减小还提高了估算语音模型的精确度,因为需要加以估算的参数只有一半。由于毗邻各帧之间有联系,因而有可能对LPC参数的编码作出延迟进行的决定。各帧之间的联系与语音模型的内插直接有关。估算出的语音模型可以根据LPC参数的子帧内插法进行最优化,而这些LPC参数在例如CELP编码器中的LTP和改进的编码中都是标准参数,这方面在B.S.Atal和M.R.Schroeder的1984年的Proc.Int.Conf.Comm.ICC-84第1610-1613页上发表的题为“语音信号在极低位速率下的随机编码”一文中以及W.B.Klijn、D.J.Krasinski和R.H.Ketchum的1988年的有关《声学、语音和信号处理》的国际会议会刊第155-158页上发表的题为“SELP中经改进的语音质量和高效的矢量量化”一文中都有介绍,这里把这些文章也包括进来,以供参考。这是以分段恒定内插方案为出发点进行的。在毗邻各帧之间内插也可以在整个帧界上获得连续的滤波参数轨迹。
本发明与其它频谱分析仪(例如采用变换技术的分析仪)相比,其优点在于,本发明可取代许多现行编码方案中的LPC分析部分而无须进一步修改其编码译码器(codecs)现在参看本发明的仅以举例的方式提供并在附图中展示出的一些实施例,以便更详细地说明本发明的内容。附图中
图1示出了对某一特定滤波参数ai的内插情况;
图2示出了本发明中使用的加权函数;
图3示出了按本发明得出的一个特定算法的方块图;
图4示出了按本发明提出的另一个特定算法的方块图。
下面的说明是就手提或移动电话和/或个人通信网络的蜂窝式通信系统进行说明的,但本领域的技术人员都知道,本发明也可以应用到其它通信用途上。具体说,本发明公开的频谱分析技术也可用于雷达系统、声纳、地震信号处理和自动控制系统中的最佳预测。
为改进频谱分析,假设下面随时间变化的全极滤波器模型在每一帧中均产生呈频谱形式的数据y(t)= 1/(A(q-1,t)) e(t)(1式)这里y(t)是离散化数据信号,e(t)是白噪声(white noise)信号;后向移位运算符q-1(q-1e(t)=e(t-k))中的A(q-1,t)可按下式求出A(q-1,t)=1+a1(t)q-1+…+an(t)q-n(2式)与其它频谱分析算法相比较,其区别在于,这里的滤波参数可以在帧内按新的规定方式变化。
鉴于e(t)是白噪声,因而最佳线性预示变量
(t)可用下式求出
(t)=-a1(t)y(t-1)-…-an(t)y(t-n)(3式)如果按下式引入参数矢量θ(t)和回归矢量φ(t)θ(t)=(a1(t)…an(t))T(4式)
ψ(t)=(-y(t-1)…-y(t-n))T(5式)则信号y(t)的最佳预测值可用下式表示
为详细说明频谱模型,需要引用一些符号。以下的上标()-、()0和()+分别表示上一帧、本帧和下一帧。
N一帧中的样本数;
t从本帧开始编号的第t个样本;
k供LPC分析用的一帧中的子区间数;
m各参数编码时所在的子区间,即各实际参数出现的子区间;
j表示从本帧开始编号的第j个子区间的指引数;
i表示第i个滤波参数的指引数ai(j(t))第i个滤波参数在第j个子区间内的插值。注意j为t的函数;
ai(m-k)=a-i上一个语音帧中的实际参数矢量;
ai(m)=a0i本语音帧中的实际参数矢量;
ai(m+k)=a+i下一个语音帧中的实际参数矢量。
在本实施例中,频谱模型采用a参数的内插法。此外,熟悉本技术领域的普通行家们都知都,该频谱模型还可以采用其它参数的内插法,例如反射系数、面积系数、对数-面积参数、对数-面积比参数、峰段频率(formantfrequencies)连同相应的带宽、线频谱频率、反正弦参数和自动相关参数。这些参数使得出的频谱模型其各参数都是非线性的。
现在可以按图1来说明参数化过程。其构思是分段恒定地在子帧m-k、m和m+k之间进行内插。但应该指出,也可以采用分段恒定内插以外的内插法,可能的话也可在两个以上的帧之间内插。特别应该指出的是,当子区间的数目k等于一帧中的样本数N时,内插就变为线性的。由于从上一帧的分析中可以知首a-i,因而可以通过求出数据与模型输出(1式)之间平方差的和的最小值列出确定a0i和(可能的话)a+i的算法的式子。
图1示出了第i个a参数的内插法。虚线轨迹表示用内插法以计算ai(j(t))时所在的子区间,图中N=160,k=m=4。
通过内插可以求出例如下面第i个滤波参数的表达式ai(j(t))=a-i(m-j(t))/(k) +a0i(k-m+j(t))/(k) ,m-k≤j(t)≤m(7式)ai(j(t))=a0i(k+m-j(t))/(k) +a+i(j(t)-m)/(k) ,m≤j(t)≤m+k为方便起见,最好引用下列加权函数w-(j(t),k,m)= (2k-m+j(t))/(k) ,m-2k≤j(t)≤m-kw-(j(t),k,m)= (m-j(t))/(k) ,m-k≤j(t)≤m
(8式)否则,w-(j(t),k,m)=0,w0(j(t),k,m)= (k-m+j(t))/(k) ,m-k≤j(t)≤mw0(j(t),k,m)= (k+m-j(t))/(k) ,m≤j(t)≤m+k(9式)否则,w0(j(t),k,m)=0,w+(j(t),k,m)= (-m+j(t))/(k) ,m≤j(t)≤m+kw+(j(t),k,m)= (2k+m-j(t))/(k) ,m+k≤j(t)≤m+2k(10式)否则,w+(j(t),k,m)=0,图2示出了N=160时的加权函数w(t,N,N)、w0(t,N,N)和w+(t,N,N)。应用7式-10式,即可将ai(j(t))以下列紧凑的形式表示出来ai(j(t))=w-(j(t),k,m)a-i+w0(j(t),k,m)a0i+w+(j(t),k,m)a+i(11式)注意6式是以θ(t)表示,即以ai(j(t))表示的。从11式可以看出,这些参数实际上是真实未知数(即a-i、a0i和、a+i)的线性组合。这些线性组合可表达成矢量和的公式,因为各加权函数对所有ai(j(t))都是相同的。为此引用了下列参数矢量θ-=(a-1…a-n)T(12式)θ0=(a01…a0n)(13式)θ+=(a+1…a+n)T(14式)于是从11式就可以得出θ(j(t))=w-(j(t),k,m)θ-+w0(j(t),k,m)θ0+w+(j(t),k,m)θ+(15式)利用此线性组合可以将模型(6式)表达成下面一般的线性回归方程
(t)=θTφ(t)(16式)其中θ=(θ-Tθ0Tθ+T)T(17式)φ(t)=[w-(j(t),k,m)φT(t) w0(j(t),k,m)φT(t)w+(j(t),k,m)φT(t)]T(18式)这样就完成了对该模型的论述。
接着在模型和算法中进行频谱的平滑化。可以采用带预开窗口程<p>表Ⅳ接收站管理MAC符号
现参照图3,示出了根据本发明的一对再生延长器的方框图。连接到延长器301的是一个第一同轴电缆302,在该电缆上载有FSK电信号,该电信号例如可以是IEEE802.4格式。在延长器301和301'之间的延长是第一和第二光纤303和304。光纤303用于在延长器301中接收由延长器301'发送的光的编码数据,和光纤304载有由延长器301发送并由延长器301'接收的光的编码数据。延长器301'连接到同轴电缆306,用于发送和接收FSK电信号。如上所述,延长器301,301'基本上是相同的,因此,下面仅详细讨论一个延长器301。
延长器301是一个调制解调器(modem)30是一种商用的调制解调器(modem),例如莫托罗拉载带Modem(CBM)组件(MC68194),它执行IEEE802.4FSK信号的接收和发送。Modem307还提供包括本地环回,发射机启动和复位适应随时间变化的情况,可以加入一个略小于1的安全系数。检验模型的稳定性也可以通过直接计算各个极或者采用Schur-Cohn-Jury试验方式进行。
若模型不稳定,可以采取若干措施。首先,可以用λiai(j(t))取代ai(j(t)),其中λ为0与1之间的常数。对越来越小的λ,重复上述稳定试验,直到模型稳定为止。另一种可以采取的措施是计算模型的各极,然后只稳定那些不稳定的极,即用不稳定极在单位圆中的镜象取代这些不稳定极。众所周知,这样做并不会影响滤波器模型的频谱形状。
新的频谱分析算法都是从下列标准式推导出来的
其中 I=[t1,t2](23式)是模型最优化所经历的时间间隔。注意使用t之前的n个额外样本是按照φ(t)的定义进行的。使用I就可以利用延迟来提高质量。上面说过,假设θ是从分析前一个帧知道的。这就是说,标准式Vρ(θ)可以写成
其中y(t)是已知量,且其中θ0+=(θ0Tθ+T)T(25式)φO+p(t)=(w0(j(t),k,m)φTρ(t) w+(j(t),k,m)φTρ(t))T(26式)为忽略旧数据的指数,直截了当的方法是往标准式中引入指数加权因数。
首先处理最佳时间间隔I的大小使语音模型受下一个语音帧中各参数影响的情况。这就是说,为正确估算θ0,还须要计算θ+。值得注意的是,虽然θ+计算出来了,但并不须要将其传送到译码器。这样做的代价是,译码器带来了一个附加的延迟,因为语音只能在直到本语音帧的子时间间隔m内再生。因此这个算法也可以视为随延迟决定时间而变化的LPC分析算法。假设取样时间间隔为TS秒,则该算法引入的从本帧开始计起的总延迟时间为延迟时间=(1- (m)/(k) )NTs+t2Ts,t2> (mN)/(k) (27式)求标准式(24式)的最小值可按线性回归的最小平方优化理论进行。因此可以从下式的线性系统求出最佳参数矢量θ0+
28式的系统可用解这类方程系统的任何标准方法来求解。28式的阶次是2n。
图3示出了本发明的一个实施例,其中的线性预测性编码分析法是以毗邻各帧之间的内插法为基础的。更具体说,图3示出了28式所述的的用高斯消去法求解的信号分析过程。首先,可将离散信号乘以窗口函数52以便使频谱光滑。得出的信号53按以帧为基础的方式存入缓存器54中。于是就可以用缓存器54中的信号来产生21式所表示的回归量或回归矢量信号55。产生回归矢量信号55的过程是利用频谱平滑参数来产生经平滑的回归矢量信号的过程。然后将回归矢量信号55分别乘以9式和10式求出的加权因数57和58,以产生第一组信号59。第一组信号用26式表示。接着根据第一组信号59和下面即将论述的第二组信号69写出28式所表示的线性方程系60。在本实施例中,方程系是用高斯消去法61求解的,由此得出本帧63和下一帧62的参数矢量信号。高斯消去法可以利用LU分解法。方程系还可以用QR因式分解法、Levenberg-Marquardt法或用递归算法求解。频谱模型的稳定度是通过经稳定度校正器64馈入参数矢量信号获得的。再将本帧经稳定后的参数矢量信号馈入缓存器65中,以使参数矢量信号延迟一个帧。
上述第二组信号69是这样产生的首先将回归矢量信号55乘以8式所表示的加权函数56,然后将得出的信号与上一帧的参数矢量信号66混合,产生信号67,接着再把信号67与储存在缓存器54中的信号混合以产生24式所表示的第二组信号69。
I没有延续到本帧的子时间间隔m以外时,W+(j(t),k,m)等于0,于是根据25式和26式,28式的最后n个方程的右侧和左侧均减小到0。头n个方程解决了求最小值的问题如下
和上面一样,这是一个标准的最小平方问题,其中为配合滤波参数随时间的变化,修改了数据的加权过程。与前述的方程阶为2n不同,方程29式的阶为n。29式所带来的编码延迟仍然用27式表示,但这时t2<mN/k。
图4示出了本发明的另一个实施例,其中的线性预测性编码分析法是以毗邻各帧之间的内插法为基础的。更具体说,图4示出了29式所表示的信号分析过程。首先,为使频谱平滑,可将离散信号70乘以窗口函数信号71。然后将得出的信号以帧为基础的方式存入缓存器73中。然后利用频谱平滑参数用缓存器73中的信号产生21式所表示的回归量或回归矢量信号74。接着将回归矢量信号74乘以9式所表示的加权因数76,以产生第一组信号。然后根据第一组信号和下面即将说明的第二组信号85写出29式所表示的线性方程系。求解该方程系以产生本帧79的参数矢量信号。频谱模型的稳定度是通过经稳定度校正器80馈入参数矢量信号获得的。再将经稳定后的参数矢量信号馈入缓存器81中,从而使参数矢量信号延迟一个帧。
上述第二组信号是这样产生的首先将回归矢量信号74乘以8式所表示的加权函数75,然后将得出的信号与上一帧的参数矢量信号混合,以产生信号83。接着再将这些信号与来自缓存器73的信号混合,从而产生第二组信号85。
上述公开的各种方法可以按几个方面加以总结。在本实施例中,重点是放在模型的改造和进可能导出计算估算值更有效的算法上。
模型结构改造的方案之一是往滤波器模型(1式)中加入分子多项式如下y(t)= (C(q-1,t))/(A(q-1,t)) e(t)(30式)其中 C(q-1,t)=1+c1(t)q-1+…cm(t)q-m(31式)编制这种模型的算法时,另一种方法是采用所谓预测误差最优化法,L.Ljung和T.Soederstroem在其由美国马萨诸塞州剑桥M.I.T出版社出版的1983年版《递归鉴别的理论与实践(TheoryandPracticeofRecursiveIdentification)》一书第2-3章中介绍了这种方法,这里也包括进来,以供参考。
另一种改造是关系到激励信号方面,如周知的那样,这是在LPC分析之后在CELP编码器中计算的。然后可以用这个信号使LPC各参数重新达到最优化,作为分析步骤的最后一步。若激励信号用u(t)表示,则适当的模型结构是一般的方程误差模型A(q-1,t)y(t)=B(q-1,t)u(t)+e(t)(32式)其中B(q-1,t)=b0(t)+b1(t)q-1+…+bm(t)q-m(33式)
另一种方法是采用所谓输出误差模型。但这只会使计算更加复杂化,因为最优化过程需要采用非线性搜索法。B-多项式的各参数按上述A-多项式完全相同的方式进行内插。通过引入θ-=(a-1…a-nb-0…b-m)T(34式)θ0=(a01…a0nb00…b0m)T(35式)θ+=(a+1…a+nb+0…b+m)T(36式)φρ(t)=(-ρ-1y(t-1)…-ρ-ny(t-n)u(t)…σ-mu(t-m))T(37式)可以证实,在34式-37式代替以上所述的任何表达式的情况下,28式和29式仍然成立。符号σ表示对应于频谱模型的分子(numerator)多项式的频谱平滑因数。
另一种可能改造上述算法的方法是在各帧之间采用分段恒定或线性内插法以外的内插法。内插方案可以扩大到三个以上的毗邻语音帧之间。此外,还可以对滤波器模型的不同参数采用不同的内插方案,并在各不同帧中采用不同方案。
求解28式和29式的方程可以用标准的高斯消去法进行计算。鉴于最小平方问题都是标准形式的,因而也存在其它的可能性。递归算法可以应用所谓矩阵转置引理(matrixinversionlemma)直接求取,该引进公开在上述《递归鉴别的理论与实践》一书中。于是应用诸如U-D因式分解法、QR因式分解法和Cholesky因式分解法之类的各种不同因式分解法就可以直接派生出其他各种算法。
还能推导出求解28式和29式的计算上更有效的算法。为此可以采用几种不同的方法,例如,L.Ljung,M.Morf和D.Falconer在1978年Int.J.Contr.第27卷第1-19页上发表的题为“递归估算方案的增量矩阵(gainmatrices)快速计算”一文和M.Morf,B.Dickinson,T.Kailath和A.Vieira在1977年IEEETrans.Acoust.,Speech,SignalProcessing第ASSP-25卷第429-433页上发表的题为“线性预测用的协方差方程(co-varianceequations)的有效求解法”一文中采用的代数方法,这里也把这些包括进来,以供参考。B.Fried-lander在1982年Proc.IEEE第70卷第829-867页上发表的题为“自适应处理用的格形滤波器(latticefilter)”一文中总结了快速算法的设计方法,这里也把该篇文章包括进来,以供参考。最近有人基于频谱模型(1式)参数的多项近似法应用几何论证研究出所谓格子算法(latticealgorithms),如E.Karlsson在1991年Proc.ICASSP第3233-3236页上发表的题为“模拟随时间变化的信号用的RLS多项格子算法“一文中所介绍的那样,这里也把该篇文章包括进来,以供参考。但该方法不是基于毗邻语音帧各参数之间的内插法。结果,该问题的阶次起码为这里所介绍的算法阶次的两倍。
在本发明的另一实施例中,将这里所公开的随时间变化的LPC分析法与原先已知的LPC分析算法结合起来。首先应用随时间变化的频谱模型的频谱分析和利用各帧之间频谱参数内插法进行第一次频谱分析,然后用不随时间而变化的方法进行第二次频谱分析,再将这两种方法加以比较,选取能达到最高质量的方法。
鉴定频谱分析质量的第一种方法是比较离散语音信号通过频谱滤波器模型的反向进行时测得的功率减小值。最高质量对应于最大的功率减小情况。这也叫做预测增量测定法。第二种方法是每当稳定时采用随时间而变化的方法(加入小安全系数)。若随时间而变化的方法不稳定,就选用不随时间变化的频谱分析法。
尽管这里已就本发明的一个特定实施例进行了说明和介绍,但本发明并不受该实施例的限制,因为熟悉本技术领域的技术人员是可以对该实施例进行修改的。本发明旨在包括这里所公开和要求保护的发明精神实质和范围内的任何和全部修改方案。
权利要求
1.一种应用随时间变化的频谱模型的信号帧频谱分析法,其特征在于该方法包括应用利用上一帧、本帧与下一帧之间各参数信号的内插法的滤波器模型对频谱进行模拟;对信号进行取样,以获取一系列离散样本并由此构成一系列信号帧;从所述信号计算出回归量信号;将这些回归量信号与一平滑参数结合起来以获取平滑的回归量信号,由此使频谱平滑起来;将所述平滑回归量信号与一些加权因素结合起来,以产生第一组信号;将来自上一帧的各参数信号与所述平滑回归量信号、一信号样本和一加权因数结合起来,以产生第二组信号;根据第一和第二组信号计算本帧和下一帧的参数信号;确定模型是否稳定;若确定结果是模型不稳定,则使其稳定。
2.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述滤波器模型为一线性的、随时间变化的全极滤波器。
3.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述滤波器模型包括一个分子(numberator)。
4.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述内插法是分段恒定内插法。
5.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述内插法是分段线性内插法。
6.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述内插法所涉及的范围超过所述上一帧、本帧和下一帧。
7.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述内插法是非线性内插法。
8.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述使频谱平滑的过程是通过对信号预开窗口达到的。
9.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述使频谱平滑的过程是通过相关加权达到的。
10.根据权利要求1所述的信号帧频谱分析法,其特征在于,用一Schur-Cohn-Jury试验来确定所述模型是否稳定。
11.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述模型的稳定情况是通过计算反射系数并观测其大小来确定的。
12.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述模型的稳定情况是通过计算各级确定的。
13.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述模型是通过极镜象法加以稳定的。
14.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述模型是通过带宽扩大法加以稳定的。
15.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述信号帧为语音帧。
16.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述信号帧为雷达信号帧。
17.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述本帧和下一帧的参数信号是用高斯消去法来计算的。
18.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述本帧和下一帧的参数信号是用高斯消去法和LU分解法来计算的。
19.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述本帧和下一帧的参数信号是用QR因式分解法来计算的。
20.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述本帧和下一帧的参数信号是用U-D因式分解法来计算的。
21.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述本帧和下一帧的参数信号是用Cholesky因式分解法来计算的。
22.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述本帧和下一帧的参数信号是用Levenberg-Marquardt法来计算的。
23.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述本帧和下一帧的参数信号是用递归公式计算的。
24.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述各参数信号为a参数。
25.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述各参数信号为反射系数。
26.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述各参数信号为面积系数。
27.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述各参数信号为对数一面积参数。
28.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述各参数信号为对数一面积比参数。
29.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述各参数信号为峰段频率和相应的带宽。
30.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述各参数信号为反正弦参数。
31.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述各参数信号为自动相关参数。
32.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述各参数信号为线频谱频率。
33.根据权利要求1所述的信号帧频谱分析法,其特征在于,其中利用了一个输入到所述频谱模型的附加的已知输入信号。
34.根据权利要求1所述的信号帧频谱分析法,其特征在于,所述滤波器模型的各参数信号是非线性的。
35.一种应用随时间变化的频谱模型的信号帧频谱分析法,其特征在于该方法包括应用利用上一帧、本帧与下一帧之间各参数的内插法的滤波器模型对频谱进行模拟;对信号进行取样,以获取一系列离散样本并由此构成一系列信号帧;从所述信号计算出回归量信号;将这些回归量信号与一平滑参数结合起来以获取平滑的回归量信号,由此使频谱平滑起来;将所述平滑回归量信号与一加权因数结合起来,以产生第一组信号;将来自上一帧的各参数信号与所述平滑回归量信号、一信号样本和一加权因数结合起来,以产生第二组信号;根据第一和第二组信号计算本帧的参数信号;确定模型是否稳定;若确定结果是模型不稳定,则使其稳定。
36.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述滤波器模型为一线性的、随时间变化的全极滤波器。
37.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述滤波器模型包括一个分子(numerator)。
38.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述内插法是分段恒定内插法。
39.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述内插法是分段线性内插法。
40.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述内插法所涉及的范围超过所述上一帧、本帧和下一帧。
41.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述内插法是非线性内插法。
42.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述使频谱平滑的过程是通过对信号预开窗口达到的。
43.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述使频谱平滑的过程是通过相关加权达到的。
44.根据权利要求35所述的信号帧频谱分析法,其特征在于,用一Schur-Cohn-Jury试验来确定所述模型是否稳定。
45.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述模型的稳定情况是通过计算反射系数并观测其大小来确定的。
46.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述模型的稳定情况是通过计算各极确定的。
47.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述模型是通过极镜象法加以稳定的。
48.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述模型是通过带宽扩大法加以稳定的。
49.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述信号帧为语音帧。
50.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述信号帧为雷达信号帧。
51.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述本帧的参数矢量信号是用高斯消去法来计算的。
52.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述本帧的参数信号是用高斯消去法和LU分解法来计算的。
53.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述本帧的参数信号是用QR因式分解法来计算的。
54.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述本帧的参数信号是用U-D因式分解法来计算的。
55.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述本帧的参数信号是用Cholesky因式分解法来计算的。
56.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述本帧的参数信号是用Levenberg-Marquardt法来计算的。
57.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述本帧的参数信号是用递归公式来计算的。
58.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述参数信号为a参数。
59.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述参数信号为反射系数。
60.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述参数信号为面积系数。
61.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述参数信号为对数-面积参数。
62.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述参数信号为对数-面积比参数。
63.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述参数信号为峰段频率和相应的带宽。
64.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述参数信号为反正弦参数。
65.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述参数信号为自动相关参数。
66.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述参数信号为线频谱频率。
67.根据权利要求35所述的信号帧频谱分析法,其特征在于,其中利用了一个输入到所述频谱滤波器模型的附加的已知输入信号。
68.根据权利要求35所述的信号帧频谱分析法,其特征在于,所述滤波器模型的各参数信号是非线性的。
69.一种信号编码法,其特征在于该方法包括应用随时间变化的频谱模型并利用各帧之间频谱参数内插法确定信号帧的第一次频谱分析;应用不随时间而变化的频谱模型确定第二次频谱分析;将第一和第二次频谱分析进行比较;然后选择质量最高的频谱分析。
70.根据权利要求69所述的信号编码法,其特征在于,所述频谱分析是这样进行比较的在用所述频谱模型合成滤波之后,测定信号能量的减少量,然后选取能使能量减少得最多的频谱分析。
71.根据权利要求70所述的信号编码法,其特征在于,若所述第一次频谱分析能使模型稳定就选取所述频谱分析为所述第一次频谱分析;若所述第一次频谱分析使模型不稳定,则选取所述第二次频谱分析。
全文摘要
以各语音帧之间的内插法为基础的一种随时间而变化的频谱分析方法,用借助于随时间变化的线性预测性编码分析算法得出的线性滤波器模拟语音信号,并用毗邻各语音帧之间的内插法来表示语音信号随时间的变化情况。此外,毗邻各帧之间的内插法还得出了在整个不同语音帧上的滤波参数的连续轨迹。
文档编号G10L19/06GK1083294SQ9310850
公开日1994年3月2日 申请日期1993年7月5日 优先权日1992年7月6日
发明者T·K·韦格伦 申请人:艾利森电话股份有限公司