数字语音编码器中的谐波噪声加权的制作方法

文档序号：2819078阅读：247来源：国知局

专利名称：数字语音编码器中的谐波噪声加权的制作方法
技术领域：
本发明主要涉及信号压缩系统，更具体地，涉及码激励线性预测(CELP)型语音编码系统。
背景技术：
数字语音与音频信号的压缩是公知的。为了在通信信道上高效地发送信号或者在诸如固态存储器件或计算机硬盘的数字媒体设备上存储压缩信号，通常需要进行压缩。尽管存在许多压缩(或者“编码”)方法，但其中一种非常流行的数字语音压缩编码方法称为码激励线性预测(CELP)，该方法为“分析-合成”编码算法系列中的一员。分析-合成法通常指利用数字模型的参数合成一组候选信号，将这些候选信号与输入信号做比较，并分析失真的编码过程。然后发送或存储产生最小失真或误差分量的参数集。该参数集最后用于重建原始输入信号的估计。CELP是一种特殊的分析-合成法，其利用一个或多个激励码本，这些码本主要包括从对应于码本索引的码本得到的码矢量集。这些码矢量在“试错”(trial and error)过程中用作语音合成器的激励，在该过程中，为每一候选码矢量计算误差指标，并且选择产生最小误差的候选码矢量。
例如，图1是现有CELP编码器100的框图。在CELP编码器100中，包含语音采样n(s(n))的输入信号被施加至线性预测编码(LPC)分析框101，在此处利用线性预测编码估计短时谱包络。得到的谱参数(或LP参数)由传输函数A(z)表示。这些谱参数被施加至LPC量化框102，量化框102对这些谱参数进行量化以产生适用于复用器108的量化谱参数Aq。量化谱参数Aq然后被传递至复用器108，并且该复用器基于该量化谱参数和由平方差最小化/参数量化框107确定的一组参数τ、β、k和γ产生编码比特流。如同本领域的普通技术人员所知，τ、β、k和γ分别定义为闭环基音延迟、自适应码本增益、固定码本矢量索引和固定码本增益。
量化谱(或LP)参数还可被本地传递至具有对应传输函数1/Aq(z)的LPC合成滤波器105。LPC合成滤波器105还从第一组合器110接收合并的激励信号u(n)，并且基于量化谱参数Aq和该合并的激励信号u(n)产生输入信号的估计如下产生合并的激励信号u(n)。基于索引参数τ从自适应码本(ACB)103选择自适应码本码矢量cτ。然后基于增益参数β对于该自适应码本码矢量cτ加权，并将该加权的自适应码本码矢量传递至第一组合器110。基于索引参数k从固定码本(FCB)104选择固定码本码矢量ck。然后基于增益参数γ对于该固定码本码矢量ck加权，并且也将该加权的固定码本码矢量传递至第一组合器110。第一组合器110然后通过合并自适应码本码矢量cτ的加权值和固定码本码矢量ck的加权值，产生合并的激励信号u(n)。(为了方便读者，还以它们的z变换形式给出了这些变量。变量的z变换由相应的大写字母表示，例如，e(n)的z变换表示为E(z))。
LPC合成滤波器105将输入信号的估计传递至第二组合器112。第二组合器112还接收输入信号s(n)并用输入信号s(n)中减去输入信号的估计输入信号s(n)与输入信号估计间的差值被施加至感知误差加权滤波器106，该滤波器基于s(n)和之间的差值和加权函数w(n)产生感知加权误差信号e(n)，如下
E(z)=W(z)(S(z)-S^(z))---(1)]]>感知加权误差信号e(n)然后被传递至平方差最小化/参数量化框107。平方差最小化/参数量化框107使用误差信号e(n)确定产生输入信号s(n)的最佳估计的优化参数集τ、β、k和γ。
图2是从编码器100接收传输的现有解码器200的框图。如本领域的普通技术人员所知，解码器200中的解复用器在与由编码器100执行的完全相同的合成过程中利用由编码器100产生的编码比特流解码优化参数集，即τ、β、k和γ。从而，如果编码器100产生的编码比特流由解码器200无差错地接收，则可重建解码器200输出的语音作为编码器100产生的输入语音估计的精确副本。
回到图1，加权滤波器W(z)利用人耳的频率遮蔽特性，使得如果信号和噪声的频率接近，则同时出现的噪声被较强的信号遮蔽。如Salami R.，Laflamme C.，Adoul J-P，Massaloux D.，“A toll quality 8Kb/sspeech coder for personal communications system，”IEEE Trans.OnVehicular Technology，pp.808-816，Aug.1994中所述，从LPC系数ai得到W(z)，并由下式给出W(z)=A(z/γ1)A(z/γ2)0<γ2<γ1≤1,---(2)]]>其中，A(z)=1+Σi=1paiz-i,---(3)]]>并且p为LPC的阶数。由于加权滤波器由LPC谱得到，其也被称为“谱加权”。
上述过程并没有考虑这样的事实，即信号周期性也促成了基频处和基频的倍频处的频谱峰。已经提出了各种技术利用这些基频谐波的噪声遮蔽。例如，在专利No.5,528,723“Digital speech coder and methodutilizing harmonic noise weighting”Gerson and Jasiuk，和在Gerson I.A.，Jasiuk M.A.，“Techniques for improving the performance of CELP typespeech coders，”Proc.IEEE ICASSP，pp.205-208，1993中，提出了一种在加权滤波器中包括谐波噪声遮蔽的方法。如以上参考文献所述，通过用谐波噪声加权滤波器C(z)修改该谱加权滤波器可包括谐波噪声加权，并且谐波噪声加权滤波器由下式给出C(z)=1-ϵpΣi=-M1M2Biz-(D+i),---(4)]]>其中，D对应于基音周期或基音迟滞或延迟，bi是滤波器系数，并且0≤εp＜1是谐波噪声加权系数。包括谐波噪声加权的加权滤波器由下式给出WH(z)＝W(z)C(z). (5)谐波噪声加权量通常由乘积∈pbi决定。由于bi由延迟决定，则谐波噪声加权量是延迟的函数。上述现有技术参考文献已经表明，可在不同的预定时间使用不同的谐波噪声加权系数(∈p)值，即∈p可以是时变参数(例如允许其在各个子帧间变化)，然而，现有技术并没有提供选择∈p的方法。因此，需要一种方法和装置，用于在数字语音编码器中执行谐波噪声加权，优化地并且动态地确定∈p的适当值，因此可以优化谐波噪声加权量。尽管上述现有技术参考文献已经表明，可在不同的时间使用不同的谐波噪声加权系数(∈p)值(例如∈p可在各个子帧间变化)，然而，现有技术并没有提供改变∈p的方法或者表明这种方法何时是有益的或有多少益处。

图1是现有技术的码激励线性预测(CELP)编码器的框图。
图2是现有技术的现有CELP解码器的框图。
图3是根据本发明优选实施例的CELP编码器的框图。
图4是∈p对于基音迟滞(D)的图示。
图5是表示由CELP编码器执行，以包括本发明的谐波噪声加权方法的步骤的流程图。
图6是根据本发明替换实施例的CELP编码器的框图。
具体实施例方式
为了满足选择谐波噪声加权(HNW)系数(∈p)值以优化谐波噪声加权量的需要，此处提供一种用于在数字语音编码器中执行谐波噪声加权的方法和装置。在操作过程中，分析接收的语音以确定基音周期。然后基于该基音周期选择HNW系数，并且基于谐波噪声加权(HNW)系数(∈p)确定感知噪声加权滤波器(C(z))。对于大的基音周期(D)，基频谐波的峰非常接近，并且相邻峰间的谷因此可能位于相邻峰的遮蔽区域中。从而，对于较大的D值可能没有必要具有大的谐波噪声加权系数。
由于HNW系数是基音周期的函数，所以可执行更好的噪声加权，并且语音失真因此对于收听人更加不明显。
本发明包含一种用于在数字语言编码器中进行谐波噪声加权的方法。该方法包括以下步骤接收语音输入s(n)；根据该语音输入确定基音周期(D)；以及基于该基音周期确定谐波噪声加权系数∈p。然后基于该谐波噪声加权系数确定感知噪声加权函数WH(z)。
本发明还包含一种用于在数字语音编码器中执行谐波噪声加权的方法。该方法包括以下步骤接收语音输入s(n)；根据该语音输入确定闭环基音延迟(τ)；以及基于该闭环基音延迟确定谐波噪声加权系数∈p。然后基于该谐波噪声加权系数确定感知噪声加权函数WH(z)。
本发明还包含一种装置，该装置包括将语音(s(n))当作输入并基于该语音输出基音周期(D)的基音分析电路，将D当作输入并基于D输出谐波噪声加权系数(∈p)的谐波噪声系数生成器，以及将∈p当作输入并利用∈p生成加权误差信号e(n)的感知误差加权滤波器，其中e(n)基于s(n)与s(n)的估计之间的差值。
本发明最后包含一种装置，该装置包括将闭环基音延迟(τ)当作输入并基于τ输出谐波噪声加权系数(∈p)的谐波噪声系数生成器，将∈p当作输入并利用∈p生成加权误差信号e(n)的感知误差加权滤波器，其中e(n)基于s(n)与s(n)的估计之间的差值。
现在回到附图，其中相同的标号表示相同的部件，图3是根据本发明优选实施例的CELP编码器300的框图。如图所示，CELP编码器300类似于现有技术中所示的编码器，不同的是增加了基音分析电路311和HNW系数生成器309。另外，感知误差加权滤波器306适于从HNW系数生成器309接收HNW系数。如下进行编码器300的操作输入语音s(n)被引导至基音分析电路311，在此处分析s(n)以确定基音周期(D)。如同本领域的普通技术人员所知，基音周期(也称为基音迟滞、延迟或者基音延迟)通常是过去输入语音具有和当前输入语音的最大相关性时的时间迟滞。
一旦确定基音周期(D)，则将D引导至HNW系数生成器309，在此处确定特定语音的HNW系数(∈p)。如上所讨论，使谐波噪声加权系数作为基音周期D的函数动态变化。谐波噪声滤波器由下式给出C(z)=1-ϵp(D)Σi=-M1M2biz-(D+i).---(6)]]>如上所述，希望对于较大的D值具有较小的谐波噪声加权(C(z))。选择∈p作为D的减函数(参看公式7)确保对于较大的基音延迟值有较小的谐波噪声加权量。尽管存在许多函数∈p(D)，但在本发明的优选实施例中，∈p(D)由公式7给出，并图示于图4。
其中，∈max是谐波噪声加权系数的最大允许值；∈min是谐波噪声加权系数的最小允许值；Dmax是最大基音周期，在该值之上，谐波噪声加权系数被设置为∈min；Δ是谐波噪声加权系数的斜率。
一旦生成器309确定εp(D)，则将εp(D)提供至滤波器306以生成加权滤波器WH(z)。如上所述，WH(z)是W(z)与C(z)的乘积。误差被提供至加权滤波器306以生成误差信号e(n)。如同在现有技术的编码器中，误差加权滤波器306基于输入信号与估计的输入信号之间的差值产生加权误差矢量e(n)，即E(z)=WH(z)(S(z)-S^(z)).---(8)]]>加权滤波器WH(z)利用人耳的频率遮蔽特性，使得如果信号和噪声的频率接近，则同时出现的噪声被较强的信号遮蔽。基于e(n)的值，平方差最小化/参数量化电路307产生τ，k，γ，β的值，将这些值在信道上发送，或存储在数字媒体设备上。
如上所讨论，由于HNW系数是基音周期的函数，从而可执行更好的噪声加权，并且语音失真因此对于收听人更加不明显。
图5是表示编码器300的操作流程图。该逻辑流程开始于步骤501，在此处由基音分析电路311接收语音输入(s(n))。在步骤503，基音分析电路311确定基音周期(D)并将D输出至HNW系数生成器309。HNW系数生成器309利用D确定基于D的谐波噪声加权系数(εp)，并将εp输出至感知误差加权滤波器306(步骤505)。最后，滤波器306在步骤507利用εp产生感知噪声加权函数WH(z)。
尽管已经参考特定实施例表示并说明了本发明，但本领域的技术人员明白，在不脱离本发明的精神与范围的情况下可进行各种形式和细节上的改变。例如，尽管给出了由εp得到WH(z)的特定公式，但可以利用由εp得到WH(z)的其它方式。例如，公式6中C(z)定义的求和项可在与εp相乘之前进一步修改。此外，在替换实施例中，εp可基于τ，在公式(7)中用τ代替D(参见图6)。如上所讨论，τ被定义为闭环基音延迟，同时εp是τ的减函数。从而公式(7)变为其中，∈max是谐波噪声加权系数的最大允许值；∈min是谐波噪声加权系数的最小允许值；τmax是最大闭环基音延迟，在该值之上，谐波噪声加权系数被设置为∈min；Δ是谐波噪声加权系数的斜率。
权利要求
1.一种用于在数字语音编码器中执行谐波噪声加权的方法，该方法包括以下步骤接收语音输入s(n)；根据所述语音输入确定基音周期(D)；基于所述基音周期确定谐波噪声加权系数∈p；以及基于所述谐波噪声加权系数确定感知噪声加权函数WH(z)。
2.权利要求1所述的方法，其中∈p是D的减函数。
3.权利要求2所述的方法，其中其中∈max是所述谐波噪声加权系数的最大允许值；∈min是所述谐波噪声加权系数的最小允许值；Dmax是最大基音周期，在该值之上，谐波噪声加权系数被设置为∈min；以及Δ是所述谐波噪声加权系数的斜率。
4.一种用于在数字语音编码器中执行谐波噪声加权的方法，该方法包括以下步骤接收语音输入s(n)；根据所述语音输入确定闭环基音延迟(τ)；基于所述闭环基音延迟确定谐波噪声加权系数∈p；以及基于所述谐波噪声加权系数确定感知噪声加权函数WH(z)。
5.权利要求4所述的方法，其中εp是τ的减函数。
6.权利要求5所述的方法，其中其中，∈max是所述谐波噪声加权系数的最大允许值；∈min是所述谐波噪声加权系数的最小允许值；τmax是最大闭环基音延迟，在该值之上，谐波噪声加权系数被设置为∈min；Δ是所述谐波噪声加权系数的斜率。
7.一种装置，包括基音分析电路，将语音(s(n))当作输入并基于所述语音输出基音周期(D)；谐波噪声系数生成器，将D当作输入并基于D输出谐波噪声加权系数(∈p)；以及感知误差加权滤波器，将∈p当作输入并利用∈p生成加权误差信号e(n)，其中e(n)基于s(n)与s(n)的估计之间的差值。
8.一种装置，包括谐波噪声系数生成器，将闭环基音延迟(τ)当作输入并基于τ输出谐波噪声加权系数(∈p)；以及感知误差加权滤波器，将∈p当作输入并利用∈p生成加权误差信号e(n)，其中e(n)基于s(n)与s(n)的估计之间的差值。
全文摘要
为了满足选择谐波噪声加权(HNW)系数(ε
文档编号G10L21/02GK1875401SQ200480031797
公开日2006年12月6日申请日期2004年10月26日优先权日2003年10月30日
发明者乌达·米塔尔, 詹姆斯·P·阿什利申请人:摩托罗拉公司(在特拉华州注册的公司)

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：乌达.米塔尔;詹姆斯.Ｐ.阿什利
技术所有人：摩托罗拉公司（在特拉华州注册的公司）
我是此专利的发明人