具有改进谐波语音编码器的发射机的制作方法

文档序号:2820719阅读:179来源:国知局
专利名称:具有改进谐波语音编码器的发射机的制作方法
技术领域
本发明涉及具有语音编码器的发射机,所述语音编码器包括从语音信号中确定多个线性预测系数的分析装置,所述分析装置包括确定所述语音信号基频的基音确定装置,该分析装置还用于通过所述多个线性预测系数和所述基频确定表示所述语音信号多个谐波相关正弦信号的幅度和频率。
本发明还涉及语音编码器,语音编码方法和包括计算机程序在内实现所述方法的有形媒介。
根据前文的发射机从EP 259 950得知。
这种发射机和语音编码器用于语音信号必须通过传输容量有限的传输媒介传输或必须存储在存储容量有限的存储介质中的应用。这种应用的例子包括在Internet上传送语音信号,从移动电话向基站以及反之传送语音信号,和在CD-ROM上,在固态存储器中,或在硬盘驱动器上存储语音信号。
已经尝试了不同的语音编码器工作原理,以便在合适的比特率上获得合理的语音质量。这些工作原理中的一个就是用多个谐波相关正弦信号表示语音信号。发射机包括具有分析装置的语音编码器,该分析装置确定表示所述正弦信号基频的语音信号基音。该分析装置还用于确定所述多个正弦信号的幅度。
所述多个正弦信号的幅度可以通过确定预测系数,从所述预测系数中计算频谱,并且用基音频率抽样所述频谱获得。
已知发射机的一个问题是重建语音信号的质量低于期望值。
本发明的一个目的是提供根据前文具有改进重建语音质量的发射机。
为此,根据本发明的发射机,其特征在于分析装置包括基音调谐装置,调谐所述多个谐波相关信号的基频以最小化所述语音信号表示和所述多个谐波相关正弦信号表示之间的测量,发射机装置包括发射所述幅度和所述基频表示的发射装置。
本发明基于这样的认识,即分析装置确定的正弦信号的幅度和基音确定装置确定的基音之组合不构成语音信号的最佳表示。通过类似综合分析的方法调谐基音,有可能在不提高编码语音信号的比特率前提下获得提高质量的重建信号。
“综合分析”可以通过比较原始语音信号和根据幅度和实际基音值重建的语音信号完成。还可以确定原始语音信号的频率并且将它与正弦信号的幅度和基音值确定的频谱比较。
本发明的一个实施例的特征在于多个谐波相关语音信号的幅度和频率是基于实际非量化预测系数确定的,其中所述幅度的表示包括量化的预测系数,而增益因此是基于量化的预测系数和所述基频确定的。
从实验中发现,在量化预测系数的基础上进行“综合分析”会在重建的语音中导致不希望的人工因素。随后进行的实验显示,在“综合分析”中使用非量化预测系数并通过量化预测系数和(精确的)基频计算增益因子,可以避免人工因素。
本发明的另一个实施例的特征在于分析装置包括为基音调谐装置提供至少一个初始基音值的初始基音确定装置。
通过使用初始基音确定装置,有可能为综合分析确定靠近最佳基音值的初始值。这将减少寻找所述最佳基音值所需的计算量。
现在将参考附图解释本发明。在这里

图1,可以使用本发明的传输系统;图2,根据本发明的语音编码器4;图3,根据本发明的浊音编码器16;图4,在根据图3的浊音编码器16中使用的LPC计算装置30;图5,在根据图3的语音编码器中使用的基音调谐装置32;图6,在根据图2的语音编码器中用于清音的的语音编码器14;图7,在根据图1的系统中使用的语音解码器14;图8,在语音解码器14中使用的浊音解码器94;图9,浊音解码器94中各点呈现的信号图;图10,在语音解码器14中使用的清音解码器96。
在根据图1的传输系统中,语音信号送到发射机2的输入端。在发射机2中,语音信号在语音编码器4中编码。语音编码器4输出端的编码的语音信号被送到发射装置6。发射装置6用于完成对编码的语音信号的信道编码,交织和调制。
发射装置6的输出信号送到发射机的输出,并且通过传输媒介8传送到接收机5。在接收机5,信道的输出信号送到接收装置7。这些接收装置7提供RF处理,如调谐和解调,解-交织(如果适当)和信道解码。接收装置7的输出信号送到语音解码器9,该语音解码器将它的输入信号转换为重建的语音信号。
根据图2,语音编码器4的输入信号ss[n]由DC陷波滤波器滤波以从输入中消除不希望的DC偏置。所述DC陷波滤波器的截止频率(-3dB)是15Hz。DC陷波滤波器10的输出信号送到缓冲区11的输入。根据本发明,缓冲区11为浊音编码器16提供具有400个DC滤波的语音抽样的块。所述有400个抽样的块包括5个10毫秒的语音帧(每个80个抽样)。它包括要被编码的当前帧,两个以前和两个后续帧。缓冲区11以每帧的间隔将最近接收的有80个抽样的帧送到200Hz高通滤波器12的输入。高通滤波器12的输出连接到清音编码器14的输入和浊音/清音检测器28的输入。高通滤波器12为浊音/清音检测器28提供有360个抽样的块并为清音编码器14提供有160个抽样的块(如果语音编码器4工作在5.2kbit/sec模式)或有240个抽样的块(如果语音编码器4工作在3.2kbit/sec模式)。上述具有不同抽样的块和缓冲区11的输出之间的关系在下表中列出。<
浊音/清音检测器28确定当前帧是否包含浊音或清音,并且将结果作为浊音/清音标志给出。这个标志送到复用器22,再送到清音编码器14和浊音编码器16。根据浊音/清音标志的值,激活浊音编码器16或清音编码器14。
在浊音编码器16中,输入信号被表示为多个谐波相关的正弦信号。浊音编码器的输出提供一个基音值,一个增益值和一种16个预测参数的表示。基音值和增益值被送到复用器22相应的输入。
在5.2kbit/sec模式,每10毫秒进行一次LPC计算。在3.2kbit/sec,每20毫秒进行一次LPC计算,除非在清音到浊音(或反之)之间出现过渡。如果发生这样的过渡,在3.2kbit/sec模式,也是每10毫秒进行一次LPC计算。
浊音编码器输出的LPC系数由霍夫曼编码器24编码。在霍夫曼编码器24中,比较器比较霍夫曼编码序列的长度和相应的输入序列的长度。如果霍夫曼编码序列的长度大于输入序列的长度,就决定发射未编码的序列。否则决定发射霍夫曼编码序列。所述判决由送到复用器26和复用器22的“霍夫曼比特”表示。复用器26用于根据“霍夫曼比特”的值向复用器22传送霍夫曼编码序列或输入序列。在复用器26中结合使用“霍夫曼比特”具有确保预测序列的表示的长度不超过一个预定值的好处。不使用“霍夫曼比特”,复用器26就可能出现霍夫曼编码序列的长度超过输入序列的长度一部分,这样编码的序列就不再能够放入只为传输LPC系数保留了有限数目比特的发射帧。
在清音编码器14中确定一个增益值和6个预测系数来表示清音信号。这6个LPC系数由霍夫曼编码器18编码,该编码器在它的输出端给出一个霍夫曼编码序列和一个“霍夫曼比特”。霍夫曼编码序列和霍夫曼编码器18的输入序列被送到由“霍夫曼比特”控制的复用器20。霍夫曼编码器18和复用器20结合的操作与霍夫曼编码器24和复用器20的操作一样。
复用器20的输出信号和“霍夫曼比特”被送到复用器22的相应输入端。复用器22用于根据浊音-清音检测器28的判决选择编码的浊音信号或编码的清音语音信号。在复用器22的输出端得到编码的语音信号。
在根据图3的浊音编码器16中,根据本发明的分析装置由LPC参数计算单元30,精确基音计算单元32和基音估计器38构成。语音信号s[n]送到LPC参数计算单元30的输入。LPC参数计算单元30确定系数a[i],在量化,编码和解码a[i]之后确定量化预测系数aq[i],以及确定LPC码C[i],其中i的值从0-15。
根据发明的概念的基音确定装置包括初始基音确定装置(在这里是基音估计器38),和基音调谐装置(在这里是基音范围计算单元34和精确基音计算单元32)。基音估计器38确定粗略基音值,该值由基音范围计算单元34用来确定基音值,这个值再由后面称为精确基音计算单元32的基音调谐装置尝试,确定最终的基音值。基音估计器38提供由多个抽样表示的粗略基音周期。精确基音计算单元32中使用的基音值是由基音范围计算单元34根据下表通过粗略基音周期确定的。
在幅度谱计算单元36中,根据下式通过信号s[i]确定加窗的语音信号SHAMSHAM[i-120]=wHAM[i]·s[i] (1)在(1)中wHAM[i]等于wHAM=0.54-0.46cos{2&pi;((i+0.5)-120160};120&le;i&lt;280----(2)]]>加窗的语音信号SHAM使用512点FFT变换到频域。所述变换所获得的频谱Sw等于Sw[k]=&Sigma;m=0159SHAM[m]&CenterDot;e-j2&pi;km/512----(3)]]>其中,基音计算单元32中使用的幅度谱根据下式计算
精确基音计算单元32通过LPC参数计算单元30提供的a-参数和粗略基音值确定精确基音值,该精确基音值使根据(4)的幅度谱和包括多个幅度由所述精确基音周期抽样LPC谱确定的谐波相关正弦信号的信号的幅度谱之间的误差信号最小。
在增益计算单元40中,与目标谱精确匹配的最佳增益是使用量化的a-参数再合成的语音信号谱计算的,而不是向精确基音计算单元32那样使用非量化的a-参数。
在浊音编码器40的输出端,得到16个LPC码,精确的基音和增益计算单元40计算的增益。LPC参数计算单元30和精确基音计算单元32的操作在下面做更详细地描述。
在根据图4的LPC计算单元30中,加窗操作是由加窗处理器50在信号s[n]上进行的。根据本发明的一个方面,分析长度取决于浊音/清音标志的值。在5.2kbit/sec模式,LPC计算每10毫秒执行一次。在3.2kbit/sec模式,LPC计算每20毫秒执行一次,除非在浊音到清音(或反之)过渡期间。如果出现这样的过渡,LPC计算每10毫秒执行一次。
下表中给出了预测系数判决所涉及的抽样数。<
对出现过渡的5.2kbit/sec情况和3.2kbit/sec情况,窗可以写为wHAM=0.54-0.46cos{2&pi;((i+0.5)-120160};120&le;i&lt;280----(5)]]>加窗的语音信号这样建立SHAM[i-120]=wHAM[i]·s[i];120≤i<280 (6)如果在3.2kbit/s情况下没发生过渡,就在窗口的中间引入80个抽样的平顶部分将窗口扩展为跨越从第120抽样开始并且以第360抽样终止的240个抽样。这样,根据下式获得窗w′HAM
对加窗的语音信号可以写出下式。
SHAM[i-120]=wHAM[i]·s[i];120≤i<360 (8)自相关函数计算单元58确定加窗的语音信号的自相关函数RSS。所计算的相关系数的个数等于预测系数的个数+1。如果出现浊音帧,所计算的自相关系数的个数是17。如果出现清音帧,所计算的自相关系数的个数是7。出现浊音还是清音帧由浊音/清音标志告知自相关函数计算单元58。
自相关系数被所谓的滞后窗加窗以对自相关系数表示的谱获得一些平滑效果。平滑的自相关系数ρ[i]根据下式计算&rho;[i]=RSS[i]&CenterDot;exp(-&pi;f&mu;i8000);0&le;i&le;P----(9)]]>在(9)中,fμ是值为46.4Hz的谱平滑常数。加窗的自相关值ρ[i]送到Schur递归模块62,用递归的方法计算反射系数k[1]到k[P]。Schur递归对本领域的技术人员是众所周知的。
在变换器66中,P个反射系数ρ[i]被变换为在图3中的精确基音计算单元32中使用的a-参数。在量化器64中,反射系数被变换为对数域比值,随后这些对数域比值被均匀量化。所得到的LPC码C[1]…C[P]送到LPC参数计算单元的输出以便进一步传输。
在本地解码器54中,LPC码C[1]…C[P]被反射系数重建器54转换为重建的反射系数 。随后,重建的反射系数 被反射系数到a-参数转换器56转换为(量化的)a-参数。
这个本地解码用于得到在语音编码器4和语音解码器14中可以得到的相同的a-参数。
在根据图5的精确基音计算单元32中,基音频率候选选择器70通过从基音范围计算单元34接收的候选的个数,起始值和步长确定用于精确基音计算单元32的候选基音值。对每个候选者,基音频率候选选择器70确定基频f0,i。
使用候选频率f0,i,谱包络抽样器72在谐波位置抽样LPC系数所描述的谱包络。第i个候选者f0,i的k次谐波的幅度mi,k可以写作mi,k=|1A(z)|z=2&pi;k&CenterDot;f0,i----(10)]]>在(10)中,A(z)等于A(z)=1+a1·z-1+a2·z-2+…+ap·z-p(11)将z=ej&theta;i,k=cos&theta;i,k+j&CenterDot;sin&theta;i,k]]>和θj,k=2πkf0,i代入11,得到A(z)|&theta;=&theta;i,k=1+a1(cos&theta;i,k+j&CenterDot;sin&theta;i,k)+&hellip;+ap(cos&theta;P,k+j&CenterDot;sin&theta;P,k)----(12)]]>将(12)分为实部和虚部,可以根据下式获得幅度mi,kmi,k=1R2(&theta;i,k)+I2(&theta;i,k)----(13)]]>其中R(θi,k)=1+a1(cosθi,k)+…+αP(cosθi,k)(14)而I(θi,k)=1+a1(sinθi,k)+…+aP(sinθi,k) (15)根据编码器当前的工作模式,将谱线mi,k(1≤k≤L)与谱的窗函数W(根据(5)或(7)得到的160点汉明窗的8192点FFT)卷积得到候选谱
。可以预先计算8192点FFT并将结果存储在ROM中。在卷积处理中,执行了下抽样操作,因为必须将候选谱与256点的参考谱比较,多于256点的计算是无用的。因此,
可以写作|S^w,j[f]|=&Sigma;k=1Lmi,k&CenterDot;W(16&CenterDot;f-k&CenterDot;f0,i);0&le;f&lt;256----(16)]]>表达式(16)只对候选基音i给出了幅度谱的大体形状,而不是它的幅度。因此,谱
必须由增益因子gi修正,该增益因子由MSE-增益计算器78根据(17)计算gi=&Sigma;j=0256Sw[j]&CenterDot;S^w,i[j]&Sigma;j=0256(Sw[j])2----(17)]]>乘法器82使用增益因子gi缩放谱
。减法器84计算幅度谱计算单元36确定的目标谱的系数和乘法器82的输出信号之差。随后,求和平方器根据下式计算方差信号Ei。Ei=E(f0,i)=&Sigma;j=0255(|Sw[j]|-gi&CenterDot;|S^w,i[j]|)2----(18)]]>产生最小值的候选基频f0,i被选做精确的基频或基音。在根据本例的编码器中,共有368个可能的基音周期,需要用9bit编码。基音每10毫秒更新一次而不管语音编码器的工作模式。在根据图3的增益计算器40中,发射到解码器的增益是用上面对增益gi描述的相同方法计算的,只是使用量化的a-参数替代计算增益gi时使用的未量化的a-参数。发射到解码器的增益因子是6比特非线性量化的,对小的gi值使用小量化步长,对较大的gi值使用较大的量化步长。
在根据图6的清音编码器14中,LPC参数计算单元82的操作类似于根据图4的LPC参数计算单元30的操作。LPC参数计算单元82在高通滤波的语音信号上操作,而不象LPC参数计算单元30那样在原始语音信号上进行。另外,LPC计算单元82的预测阶数是6,而不是LPC参数基音计算单元30使用的16。时域加窗处理器84根据(19)计算通过汉宁窗的语音信号sw[n]=s[n]&CenterDot;(0.5-0.5cos(2&CenterDot;&pi;(i+0.5)-120160));120&le;i&lt;280----(19)]]>在RMS值计算单元86中,根据(20)计算语音帧的幅度的平均值guv=141N&Sigma;i=0159sw2[i]----(20)]]>发射到解码器的增益因子guv是5比特非线性量化的,对小的guv值使用小量化步长,对较大的guv值使用较大的量化步长。清音编码器14不确定激励参数。
在根据图7的语音编码器中,为霍夫曼解码器90提供霍夫曼编码的LPC码和浊音/清音标志。如果浊音/清音标志指示浊音信号,霍夫曼解码器90根据霍夫曼编码器18使用的霍夫曼表解码霍夫曼编码的LPC码。根据霍夫曼比特的值,所接收的LPC码由霍夫曼解码器90解码或直通到解复用器92。增益值和接收的精确基音值也送到解复用器92。
如果浊音/清音标志指示浊音帧,就将精确的基音,增益和16个LPC码送到谐波语音合成器94。如果浊音/清音标志指示清音帧,则将增益和6个LPC码送到清音合成器96。谐波语音合成器94输出的合成浊音信号v,k[n]和清音合成器96输出的合成清音信号uv,k[n]一起送到复用器98相应的输入端。
在浊音模式,复用器98将谐波语音合成器94的输出信号v,k[n]送到重叠相加综合模块100的输入端。在清音模式,复用器98将清音合成器96的输出信号uv,k[n]送到重叠相加综合模块100的输入端。在重叠相加模块100中,部分重叠的浊音和清音段被加在一起。重叠相加综合模块100的输出信号[n]可以写为
在(21)中,Ns是语音帧的长度,Vk-l是前一语音帧的浊音/清音标志,而vk是当前语音帧的浊音/清音标志。
重叠和块的输出信号[n]送到后置滤波器102。后置滤波器通过抑制共振区外的噪声增强感知的语音质量。
在根据图8的浊音解码器94中,基音解码器104解码从解复用器92接收的编码的基音并将其转换为基音周期。基音解码器104确定的基音周期送到相位合成器106的输入端,谐波振荡器组108的输入端和LPC谱包络抽样器110的第一输入端。
LPC解码器112解码从解复用器92接收的LPC系数。解码LPC系数的方法取决于当前语音帧包含浊音还是清音。因此,浊音/清音标志送到LPC解码器112的第二输入端。LPC解码器将量化的a-参数送到LPC谱包络抽样器110的第二输入端。LPC谱包络抽样器112的操作由(13),(14)和(15)描述,因为精确基音计算单元32完成相同的操作。
相位合成器106用于计算表示语音信号的第i阶正弦信号的相位k[i]。选择的相位k[i]使第i阶正弦信号从一帧到下一帧保持连续。浊音信号是通过合并重叠帧合成的,每一个重叠帧包括160个加窗的抽样。从图9中的图118和122可以看出两个相邻帧之间有50%重叠。图118和122中使用的窗用点划线表示。现在,相位合成器用于在重叠影响最大的位置提供连续的相位。这里使用的窗口函数的这个位置在抽样119。当前帧的相位k[i]现在可以写作
在当前描述的语音编码器中Ns的值等于160。对于最初的浊音150℃的油浴中加热6.5小时。生成的聚苯乙烯聚合物的分子量性质显示于表Ⅴ中。通过将油浴温度从125℃升至150℃,反应时间可显著减少。在实施例Ⅱ中,油浴温度为123℃,90%转变所需的反应时间为约69小时。当油浴温度为150℃时,在6.5小时内就可得到86%的转变率。与实施例Ⅱ相比,不需要在95℃的预反应,甚至于当所有反应物和反应剂在高温下立即互相反应时也不会导致多分散性的扩大。
表Ⅳ
表Ⅴ
实施例Ⅴ苯乙烯在150℃的本体聚合在氩气氛下将苯乙烯(15g,0.144mol)、过氧化苯甲酰(0.075g0.00031mol)和TEMPO(0.063g,0.00040mol)的溶液在保持在150℃的油浴中加热7小时。生成的聚苯乙烯聚合物的分子量性质显示于表Ⅵ中。
实施例Ⅵ
也可以在6kbit/sec的比特率上获得语音质量更好的语音编码器。这里所做的改进是确定多个谐波相关正弦信号的前8个谐波的相位。相位[i]是根据(25)计算的
其中θi=2πf0·i。R(θi),I(θi)等于R(&theta;i)=&Sigma;n=0N-1sw[n]&CenterDot;cos(&theta;i&CenterDot;n)----(26)]]>和I(&theta;i)=-&Sigma;n=0N-1sw[n]&CenterDot;sin(&theta;i&CenterDot;n)----(27)]]>这样得到的8个相位[i]被均匀量化为6比特并且包括在输出比特流中。
对6kbit/sec编码器的进一步改进是在清音模式传输附加的增益值。通常是用每2毫秒发射一个增益代替每帧一次。在紧接着过渡后的第一帧,发射10个增益值,其中5个表示当前的清音帧,另5个表示清音编码器处理的前一个清音帧。增益是从4毫秒的重叠窗中确定的。
应该注意到LPC系数的个数是12并且可能使用差分编码。
权利要求
1.一种具有语音编码器的发射机,所述语音编码器包括从语音信号中确定多个线性预测系数的分析装置,所述分析装置包括确定所述语音信号的基频的基音确定装置,该分析装置还用于通过所述多个线性预测系数和所述基频确定表示所述语音信号多个谐波相关正弦信号的幅度和频率,其特征在于分析装置包括基音调谐装置,调谐所述多个谐波相关信号的基频以最小化所述语音信号表示和所述多个谐波相关正弦信号表示之间的测量,发射机包括发射所述幅度和所述基频表示的发射装置。
2.根据权利要求1的传输系统,其特征在于多个谐波相关的语音信号的幅度和频率的确定实质上是基于非量化系数的,其中,所述幅度的表示包括量化的预测系数,和在量化的预测系数和所述基频的基础上确定的增益因子。
3.根据权利要求1或2的发射机,其特征在于分析装置包括为基音调谐装置提供至少一个初始基音值的初始基音确定装置。
4.根据前述一个权利要求的发射机,其特征在于语音编码器包括确定语音信号的频谱的谱分析装置,并且基音调谐装置用于最小化从所述幅度和基频中得到的谱与语音信号的频谱的谱之差。
5.一种语音编码器包括从语音信号中确定多个线性预测系数的分析装置,所述分析装置包括确定所述语音信号的基频的基音确定装置,该分析装置还用于通过所述多个线性预测系数和所述基频确定表示所述语音信号多个谐波相关正弦信号的幅度和频率,其特征在于分析装置包括基音调谐装置,调谐所述多个谐波相关信号的基频以最小化所述语音信号表示和所述多个谐波相关正弦信号表示之间的差别测量,发射机包括发射所述幅度和所述基频表示的发射装置。
6.根据权利要求5的语音编码器,其特征在于分析装置包括为基音调谐装置提供至少一个初始基音值的初始基音确定装置。
7.根据权利要求5或6的语音编码器,其特征在于语音编码器包括确定语音信号的频谱的谱分析装置,并且基音调谐装置用于最小化从所述幅度和基频中得到的谱与语音信号的频谱的谱之差。
8.一种语音编码方法包括从语音信号确定多个线性预测系数,确定所述语音信号的基频,从所述多个线性预测系数和所述基频确定多个表示所述语音信号的谐波相关正弦信号的幅度和频率,其特征在于该方法包括调谐所述多个谐波相关信号的基频以最小化所述语音信号表示和所述多个谐波相关正弦信号表示之间的差别测量。
9.根据权利要求8的方法,其特征在于该方法包括为基音调谐装置提供至少一个初始基音值。
10.根据权利要求8或9的方法,其特征在于该方法包括确定语音信号的频谱,并且该方法包括最小化从所述幅度和基频中得到的谱与语音信号的频谱的谱之差。
11.一种包括执行语音编码方法的计算机程序的有形媒介,该方法包括从语音信号中确定多个线性预测系数,从所述语音信号中确定基频,从所述多个线性预测系数和所述基频确定表示所述语音信号的多个谐波相关正弦信号的幅度和频率,其特征在于该方法包括调谐所述多个谐波相关信号的基频以最小化所述语音信号表示和所述多个谐波相关正弦信号表示之间的差别测量。
全文摘要
在谐波语音编码器(16)中,要编码的语音信号由多个LPC参数计算单元(30)确定的LPC参数,一个基音值和一个增益值表示。语音编码器包括一个确定粗略基音的(粗略)基音估计器(38)和一个通过粗略基音值确定精确基音的精确基音计算单元(20)。这种对精确基音值的确定是通过综合分析法完成的,选择使合成语音信号表示与原始语音信号表示之间的误差测量最小的精确基音值。
文档编号G10L25/90GK1231050SQ98800966
公开日1999年10月6日 申请日期1998年6月5日 优先权日1997年7月11日
发明者R·陶里, R·J·斯勒伊特, A·J·格尔里茨 申请人:皇家菲利浦电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1