专利名称:一种基于melp的多帧联合量化低速率语音编解码方法
技术领域:
本方法涉及到无线通信系统中的一种低速率语音编码方法,特别涉及一种基于混合激励线性预测编码(MELP)的多帧联合量化低速率语音编解码方法,该方法适合无线通信系统在通信条件差、背景噪声复杂的环境下占用极少的频谱资源实现语音信号的可靠传输,属于无线通信技术领域。
背景技术:
随着当前无线通信业务的不断扩展和传输数据量的不断增大,未来无线通信系统要求更高的数据传输效率和传输准确率,特别是日常最基本的语音通信。然而当前无线通信频谱资源日渐紧张,通信的电磁环境日渐恶劣,无线语音通信可用信道越来越窄,低速率语音编码作为提高频谱利用率的有效解决方案应运而出。当前无线通信系统广泛地采用基于人体语音发声模型的参数编码方案如混合激励线性预测编码(MELP)、多带激励编码(MBE)、正弦变换编码(STC)和波形内插编码(WI)。四种方案均是以人体发声的数学模型为基础,通过在解码端对语音信号进行分帧处理,以帧为单位进行合成端所需关键性参数如线谱对频率(lsf)、基音周期(pitch)、增益G等的提取,然后进行矢量量化和线性量化,最后将量化结果输出,上述几种方案的差别仅仅在于编码端参数的提取和处理以及解码端语音信号重构时激励信号的构造和选择上。然而,随着当前无线语音通信数据量的不断增大、通信环境的不断恶劣和可用频谱资源的日渐紧张,现有编码方案因其编码速率多在2. 4-4. 8kb/s已无法满足当前的需求,如何研究设计一种有效的低速率语音编解码方案,使之在有限的信道资源下进行可靠地语音通信成为无线多媒体通信和信号处理领域的技术研究热点之一。当前国内外的许多专家学者在现有参数编码方案的基础上,提出了进一步降低编码速率的多帧参数联合量化方案,即在解码端以对语音信号的单帧参数提取为基础,依照设定的多帧长度N将相邻的N个单帧的参数联合起来进行统一量化,以线谱对频率参数(Isf)为例,单帧信号的Isf参数为10维矢量,采取四级残差矢量量化,而多帧参数联合量化方案中则将N个单帧的Isf联合组成一个N*10维矢量,统一进行四级残差矢量量化,在解码端通过对量化码本依照量化标号的索引获取恢复后的参数,从而进行语音信号的重构。由此可见编码端对关键性参数的精细量化方案和解码端对参数的精确恢复是参数编码的重点,同时也是本发明的出发点和切入点,如何能够在保证参数量化精确度的同时有效降低传递参数的维数和量化方案的计算复杂度、编解码延时是当前低速率语音编码研究领域的热点。论文《A VARIBLE LOW BIT RATESPEECH CODER BASED ON MELP》和《A 600 BPSMELP VOCODER FOR USE ON HF CHANNELS》中提到的对于语音信号分别采取四帧和六帧的联合量化,文献《一种基于MELP的600b/s极低速率语音编码》中出现的对于语音信号在编码端采取三帧的联合量化,但参数传递时只传递首帧和末帧,解码端对于参数采取硬判决性质的巾贞间线性插值预测,论文《Joint OptimizationAlgorithm of Mult1-parameterCodebook Size Based on Superframe Mode》中对于所有的多巾贞参数米取基于信号清池状况的动态化码本量化,都在一定程度了降低编码速率,但是标准语音的主观和客观测试效果显示过多的单帧参数联合导致传递参数维数过多,参数量化过程中进行矢量量化时候所需时间较长,在编码方案延时效应上效果较差;对于多帧参数在解码端过于简单的采取硬性判决下的帧间线性预测导致参数重构失真较大,极易导致倍频信号的干扰,重构信号可懂度较差,这与参数编码以重构信号可懂度为第一目标是不相符的,而多帧信号的所有参数基于清浊情况的动态化尺寸码本量化,导致编码端在参数量化时需要准备数量过多的码本,在具体实现过程中占用存储较大,造成了参数量化的执行效率较低。因此,设计一种基于多帧参数联合量化的采用最佳权值加权的帧间线性预测、计算复杂度和量化效果兼顾优化的低速率语音编解码方案是本发明的研究内容。
发明内容
1、目的为了实现在较窄信道和复杂电磁环境下无线通信中可靠地低速率语音编码,将基于参数编码的多帧参数联合量化方案应用到语音压缩编解码系统中,以提高系统的整体通信性能。传统的多帧参数联合量化方案选取的多帧个数随意化严重,存在四帧五帧六帧多种情况,对于关键性参数如线谱对频率Isf 采取的是全部保留,组成多维矢量量化N*10维传送,搜索码本时所需时间较长,算法延时无法满足通信基本要求,部分传输方案中采取帧间线性预测,即参数只传递部分,解码端采取硬判决权值加权的帧间线性预测,即首帧和末帧同时为清音或者浊音则权值因子r取值0. 5,首帧为浊音,末帧为清音则r取值为0. 8,首帧为清音,末帧为浊音则r取值为0. 2,这样无法将r与信号的清浊信息进行有效契合,参数恢复失真度较大从而导致信号出现杂波信号干扰;基于信号清浊的参数量化码本尺寸动态化方案,所需存储的量化码本较多,占用存储空间大,同时多个码本搜索计算复杂度高。为了提高多帧参数联合量化方案的编解码性能,本发明的目的是提供一种基于MELP的多帧联合量化低速率语音编解码方法,它是在多帧参数联合量化的基础上,以混合性激励线性预测编码(MELP)为例,针对多帧联合中关键性参数线性插值权值因子取值和基音周期动态化码本量化提出一种新的解决办法,充分考虑到相邻五帧信号的清浊变化与线性预测中插值因子的联系,对于关键参数基音周期Pitch依照清浊状态采用动态化尺寸的量化码本进行量化,降低算法计算的复杂度,从多方面提升参数量化的精细度和参数重构的准确度,提高在低码率条件下语音信号编解码的可靠性和频谱利用率,提升无线通信系统的语音通信性能。2、技术方案本发明的主要特征在于编码端,首先对语音信号进行预处理,去除工频信号的干扰,选取帧长为25ms,进行以帧为单位的关键性参数提取,提取的关键性参数包括线谱对频率Isf、基音周期pitch、增益G、带通信号vp,与传统的MELP/2. 4kb/s编码标准相比较,本发明舍弃了主要用于调节重构语 音信号自然度的参数傅氏级数幅值Fm和非周期性抖动标志位jitter,然后将相邻三帧信号的参数联合起来组成一个多维的矢量,进行矢量量化,获得量化标号后编码工作完成。解码端通过量化得到的标号依照量化码本进行索引查询,得到对应的参数数值,其中对于线谱对频率参数Isf需要将前后相邻的连续五帧信号的清浊信息嵌入到线性插值公式中,依照给定的方案选取最合适的插值因子。参数完全恢复后经过合成滤波器得到重构语音信号,完成解码工作。
图1给出的是编码端对参数的提取和量化过程,提取的参数主要包括线谱对频率lsf、基音周期pitch、增益G、带通信号vp。编码端的基本步骤如下步骤一确定各参数量化所用比特数目,计算编码速率。步骤二 输入语音信号经过预处理去除工频信号干扰,进行分帧处理,单帧信号时间长度为25ms计算参数,依照图2给出的针对线谱对频率Isf所采用的多级残差进行矢量量化。步骤三依照图3给定的线性插值的权值因子r的确定过程进行r的确定。步骤四依照图4给定的基音周期量化动态码本尺寸的确定进行不同模式下的码本确定。步骤五设定巾贞数number=l将连续三巾贞信号的参数进行联合组成超级中贞,进行统一矢量量化线谱对频率参数Isf采取部分传递,只传递第一帧和第三帧,即IsMlsf1, I Sf3), 20 维信号;增益参数 G=(Gia,Glj2, G2j1, G2j2, G3a, G3,2),首先计算均值
,将增益进行去均值处理然后进行矢量量化,均值进行线性均
6
匀量化;基音周期pitch= (Pl,P2, P3),取对数后进行矢量量化,量化码本的尺寸依照三帧信号的清浊动态变化;带通信号的清浊VP中第一子带的清浊VP1作为整帧信号的清浊全部传送,后四个子带的清浊则按顺序组成一个12维的矢量进行矢量量化,量化码本尺寸固定。步骤六将之前步骤所得的参数进行7,4汉明码和8,4汉明码的差错控制编码,组成二进制比特流进行传送。其中,编码端步骤二中所述的“依照图2给出的针对线谱对频率Isf所采用的多级残差进行矢量量化”,其具体实现过程如下步骤1:首帧信号的参数Isf1与末帧信号的参数Isf3联合组成量化矢量Isf= (Isf1, Isf3),20维信号,量化次数n设为1.步骤2 :对输入信号进行矢量量化,计算Isf与码本中每一个码矢之间的欧氏距离。计算公式必=!>,(/私-kf,j s其中Isfi代表输入矢量的第i维上的数值,w代表码
I I
本中的第j个码矢的第i维上的数值,Wi代表权值因子,对所有欧式距离进行比较,最小值对应的标号即为量化结果。步骤3 :判断量化次数是否达到n,满足则量化过程结束,未达到则计算残差信号cancha = kf — lsf ;然后将cancha当作待量化矢量跳回步骤2继续进行。其中,编码端步骤三中所述的“依照图3给定的线性插值的权值因子r的确定过程进行r的确定”其具体实现过程如下
步骤1:依照五帧信号的清浊信息即带通信号Vp=(Vl,V2, v3, v4, V5)进行分类,其中取值为I代表信号是浊音信号,取值为0代表信号为清音信号。特殊情况为当V2=V4=I和V2=V4=O时权值因子r取值为常值0. 5。步骤2 :去除上述特殊情况的前提下,依照vp进行分类,具体分类如表I所示。对于特定分类下的插值因子,设定&/2 = + Cl - ) * kf\i =在A G (0, I)求解
权利要求
1.一种基于MELP的多帧联合量化低速率语音编解码方法,其特征在于该方法具体步骤如下 编码端的基本步骤如下 步骤一确定各参数量化所用比特数目,计算编码速率; 步骤二 输入语音信号经过预处理去除工频信号干扰,进行分帧处理,单帧信号时间长度为25ms计算参数,依照给出的针对线谱对频率Isf所采用的多级残差进行矢量量化;步骤三依照给定的线性插值的权值因子r的确定过程进行r的确定;步骤四依照给定的基音周期量化动态码本尺寸的确定进行不同模式下的码本确定;步骤五设定帧数number=l将连续三帧信号的参数进行联合组成超级帧,进行统一矢量量化线谱对频率参数Isf采取部分传递,只传递第一帧和第三帧,即IsMlsf1, I Sf3), 20 维信号;增益参数 G=(Gia,Glj2, G2j1, G2j2, G3a, G3,2),首先计算均值
2.根据权利要求1所述的一种基于MELP的多帧联合量化低速率语音编解码方法,其特征在于编码端步骤二中所述的“依照给出的针对线谱对频率Isf所采用的多级残差进行矢量量化”,其具体实现过程如下 步骤1:首帧信号的参数I s 与末帧信号的参数I s f3联合组成量化矢量IsMlsf1, Isf3), 20维信号,量化次数η设为I ; 步骤2 :对输入信号进行矢量量化,计算Isf与码本中每一个码矢之间的欧氏距离;计 算公式cfe = YdWiHsfl-1sfuY 3其中Isfi代表输入矢量的第i维上的数值,代表码本中的第j个码矢的第i维上的数值,Wi代表权值因子,对所有欧式距离进行比较,最小值对应的标号即为量化结果; 步骤3 :判断量化次数是否达到n,满足则量化过程结束,未达到则计算残差信号ccmcha = !,sf-lsf,然后将cancha当作待量化矢量跳回步骤2继续进行。
3.根据权利要求1所述的一种基于MELP的多帧联合量化低速率语音编解码方法,其特征在于编码端步骤三中所述的“依照给定的线性插值的权值因子r的确定过程进行r的确定”其具体实现过程如下 步骤1:依照五帧信号的清浊信息即带通信号VP=(Vl,V2, v3, v4, v5)进行分类,其中取值为I代表信号是浊音信号,取值为O代表信号为清音信号,特殊情况为当V2=V4=I和V2=V4=O时权值因子r取值为常值O. 5 ; 步骤2 :去除上述特殊情况的前提下,依照vp进行分类,具体分类如下表I所示,对于特定分类下的插值因子,设定
4.根据权利要求1所述的一种基于MELP的多帧联合量化低速率语音编解码方法,其特征在于编码端步骤四中所述的“依照给定的基音周期量化动态码本尺寸的确定进行不同模式下的码本确定”,其具体实现过程如下 步骤1:首先判断三帧信号的清浊,依照其中浊音信号个数改变量化码本的尺寸,浊音信号个数越多,量化码本的尺寸越大;当三帧信号均为清音信号时,基音周期均为默认值50,此时码本尺寸为I,码本中仅有一个码矢P= (50,50,50); 步骤2 :当三帧信号中仅有一帧信号为浊音时量化码本尺寸统一设定为Mim1,当三帧中有两帧信号为浊音信号时量化码本尺寸设定为num2 ; 步骤3 :当三帧信号均为浊音信号时设定码本量化尺寸为num3,此时将全清音信号时节省下的码本尺寸赋给全浊音信号;所有码本的尺寸关系满足公式Σ · = 2、+、,对于不同的清浊模式下采用LBG算法训练对应的量化码本。
全文摘要
一种基于MELP的多帧联合量化低速率语音编解码方法,编码端对信号首先采取单帧25ms长度处理,依次提取参数线谱对频率lsf、基音周期pitch、带通清浊vp和增益G,然后以相邻三帧为单位进行联合量化,其中vp采取3维的单码本量化,pitch先对数化后采取依照信号清浊的动态化尺寸的码本量化,G先进行去均值化再单码本量化,lsf只将首帧的和末帧的组成20维矢量进行四级残差矢量量化,解码端对于G、lsf、pitch首先采取解码本处理,然后针对lsf采取插值因子加权的帧间线性预测获得中间帧的lsf,插值因子r求解过程中嵌入了前后相邻五帧信号的清浊信息,充分考虑到了语音信号的频谱连续性和平稳性。因此,本发明有效地将编码速率降低1.2kb/s以下,对于低速率语音编码技术的研究和应用有很大的参考价值。
文档编号G10L19/135GK103050122SQ20121055196
公开日2013年4月17日 申请日期2012年12月18日 优先权日2012年12月18日
发明者修春娣, 苏兆安, 刘建伟 申请人:北京航空航天大学