立体声编码方法及其装置、立体声解码方法及其装置的制作方法

文档序号:7695326阅读:311来源:国知局
专利名称:立体声编码方法及其装置、立体声解码方法及其装置的制作方法
技术领域
本发明涉及编解码技术,具体涉及立体声编码方法及装置、立体声解码方法及其装置。

背景技术
在低码率的声音编解码应用中,为了尽量减少传输数据量,提高低码率条件下的传输效率,可以只传输单声道信号。但是,单声道信号给听者的感觉是从头部内产生声音,如果收听时间较长则会产生不舒服的感觉,因此希望能在低码率条件下引入立体声的效果。其中,低码率是指单位时间内传输较少的比特位。
目前的立体声编解码方案有纯粹的后处理方案、和差立体声方案和扩展的宽带自适应多速率(AMR-WB+,Extended AdaptiveMulti-Rate-Wideband)立体声编解码方案。
其中,单纯的后处理方案是在解码器端向所接收的单声道信号中添加一个延时信号,从而构建出双声道立体声信号,以建立立体声感觉。这种方法的优点是只需传输单声道信号,占用码率空间小。但是,后处理方案不能区分原始信号是单声道信号还是立体声信号,即使原始信号为单纯的单声道信号,也将被盲目的转换成立体声信号,此时,听者会感觉到不舒服,而且这种情况经常发生在语音信号的录音中。此外,这种后处理的方案仅能建立类似立体声的感觉,并不能准确恢复出原始信号声像的位置。
和差立体声方案利用原始信号左右声道的相关性,分别对左右声道的和信号和差信号进行波形编码,其中,

为左声道信号,

为右声道信号,

为和信号,

为差信号;



都是具有长度和方向的向量。但是,和差立体声方案需要传输和信号和差信号,因此在低码率编码应用中需占用较多的码率空间,因此传输效率不高。只有原始信号左右声道极其相似的情况下,差信号所需比特数才有所减少,此时才能体现出高效率。而在很多情况下,例如左右声道分别录制不同的乐器,或者左右声道声像较偏、左右声道信号能量相差很大的情况下,这种同时传输差信号的处理就无法在低码率的条件下达到较好的效果。因此,和差立体声方案在低码率的条件下并不能达到较好的效果。
扩展的宽带自适应多速率(AMR-WB+,Extended AdaptiveMulti-Rate-Wideband)立体声编解码方案,是目前较为有效的立体声编码技术。但是,该方案中的立体声编码技术采用时域滤波方法实现,其分辨率不高,解码后生成的立体声声音质量也比较低,不能更好的接近原始立体声。
因此,研究一种低码率下对立体声的高质量编码是亟待解决的问题。


发明内容
有鉴于此,本发明提供了一种立体声编码方法,能够实现低码率下对立体声的高质量编码。
该方法包括 A、编码端提取表征立体声中第一声道频谱与第二声道频谱的能量比的第一立体声参数,表征第一声道和第二声道的加权差频谱与加权和频谱能量比的第二立体声参数,并获取第一声道和第二声道的加权和频谱; 其中,所述加权的权值为所述第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个; B、对所述加权和频谱、第一立体声参数和第二立体声参数进行编码,向解码端发送。
本发明还提供了一种立体声解码方法,能够实现低码率下对立体声的高质量编码。
该方法包括 A、解码端接收立体声第一声道与第二声道的加权和频谱,以及第一立体声参数和第二立体声参数;所述第一立体声参数表征第一声道频谱和第二声道频谱的能量比,所述第二立体声参数表征第一声道和第二声道的加权差频谱与加权和频谱的能量比; 其中,所述加权的权值为所述第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个; B、利用加权和频谱与采用第二立体声参数进行缩放的缩放后加权差频谱具有等幅垂直的特点,计算加权差频谱; C、根据所述加权和频谱、加权差频谱以及第一立体声参数,恢复第一声道频谱和第二声道频谱。
本发明还提供了一种立体声编码装置,能够实现低码率下对立体声的高质量编码。
该装置包括第一参数提取单元、第二参数提取单元、加权单元和发送单元; 所述第一参数提取单元,用于提取表征立体声第一声道频谱和第二声道频谱的能量比的第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个; 所述加权单元,用于获取每个频点上第一声道和第二声道的加权和频谱,所述加权的权值为所述第一立体声参数; 所述第二参数提取单元,用于提取表征第一声道和第二声道加权差频谱与所述加权和频谱之间能量比的第二立体声参数; 所述发送单元,用于向解码端发送从第一参数提取单元获取的第一立体声参数、从第二参数提取单元获取的第二立体声参数和从加权单元获取的加权和频谱。
本发明还提供了一种立体声解码装置,能够实现低码率下对立体声的高质量编码。
该装置包括接收单元、中间参数求取单元和恢复单元; 所述接收单元,用于接收立体声第一声道与第二声道的加权和频谱,以及第一立体声参数和第二立体声参数;所述第一立体声参数表征第一声道频谱和第二声道频谱之间的能量比,所述第二立体声参数表征第一声道和第二声道的加权差频谱和加权和频谱的能量比;所述加权的权值为第一立体声参数; 其中,所述加权的权值为第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个; 所述中间参数求取单元,用于利用加权和频谱与采用第二立体声参数进行缩放的缩放后加权差频谱具有等幅垂直的特点,计算加权差频谱; 所述恢复单元,用于根据所述加权和频谱、加权差频谱以及第一立体声参数,恢复第一声道频谱和第二声道频谱。
根据以上技术方案可见,本发明采用频域编码方法实现,其分辨率较高,解码后生成的立体声声音质量也相对较高,能够较好的接近原始立体声,提高了立体声编解码质量。而且,经编码,只需传输加权和声道频谱以及两个立体声参数,有效地提高了低码率条件下的传输效率。
在解码端,利用左右声道的加权和以及加权差近似垂直这一隐含参数,得到加权差,并采用加权和、加权差以及作为加权权值的第一立体声参数恢复得到左右声道频谱,整个恢复过程没有进行正弦、余弦等角度计算,因此大大降低了解码端的解码复杂度,从而减小了解码时间。
较佳地,当根据最小均方差准则对加权和以及两个立体声参数的求取进行优化后,令加权和以及两个立体声参数的取值能够使得左右声道均方差之和最小,则,恢复出的立体声解码信号更加接近原始信号,进一步提高了立体声编解码质量。



图1为本发明实施例中立体声编码方法的流程图。
图2为本发明实施例中立体声编码模式模型图。
图3为本发明实施例中立体声解码方法的流程图。
图4为本发明实施例中立体声编码装置的结构示意图。
图5为本发明实施例中立体声解码装置的结构示意图。

具体实施例方式 本发明实施例所提供的立体声编解码方案属于参数立体声方案,其基本思想为编码端提取表征立体声信号特征的立体声参数,只传输左右声道的加权和频谱以及所提取的参数,从而减少所传输数据数量,以达到低码率条件下较好的传输效率。所提取的立体声参数分别是表征左右声道能量比的第一立体声参数,和表征左右声道加权差和加权和能量比的第二立体声参数。
加权和频谱的求取方式是将左右声道中的第二声道频谱进行长度缩放,使得缩放后第二声道频谱与未缩放的第一声道频谱能量相等,然后将未缩放第一声道频谱和缩放后第二声道频谱进行向量相加,得到的加权和频谱。
加权差频谱是将上述未缩放第一声道频谱和缩放后第二声道频谱相减得到的。
由于未缩放第一声道和缩放后的第二声道能量相等,因此加权和频谱与加权差频谱之间的角度关系是垂直的。那么当通过第二立体声参数对加权差进行缩放,就可以得到缩放后的加权差频谱,该缩放后的加权差频谱与加权和频谱垂直且等长。
那么,在解码端,当接收到加权和频谱时,能够获取其等幅垂直的缩放后加权差频谱,然后利用第二立体声参数进行缩放,得到原始的加权差频谱。然后利用加权和频谱以及加权差频谱,得到左声道和缩放后的右声道,最后利用第一立体声参数对缩放后的右声道进行缩放,从而获得原始右声道频谱。
从以上所述可以看到,本发明解码端恢复立体声所利用的数据不仅包括所传输的加权和频谱以及两个立体声参数,还包括加权和频谱与缩放后的加权差频谱具有等幅垂直这一特点,实际上这一特点是解码时所利用的必不可少的隐性参数。该隐性参数不必在码流中传输,减少了传输码流的比特数,提高了低码流下的传输效率,而且,利用该隐性参数只需将加权和频谱进行等幅垂直的变换处理,而频谱信号是由实部和虚部组成的,所谓等幅垂直处理就是对加权和的虚部取负,然后将实部数值和取负后的虚部数值进行实虚部的调换,得到缩放后的加权差频谱。然后再利用第一立体声参数和第二立体声参数进行乘除运算,得到第一声道频谱和第二声道频谱。整个计算过程无需任何的角度计算,降低了解码复杂度,从而减少了解码端的解码时间。
下面,结合附图并举实施例,对本发明进行详细描述。
图1为本发明实施例中立体声编码方法的流程图。该实施例以第一声道为左声道,第二声道为右声道为例,进行描述。如图1所示,该方法包括以下步骤 步骤100分别对立体声的左声道信号和右声道信道进行离散傅立叶变换(DFT)变换,得到DFT变换域上的左声道频谱和右声道频谱。
步骤101分别将立体声的左声道频谱和右声道频谱划分为K个子频带,K为正整数。
在DFT变换域上,各子频带内的左声道频谱

和右声道频谱

都是频谱向量,具有实部和虚部。子频带内的



的表达式为 其中,xl和yl分别为左声道频谱的实部和虚部,xr和yr分别为右声道频谱的实部和虚部,k为子频带标号,i为子频带内的频率点标号。以下描述中涉及到

就表示


表示
步骤102分别在每个子频带k内,提取各子频带中表征左声道频谱和右声道频谱能量比的第一立体声参数

k=1、2......K。
本步骤中,第一立体声参数为左声道频谱的能量与右声道频谱的能量之间的比值,其计算方法可以采用以下公式 其中,EL(k)和ER(k)分别为子频带k的左声道能量和右声道能量。子频带k内的声道能量是对该子频带声道向量取模的平方。计算声道能量的方式为已知技术手段,这里就不再详述。
步骤103采用第一立体声参数

作为右声道频谱的缩放比,计算缩放后右声道频谱

,使得缩放后右声道频谱

与未缩放的左声道频谱

的能量相等。
本步骤中,缩放后的右声道频谱

采用如下公式计算 参见图2示出的本发明实施例中立体声编码模式模型图,图中的向量



分别表示左声道频谱和右声道频谱,采用



进行缩放后,得到与

方向相同,与

长度相同的

。从物理意义上讲,图2中的



能量相等。
步骤104对于子频带k内的每个频率点i,计算该频率点的加权和频谱

和加权差频谱

。其中,所谓加权是指对右声道

加权,加权权值为

或者说,本步骤是求取



的和频谱与差频谱。
需要说明的是,每个频率点i都具有其对应的



,但是,处于同一子频带的频率点共用相同的

和gd(k)。对



这些向量进行运算时,是对每一个频率点i分别进行运算。以下就不再重复说明。
本步骤中,加权和频谱

以及加权差频谱

的计算方法可以采用如下公式 从以上公式(5)和(6)可以看出,解码端可以根据

gr(k)和

恢复出



那么如何得到

就是一个关键问题。
如图2所示,经步骤103的缩放后,左声道频谱

的能量与缩放后右声道频谱

的能量近似相等,根据



获得的加权和频谱

和加权差频谱

也近似垂直,但是长度并不相等。那么如何在解码端根据

以及垂直关系得到

呢?从图2中可以看到,如果根据

计算其等幅垂直的正交频谱

,那么将

乘以一个长度系数,就可以得到

以下步骤105就是计算这个长度系数,即第二立体声参数gd(k)的具体方式。
步骤105产生与加权和频谱

等幅垂直的正交频谱

,即缩放后加权差频谱,提取表征加权差频谱

和正交频谱

之间能量比的第二立体声参数gd(k)。
较佳地,在本步骤中,由于



等幅,因此二者能量相等。而且考虑到在编码端求取出来的正交频谱

并实质上的作用,因此本步骤可以直接求取加权差频谱

和加权和频谱

的能量比,作为gd(k)。gd(k)的计算方法可以采用以下公式 从公式(7)中可以看出,该公式根据



能量相等,即ED=EM,得到,然后将公式(6)代入该表达式,得到公式(7)的计算声道能量的方式为已知技术手段,这里就不再详述。
本步骤中得到的gd(k)反映了



的长度比,因此,解码端就可以将gd(k)作为正交频谱

的缩放比从而计算

,计算

的公式为 步骤106对加权和频谱

进行波形编码,对

和gd(k)进行量化编码,将编码结果输出到发给解码端的比特流中。当然,也可以直接传输gr(k)。
至此,本流程结束。
需要说明的是,以上求取

gr(k)和gd(k)都是在各子频带内完成的。每个子频带都具有对应的

gr(k)和gd(k)。在恢复时,也是采用各子频带对应的

gr(k)和gd(k)恢复得到各子频带的左右声道频谱,经逆DFT变换后,求出合成立体声信号。
以下图3示出的流程就是本发明实施例中立体声解码方法的流程图。如图3所示,该方法包括以下步骤 步骤301将从码流中获取的数据进行逆量化解码后,得到加权和频谱

以及每个子频带的

和gd(k)。当然如果编码端传输的是gr(k),解码端只需要对其进行倒数运算,即可得到第一立体声参数

传输gr(k)还是

是由编码端和解码端预先约定的。
步骤302利用加权和频谱

与采用gd(k)作为缩放比的缩放后加权差频谱

之间具有等幅垂直这一特点,计算加权差频谱
本步骤中,计算

的过程具体包括以下步骤 a1、产生与加权和频谱

等幅垂直的正交频谱

及采用gd(k)作为缩放比的缩放后加权差频谱; 若, 则, 其中,xm和ym分别为加权和频谱的实部和虚部; b1、根据公式(8),利用得到的gd(k)将正交频谱

进行缩放,得到加权差频谱
步骤303根据加权和频谱

加权差频谱

以及作为加权权值的第一立体声参数gr(k),恢复左声道频谱

和右声道频谱
本步骤中,具体恢复过程包括以下步骤 a2、根据公式(6)中将



相加,得到左声道频谱
b2、根据公式(5)中利用



得到缩放后的右声道频谱
c2、根据公式(4)中利用gr(k)对

进行缩放,得到原始右声道频谱
在实际恢复过程中,步骤302和303可以简化为如下两个步骤 步骤一、根据公式(9)和(10)产生与加权和频谱

等幅垂直的正交频谱
步骤二、利用如下公式(11)和(12)获得


经过以上步骤的执行,可以得到各子频带的






就合成了立体声信号的频谱。
步骤304对立体声信号的频谱进行逆DFT变换,得到合成的立体声信号。
至此,本流程结束。
从以上实施例中的编码方法和解码方法来看,本发明采用频域编码方法实现立体声的编解码,其分辨率较高,解码后生成的立体声声音质量也相对较高,能够较好的接近原始立体声,提高了立体声编解码质量。而且,经本发明实施例中的编码,只需要传输加权和声道频谱以及两个立体声参数,有效地提高了低码率条件下的传输效率。
在解码端,利用左右声道的加权和以及加权差近似垂直这一隐含参数,得到加权差,并采用加权和、加权差以及作为加权参数的第一立体声参数恢复得到左右声道频谱,整个恢复过程没有进行正弦、余弦等角度计算,因此大大降低了解码端的解码复杂度,从而减小了解码时间。
为了能够进一步提高立体声编解码质量,令恢复的立体声解码信号更加接近原始信号,减少恢复信号与原始信号之间的误差,本发明在上述实施例的基础上,根据最小均方差准则对

gr(k)和gd(k)的求取进行优化,令优化后的

gr(k)和gd(k)的取值能够使得左右声道均方差之和最小。
优选地,为了体现误差在左右声道的分配程度,在计算左右声道均方差之和时,进行加权处理,使得

gr(k)和gd(k)的取值能够令左右声道均方差的加权和最小。
本发明实施例仍以第一声道为左声道,第二声道为右声道为例,对

gr(k)和gd(k)的优化过程进行详细描述,其优化流程如下 首先,建立求取子频带k内左右声道均方差加权和的表达式 其中,i∈band(k)是指i取子频带k内的频率点;εl(k)为左声道均方差之和,εr(k)右声道均方差之和,

为解码端接收到的左声道频谱,

为解码端编码前的原始左声道频谱,

为解码端接收到的右声道频谱,

为解码端编码前的原始右声道频谱;g(k)为重要度因子,反映了编码误差在左右声道的分配程度。在实际应用中,g(k)可以为常数1,也可以为左右声道信号的能量比。当g(k)为能量比时,右声道能量越弱,g(k)的值越大;右声道能量越强,g(k)的值越小。
表达式(13)中的



为解码端接收到的左右声道频谱,因此将解码端用于恢复左右声道频谱的公式(11)和(12)代入表达式(13),并采用表达式表示表达式(13)中



得到如下变形后的左右声道均方差加权和的表达式(14) (14) 其中,xl、yl、xr、yr、xm和ym的意义已经在前面进行了注释。
第二步,为了使ε(k)的取值最小,对于每一个频率点i都要满足加权均方差ε(k)最小,因此对于加权和频谱

每个频率点来说都需要满足和 那么,本步骤中分别对xm和ym求偏导,得到 i∈band(k) (15) 通过表达式(15)求得的xm和ym就是令ε(k)取值最小的xm和ym。
第三步,将表达式(15)代入公式(14),得到

信号取值最优后的ε(k)的表达式 其中, 第四步,求优化后的gd(k)。
对表达式(16)求gd(k)的偏导,由可以得到 最后,求优化后的gr(k)。
对表达式(16)求gr(k)的偏导,由可以得到 其中, 那么,编码端进行编码的步骤就可以为分别采用公式(17)和(18)计算gr(k)和gd(k),再将得到的gr(k)和gd(k),以及重要度因子g(k)代入表达式(15),求出每个频率点i上的加权和频谱

然后将求得的数据

gr(k)和gd(k)进行编码并发给解码端。
无论编码端采用图1的流程求取


和gd(k),或是采用优化后的表达式(15)、(17)和(18)计算

gr(k)和gd(k),在解码端,都是采用图3示出的流程恢复


如果不考虑编码误差在左右声道的分配程度,将公式表达式(15)、(17)和(18)中的g(k)取1即可。
需要说明的是,以上实施例都是以第一声道为左声道,第二声道为右声道为例进行描述。可以理解,如果第一声道为右声道,第二声道为左声道,仍可以根据本发明原理得到一套编码公式和解码公式。编解码原理本质上是一样的,只是推导出来的公式可能在形式上有所区别。
而且,以上实施例只对DFT变换后的左右声道频谱进行子带划分和立体声参数的计算,实际上该方法还适用于进行其它类型时频转换后的左右声道频谱。此外,还可以对立体声信号的左、右声道分别进行子带分解,得到左、右声道的低频子带域信号,然后对左、右声道的低频子带域信号进行预测分析和时频变换,以获取左、右声道的低频子带域激励谱,此时将左、右声道的激励谱作为左、右声道频谱,并采用本发明实施例的立体声编解码方法进行编解码处理。
此外,以上实施例中划分子带的原因是各个频带的特征不同,编码阶段得到的立体声参数也不同,因为为了在解码端更好的恢复立体声,在编码时进行子带划分,并针对每个子带进行加权和以及立体声参数的求取。
为了实现以上立体声编解码方法,本发明还提供了立体声编码装置和解码装置。
图4为本发明实施例中立体声编码装置的结构示意图。如图4所示,该立体声编码装置400包括子带划分单元410、第一参数提取单元420、第二参数提取单元430、加权单元440和发送单元450; 所述子带划分单元410,用于分别将立体声的第一声道和第二声道频谱划分为K个子频带,K为正整数;其中,第一声道和第二声道为所述立体声中左声道和右声道中的一个和另一个;本实施例以第一声道为左声道,第二声道为右声道为例。当然,为了获取频谱,本单元还需要在子带划分之前对立体声的左声道信号和右声道信道进行DFT,得到DFT变换域上的左声道频谱和右声道频谱,然后再进行子带划分处理。
第一参数提取单元420,用于在每个子频带k内,分别提取表征左声道频谱和右声道频谱能量比的第一立体声参数

k=1、2...K。
该第一参数提取单元420在提取

时,可以直接将第一声道频谱的能量与第二声道频谱的能量之间的比值作为

的值;或者,利用优化过的gr(k)表达式(18)计算gr(k)的值,使得

的值不仅表征第一声道和第二声道的能量比,而且能够令左右声道的均方差加权和最小。
加权单元440,用于采用接收的

作为权值,获取左右声道的加权和频谱

。在计算

时,为了获得最优的

,可以利用优化过的

表达式(15)计算各频点i的

。在计算过程中需要代入gd(k)和gr(k)的值,这些值可以从第一参数提取单元420和第二参数提取单元430中获取。
第二参数提取单元430,用于在每个子频带k内,分别提取表征



之间能量比的第二立体声参数gd(k)。或者,利用优化过的gd(k)表达式(17)计算gd(k)的值,使得gd(k)的值不仅表征左右声道加权差和加权和的能量比,而且能够令左右声道的均方差加权和最小。
发送单元450,用于向解码端发送从加权单元440获取的

、从第一参数提取单元420获取的

或gr(k),以及从第二参数提取单元430获取的gd(k)。
图5为本发明实施例中立体声解码装置的结构示意图。如图5所示,该装置500包括接收单元510、中间参数求取单元520以及恢复单元530。
其中,接收单元510,用于接收左右声道的加权和频谱

,以及

和gd(k);其中,

表征左右声道频谱的能量比,gd(k)表征左右声道的加权差频谱和加权和频谱的能量比;其中,加权差以及加权和的加权权值为
中间参数求取单元520,用于利用加权和频谱

与采用gd(k)作为缩放比的缩放后加权差频谱具有等幅垂直的特点,计算加权差频谱

。该中间参数求取单元520具体包括正交模块和缩放模块,其中正交模块产生与

等幅垂直的正交频谱

,作为缩放后加权差频谱;缩放模块根据



方向相同且长度之比为gd(k)的特点,利用gd(k)将

进行缩放,得到
恢复单元530,用于根据所接收的


以及从中间参数求取单元520获得的

恢复左、右声道频谱。该恢复单元530具体包括左声道恢复模块和右声道恢复模块,其中左声道恢复模块,将



相加,得到;

右声道恢复模块,利用



得到缩放后右声道频谱,即

,然后采用



进行缩放,得到
在实际中,中间参数求取单元520可以只求取正交频谱

,然后由缩放模块将

和gd(k)输出给恢复单元530即可。恢复单元530中的左声道恢复模块存储公式(11),即右声道恢复模块存储公式(12),即那么左声道恢复模块和右声道恢复模块只需要获取相应参数并代入公式计算就可以了。
由以上所述可以看出,本发明所提供的立体声编解码方法,能实现低码率下对立体声的高质量编码。解码过程也无需任何的角度计算,降低了解码复杂度,从而减少了解码端的解码时间。当采用优化公式进行编码运算时,还能够进一步提高编解码质量。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1、一种立体声编码方法,其特征在于,该方法包括
A、编码端提取表征立体声中第一声道频谱与第二声道频谱的能量比的第一立体声参数,表征第一声道和第二声道的加权差频谱与加权和频谱能量比的第二立体声参数,并获取第一声道和第二声道的加权和频谱;
其中,所述加权的权值为所述第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个;
B、对所述加权和频谱、第一立体声参数和第二立体声参数进行编码,向解码端发送。
2、如权利要求1所述的方法,其特征在于,步骤A之前进一步包括
A0、分别将立体声的第一声道频谱和第二声道频谱划分为K个子频带,K为正整数;
所述步骤A为分别提取各子频带k内的第一立体声参数和第二立体声参数,以及以第一立体声参数为加权权值的加权和频谱;k=1、2...K;
所述步骤B为对所述各子频带的加权和频谱、第一立体声参数和第二立体声参数进行编码,向解码端发送。
3、如权利要求1或2所述的方法,其特征在于,所述第一立体声参数为第一声道频谱的能量值与第二声道频谱的能量值之间的比值;
所述第二立体声参数为加权差频谱的能量值与加权和频谱的能量值之间的比值。
4、如权利要求2所述的方法,其特征在于,所述第一立体声参数、第二立体声参数和加权和频谱都是根据令第一声道的均方差与第二声道的均方差的加权和最小准则获取的。
5、如权利要求4所述的方法,其特征在于,所述第一声道为左声道,所述第二声道为右声道;
所述第二立体声参数gd(k)采用公式计算;
所述第一立体声参数
利用如下公式计算
所述加权和频谱为其实部xm和虚部ym采用如下公式计算
其中,
g(k)为计算均方差加权和的权值;xl和yl分别为左声道频谱的实部和虚部,xr和yr分别为右声道频谱的实部和虚部,i为子频带k内的频率点标号,i∈band(k)表示i取子频带k内的频率点。
6、如权利要求5所述的方法,其特征在于,所述g(k)取1。
7、如权利要求5所述的方法,其特征在于,所述g(k)为表征编码误差在第一声道和第二声道分配程度的重要度因子。
8、如权利要求7所述的方法,其特征在于,所述重要度因子为第一声道频谱与第二声道频谱的能量比。
9、一种立体声解码方法,其特征在于,该方法包括
A、解码端接收立体声第一声道与第二声道的加权和频谱,以及第一立体声参数和第二立体声参数;所述第一立体声参数表征第一声道频谱和第二声道频谱的能量比,所述第二立体声参数表征第一声道和第二声道的加权差频谱与加权和频谱的能量比;
其中,所述加权的权值为所述第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个;
B、利用加权和频谱与采用第二立体声参数进行缩放的缩放后加权差频谱具有等幅垂直的特点,计算加权差频谱;
C、根据所述加权和频谱、加权差频谱以及第一立体声参数,恢复第一声道频谱和第二声道频谱。
10、如权利要求9所述的方法,其特征在于,所述步骤A接收的所述加权和频谱、第一立体声参数和第二立体声参数是各子频带的加权和频谱、第一立体声参数和第二立体声参数;
所述步骤B为利用各子频带对应的加权和频谱与采用第二立体声参数进行缩放的缩放后加权差频谱具有等幅垂直的特点,分别计算各子频带的加权差频谱;
所述步骤C为根据各子频带对应的所述加权和频谱、加权差频谱以及第一立体声参数,恢复各子频带的第一声道频谱和第二声道频谱。
11、如权利要求9所述的方法,其特征在于,所述步骤B包括
b1、产生与所述加权和频谱等幅垂直的正交频谱,作为缩放后加权差频谱;
b2、利用所述第二立体声参数对所述缩放后加权差频谱进行缩放,得到加权差频谱。
12、如权利要求9所述的方法,其特征在于,所述步骤C包括
c1、将所述加权和频谱与所述加权差频谱相加,得到左声道频谱;
c2、根据加权和频谱和左声道频谱,得到缩放后右声道频谱;
c3、利用所述第一立体声参数对得到的缩放后右声道频谱进行缩放,得到右声道频谱。
13、一种立体声编码装置,其特征在于,该装置包括第一参数提取单元、第二参数提取单元、加权单元和发送单元;
所述第一参数提取单元,用于提取表征立体声第一声道频谱和第二声道频谱的能量比的第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个;
所述加权单元,用于获取每个频点上第一声道和第二声道的加权和频谱,所述加权的权值为所述第一立体声参数;
所述第二参数提取单元,用于提取表征第一声道和第二声道加权差频谱与所述加权和频谱之间能量比的第二立体声参数;
所述发送单元,用于向解码端发送从第一参数提取单元获取的第一立体声参数、从第二参数提取单元获取的第二立体声参数和从加权单元获取的加权和频谱。
14、如权利要求13所述的编码装置,其特征在于,该编码装置进一步包括子带划分单元,用于分别将立体声的第一声道频谱和第二声道频谱划分为K个子频带,K为正整数;
所述第一参数提取单元、第二参数提取单元和加权单元分别对各子频带执行自身处理功能。
15、如权利要求13所述的编码装置,其特征在于,所述第一参数提取单元将所述第一声道频谱的能量值与所述第二声道频谱的能量值之间的比值作为第一立体声参数;
所述第二参数提取单元将所述加权差频谱的能量值与所述加权和频谱的能量值之间的比值作为第二立体声参数。
16、如权利要求13所述的编码装置,其特征在于,所述第一参数提取单元进一步用于,根据令第一声道的均方差与第二声道的均方差的加权和最小准则获取所述第一立体声参数;
所述第二参数提取单元进一步用于,根据令第一声道的均方差与第二声道的均方差加权和最小的准则获取所述第二立体声参数;
所述加权单元进一步用于,根据第一声道的均方差与第二声道的均方差加权和最小准则获取所述加权和频谱。
17、一种立体声解码装置,其特征在于,该装置包括接收单元、中间参数求取单元和恢复单元;
所述接收单元,用于接收立体声第一声道与第二声道的加权和频谱,以及第一立体声参数和第二立体声参数;所述第一立体声参数表征第一声道频谱和第二声道频谱之间的能量比,所述第二立体声参数表征第一声道和第二声道的加权差频谱和加权和频谱的能量比;所述加权的权值为第一立体声参数;
其中,所述加权的权值为第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个;
所述中间参数求取单元,用于利用加权和频谱与采用第二立体声参数进行缩放的缩放后加权差频谱具有等幅垂直的特点,计算加权差频谱;
所述恢复单元,用于根据所述加权和频谱、加权差频谱以及第一立体声参数,恢复第一声道频谱和第二声道频谱。
18,如权利要求17所述的解码装置,其特征在于,所述接收单元接收的所述加权和频谱、第一立体声参数和第二立体声参数是各子频带的加权和频谱、第一立体声参数和第二立体声参数;
中间参数求取单元和恢复单元分别对各子频带执行自身处理功能。
19、如权利要求17所述的解码装置,其特征在于,所述中间参数求取单元包括正交模块和缩放模块;
所述正交模块,用于产生与所述加权和频谱等幅垂直的正交频谱,作为缩放后加权差频谱;
所述缩放模块,用于利用所述第二立体声参数对所述缩放后加权差频谱进行缩放,得到加权差频谱。
20、如权利要求19所述的解码装置,其特征在于,所述恢复单元包括左声道恢复模块和右声道恢复模块;
所述左声道恢复模块,用于将所述加权和频谱与所述加权差频谱相加,得到左声道频谱;
所述右声道恢复模块,用于根据加权和频谱和左声道频谱,得到缩放后的右声道频谱,利用所述第一立体声参数对得到的缩放后右声道频谱进行缩放,得到右声道频谱。
全文摘要
本发明公开了一种立体声编码方法,该方法包括提取表征立体声中第一声道频谱与第二声道频谱的能量比的第一立体声参数,表征第一声道和第二声道的加权差频谱与加权和频谱能量比的第二立体声参数,并获取第一声道和第二声道的加权和频谱;其中,所述加权的权值为所述第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个;对所述加权和频谱、第一立体声参数和第二立体声参数进行编码,向解码端发送。本发明还公开了一种针对于该编码方法的解码方法,以及一种立体声编码装置和一种立体声解码装置。使用本发明能够实现低码率下对立体声的高质量编码。解码过程也无需任何的角度计算,降低了解码复杂度。
文档编号H04B1/66GK101604524SQ20081011475
公开日2009年12月16日 申请日期2008年6月11日 优先权日2008年6月11日
发明者徐恒宇, 靓 李, 潘兴德 申请人:北京天籁传音数字技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1