专利名称:多信道信号编码和解码的制作方法
技术领域:
本发明涉及如立体声音频信号之类的多信道信号的编码和解码。
在音频/话音通信采用不止一个输入信号的环境中,例如在具有立体声扬声器和两个传声器(立体声传声器)的计算机工作站中,需要两个音频/话音信道来发送立体声信号。多信道环境的另一例子是具有两个、三个或四个信道输入/输出的会议室。这种类型的应用预期用在因特网和第三代蜂窝系统中。
在[3]中描述了多信道线性预测综合分析(LPAS)信号编码/解码的一般原理。但是,所描述的原理在存在强信道间相关或可变信道间相关的情况下不总是最佳的。
这个目的是根据所附权利要求书来解决的。
简言之,本发明涉及由多部分组成的固定码本,其中包括用于每个信道的专用固定码本和所有信道所共用的共享固定码本。这种策略使得有可能或者随信道间相关而定在逐帧的基础上,或者随所需总比特率而定以呼叫顺序为基础,改变分配给专用码本和共享码本的比特数。因此,在信道间相关性高的情况下,基本上只需要共享码本,而在信道间相关性低的情况下,基本上只需要专用码本。如果信道间相关性已知或者假定是高的,则所有信道所共用的共享固定码本可能就足够了。类似地,若所需总比特率较低,基本上只使用共享码本,而在所需总比特率较高的情况下可使用专用码本。
最佳实施例的详细描述在下面的描述中,相同的参考标记用于等效或类似的部分。
现在通过介绍[3]中描述的常规单信道线性预测综合分析(LPAS)语音编码器和通用多信道线性预测综合分析语音编码器来描述本发明。
图1是常规单信道LPAS语音编码器的框图。编码器包括两部分,即综合部分和分析部分(相应的解码器只包括综合部分)。
综合部分包括LPC综合滤波器12,它接收激励信号i(n),并且输出合成语音信号(n)。激励信号i(n)是通过在加法器22中将两个信号u(n)和v(n)相加而形成的。信号u(n)是通过在增益单元20中将来自固定码本16的信号f(n)按增益gF来放大而形成的。信号v(n)是通过在增益单元18中将来自自适应码本14的激励信号i(n)的延迟形式(通过延迟“滞后”)按照增益gA放大而形成的。自适应码本是通过包括延迟单元24的反馈环形成的,延迟单元将激励信号i(n)延迟一个子帧长N。因此,自适应码本将包含移位到码本中的过去的激励i(n)(最旧的激励被移出码本并被丢弃)。LPC综合滤波器参数一般每20-40ms帧更新一次,而自适应码本每5-10ms子帧更新一次。
LPAS编码器的分析部分执行输入语音信号s(n)的LPC分析,还执行激励分析。
LPC分析由LPC分析滤波器10来执行。这种滤波器接收语音信号s(n),并在逐帧的基础上建立此信号的参数模型。选择模型参数,以便使由实际语音帧矢量和模型生成的相应信号矢量之差所形成的残余矢量的能量最小。由分析滤波器10的滤波器系数表示模型参数。这些滤波器系数定义滤波器的传输函数A(z)。由于综合滤波器12具有至少约等于1/A(z)的传输函数,因此这些滤波器系数还控制综合滤波器12,如虚线控制线所示。
执行激励分析以确定固定码本矢量(码本索引)、增益gF、自适应码本矢量(滞后)和增益gA的最佳组合,从而产生与语音信号矢量{s(n)}最匹配的合成信号矢量{(n)}(这里{}表示形成矢量或帧的样值集合)。这是在测试这些参数的所有可能的组合的穷尽搜索中完成的(次最优搜索方案也是可行的,其中,一些参数是独立于其它参数来确定的并且在搜索其余参数的过程中保持固定)。为了测试合成矢量{(n)}与相应的语音矢量{s(n)}的接近程度,不同矢量的能量{e(n)}(加法器26中形成的)可以在能量计算器30中计算。但是,更有效的是考虑加权误差信号矢量的能量{ew(n)},其中已经以这样的方式重新分配了误差,使得大的误差被大振幅的频带所掩蔽。这是在加权滤波器28中完成的。
现在参照图2-3来描述图1的单信道LPAS编码器到根据[3]的多信道LPAS编码器的修改。假定一种双声道(立体声)语音信号,但是同样的原理也可用于两个以上的信道。
图2是[3]中描述的多信道LPAS语音编码器的分析部分的实施例的框图。图2中,输入信号现在是多信道信号,如信号分量s1(n)、s2(n)所示。图1中的LPC分析滤波器10已被具有矩阵取值的传输函数A(z)的LPC分析滤波器单元10M所代替。类似地,加法器26、加权滤波器28以及能量计算器30分别被相应的多信道单元26M、28M和30M所代替。
图3是[3]中描述的多信道LPAS语音编码器的综合部分的实施例的框图。多信道解码器也可由这样的综合部分构成。这里,图1中的LPC综合滤波器12被具有矩阵取值的传输函数A-1(z)的LPC综合滤波器单元12M所代替,A-1(z)(如该符号所示)至少约等于A(z)的反函数。类似地,加法器22、固定码本16、增益单元20、延迟单元24、自适应码本14和增益单元18分别被相应的多信道单元22M、16M、24M、14M和18M所代替。
这种先有技术的多信道编码器存在的问题是,它对于由变化的传声器环境引起的变化的信道间相关不是非常灵活。例如,在某些情况下,若干传声器可从单个讲话者拾取语音。在这种情况下,来自不同传声器的信号实际上是相同信号的延迟和缩放的形式(假定回波可忽略),即信道是强相关的。在其它情况下,在不同的传声器处可能同时有不同的讲话者。这种情况下几乎没有信道间相关。
图4是根据本发明的多信道LPAS语音编码器的综合部分的典型实施例的框图。本发明的基本特征是多部分固定码本的结构。根据本发明,它包括用于各信道的专用固定码本FC1、FC2和共享固定码本FCS。虽然所有信道共用共享固定码本FCS(这意味着所有信道使用相同的码本索引),但是这些信道与各自的滞后D1、D2相关联,如图4所示。此外,专用固定码本FC1、FC2与各自的增益gF1、gF2相关联,而各自的滞后D1、D2(这可以是整数或分数)与各自的增益gFS1、gFS2相关联。在加法器AF1、AF2中,把来自每个专用固定码本FS1、FS2的激励加到来自共享固定码本FCS的相应激励上(每个信道有同样的码本矢量,但有各自的滞后和增益)。通常,固定码本包括代数码本,其中激励矢量由按照一定规则分布在每个矢量上的单位脉冲构成(这是本领域中众所周知的,这里不再详细描述)。
这种多部分固定码本结构是非常灵活的。例如,一些编码器可以使用专用固定码本中的更多比特,而另一些编码器可以使用共享固定码本中的更多比特。此外,编码器可以动态地改变专用和共享码本之间比特的分配,这随信道间相关性而定。对于一些信号,甚至最好是对一个单独信道分配比其它信道更多的比特(比特的不对称分配)。
尽管图4说明了双信道固定码本结构,但是应当理解,通过增加专用码本的数目以及滞后和信道间增益的数目,所述概念容易推广到更多信道。
通常顺次搜索共享和专用固定码本。最佳次序是首先确定共享固定码本激励矢量、滞后和增益。然后确定专用固定码本矢量和增益。
现参照图5和图6来描述两种多部分固定码本搜索方法。
图5是根据本发明的多部分固定码本搜索方法的实施例的流程图。步骤S1确定主要或首位信道,一般是最强的信道(具有最大帧能量的信道)。步骤S2在预定的时间间隔、例如整帧或其一部分中确定每个次要或滞后信道与主要信道之间的互相关。步骤S3存储每个次要信道的滞后候选者。这些滞后候选者是通过每个次要信道的多个最高互相关峰值的位置以及每个峰值周围最近的位置来定义的。可能例如选择3个最高峰值,然后增加每个峰值两侧上的最近位置,给出总共9个滞后候选者。如果使用高分辨率(分数)滞后,则可以把每个峰值附近的候选者数目增加到例如5或7个。通过对输入信号进行上升抽样,可以得到更高的分辨率。在一个简单的实施例中,主要信道的滞后可以视为零。但是,由于码本中的脉冲一般不能具有任意的位置,因此,通过为主要信道指定滞后可以得到一定的编码增益。当使用高分辨率滞后时,尤其如此。在步骤S4,为每个存储的滞后候选者组合产生临时共享固定码本矢量。步骤S5选择与最佳临时码本矢量对应的滞后组合。步骤S6确定最佳信道间增益。最终,步骤S7确定信道特定(非共享)的激励和增益。
在这种算法的变型中,保留所有或最佳临时码本矢量和相应的滞后及信道间增益。对于每个保留的组合,执行按照步骤S7的信道特定搜索。最终,选择共享和专用固定码本激励的最佳组合。
为了减小这种方法的复杂性,可以将临时码本的激励矢量限制到仅若干脉冲。例如,在GSM系统中,增强全速率信道的完整固定码本包括10个脉冲。在这种情况下,3-5个临时码本脉冲是合理的。一般,脉冲总数的25%-50%是合理的数目。当选择了最佳滞后组合时,仅为这种组合搜索完整码本(一般已定位的脉冲不变,仅仅是完整码本中的其余脉冲必须定位)。
图6是根据本发明的多部分固定码本搜索方法的另一实施例的流程图。在此实施例中,步骤S1、S6和S7与图5的实施例相同。步骤S10将新的激励矢量脉冲定位在各个允许的滞后组合的最优位置(第一次执行这个步骤,所有的滞后组合是允许的)。步骤S11测试是否所有的脉冲已被消耗。如果不是,步骤S12将允许的滞后组合限制到最佳的其余组合。此后,把另一脉冲加到其余允许的组合。最终,当所有脉冲已被消耗,步骤S13选择最佳的其余滞后组合及其相应的共享固定码本矢量。
关于步骤S12有若干可能性。一种可能性是在每次迭代中保留最佳滞后组合的一定百分比,例如25%。但是,为了避免在所有脉冲消耗之前仅剩一个组合,可能确保在每次迭代后至少剩余一定数目的组合。一种可能性是确保总是剩有至少与剩余脉冲加一同样多的组合。这样,在每次迭代中总有若干候选组合供选择。
对于固定码本增益,每个信道需要关于共享固定码本的一个增益和关于专用码本的一个增益。这些增益一般具有信道间的大的相关性。他们还与自适应码本中的增益相关。因此,这些增益的信道间预测是可能的,可采用矢量量化对其编码。
重看图4,自适应码本包括用于每个信道的一个自适应码本AC1、AC2。自适应码本可在多信道编码器中以多种方式配置。
一种可能性是令所有信道共享相同的间距滞后(pitch lag)。当存在强的信道间相关时,这是可行的。甚至当共用间距滞后时,信道仍可有具有各自的间距增益gA11-gA22。在所有信道中同时以闭环方式来搜索这种共享间距滞后。
另一种可能性是令各个信道具有专用间距滞后。当存在弱的信道间相关时(信道是独立的),这是可行的。可以对间距滞后进行差分编码或绝对编码。
还有一种可能性是以跨信道方式利用激励历史。例如,信道2可根据信道1的激励历史在信道间滞后P12下进行预测。当存在强的信道间相关时,这是可行的。
至于固定码本的情况,所述自适应码本结构非常灵活并适用于多模式操作。使用共享还是专用间距滞后的选择是基于残余信号能量。在第一步中,确定最优共享间距滞后的残余能量。在第二步中,确定最优专用间距滞后的残余能量。如果共享间距滞后情况的残余能量超过专用间距滞后情况的残余能量预定的量,则使用专用间距滞后。否则,使用共享间距滞后。如果需要,可使用能量差的移动平均来平滑判决。
这种策略可认为是在共享或专用间距滞后之间判决的“闭环”策略。另一种可能性是基于例如信道间相关的“开环”策略。在这种情况下,如果信道间相关超过预定阈值,则使用共享间距滞后。否则,使用专用间距滞后。
类似的策略可用以确定是否使用信道间间距滞后。
此外,在不同信道的自适应码本增益之间可以预期有明显的相关性。这些增益可以从信道的内部增益历史来预测,从同一帧但属于其它信道的增益来预测,也可以从固定码本增益来预测。至于固定码本,矢量量化也是可行的。
在图4中的LPC综合滤波器单元12M中,每个信道采用专用LPC(线性预测编码)滤波器。这些滤波器可以以与单信道情况相同的方式独立导出。但是,这些信道中的一些或全部还可共享相同的LPC滤波器。这实现了根据信号属性、例如LPC频谱之间的频谱距离在多滤波器和单滤波器模式之间切换。
图7是根据本发明的多信道LPAS语音编码器的分析部分的典型实施例的框图。除了已参照图1和2描述的那些单元之外,图7中的分析部分包括多模式分析单元40。单元40确定信道间相关,以便确定信道间是否存在足够的相关性以证明仅用共享固定码本FCS、滞后D1、D2以及增益gFS1、gFS2来编码是正确的。如果不是,则必须使用专用固定码本FC1、FC2和增益gF1、gF2。相关可通过时域中通常的相关来确定,即相对于主要信号移位次要信道信号直到获得最佳适配为止。如果存在两个以上信道,则若最小相关值超过预定阈值,就使用共享固定码本。另一种可能性是对与主要信道的相关性超过预定阈值的信道使用共享固定码本,而对其余信道使用专用固定码本。可以通过收听试验来确定确切的阈值。
在低比特率编码器中,固定码本可仅包括共享码本FCS和相应的滞后单元D1、D2以及信道间增益gFS1、gFS2。这个实施例等效于等于零的信道间相关阈值。
分析部分还可包括相对能量计算器42,确定每个信道的比例因子e1、e2。这些比例因子可以根据下式来确定ei=EiΣiEi]]>其中,Ei是帧i的能量。采用这些比例因子,可以根据信道的相对强度来重新换算每个信道的加权残余能量R1、R2,如图7所示。重新换算每个信道的残余能量具有针对每个信道的相对误差进行优化而不是针对每个信道的绝对误差进行优化的作用。多信道误差重新换算可用于所有步骤(导出LPC滤波器、自适应和固定码本)中。
比例因子还可以是相对信道强度ei的更一般函数,例如f(ei)=exp(α(2ei-1))1+exp(α(2ei-1))]]>其中α是在间隔4-7中的常数,例如α≈5。定标函数的确切形式可以通过主观收听试验来确定。
本发明的上述实施例的各单元的功能性通常由一个或多个微处理器或微/信号处理器组合及相应的软件来实现。
上述描述主要针对编码器。相应的解码器仅包括这种编码器的综合部分。通常,编码器/解码器组合被用在终端中,通过有限带宽的通信信道来发送/接收编码信号。终端可以是蜂窝电话或基站中的无线电终端。这种终端还包括各种其它单元、比如天线、放大器、均衡器、信道编码器/解码器等。但是,这些单元对于描述本发明不是必要的,因此将其省略。
本领域的技术人员应当理解,只要不背离所附权利要求书所定义的本发明的范围,可以对本发明进行各种修改和变更。
参考文献[1]A.Gersho的“语音和音频压缩的进步”,Proc.of the IEEE第82卷,第6期,第900-918页,1994年6月。
A.S.Spanias的“语音编码讲座评论”,Proc.of the IEEE第82卷,第10期,第1541-1582页,1994年10月。
WO 00/19413(Telefonaktiebolaget LM Ericsson)。
权利要求
1.一种多信道线性预测综合分析信号编码器,它包括由多部分组成的固定码本,其中包括用于每个信道的专用固定码本;以及所有信道所共用的共享固定码本。
2.一种多信道线性预测综合分析信号编码器,它包括所有信道所共用的共享固定码本。
3.如权利要求1或2所述的编码器,其特征在于,所述共享固定码本连接到每个信道的专用延迟单元。
4.如权利要求3所述的编码器,其特征在于,所述专用延迟单元是高分辨率单元。
5.如权利要求3所述的编码器,其特征在于,每个延迟单元连接到相应的增益单元。
6.如权利要求1所述的编码器,其特征在于包括用于分析信道间相关性、以便确定是否在所述专用固定码本和所述共享固定码本之间改变比特分配的装置。
7.如权利要求1或2所述的编码器,其特征在于包括由多部分组成的自适应码本,其中具有用于每个信道的专用自适应码本和专用间距滞后。
8.如权利要求7所述的编码器,其特征在于包括用于确定所有信道是否可以共享共同的间距滞后的装置。
9.如权利要求7所述的编码器,其特征在于包括在每个信道与其它信道之间的信道间间距滞后。
10.如权利要求1或2所述的编码器,其特征在于包括用于根据相对信道强度重新换算每个信道的残余能量的装置。
11.一种多信道线性预测综合分析信号解码器,它包括由多部分组成的固定码本,其中包括用于每个信道的专用固定码本;以及所有信道所共用的共享固定码本。
12.一种多信道线性预测综合分析信号解码器,它包括所有信道所共用的共享固定码本。
13.如权利要求11或12所述的解码器,其特征在于,所述共享固定码本连接到每个信道的专用延迟单元。
14.如权利要求13所述的解码器,其特征在于,所述专用延迟单元是高分辨率单元。
15.如权利要求13所述的解码器,其特征在于,每个延迟单元连接到相应的增益单元。
16.如权利要求11或12所述的解码器,其特征在于包括由多部分组成的自适应码本,其中具有用于每个信道的专用自适应码本和专用间距滞后。
17.如权利要求16所述的解码器,其特征在于包括在每个信道与其它信道之间的信道间间距滞后。
18.一种包括多信道线性预测综合分析语音编码器/解码器的终端,所述编码器/解码器具有由多部分组成的固定码本,其中包括用于每个信道的专用固定码本;以及所有信道所共用的共享固定码本。
19.一种包括多信道线性预测综合分析信号解码器的终端,其中包括所有信道所共用的共享固定码本。
20.如权利要求18或19所述的终端,其特征在于,所述共享固定码本连接到每个信道的专用延迟单元。
21.如权利要求20所述的无线电终端,其特征在于,所述专用延迟单元是高分辨率单元。
22.如权利要求20所述的终端,其特征在于,每个延迟单元连接到相应的增益单元。
23.如权利要求18所述的终端,其特征在于包括用于分析信道间相关性、以便确定是否在所述专用固定码本和所述共享固定码本之间改变比特分配的装置。
24.如权利要求18或19所述的终端,其特征在于包括由多部分组成的自适应码本,其中具有用于每个信道的专用自适应码本和专用间距滞后。
25.如权利要求24所述的终端,其特征在于包括用于确定所有信道是否可以共享共同的间距滞后的装置。
26.如权利要求24所述的终端,其特征在于包括在每个信道与其它信道之间的信道间间距滞后。
27.如权利要求18所述的终端,其特征在于,所述终端是无线电终端。
28.一种多信道线性预测综合分析信号编码方法,它包括以下步骤分析信道间相关性;以及根据当前信道间相关性,动态地改变各个信道专用的固定码本和所有信道共用的共享固定码本之间的编码比特分配。
29.一种多信道线性预测综合分析信号编码方法,它包括以下步骤确定所需的总比特率;以及根据所确定的总比特率,调整各个信道专用的固定码本和所有信道共用的共享固定码本之间的编码比特分配。
全文摘要
一种由多部分组成的固定码本包括用于每个信道的专用固定码本(FC1、FC2)和共享固定码本(FCS)。虽然共享固定码本(FCS)是所有信道共用的,但是这些信道与专用滞后(D1、D2)相关联。此外,专用固定码本(FC1、FC2)与专用增益(gF1,gF2)相关联,并且专用滞后(D1、D2)也与专用增益(gFS1,gFS2)相关联。来自各个专用固定码本(FS1、FS2)的激励加到来自共享固定码本(FCS)的相应激励上(各个信道有共享码本矢量、但具有专用滞后和增益)。
文档编号G10L19/04GK1455917SQ0181549
公开日2003年11月12日 申请日期2001年8月29日 优先权日2000年9月15日
发明者T·B·明德, A·施泰纳松, A·乌夫利登 申请人:艾利森电话股份有限公司