话音编码设备中计算帧原型间线性相移的频带识别方法和装置的制作方法

文档序号：2829319阅读：229来源：国知局

专利名称：话音编码设备中计算帧原型间线性相移的频带识别方法和装置的制作方法
背景技术：
I.发明领域本发明涉及话音处理领域，尤其涉及话音编码设备中计算帧原型间线性相移的频带识别方法和装置。
II.背景技术采用数字技术的话音传输日益普遍，尤其在长距离电话和数字无线电话的应用中。这又引起关注决定能在信道上发送得最少而保持所感受重构话音质量的信息量。如果用简单的抽样和数字化发送话音，要求64千位/秒(Kbps)左右的数据速率，以达到常规模拟电话的话音质量。然而，通过采用话音分析，并后续适当的编码、发送，并且在接收机重新综合，能达到数据速率显著降低。
在许多电信领域采用话音压缩装置。该领域的一个例子是无线通信。无线通信领域有许多应用，包括例如无绳电话、寻呼、无线本地环路、蜂窝网电话系统和PCS电话系统之类的无线电话、移动互联网协议(IP)电话和卫星通信系统。特别重要的应用是移动用户的无线电话。
无线通信系统已开发各种空中接口，包括例如频分多址(FDMA)、时分多址(TDMA)和码分多址(CDMA)。在这方面已建立各种国内和国际标准，包括例如“高级移动电话业务”(AMPS)、“全球移动通信系统”(GSM)和“过渡标准”95(IS-95)。典型的无线电话通信系统是码分多址(CDMA)系统。电信业协会(TIA)和其他公知标准机构颁布IS-95标准及其派生标准IS-95A、ANSI J-STD-008、IS-95B、建议的第3代标准IS-95C和IS-2000等(这里统称为IS-95)，以规定蜂窝网电话系统或PCS电话通信系统的CDMA的空中接口的应用。5103459号和4901307号美国专利阐述实质上根据IS-95标准的应用配置的典型无线通信系统，该专利转让给本发明受让人，通过引用与本申请结合。
通过提取有关人类语言产生模型的参数，利用各种方法压缩话音的装置称为话音编码设备。话音编码设备将输入的话音信号划分成时间块或分析帧。该设备通常包含编码器和译码器。编码器分析输入的话音帧，提取某些相关参数后，将该参数量化为二进制表示，即二进制位组或二进制数据分组。在信道上将数据分组发给接收机和译码器。译码器对数据分组进行处理，将其去量化，以产生参数，并且用去量化的参数重新综合话音帧。
话音编码设备的功能是通过去除话音固有的全部自然冗余，将数字话音信号压缩成低位速率信号。通过用一组参数表示输入话音帧，并利用量化用二进制位组表示参数，达到数字压缩。如果输入话音帧具有Ni个位，话音编码设备产生的数据分组具有No个位，则该设备达到的压缩因数为Cr＝Ni/No。面临的挑战是保持译码话音高质量，同时达到目标压缩因数。话音编码设备的性能取决于(1)话音模型或上述分析综合处理的组合工作的完善程度，以及(2)在每帧No位目标位速度下进行参数量化处理的完善程度。因此，话音模型的目标是每帧用少量参数获取话音信号要素或目标话音质量。
话音编码器设计中最重要的可能是寻找良好的参数组(包括矢量)，以描述话音信号。良好的参数组对重构感觉上正确的话音信号要求系统频宽小。话音编码参数的例子有音调、信号功率、频谱包络(或共振峰)、振幅频谱和相位频谱。
话音编码设备可做成时域编码器，该编码器通过利用高时间分辨率处理，每次对少量话音段(通常是5毫秒(ms)的子帧)进行编码，试捕获时域话音波形。每一子帧借助本领域公知的各种寻找算法，从码本空间寻找高准确的代表。另外，话音编码设备可做成频域编码器，该编码器试图用参数组(分析)捕获输入话音帧的短期话音频谱，并且用相应的综合处理从该频谱参数重建话音波形。参数量化器根据《矢量量化和信号压缩(Vector Quantization and SignalCompression)》(A.Gersho和R.M.Gray著，1992年)所示的公知量化技术，用存储的码矢量表示代表参数，从而保留这些参数。
公知的时域话音编码器是码激励线性预测(CELP)编码器，《话音信号数字处理(Digital Processing of Speech Signals)(396～453页，L.B.Rabiner和R.W.Schafer著，1978)阐述该译码器，该文献通过引用与本申请结合。CELP译码器中，利用线性预测(LP)分析，求短期共振峰滤波器的系数，从而去除话音信号中的短期相关或冗余。对输入话音帧采用短期预测滤波器，产生LP残留信号，进而用长期预测滤波器参数和后续随机码本对其进行建模和量化。因此，CELP编码将时域话音波形编码任务划分成分开的LP短期滤波器系数编码任务和LP残留编码任务。可按固定速率(即各帧采用相同数量的位No)或可变速率(不同类型的帧内容采用不同的位速率)进行时域编码。可变速率编码器试图仅用将编译码器参数编码成达到适当程度目标质量所需数量的位。5414796号美国专利阐述一种示范可变速率CELP编码器，该专利转让给本发明受让人，并通过引用与本申请结合。
CELP编码器之类的时域编码器通常依靠每帧位数No多，保持时域话音波形准确。如果每帧位数No较多(例如8Kbps或以上)，该编码器通常提供优越的话音质量。然而，低位速率(4Kbps及以下)时，时域编码器受可用位数限制，不能保持高质量和性能牢靠。低位速率时，高速率商用中配置很成功的常规时域编码器，其波形匹配性能受有限码本空间抑制。因此，尽管时时改进，以低位速率工作的许多CELP编码系统仍遭受感觉上显著失真，其通常特征为噪声。
目前出现开发工作在中低位速率(即2.4至4Kbps范围及以下)的高质量话音编码设备的研究关注热潮和强烈商用需求。其应用范围包括无线电话、卫星通信、因特网电话、各种多媒体和声音流应用、话音函件和其它话音存储系统。驱动力为高容量需求和分组丢损情况下性能牢靠需求。各种近期话音编码标准机构是推进低速率话音编码算法研究开发的另一直接推动力。低速率话音编码器在每一可用带宽建立较多信道或用户。与适当信道编码附加层结合的低速率话音编码器能适应编码器规范的总预算位数，并且在信道差错情况下提供牢靠的性能。
一种在低位速率有效的话音编码技术是多模式编码。序列号为09/217341的美国专利申请阐述多模式编码技术的范例，该申请在1998年12月21日提出，题目为“可变速率话音编码(VARAIBLE RATE SPEECH CODING)”，该申请转让给本发明受让人，并通过引用与本申请结合。常规多模式编码器对不同类型的输入话音帧采用不同的模式(或编译码算法)。用最有效的方式专门制订各模式或编译码处理，以最佳表示某类型的话音段，诸如浊音语(voiced speech)、清音语(unvoiced speech)、过渡语(例如处于浊音与清音之间)和背景噪声(非语言)。外部开环模式判决机构审查输入话音帧，并判决对该帧用何模式。通常通过从输入帧提取一定数量的参数，就某些时间特性和频谱特性评价这些参数并根据对该评价的判决模式，进行开环模式判决。
工作在2.4Kbps左右的速率的编码系统一般是参数性的。即，该编码系统通过以规定间隔发送描述话音信号音调周期和频谱包络(或共振峰)的参数，进行工作。这些所谓参数性编码器的说明例是LP声码器系统。
LP声码器用每一音调周期的一个信号脉冲模拟浊音语信号。此基本方法可扩大到包含发送各种参数中的频谱包络信息。虽然LP声码器一般提供合理的信息，但会引入感觉上显著的失真，其特征通常为蜂音。
近年来，编码器出现波形编码器和参数编码器的混合体。这些“混合编码器”的说明例是原型波形插空(PWI)话音编码系统。该系统也可称为原型音调周期(PPP)话音编码设备。PWI编码系统提供浊音语有效编码方法。PWI的基本概念是按固定时间间隔提取代表性音调周期(原型波形)，发送其描述，并通过原型波形间内插重构话音信号。PWI方法可根据LP残留信号或话音信号进行工作。1998年12月21日提出的序列号为09/217494的美国专利申请阐述PWI或PPP话音编码设备的范例，该申请的题目为“周期性话音编码(PERIODICSPEECH CODING)”，该申请转让给本发明受让人，并通过引用与本申请结合。5884253号美国专利和“话音编码的波形插空方法(Methods for WaveformInterpolation in Speech Coding)”(W.Bastiaan Kleijn和Wolfgang Granzow著，1991年，1 Digital Signal Processing，215～230页)阐述其他PWI或PPP话音编码器。
常规话音编码设备中，发送各话音帧内每一音调原型的全部相位信息。然而，低位速率话音编码器中，希望尽可能保持带宽。因而，提供发送较少相位参数的方法是有利的。这样，就需要一种每帧发送少量相位信息的话音编码器。

发明内容
本发明涉及一种每帧发送少量相位信息的话音编码设备。因而，本发明的一个方面中，一种划分帧原型频谱的方法有利地包含以下步骤将频谱划分成多个段；给每一段分配多个频带；对每一段建立多个频带用的带宽组。
本发明的另一方面中，一种配置成划分帧原型频谱的话音编码设备有利地包含将频谱划分成多个段的装置；给每段分配多个频带的装置；对每段建立多个频带的带宽组的装置。
本发明的再一方面中，一种话音编码设备有利地包含原型提取器，从话音编码设备进行处理的帧提取原型；原型量化器，连接原型提取器，并且配置成将原型的频谱划分成多个段，给每段分配多个频带，对每段建立多个频带用的带宽组。

图1是无线电话系统的框图。
图2是每端由话音编码设备终接的信道的框图。
图3是编码器框图。
图4是译码器框图。
图5是说明话音编码判决处理的流程图。
图6A是话音信号幅度对时间的图形。
图6B是线性预测(LP)残留幅度对时间的图形。
图7是原型音调周期(PPP)话音编码设备的框图。
图8是诸如图7中话音编码设备等PPP话音编码设备所执行算法步骤的说明流程图，用于识别原型音调周期的离散傅里叶级数(DFS)表示中的频带。
较佳实施例的详细说明下文所述示范实施例存在于配置成利用CDMA空中接口的无线电话通信系统。然而，本领域的技术人员会理解，实施本发明特性的二次(子)抽样方法和设备可存在于利用各种本领域技术人员熟知技术的任何通信系统中。
如图1所示，CDMA无线电话系统一般包含多个移动用户单元10、多个基站12、基站控制器(BSC)14和移动通信交换中心(MSC)16。MSC16配置成与常规公用交换电话网(PSTN)18接口。MSC16还配置成与BSC14接口。BSC14通过路程迂回线路连接基站12。路程迂回线路可配置成支持任何已知接口，其中包括例如E1/T1、ATM、IP、PPP、帧中继、HDSL、ADSL或XDSL。会理解，该系统中可有2个以上BSC14。有利地是每一基站12包含至少一个扇区(未图示)，每一扇区包含全向天线或指向径向离开基站12的特定方向的天线。或者每一扇区可包含2付天线，用于分集接收。每一基站12可有利地设计成支持多种频率分配。扇区与频率分配的交集可称为CDMA信道。基站12也可称为基站收发信机子系统(BTS)12。或者，“基站”可用于业界统指BSC14和一个以上的BTS12。BTS12也可指“区站”12。另外，给定的BTS12的各个扇区也可称为区站。移动用户单元10通常是蜂窝网电话或PCS电话10。有利的是系统配置成按照IS-95标准使用。
蜂窝网电话系统的典型工作期间，基站12从一些移动单元10接收一组反向链路信号。移动单元10进行电话呼叫或其它通信。给定基站12接收的各反向链路信号在该基站12内进行处理。所得数据传给BSC14。BSC14提供呼叫资源分配和移动性管理功能，其中包括协调基站12间的软切换。BSC14还将接收数据发给MSC16，后者提供附加的选路业务，以便与PSTN18接口。同样，PSTN18也与MSC16接口，MSC16则与BSC14接口，后者转而控制基站12，以对一些移动单元10发送一组前向链路信号。
图2中，第1编码器100接收数字化话音抽样S(n)，并对其进行编码，以在传送媒体102(或信道102)上发送到第1译码器104。译码器104将编码的话音抽样译码后，综合成话音输出信号SSYNTH(n)。为了在相反方向发送，第2编码器106将数字话音抽样S(n)编码后，在信道108上发送。第2译码器110接收该编码话音抽样，并进行译码后，产生综合的话音输出信号SSYNTH(n)。
话音抽样S(n)代表根据本领域公知的任何方法(例如压缩扩展μ律或A律脉码调制(PCM))进行数字化和量化的话音信号。本领域已公知，将话音抽样S(n)组合成输入数据帧，每帧包含预定数量的数字化话音抽样S(n)。示范实施例中，采用8KHz的抽样率，每20ms帧包括160个抽样。以下所述实施例中，数据传输率从13.2Kbps(全速率)到6.2Kbps(半速率)到2.6Kbps(1/4速率)到1Kbps(1/8速率)逐帧变化有利。由于可选择低位速率用于含较少话音信息的帧，改变数据传输速率有利。本领域技术人员已理解，可用其他抽样率、帧规模和传输速率。
第1编码器100和第2译码器11O一起组成第1话音编码设备或话音编码器。话音编码设备可用于传输话音信号用的任何通信装置，包括例如以上参照图1所示的用户单元、BTS或BSC。同样，第2编码器106和第1译码器104一起组成第2话音编码设备。本领域技术人员理解，可用数字信号处理器(DSP)、专用集成电路(ASIC)、离散门逻辑、固件或任何常规可编程软件模块和微处理器实现话音编码设备。软件模拟可驻留在RAM存储器、快速擦写存储器、寄存器或本领域公知的任何其它形式的可写存储媒体中。另外，任何常规处理器、控制器或状态机可代替微处理器。5727123号美国专利阐述专门为话音编码设计的示范ASIC，1994年2月16日提出的序列号为08/197417的美国专利申请(题目为“声码器ASIC(VOCODER ASIC)”)也有阐述，这2个专利都转让给本发明受让人，并并通过引用与本申请结合。
图3中，可用于话音编码设备的编码器200包含模式判决模块202、音调估计模块204、LP分析模块206、LP分析滤波器208、LP量化模块210和残数量化模块212。将输入话音帧S(n)提供给模式判决模块202、音调估计模块204、LP分析模块206和LP分析滤波器208。模式判决模块202根据每一输入话音帧S(n)各特性中的周期性、能量、信噪比(SNR)或过零率，产生模式索引号IM和模式M。5911128号美国专利阐述根据周期性对话音帧分类的各种方法，该专利转让给本发明受让人，并通过引用与本申请结合。电信业协会的业界过渡标准TIA/EIA IS-127和TIA/EIA IS-733也编入这些方法。上述序列号为09/217341的美国专利申请也讲述模式判决方法的范例。
音调估计模块204根据每一输入话音帧S(n)产生音调索引号Ip和滞后值Po。LP分析模块206对每一输入话音帧S(n)进行线性预测分析，以产生LP参数a。该参数a提供给LP量化模块210。该模块2l0还接收模式M，从而以取决于模式的方式进行量化处理。该模块210产生LP索引号ILP和量化LP参数。LP分析滤波器208除接收输入话音帧S(n)，还接收量化LP参数。该滤波器208，根据量化线性预测参数产生代表输入话音帧S(n)之间差错和重构话音的LP残留信号R[n]。将LP残留信号R[n]、模式M和量化LP参数提供给残数量化模块212。该模块212根据这些值产生残数索引号IR和量化残留信号 [n]。
图4中，可用于话音编码设备的译码器300包含LP参数译码模块302、残数译码模块304、模式译码模块306和LP综合滤波器308。模式译码模块306接收模式索引号IM，将其译码，从而产生模式M。LP参数译码器模块302接收模式M和LP索引号ILP。该模块302将接收的值译码，产生量化LP参数。残数译码模块304接收残数索引号IR、音调索引号IP和模式索引号IM。该模块304将接收的值译码，产生量化残留信号 [n]。该信号 [n]和量化LP参数提供给LP综合滤波器308，从而综合成译码输出话音信号[n]。
本领域已公知图3中编码器200和图4中译码器300的各模块的操作和实现，上述5414796号美国专利和《话音信号数字处理(Digital Processing ofSpeech Signals)》(L.B.Rabiner和R.W.Schafer著，396～453页，1978年)也对此进行阐述。
如图5的流程图所示，按照一实施例的话音编码设备在处理传输的话音抽样中遵照以下步骤。步骤400中，话音编码设备在连续帧内接收话音信号的数字抽样。接收给定帧时话音编码设备进到步骤402。此步骤402，话音编码设备检测该帧的能量。此能量是该帧话音活动性的度量。通过对数字话音抽样幅值的平方求和，并将所得能量与门限值比较，进行话音检测。一实施例中，该门限值随背景噪声电平电变化自适应。上述5414796号美国专利阐述可变门限话音活动性检测器的范例。有些清音语声可为能量非常低的抽样，会将其错误编码成背景噪声。为了避免出现这点，可用低能量抽样频谱倾斜，以区别清音语和背景噪声，如以上5414796号美国专利所述。
检测帧能量后，话音编码设备进到步骤404。步骤404中，话音编码设备判断检测的帧能量是否足以区分包含话音信息的帧。如果检测的帧能量下降到预定电平以下，话音编码设备就进到步骤406。步骤406中，该设备将此帧当作背景噪声(即非话音或寂静)进行编码。一实施例中，背景噪声帧以1/8速率或1Kbps编码。如果步骤404中检测的帧能量达到或超过预定门限电平，则将该帧区分为话音后，话音编码设备进到步骤408。
步骤408中，话音编码设备判断该帧是否清音语，也就是说，该设备审查帧的周期性。各种公知的周期性判断方法包含例如采用过零点和采用归一化自相关函数(NACF)。具体而言，上述5911128号美国专利和序列号为09/217341的美国专利申请阐述采用过零点和NACF检测周期性。此外，电信业协会过渡标准TIA/EIA IS-127和TIA/EIA IS-733也编入上述区别清音语与浊音语用的方法。如果步骤408中判定该帧为清音语，话音编码设备进到步骤410。在步骤410，该设备将此帧作为清音语编码。一实施例中，以1/4速率或2.6Kbps对清音语帧进行编码。如果步骤408中不判定该帧为清音语，话音编码设备进到步骤412。
步骤412中，话音编码设备采用例如以上5911128号美国专利所述的本领域公知周期性检测方法，判断该帧是否渡语。如果判定该帧是过渡语，话音编码设备进到步骤414。在步骤414，将该帧当作过渡语(即从清音语过渡到浊音语)进行编码。一实施例中按照多脉冲插空编码法对过渡语帧进行编码，序列号为09/307294的美国专利申请阐述该方法，该申请的题目为“过渡语帧的多脉冲插空编码(MULTIPULSE INTERPOLATIVE CODING OF TRANSITION SPEECHFRAMES)”，1999年5月7日提出，已转让给本发明受让人，并通过引用与本申请结合。另一实施例中，以全速率或13.2Kbps对过渡语帧进行编码。
如果在步骤412中话音编码设备判定该帧不是过渡语，该设备进到步骤416。步骤416中，话音编码设备将该帧当作浊音语进行编码。一实施例中，可用半速率或6.1Kbps对浊音语帧编码。还可用全速率或13.2Kbps(或8K CELP编码设备中的8Kbps全速率)对浊音语帧编码。然而，本领域的技术人员会理解，半速率浊音帧编码通过利用浊音帧的稳态性，使编码设备可节省宝贵的带宽。此外无论浊音语用何种速率编码，有利的是利用过去帧的信息对浊音语编码，因而该语进行预测性编码。
本领域的技术人员会理解，可按图5所示的步骤对话音信号或相应的LP残数编码。图6A的图形中可看到噪声、清音语、过渡语和浊音语的波形特性随时间变化，图6B的图形中则可看到噪声、清音语、过滤语和浊音语的LP残数波形特性随时间变化。
一实施例中，原型音调周期(PPP)话音编码设备500包含反向滤波器502、原型提取器504、原型量化器506、原型去量化器508、插空/综合模块510和LPC综合模块512，如图7所示。有利的是话音编码设备500可作为DSP实现，并且可驻留在例如CS或蜂窝网电话系统的用户单元或基站中，或者可驻留在卫星系统的用户单元或网关中。
话音编码器500中，将数字化话音信号S(n)(n为帧号)提供给反向LP滤波器502。一具体实施例中，帧的长度是20ms。按照下述计算反向滤波器的传输函数A(z)＝1-a1z-1-a2z-2-…-apz-p，式中系数aI为滤波器抽头，这些抽头具有按照以上5414796号美国专利和序列号为09/217494的美国专利申请所述的已知方法选择的预定值，这些专利前面已按参考资料全部引入。数p表示反向LP滤波器502用于预测的先前抽样的数量。具体实施例中，p设定为10。
反向滤波器502将LP残留信号r(n)提供给原型提取器504。原型提取器504从当前的帧提取原型。该原型是由插空/综合模块510与同样也位于帧内的先前帧原型一起加以线性内插的当前帧的一部分，进行该内插目的在于在译码器重构Lp残留信号。
原型提取器504将该原型提供给原型量化器506，按照本领域公知的任何量化方法对该原型进行量化。可从查找表(未示出)得到的量化值汇编成包含滞后参数和其码本参数的数据分组，以便在信道上传送。该分组提供给发射机(未示出)，在信道上发送到接收机(也未示出)。设反向LP滤波器502、原型提取器504和原型量化器506对当前的帧进行PPP分析。
接收机接收该分组，将其提供给原型去量化器508。原型去量化器508可根据任何公知技术对该分组进行去量化。原型去量化器508将去量化的原型提供给插空/综合模块510。该模块510将该原型与同样位于帧内的先前帧原型一起插空，以便对当前帧重构LP残留信号。有利的是按照5884254号美国专利和上述序列号为09/217494的美国专利申请所说明的已知方法完成该插空和帧综合。
插空/综合模块510将重构件的LP残留信号 (n)提供给LPC综合模块512。LPC综合模块512还从发送的数据分组接收线路频谱对(LSP)，用于对重构的LP残留信号 (n)进行LPC滤波，以对当前帧产生重构的话音信号 (n)。另一实施例中，可在进行当前帧插空/综合前，对原型进行话音信号 (n)的LPC综合。原型去量化器508、插空/综合模块510和LPC综合模块512进行当前帧的PPP综合。
一实施形态中，诸如图7的话音编码设备500之类的PPP话音编码设备识别要计算线性相移的频带数B。有利的是在量化前按照与本申请一起提出的相关美国专利申请所述的方法和设备智能化地对相位进行二次取样，该申请题目为“相位频谱信息二次取样的方法和设备(METHOD AND APPARATUS FORSUBSAMPLING PHASE SPECTRUM INFORMATION)”，转让给本发明受让人。有利的是该话音编码设备依据整个离散傅里叶级数(DFS)矢量中的谐波幅度重要性将所处理帧的原型的DFS矢量划分成具有可变宽度的少量频带，从而成正比地减少需要的量化。将0Hz至Fm Hz的整个频率范围(Fm是所处理原型的最高频率)划分成L段。因此，存在的谐波数M等于Fm/Fo，Fo Hz是基频。因而，由幅度矢量和相位矢量组成的原型DFS矢量有M元。该话音编码设备预先对L段分配b1、b2、b3…bL频带，从而b1+b2+b3…bL等于所需频带总数B。与此相对应，第1段有b1个频带，第2段有b2个频带，……，第L段有bL个频带，整个频率范围有B个频带。一实施例中，整个频率范围是从零至4000Hz，即人类口语话音的范围。
一实施例中，在L段的第i段均匀分配bi个频带。通过将第i段的频率范围分成bi个相等部分，完成这点。与此相对应，第1段分成b1个相等频带，第2段分成b2个相等频带，…第L段分成bL个相等频带。
另一实施例中，对第i段中bi个频段的每一个选择一组固定的非均匀布局频带边缘。通过在第i段上选择任意bi个频带的组或取得i段能量直方图总平均值，达到这点。能量集中度高可要求频带窄，能量集中度低则用较宽的频带。因而，第1段分成b1个固定的非相等频带，第2段分成b2个固定的非相等频带，…第L段分成bL个固定的非相等频带。
另一实施例中，对每一子频带中bi个频带的每个选择可变的频带边缘组。通过用等于适当低值Fb Hz的目标频带宽度作为起点，完成这点。然后，执行以下的步骤。将计数器n置1。然后，寻找幅度矢量，求最大幅度值的频率FbmHz和相应的谐波数mb(等于Fbm/Fo)。通过排除先前所有设定频带边缘覆盖的范围(对应于1到n-1的迭代)，进行该寻找。然后，将bi个频带中第n频带的频带边缘设定为谐波数mb-Fb/Fo/2和mb+Fb/Fo/2，相应于频率Fmb-Fb/2和Fmb+Fb/2Hz。接着，计数器n递增，并且重复进行寻找幅度矢量和设定频带边缘的步骤，直到计数值n超过bi。因而，第1段分成b1个可变的不相等频带，第2段分成b2个可变的不相等频带，…第L段分成bL个可变的不相等频带。
上面刚说明的实施例中，频带进一步加细，以去除相邻频带边缘之间的间隙。一实施例中，低频带的右频带边缘及其最接近的高频带的左频带边缘都加以延伸，在2个边缘间隙的中部重合(位于第2频带左方的第1频带，频率低于第2频带)。达到这点的一种方法是将2个频带的边缘设定成其频率(和相应的谐波数)的平均值。另一实施例中，将低频段右边缘及其最接近的高频段左边缘中的任一个设定成频率上等于另一个(或设定成另一个的谐波数的相邻谐波数)。可依据以右边缘终止的频带和以左边缘开始的频带中包含的能量进行频带边缘的均衡。与能量较高的频带对应的频带边缘保持不变，而另一频带边缘要改变。或者，中部能量局部化较高的频带对应的频带边缘改变，而另一频带边缘不改变。另一实施例中，上述右频带边缘和上述左频带边缘都按x∶y的比率在频率和谐波数上移动不相等的距离，其中x和y分别是以左频带边缘开始的频带和以右频带边缘终止的频带的频带能量。或者，x和y可分别是中心谐波能量对以右频带边缘终止的频带的总能量的比率和中心谐波能量对以左频带边缘开始的频带的总能量的比率。
另一实施例中，一些L段DFS矢量中可用均匀分配的频带，另一些可用固定的非均匀频带，又一些可用可变的非均匀频带。
一实施例中，诸如图7中话音编码设备500的PPP话音编码设备执行图8的流程图中说明的算法步骤，以在原型音调周期的离散傅里叶级数(DFS)表示中识别频带。识别这些频带，用于计算相对于参考原型DFS的频带定位或线性相移。
步骤600中，话音编码设备开始进行识别频带的处理。然后，该设备进入步骤602。在步骤602话音编码设备在基频Fo下计算原型的DFS。然后，该设备进入步骤604。步骤604中，话音编码设备将频率范围分成L段。一实施例中，该频率范围是从零到4000Hz，即人类口语话音的范围。然后，话音编码设备进到步骤606。
步骤606中，话音编码设备给L段分配bL个频带，使b1+b2+…+bL等于要计算线性相移的频带总数B。然后，该设备进入步骤608。步骤608中，话音编码设备将段的计数i设定为等于1。然后，该设备进入步骤610。步骤610中，话音编码设备选择每一段中分配频带的分配方法。然后，该设备进到步骤612。
步骤612中，话音编码设备判断步骤610的频带分配方法是否在段内均匀分配频带。如果步骤610的频带分配方法在段内均匀分配频带，该设备进到步骤614。反之，步骤610的频带分配方法不是在段内均匀分配频带，则设备进到步骤616。
步骤614中，话音编码设备将第i段分成bi个相等频带。然后，该设备进到步骤618。步骤618中，话音编码设备使段计数i递增。然后，该设备进到步骤620。步骤620中，话音编码设备判断段计数i是否大于L。如果段计数i大于L，该设备进到步骤622。反之，段计数i大于L，该设备进到步骤622。反之，段计数i不大于L，则该设备返回步骤610，选择下一段的频带分配方法。步骤622中，话音编码设备退出频带识别算法。
步骤616中，话音编码设备判断步骤610的频带分配方法是否在段内分配固定的非均匀频带。如果步骤610的频带分配方法在段内分配固定的非均匀频带，该设备进到步骤624。反之，步骤610的频带分配方法不是在段内分配固定的非均匀频带，则该设备进到步骤626。
步骤624中，话音编码设备将第i段分成bi个不相等的预置预带。用上述方法可完成这点。然后，话音编码设备进到步骤618，使段计数i递增，继续对每段分配频带，直到整个频率范围都分配频带。
步骤626中，话音编码设备将频带计数n设定为等于1，并将起始带宽设定为等于FbHz。然后，该设备进到步骤628。步骤628中，话音编码设备排除从1到n-1范围内带宽的幅度。然后，该设备进到步骤630。步骤630中，话音编码设备对剩下的幅度矢量分类。然后，该设备进到步骤632。
步骤632中，话音编码设备判定具有最高谐波数mb的频带的位置。然后，该设备进到步骤634。步骤634中，话音编码设备围绕mb设定频带边缘，使频带边缘之间包含的谐波总数等于Fb/Fo。然后，该设备进到步骤636。
步骤636中，话音编码设备移动相邻频带的频带边缘，填充频带间隙。然后，该设备进到步骤638。步骤638中，话音编码设备使频带计数n递增。然后，该设备进到步骤640。在步骤640话音编码器判断频带计数n是否大于bi。如果频带计数n大于bi，设备进到步骤618，使段计数i递增，并且对各段分配频带，直到整个频率范围都分配频带。反之，频带计数n不大于bi，则该设备返回步骤638，建立段内下一频带的宽度。
这样，说明了一种新颖的话音编码设备中计算帧原型间线性相移用的频带识别方法和装置。本领域的技术人员会理解，结合这里所揭示的实施例阐述的各种说明性逻辑块和算法步骤可用数字信号处理器(DSP)、专用集成电路(ASIC)、离散电路门或晶体管逻辑电路、离散硬件部件(诸如寄存器和FIFO)、执行固件指令集的处理器或任何常规可编程软件模块和处理器加以实现或执行。处理器为微处理器有利，但另一方面，处理器也可以是任何常规处理器、微控制器或状态机。软件模块可驻留于RAM存储器、快速擦写存储器、寄存器或本领域公知的任何其它类型可写存储媒体中。技术人员还会理解，用电压、电流、电磁波、磁场或磁粒子、光场或光粒子或这些的任何组合代表以上说明各处会参照的数据、指令、命令、信息、信号、二进制位、码元和码片。
这样，说明了本发明的较佳实施例。然而，本领域的普通技术人员会明白，这里所揭示的实施例可做大量变换而不偏离本发明的实质和范围。因此，除遵照以下的权利要求外，本发明不受限制。
权利要求
1.一种划分帧原型频谱的方法，其特征在于包含以下步骤将频谱划分成多个段；给每一段分配多个频带；对每一段建立多个频带用的带宽组。
2.如权利要求1所述的方法，其特征在于，所述建立步骤包含对特定段内全部频带分配固定的均匀带宽的步骤。
3.如权利要求1所述的方法，其特征在于，所述建立步骤包含对特定段内多个频带分配固定的非均匀带宽的步骤。
4.如权利要求3所述的方法，其特征在于，其中所述分配步骤包含与带内能量集中度成反比的改变带宽的步骤。
5.如权利要求1所述的方法，其特征在于，所述建立步骤包含对特定段内多个频带分配可变的带宽的步骤。
6.如权利要求5所述的方法，其特征在于，其中分配步骤包含以下步骤设定目标带宽；除任何先前建立的频带边缘覆盖的寻找范围外，对每一带宽寻找原型的幅度矢量，以确定带内最大谐波数；对每一频带围绕最大谐波数确定频带边缘位置，使位于频带边缘之间的谐波总数等于基频除目标带宽；消除相邻频带边缘的间隙。
7.如权利要求6所述的方法，其特征在于，所述消除步骤包含对每一间隙设定内封该间隙的相邻间隙边缘，使其等于2个相邻频带边缘的频率平均值的步骤。
8.如权利要求6所述的方法，其特征在于，所述消除步骤包含对每一间隙设定能量较小的频带对应的相邻频带边缘，使其等于能量较大的频带所对应相邻频带边缘的频率值的步骤。
9.如权利要求6所述的方法，其特征在于，所述消除步骤包含对每一间隙设定频带中心能量局部化较高的频带对应的相邻频带边缘，使其等于频带中心能量局部化较低的频带所对应相邻频带边缘的频率值的步骤。
10.如权利要求6所述的方法，其特征在于，所述消除步骤包含以下步骤对每一间隙调整2个相邻频带边缘的频率值，即以x对y的比率相对于频率较低的相邻频带边缘频率值的调整，调整频率较高的频带所对应相邻频带边缘的频率值，其中x是较高频率的相邻频带的频带能量，y是较低频率相邻频带的频带能量。
11.如权利要求6所述的方法，其特征在于，所述消除步骤包含以下步骤对每一间隙调整2个相邻频带边缘的频率值，即以x对y的比率相对于频率较低的相邻频带边缘频率值的调整，调整频率较高的频带所对应相邻频带边缘的频率值，其中x是较低频率相邻频带的中心谐波能量对较低频率相邻频带的总能量的比率，y是较高频率相邻频带的中心谐振能量对较高频率相邻频带的总能量的比率。
12.一种话音编码设备，配置成划分帧原型的频谱，其特征在于包含将频谱划分成多个段的装置；给每段分配多个频带的装置；对每段建立多个频带的带宽组的装置。
13.如权利要求12所述的话音编码设备，其特征在于，所述建立装置包含对特定段内全部频带分配固定的均匀带宽的装置。
14.如权利要求12所述的话音编码设备，其特征在于，所述建立装置包含对特定段内多个频带分配固定的非均匀带宽的装置。
15.如权利要求14所述的话音编码设备，其特征在于，所述分配装置包含与频带内能量集中成反比地改变带宽的装置。
16.如权利要求12所述的话音编码设备，其特征在于，所述建立装置包含对特定段的多个频带分配可变的带宽的装置。
17.如权利要求16所述的话音编码设备，其特征在于，所述分配装置包含设定目标带宽的装置；寻找装置，对每一频带寻找原型的幅度矢量，以决定频带内除先前建立的频带边缘覆盖的寻找范围外的最大谐波数；定位装置，围绕最大谐波数决定频带边缘的位置，使位于频带边缘之间的谐波总数等于基频除目标带宽；消除相邻频带边缘间隙的装置。
18.如权利要求17所述的话音编码设备，其特征在于，所述消除装置包含设定装置，对每一间隙设定内封该间隙的相邻频带边缘，使其等于2个相邻频带边缘的频率平均值。
19.如权利要求17所述的话音编码设备，其特征在于，所述消除装置包含设定装置，对每一间隙设定能量较低的频带对应的相邻频带边缘，使其等于能量较高的频带所对应相邻频带边缘的频率值。
20.如权利要求17所述的话音编码设备，其特征在于，所述消除装置包含设定装置，对每一间隙设定频带中心能量局部化较高的频带对应的相邻频带边缘，使其等于频带中心能量局部化较低的频带所对应相邻频带边缘的频率值。
21.如权利要求17所述的话音编码设备，其特征在于，所述消除装置包含调整装置，对每一间隙调整2个相邻频带边缘的频率值，即以x对y的比率相对于频率较低的相邻频带边缘频率值的调整，调整频率较高的频带所对应相邻频带边缘的频率值，其中x是较高频率相邻频带的频带能量，y是较低频率相邻频带的频带能量。
22.如权利要求17所述的话音编码设备，其特征在于，所述消除装置包含调整装置，对每一间隙调整2个相邻频带边缘的频率值，即以x对y的比率相对于频率较低的相邻频带边缘频率值的调整，调整频率较高的频带所对应相邻频带边缘的频率值，其中x是较低频率相邻频带的中心谐波能量对较低频率相邻频带的总能量的比率，y是较高频率相邻频带的中心谐振能量对较高频率相邻频带的总能量的比率。
23.如权利要求12所述的话音编码设备，其特征在于，所述话音编码设备驻留在无线通信系统的用户单元中。
24.一种话音编码设备，其特征在于包含原型提取器，配置成从话音编码设备进行处理的帧提取原型；原型量化器，耦联原型提取器，并且配置成将原型的频谱划分成多个段，给每段分配多个频带，对每段建立多个频带用的带宽组。
25.如权利要求24所述的话音编码设备，其特征在于，所述原型量化器还配置成建立带宽组，作为特定段内全部频带用的固定的均匀带宽。
26.如权利要求24所述的话音编码设备，其特征在于，所述原型量化器还配置成建立带宽组，作为特定段内多个频带用的固定的非均匀带宽。
27.如权利要求26所述的话音编码设备，其特征在于，所述原型量化器还配置成与频带内能量集中度成反比地改变带宽。
28.如权利要求24所述的话音编码设备，其特征在于，所述原型量化器还配置成建立带宽组，作为特定段内多个频带用的可变带宽。
29.如权利要求28所述的话音编码设备，其特征在于，所述原型量化器还配置成通过设定目标带宽设定可变带宽；除任何先前建立的频带边缘覆盖的寻找范围外，对每一带宽寻找原型的幅度矢量，以确定频带内最大谐波数；对每一频带围绕最大谐波数确定频带边缘位置，使位于频带边缘之间的谐波总数等于基频除目标带宽；消除相邻频带边缘的间隙。
30.如权利要求29所述的话音编码设备，其特征在于，所述原型量化器还配置成对每一间隙设定内封该间隙的相邻频带边缘，使其等于2个相邻频带边缘的频率平均值，从而消除间隙。
31.如权利要求29所述的话音编码设备，其特征在于，所述原型量化器还配置成对每一间隙设定能量较小的频带对应的相邻频带边缘，使其等于能量较大的频带所对应相邻频带边缘的频率值，从而消除间隙。
32.如权利要求29所述的话音编码设备，其特征在于，所述原型量化器还配置成，对每一间隙设定频带中心能量局部化较高的频带对应的相邻频带边缘，使其等于频带中心能量局部化较低的频带所对应相邻频带边缘的频率值，从而消除间隙。
33.如权利要求29所述的话音编码设备，其特征在于，所述原型量化器还配置成对每一间隙调整2个相邻频带边缘的频率值，即以x对y的比率相对于频率较低的相邻频带边缘频率值的调整，调整频率较高的频带所对应相邻频带边缘的频率值，其中x是较高频率的相邻频带的频带能量，y是较低频率相邻频带的频带能量，从而消除间隙。
34.如权利要求29所述的话音编码设备，其特征在于，所述原型量化器还配置成对，每一间隙调整2个相邻频带边缘的频率值，即以x对y的比率相对于频率较低的相邻频带边缘频率值的调整，调整频率较高的频带所对应相邻频带边缘的频率值，其中x是较低频率相邻频带的中心谐波能量对较低频率相邻频带的总能量的比率，y是较高频率相邻频带的中心谐振能量对较高频率相邻频带的总能量的比率，从而消除间隙。
35.如权利要求24所述的话音编码设备，其特征在于，所述话音编码设备驻留在无线通信系统的用户单元中。
全文摘要
一种话音编码设备中计算帧原型间线性相移用的频带识别方法和装置，其中通过下述划分帧原型频谱将频谱划分成多个段、给每一段分配多个频带、对每一段建立多个频带用的带宽组。带宽可在给定任何段内固定且均匀分布。带宽可在任何段内固定且非均匀分布。带宽可在给定任何段内可变且非均匀分布。
文档编号G10L19/12GK1451154SQ00813042
公开日2003年10月22日申请日期2000年7月18日优先权日1999年7月19日
发明者S·曼祖那什, A·P·德加科, A·K·阿南塔萨帕德曼拉巴汉, P·J·黄, E·L·T·肖依申请人:高通股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：S.曼祖那什;A.P.德加科;A.K.阿南塔萨帕德曼拉巴汉;P.J.黄;E.L.T.肖依
技术所有人：高通股份有限公司
我是此专利的发明人

上一篇：话音编码设备的频谱幅度量化的制作方法
上一篇：用来对相位谱信息进行子抽样的方法和设备的制作方法