专利名称:用于估算语音调制解调器中的模拟高频段信号的方法和系统的制作方法
技术领域:
本发明一般涉及编码和解码综合语音的领域,特别涉及宽频带语音的这样的编码和解码。
背景技术:
日前许多编码语音的方法是基于线性预示(LP)编码,其感性地直接从该语音信号的时间波形而不是从其频谱提取一个语音信号的主要特征(如被称为的频道声音编码器或被称为的共振峰声音编码器所进行的)。在LP编码中,首先分析(LP分析)一个语音波形,以确定引起语音信号并还引起一个传输函数的声道(Vocal track)激励的时变模式。接着一个解码器(在接收端,该编码语音信号是电信通信信号的情况下)使用通过模拟该声道的一个参数化系统传送该激励的综合器再生该原始语音。如发言者产生该语音信号那样,该声道模式的参数和该模式的激励两者被周期性地更新以适应在该发言者中出现的相应的变化。但是,在更新之间,即在任何说明间隔期间,该系统的激励和参数保持不变,并且用该模式执行的处理是一个线性时间无变度的处理。所有编码和解码(贡献的)系统被称为编解码器。
在使用LP编码产生语音的一个编解码器中,该解码器需要提供三个输入的编码器一个音调周期,如果该激励是发音,一个增益系数和预测系数。(在某些编解码器中,例如,还提供该激励的特性,即它是否是发声的或不发声的,但是对于一种代数学的代码激励的线性预示(ACELP)编解码器一般是不需要的。)LP编码是预示的,原因在于在处理前向估算时,它基于施加该参数的话音波形(在一说明间隔期间)的实际输入段应用预测参数。
基本的LP编码和解码可以用来以相对低的数据率数字地传送语音,但是它产生综合的发声语音,这是由于使用了它的很简单的激励系统。一种所谓的代码激励的线性预示(CELP)编解码器是一种增强激励的编解码器。它是基于“残留”编码。该声道的模拟是借助于其参数在压缩的语音中被编码的数字滤波器。这些滤波器由一个信号驱动,即“被激励”,该信号表示原始发言者的声带的振动。音频语音信号的残留信号是(原始)音频语音信号,小于该数字滤波的音频语音信号。一个CELP编解码器编码该残留信号并使用它作为激励的基础,其中叫做“残留脉冲激励”。但是,在逐一取样(Sample-by-Sample)的基础上,CELP使用从一个预定波形模型组选择的一个波形模型来表示一个残留取样块。由该编码器确定的一个代码字提供到该解码器,该解码器接着使用该代码字选择一个残留序列来表示该原始的残留取样。
图1表示一个发射器/编码器系统的元件和一个接收器/解码器系统的元件。整个系统用作一个LP编解码器,并可以是一个CELP类型的编解码器。该发射器接收一个取样的语音信号s(n)并将其提供到对一个编解码器确定LP参数的分析器(反向滤波器和综合滤波器)。sq(n)是用来确定残留x(n)的反向滤波的信号。激励搜索模块为传输编码例如定量的或量化的误差xq(n)的残留x(n)和综合器参数两者,并将它们施加到引导到该接收器的一个通信频道。在接收器(解码系统)侧,一个解码器模块从传输的信号提取该综合器参数并将它们提供到一个综合器。该解码器模块还从该传输的信号确定定量的误差xq(n)。从该综合器的输出是同该定量误差xq(n)相组合的、用来产生表示原始语音信号s(n)的一个定量值sq(n)。
除了该误差xq(n)作为一个指数发送到表示适合用于近似误差(残留)x(n)的各种不同波形的一个代码簿中之外,发射器和接收器以类似方式使用一个CELP类型编解码器功能。
按奈奎斯特(Nyquist)理论,具有取样率Fs的一个语音信号能表示从0-0.5Fs的一个频段。现在,多数语音编解码器(编码器-解码器)使用8KHz的取样率。如果该取样率从8KHz增加,语音的逼真度将改进,因为能表示更高的频率。今天,该语音信号的取样率通常为8KHz,但是开发的移动电话站将使用16KHz的取样率。按奈氏理论,16KHz的取样率能表示0-8KHz频段中的语音。被取样的语音接着由发射器用于通信,然后由接收器解码。使用16KHz的取样率取样的语音的语音编码被称为宽频带语音编码。
当语音的取样率增加时,编码复杂性也增加。用某些算法,当取样率增加时,编码的复杂性甚至能呈指数地增加。因此,在确定对宽频带语音编码的算法时,编码复杂性通常是一个限制因素。这是特别真实的,例如在移动电话站情况下,在那里功率损耗,可得到的处理功率,和存储器要求显著地影响算法的适用性。
有时在语音编码中,已知为分样(decimation)的过程被用来降低该编码的复杂性。分样将降低对一个序列的原始取样率到一个更低的取样率。这是已知的内插法的相反的过程。该分样处理用一个低通滤波器滤波输入数据,然后用更低的取样率再取样该最后的被平滑的信号。内插法将增加对一个序列的原始取样率到更高的一个取样率。内插法将零插入该原始序列中,然后应用一个专门的低通滤波器用内插值去替换该零值。这样将增加取样数。
其他的现有技术宽频带语音编解码器通过使用子频段编码限制复杂性。在这样的一个子频段方法中,在编码一个宽频带信号前,它被分成两个信号,一个较低频段信号和一个较高频段信号。接着两个信号被单独编码。在该解码器中,在综合处理时,将重新组合该两个信号。在该编码算法的复杂性随取样率指数地增加的那些部分(例如搜索改革的代码簿),这样的一种方法将减小编码的复杂性。然而,在复杂性线性增加的部分,这样的一种方法不增加复杂性。
上面的子频段编码现有技术解决方案的编码复杂性可以通过忽略在该编码器中较高频段的分析和如图2中所示的通过在该解码器中用滤波的白噪声或滤波的伪随机噪声来取代它而进一步地被减小。较高频段的分析能被忽略乃是因为人类的听力对高频频段的相位响应是不灵敏的,而仅仅对幅度响应是灵敏的。另外的原因在于只有噪声类的非发声音素在该较高频段中包含能量,而对于相位是重要的发声信号在该较高频段中没有多少能量。按这种近似,较高频段的频谱是用由该较低频段的LP滤波器形成的LP滤波器估算的。这样在传输频道上,没有该较高频率频段内容的信息传送,而较高频段LP综合滤波参数的形成是基于该较低频段。白噪声,一个模拟信号,被用作为对该较高频段滤波的一个源,而该噪声的能量是由该较低频段信号的特性来估算。因为对于该较低频段而言,编码器和解码器两者都识别激励,和长期预测器(LTP)以及固定的代码薄增量,所以有可能从这些参数来估算用于该较高频段的能量定标系数和LP综合滤波参数。按这种现有技术近似,宽频带白噪声的能量将均衡于较低频段激励的能量。因此,将计算该较低频段综合信号的倾斜。在该倾斜系数的计算中,最低频段被截止,而该均衡的宽频带白噪声信号被乘以倾斜系数。接着该宽频带噪声通过该LP滤波器滤波。最后该较低频段由该信号截上。由此,较高频段能量的定标是基于由能量定标器估算器较高频段能量定标系数,而该较高频段LP综合滤波是基于由一个LP滤波估算器提供的较高频段LP综合滤波参数,而不管该输入信号是否为语音或背景噪声。然而这种近似适合于仅包含语音的处理信号,当输入信号包含背景噪声,特别是在非语音周期期间将不起作用。
所需要的是一种包含背景噪声的输入信号的宽带语音编码的方法,其中与编码全宽带语音信号的复杂性相比,该方法将降低复杂性,不管使用的具体编码算法,在表示语音信号方面还提供基本相同的优等的精确度。
发明概述本发明采用话音活动信息的优点区分一个输入信号的语音和非语音周期,以便当估算该输入信号的较高频段的能量定标系数和线性预示(LP)综合滤波参数时考虑该输入信号中背景噪声的影响。
因此,本发明的语音编码方法的第一方面用于编码和解码具有语音周期和非语音周期的输入信号,并且提供具有较高频率分量和较低频率分量的综合的语音,其中该输入信号在编码和解码过程中被分到一个较高频段和一个较低频段中,和其中该较低频段的语音相关的参数特性被用来处理一个模拟信号以提供该综合语音的该较高频率分量,和其中该输入信号包括在该语音周期中的一第一信号和在该非语音周期中的一第二信号,所说方法包括步骤基于表示该第一信号的语音相关参数,定标和综合滤波在该语音周期中的该模拟信号;以及基于表示该第二信号的语音相关参数,定标和综合滤波在该非语音周期中的该模拟信号,其中该第一信号包括一个语音信号,和该第二信号包括一个噪声信号。
最好,还基于由该综合的语音的较低频率分量计算的一个频谱倾斜系数定标和综合滤波在该语音周期中的该模拟信号。
最好,当该输入信号包括背景噪声时,基于该背景噪声的一个校正系数特性,进一步定标和综合滤波在该语音周期中的该模拟信号。
最好,基于该背景噪声的校正系数特性进一步定标和综合滤波在该非语音周期中的该模拟信号。
最好,话音活动信息用来指示该第一和第二信号周期。
本发明的第二方面是一个语音信号发射器和接收器系统,用于编码和解码具有语音周期和非语音周期的一个输入信号和提供具有较高频率分量和较低频率分量的综合的语音,其中该输入信号在编码和解码处理过程被分到一个较高频段和一个较低频段中,和其中该较低频段的语音相关的参数特性用来处理一个模拟信号以提供该综合语音的该较高频率分量一个模拟信号,和其中该输入信号包括在该语音周期中的一第一信号和在该非语音周期中的一第二信号。该系统包括一个解码器,用于接收该编码的输入信号和用于提供语音相关参数;一能量标定估算器,响应该语音相关参数,用于提供一个能量定标系数以定标该模拟信号;一个线性预示滤波估算器,响应该语音相关参数,用于综合滤波该模拟信号;以及一个机构,用于提供关于该语音和非语音周期的信息,使得用于该语音周期和该非语音周期的该能量定标系数分别基于该第一和第二信号估算。
最好,该信息提供机构能提供一第一加权校正系数用于该语音周期和一个不同的第二加权校正系数用于该非语音周期,以便基于该第一和第二加权校正系数允许该能量定标估算器提供能量标定系数。
最好,综合滤波在该语音周期和非语音周期中的该模拟信号也是分别基于该第一加权校正系数和该第二加权校正系数。
最好,该语音相关参数包括表示该第一信号的线性预示编码系数。
本发明的第三方面是一个解码器,用于根据指示具有语音周期和非语音周期的一个输入信号的编码的数据综合具有较高频率分量和较低频率分量的语音,其中该输入信号在编码和解码过程被分到一个较高频段和一个较低频段中,和该输入信号的编码是基于该较低频段,和其中该编码的数据包括该较低频段的语音参数特性用于处理一个模拟信号和提供该综合的语音的该较高频率分量。该系统包括
一个能量定标估算器,响应该语音参数,用于提供第一能量定标系数以定标在该语音周期中的该模拟信号和第二能量定标系数以定标在该非语音周期中的该模拟信号;以及一个综合滤波估算器,提供多个滤波参数以综合滤波该模拟信号。
最好,该解码器还包括一个机构,用于监视该语音周期和非语音周期以允许该能量定标估算器由此改变该能量定标系数。
本发明的第四方面是一个移动站,它被配置来接收包含指示一个输入信号的语音数据的一个编码的位流,其中该输入信号被分到一个较高频段和一个较低频段中,和该输入信号包括在语音周期中的第一信号和在非语音周期中的第二信号,和其中该语音数据包括从该较低频段得到的语音相关参数。该移动站包括第一装置,用于使用该语音相关参数解码该较低频段;第二装置,用于由一个模拟信号解码该较高频段;第三装置,响应该语音数据,用于提供关于该语音和非语音周期的信息;能量定标估算器,响应该语音周期信息,提供基于该第一信号的第一能量定标系数和基于第二信号的第二能量定标系数用于定标该模拟信号;以及预示滤波估算器,响应该语音相关参数和语音周期信息,用于提供基于该第一信号的第一多个线性预示滤波参数和用于滤波该模拟信号的第二多个线性预示滤波参数。
本发明的第五方面是一个通信网络的一个元件,它被配置来从具有编码一个输入信号的装置的一个移动站接收包含语音的一个编码的位流,其中该输入信号被分到一个较高频段和一个较低频段中,和该输入信号包括在语音周期中的第一信号和在非语音周期中的第二信号,其中该语音数据包括从该较低频段得到的语音相关参数。该元件包括第一装置,用于使用该语音相关参数解码该较低频段;第二装置,用于由一个模拟信号解码该较高频段;第三装置,响应该语音数据,提供关于该语音和非语音周期的信息,和提供语音周期信息;
能量定标估算器,响应该语音周期信息,用于提供基于该第一信号的第一能量定标系数和基于该第二信号的第二能量定标系数用于定标该模拟信号;以及预示滤波估算器,响应该语音相关参数和语音周期信息,用于提供基于该第一信号的多个线性预示滤波参数和用于滤波该模拟信号的第二多个线性预示滤波参数。
根据结合图3-6阅读该说明书本发明将成为显而易见。
发明的简要说明图1是说明使用一个线性预示编码器和解码器的发射器和接收器的图解表示。
图2是说明现有技术的CELP语音编码器和解码器的图解表示,其中白噪声用作对较高频段滤波。
图3是说明按本发明的较高频段解码器的图解表示。
图4是说明按输入信号中噪声水平的加权计算的流程图。
图5是说明一个移动站的图解表示,该移动站包括按本发明的一个解码器。
图6是说明使用按本发明的一个解码器的电信通信网络的图解表示。
如图3中所示,使用一个较高频段解码器10基于由类似于如图2中所示的由现有技术较高频段解码器采用的方法的较低频段解码器2产生的该较低频段参数102提供一个较高频段能量定标系数140和多个较高频段线性预示(LP)综合滤波参数142。如在图2中所示,在现有技术编解码器中,一个分样装置用来将该宽带输入信号改变到一个较低频段语音输入信号中,和一个较低频段编码器用来分析一个较低频段语音输入信号以提供多个编码的语音参数。包括一个线性预示编码(LPC)信号的编码的参数,关于该LP滤波器和激励的信息通过传输频道传送到使用一个语音解码器以再现该输入语音的一个接收端。在该解码器中,该较低频段语音信号由一个较低频段解码器综合。实际中,该综合的较低频段语音信号包括由一个LB分析-综合(Analysis-by-Synthesis)(A-b-S)模件(未示)提供的该较低频段激励exc(n)。接着,用内插法提供一个只在该较低频段中包含能量的综合的宽带语音信号到一个求和装置。关于在较高频段中再生该语音信号,该较高频段解码器包括一个能量定标器估算器,一个LP滤波估算器,一个定标模件,和一个较高频段LP综合滤波模件。如所示的那样,该能量定标器估算器提供一个较高频段定标系数,或增益,到该定标模件,而该LP滤波估算器提供一个LP滤波器矢量,或一组较高频段LP综合滤波参数。使用该能量定标系数,该标定模件定标如由该白噪声发生器提供的该模拟信号的能量到一个适当的电平。该较高频段LP综合滤波模件将适当定标的白色噪声转换到在该较低和较高两频段中包含有色噪声(colored noise)的一个模拟宽带信号。之后,一个高通滤波器被用来向该求和装置提供仅在该较高频段包含有色噪声的一个模拟宽带信号,以便在整个宽带中产生该综合的语音。
在本发明中,如图3中所示的,该白噪声,或该模拟信号e(n)也由一个白噪声振荡器4产生。然而在如图2中所示的现有技术的解码器中,较高频段的背景噪声是使用与估算该较高频段语音信号的相同的算法估算的。由于背景噪声的频谱通常比语音的频谱更平缓,所以在该综合的背景噪声条件下对于该较高频段而言现有技术方法产生很小的能量。按本发明,两组能量定标器估算器和两组LP滤波定标器用在该较高频段解码器10中。如图3所示,能量定标器估算器20和LP滤波器估算器22用于该语音周期,而能量定标器计算器30和LP滤波器估算器32用于非语音周期,所有基于由相同较低频段解码器2提供的该较低频段参数102。特别地,能量定标器估算器20假定信号是语音和由此估算该较高频段能量,而LP滤波估算器22设计来模拟一个语音信号。类似地,能量定标器估算器30假定信号是背景噪声和在该假定下估算该较高频段能量,而LP滤波估算器32设计来模拟一个背景噪声信号。因此该能量定标器估算器20用来提供用于语音周期的较高频段能量定标系数120到一个加权调节模件24,而该能量定标器30用来提供用于非语音周期的较高频段能量定标系数130到一个加权调节模件34。该LP滤波估算器22用来提供较高频段LP综合滤波参数122到用于该语音周期的一个加权调节模块26,和LP滤波估算器32用来提供较高频段LP综合滤波参数132到用于该非语音周期的一个加权调节模件36。一般地,该能量定标估算器30和该LP滤波估算器32假定该频谱是平缓的和该能量标定系数是大的,如果与由能量定标器估算器20和LP滤波估算器30所假定的相比较的话。如果信号包括语音和背景噪声两者,则使用两组估算器,但最终的估算是基于较高频段能量定标系数120,130的加权的平均和该较高频段LP综合滤波参数122,132的加权的平均。
为了改变在一个背景噪声和一个语音模式之间的较高频段参数估算算法的加权,基于该语音和背景噪声信号具有可分别的特性的事实,加权计算模件18使用话音活动信息106和解码的较低频段语音信号作为它的输入并且在非语音周期期间通过设置一个加权系数αn用于噪声处理和一个加权系数αs用于语音处理使用该输入来监视背景噪声的电平,这里,αn+αs=1。应指出话音活动信息106是由一个话活动检测器(VAD,未示)提供的,在现有技术中是已知的。该话音活动信息106用来区分该解码的语音信号108的哪部分是来自该语音周期,而哪一部分是来自非语音周期。该背景噪声在语音暂停或非语音周期期间能进行监视。要指出的是,在该话音活动信息未在该传输频道上送到该解码器的情况下,有可能分析该解码的语音信号108以便区分该非语音周期和该语音周期。当存在检测的明显的背景噪声电平时,则如图4中所示的通过增加该加权校正系数an和减小该加权校正系数as,对于该背景噪声加权着重向着该较高频段发生。例如,该加权可按语音能量与噪声能量的实际比例(SNR)来进行。这样,对于语音周期,加权计算模件18对该语音周期提供一个加权校正系数116,或as到该加权调节模件24,26以及对于非语音周期提供一个不同的加权校正系数118,或an到该加权调节模件34,36。例如,通过分析在该非语音周期期间包含在信号102中的综合信号的功率可以求出该背景噪声的功率。通常,该功率电平十分稳定并能考虑成一个常数。因此,SNR是综合的语音信号的功率对背景噪声功率的对数值。借助该加权校正系数116和118,对于语音周期该加权调节模件24提供一个较高频段能量定标系数124,而对于非语音周期该加权调节模件34提供一个较高频段能量定标系数134到求和模件40。求和模件40提供一个较高频段能量定标系数140用于语音和非语音周期。同样地,对于该语音周期,加权调节模件26提供较高频段LP综合滤波参数126,而加权调节模件36提供较高频段LP综合滤波参数136到求和装置42。基于这些参数,该求和装置42提供较高频段LP综合滤波参数142用于该语音和非语音周期。如在图2中所示的,类似于现有技术较高频段编码器中的它们的对应物,一个定标模件50适当地定标如由白噪声发生器4所提供的该模拟信号104的能量,而一个较高频段LP综合滤波模件52在该较低的和较高的频段将该白噪声转换到包含有色噪声的一个模拟宽带信号152中。由参考数150指示具有能量被适当定标的该模拟信号。
实施本发明的一个方法是基于来自该能量定标器估算器20的较高频段能量定标系数120增加该较高频段的背景噪声能量。这样,该较高频段能量定标系数130能简化为该较高频段能量定标系数120乘以一个固定的校正系数Ccorr。例如,如果由该能量定标器估算器20使用的倾斜系数Ctilt是0.5,而校正系数Ccorr=2.0,则该求和的较高频段能量系数140,或αsum,能按下列等式计算αsum=αsctilt+αnctiltccorr(1)如果该加权校正系数116,或αs,对仅语音设置为1.0,对仅噪声为0.0,对具有低电平背景噪声的语音为0.8,和对具有高电平背景噪声的语音为0.5,则求和的较高频段能量系数αsum被给出为αsum=1.0×0.5+0.0×0.5×2.0=0.5(对仅语音)αsum=0.0×0.5+1.0×0.5×2.0=1.0(对仅噪声)αsum=0.8×0.5+0.2×0.5×2.0=0.6(对具有低背景噪声的语音)αsum=0.5×0.5+0.5×0.5×2.0=0.75(对具有高背景噪声的语音)在图5中说明示例性实施。该简单过程可通过校正该较高频段的能量提高该综合语音的质量。在此使用校正系数Ccorr乃是因为背景噪声的频谱通常比语音的频谱更平缓。在语音周期中,该校正系数Ccorr的作用并不像在非语音周期中那样明显,这是由于Ctilt值低。在该情况下,如在现有技术中那样设计Ctilt值用于语音信号。
根据背景噪声的平缓性,有可能自适应地改变该倾斜系数。在一个语音信号中,倾斜定义为频域能量的一般斜率。一般地,一个倾斜系数是由较低频段综合信号计算的并和均衡宽带模拟信号相乘。该倾斜系数通过使用下列等式计算第一自相关系数γ进行估算r={sT(n)s(n-1)}/{sT(n)s(n)} (2)其中s(n)是综合语音信号。因此,估算的倾斜系数Ctilt由Ctilt=1.0-γ确定,其中0.2≤Ctilt≤1.0,和上标T指示一个矢量的移项。
也有可能由LPC激励exc(n)和该滤波的模拟信号e(n)估算该定标系数如下escnled=sqrt[{excT(n)exc(n)}/{eT(n)e(n)}]e(n)(3)该定标系数sqrt[{excT(n)exc(n)}/{eT(n) e(n)}]由参考数140指示,和定标的白噪声escaled由参考数150指示。LPC激励,滤波的模拟信号和倾斜系数能包含在信号102中。
应指出在语音周期的LPC激励exc(n)不同于在非语音周期。由于在语音周期中较低频段信号和较高频段信号之间的特性关系不同于非语音周期,所以希望通过将倾斜系数Ctilt乘校正系数Ccorr来增加较高频段的能量。在上述例中(图4),Ccorr选择为一个常数2.0。但应选择校正系数Ccorr使得0.1≤CtiltCcorr≤1.0。如果能量定标器估算器120的输出信号120是Ctilt,则能量定标器估算器130的输出信号130是CtiltCcorr。
当背景噪声不存在时,对噪声该LP滤波估算器32的一种实施是形成较高频段更平缓的频谱。能通过在形成的宽带LP滤波器之后附加一个加权滤波器WHB(z)=A~(z/β1)/A~(z/β2)]]>得到,这里 是该量化的LP滤波器和oβ1≥β2>1。例如,αsum=αsβ1+αnβ2Ccorr,其中β1=0.5,β2=0.5(对仅语音)β1=0.8,β2=0.5(对仅噪声)β1=0.56,β2=0.46(对具有低背景噪声的语音)β1=0.65,β2=0.40(对具有高背景噪声的语音)应指出当β1和β2之间的差越大时,频谱越平缓,而加权滤波器消除该LP滤波器的影响。
图5表示按本发明一示例性实施例的一个移动站200的方块图。该移动站包括装置的典型部件,例如麦克风201,键盘207,显示器206,耳机214,收/发开关208,天线209和控制单元205。此外,该图表示一个移动站的典型的发射和接收块。发射块204包括一个编码器221,用于编码语音信号。该发射块204还包括频道编码,辨认和调制要求的操作以及RF功能,为清楚起见在图5中未画出。接收块211还包括本发明的一个解码块220。解码块220包括一个像图3中所示的较高频段解码器10的较高频段解码器222。从麦克风201输入、在放大级202放大并在A/D转换器中数字化的信号被送到发射块204,典型地是送到由该发射块包括的语音编码装置。由该发射块调制和放大的经处理的发送信号通过收/发开关208送到天线209。从天线接收的信号通过该收/发开关208送到接收块211,其解调接收的信号并解码该辨认和该频道编码。最后的语音信号通过D/A转换器212送到一个放大器213并进而送到耳机214。控制单元205控制移动站200的操作,读出由用户从键盘207给出的控制命令和借助显示器206给出消息到该用户。
按本发明的较高频段解码器10也可以用在一个电信通信网络300中,例如一个普通的电话网络或移动站中,例如GSM网络。图6表示这种电信网络的一个方块图。例如,电信通信网络300可包括电话交换机或相应的切换系统360,电信网络的普通电话370,基站340,基站控制器350和其他控制装置355都与其相连接。移动站330可以通过基站340建立对该电信通信网络的连接。包括类似于图3中所示的较高频段解码器10的一个较高频段解码器322的解码块320例如可以特别有利地放置在基站340中。然而,例如该解码块320也可放置在基站控制器350或其他的控制或切换装置355中。如果移动站系统例如在该基站和该基站控制器之间使用分开的传输编码器用于将占该无线电频道优势的编码信号转换到在一个电信通信系统中传送的典型的64Kbit/s的信号和反过来也一样,则该解码块320也配置在这样的一个传输编码器中。一般包括较高频段解码器322的解码块320可以放置在电信通信网络300的任一元件中,该电信通信网络300将编码的数据流转换到一个未编码的数据流。解码块320解码和滤波从移动站330输入的编码的语音信号,之后该语音信号可按通常的方式传送为在该电信通信网络300中的自由传送的信号。
本发明可应用到CELP型语音编解码器并还适用于其他类型的语音编解码器。此外,如图3中所示,有可能使用在该解码器中,仅一个能量定标器估算器估算较高频段能量,或一个LP滤波器估算器模拟语音和背景噪声。
这样,虽然本发明已相对一个其最佳实施例作了描述,本专业技术人员将理解可以进行其形式和细节上的上述的和不同的其他的改变,省略和偏离而不脱离本发明的精神和范围。
权利要求
1.一种语音编码的方法,用于编码和解码一个具有语音周期和非语音周期的输入信号以及提供具有较高频率分量和较低频率分量的综合的语音,其中该输入信号在编码和解码处理中被分到一个较高频段和一个较低频段中,和其中该较低频段的语音相关参数特性被用来处理一个模拟信号以提供该综合语音的该较高频率分量,和其中该输入信号包括在该语音周期中的一第一信号和在该非语音周期中的一第二信号,所说方法包括步骤基于表示该第一和第二信号的话音活动信息定标在该语音周期中的该模拟信号。
2.权利要求1的方法,进一步包括步骤基于表示该第一信号的该语音相关参数综合滤波在该语音周期中的模拟信号;以及基于表示该第二信号的该语音相关参数综合滤波在该非语音周期中的模拟信号。
3.权利要求1的方法,其中该第一信号包括一个语音信号和该第二信号包括一噪声信号。
4.权利要求3的方法,其中该第一信号还包括该噪声信号。
5.权利要求1的方法,其中该语音周期和该非语音周期基于该输入信号由一个话音活动检测装置定义。
6.权利要求1的方法,其中该语音相关参数包括表示该第一信号的线性预示编码系数。
7.权利要求1的方法,其中在该语音周期中的该模拟信号的定标是进一步基于由该综合的语音的该较低频率分量计算的一个频谱倾斜系数。
8.权利要求7的方法,其中该输入信号包括一个背景噪声,和其中在该语音周期中的该模拟信号的定标是进一步基于该背景噪声的一个校正系数特性。
9.权利要求8的方法,其中在非语音周期中的该模拟信号的定标是进一步基于该校正系数。
10.一个语音信号发射器和接收器系统,用于编码和解码具有语音和非语音周期的一个输入信号和提供具有较高频率分量和较低频率分量的综合的语音,其中该输入信号在编码和解码处理中被分到一个较高频段和一个较低频段中,和其中该较低频段的语音相关参数特性被用来处理一个模拟信号以提供该综合语音的该较高频率分量一个模拟信号,所说系统包括一个解码器,用于接收该编码的输入信号和用于提供该语音相关参数;一个能量定标估算器,响应于该语音相关参数,用于提供一个能量定标系数以定标该模拟信号;一个线性预示滤波估算器,响应于该语音相关参数以综合滤波该模拟信号;以及装置,用于提供关于该语音和非语音周期的信息,使得用于该语音周期和该非语音周期的能量定标系数分别基于表示该语音和非语音信号的信息估算。
11.权利要求10的系统,其中该信息提供装置基于该输入语音的话音活动信息监视该语音和非语音周期。
12.权利要求10的系统,其中该信息提供装置能为该语音周期提供一个第一加权校正系数和为非语音周期提供一个不同的第二加权校正系数,以便允许该能量定标估算器基于该第一和第二加权校正系数提供该能量定标系数。
13.权利要求12的系统,其中综合滤波在该语音周期和该非语音周期中的该模拟信号是分别基于该第一加权校正系数和该第二加权校正系数。
14.权利要求10的系统,其中该输入信号包括在该语音周期中的第一信号和在该非语音周期中的第二信号,和其中该第一信号包括一个语音信号和该第二信号包括一个噪声信号。
15.权利要求14的系统,其中该第一信号还包括该噪声信号。
16.权利要求10的系统,其中该语音相关参数包括表示该第一信号的线性预示编码系数。
17.权利要求10的系统,其中用于该语音周期的该能量定标系数也由该综合语音的该较低频率分量的该频谱倾斜系数估算。
18.权利要求17的系统,其中该输入信号包括一个背景噪声,和其中用于该语音周期的该能量定标系数还由该背景噪声的一个校正系数特性估算。
19.权利要求18的系统,其中用于该非语音周期的能量定标系数进一步由该校正系数估算。
20.一个用于综合语音的解码器,该综合语音具有来自编码的数据的较高频率分量和较低频率分量,该编码的数据指示具有语音周期和非语音周期的一个输入信号,其中该输入信号在该编码和解码处理中被分到一个较高频段和一个较低频段中,和该输入信号的编码是基于该较低频段,和其中该编码的数据包括该较低频段的语音参数特性,其被用来处理一个模拟信号,以便提供该综合语音的该较高频率分量,所说系统包括一个能量定标估算器,响应于该语音参数,用于提供一第一能量定标系数以定标在该语音周期中的该模拟信号,和第二能量定标系数用于定标在该非语音周期中的该模拟信号;以及一个综合滤波估算器,用于提供多个滤波参数以综合滤波该模拟信号。
21.权利要求20的解码器,还包括用于监视该语音周期和该非语音周期的装置。
22.权利要求20的解码器,其中该输入信号包括在语音周期中的第一信号和在非语音周期中的第二信号,其中该第一能量定标系数基于该第一信号估算,而第二能量定标系数基于该第二信号估算。
23.权利要求22的解码器,其中用于该语音周期和该非语音周期的滤波参数分别由该第一和第二信号估算。
24.权利要求22的解码器,其中该第一能量定标系数进一步基于该综合语音的该较低频率分量的频谱倾斜系数特性估算。
25.权利要求22的解码器,其中该第一信号包括背景噪声,和其中该第一能量定标系数进一步基于该背景噪声的一个校正系数特性估算。
26.权利要求25的解码器,其中该第二能量定标系数进一步由该校正系数估算。
27.一个移动站,配置来接收一个包含表示一个输入信号的语音数据的编码的位流,其中该输入信号被分到一个较高频段和一个较低频段中,和该输入信号包括在语音周期中的第一信号以及在非语音周期中的第二信号,和该语音数据包括由该较低频段得到的语音相关参数,所说移动站包括第一装置,响应于该编码的位流,用于使用该语音相关参数解码该较低频段;第二装置,响应于该编码的位流,用于由一个模拟信号解码该高频段;第三装置,响应于该语音数据,用于得到有关该语音和非语音周期的话音活动信息;以及一个能量定标估算器,响应于该话音活动信息,用于提供第一能量定标系数和第二能量定标系数,以基于该语音周期和非语音周期定标该模拟信号。
28.权利要求27的移动站,还包括一个预示滤波估算器,响应于该语音相关参数和话音活动信息,用于提供基于该第一信号的第一多个线性预示滤波参数和多个用于滤波该模拟信号的第二多个线性预示滤波参数。
29.一个电信通信网络的元件,配置来接收包含表示来自一个移动站的一个输入信号的语音数据的编码的位流,其中该输入信号被分成一个较高频段和一个较低频段以及该输入信号包括在语音周期中的第一信号以及在非语音周期中的第二信号,其中该语音数据包括从该较低频段得到的语音相关参数,所说元件包括第一装置,用于使用该语音有关参数解码该较低频段;第二装置,用于由一个模拟信号解码该较高频段;第三装置,响应于该语音数据,用于提供有关该语音和非语音周期的信息;以及一个能量定标估算器,响应于该语音周期信息,用于提供基于该第一信号的第一能量定标系数和基于第二信号的第二能量定标系数以定标该模拟信号。
30.权利要求29的元件,还包括一个预示滤波估算器,响应于该语音相关参数和该语音周期信息,用于提供基于该第一信号的第一多个线性预示滤波参数和第二多个线性预示滤波参数以滤波该模拟信号。
全文摘要
一种用于编码和解码一个输入信号的方法和系统,其中在编码和解码处理中该输入信号被分成一个较高频段和一个较低频段,以及其中该较高频段的解码是通过使用随同从该较低频段得到的语音相关的参数的一个模拟信号来执行的。实际中,该模拟信号在较低和较高频段被转换到包括有色噪声的一个模拟宽频带信号之前被进行定标的。此外,话音活动信息用来确定该输入信号的语音周期和非语音周期。基于该话音活动信息,在语音周期和非语音周期,不同的加权系数被用来定标该模拟信号。
文档编号G10L11/02GK1484824SQ01817590
公开日2004年3月24日 申请日期2001年8月31日 优先权日2000年10月18日
发明者J·罗托拉-普基拉, H·J·米科拉, J·韦尼奥, J 罗托拉-普基拉, 岚, 米科拉 申请人:诺基亚有限公司