专利名称:立体声信号编码装置、立体声信号解码装置、立体声信号编码方法及立体声信号解码方法
技术领域:
本发明涉及立体声信号编码装置、立体声信号解码装置、立体声信号编码方法及立体声信号解码方法。
背景技术:
在移动通信系统中,为了电波资源等的有效利用,要求将语音信号压缩为低比特率进行传送。另一方面,也希望提高通话语音的质量及实现临场感高的通话服务,对于其实现,不只是对单声道信号,还希望对多声道音响信号、特别是立体声音响信号进行高质量编码。作为将立体声音响信号以低比特率进行编码的方式,已知强度立体声方式(intensity stereo method)。在强度立体声方式中,采用将单声道信号乘以比例系数(scaling coefficients)从而生成L声道信号(左声道信号)和R声道信号(右声道信号)的方法。这样的方法也称作振幅声相(amplitude panning)。振幅声相的最基本的方法是对时域的单声道信号乘以振幅声相用的增益系数(声相增益系数)而求出L声道信号及R声道信号的方法(例如参照非专利文献I)。另外,作为另外的方法,也有在频域中按每一个频率分量(或者每个频率组)对单声道信号乘以声相增益系数从而求出L声道信号及R声道信号的方法(例如参照非专利文献2)。另外,若将声相增益系数作为参量立体声(parametric stereo)的编码参数进行利用,则能够实现立体声信号的可扩展编码(单声道-立体声可扩展编码)(例如参照专利文献I及专利文献2)。在专利文献I中将声相增益系数作为平衡参数进行了说明,在专利文献2中将声相增益系数作为ILD(声强差)进行了说明。另一方面,在移动通信系统中,为了电波资源的有效利用而存在间歇传送(Discontinuous Transmission (不连续传送):DTX)的技术(例如参照非专利文献3)。DTX是在未发出语音时以极低比特率间歇性地传送表示背景噪声的信息的技术。由此,能够降低通话时的平均比特率,能够在相同的频带中容纳更多的移动终端。例如,在非专利文献3中,在判定为非语音区间(无音区间、背景噪声区间)的帧中,以每8巾贞I次的比例,将LPC(Linear Prediction Coding,线性预测编码)系数以29比特进行量化(例如,将LPC系数变换为LSF (Line Spectral Frequencies,线谱频率)系数),将帧能量以6比特进行量化,即合计35比特(比特率:1.75kbit/s)。在解码单元中,对基于随机数所生成的每帧10个的脉冲乘以解码后的帧能量,并使其通过由解码后的LPC系数构成的合成滤波器来生成解码信号。每隔8帧对LPC系数和帧能量进行更新的同时,进行该解码处理。在先技术文献专利文献专利文献1:日本特表2004-535145号公报
专利文献2:日本特表2005-533271号公报非专利文献非专利文献1:V.Pulkki and M.Kar jalainen, “Localization ofamplitude-panned virtual sources I:Stereophonic panning,,,Journal of the AudioEngineering Society, Vol.49,N0.9,2001 年 9 月,pp.739-752非专利文献2:Β.Cheng, C.Ritz and 1.Burnett, “Principles and analysisof the squeezing approach to low bit rate spatial audio coding,,,proc.1EEEICASSP2007, pp.1-13-1-16,2007 年 4 月非专利文献3:3GPP TS26.092V4.0.0, " AMR Speech Codec ;Comfort noiseaspects (Release4), " May200
发明内容
发明要解决的问题在此,考虑对立体声信号适用间歇传送技术的情况。在上述以往技术中,在对背景噪声信号的频谱形状使用声相系数的情况下,存在由于对子带乘以声相系数,而在子带间的频谱产生能量的级差,使质量降低的问题。在与频谱形状比语音单纯的背景噪声信号中,明显地出现该问题。另外,为了解决该问题,考虑了使子带宽度变窄来抑制能量级差的产生的方法,但在这种情况下,必须从编码器侧向解码器侧传送的声相系数的数量增加了,其结果导致比特率的增加。另一方面,在以LPC系数表示背景噪声信号的频谱形状的情况下不会产生上述那样的频谱中的能量级差。但是,必须针对L声道及R声道的每一个对LPC系数进行编码,其结果是,存在比特率增加的问题。本发明的目的是提供在对立体声信号适用间歇传送技术的情况下不使质量降低而能够实现低比特率化的立体声信号编码装置、立体声信号解码装置、立体声信号编码方法及立体声信号解码方法。解决问题的方案本发明的一形态的立体声信号编码装置,对由第一声道信号和第二声道信号构成的立体声信号进行编码,采用包括如下单元的结构:第一编码单元,在当前帧的所述立体声信号是语音部分的情况下对所述立体声信号进行编码,从而生成第一立体声编码数据;第二编码单元,是在当前帧的所述立体声信号是非语音部分的情况下对所述立体声信号进行编码的单元,且分别对单声道信号频谱参数、第一声道信号信息和第二声道信号信息进行编码,从而生成第二立体声编码数据,该单声道信号频谱参数是使用所述第一声道信号和所述第二声道信号所生成的单声道信号的频谱参数,该第一声道信号信息是与所述单声道信号的频谱参数和所述第一声道信号的频谱参数之间的变动量有关的信息,该第二声道信号信息是与所述单声道信号的频谱参数和所述第二声道信号的频谱参数之间的变动量有关的信息;以及发送单元,发送所述第一立体声编码数据或所述第二立体声编码数据。本发明的一形态的立体声信号解码装置,采用包括如下单元的结构:接收单元,得到在编码装置中由第一声道信号和第二声道信号构成的立体声信号是语音部分的情况下所生成的第一立体声编码数据或者在所述编码装置中所述立体声信号是非语音部分的情况下所生成的第二立体声编码数据;第一解码单元,对所述第一立体声编码数据进行解码,从而得到解码第一立体声信号;以及第二解码单元,是对所述第二立体声编码数据进行解码的单元,且使用根据所述第二立体声编码数据所包含的编码数据得到的单声道信号频谱参数、第一声道信号信息和第二声道信号信息,得到由解码第一声道信号和解码第二声道信号构成的解码第二立体声信号,该单声道信号频谱参数是使用所述第一声道信号和所述第二声道信号所生成的单声道信号的频谱参数,该第一声道信号信息是与所述单声道信号的频谱参数和所述第一声道信号的频谱参数之间的变动量有关的信息,该第二声道信号信息是与所述单声道信号的频谱参数和所述第二声道信号的频谱参数之间的变动量有关的信息。本发明的一形态的立体声信号编码方法,是对由第一声道信号和第二声道信号构成的立体声信号进行编码的立体声信号编码方法,包括:第一编码步骤,在当前帧的所述立体声信号是语音部分的情况下对所述立体声信号进行编码,从而生成第一立体声编码数据;第二编码步骤,是在当前帧的所述立体声信号是非语音部分的情况下对所述立体声信号进行编码的步骤,且分别对单声道信号频谱参数、第一声道信号信息和第二声道信号信息进行编码,从而生成第二立体声编码数据,该单声道信号频谱参数是使用所述第一声道信号和所述第二声道信号所生成的单声道信号的频谱参数,该第一声道信号信息是与所述单声道信号的频谱参数和所述第一声道信号的频谱参数之间的变动量有关的信息,该第二声道信号信息是与所述单声道信号的频谱参数和所述第二声道信号的频谱参数之间的变动量有关的信息;以及发送步骤,发送所述第一立体声编码数据或所述第二立体声编码数据。本发明的一形态的立体声信号解码方法,包括:接收步骤,得到在编码装置中由第一声道信号和第二声道信号构成的立体声信号是语音部分的情况下所生成的第一立体声编码数据或者在所述编码装置中所述立体声信号是非语音部分的情况下所生成的第二立体声编码数据;第一解码步骤,对所述第一立体声编码数据进行解码,从而得到解码第一立体声信号;以及第二解码步骤,是对所述第二立体声编码数据进行解码的步骤,且使用所述第二立体声编码数据所包含的单声道信号频谱参数、第一声道信号信息和第二声道信号信息,得到由解码第一声道信号和解码第二声道信号构成的解码第二立体声信号,该单声道信号频谱参数是使用所述第一声道信号和所述第二声道信号所生成的单声道信号的频谱参数,该第一声道信号信息是与所述单声道信号的频谱参数和所述第一声道信号的频谱参数之间的变动量有关的信息,该第二声道信号信息是与所述单声道信号的频谱参数和所述第二声道信号的频谱参数之间的变动量有关的信息。发明效果根据本发明,在对立体声信号适用间歇传送技术的情况下,能够不使品质降低而实现低比特率化。
图1是表示本发明实施方式I的立体声信号编码装置的结构的方框图。图2是表示本发明实施方式I的立体声信号解码装置的结构的方框图。图3是表示本发明实施方式I的立体声DTX编码单元的内部结构的方框图。
图4是表示本发明实施方式I的立体声DTX解码单元的内部结构的方框图。图5是表示本发明实施方式2的立体声DTX编码单元的结构的方框图。图6是表示本发明实施方式2的立体声DTX解码单元的结构的方框图。图7是表示本发明实施方式2的声道间的帧能量之差和各声道的变形系数之间的对应关系的图。图8是表示本发明实施方式3的立体声DTX编码单元的结构的方框图。图9是表示本发明实施方式3的立体声DTX解码单元的结构的方框图。符号说明100立体声信号编码装置101VAD 单元102、105、202、205 切换单元103立体声编码单元
104立体声DTX编码单元106复用单元200立体声信号解码装置201、401 分离单元203立体声解码单元204立体声DTX解码单元301、302帧能量编码单元303、304、502、701、702 频谱参数分析单元305平均频谱参数计算单元306平均频谱参数量化单元307平均频谱参数解码单元308、309、708、709误差频谱参数计算单元310、311、710、711误差频谱参数量化单元312复用单元402、403、704、705帧增益解码单元404平均频谱参数解码单元405、406、801、802误差频谱参数解码单元407、408、603、604、803、804 频谱参数生成单元409、412激励生成单元410,413 乘法单元411、414合成滤波器单元501单声道信号生成单兀503频谱参数量化单元601、703频谱参数解码单元602、706帧增益比较单元707频谱参数估计单元
具体实施例方式以下,参照附图对本发明的实施方式详细地进行说明。(实施方式I)图1是表示本发明实施方式I的立体声信号编码装置100的结构的方框图。立体声信号编码装置100主要由VAD (Voice Active Detector,语音检测)单元101、切换单元102、105、立体声编码单元103、立体声DTX编码单元104和复用单元106所构成。立体声信号编码装置100以规定的时间间隔(例如,20ms)进行立体声信号成帧,以该帧为单位进行立体声信号的编码。以下,对各结构,详细地进行说明。VAD单元101分析输入信号(由L声道信号和R声道信号构成的立体声信号),判定当前帧的输入信号是语音部分还是非语音部分。由于信号的振幅值非常小而听感上感到无音的无音部分、日常生活中所感知的环境音(通道的动作声音和车辆的行驶声音)所代表的背景噪声部分等属于非语音部分。以下,将背景噪声部分作为非语音部分的代表进行说明。在该分析中,至少使用信号的能量。而且,VAD单元101在作为分析结果判定为当前帧的输入信号是语音部分的情况下,生成表示当前帧的输入信号是语音部分的VAD数据,在判定为当前帧的输入信号是背景噪声部分的情况下,生成表示当前帧的输入信号是背景噪声部分的VAD数据。而且,VAD单元101将所生成的VAD数据向切换单元102、105及复用单元106输出。切换单元102依据从VAD单元101输入的VAD数据切换立体声编码单元103和立体声DTX编码单元104,作为输入信号(立体声信号)的输出目的地。具体而言,在VAD数据表示语音部分的情况下,切换单元102将输出目的地切换为立体声编码单元103,并将输入信号输出到立体声编码单元103。另一方面,在VAD数据表示背景噪声部分的情况下,切换单元102将输出目的地切换为立体声DTX编码单元104,并将输入信号输出到立体声DTX编码单兀104。立体声编码单元103对从切换单元102输入的输入信号(语音部分)进行编码。具体而言,立体声编码单元103利用构成立体声信号的L声道信号和R声道信号之间的相关对立体声信号进行编码。作为上述立体声信号的编码方法,例如使用非专利文献I所示的方法。而且,立体声编码单元103将通过编码处理所生成的立体声编码数据输出到切换单元105。立体声DTX编码单元104对从切换单元102输入的输入信号(背景噪声部分)进行编码。例如,立体声DTX编码单元104以对规定的帧数(例如,8帧)I次的比例进行编码处理。这是因为假定了背景噪声的特性在时间上的变化少。由此,能够进一步实现低比特率化。而且,立体声DTX编码单元104将通过编码处理所生成的立体声编码数据经由切换单元105输出到复用单元106。此外,如果是不使编码处理动作的帧,则立体声DTX编码单元104将表示编码处理未动作的状况的特定符号(例如,无音标识符(Silence description))即SID输出到切换单元105,作为立体声编码数据。此外,关于立体声DTX编码单元104中的编码处理的详细说明,将后述。与切换单元102同样地,切换单元105依据从VAD单元101输入的VAD数据,切换立体声编码单元103和立体声DTX编码单元104,作为立体声编码数据的输入源。具体而言,在VAD数据表示语音部分的情况下,切换单元105将输入源切换为立体声编码单元103,将立体声编码单元103所生成的立体声编码数据输出到复用单元106。另一方面,在VAD数据表示背景噪声部分的情况下,切换单元105将输入源切换为立体声DTX编码单元104,将立体声DTX编码单元104所生成的立体声编码数据输出到复用单元106。复用单元106对从VAD单元101输入的VAD数据和从切换单元105输入的立体声编码数据进行复用,生成复用数据。由此,复用数据发送到立体声信号解码装置。以上,结束了立体声信号编码装置100的结构说明。接着,使用图2说明本实施方式的立体声信号解码装置200。图2是表示立体声信号解码装置200的结构的方框图。立体声信号解码装置200主要由分离单元201、切换单元202、205、立体声解码单元203和立体声DTX解码单元204构成。以下,对各结构详细地进行说明。分离单元201接收所输入的复用数据,并将接收到的复用数据分离为VAD数据和立体声编码数据。而且,分离单元201将VAD数据输出到切换单元202、205,将立体声编码数据输出到切换单元202。切换单元202依据从分离单元201输入的VAD数据(表示当前帧的输入信号是语音部分和背景噪声部分中的哪种的数据),切换立体声解码单元203和立体声DTX解码单元204,作为立体声编码数据的输出目的地。具体而言,在VAD数据表示语音部分的情况下,切换单元202将输出目的地切换为立体声解码单元203,将立体声编码数据输出到立体声解码单元203。另一方面,在VAD数据表示背景噪声部分的情况下,切换单元202将输出目的地切换为立体声DTX解码单元204,将立体声编码数据输出到立体声DTX解码单元204。立体声解码单元203对从切换单元202输入的立体声编码数据(即,在立体声信号编码装置100中当立体声信号是语音部分的情况下所生成的立体声编码数据)进行解码,生成解码立体声信号(解码L声道信号及解码R声道信号)。而且,立体声解码单元203将所生成的解码立体声信号输出到切换单元205。立体声DTX解码单元204对从切换单元202输入的立体声编码数据(即,在立体声信号编码装置100中当立体声信号是背景噪声部的情况下所生成的立体声编码数据)进行解码,生成解码立体声信号(解码L声道信号及解码R声道信号)。而且,立体声DTX解码单元204将所生成的解码立体声信号输出到切换单元205。此外,如上所述,因为立体声DTX编码单元104(图1)以对规定的帧数(例如,8帧)1次的比例进行编码处理,所以立体声DTX解码单元204,以对规定的帧数(例如,8帧)I次的比例接收立体声编码数据,而在除此以外的帧也就是编码处理不动作的帧,接收SID (无音标识符)。立体声DTX解码单元204在接收到SID时,使用刚刚接收到的立体声编码数据进行解码处理,生成解码立体声信号。即,在立体声DTX解码单元204中,以规定的帧数(例如,8帧)连续使用接收到的立体声编码数据。此外,关于立体声DTX解码单元204中的解码处理的详细说明,将后述。与切换单元202同样地,切换单元205依据从分离单元201输入的VAD数据,切换立体声解码单元203和立体声DTX解码单元204,作为解码立体声信号的输入源。具体而言,在VAD数据表示语音部分的情况下,切换单元205将输入源切换为立体声解码单元203,使立体声解码单元203中生成的解码立体声信号输出。另一方面,在VAD数据表示背景噪声部分的情况下,切换单元205将输入源切换为立体声DTX解码单元204,使立体声DTX解码单元204中生成的解码立体声信号输出。
以上,结束了对立体声信号解码装置200的结构的说明。接着,使用图3说明立体声信号编码装置100中的立体声DTX编码单元104的结构。此外,在以下的说明中,以使用LSP(Line Spectral Pairs,线谱对)参数作为各信号的频谱参数的情况为前提进行说明。例如,能够通过对LPC系数进行变换而求出各信号的LSP参数,该LPC系数是通过对各信号的LPC分析所得到的。但是,作为频谱参数,不限定于LSP参数,也可以使用 LSF(Line Spectral Frequencies,线谱频率)参数及 ISF(ImmittanceSpectral Frequencies,导抗谱频率)参数等。图3是表示立体声DTX编码单元104的内部结构的方框图。立体声DTX编码单元104主要由巾贞能量编码单元301、302、频谱参数分析单元303、304、平均频谱参数计算单元305、平均频谱参数量化单元306、平均频谱参数解码单元307、误差频谱参数计算单元308、309、误差频谱参数量化单元310、311、复用单元312所构成。以下,对各结构详细地进行说明。帧能量编码单元3 01求出所输入的L声道信号的帧能量,并对帧能量进行标量量化(scalar quantization)(编码),生成L声道信号巾贞能量量化信息。而且,巾贞能量编码单元301将L声道信号帧能量量化信息输出到复用单元312。帧能量编码单元302求出所输入的R声道信号的帧能量,并对帧能量进行标量量化(编码),生成R声道信号帧能量量化信息。而且,帧能量编码单元302将R声道信号帧能量量化信息输出到复用单元312。频谱参数分析单元303对所输入的L声道信号进行LPC分析,生成表示L声道信号的频谱特性的LSP参数。而且,频谱参数分析单元303将L声道信号的LSP参数输出到平均频谱参数计算单元305及误差频谱参数计算单元308。与频谱参数分析单元303同样地,频谱参数分析单元304对所输入的R声道信号进行LPC分析,生成表示R声道信号的频谱特性的LSP参数。而且,频谱参数分析单元304将R声道信号的LSP参数输出到平均频谱参数计算单元305及误差频谱参数计算单元309。平均频谱参数计算单元305使用L声道信号的LSP参数及R声道信号的LSP参数,计算平均频谱参数。而且,平均频谱参数计算单元305将平均频谱参数输出到平均频谱参数量化单元306。例如,平均频谱参数计算单元305根据下式(I),计算平均频谱参数LSPm (i)。
权利要求
1.立体声信号编码装置,对由第一声道信号和第二声道信号构成的立体声信号进行编码,包括: 第一编码单元,在当前帧的所述立体声信号是语音部分的情况下对所述立体声信号进行编码,从而生成第一立体声编码数据; 第二编码单元,是在当前帧的所述立体声信号是非语音部分的情况下对所述立体声信号进行编码的单元,且分别对单声道信号频谱参数、第一声道信号信息和第二声道信号信息进行编码,从而生成第二立体声编码数据,该单声道信号频谱参数是使用所述第一声道信号和所述第二声道信号所生成的单声道信号的频谱参数,该第一声道信号信息是与所述单声道信号的频谱参数和所述第一声道信号的频谱参数之间的变动量有关的信息,该第二声道信号信息是与所述单声道信号的频谱参数和所述第二声道信号的频谱参数之间的变动量有关的信息;以及 发送单元,发送所述第一立体声编码数据或所述第二立体声编码数据。
2.如权利要求1所述的立体声信号编码装置, 所述第二编码单元包括: 第一分析单元,对所述第一声道信号进行线性预测编码分析,从而生成第一频谱参数; 第二分析单元,对所述第二声道信号进行线性预测编码分析,从而生成第二频谱参数; 平均频谱参数计算单元,计算所述第一频谱参数和所述第二频谱参数之间的平均作为所述单声道信号频谱参数; 单声道信号编码单元,对所述单声道信号频谱参数进行编码; 解码单元,对所述单声道信号频谱参数的编码数据进行解码,从而生成解码频谱参数; 第一误差计算单元,计算所述解码频谱参数和所述第一频谱参数之间的差值作为所述第一声道信号信息; 第二误差计算单元,计算所述解码频谱参数和所述第二频谱参数之间的差值作为所述第二声道信号信息; 第一声道信号编码单元,对所述第一声道信号信息进行编码;以及 第二声道信号编码单元,对所述第二声道信号信息进行编码。
3.如权利要求1所述的立体声信号编码装置, 所述第二编码单元包括: 生成单元,对所述第一声道信号和所述第二声道信号进行缩混,从而生成所述单声道信号; 分析单元,对所述单声道信号进行线性预测编码分析,从而生成所述单声道信号频谱参数; 第一分析单元,对所述第一声道信号进行线性预测编码分析,从而生成第一频谱参数; 第二分析单元,对所述第二声道信号进行线性预测编码分析,从而生成第二频谱参数;单声道信号编码单元,对所述单声道信号频谱参数进行编码; 解码单元,对所述单声道信号频谱参数的编码数据进行解码,从而生成解码频谱参数; 第一误差计算单元,计算所述解码频谱参数和所述第一频谱参数之间的差值作为所述第一声道信号信息; 第二误差计算单元,计算所述解码频谱参数和所述第二频谱参数之间的差值作为所述第二声道信号信息; 第一声道信号编码单元,对所述第一声道信号信息进行编码;以及 第二声道信号编码单元,对所述第二声道信号信息进行编码。
4.如权利要求1所述的立体声信号编码装置, 所述第二编码单元包括: 生成单元,对所述第一声道信号和所述第二声道信号进行缩混,从而生成所述单声道信号;` 分析单元,对所述单声道信号进行线性预测编码分析,从而生成所述单声道信号频谱参数; 单声道信号编码单元,对所述单声道信号频谱参数进行编码; 第一能量编码单元,将所述第一声道信号的能量作为所述第一声道信号信息进行编码;以及 第二能量编码单元,将所述第二声道信号的能量作为所述第二声道信号信息进行编码。
5.如权利要求1所述的立体声信号编码装置, 所述第二编码单元包括: 生成单元,对所述第一声道信号和所述第二声道信号进行缩混,从而生成所述单声道信号; 分析单元,对所述单声道信号进行线性预测编码分析,从而生成所述单声道信号频谱参数; 单声道信号编码单元,对所述单声道信号频谱参数进行编码; 第一能量编码单元,将所述第一声道信号的能量作为所述第一声道信号信息进行编码; 第二能量编码单元,将所述第二声道信号的能量作为所述第二声道信号信息进行编码; 比较单元,对所述第一声道信号的能量的解码值和所述第二声道信号的能量的解码值进行比较; 生成单元,根据所述单声道信号频谱参数的解码值得到第一声道线性预测编码系数及第二声道线性预测编码系数,在所述比较单元的比较结果中所述第一能量的解码值与所述第二能量的解码值之差越大,则在对所述第一线性预测编码系数及所述第二线性预测编码系数之中能量小的信号的线性预测编码系数实施了越加强频谱的白化的变形后,变换为频谱参数,从而生成变形第一频谱参数及变形第二频谱参数; 第一误差计算单元,计算所述单声道信号频谱参数和所述变形第一频谱参数之间的差值作为所述第一声道信号信息; 第二误差计算单元,计算所述单声道信号频谱参数和所述变形第二频谱参数之间的差值作为所述第二声道信号信息; 第一声道信号编码单元,对所述第一声道信号信息进行编码;以及 第二声道信号编码单元,对所述第二声道信号信息进行编码。
6.立体声信号解码装置,包括: 接收单元,得到在编码装置中由第一声道信号和第二声道信号构成的立体声信号是语音部分的情况下所生成的第一立体声编码数据或者在所述编码装置中所述立体声信号是非语音部分的情况下所生成的第二立体声编码数据; 第一解码单元,对所述第一立体声编码数据进行解码,从而得到解码第一立体声信号;以及 第二解码单元,是对所述第二立体声编码数据进行解码的单元,且使用根据所述第二立体声编码数据所包含的编码数据得到的单声道信号频谱参数、第一声道信号信息和第二声道信号信息,得到由解码第一声道信号和解码第二声道信号构成的解码第二立体声信号,该单声道信号频谱参数是使用所述第一声道信号和所述第二声道信号所生成的单声道信号的频谱参数,该第一声道信号信息是与所述单声道信号的频谱参数和所述第一声道信号的频谱参数之间的变动量有关的信息,该第二声道信号信息是与所述单声道信号的频谱参数和所述第二声道信号的频谱参数之间的变动量有关的信息。
7.如权利要求6所述的立体声信号解码装置, 所述第一声道信号信息表示所述单声道信号频谱参数和所述第一声道信号的频谱参数之间的差值以及所述第一声道信号的能量即第一能量, 所述第二声道信号信息表示所述单声道信号频谱参数和所述第二声道信号的频谱参数之间的差值以及所述第二声道信号的能量即第二能量, 所述第二解码单元包括: 第一频谱参数生成单元,使用所述单声道信号频谱参数及所述第一声道信号信息,生成所述第一声道信号的频谱参数即第一频谱参数; 第二频谱参数生成单元,使用所述单声道信号频谱参数及所述第二声道信号信息,生成所述第二声道信号的频谱参数即第二频谱参数; 第一合成滤波器,使乘以所述第一能量后的激励信号通过合成滤波器,从而生成所述解码第一声道信号,该合成滤波器由根据所述第一频谱参数得到的线性预测编码系数构成;以及 第二合成滤波器,使乘以所述第二能量后的激励信号通过合成滤波器,从而生成所述解码第二声道信号,该合成滤波器由根据所述第二频谱参数得到的线性预测编码系数构成。
8.如权利要求6所述的立体声信号解码装置, 所述第二解码单元包括: 比较单元,对所述第一声道信号的能量即第一能量和所述第二声道信号的能量即第二能量进行比较; 生成单元,使用所述比较单元的比较结果及所述单声道信号频谱参数,生成所述第一声道信号的线性预测编码系数即第一线性预测编码系数以及所述第二声道信号的线性预测编码系数即第二线性预测编码系数; 第一合成滤波器,使乘以所述第一声道信号的能量后的激励信号通过由所述第一线性预测编码系数所构成的合成滤波器,从而生成所述解码第一声道信号;以及 第二合成滤波器,使乘以所述第二声道信号的能量后的激励信号通过由所述第二线性预测编码系数所构成的合成滤波器,从而生成所述解码第二声道信号。
9.如权利要求8所述的立体声信号解码装置, 所述生成单元根据所述单声道信号频谱参数得到所述第一线性预测编码系数及所述第二线性预测编码系数,在所述第一能量和所述第二能量之间的差值比阈值大的情况下,对所述第一线性预测编码系数及所述第二线性预测编码系数之中能量小的信号的线性预测编码系数实施加强白化程度的变形。
10.如权利要求8所述的立体声信号解码装置, 所述生成单元根据所述单声道信号频谱参数得到所述第一线性预测编码系数及所述第二线性预测编码系数,所述第一能量和所述第二能量之间的差值越大,则对所述第一线性预测编码系数及所述第二线性预测编码系数之中能量小的信号的线性预测编码系数实施越加强白化程度的变形。
11.如权利要求6所述的立体声信号解码装置, 所述第一声道信号信息表示所述单声道信号频谱参数和所述第一声道信号的频谱参数之间的差值即第一误差分量以及所述第一声道信号的能量即第一能量, 所述第二声道信号信息表示所述单声道信号频谱参数和所述第二声道信号的频谱参数之间的差值即第二误差 分量以及所述第二声道信号的能量即第二能量, 所述第二解码单元包括: 比较单元,对所述第一能量和所述第二能量进行比较; 生成单元,根据所述单声道信号频谱参数得到第一线性预测编码系数及第二线性预测编码系数,在所述比较单元的比较结果中所述第一能量和所述第二能量之间的差值越大,则在对所述第一线性预测编码系数及所述第二线性预测编码系数之中能量小的信号的线性预测编码系数实施越加强频谱的白化的变形,从而生成了变形第一线性预测编码系数及变形第二线性预测编码系数后,变换为频谱参数,生成变形第一频谱参数及变形第二频谱参数,并且对所述变形第一频谱参数加上所述第一误差分量,从而生成所述第一声道信号的频谱参数即第一频谱参数,对所述变形第二频谱参数加上所述第二误差分量,从而生成所述第二声道信号的频谱参数即第二频谱参数; 第一合成滤波器,使乘以所述第一能量后的激励信号通过合成滤波器,从而生成所述解码第一声道信号,该合成滤波器由根据所述第一频谱参数得到的线性预测编码系数构成;以及 第二合成滤波器,使乘以所述第二能量后的激励信号通过合成滤波器,从而生成所述解码第二声道信号,该合成滤波器由根据所述第二频谱参数得到的线性预测编码系数构成。
12.立体声信号编码方法,对由第一声道信号和第二声道信号构成的立体声信号进行编码,包括:第一编码步骤,在当前帧的所述立体声信号是语音部分的情况下对所述立体声信号进行编码,从而生成第一立体声编码数据; 第二编码步骤,是在当前帧的所述立体声信号是非语音部分的情况下对所述立体声信号进行编码的步骤,且分别对单声道信号频谱参数、第一声道信号信息和第二声道信号信息进行编码,从而生成第二立体声编码数据,该单声道信号频谱参数是使用所述第一声道信号和所述第二声道信号所生成的单声道信号的频谱参数,该第一声道信号信息是与所述单声道信号的频谱参数和所述第一声道信号的频谱参数之间的变动量有关的信息,该第二声道信号信息是与所述单声道信号的频谱参数和所述第二声道信号的频谱参数之间的变动量有关的信息;以及 发送步骤,发送所述第一立体声编码数据或所述第二立体声编码数据。
13.立体声信号解码方法,包括: 接收步骤,得到在编码装置中由第一声道信号和第二声道信号构成的立体声信号是语音部分的情况下所生成的第一立体声编码数据或者在所述编码装置中所述立体声信号是非语音部分的情况下所生成的第二立体声编码数据; 第一解码步骤,对所述第一立体声编码数据进行解码,从而得到解码第一立体声信号;以及 第二解码步骤,是对所述第二立体声编码数据进行解码的步骤,且使用所述第二立体声编码数据所包含的单声道信号频谱参数、第一声道信号信息和第二声道信号信息,得到由解码第一声道信号和解码第二声道信号构成的解码第二立体声信号,该单声道信号频谱参数是使用所述第一声道信号和所述第二声道信号所生成的单声道信号的频谱参数,该第一声道信号信息是与所述单声道信号的频谱参数和所述第一声道信号的频谱参数之间的变动量有关的信息,该第二声道信号信息是与所述单声道信号的频谱参数和所述第二声道信号的频谱参数之间的变动量有关的信息。
全文摘要
在对立体声信号适用间歇传送技术的情况下,不会使质量降低而能够实现低比特率化的立体声信号编码装置。该装置是对由第一声道信号和第二声道信号构成的立体声信号进行编码的立体声信号编码装置(100),立体声编码单元(103)在当前帧的立体声信号是语音部分的情况下对立体声信号进行编码,从而生成第一立体声编码数据,立体声DTX编码单元(104)是在当前帧的立体声信号是非语音部分的情况下对立体声信号进行编码的单元,且分别对使用第一声道信号及第二声道信号所生成的单声道信号的频谱参数即单声道信号频谱参数、与第一声道信号有关的第一声道信号信息、与第二声道信号有关的第二声道信号信息进行编码,从而生成第二立体声编码数据。
文档编号G10L19/00GK103180899SQ201180052129
公开日2013年6月26日 申请日期2011年10月17日 优先权日2010年11月17日
发明者押切正浩, 江原宏幸 申请人:松下电器产业株式会社