专利名称:用于压缩的方法和装置,用于传输的方法以及用于扩展被压缩多声道声音信号的方法和 ...的制作方法
技术领域:
本发明涉及压缩,例如电影院、磁带录相机或视盘放相机等多声道音响系统的声音信号的方法和装置,传输多声道声音系统的被压缩声音信号的方法,扩展多声道声音系统的被压缩声音信号的方法和装置,以及记录多声道音响系统的被压缩声音信号的记录媒体。
背景技术:
已知许多压缩数字声频或语声信号的技术。例如,在子频带编码中,非块形成频带划分系统,不将输入音频信号按时间划分成块,而将其用滤波器按频率划分成多个用于量化的频带。在块形成频带划分系统中,例如变换编码系统,时间域的输入音频信号通过正交变换被转换成频域的频谱系数。产生的频谱系数按频率划分成多个频带,并且每个频带的频谱系数被量化。
一种组合了子频带编码和变换编码的技术也是已知的。其中,通过按频率划分输入音频信号而不将其划分成块所产生的频域信号被个别地、正交地变换成频谱系数。然后,将频谱系数按频率划分成多个频带,接着每个频带里的频谱系数被量化。
在那些用于将输入的数字音频信号划分成频域而不是将其划分成块的滤波器中,有一种是正交镜像(QMF)滤波器,例如在R.E.Crochieve,55 BELL SYST.TECH.J.No.8,(1976)的《子频带中的语声数字编码》中有所描述。在Joseph H.Rothweilev,ICASSP 83,BOSTON(1983)的《多相正交滤波器—一种新的子频带编码技术》中,讨论了将输入音频信号按频率划分成同样带宽的频带的技术。
正交地变换输入信号的已知技术包括将数字输入音频信号按时间划分成有预定时间间隔的块,并且用快速付利叶变换(FFT),离散余弦变换(DCT),或改进的DCT(MDCT)处理所产生的块,将每个数字音频信号块从时间域变换成频域的一组频谱系数。在J.P.Princen和A.B.Bradley,的《采用基于时域混叠对消的滤波器组的子频带/变换编码》,ICASSP 1987中讨论了改进的DCT。
作为用于量化通过分频所得到的频谱系数的一种技术,已知按频率将频谱系数划分成频带,并考虑到人类听觉的频率分辨率的特征。在0Hz到20或22KHz范围内的音频能按频率划分成频带,例如25个临界频带,它们的带宽随频率的增加而增加。通过对每个频带进行自适应比特分配而对每个频带内的频谱系数进行量化。例如,从改进离散余弦变换(MDCT)所得到的频谱系数被频率划分成频带,并用自适应确定的比特数对每个频带里的频谱系数进行量化。
现在将讨论两种已知的自适应比特分配技术。首先,在ASSP-25,IEEE声音,语声处理和信号处理学报,1977,8月No.4中所描述的技术中,根据相应频带信号的大小来进行比特分配。尽管这个系统提供扁平量化噪声频谱,并最小化噪声能量,但是,听者感觉到的噪声末被最小化,因为这种技术不利用人类听觉的掩蔽特征。
另一方面,M.A.Kransner《临界频带编码器—适应听觉系统感觉要求的数字编码》,ICASSP 1980中,描述了利用人类听觉的掩蔽特性来确定为每个声道建立固定量化比特分配所需的信号-噪声之比的技术。但是,由于其固定的比特分配,这种技术对单一正弦(sine)波输入提供相对差的结果。
作为压缩数字声音信号的高效系统,例如,采用上述子频带编码系统,一种被称作ATRAC的高效压缩系统已经投入实际使用。这个系统利用人类听觉特性,用自适应变换声音编码将数字声音信号压缩到它们原始比特要求的大约20%。ATRAC是当前代理人(sony公司)的注册商标。
在四到八条声道中的多声道声音或语声信号,不仅在例如一般音响设备中用到,还在立体声或多声道音响系统中采用,例如在电影院、高质量电视、磁带录相机和视盘放相机中发现的那些设备。在这些情况下,需要采用高效压缩,以降低代表大量声音信号所需的比特率。
特别是,在商业应用中,已经有了一种向多声道数字声音信号和处理八声道数字声音信号的设备方面发展的趋势。典型的处理八声道数字声音信号的设备是电影院音响系统,以及通过各种电子媒体,电子化地重放电影的画面和声音的装置,尤其是诸如象高质量电视系统、磁带录相机和视盘放相机那样的装置。在这种装置音响系统中,有一种趋于四和八声道之间的多声道音响系统的趋势。
电影院音响系统最近已经建议在电影胶片上为以下八条声道记录数字声音信号左边,左边-中心,中心,右边-中心,右边,左环,右环和子低音喇叭。这些声音声道分别由左扬声器,左-中心扬声器,中心扬声器,右-中心扬声器和右扬声器重放,它们全安排在屏幕之后;子低音喇叭位于屏幕前面或后面;以及一个左环绕扬声器和右环绕扬声器。在左边墙大厅背墙的左部以及右边墙和大厅背墙的右部,为左环绕扬声器和右环绕扬声器,分别安排了两组扬声器。大厅背墙和两边墙上的这两组扬声器产生丰富的环绕声域,以伴随在电影院的宽屏幕上的壮观的视觉效果。这了简化,从现在起,这两组扬声器被称作“左环绕扬声器”和“右环绕扬声器”。
难以在电影胶片上象在密磁盘(CD)中所采用的那样用44.1KHz的采样频率录制八声道的16-比特线性量化数字声音,因为胶片上缺少能为这样的信号容纳足够宽的音槽的区域。电影胶片的宽度和胶片上图象区的宽度是标准化的。胶片的宽度不能增加,也不能减少图象区的宽度以容纳这类数字音频信号所需宽度的声槽。有标准图象区,标准模拟声槽,和标准孔眼的标准胶片只有一个窄的数字声音信号能被记录的区域。因此,只有数字声音信号在记录在胶片上之前被压缩过,才能记录八声道的数字声音。能用上述ATRAC高效压缩系统对八声道数字声音进行压缩。
电影胶片容易被划坏,因此,如果数字声音信号未经任何形式的检错和纠错而被录制,它将引起遗漏。因此,采用纠错码是必不可少的,当进行信号压缩时,必须考虑这一点。
作为在家里提供电影的一种媒体,光盘已经开始流行,最理想的是能够用四到八个声道在光盘上录制多声道声音,以提供比传统立体声更逼真的声音。在光盘上,视频信号的数据量是音频信号的十倍,并只为声音信号提供有限的记录区域。特别地,象当前大屏幕趋势所要求的那样,当需要图象信号提供高质图象时,尽可能多地记录区被用于图象信号。因此,如果要在声音信号的可记录区域中提供所需数目的声道,声音信号必须被高度压缩。
当由当前代理人之一(sony公司)所建议的上述ATRAC高效压缩系统被用于立体(两声道)声系统中时,每个声道中的音频信号被相互独立地进行压缩。这使每条声道能被独立地使用,并且简化了用于压缩音频信号的处理算法。按这种方式工作,ATRAC系统为大多数应用提供足够的压缩,并且当用ATRAC系统对音频信号进行压缩和扩展时,所获得的声音质量被认为很好。
但是,由于它独立地压缩每个音频信号,因此不能说当前ATRAC系统用以进行其压缩的比特分配处理以最高效率操作。例如,如果一条声道的信号电平很低,能用较少比特,充分地代表该信号。另一方面,另一条声道中的信号可能需要更多的比特来充分地代表它。现有ATRAC系统在每个声道分配相同数目的比特,而与在声道中充分表示信号实际所需的比特数目无关。因此,为了提供其高质量重放,本系统进行的比特分配中,必须有一些冗余。
如果要把多声道声音信号录制在电影胶片或光盘上,需要提高压缩比而音质恶化又最小。
因此,本发明的一个目标是提供一种编码方法和装置,用于进一步提高压缩比以使多声道声音信号能被录制在电影胶片、光盘或其它媒体上,或能被传输或分配。
本发明的另一目标是提供一种编码方法或装置,以声音质量的最小程度恶化,为至少两条声道的声音信号编码,有良好的声道隔离,以及稳定的立体声效果。
发明概述本发明首先提供多声道信号处理器,用于在多声道音响系统的相应声道中压缩数字声音信号。该装置包括第一级压缩系统和第二级压缩系统。在第一级压缩系统中,耦合电路进行至少两条声道之间数字声音信号的耦合,以为每条声道产生一个经过耦合处理的信号。压缩器电路从耦合电路接收经过耦合处理的信号,并且将每个经过耦合处理的信号划分成相应频带中的频带信号,并压缩通过划分每个经过耦合处理的信号所得到的频带信号,以生成第一级被压缩信号。在第二级压缩系统中,确定电路为每一声道接收来自第一级压缩系统的第一级被压缩信号,并且根据相应声道的第一级被压缩信号来为每条声道确定能量。声道比特分配判定电路相应于确定电路操作,并且在声道之间分配预定的比特数量,给每条声道分配一些比特。最后,附加压缩器对每条声道使用由声道比特分配判定电路分配给相应声道的比特数,进一步压缩每条声道的第一级被压缩信号。
发明接着提供一种用于在多声道音响系统的相应声道中压缩数字声音信号的方法。在该方法中,在至少两条声道的数字声音信号之间进行耦合,为每个声道生成一个经耦合处理的信号。经过耦合处理的信号被分频成相应的频带内的频带信号。通过划分每个经过耦合处理的信号所得到的频带信号被压缩,以产生第一级被压缩信号。从相应声道的第一级被压缩信号确定每条声道的能量,相应于每条声道的确定能量,在声道之间分配预定量的比特数量,为每条声道分配一些比特。最后,每条声道的第一级被压缩信号,利用分配给该声道的比特数,被进一步压缩。
本发明还提供一种录制媒体,通过上述在多声道音响系统的相应声道中压缩数字声音信号的方法所生成的被压缩信号被录制在其上。
本发明还提供一种方法,用于通过传输媒体在多声道音响系统的相应声道中传输数字声音信号,其中,上述方法所描述的每个声道的第一级被压缩信号被进一步压缩以生成相应的第二级被压缩信号,所有声道的第二级被压缩信号被复用生成一个比特流,比特流被加在传输媒体上。
本发明接着提供一种多声道信号扩展器,用于扩展代表多声道音响系统的相应声道中数字声音信号被压缩信号,系统中至少两个声道中的数字声音信号在被压缩之前已经经过耦合。被压缩信号包括代表至少两个声道的数字声音信号的主要信息和辅助信息。该装置包括解复用器,第二级扩展器和第一级扩展器。解复用器分解被压缩的信号以提取主要信息和辅助信息。第二级扩展器通过将可变长度码转换成固定长度码来扩展来自解复用器的主要信息。第一级扩展器响应来自解复用器辅助信息而进行操作,进一步扩展来自第二级扩展器的固定长度码以在至少两个声道的每个当中提供再生数字声音信号。尽管在两条声道中的数字声音信号按标准有同样的带宽,但是,一条声道中的第一级扩展器对其操作的固定长度码与另一声道中的,第一级扩展器对其操作的固定长度码相比,代表较窄带宽的信号。
本发明还提供一种方法,用于扩展代表多声道音响系统的相应声道中的数字声音信号的被压缩信号,系统中,至少两个声道中数字声音信号在压缩前已经经过耦合。被压缩信号包括代表至少两个声道的数字声音信号的主信息和辅助信息。在该方法中,被压缩的信号经复用以提取主要信息和辅助信息。通过把主要信息的可变长度码转换成固定长度码,来扩展从被压缩信号中提取的主要信息。最后,从被压缩信号中提取的辅助信息被用于进一步扩展通过转换主要信息的可变长度码所得到的固定长度码,以在至少两条声道中的每条中生成再生数字声音信号。尽管按标准两条声道中的数字声音信号有相同的带宽,但是在至少两条声道的一条中被进一步扩展的固定长度码与在至少两条声道的另一声道中被进一步扩展的固定长度码相比,代表有较窄带宽的信号。
最后,本发明提供多声道信号压缩器,用于在多声道音响系统的相应声道中压缩数字声音信号。该装置包括第一级压缩器和第二级压缩器。第一级压缩器接收相应声道的数字声音信号并压缩该数字声音信号,以提供相应的第一级被压缩信号。第二级压缩器从第一级压缩器接收第一级的被压缩信号,根据相应的第一级被压缩信号为每个声道确定能量,对应为每条声道确定的能量,在信息之间分配比特,给每条声道分配一些比特,并且进一步压缩第一级被压缩信号,以提供一个相应的第二级被压缩信号。每个声道中的第二级被压缩信号利用分配给该声道的比特数。
附图简述
图1是个框图,表示根据本发明,用于压缩多声道声音信号的多声道压缩器装置的构造。
图2表示和电影一起使用的,八声道数字声音系统的扬声器的排列。
图3是个框图,表示构成图1所示装置的耦合电路的构造。
图4是个框图,表示用于图1所示装置的第一级压缩系统的一个压缩器的实际例子。
图5A和5B表示数字声音信号的每一帧怎样被划分成频率段,而每个频率段中的信号又怎样在图4所示压缩器中按时间被划分成块。
图6是一个用于实现比特分配技术的自适应比特分配电路,采用信号频谱相关比特分配和噪声频谱相关比特分配。
图7是允许噪声电平检测电路的框图,用于在图6所示的频谱相关比特分配电路中发现所允许的噪声电平。
图8表示在每个频带中用频谱系数来掩蔽的例子。
图9表示信号频谱,掩蔽阈值和最小可听电平曲线。
图10是个电路框图,表示根据本发明用于扩展由图1所示多声道压缩器所生成的被压缩多声道声音信号的多声道扩展器的例子。
本发明详细描述参考附图,现在将详细描述本发明的优选实施例。
图1表示根据本发明,用于压缩多声道音响系统的数字声音信号的多声道信号压缩器装置的基本部分。多声道压缩器装置被指定压缩声道CH1至CHn中的数字声音信号,以生成输出比特流。在该装置中,第一级压缩系统1包括压缩器2021至202n,它们分别压缩声道CH1至CHn中的数字输入声音信号。第二级压缩系统2包括对数频谱包络检测器208,声道比特分配判定电路209,熵编码器2031至203n,以及辅助信息压缩器2041至204n。
对数频谱包络检测电路208接收由第一级压缩系统1所生成的辅助信息,并且从辅助信息检测每条声道CH1至CHn中的信号能量,声道比特分配判决电路209根据本质上对应于对数频谱包络检测器208输出的比值,来确定相应于输出比特率的总比特数在声道之间的分配。在熵编码器2031至203n中,自适应量化器2051至205n,利用从声道比特分配判决电路209所接收的声道比特分配信息所指示的比特数,自适应地量化来自第一级压缩系统1的被压缩信号。熵编码器将第一级压缩系统1中的压缩器所产生的固定长度字转换成可变长度字。辅助信息压缩器2041至204n自适应地压缩辅信息,即在压缩相应数字声音信号过程中,在第一级压缩系统1中由压缩器2021至202n所生成的字长度信息和比例系数信息。
用与本发明相应的多声道信号压缩器压缩相应声道中的数字声音信号所得到的比特流,被记录在录制媒体上,或通过传输媒体被传输。录制媒体的例子包括电影胶片;盘形录制媒体,诸如光盘,磁光盘,相变型光盘,以及磁盘;磁带型录制媒体,诸如录相带;以及固态媒体,诸如半导体存储器和IC卡。
当录制媒体是电影胶片时,声道CH1至CH8中声音信号被送到例如图2所示数字电影音响系统中的相应扬声器上。中夹声道C,子低音喇叭声道SW和左声道L,左-中心声道LC,右声道R,右-中心声道RC,左-环绕声道LB,和右环绕声道RB的信号,分别送到中央扬声器102,子低音喇叭103,左扬声器106,左-中心扬声器104,右扬声器107,右-中心扬中器105,左-环绕扬声器108和右-环绕扬声器109。
图2表示了投影机100,它将电影胶片的图象区的图象投影到屏幕101上,并且还表示了各种扬声器相对于投影机屏幕,观众110的布局。
中央扬声器102位于屏幕101的中心处,在屏幕远离观众110的一侧,响应中央声道声音信号生成中央声道声音。它产生中心位的声音,按惯例,所有对话都由中央扬声器重放,而与讲话的男演员或女演员在屏幕上的位置无关。
子低音喇叭响应子低音喇叭声道声音信号产生低频效应音响。它产生的音响经常被认为是颤音,而非低频音响,诸如爆炸及其它大规模特殊效果的声音。
左扬声器106和右扬声器107分别安放在屏幕101的左边缘和右边缘或之外,并且响应左和右声道音响信号产生左声道声音和右声道声音。它们主要用于重放立体声音乐以及再生从位于接近屏幕左和右边缘的音源发出的音响效果。
左-中心扬声器104和右-中心扬声器105分别位于中央扬声器102和左扬声器106之间,以及中央扬声器102和右扬声器107之间。它们分别响应左中心声道音响信号和右中心声道音响信号产生左中心音响和右-中心音响。扬声器104和105分别作为左扬声器106和右扬声器107的辅助扬声器。在具有大屏幕101和能容纳大量观众的电影院中,位于中央扬声器102和左及右扬声器106和107之间的声源可感位置可能不稳定或不清楚。增加左中心扬声器104和右中心扬声器105有助于更稳定地定位这些声源,因此有助于形成更真实的声音形象。
左环绕扬声器108和右环绕扬声器109一般悬挂在大厅围绕观众的墙上,并且响应在环绕声道音响信号和右环绕声道音响信号,分别产生左环绕音响及右环绕音响。这些扬声器有助于给观众以被包围在一个音响环境中的感觉,诸如掌声或欢呼声,并且有助于形成三维声音形象。
返回图1,现在将描述多声道信号压缩器200的结构。图1中,声道CH1到CHn中的数字音响信号分别被送到输入端2011到201n,从这里经过耦合电路220。耦合电路降低了代表多声道音响系统的音响信号所需的比特数。后面将细述其操作。
声道CH1到CHn的数字声音信号,经耦合电路220处理之后,被加到第一级压缩系统1中的相应压缩器2021至202n上。压缩器2011至201n压缩数字声音信号,以生成主信息和辅助信息,它们都被表示成固定长度字。后面将详细描述压缩器2021至202n的结构。
来自压缩器2021至202n的主信息分别被加到熵编码器2031到203n上,它提供进一步压缩,将主信息的固定长度字转换成可变长度码。来自压缩器2021至202n的辅助信息被送到辅助信息压缩器2041至204n,它包括与第一级压缩系统1中进行的压缩有关的字长和比例系数,后面将对其更详细地描述。辅助信息压缩器响应由声道比特分配判决电路209给每条声道的声道比特分配信息,压缩辅助信息。
熵编码器2031至203n根据主信息的不同可能字出现的频率,通过将主信息的固定长度字转换成可变长度码对主信息进行熵编码。较经常出现的字被分配给较短的可变长度码,而较少出现的字被分配给较少可变长度码。分别包括自适应量化电路2051至205n的熵编码器2031至203n进行自适应量化。
声道CH1至CHn的辅助信息也通过终端2151至215n从第一级压缩器2021至202n发送给对数频谱包络检测电路208。对数频谱包络检测电路208,根据声道的辅助信息计算每个声道中的声音能量,例如使用声道中不同频带的比例系数。根据不同频带的比例系数来确定每条声道的频谱包络。自此获得每个声道的对数频谱包络信息,并送到声道比特分配判决电路209上。
声道比特分配判决电路209响应从对数频谱包络检测电路208所接收的声道的对数频谱包络信息进行操作,以确定相应于输出比特率的总比特数在声道之间的分配。对每条声道的主信息和辅助信息进行独立的比特分配。
在本实施例中,第一级压缩系统1中的压缩器压缩每条声道中的数字声音信号,以用大约100kbps的比特率提供主信息和辅助信息。因为所有八条声道所要求的输出比特率是500kbps,所以要求对主信息和辅助信息的进一步压缩。因此,声道比特分配判决电路209,根据每条声道中的声音信号所需比特,在八条声道之间分配相应于输出比特率的比特数。换言之,当相应的熵编码器2031至203n将来自第一级压缩系统1的主信息从固定字长转换成可变字长时,声道比特分配判决电路209从相应于比特率500kbps的比特数中,分配每个适应量化器2051至205n所用的比特数。
作为这种比特分配处理的结果,在信号电平低的声道上,压缩器2021到202n之一所用的相应于100kbps比特率的比特数被降低到,例如相应于10kbps的比特数,鉴于子低音信号声道频率范围有限,由压缩器用于子低音声道的相应于100kbps比特率的比特数,减少到例如相应于比特率20kbps的比特数。作为这种在声道之间动态重分配的结果,分配给一些声道的冗余比特能够被去掉,以将输出比特率降低到所要求的值(500kbps)。而当比特用量许可时,重新分配冗余比特给能够更有效地利用它们的声道。
在声道间相应于输出比特率进行比特分配,引起相应声道所用比特数的明显差异。但是,由于采用了可变长度码,也由于来自第二级压缩系统2的被压缩信号经复用器206排列的方式,所以相应声道所用比特数的差异不引起操作上的问题。而且,相应声道所用比特数的差异并不妨碍进行同时的压缩和扩展,这是因为扩展器进行和压缩器相反的操作。换言之,在任何时间和任何声道上,扩展器不需要比压缩器所提供的比特数更多或更小的比特。
指示用于每条声道量化主信息的比特分配的信息,通过终端2161至216n,被从声道比特位置判决电路209分别送到自适应量化电路2051至205n。指示用于每条声道量化辅助信息的比特分配的信息,通过终端2141至214n,被从声道比特位置判决电路209分别送到辅助信息压缩器2041至204n。
在自适应量化电路2051至205n中,对每条声道采用由来自比特分配判决电路209的,指示声道主信息比特分配的信息所指明的比特数,自适应地量化每条声道的主信息。辅助信息压缩器2041至204n,对每条声道采用由来自声道比特分配判决电路209的,指示声道辅助信息比特分配的信息所指明的比特数,压缩辅助信息(即,比例系数和字长度信息)。
熵编码器2031至203n及辅助信息压缩器2041至204n的输出被送到复用器206。
复用器复用加到该处的熵编码器2031至203n和辅助信息压缩器2041至204n的输出,并将产生的比特流送到输出端207。来自输出端的输出比特流,进而被纠错电路(未示出)处理,该电路加入纠错码和/或调制器,以形成一个记录在记录媒体上的比特流。例如,光盘230或电影胶片(未示出)能被用作录制媒体。或者,可以通过天线231用无线电传送比特流。也可以通过其它适当的媒体传输比特流,例如,卫星广播、电缆、铜线或光纤传输系统、ISDN系统、etc。
现在将参考图3描述由上述耦合电路220所完成的处理。
图3表示完成所有声道之间的耦合的耦合电路220的结构。在图3中,每一声道CH1至CHn中的数字声音信号分别由相应的低通滤波器2211至221n和高通滤波器2221至222n分割成较低频段信号和高频段的信号。每条声道中较低频段信号和高频段信号的频率范围分别为0Hz到11KHz和11到22KHz。例如,可以由适当的正交镜象滤波器(QMFS)来提供低通滤波器2211到221n和高通滤波器2221到222n的功能。
来自低通滤波器2211到221n的频率范围在0Hz到11KHz之间的低频段信号,通过终端2241至224n分别被加到第一级压缩器2021到202n上。另一方面,来自高通滤波器2221到222n的,频率范围11KHz到22KHz的高频段信号,通过终端2261至226n,分别被加到加法电路223上。加法电路将所有声道的高频段信号加在一起,生成一个单一的组合高频段信号,它又通过终端225将该组合高频段信号加到第一级压缩器电路2021上。
相应声道的高频段信号被组合在一起,形成单一组合的高频段信号,它只和一个声道的较低频段信号一起被处理,因为我们知道人类的听觉在高频时,对方向不敏感。因此,听者难以分辨多个扬声器中哪一个产生高频声音。声音的频率越高这就变得越困难。我们的实验表明,人类的听觉对于频率高于3KHz的声音的方向几乎没有感知能力。
因此,如果音响系统至少有两条声道,并且从一条声道的扬声器重新生成所有声道的高频段信号,那么,听者难以感知哪个扬声器在产生声音。因此,累加所在声道的高频段信号,以生成一个组合的高频段信号,以及用音响系统的至少一个扬声器来重新生成组合的高频段信号,不会引起音响系统的方向特性的明显降低。
因此,在耦合电路202中,组合多声道音响系统各声道的高频段信号并且按单一声道的高频段信号来处理所得的组合高频段信号,这使得无需在输出比特流中包括单个声道的高频段信号。这就能从输出比特流中,将代表单个声道的高频段信号的所需比特省去,这样就节省了代表多声道音响系统的声音信号所需的比特数。
在上述实施例中,较低频段信号是频带在0Hz到11KHz之间的信号分量,而高频带信号是频带在11到22KHz之间的信号分量。但是,由于缺乏对3KHz以上分量的方向感知,低频带信号可以是频率在0Hz到3KHz范围内的信号分量,且高频带信号可以是频率带在3到22KHz之间的信号分量。
在以上实施例中,所有声道的高频段信号被组合在一起形成组合高频带信号,它作为单一声道的高频带信号被压缩。但是,如果可用比特率允许,则左边声道的高频带信号可以独立于右边声道高频带信号组合在一起,以提供两个组合高频带信号,它们作为两个声道的高频带信号被压缩。或者,前面声道的高频带信号独立于环绕声道的高频带信号而被组合在一起,以提供两个组合高频带信号。
现在将参考图4描述图1所示的,第一级压缩系统1中的压缩器2021至202n的实际结构。在图1所示的压缩器2021至202n中,每个声道中的数字声音信号,例如可以是PCM声音信号能采用子频带编码(SBC),自适应变换编码(ATC),和自适应比特分配(APC-AB)进行压缩,图4表示声道CH1中的压缩器2021的结构。压缩器2022至202n的结构也类似,但由于声道CH2至CHn的高于11KHz的高频带信号由耦合电路220(图1)进行提取,所以,这些压缩器没有频带分割滤波器11和高频带处理电路29。而且,压缩器2021没有频带滤波器11,因为这个滤波器的功能由耦合电路202中的滤波器来提供。在当前代理人之一(Sony公司)所有的美国专利No.5,301,205中更详细地公开了压缩器的结构。
在当前实施例中,声道CH1中的数字声音信号由非块形成频带划分滤波器划分成多个频带。来自频带划分滤波器的每个频率范围内的频带信号按时间被动态地划分成块,并且每个频带的每个块从时域进行正交变换,以生成一组频段的频谱系数。自适应地将量化比特分配给频谱系数,该频谱系数按频率划分成频带,最好为临界频带,或是通过按频率划分较高频带而得到的子频带。这样就使人类听觉的心理声学特性在考虑的范围之内。
通过频带划分滤波器对数字声音信号的非块形成频带划分,产生相等带宽的频带,但是,频带带宽最好随着频率的增加而增加。频带信号按时间被划分成的块的长度相应于正交变换前的数字声音信号或频段信号的动态特性而自适应地改变。块自动调节用于每个临界频带或是按频率分割较高频临界频带所得的每个子频带的频谱系数。
临界频带是由考虑人类听觉的频率鉴别特性的分频系统所产生的频带。临界频带是噪声频带,它能被和噪声频带有相同强度并具有噪声频带中心频率的纯声音所覆盖。临界频带的宽度随着频率的增加而增加。0Hz到20或22KHz的音频范围一般被划分成25个临界频带。
在此对临界频带作了说明后,应当理解较高频率临界频带能可选择地被划分成多个子频带。当较高频率关键频带被划分成子频带时,对临界频带的说明也适用于较高频率临界频带所被划分成的子频带。
在图4中,声道CH1中的数字声音信号,例如是0Hz到22KHz频带内的PCM音频信号,被加到输入端10。数字声音信号被频带划分滤波器11划分成较低频段0Hz到11KHz的频段信号和频段在11到22KHz内的高频段信号,该滤波器最好是正交镜象(QMF)滤波器。频率段在0Hz到11KHz内的较低频带信号又被频带划分滤波器12进一步划分成在频率段0Hz到5.5KHz之内的低频段信号,以及频段5.5到11KHz之间的频段信号。该频带划分滤波器最好也是一个QMF滤波器。
来自频带划分滤波器11的高频段信号被送到正交变换电路13,以及块长度判决电路19上,正交变换电路13最好是改进的离散余弦变换(MDCT)电路。来自频带划分滤波器12的中频段信号被送给MDCT电路14,以及块长度判决电路20。来自频带划分滤波器12的低频段信号被送到MDCT电路14,以及块长度判决电路21。
图5A和5B表示了为了由MDCT电路13、14、15进行正交变换,而将三个频带中数字声音信号划分成的块的实际例子。三个频带中块的块长度由块长度判决电路19、20和21动态地确定。图5A和5B分别表示长模式的块,其中频带信号在具有较长长度的块中作正交变换,和短模式的块,其中频段信号在具有较短长度的块中作正交变换。附加地或可选地,频带信号能在与所示的不同的块长度组合中作正交变换。
在图5A和5B所示的例子中,三个频带信号每个都有两种可能的块长度,它们在其中作正交变换。每个块中频段0Hz至5.5KHz内的低频段信号和中频段5.5KHz至11KHz内的中频段信号的采样数在图5A中所示的长模式中被置为128,而在图5B所示的短模式中被置为32。另一方面,每块中频段11KHz到22KHz内高频段信号的采样数在图5A所示的长模式中被置为256,且在图5B所示的短模式中被置为32。以这种方法,当选定短模式时,作正交变换的块中的采样数对所有频段都置为相同。随着频率的增加,这降低了频率分辨率,而同时作为将帧划分成更多的块的结果,时间分辨率得到了增加,块长度判决电路19,20,21分别将它们确定的指明块长度的信息送给MDCT电路13、14、15,以及自适应比特分配和量化电路16、17和18,以及送给输出端23、25和27。
自适应比特分配和量化电路16、17和18将由MDCT电路13、14和15生成的频谱系数按频率划分成临界频带,并且归一化和重量化每个临界频带中的频谱系数。为了在每个临界频带中归一化频谱系数,自适应比特分配和量化电路为每个临界频带确定一个比例系数,并分别将比例系数送到输出端22、24和26。
自适应比特分配和量化电路16、17和18用以在每个临界频带中重量化和归一化频谱系数的比特数取决于从相应块长度判决电路19、20和21中所接收的块长度信息,和被分配用以重量化临界频带频谱系数的比特数,后面将描述在临界频带之间确定量化比特分配的自适应比特分配电路。
来自自适应比特分配和量化电路16、17和18的,经重新量化的频谱系数分别被送到输出端22、24和26。最后,自适应比特分配和量化电路16、17和18将指示用于重量化每个临界频带频谱系数的比特数的字长度信息,分别送给输出端22、24和26。
在确定临界频带之间量化比特的分配时,通过在每个临界频带中计算由MDCT电路13、14和15所生成的频谱系数幅度的均方根值来确定每个临界频带中的信号能量,作为频带的强度。另外,每个临界频带的比例系数也能用作临界频带的强度,在这种情况下,无需在每个临界频带中进一步计算信号能量,因此硬件的规模可以相对地减小。每个临界频带中频谱系数幅度的峰值或平均值也可以代替频谱系数的能量被用作临界频带的强度。
在图4所示的例子中,数字声音信号的带宽被置为0Hz到22KHz,这样,就能使用处理这个标准频带的通用LSI。但是,如果在多声道信号压缩器中包括有耦合电路220(图1),那么电路就能被简化,因为只用低频带压缩电路28就能处理声道CH2到CHn中的数字声音信号,11KHz以上的高频段信号被耦合电路220从声道中去除了。因此,当用耦合电路220处理八条声道中的数字声音信号时,需要八个低频带压缩器电路28,每条声道一个低频带压缩电路,而所有声道仅需一个高频带压缩电路。因此,只有声道CH1需要高频带压缩器29来压缩由耦合电路220生成的组合高频带信号。任何压缩器电路中都无需QMF 11,因为滤波由耦合电路进行。尽管如上所述,组合高频段信号是由压缩器2021进行压缩的,作为另一种方法它还能被其它压缩器压缩。
图6表示了自适应比特分配和量化电路16、17和18(图4)的自适应比特分配电路800的细节,自适应比特分配电路800确定了用于重新量化每个临界频带频谱系数的量化比特的分配。在图6中,来自MDCT电路13、14和15(图4)的频谱系数经自适应比特分配和量化电路800的输入端801被送到频带强度计算电路803。频带强度计算电路根据正交地变换频段信号的每个块所得到的临界频带的一组频谱系数为每个临界频带计算强度。通过计算临界频带中频谱系数幅度的均方根值来计算临界频带的强度。作为代替的方法,可以从临界频带中频谱系数的幅度的峰值或平均值、归一化临界频带中的频谱系数所得的比例系数、或其它方法得到频带大小强度。
如图8所示,频带强度计算电路803为每个临界频带提供一频带强度作为其输出。为了简化,图8只表示了12个频带(B1到B12)以代表临界频带,和较高频临界频带被划分成的子频带。
由频带强度计算电路803所计算的频带强度被送到信号谱相关比特分配电路804。信号谱相关比特分配电路采用会产生白噪声谱的量化噪声的方式,响应每个临界频带的强度对数,在临界频带之间分配相应于块802所指示的比特率的固定数目的量化比特。
噪声谱相关比特分配电路805根据允许的噪声频谱来进行比特分配,以在临界频带之间分配相应于块802所指示的比特率的固定数目的量化比特。噪声谱相关比特分配电路805接收来自频带强度计算电路803的每个临界频带的频带强度。响应频带强度的频谱,噪声谱相关比特分配电路确定所允许的噪声频谱,也说是将掩蔽考虑在内的每个临界频带的允许噪声电平。然后,噪声谱相关比特分配电路在临界频带之间分配相应于比特率的固定数目的比特,以产生所要求的允许噪声频谱。
比特分配比判决电路809在信号谱相关比特分配和噪声谱相关比特分配之间分配由块802指明的,总的可用数目的量化比特,例如相应于128kbps的比特。比特分配比判决电路809,根据声道声音信号的音调,也就是声音信号的频谱平滑度来确定两种不同类型比特分配之间的分配比率。由频谱平滑性计算电路808所计算的频谱平滑度系数指明声音信号的频谱平滑度,并被送到比特分配判决电路。
比特分配判决电路生成两个控制信号,分别指示比特分配率和比特分配率的补数,并将它们分别送到乘法器811和812。乘法器811用比特分配率乘由信号谱相关比特分配电路804所产生的固定数目比特的分配。乘法器812用比特分配率的补数乘由噪声谱相关比特分配电路805所产生的固定数目比特的分配。
加法器将由乘法器811所确定的每个临界频带的信号谱相关比特数和由乘法器812所确定的每个临界频带的噪声谱相关比特数相加,给出一个量化比特总数,用于量化临界频带中的频谱系数,并将结果送到输出端807。这样实际上用于在每个临界频带中重新量化频谱系数的信号谱相关比特数和噪声谱相关比特数之比根据声道中声音信号的频谱平滑度而变化。响应自输出端807接收到的结果,自适应比特分配和量化电路16、17和18(图4)中的量化器(未示出),用为量化临界频带频谱系数而分配的量化比特总数来重新量化每个临界频带中的每个频谱系数。
噪声谱相关比特分配电路805包括一个允许噪声频谱计算电路,它通过考虑频带内声音信号的掩蔽,来计算所允许的噪声频谱。掩蔽是指当一个声音被另一个声音掩盖时,使人的听觉感觉不到的现象。掩蔽包括在时间域由声音造成的临时掩蔽,和在频段由声音造成的同时掩蔽。作为掩蔽的结果,遭到临时或同时掩蔽的任何噪声都将听不到。因此,在声道的数字声音信号的临时或同时掩蔽范围内的噪声被认为是可允许的噪声。
图7表示允许噪声频谱计算电路805的实际例子的框图。在图7中,来自MDCT电路13、14和15的频谱系数被送到输入端521,在此它们经过频带强度计算电路522。频带强度计算电路通过计算临界频带中频谱系数的幅度之和来确定每个频带的强度。或者,也可以利用临界频带频谱系数幅度的峰值,RMS或平均值以及临界频带的比例系数。由频带强度计算电路522计算的临界频带强度的频谱一般被叫作树皮频谱。图8表示了一个典型的树皮频谱SB,但为了简化画图只表示了12个临界频带B1至B12。
为了确定树皮频谱的掩蔽效果,对树皮频谱SB进行卷积处理,即树皮频谱的值与预定加权函数相乘,得到的积被加在一起。为此,来自频谱强度计算电路522的树皮频谱值被送到卷积滤波器523。选择性地,由图6所示的频带强度计算电路803所计算的频带强度能通过终端540被接收并用作树皮频谱。如果这样做的话,频带强度计算电路522能被省去。
卷积滤波器523包括多个延迟元件,它们顺序地延迟树皮频谱的值,多个乘法器,例如25乘法器,一个临界频带一个,用于用加权函数乘以每个延迟元件的输出,以及一个加法电路用于累加乘法器的输出,刚才描述的卷积处理从图8所示树皮频谱中得到也在图8中所示的掩蔽频谱MS。
用在卷积滤波器电路523中的加权函数的实际例子对乘数M-1、M-2、M-3、M+1、M+2和M+3分别为0.15、0.0019、0.0000086、0.4、0.06和0.007。乘数M的加权系数是1,且M是从1到25的任意整数。
卷积滤波器523的输出被送到减法器524,以得到和每个临界频带中所允许噪声电平相对应的卷积域电平a,和允许噪声电平相应的卷积域电平a是这样一个电平,即在经反卷积之后,它将给出每个临界频带的允许噪声电平。
代表掩蔽电平的容许函数被加到减法器524上,以得出电平a。通过增大或减小容许函数来控制电平a。容许函数由后面将会描述的(n-ai)函数发生器525提供。
当临界频带数是i时,最低频率临界频带数是1,由以下等式来确定相应于允许噪声电平的电平aa=S-(n-ai)…(1)其中n和a分别是常数(a>0),且S是经卷积处理的树皮频谱的密度。在等式(1)中,(n-ai)代表容许函数。在优选实施例中,n被置为38且a被置为-0.5。有了这些设置,当经压缩的信号被扩展时,不会损害声音的质量,因此就获得了一个令人满意的被压缩信号。
如上所述确定的电平a被送到除法器526,它对卷积域内的电平a进行反卷积。按这种方法,掩蔽频谱变成了允许的噪声频谱。尽管反卷积一般要求复杂的算术操作,但是,在现有实施例中采用了简单的除法器526来进行反卷积。
掩蔽频谱,即每个临界频带的掩蔽电平通过合成电路527被送到减法器528,它也通过延迟电路529从频带强度计算电路522或从频带强度计算电路803(图6)接收上述树皮频谱SB。减法器528从树皮频谱SB中减去掩蔽频谱,这样,如图9所示,掩蔽电平MS之下的树皮频谱SB部分被掩盖。考虑到在减法器528之前的电路中的处理延迟,延迟电路529延迟树皮频谱。
减法器528的输出通过允许噪声频谱校正电路530被送到输出端531。输出端531的输出被送到ROM(未示出),其中存贮了多组被分配的比特数。输出端531的输出从ROM中选择一组被分配的比特数,即分配给每个临界频带的比特数。ROM将这组被分配的比特数送到输出端,作为如图6所示噪声谱相关比特分配电路805的输出。
如图9所示,合成电路527用掩蔽频谱MS来分析表示所谓最小可听电平曲线RC的数据,最小可听电平曲线代表人类听觉的另一特性,并由最小可听电平曲线生成器523提供。绝对电平低于最小可听电平曲线的噪声不能被听到。对于给定的量化,最小可听曲线的形状取决于重放的音量。但是,由于用实用16-bit数字系统的动态范围表示数字声音信号的方法差别不大,如果人耳最敏感的频带内听不到量化噪声,即4KHz附近的频带,那么能假定在其它频带内听不到低于最小可能电平曲线的量化噪声。因此,当和由系统所设置的字长度相对应的4KHz附近的量化噪声末被听到时,能通过合成最小可听电平曲线RC和掩蔽频谱MS来提供允许噪声电平。每个临界频带中,所产生的允许噪声电平可以达到由图9中的阴影部分所指明的电平。在这个实施例中,在4KHz的最小可听电平曲线的电平被设置成和采用例如20bits量化时对应的最小电平相应的电平。图9还表示了信号频谱SS。
允许噪声频谱校正电路530,在减法器528的输出端,根据例如由校正信息电路533生成的等音量曲线,校正允许噪声频谱。等音量曲线也是人类听觉的另一特性。这一曲线是通过确定各种频率在与1KHz单音听到的强度相同时的声音压力电平而得到的。等音量曲线和图9所示的最小可听曲线RC基本一样。根据等音量曲线,当4KHz的声音的声压电平比1KHz的声音的声压电平小8到10dB时,所听到的4KHz附近的声音和1KHz的声音强度一样。另一方面50Hz附近的声音的声压电平必须比以同样强度听到的1KHz的声音的声压电平大15dB。出于这种原理,高于最低可听电平曲线的噪声应该具有相应于等音量曲线的曲线给出的频率特性。应当看到,调整系统和人类的听觉特性相适应要求考虑等音量曲线来校正允许噪声频谱。
现在返回图6,两种比特分配技术,即噪声谱相关比特分配和信号谱相关比特分配之间的声道总可用比特数分配比,是由比特分配比判决电路809响应由频谱平滑性计算电路808所计算的频谱平滑性指数来设置的。频谱平滑性指数表明声道的数字声音信号的频谱的平滑性。现在将描述在两种比特分配技术之间分配总的可用比特数的实用方法。
来自MDCT电路13、14和15(图1)的频谱系数通过输入端801被送到频谱平滑性计算电路808,808还被加上来自频带强度计算电路803的输出。频谱平滑性计算电路808计算指明数字声音信号的频谱平滑性的指数。在本实施例中,信号频谱相邻值之差的绝对值之和被信号频谱绝对值之和去除后,作为指数使用。例如,频谱平滑性计算电路能计算相邻频带强度值之差的绝对值之和与所有频带强度之和的商,以此作为频谱平滑性指数,即,I=0.5×Σi=1n|Si-Si-1|]]>Σi=1n|Si|]]>其中,I是频谱平滑性指数,Si是第i个临界频带的频带强度。
从频谱平滑性计算电路808将频谱平滑性指数送到比特分配率判决电路809,809设定根据信号谱相关比特分配所分配的比特,和根据噪声谱相关比特分配所分配的比特之间的比特分配比。比特分配率判决电路809接收来自块802的指明总可用比特数的信息。比特分配率判决电路设置比特分配率,这样,随着来自频谱平滑性计算电路808的频谱平滑性指数的增加(表明数字声音信号的频谱的平滑性降低),由噪声谱相关比特分配分配更多的比特,而由信号谱相关比特分配更少的比特。
比特分配率判决电路809将指示比特分配率的控制信号送到乘法器811,并且将代表比特分配率的补数(1减去分配率)的控制信号送到乘法器812。根据分配率,乘法器811调整信号谱相关比特分配,乘法器812调整噪声谱相关比特分配。
当数字声音信号的频谱平滑时,代表来自比特分配率判决电路809的比特分配率的控制信号,假定一个值0.8来由信号谱相关比特分配来分配更多的比特。代表送到乘法器812的比特分配率的补数的控制信号被置为1-0.8=0.2。乘法器811用0.8乘以来自信号谱相关比特分配电路804的比特分配信息,而乘法器812用0.2乘以来自噪声谱相关比特分配电路805的比特分配信息。加法器806将乘法器811和812的输出相加,以为每个临界频带提供总的比特分配。总的比特分配被送到输出端807。
图10表示多声道扩展器100的结构,它是图1所示多声道压缩器200的相对部分。在图10中,从录音媒体(或在发送后被接收)再生的比特流在纠错之后被送到去复用器141。去复用器141将经纠错的比特流分解成每条声道的熵编码主信息和被压缩的辅助信息。去复用器将经熵编码的主信息送到第二级扩展器130,将被压缩的辅助信息送到辅助信息扩展器1041至104n。
第二级扩展器130,熵解码器1311至131n为其相应的声道解码经熵编码的主信息,以为每一声道中的每个频段生成一组被量化的频谱系数。每组被量化的频谱系数由固定长度的字组成,即对每个临界频带中的频谱系数用相同数目的比特进行量化。由于加到原始数字声音信号上的耦合处理,所以,只有声道CH1的熵解码器在三个频段的每一个当中产生一组经量化的频谱系数。声道CH2到CHn的熵解码器1312到131n每个只为低和中频带生成一组经量化的频谱系数。
辅助信息扩展器1041到104n为每条声道扩展从乘法器141接收到的被压缩的辅助信息,并且将为每条声道的每个频段所产生的辅助信息送到第一级扩展器120的扩展器1021到102n相应的一个之中。例如,辅助信息扩展器1041将声道CH1的三个频带的辅助信息送到声道CH1的扩展器1021的输入端123、125和127上。同样,由于对原始数字信号的耦合处理,声道CH2到CHn的辅助信息解码器1042到104n只将低频段和中频段的辅助信息提供给相应的扩展器1022到102n。
第二级扩展器130将每条声道的每个频带的一组经量化的频谱系数送给第一级扩展器120的输入端。例如,声道CH1的熵解码器1311将声道CH1的三个频段中每一个的一组经量化的频谱系数送给第一级扩展器120中的扩展器1021的端子122、124和126。
下面将描述第一级扩展器120中声道CH1的扩展器1021。声道CH2到CHn的扩展器1022到102n也一样,除了它们没有高频带解量化器116和反向MDCT电路113,也可能没有反向正交镜像电路111。
解量化电路116、117、118采用相应的字长度信息释放加在相应频带内一组经量化的频谱系数上的自适应比特分配。产生的每一频带中均匀量化的频谱系数被送到相应的一个反向正交变换电路113、114和115上。
反向正交变换电路IMDCT电路113、114、115,是较好的反向MDCT电路,它们对相应频带内的一组经均匀量化的频谱系数进行反向正交变换,以在相应频带中生成时域信号块。在进行反向MDCT的过程中,加在频谱系数上的块自动定位被释放。反向量化镜像滤波器(IQMF)电路112和111将相应频带中的时域信号组合成全频域数字声音信号,它被送到输出端110。
如果不对送到图1所示的多声道信号压缩器中的第一级压缩系统1的数字声音信号进行耦合,那么扩展器1022到102n也必须每个都包括解量化器116,IMDCT电路113,和IQMF 111,来处理每个声道的高频段。
如果对数字声音信号进行了耦合,最好由声道CH1处理中心声道,这样就由中心扬声器重放高频段信号。或者,IQMF 111也能被包括在多于声道CH1的声道中。在包括IQMF 111的声道中,IQMF 111将被用于合成来自声道CH1IMDCT 113输出的组合高频段时域信号和来自本声道IQMF 112输出的较低频时域信号。这样,就从多于一个的扬声器重放组合的高频段信号。
以上描述是参考八声道音响系统进行的。但是,这里描述的设备是模块化的,它能用于处理具有多于2的任何数目声道的多声道音响系统中的声音信号。
尽管这里已详细描述了本发明的说明性实施例,但是应当理解,本发明不限于所描述的具体实施例,可以在所附权利要求所定义的发明范围内进行各种修正。
权利要求
1.在多声道音响系统的相应声道中压缩数字声音信号的多声道信号压缩器,该装置包括第一级压缩系统,包括耦合设备,用于进行至少两条声道的数字声音信号之间的耦合,以为每个声道生成一个经过耦合处理的信号,以及从该耦合设备接收经耦合处理的信号的压缩器设备,用于将每个耦合信号按频率划分成相应频带中的频带信号;以及压缩通过划分每个经过耦合处理的信号所得到的频带信号,以生成第一级经压缩信号;第二级压缩系统包括判定设备,从第一级压缩系统为每条声道接收第一级压缩的信号,根据每条声道的第一级压缩信号确定每条声道的能量,声道比特分配判定设备,它响应判定设备进行操作,用于在声道之间分配预定数目的比特,以为每条声道分配一定数目的比特,用于进一步为每条声道压缩第一级压缩信号的辅助压缩器设备,压缩器设备利用由声道比特分配设备为每条声道分配的比特数进行压缩。
2.权利要求1的多声道信号压缩器,其中耦合设备至少在起码两条声道的数字声音信号的高频带部分之间进行耦合。
3.权利要求2的多声道信号压缩器,其中耦合设备从至少两条声道的数字声音信号的高频率部分生成耦合信号;压缩器设备将耦合信号作为一个经过耦合处理信号的高频段部分来进行压缩。
4.权利要求3的多声道信号压缩器,其中耦合设备在其间进行耦合的至少一个数字声音信号包括一个较低频带部分,这部分不被耦合设备耦合;压缩器设备压缩至少一个数字声音信号的较低频段部分。
5.权利要求2的多声道信号压缩器,其中数字声音信号的高频带部分有至少3KHz的最低频率。
6.权利要求1的多声道信号压缩器,其中第一级压缩信号包括固定长度的码字;附加压缩器设备包括可变长度编码设备,用于将第一级压缩信号的固定长度码字转换成可变长度码,这样较经常地出现的固定长度码字被转换成具有较短字长度的可变码字。
7.在多声道音响系统的相应声道中,用于压缩数字声音信号的方法,该方法包括步骤在至少两条声道中的数字声音信号之间进行耦合,以为每条声道生成一个经过耦合处理的信号;将经过耦合处理的信号按频率划分成相应频带内的频带信号;将通过划分每个经过耦合处理的信号所得到的频带信号进行压缩,以生成第一级压缩信号;从每一声道的第一级压缩信号判定每一声道的能量;响应在判定步骤所确定的每一声道的能量,在声道之间分配预定数目的比特,以给每一声道分配一些比特;并且利用通过分配步骤为每条声道分配的比特数,进一步为每一声道压缩第一级压缩信号。
8.权利要求7的方法,其中,在进行耦合的步骤中,至少在起码两条声道中的数字声音信号的高频带部分进行耦合。
9.权利要求8的方法,其中在进行耦合的步骤中,通过在至少两条声道中的数字声音信号的高频带部分之间进行耦合而生成耦合信号;作为一个经过耦合处理的信号的高频部分,对耦合信号进行频率划分和压缩。
10.权利要求9的方法,其中,在进行耦合的步骤中,至少两条声道中的数字声音信号的高频带部分有至少3KHz的最低频率。
11.通过一种用于在多声道音响系统的相应声道中的压缩数字声音信号的方法产生的信号被录在一种录音媒体上,该方法包括步骤在至少两条声道的数字声音信号之间进行耦合,为每条声道产生一个经过耦合处理的信号;将经过耦合处理的信号按频率划分成相应频带中的频带信号;压缩通过划分每个经过耦合处理的信号所得到的频带信号,生成第一级压缩信号;根据每条声道的第一级压缩信号来确定该声道的能量;根据判定步骤确定的每一声道的能量,在声道之间分配预定数目的比特,以给每一声道分配一些比特;进一步为每一声道压缩第一级压缩信号,以为每一声道产生一个第二级压缩信号,采用由分配步骤分配给每一声道的比特数,为每一声道压缩该声道的第一级压缩信号;复用所有声道的第二级压缩信号,以提供一个比特流;将比特流送到录音传输媒体上。
12.权利要求11的录音媒体,包括一光盘。
13.通过传输媒体在多声道音响系统的相应声道中传输数字声音信号的方法,该方法包括步骤在至少两条声道的数字声音信号之间进行耦合,为每一声道产生一个经过耦合处理的信号;将经过耦合处理的信号按频率划分成相应频带中的频带信号;压缩通过划分每个经过耦合处理的信号所获得的频带信号,以生成第一级压缩信号;从每一声道的第一级压缩信号判定该声道的能量;响应由判定步骤为每一声道所确定的能量,在声道之间分配预定数目的比特,以为每一声道分配一些比特;为每一声道进一步压缩第一级压缩信号,以为每一声道产生第二级压缩信号,采用由分配步骤分配给每一声道的比特数,为每一声道压缩该声道的第一级压缩信号;复用所有声道的第二级压缩信号,以提供一比特流;将比特流送到传输媒体上。
14.用于扩展代表多声道音响系统相应声道中数字声音信号的被压缩信号的多声道信号扩展器,在压缩之前,至少两声道中的数字声音信号已经经过耦合,被压缩的信号包括代表至少两声道的数字声音信号的主信息和辅助信息,该装置包括用于分解被压缩信号,以提取主信息和辅助信息的去复用设备;通过把可变长度码转变成固定长度码,扩展来自去复用设备的主信息的第二级扩展器设备;响应来自去复用设备的辅助信息进行操作的第一级扩展器设备,用于进一步扩展来自第二级扩展器设备的固定长度码,以在至少两条声道的每一条中提供一再生数字声音信号;其中尽管至少两条声道之一中的数字声音信号和至少两条声道的另一声道中的数字声音信号一般有相同的带宽,至少两条声道的一条中第一级扩展器设备对其进行操作的某些固定长度码比至少两条声道的另一条中第一级扩展器设备对其进行操作的某些固定长度码代表更窄的带宽。
15.权利要求14的多声道信号扩展器,其中主信息包括涉及至少两条声道中每一条的多个频段的信息;第一级扩展器设备包括用于在每个频带内为至少两条声道的另一条重新构造时域信号的设备,用于在频段内为至少两条声道的每一条合成时域信号,以为至少两条声道中的每一条生成再生数字声音信号的设备。
16.用于扩展代表多声道音响系统相应声道中数字声音信号的被压缩信号的方法,至少两条声道中的数字声音信号在经压缩之前已被耦合,被压缩的信号包括代表至少两条声道的数字声音信号的主信息和辅助信息,该方法包括步骤多路分解被压缩信号,以提取主信息和辅助信息;通过将主信息的可变长度码转换成固定长度码,扩展在去复用步骤从被压缩信号中所提取的主信息;用在去复用步骤从被压缩信号中所提取的辅助信息,进一步扩展通过转换主信息的可变长度码所得到的固定长度码,以在至少两条声道的每一条中产生再生数字声音信号;其中尽管至少两条声道之一中的数字声音信号与至少两条声道的另一条中的数字声音信号通常有相同的带宽,在至少两条声道之一中对其进行进一步扩展操作的某些固定长度码比在至少两条声道的另一条中对其进一步扩展操作的某些固定长度码代表更窄的带宽。
17.权利要求16的方法,其中主信息包括关于至少两条声道中的每一条的多个频带的信息并且其中进一步的扩展包括步骤处理一些固定长度码,以在至少两条声道的每一条的每一频带重新构造时域信号,为至少两条声道的每一条在频带合成时域信号,以为两条声道中的每一条产生再生数字声音信号。
18.在多声道音响系统的相应声道中,用于压缩数字声音信号的多声道信号压缩器,该装置包括第一级压缩器设备,用于接收相应声道的数字声音信号和压缩数字声音信号,以提供相应的第一级压缩信号;第二级压缩器设备,用于从第一级压缩器设备接收第一级压缩信号;根据相应的一个第一级压缩信号判定每一声道的能量;响应为每一声道所判定的能量,在声道之间分配比特,给每一声道分配一些比特;进一步压缩第一级压缩信号,以提供相应的第二级压缩信号,每一声道中的第二级压缩信号利用分配给一条声道的比特数。
全文摘要
在多声道音响系统的相应声道中,压缩数字声音信号的多声道信号压缩器。该装置包括第一级压缩系统和第二级压缩系统。在第一级压缩系统中,耦合电路进行至少两条声道的数字声音信号之间的耦合,以为第一声道生成一个经过耦合处理的信号。压缩器电路从耦合电路接收经过耦合处理的信号,并将每个经过耦合处理的信号按频率划分成相应频带中的频带信号,并压缩通过划分每一经过耦合处理的信号所得到的频带信号,以生成第一级压缩信号。在第二级压缩系统中,判决电路从第一级压缩系统为每一声道接收第一级压缩信号,并且从相应声道的第一级压缩信号判定每一声道的能量。声道比特分配判决电路响应判决电路进行操作,在声道之间分配预定数目的比特给每一声道。最后,辅助压缩器采用由比特分配判决电路分配给相应声道的比特数,进一步压缩每一声道的第一级压缩信号。
文档编号G10L19/008GK1119902SQ94191534
公开日1996年4月3日 申请日期1994年12月7日 优先权日1993年12月7日
发明者赤桐健三, M·F·戴维斯, C·C·托德, Rim·多尔比 申请人:索尼公司, 杜比实验室许可公司