信号编码或解码设备以及记录媒介的制作方法

文档序号:7564393阅读:413来源:国知局
专利名称:信号编码或解码设备以及记录媒介的制作方法
技术领域
本发明涉及一种信号编码和解码设备,在该设备中,输入数字数据利用高效编码和解码被编码,传送,记录,再现和解码,以便产生播放信号,还涉及到一种用于记录该编码信号的记录媒介。
有多种技术用于音频或话音信号的高效编码。在对于无帧形成系统的子频段编码(SBC)中,在时间轴上的音频信号的频率范围在编码前沿该时间轴没有将该信号形成帧的情况下被分成多个用于编码的子频段。在对于帧形成系统的变换编码中,在时间轴上代表该音频信号的数字信号的每一帧由正交变换转换成在频率轴上表示该音频信号的一组频谱系数。在子频段和变换编码相结合的条件下,代表该音频信号的该数字信号由子频段编码分成许多频率范围,同时变换编码被施加到该每一个频率范围。
已知的用于将一频谱分成许多频率范围的滤波器包括正交滤波器(QMF),例如在R.E.Crochiere的在55贝尔系统技术公报第8期(1976)上的论文“在子频中语音的数字编码”中所讨论的那样。将一个频谱分成等宽频率范围的技术在Joseph H.Rothweiler发表于ICASSP 83 BOSTON的文章“多相位正交滤波器--一种新的子频段编码技术”中进行讨论。
已知的用于正交变换的技术包括将该数字输入音频信号分成一予定时间间隔的帧的技术,并且使用快速富利叶变换(FFT),余弦变换(DCT)或改进DCT(MDCT)处理合成帧,以便将该信号从时间轴转换到频率轴。MDCT的讨论能在J.P.Princen和A.B.Bradley的文章中发现“以时域折叠抵消为基础,使用滤波器组的子频段/变换编码”,ICASSP 1987。
借助于量化由一个滤波器分成子频段的信号或量化由正交变换转换成频谱系数组的信号,有可能控制对量化噪声敏感的频率范围,以及借助采用掩蔽效应的优点影响一较高效率的音调编码。可获得更高效率的编码,只要在量化之前,例如,用每一频段中的信号分量的最大绝对值去归一化每一个频段。
在量化由正交变换产生的频谱系数的一种技术中,熟悉的是使用采取人类听觉系统的心理声学特点的优点的子频段。于是在频率轴上表示一个音频信号的频谱系数可以被分成为许多临界的频率范围。该临界范围的宽度随频率增加而增加。一般地说,覆盖OHZ-20KHZ的音频频谱,约用25个临界频段。在这样一种量化系统中,二进制数被自适应地分配在各个临界频段中。例如,当将自适应位配置加到由MDCT产生的频谱系数数据时,在每一个临界频段中由MDCT产生的频谱系数数据使用二进制数的一个自适应分配数进行量化。
已知的自适应二进制数配置技术包括在IEEE TRANS.ONACOUSTICS,SPEECH,AND SIGNAL PROCESSING,VOL.ASSP-25,NO.4(1977.Awgust)中所描述的内容,其中,二进制数配置是基于在每一个临界频段中该信号的幅度来进行的,该技术产生一种平坦的量化噪声频谱,并将噪声能量降到最小,但是由听众觉出的噪声电平并非最佳,这是由于该技术不能有效地利用心理声学掩蔽效应。在由M.A.Krassner在“听觉系统的知觉要求的临界频段编码器-数字编码”(ICASSP 1980)所描述的这种二进制配置技术中,该心理掩蔽机构被用来确定一个固定的二进制位配置,这种配置将产生用于每一个临界频段的必要的信号--噪声比。但是,这样的一种系统的信号--噪声比使用一强音调信号,例如一个正弦波进行测量,由于在该临界频段中二进制数的固定配置而将产生不是最佳的结果。
为了解决这些问题,这里推荐一种高效的编码设备(欧洲专利公开号NO.0525809 A2,申请的
公开日期为03.02.93,Bulletin 93/05),其中,能用于二进制数配置的全部二进制数的数目被分配到一个固定的二进制数配置模式予置,用于每个小尺寸的块以及在每个块中与信号能量有关的各个二进制数。二进制数按比分配的比值被设置成处于与输入信号有关的一个信号相关的状态。该信号频谱越平坦,该二进制数按比分配和该固定二进制数配置模式比较起来就越大。
用这种已知方法,大量的二进制数被分配到具有一个特定频谱单元的组,该特定频谱单元具有高的能量水平,如在一正弦波输入情况下,用来显著地改善信号噪声特性。由于人类听觉灵敏度对具有一个尖锐的频谱分量的信号非常灵敏,所以该方法在心理声学上改善声音质量方面是有效的,目的是改善信号噪声比。
除了以上描述的那些方法之外,一些方法已被推荐与二进制数配置有关。如果模拟听觉灵敏的一种模式越精确,而且编码器件的能力被加以改善,则编码效率能够进一步加以改善。
参照

图11-16,它们说明一种普通的信号编码设备。
在这些图中,通过终端100施加的一个声学信号波形变换电路101变换成信号频率分量,它由信号分量编码电路102进行编码。一代码串由代码串发生电路103产生,并在一终端104输出。
图12示意地表示图11中所示的该变换电路101的一种结构。在图12中,施加到一终端200的信号(输出到图11的终端100的信号)由双分频滤波器201,202分为三个频段。这样,滤波器201将来自该200端的信号滤除1/2,而滤波器202再将由滤波器201滤除的信号滤除1/2(来自200端的信号被滤除1/4)。即滤波器202输出两个信号,每一个信号的带宽为来自200端的信号带宽的1/4。
由滤波器201,202分为三个频段的信号用前向正交变换电路,如MDCT电路203,204和205变换为频谱信号分量。这些前向正交变换电路203-205的输出按规定路线发送到图11中所示的信号分量编码电路。
图13示意表示图11中所示的信号分量编码电路102的结构。
在图13中,施加到300端的变换电路101的输出由归一化电路301对每一个予置范围进行归一化,并按规定路线发送到量化电路303。施加到300端的信号还按规定路线发送到量化准确度判定电路302。
量化电路303根据由量化准确度判定电路302对施加在300端上信号进行计算的量化准确度量化来自归一化电路301的信号。该量化电路303的输出在端点304输出,并按规定路线发送到图11中所示的代码串发生电路103。不仅信号分量由量化电路303进行量化,而且在归一化电路301中的和归一化系数有关的信息以及在量化准确度判定电路302中的和量化准确度有关的信息都包括在端点304的输出信号中。
图14示意表示一种解码器的结构,用于对来自图11由编码器产生的代码串的声学信号进行解码,并输出该被解码的声学信号。
参照图14,一个代码串分解电路401从图11由该装置产生并加到端点400的代码串提取各种信号分量的代码。按照这些代码,信号分量由信号分量解码电路402进行解码,并按顺序由具有逆变换的逆换电路403进行处理,该逆变换是由图11中所示的变换电路101执行的变换的一种反向操作,在端点404上产生声学波形信号输出。
图15示意表示图14中所示的逆变换电路403的一种结构。
图15的结构相应图12中所示的变换电路的结构。来自信号分量解码电路402的通过端点501,502和503施加的信号由图12所示的执行逆变换到前向变换的逆正交变换电路504,505和506进行变换。逆变换电路504,505,506产生的频率范围的信号由双级频段组合滤波器507,508组合。
即逆变换电路505,506的输出由频段组合滤波器507组合,而频段组合滤波器507的输出以及逆变换电路504的输出由频段组合滤波器508组合。该频段组合滤波器508的输出通过端点509(图14的404端)输出。
图16说明在由图11中所示的编码器执行的一般编码方法,在图16中,表示的频谱信号是由图12中所示的变换电路产生的。图16表示在MDCT上得到的并转换成dB值的频谱信号的绝对值的电平。
在图16中,输入信号对于每一个予置时间帧或组被转换成64根频谱信号(这些视谱信号按图16被组合成五个予置的频段b1-b5。每个频段被看作是一个编码单元。这些编码单元的带宽在较低频率段被选择得较窄,而在越高的频段被选择得较宽,为的是去控制量化噪声的产生,以符合人类听觉灵敏度的特点。
但是,对于上述一般方法,量化频率分量的范围是固定的。因此,如果频谱分量集中在若干特定频率的附近,以及如果这些频谱分量用足够的准确度加以量化,则有必要分派更多的二进制数到属于同一频段的大量频谱分量上去。
那就是,如果归一化是对每一个予置频段执行的,则归一化是根据在包括音调分量的频段b3中由音调分量确定的更大的归一化系数来执行的。
通常,包含在其频谱能量集中的一具体频率中的一音调声学信号中的噪声比附加到一个声学信号的噪声更加刺耳,因其能量平坦地分布在一宽的频率范围去上,并由此对人类听觉灵敏度出现显著的干扰。此外,如果该频谱分量具有较大能量,即该音调分量没有以足够的精确度被进行量化,则当该频谱分量在时间轴上恢复为波形信号并同暂时在前面和后面的块组合时,块对块干扰将更大。即,当恢复的块信号同暂时相邻组信号组合时,将产生不可忽视的结合干扰,对人类听觉灵敏度再度出现严重的干扰。由于这种原因,为了编码,音调分量需要使用足够大量的二进制数进行量化。然而,如上所述,如果该量化准确度是对每一个予置预段设置的,大量二进制数需要分派到包括音调分量的编码单元中的大量频谱分量上,这将降低编码效率。这样,改善音调信号的编码效率而不降低声音质量将是难以办到的。
为了克服这样的麻烦,本受让人已经在日本专利申请NO.5-152865(1993)以及日本专利申请NO.5-18332(它们未在本申请的申请日公开)中提出了用于实现高编码效率的编码方法,输入声学信号被分成显示能量集中在一个特定频率上的一个音调分量以及一个在宽频率范围是显示平坦能量分布的分量,而编码在每一个分量上进行。
借助推荐的方法,该音调分量在频率轴极窄的范围上被高准确度地进行量化,并沿频率轴上位置记录在一种记录媒介上,用以实现比上述对于予置频段的频率分量量化更高效率的编码。这样,对于推荐方法的一个方面,集中在每一个音调分量的局部最大能量的频谱分量周围的若干予置频谱分量被归一化和量化,以便进行编码。在此描述上述专利申请的内容是由于它们被本发明的受让人所拥有。
但是,补偿声学信号的频谱分量是复杂的,并且一个音调分量具有扩展组成的频谱单元的分离散式。那就是说,例如对于正弦波情况,频谱分量随着偏离其频率的增加,能量很快下降,并且实质上所有的能量集中在极少量的频谱分量中。
虽然音调分量能从由一般的音乐器械产生的声音提取,组成每一个音调分量的频谱单元并非同正弦波那样如此敏锐,这是由于音乐表演期间存在频率的涨落。另一方面,从一种音乐器械到另一种音乐器械扩展组成每一个音调分量的频谱单元的方式显著不同。
如果,对于归一化并量化若干集中在每一个音调分量的最大能量频谱单元周围的频谱单元,该频谱单元数是增加的,那些从中心频谱单元除去的、同具有最尖锐的频谱能量分布的音调分量相比,由于心理声学效应而可以忽略不计的极小幅度的频谱单元也被进行量化。这样要求若干予置二进制数去降低编码效率。
相反,如果频谱单元减少,相对于具有少量尖锐频谱能量分布的音调分量,由于心理声学效应而不能忽略不计的那些频谱分量需要和该音调分量分开进行编码,这样将整个地降低编码效率。
鉴于以上所描述的技术状态,本发明的目的在于提供一种能改善编码效率而不降低尤其是对于声调声学信号质量的信号编码/解码设备,以及一种记录媒介,用于记录由该信号编码设备处理的信号。
根据本发明,提供了用于对一输入信号进行编码的方法,它包括以下步骤将输入信号分解为频率分量;将频率分量分成由许多音调分量组成的第一信号和由许多其他分量组成的第二信号,由该音调分量组成的频率分量的数目是变化的;对第一信号进行编码;对第二信号进行编码。
根据本发明,还提供了一种用于对一个输入信号进行编码的设备,该设备具有用于分解输入信号为频率分量的单元;用于将频率分量分为由许多音调分量组成的第一信号和由其他分量组成的第二输入信号的单元,由音调分量组成的频率分量的数目是变化的;用于对第一信号进行编码的单元;用于对第二信号进行编码的单元。
根据本发明,还提供了一种在其上可记录编码信号的信号记录媒介,该记录媒介按以下步骤形成将输入信号分解为频率分量;将频率分量分成由许多音调分量组成的第一信号和由其他分量组成的第二信号,由该音调分量组成的频率分量的数目是变化的;对第一信号进行编码;对第二信号进行编码;将已编码的第一和第二信号记录在记录媒介上。
根据本发明,还提供了一种在其上可记录编码信号的信号记录媒介,其中在许多音调分量上的信息以及在噪声分量上的信息是分开记录的,在音调分量上的信息包括指示由每一个音调分量组成的频率分量数目的信息。
根据本发明,还提供了用于对编码信号进行解码的方法,它包括以下步骤对由许多音调分量组成的第一信号解码,以产生第一解码信号;对由噪声分量组成的第二信号解码,以产生第二解码信号;组合第一和第二解码信号并对组合信号进行反变换,或分开对第一和第二解码信号进行反变换,并组合该反变换的信号,组合和反变换步骤在表示由每一个音调分量组成的频率分量数目信息的基础上进行。
根据本发明,还提了一种对编码信号进行解码的设备,它包括用于对由许多音调分量组成的第一信号进行解码的第一解码单元,产生一第一解码信号;用于对由噪声分量组成的第二信号进行解码的第二解码单元,产生一个第二解码信号;以及用于组合该第一和第二解码信号并对该组合信号进行反变换,或分开对第一和第二解码信号进行反变换并组合该被反变换的信号的组合和反变换单元,该组合和反变换单元在表示由每一个音调分量组成的频率分量数目信息的基础上执行组合操作。
用本发明的信号编码单元,根据其频谱能量的分布方式,音调信号可以被有效地进行编码,以便获得高总体效率的编码。那就是说,尤其是音调声学信号能够随编码效率的提高进行编码而不降低声音的质量。因此,应当在记录媒介上记录压缩编码信号,记录容量有效地加以利用。此外,对再现记录媒介而产生的信号进行译码就可获得高声量的声学信号。
图1是表示按本发明实施例的一种编码装置的电路方框图;图2是表示按本发明实例施例一种解码装置的电路方框图;图3是表示在按本发明实施例的一种信号分量分离电路中的操作顺序的流程图;图4表示在按图1实施例编码的信号中的音调分量;图5表示在图1实施例编码的信号中的噪声分量;图6表示一种方式,按这种方式,组成在按图1实施例编码的信号中的音调分量的频谱单元数目是变化的;图7表示当组成在按图1实施例编码的信号中的音调分量的频谱单元数目是变化的时候的噪声分量;图8是流程图,说明用来确定被记录成在按图1实施例处理的信号中的音调分量的音调分量的频谱单元数目的操作顺序;图9按图1实施例说明由信号编码获得的一代码串的记录;图10按图1实施例说明由信号编码获得另一代码串的记录;图11是表示一般编码装置的电路方框图;图12是表示图1实施例的一种变换电路结构的电路方框图,以及一般的偏码装置;图13是表示图1实施例的一种信号分量编码电路结构的电路方框图以及一般的编码电路;
图14是表示一般解码装置的电路方框图;图15是表示图1实施例的一种反变换电路结构的电路方框图以及一般的解码装置;图16说明用现有技术的编码方法参照附图,将详细说明实施例一种信号编码装置。在图1中,一个声学波形信号加到终端600。声学波形信号由变换电路601转换为信号频率分量,该频率分量按规定路径发送到信号分量分离电路602。
信号分量分离电路602将信号频率从变换电路601分离出来,使其成为每一个具有尖锐频谱分布的音调分量和每一个具有其他信号频谱分量的表示出平坦频谱分布的噪声分量。具有尖锐频谱分布的音调分量由音调编码电路603进行编码,而本身为不具有尖锐频谱分量的信号频率分量的噪声分量由噪声分量编码电路604进行编码。音调分量编码电路603和噪声分量编码电路604的输出由代码串产生电路605进行处理,以产一个输出代码串。ECC编码器606附加误差校正代码到代码串产生电路605的输出代码串。ECC编码器606由EFM电路607调制,以便加到记录头608。记录头608记录EFM电路607的三个输出代码串于磁盘609上。信号分量分离电路602输出音调分量数目信息、位置信息数据以及频谱单元数目信息到代码出产生电路605,这将稍后给予说明。
对于变换电路601,可使用类似图12中所示的装置,当然,变换电路601可按任何不同于图12所示的装置的方式进行配置。例如,输入信号可直接由MDCT变换为频谱信号,而变换成频谱信号可以由DFT或DCT而不是由MDCT来执行。
虽然信号可以由频率分配滤波器分离为频段分量,按目前的编码装置进行编码的方法对在信号能量集中的特定频率上的情况能最高效地进行。因此合理的是使用由上述正交变换将输入信号转换为频谱分量的方法,在该正交换中,用较少量的运算-逻辑操作即可获得大量的频率分量。
此外,音调分量编码电路603和噪声分量编码电路604可以用类似于图13中所示的装置实施。
图2示意表示一种信号解编装置,用于对由图1中所示的编码单元编码信号进行解码。
参照图2,由放音头708从磁盘609产生的代码串加到解调该输入代码串的EFM解调电路709。被解调的代码串按路径发送到ECC解码器710,在此进行误差校验。代码串分解电路识别该代码串的那一部分对应音调分量,并将输入代码分离为音调分量代码和噪声分量代码。代码串分离电路701将用于音调分量的位置信息和用于频谱单元数目的信息从输入代码串分离出来,并将分离信息输出到出口组合电路704。音调分量代码和噪声分量代码按规定路径分别发送到音调分量解码电路702和噪声分量解码电路703,用于对解码的去量化和去归一化。来自音调分量解码电路702和噪声分量解码电路703的解码信号按规定路径发送到执行组合操作的组合电路704,该组合操作是由图1的信号分量分离电路602进行的。根据用于音调分量的位置信息以及由代码串分离电路701提供的关于频谱分量数目的信息,组合电路704将音调分量的解码信号附加到噪声分量的解码信号的一予置位置,以便组合频率轴上的噪声分量和音调分量。这个综合解码信号由执行反变换的反变换电路705(图1中所示换电路601)进行变换,并且由在频率轴上的信号恢复为时间轴上的原始声学波形信号。反变换电路705的输出波形信号在终端705输出。反变换和组合的顺序是可以对换的,在这种情况中,图2所示的组合--反变换电路711可做成如图17中所示的那样。反变换电路712将来自噪声分量解码电路703的在频率轴上的解调噪声分量信号变换为在时间轴上的噪声分量信号。反变换电路713在由关于频单元数目信息以及音调分量分出电路701提供的关于音调分量信息所表示的频率轴的位置上排列来自音调分量的解码信号进行反变换,以便在时间轴上产生音调分量信号。组合电路714组合在时间轴上的来自反变换电路712的噪声分量信号以及在时间轴上的来自反变换电路713的音调分量信号,以产生原始的声学波形分量信号。
对于反变换电路705,712和713,可以使用在图15中表示并结合图15加的描述的一种装置。
图3表示对于分离在图1中所示编码电路的信号分量分离电路602中的音调分量的操作顺序。
在图3中,I和N分别表示频谱信号的序号以及该频谱信号的总数,另方面,P和R表示予置系数。对于音调分量,如果一个给定频谱信号的绝对值在当地大于其他频谱信号,并在超过一予定值之前大于在时间帧或块(根据帧或块执行正交变换)中的频谱信号的最大绝对值以及该频谱信号的能量和及相邻频谱单元,例如在频谱信号两边上的频谱单元的能量,和包括该频谱信号的一予置频段中的能量比较起来是大于一予置比值的,则该频谱信号以及该频谱信号两边上的频谱信号被认为是音调分量。该予置频段对于较低和较高频率可分别选择为较窄和较宽的,以符合例如临界带宽要求,目的是考虑听觉灵敏特性。
参照图3,在步骤S1,最大频谱单元的绝对值以变量A0代替,在步骤S2,频谱信号的序号置1,在下一步骤S3,某一频谱单元的绝对值以变量A代替。
在步骤S4,检验该频谱单元是否为当地最大频谱信号的绝对值,即是否为在当地大于其他接近的频谱分量的频谱信号的绝对值。如果结果是NO,即如果该频谱单元的绝对值不是当地最大频谱信号的绝对值,处理转到频S10。如果结果是YES,即该频谱单元的绝对值是当地最大频谱信号的绝对值,处理转到步骤S5。
在步骤S5,检验在包括当地最大频谱单元和代表一予置幅度和系数P的时间帧中,当地最大频谱单元的绝对值的变量A和最大频谱单元的绝对值A0的比值哪一个更大(A/A0>?)。如果结果是YES,即如果A/A0大于P,处理转到步骤S6。如果结果是NO,即如果A/A。不大于P,处理转到步骤S10。
在步骤S6,邻近频谱单元的绝对值的频谱单元的能量(当地最大频谱单元的绝对值),例如,在当地最大频谱单元的绝对值两个边上的频谱单元的能量和用变量X代替。在下一步骤S7,在包括本地最大频谱单元和相邻频谱单元的绝对值的予置频带中的能量用变量Y代替。
在下一步骤S8,校验上述能量值的变量X对用于予频带能量以及代表一予置比值的系数R的变量的比值哪一个大(X/Y>R?)。如果结果是YES,即如果X/Y大于R,处理转到步骤S9。如果结果是NO,即如果X/Y不大于R,处理转向步骤S10。
在步骤S9,当地最大频谱单元的绝对值信号以及若干邻近它的频谱信号被认为是音调分量,其结果将加以记录。
在下一步骤S10,检验记录在步骤S9上的频谱信号的数I是否等于频谱信号的总数N(I=N?)。如果结果是YES,处理结束。如果结果是NO,处理转到步骤S11。在步骤S11、频谱序号增加1(I=1+1),之后处理反到步骤S3。上述操作顺序将重复。
图4表示一例子情况,其中组成一个音调分量的频谱信号数目是固定的。
在图4所示例中,具体地表示四个音调分量TCA,TCB,TCD如图4例所示,这些音调分量集中在12个频谱信号中,如果这些分量被高准确量化,二进制数的数目基本上不增加。虽然编码效率可以用归一化并接着量化音调分量的方法以改善,为简化结构,可以省去对于归一化和再量化的处理,因为它是形成该音频分量的数目较小的频谱信号。
图5表示噪声分量,它是小于音调分量的原始频谱信号。
参照图5,由于该音调分量是从频段b1-b5中的原始频谱信号分离出来的,因此,在编码单元中的归化系数呈现较小值,结果,甚至用数目较小的二进制数就可以减小量化噪声。
用这样一种方式将音调分量从噪声分量中分离出来,同对每一个固定频段既执行归一化,又执行量化的方法相比,能够实现更高效率的编码。但是,组成每一个音调分量的频谱数目固定在5上,那就是当地最大频谱信号的绝对值信号和在该信号两侧上的每两个信号,结果,如图5频段b2和b3所示那样,较大频谱信号被分离出来,在噪声分量中不再有图4中所示的音调分量TCB。因此,对于图5中的频段b2和b3,这些噪声分量用更大的归一化系数进行归一化并被量化,结果编码效率更低。为了降低用于噪声分量归一化系数的值,较大的频谱信号可以从这些噪声分量中抽出来作为剩余的音调分量。但是,在这种情况下,需要去编码新的音调分量。另一方面,至于图4中所示的间调分量TCC,TCD,偏离当地最大频谱单元的频谱单元也同音调一样进行编码。但是,由于要求大量二进制数用高准确度化音调分量,如果具有如此小能量的频谱单元同音调一样进行编码,偏码效率可能降低这样,用目前实施例的单元,组成音调分量的频谱信号表面出可以变化的。即,五个频谱分量,包括其大小等于零的虚设频谱分量,以及集中在当地最大频谱信号的绝对值信号周围的七个频谱分量分别组成音调分量TCA和TCB。同样,也集中在当地最大频谱信号的绝对值信号用的三个频谱分量组成音调分量TCC,TCD。
图7表示不再有这些音调分量的噪声分量的分布。从与图5相比较看出,为改善编码效率,更小的值可用于频段b2和b3归一化系数。为更进一步改善编码效率,将降低音调分量TCC,TCD频谱信号数目。
图8表示确定记录在图3中作为音调的音调分量的频谱信号数目的典型操作顺序。
在图8中,音调分量的频谱信号的最大数置到7。如果集中在当地最大频谱分量的绝对值的信号周围的三个或五个频谱分量的能量超过相对于集中在该当地最大频谱分量的绝对值的信号周围的七个频谱分量的能量的一予置比值,音调分量的频谱单元数分别设置到3或5。虽然如上所述,予先记录和音调分量被进行分类,该分类操作也可以在提取音调分量的时间进行。
在图8中,记录的音调分量数在步骤S21设置为一变量M。在步骤S22频谱信号I的序号设置到1。在步骤S23,相邻于当地最大频谱单元的七个频谱单元的能量由变量Y替代。在S24步骤,相邻于当地最大频谱发量的三个频谱单元的能量由变量X替代。
在下一步骤S25,检验相邻的七个频谱单元的能量同三个频谱单元的能量的比值(X/Y)是否超过一目前的值P(X/Y>P?),如果在步骤S25的结果是YES,即如果值P被超过,处理转到步骤S26。如果结果是NO,即如果该值P未被超过,处理处理转到步骤S27。
如果音调分量的组成的频谱单元数目在步骤S26被设置为3,即为三个音调频谱分量。然后处理转到稍后说明的步骤S31。
在步骤S27,五个集中在一当地最大频谱分量周围的相邻频谱单元由变量X替代。在下一步骤S28,检验相邻的七个频谱单元的能量对五个频谱单元之比(X/Y)是否超过一目前值P(X/Y>P?)。如果在步骤S25的结果是YES,即如果值P被超过,处理转到步骤S29。如果结果是NO,即如果值P未被超过,处理转到步骤S30。
在步骤S29,如果音调分量的组成频谱单元和数目被设置为5,即为五个音调频谱分量。则处理转到稍后说明的步骤S31。
在步骤S30;如果音调分量的组成频谱单元被设置为7,即七个音调频谱分量,则处理转到稍后说明的步骤S31。
在步骤S31,检验记录在步骤S26,S29以及S30上的音调分量数目是否等于频谱信号的序号I(I=M?)如果结果是YES,即如果I=M,处理结束。如果相反,处理转到步骤S32。
在步骤S32,频谱信号的序号增加(I=I+1),并且以上操作顺序将重复进行。信号分量分离电路602按规定路径将由以上操作顺序所建立的音调分量的频率分量发送到音调分量编码电路603,而同时将剩余频率分量作为噪声分量按规定路径发送到噪声分量编码电路604。信号分量分离电路602将音调分量数目信息,位置信息,以及指示组成每一个音调分量的组成频谱单元的数目的频谱单元数信息按规定路径发送到代码串产生电路605。
图9表示一个代码串的具体例子,其中使用本实施例的编码装置对图6的频谱信号进行编码(代码串记录在记录媒介上)。
参照图9,音调分量+TCA,TCB,TCC,TCD,有关的音调分量TCA,TCB,TCC,TCD信息顺序以及按照由图6中所示的与噪声分量nc、nc2,nc3,nc4,nc5有关的噪声分量的信息的顺序进行的。
当关于音调分量的信息,关于指示该音调分量的组成频谱单元的数的频谱单元spn的数的信息对音调分量TCB是7的信息,例如,对于该音调分量TCB,关于指示音调分量的中心频谱是15的中心位置的信息,例如,关于指示量化二进制是四的量化准确度的信息,以及关于量化系数NP的信息,随同关于归一化和量化信号分量信息,例如信息数据SC1,SC2,SC3,…SC7都被记录在该记录媒介上。当然,如果量化准确度予先固定并与频率有关,则能够忽略关于量化准确度的信息。至于对于音调分量的位置信息,对于音调分量TCB,音调分量的最低位置是12的位置可以代替上述中心位置信息进行记录。
在关于音调分量TCC的情况,关于频谱单元数spn=3的信息,关于中心位置CP=31的信息,以及关于量化准确度QP=6的信息,包括关于信号分量的信息数据在内是SC1,SC2以及SC3。
至于对噪声分量的信息,关于量化准确度QP是3的信息,例如对于关于音调分量的信息nc1,以及关于归化系数NP的信息随同关于归化和量化的信号分量信息,例如信息数据SC1,SC2,SC3,…SC8都被记录在该记录媒介上。
可想到不同于图9中所示的各种结构,用本实施例借助编码获得代码串。图10表示用于有效记录有关频谱音调分量数目信息的代码串的结构例,如像在本实施例的编码方法应用中所要求的那样。
在图10例中,音调分量按每一个具有相同频谱分量数目的组进行记录。即,在本例中,例如,音频分量的数目是二,具有三个频谱音频分量,而该音调分量TCC,TCD(音调分量的信息数据)被记录,继之以表示所有具有组成频谱单元等于五的数目的音调分量的信息,例如关于该五个频谱音调分量=1的信息数据数目以及关于音调分量TCA的信息,以及表示所有具有组成频谱单元等于七的数目的音调分量的信息,例如关于该七个频谱音调分量=1的信息数据数目以及关于音调分量tcB的信息。如果该音调分量按照每个包括相同数目的组成频谱单元组这种方式进行记录,则没有必要记录关于该频谱音调分量数目的数据,这样,对于大量音调分量的情况,使特别有效的偏码成为可能。
记录顺序也可以按照以上所示的进行修改。例如,关于三个频谱音调分量信息数据,关于五个频谱音调分量的信息数据,以及关于七个频谱音调分量的信息数据,开始按这个顺序进行记录,接着是关于该音调分量的内容的信息数据。
虽然以上说明主要针对声学信号的编码,本方法还可以应用到一般波形信号的编码。然而本方法可以最有效地应用到声学信号,这是由于关于音调分量的信息在心理声学效应方面起着重要的作用。
虽然音调分量先于编码进行量化和归化,但这并非是必须遵循的,并且未进行归一化和简单量化的音调分量按本发明的编码方法也可进行编码。同样,如果某一代码直接同每一音调的频谱分布相关。而不是跟随编码的量化,组成音调分量的频谱单元数按本发明的编码方法是可以改变的。
要指出的是本发明可以毫不后悔地应用JP专利申请NOS.5-152865(1993)和5-183322(1993)中推荐的各种方法。
即,噪声分量可以借助于人类听觉灵敏度特性更有效地进行编码。例如,在频率轴上的音调信号附近,掩蔽效应将有效地起到作用。因此,如果在这种段定基础上进行,即在被抽出的音调分量的附近的噪声分量是零,如早先所领会的,在由编码信号解码的声学信号和原始声音之间不存在显著的差别。用该方法,如果编码单元根据临界带宽设计,信号压缩可按一种极简单的方式获得。
还可能的是将相邻于音调分量的频谱分量的一予置数的值减小到零,而不是将编码单元的噪声分量减小到零。该予置数根据听觉灵敏度特性加以改变,与该音调分量的频率有关,结果它是分别小于和大于较低的和较高频率范围。使用该方法,可用简单方式获得心理声学有效的高效率的压缩。由于靠音调分量的掩蔽强烈影响较高频率范围,对于降低噪声分量到零的范围可以不对称地进行设置。
噪声分量也可用所谓在D.A.Huffman“A MethodforConstruction of Minimun Redundancy Codes”I.R.E.,40,P.1098(1952)中所描述的可变长度编码进行编码。用这种编码方法,编码方法可以借且于配置较短代码长度到更加频繁出现的模式来加以改善。这种代码可以使用上述降低噪声分量到零的方法。具体地,由于零分量频繁出现,较短长度的代码可以配置到零,以便改善编码效率。该可变长度编码也可应用到音调分量。
上述方法归属于分离音调分量,并将它们和邻近的信息降低到零,并接着对噪声介量进行编码。然而有可能从原始频谱信号减去经编码接着又被解码的音调分量,并对最后所得的差信号编码。这样,减去经编码接着又被解码的音调分量的频谱信号被进行编码。此外,音调分量可以从该频谱信号抽取并进行编码,以改善该频谱信号的编码准确度。以上处理的重复将导致编码准确度的改善。
参照图18,现在说明用来执行上述方法的一种信号编码装置。和图1那些相同的部分或部件用相同的标号,而为简化不再进行相应说明。由变换电路601产生的频谱信号通过由开关控制电路808控制的一个开关801按规定路径发送到音调分量提取电路802。音调分量提取电路802识别由结合图3和8描述处理的音调分量,并且仅将识别的音调分量按规定路径发送到音调分量编码电路603。音调分量提取电路802输出关于音调分量的信息数据数,关于中心位置信息以及指示音调分量的频谱单元数的信息数据到代码串产生电路605。音调分量编码电路603归一化并量化输入音调分量,并且将归一化了的和量化了的间调分量按规定路径发送到本地解码器804和代码串产生电路605。本地解码器804对归一化和量化的音调分量进行再量化和再归一化,为的是恢复原始音调分量。然而,现在量化噪声已经包括在恢复的信号中。本地解调器804的输出作为第一解调信号按规定路径发送到一个附加节点805。原始频谱信号通过由开关控制电路808控制的开关806从变换电路601加到该附加节点805。附加节点805从原始频谱信号减去第一解码信号,输出第一差信号。如果音调分量的提取,编码,解码和相减在一个步骤中完成,该第一差信号被作为噪声分量通过由开关控制电路808控制的开关807加到噪声分量编码电路604。如果音调分量的提取,编码,解码和相减重复进行,该第一差信号通过开关801按规定路径加到音调分量提取电路802。音调分量提取电路802,音调分量编码电路603以及本地解码器804执行如上所述同样的操作以产生按规定路径发送到也通过开关806馈送第一差信号的附加节点808的第二解码信号。附加节点805从第一差信号减去第二解码信号,输出第二差信号。如果音调分量的提取,编码,解码和相减是由两个完成的,第二差信号作为噪声分量按规定路径通过开关807发送到噪声分量编码电路604。如果音调分量的提取,编码,解码,以及相减接着重复,上述那些同样的操作由音调提取电路802,音调分量编码电路603,本地解码器804和附加节点805完成。如果从音调分量提取电路802提供的音调分量的信息数据数目超过阈值,则开关控制电路808将维音调分量信息数据数目的减值,并控制开关807去终止音调分量的提取。当音调分量的提取中断时有可能在该时间点上终止音调分量的提取,编码,解码以及相减。如果采用上面方法,可以维持足够的编码精确度,甚至尽管用于量化音调分量的二进制数的数目的上限设置到一个较低值,并因此用来记录量化二进制数的二进制数的数目可以减少。按上述方式用多于二个步骤提取音调分量的本方法不仅可以应到从原始频谱信号减去等效于编码和解码音调分量的一个信号的情况,而且可以应用到将提取的音调分量的频谱信号减少到零的情况。这样如“免除音调分量的信号”这种表示意味着理解这两个情况。
音调分量的提取可以限制到较高的频段。
如果,一般为执行变换为频谱信号,在较低频段应保持足够的频率分辨度,用于变换为频谱信号的转换域需要选择得较长。然而,使用无难度的小尺寸器件是不能达到的。为了对音调分量进行编码,需要对归一化信息或音调分量的位置信息进行编码。但是分离存在在较低频段中的大量音调分量是困难的,为改善编码效率,用相应于提取的音调分量的数目去记录信息数据,这将是不方便的。因此,如果在较低频段不能维持足够的频率分辨度,则只有在较高频段才能满足分离和编码音调分量的需要。
为了在较低频段维持足够的频率分辨度,对于较低频段的频率分辨度可以根据较高频段的加以改变。
按照本发明的记录媒介是这样的一种记录媒介,在其上记录使用上述编码单元进行编码的信号。该记录媒介可包括一个盘状记录媒介,如光盘,磁--光盘,相位改变型光盘或磁盘,带状记录媒介,如磁带,以及半导体记录媒介,如记录卡或IC芯片。
虽然在上述实施例中,代码串是记录在记录媒介上的,但它也可以在一种光纤上传播的。
权利要求
1.用于编码输入信号的一种方法,包括如下步骤分解输入信号为频率分量;将该频率分量分离为由许多音调分量组成的第一信号和由其他分量组成的第二信号,组成音调分量的频率分量的数目是可变的;对所说第一信号进行编码;以及对所说第二信号进行编码。
2.根据权利要求1的方法,还包括对表示组成每一个音调分量的频率分量的数目的信息进行编码的步骤。
3.根据权利要求1的方法,其中所说分解是正交变换。
4.根据权利要求1的方法,其中,对所说第一信号进行编码的步骤包括对所说第一信号进行量化的步骤。
5.根据权利要求1的方法,其中,对所说第一信号进行编码的步骤包括对所说第一信号进行归一化的步骤。
6.根据权利要求1的方法,还包括将每一个由相同频率分量数目组成的所说音调分量分解为代码串。
7.根据权利要求1的方法,其中所说的输入信号是一个声学信号。
8.用于对一个输入信号进行编码的设备包括用于将频率分量分离成由许多音调分量组成的第一信号和由其他分量组成的第二输入信号的装置,组成音调分量的频率分量是可变的;用于对所说第一信号进行编码的装置;以及用于对所说第二信号进行编码的装置。
9.根据权利要求8的设备还包括用于对表示组成每一个音调分量的频谱分量数目的信息进行编码的装置。
10.根据权利要求8的设备,其中所说的分解是正交变换。
11.根据权利要求8的设备,其中所说第一编码装置包括用于量化所说第一信号的装置。
12.根据权利要求8的设备,其中所说第一编码装置包括用于归一化所说第一信号的装置。
13.根据权利要求8的设备,还包括将所说每一个由相同频率分量数目组成的音调分量分为代码串的装置。
14.根据权利要求8的设备,其中所说输入信号是一个声学信号。
15.一种在其上记录编码信号的记录媒介,所说记录媒介以下步骤形成分解一输入信号为频率分量将频率分量分离成由许多音调分量组成的第一信号和由其他分量组成的第二信号,组成该音调分量的频率分量数目是可变的;对所说第一信号进行编码;对所说第二信号进行编码;以及将编码的第一和第二信号记录在记录媒介上。
16.根据权利要求15中的信号记录媒介,借助如下附加步骤形成将表示组成每一个音调分量的频率分量数目信号进行编码;以及记录表示组成每一个编码音调分量的频率分量数目信息。
17.根据权利要求15中的信号记录媒介,其中所说分解是正交变换。
18.根据权利要求15中的信号记录媒介,其中对所说第一信号编码的步骤包括量化所说第一信号。
19.根据权利要求15中的信号记录媒介,其中,对所说第一信号编码的步骤包括归一化所说第一信号。
20.根据权利要求15中的信号记录媒介,借助于将所说每一个由相同频谱数目组成的音调分量分为代码串的附加步骤形成。
21.根据权利要求15中的信号记录媒介,其中,输入信号是声学信号。
22.一种在其上记录编码信号的记录媒介,其中关于多个音调分量的信息和关于噪声分量的信息分开进行记录,以及其中关于所说音调分量的信息包括表示组成每一个音调分量的频率分量数目的信息。
23.根据权利要求22中的信息记录媒介,其中所说音调分量包括关于归一化系数信息和量化准确度信息中之一信息。
24.根据权利要求22中的信号记录媒介,其中,音调分量信息是按照具有组成每一个音调分量的频率分量数目相同的音调分量的信息组进行记录的。
25.用于对一个编码信号进行解码的方法包括如下步骤对由多个一个音调分量组成的第一信号进行解码,以产生第一解码信号;对由噪声分量组成的第二信号进行解码,以产生第二解码信号;以及组合所说第一和第二解码信号并对该组合信号进行反变换,或分开对所说第一和第二解码信号进行反变换然后组合该经反变换的信号,组合和反变换步骤是根据表示组成每一个音调分量的频率分量的数目信息进行的。
26.根据权利要求25的方法,其中所说组合和反变换步骤包括逆正交变换所说第一和第二解码信号。
27.根据权利要求25的方法,其中对第一信号进行解码的步骤包括再量化所说第一信号。
28.根据权利要求25的方法,其中对第一信号进行解码的步骤包括再归一化所说第一信号。
29.根据权利要求25的方法,其中所说第一信号是按照具有组成每一个音调分量的频率分量数目相同的音调分量的信息组进行组合的。
30.根据权利要求25的方法,其中由可说反变换步骤取得的信号是一个声学信号。
31.用于对一个编码信号进行解码的设备,包括第一解码装置,用于对由多于一个音调分量组成的第一信号进行解码,产生第一解码信号;第二解码装置,用于对由噪声分量组成的第二信号进行解码,产生第二解码信号;以及组合和反变换装置,用于组合所说第一和第二解码信号并反变换该组合信号,或分开反变换所说第一和第二解码信号,然后组合该经反变换的信号,组合和反变换装置根据表示组成每一个音调分量的频率分量的数目执行组联操作。
32.根据权利要求31的设备,其中所说组合和反变换装置包括逆正交变换装置,用于逆正交变换所说第一和第二解码信号。
33.根据权利要求31的设备,其中所说第一解码装置包括再归一化装置,用于再归一化所说第一信号。
34.根据权利要求31的设备,其中所说第一信号是按照具有组成每一个音调分量的频率分量数目相同的音调分量的信息组进行组合的。
36.根据权利要求31的设备,其中所说组合和反变换装置的输出是一个声学信号。
全文摘要
一种对输入信号编码的方法和设备包括分解输入信号为频率分量,分离频率分量为音调分量组成的第一信号和由其他分量组成的第二信号,音调分量的频率分量数目可变,对第一和第二信号进行编码。一种对编码信号解码的方法和设备,及记录编码信号的记录媒介。音调信号可根据频谱能量分布方式有效地进行编码,将编码的信号压缩记录在记录媒介上可有效地使用记录能力。高质量声学信号可根据记录媒介再生的解码信号得到。
文档编号H04B1/66GK1117674SQ9411375
公开日1996年2月28日 申请日期1994年9月28日 优先权日1993年9月28日
发明者筒井京弥 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1