数字信号处理设备和数字信号处理方法

文档序号：2835807阅读：376来源：国知局

专利名称：数字信号处理设备和数字信号处理方法
技术领域：
本发明关于一种信号处理设备和一种信号处理方法。信号预先按一定数据量分块。这种方法允许编辑块数字信号，使每一块连同它邻近的块，有效地进行编码。
对于声频信号，作为高效编码方法的技术参照，例如，众所周知的，变换编码方法。该方法是分块频带分频方法的一个例子。在这种变换编码方法中，时间基声频信号按预定时间周期单元分成块，每一块时间基信号转换成频率基信号(即正交变换)。这样，该时间基信号被分成许多频带，在每一个频带中，块被编码了。作为另一相关技术参照，谐波频带编码(SBC)方法是所谓非分块频带分频方法的一个例子。在SBC方法中，将一个时间基声频信号分成许多频带，然后编码，而不把信号按预定的时间周期单元分成块。
作为高效编码方法的另一相关参照，是频带分隔编码和SBC方法的组合。在这种方法中，每个谐振信号正交变换成相应变换编码方法的频率基信号，被变换信号按每个谐波频带编码。
作为采用上述项谐波频带编码方法的分频滤波器的例子，有众所周知的QMF(正交镜面滤波器)。在第55卷8期(1976)Bell Syst．Tech．J中，R．E．Crochieve所著“语言的次谐频数字编码”一文中叙述了QMF。在ICASSP．83，BOSTON“多相正交滤波器-一种新型次谐频编码技术”一文中，Jeseph H．RoTh Wiler叙述了采用等频宽分频方法的多相正交滤波器和相应的设备。
作为正交变换的一个例子，输入声频信号按预定的时间周期单元(如每帧)的间隔分块，每块如，用快速付里叶变换(FFT)方法离散，余弦变换(DCT)方法，或修正的DCT变换(MDCT)方法进行变换，其结果把时间基信号转换成频率基信号。在1987年，Surrey Royal Melbourue大学技术学院的J．P．Princen和A．B．Bradley所著“用基于时间畴混淆消除的滤波器组设计的次谐频／变换编码”一文中叙述过MDCT。
在另一方面，考虑到人的听觉特性，采用分频宽度量化每个次谐波分量。换句话说，所谓临界频带指人的听觉宽度正比于频率。用临界频带，声频信号可以分成许多次谐频(如25个次谐频)。根据次谐频编码方法，当每个次谐波进行编码时，将预定的位数分成每个项谐频，换种说法，每个次谐频分到的位数是自适应的。例如，MDCT过程产生的MDCT系数数据，用上述位分配方法进行编码，自适应的位数分配给每个次谐波的MDCT系数数据，每块分配到的位数，也就编码了。
作为位分配方法及其设备相关的实例，参见1997年25卷4期IASSP的“一种按照每个次谐频信号强度的位分配方法”，另一相关参照为1980年ICASP的“用听觉掩蔽按照每个次谐频的信噪比固定位分配方法”和M．A．Kransner MiT的“临界频带编码器-听力系统知觉要求的数字编码”。
在对每个资谐频的每块进行编码时，对每个次谐频来说，每块是归一化和量化。这样，每块有效编码，此过程称作块浮量过程。当用MDCT过程产生MDCT系数作编码时，得到每个次谐频MDCT系数的量大绝对值。根据这最大值，MDCT系数归一化，然后量化。从而MDCT系数能更有效编码。归一化过程可如下完成。从许多数值中，每块选一个值用预定计算过程作归一化过程。赋予选定值的数用作归一化信息。大多数的值数字化，从而声级能增加2dB。
上述高效编码信号按如下解码。参照每个次谐频的位分配信息和归一化信息等产生已高效编码信号的MDCT系数。由于对该MDCT系数作所谓反正交变换过程，产生时间基数据。当完成高效编码过程时，只要频带用分频滤波器分成次谐频，则用次谐频组合滤波器组合出时间基数据。当归一化信息可以用加、减过程改变或者类似，再生级调整功能，滤波功能等等来改变实现时间基信号，编码数据的解码，这就是所谓数据的编辑方法。根据这种方法，因为再生级可用一计算过程如加、减来进行，调整所以设备的结构就变得简单了。此外，因为解码过程，编码过程等等并不需要过多，重新可以调整不降低信号质量。此外，用这种方法，可修正编码信号而不改变解码产生信号的时间周期，解码过程产生的部分信号可能改变而不影响其他部分。
除了改变归一化信息，当得到解码信号和原始信号之间的时间逻辑关系(即位相的延迟量)时，与解码信号具有相同时间逻辑关系的编码数据产生。
当编码数据用上述方法改变时，可完成编辑操作，如级调整。对应增加或减小归一化信息的一个值(如2dB)，这样，可以完成如此精确的级调整。在时间逻辑方面，如级调整这样的一个编辑操作不能完成。精度超出所用编码方法对应编码数据格式的最小时间单元(最小时间单元，如1帧)。
然而，由于对所用编码方法和编码数据格式的如此限制，重放级和频率范围的编辑操作和时间逻辑方向的操作不能更精确完成。
可以，本发明的一个目的是提供一种数字信号处理设备，一种数字信号处理方法，一种数字信号记录设备和一种数字信号记录方法，允许对重放级极少受所用编码格式影响完成这种编辑过程。本发明的另一个目的，是提供能记录这种数据的记录介质。
本发明的第一方面，是处理输入信号已分成块的数字信号处理设备。每块有预定的数据量，并与相邻块一起高效编码，包含一个解码方法，能把高效编码信号连同它邻近块一起解码。一种改变过程的方法，用来改变解码的数字信号，一种编码方法，用来将改变了的数字信号连同它相邻块一起高效编码。以及一种延迟补偿方法，用来补偿用解码方法解码后信号一个延迟。
本发明的第二方面是一种数字信号处理方法。处理已被分成块的输入数字信号。每块有预定的数据量，并已与相邻块一起高效编码，包含下述步骤(a)对被高效编码信号连同相邻块一起的解码。(b)改变已解码的数字信号。(c)将改变后的数字信号加同与相邻块一起高效编码，并对步骤(a)解码的解码信号一个延迟补偿。
经下列最好实施例的详细叙述和加图示说明，本发明的这些目的、特性和优点将会一目了然。

图1按本发明的数字信号记录设备的结构框图。
图2A半常规信号情况下，正交变换块大小的示意图。
图2B非规则信号情况下，短模式正交变换块大小的示意图。
图2C非规则信号情况下，中模式a正交变换块大小的示意图。
图2D非规则信号情况下，中模式b正交变换块大小的示意图。
图3按本发明的编码数据格式示意图。
图4图3第一字节数据详情示意图。
图5分配计算电路的结构框图。
图6频谱按临界频带、块浮置等等划分图。
图7声掩蔽谱图。
图8最小可听曲线和掩蔽谱图。
图9按本发明数字信号重放和／或记录设备的结构框图。
图10归一化信息产生示意图。
图11改变归一化信息的电平操作示意图。
图12改变归一化信息的滤波操作示意图。
图13编码数据、帧重迭示意图。
图14按本发明，完成编码过程的结构框图。
图15A信号波形和记录介质上记录帧之间关系示意图。
图15B信号波形和完成解码过程和有效过程后相应帧之间关系示意图。
图15C信号波形和完成编码过程后相应帧之间的关系示意图。
图16按本发明，编码过程中单帧的时间逻辑关系示意图。
图17A输入窗滤波并按帧编码的PCM数据情况的示意图。
图17B部分经图17A编码并录在介质上的PCM数据编辑示意图。
图17C用一延迟补偿量补偿窗位置滤波的示意图。
图18按MPEG声格式的编码数据格式示意图。
优先实施例的详细描述参照图1，将叙述按本发明的一种数字信号记录设备的结构实例。本发明的实施例是一种具有编码过程系统的数字信号记录设备。
能对输入数字信号，如对应次谐频编码(SBC)过程，自适应变换编码(ATC)过程和自适应位分配过程，声频PCM(脉码调制)信号完成高效编码过程。在这些例子中，作为输入数字信号，可以是数字声频数据信号(人的语言、歌声、器乐声或类似数字化过的)，数字视频信号或类似可以被处理的信号。
当取样频率为44．1千赫时，频带为0到22千赫的一声频PCM信号，通过输入终端100输到分频滤波器101，分频滤波器101把提供的信号分成一个频带为0到11千赫的次谐频信号和一个频带为11到22千赫的次谐频信号。次谐频为11到22千赫的信号提供给MDCT(修改的离散余弦变换)电路103和块电路109、110和111。
0千赫到11千赫的次谐频信号提供给分频滤波器102，分频滤波器102把所提供的信号分成一个频带为5．5千赫到11千赫的次谐频一个频带为0千赫到5．5千赫的次谐频信号。5．5千赫到11千赫的次谐频信号提供给MDCT电路104和块电路109、110和111。另一方面，0到5．5千赫的次谐频信号提供给MDCT电路105和块电路109、110和111、每个分频滤波器101和102可包含一个QFM或类似的滤波器。块电路109指明对应提供信号的块大小，把代表块大小的信息提供给MDCT电路103和输出终端113。
块电路110指明对应所提供信号的块大小。把代表块大小的信息提供给MDCT电路104和输出终端115。块电路111指定对应所提供信号的块大小，把代表指定块大小的信息提供给MDCT电路105和输出终端117。块电路109、110和111使发起使块大小即块长度在完成正交变换过程前随输入数据自适应的改变。
图2A、2B、2C和2D表示提供给MDCT电路103、104和105单个次谐频的数据例。块电路109、110和111独立指定由分频滤波器101和102输出的单个次谐频的正交变换块的大小。此外，MDCT电路103、104和105能按照信号的时间特性和频率分布改变时间分辨率。当输入信号在时间逻辑上为半稳恒时，每个正交变换块大小的长模式为11．6毫秒。
另一方面，当输入信号是非稳恒时，每个正交变换块大小的一种模式是长模式的1／2或1／4。实际上，用短模式，正交变换块大小为长模式的1／4。这样，用短模式，每个正交变换块的大小为2．9毫秒，如图2B所示。有两种中间模式，为中间模式a和中间模式b。用中间模式a，正交变换块的大小为长模式的1／2。而中间模式b，正交变换块的大小为长模式的1／4。这样，在中间模式a，一个正交变换块的大小为5．8毫秒，另一个正交变换块大小为2．9毫秒，如图2C所示。在中间模式b，一个正交变换块的大小是长模式的1／4。而另一个正交变换块的大小是长模式的1／2。所以，在中间模式b，一个正交变换块是2．9毫秒，而另一个正交变换块大小为5．8毫秒，如图2D所示。随着时间分辨率的种种变化，可以处理复杂化了的输入信号。
考虑到设备的电路标尺和诸如此类引起的限制，每个正交变换块的大小可以用较为复杂的方式进行划分。这样，显然现实输入信号可更充分进行处理。块电路109、110和111指定块大小。把代表块大小的信息提供给MDCT电路103、104和105，位分配计算电路118和输出终端113、115和117。
回到图1，MDCT电路103对应块电路109指定的块大小完成MDCT过程。该过程产生的高频带MDCT系数，即频率基谱数据，与每个临界频带相结合，提供给自适应位分配编码电路106和位分配计算电路118。MDCT电路104，按照块电路110指定的块大小完成MDCT过程。此过程产生的中间频带MDCT系数，即频率基谱数据，提供给自适应位分配编码电路107和位分配计算电路118。临界频带宽度的划分要考虑块浮是过程的效率。
MDCT电路105按块电路111指定的块大小完成MDCT过程。该过程的结果，低频带MDCT系数与每个临界频带相结合，则提供给自适应位分配编码电路108和位分配计算电路118。临界频带是频率通带，要考虑人的听觉特性来进行划分。当一个特定的清亮的声时被一个和它具有相同强度并频带相邻的窄带噪声所掩盖，则窄带噪音的频带就是临界频带。临界频带的带宽正比于它们的频率。例如，0到22千赫的频带可分成25个临界频带。
位分配计算电路118，对应所提供的MDCT系数，即频率基谱数据和块大小信息，考虑到上述临界频带和掩蔽效应(以后会讲到)的块浮置，计算每个次谐频的掩蔽量，能量和／或峰值，根据计算结果，位分配计算电路118计算换算因数和每个谐频分配到的位数。把算出的分配到的位数提供给自适应位分配编码电路106、107和108。在以下描述中，每个次谐频作为一个位分配单元认作单元块。
自适应位分配编码电路106重量化谱数据即MDCT系数，而该MDCT系数是MDCT电路103按照块电路109指定的块大小信息和位分配电路118所提供的分配到的位数和换算因数信息来提供的。作为过程的结果，自适应位分配电路106产生对应所用编码格式的编码数据。已编码的数据提供给计算设备120。自适应位分配编码电路107重量化谱数据即MDCT系数。该系数是MDCT电路104按块电路110给的块大小信息和计算电路118给的分配到的位数和换算因数信息来提供的。作为该过程的结果，产生对应编码格式的编码数据。该编码数据提供给计算设备121。
图3显示一个数据格式的实例。在图3中，左边数字1，1，2，……，211代表字节。本例中一帧包括212个字节。在第0字节位置存放由图1所示块电路109，110和111指定的每个谐频的块大小信息。在第1字节位置存放单元块的数目。在高频段位分配计算电路118很有可能不给单元块分配位，从而不被记录。这样，要处理这种情况，用这种方式指定单元块的数目，使较多的位分配给中间频带区域和低频带区域，因为它们相比于高频带区域，更会大大影响人的听觉。此外，在第1字节位置，存放了包含双重写的位分配信息的单元块数目以及包含双重写的换算因数信息的单元块数目。
为了修正一个错误，同样的信息被重写了。换句话说，被记录在某一特定字节的数据在另一字节又被记录了。虽然对抗出错的强度正比于双重被写的数据量和用于谱数据递减的数据量。在编码格式的实例中，因为含有重写位分配信息的单元块数和含有重写换算因数的单元块数是独立指定的，抗错强度和用于谱数据的位数目可以进行优化。按预定位的代码和单元块数之间的相互关系被定义成一个格式。
图4例举第1字节的8位的内容。本例中前3位代表所包含的单元块数目。后两位代表含有重写位分配信息的单元块数目，最后3位代表含有重写换算因数的单元块数目。
图3中第2字节位置表示存放的每一单元块的位分配信息。例如，一个单元块包含4位那末，作为原文块数的位分配信息从第0个单元块开始存放。紧接着位分配信息的是每个单元块的换算因数信息。实例中用作换算因数信息，每个单元块包含6位。这样，作为单元块数的换算因数从第0个单元块开始存放。
接着换算因素信息的是每个单元块的谱数据。存放真实包容的单元块数的谱数据。因为每个单元块包含的谱数据是已被定义成一种格式，随同位分配信息，能得到数据关系。当特定的单元块分配到的位数为零，说明不容纳该单元块。
接在谱数据后面的是重写过的换算因数和重写过的位分配信息。换算因数信息和位分配信息按照如图4所示的双重写信息进行重写。在最后一个字节(第211字节)和倒数第2个字节(210字节(将第0个字节的信息和第1个字节的信息进行重写，这已定义成一种格式。但是重写过的换算因数信息和重写过的位分配信息是不能改变的。
一帧包括经输入终端100提供的1024个PCM采样。前512个采样用作前帧，后512个采样用作下一帧。从MDCT过程的重失观点采用这种排列。
回到图1，归一化信息变换电路119产生改变低频带，中频带和高频带的换算因数信息的值，并将对应低频带，中频带和高频带的值分别提供给计算设备120、121和122。计算设备120把归一化信息变换电路119提供的值加到由自适应位分配编码电路106提供的编码数据含有的换算因数信息。当归一化信息变换电路119输出的值为负值时，计算设备120操作成减设备。计算设备121把归了化信息变换电路119给的值和自适应位分配编码电路107给出的编码数据中包含的换算因数信息相加。当归一化信息变换电路119输出的值为负值时，计算设备121操作成减设备。
计算设备122把归一化信息变换电路119给出的值和自适应位分配编码电路108给出编码数据中的换算因数信息相加。当归一化信息变换电路119的输出为负值时，计算设备122操作成减设备。归一化信息变换电路119按照用户通过面板给出的操作而操作。这种情况下，电平调节过程、滤波过程和诸如此类过程后面都会讲到，用户的要求都能实现。计算设备120、121和122的输出信号分别通过输出终端112、114和116送到常规的记录系统(未显示)。该记录系统把120、121和122等记录设备的输出信号记录在一种记录介质，例如磁光盘上。
记录系统至少记录一种用记录介质上的磁道地址完全能控制而产生的编码数据以及还没处理过的数据。记录方式为编码数据和未经处理的数据分开记录。后面会讲到此过程，这样在记录介质上至少记录了一种类型的编码数据和／或预编辑数据。说到记录介质，除了磁光盘外还可以用盘状的记录介质(如磁盘)，带状的记录介质(如磁带或光带)或半导体存贮器(如IC存贮器，卡型存贮器，存贮卡或光存贮器)。
接下来详细叙述每个过程。图5表示位分配计算电路118的一个实例。通过输入终端301把MDCT电路103、104和105提供的频率基频数据或MDCT系数送到能量计算电路Rc。另外，块电路109、110和111给出的块大小信息也通过输入终端301送到能量计算电路302，能量计算电路302计算每个单元块振幅值的总和，从而算出各单元块的能量。
图6表示能量计算电路302输出信号的一个实例。图6中各谐频总和的谱SB用顶端带圆的垂直线表示。图6的水平轴和垂直轴分别代表频率和信号强度。简化起见，只在谱B12的顶端同和“SB”字样。次谐频(单元块)的数目是12(从B1到B12)，要是不用能量计算电路302，也可以安排部分结构来计算振幅的峰值，平均值等等，再对应振幅的峰值，平均值等等完成位分配过程。
能量计算电路302指定换算因数值。事实上在取舍换算因数值时提供几种正值。常选择其中比谱数据即各单元块MDCT系数绝对值较大的那些。选中值中的最小值作为该单元块的换算因数。实例中分给可选换算因数值的数只有几位。比如，可存在ROM(只读存贮器)中。由此，实例中将换算因数值增加2分贝。分配给特定单元块的换算因数值的数字义为该特定单元块的换算因数信息。
能量计算电路302的输出信号(即，每个谱值SB)提供给褶积滤波电路303。该褶积滤波电路303为考虑掩蔽的影响，用谱SB乘上一个预定加权否数后相加来完成褶积过程。接着，参照图6，详细叙述该褶积过程。如上所述，图6表示各块谱SB的一个实例。在褶积滤波电路303的褶积过程中计算虚数所划部分的总和。该褶积滤波电路303可包括许多延迟设备、许多乘设备和一个求总和的加设备。每个延迟设备相继延迟输入数据，而每个乘设备把对应延迟设备的输入数据乘上一个滤波系数(加权函数)。总和相加设备把多个设备的输出数据全部加起来。
回到图5，把褶积滤波电路303的一个输出信号送到计算设备304，容差函数(代表掩蔽电平)是从(n-ai)函数生成电路305提供给计算调和304的。计算设备304用容量函数算出对应褶积滤波电路303的褶积区域内的容差噪声电平的电平α，后面将讲到，对应容差噪声电平的电平α是每个临界频带的容差电平，作为反褶积过程的结果。算得的电平α值受容差否数的增加／减小所控制。
换句话说，如果把最低临界频带分配到的数标成i，则可按下列方式(1)得到对应容差噪声电平的电平αα=S-(n-ai)…(1)其中n和α是常数；a＞0；S是褶积谱的强度。公式1中(n-ai)是容差函数。本例中给定n=38和a=1。
计算设备304算得的电平α送到除法设备306，除法设备306反褶积电平α。其结果除法设备306产生对应电平α的一个掩蔽谱。该掩蔽谱是一个容差噪声谱。一般完成反褶积过程要求复杂计算。但是，按照本发明的第一实施例，利用结构十分简单的除法设备306就完成了反褶积过程。掩蔽谱送到组合电路307。此外，代表最小可听曲线Rc(后面会讲到)的数据是由最小可听曲线生成电路312送到组合电路307。
该组合电路307把除法设备306输出的掩蔽谱和代表最小可听曲线Rc的数据相组合，并产生一个掩蔽谱。把所产生的掩蔽谱送到减设备308，能量计算电路302输出信号(即每个谐频的谱SB)的时序用延伸电路进行调整。最终信号送到减设备308该减设备308完成相应掩蔽谱和谱SB的减过程。
作为减过程的结果，各块的谱SB被掩蔽了，以至于比掩蔽谱电平小的一部分被掩蔽。图7是掩蔽过程的一个实例。参照图7，谱SB中小于掩蔽谱(MS)电平的一部被掩蔽。简化起见，图7中只有谱B12标上“SB”，且对应掩蔽谱电平标上“MS”字样。
当噪声绝对电平等于或小于最小可听曲Rc，人就听不到这种噪声。即使用同样编码方法最小可听曲线也会随着重放重量变化。然而，在一实数字系统中，例如处于16-位动态范围的音乐数据不会有很大变化。那末，假设在大多数可听频带附近4千赫的量化噪声为不可听的，则建议在其他频段中小于最小可听曲线电平的量化噪声是不可听的。
这样，处于系统学长周围4千赫的噪声就不算可听声了。如果用组合最小可听曲线Rc和掩蔽谱MS来得到容差噪声电平，则图8下半影线部分能代表容差噪声电平。本例中位于最小可听曲线4千赫处的电平设备为最小电平，例如等价于20位。图8中各块的SB用实线表示，各块的MS用虚线表示，但简化起见，图8中只有谱B12用“SB”、“MS”和“Rc”字样表示。
回到图5减设备308的输出信号提供给容差噪声补偿电路310。该容差噪声补偿电路310补偿减设备308输出信号的容差噪声电平，对应本例，用相同小圆曲线表示的数据。换句话说，容差噪声补偿电路310对各单元块按照各种参数，诸如上述掩蔽和听觉特性计算分配到的位。通过输出终端311，把容易噪声补偿电路310的输出信号作为位分配计算电路118的最终输出数据。本例中，等小圆曲线是表示人听觉特性的特性曲线。例如，能听到的各频率声的声压是用1千赫清亮声音的相同强度画出来的。把这些点连起来就可表示成一曲线。该曲线认作小圆等灵敏度曲线。
在图8中等小圆曲线和最小可听曲线相匹配。等小圆曲线上，虽然4千赫附近的声压比1千赫附近的声压要小8到10分贝，但是4千赫的强度和1千赫的强度都相同。相比较，除非50赫的声压比1千赫的声压大到约15分贝，则50赫的强度才和1千赫的声强不相同。这样，超出最小可所曲线Rc(即容差噪声电平)和等小圆曲线具有相同的频率特性，人就听不到这噪声。因此，显然考虑了等小圆曲线，容差噪声电平就能补偿人的听觉特性。
下面将详细讨论换算因数信息，因为换算因数值有可选择性，所以在多个正值(例如63个正值)存放在位分配计算电路118的存贮器中。从任选值中选出超出谱数据绝对最大值或特定块MDCT系数的值。取被选出值中的最小值作为特定块的换算因数值。分配给选定换算因数值的数定义为特定单元块的换算因数信息，该换算因数信息包含编码数据。给可供选择的换算因数值中的正值分配6位数。正值增加2分贝。
当换算因数信息受加操作和减操作作控制时，重放声频数据的电平可调整到增加2分贝。例如，当归一化信息变换电路119输出的相同值被加或被所有单元块的换算因数信息相减时，所存单元块的电平可高整2分贝。加／减操作后产生的换算因数信息限于所用格式规定的范围。
另一种情况，当归一化信息变换电路119输出不同值相加或和各单元块的换算因数信息相减时，则各单元块的电平可分别。调整其结果可用一个滤波否数来实现。更为实际是当该归一化信息变换电路119输出一对单元块数和被加或与该单元块换算因数信息相减的一个值时，单元块和被加或与该单元块换算因数信息相减的值是相关的。
通过上述方式改变换算因数信息，参照图10、11和12叙述所能实现的功能。此外，已知一种数字信号处理设备，它并不是用QMF和MDCT来完成谐频编码方法和编码方法。例如用一种编码方法完成利用归一化信息和位分配信息的是化操作(例如，对应于次谐频编码方法用滤波器组)时，则能完成为改变归一化信息的编辑过程。
接下来，参照图9将叙述按照本发明的一种数字信号重放和／或记录设备的结构实例。被重放的编码数据从记录介质，诸如磁光盘上输到输入终端707，另外，从输入终端708给出编码过程中用到的块大小信息(即，等价于图1所示输出终端113、115和117的输出信号)。另外，通过例如一操作面板，输入一个用户命令后，归一化信息变换电路709产生编辑过程要用的一个参数(例如，是一个要与各单元块换算因数信息相加或相减的一个值)。
编码数据将由输入终端707给计算设备710。计算设备710还从归一化信息变换电路709接收数字数据。计算设备把归一化信息变换电路119提供的数字数据对应于被提供的编码数据的换算因数信息相加。当归一化信息变换电路709输出的数值为负值时，计算设备710操作成一个减设备。计算设备710的输出信号送到自适应位分配解码电路706和输出终端711。
该自适应位分配解码电路706参照自适应位分配信息，把分配位进行分解。自适应位分配解码电路704的输出信号提供反正交变换电路703、704和705，反正交变换电路703、704和705把频率基信号变换成时间基信号。反正交变换电路703的输出信号提供频带组合滤波器701，反正交变换电路704、705输出信号提供频带组合滤波器702。每个反正交变换电路703、704和705可包括反修正DCT变换电路(IMDCT)。
频带组合滤波器702把所提供的信号进行组合并将结果提供给频带组合滤波器701，频带组合滤波器701将所提供的信号进行组合，并将组合结果提供给终端700。用这样的方式，反正交变换电路703、704和705输出的各分立次谐频时间基信号被解码成全频带的一个信号。每个频带组合滤波器701和702可以包括例如IQMF(反正交镜面滤波面)。将全频带的解码信号提供给一生成从输出终端700输出重放声的结构配置，它包括数字／模拟转换器，扬声器等(未列出)。
通过计算设备710的加操作或减操作来操作换算因数信息，能实现重放数据的电平调整。例如，每次2分贝。当归一化信息变换电路709输出相同值并将此值和各单元块的换算因数信息相加或相减。从而各单元块电平可调整2分贝。在此过程中，作为加／减操作结果的换算因数信息限于所用格式规定的换算因数值的范围。
另一种情况，当归一化信息变换电路709对各单元块输出不同值时，将此不同值和各单元块的换算因数信息相加或相减，则可实现各单元块的电平调整。其结果榀实现滤波器功能。事实上，归一化信息变换电路709输出对应各单元块的一组数和可相加或相减的一个值。这样，各单元块可以与被换算因数信息相加或相减的值相关。
接下来要详细叙述通过改变换算因数信息完成的编辑过程。图10是表明因归一化过程影响自适应位分配编码电路706输出的编码数据，块浮置过程的实例。在图10中假设准备了0到9的10个归一化电平。单个单元块中最大谱数据或对应较大于MDCT系数的最小归一化电平的归一化电平数看作当前单元块的换算因数信息。这样，在图10中对应块号的换算因数信息是5，而对应块号1的换算因数信息是7。同样可指定各块的换算因数信息。参照图3的描述把换算因数信息写入编码数据。通常，对应归一化信息，数据是解码的。
图11是如图10所示换算因数信息操作的实例。当归一化信息变换电路119对所存块输出“-1”，而且计算设备120、121和122把这个“-1”加到如图10所示换算因数信息，这样换算因数信息变或比原始值小“1”的值。此过程中，谱数据或各块的MDCT系数被解码成比原始值小2分贝的值。换句话说，实现了电平调整，使信号电平降低了如2分贝。
图12表示由归一化信息变换电路709为编码数据中包含的换算因数信息完成的另一实例过程。如图10所示，当归一化信息变换电路119对块号3输出值“-6”而对块号4输出值“-4”，然后将这些值分别与第3块和第4块的换算因数信息相加，这样，第3块和第4块的换算因素信息都变成“0”，如图12所示。其结果就完成9滤波过程。在图12所示例中，给换算因数值加负值(或减正值)使它们变成“0”。另一种方法是将所需块的换算因数值可以强制设置为“0”。
在图10到图12的实例中，单元块的数目为5(从单元块0到单元块4)，归一化任选的数目为10(可选0到9)。但是，按实际记录介质如MD(迷你磁盘)，磁光盘的格式，单元块的数目为52(从单元块0到单元块51)，可选的归一化数目为64(从中到63)。在此范围内最好指定改变换算因数信息等用的单元块和参数，就能更精确完成电平调整过程，滤波过程等。
如果在图9中加入记录系统结构，则录在记录介质上的数据可以按照编辑结果重写。记录介质，诸如盘状记录介质(如磁光盘或磁盘)，带状记录介质(如磁带或光带)或半导体存贮器(如IC存贮器，存贮条或存贮卡)。当编辑结果通过输出终端711输出，如图9所示，并写入记录介质时，也可以用这样一个简单结构把换算因数信息写入记录介质。这样，参照重放结果(即，听听重放声音)，用户或相当用户就能完成编辑过程，使记录系统按编辑结果重写被录在介质上的数据。因此，编辑过程的结果因改变了归一化信息或类似信息就可以存放了。另外，可提供录有编辑过程结果的记录介质。
作为编辑过程的结果，因改变了参照图10到12叙述的换算因数信息，就可以实现各种功能诸如重放电平调整功能，渐强功能，渐弱功能滤波功能和颤动功能。但是要完成的电平调整至多对应增加或减小归一化信息的一个值(如2分贝)换句话说，所能完成的电平调整精度不能小于2分贝。同样，按时间顺序，用相应所用格式的编码数据格式完成电平调整。(如，精度上最多是一帧或类似一帧)。
为了按照本发明解决这些问题，暂时将编码数据解码成PCM采样。此后用所要方式编辑PCM采样。再次把PCM采样编辑。其结果得到编码数据。但是每帧编码数据包含与邻近帧的重迭，需要考虑到重迭部分的过程。下面会讲到这些过程。如上所述，每帧包括1024个PCM采样。用MDCT的103、104和105完成的过程中相继处理的每帧有重迭的采样部分。当帧N中处理第n个到第n+1535个采样。第N+2帧中处理的1024个采样是第n+1024个到n+2047个采样。
但是，在第1帧中，假设在采样序列开始之前，有512个零数据的PCM采样组成一个虚拟帧。因此要处理的第1帧与虚拟帧重迭。同样，在最后一帧中假设在采样序列的末端后面还有512个零数据的PCM采样组成一虚拟帧。这样最后一帧也和虚拟帧重迭。在这样的过程中，实际处理的采样数目是512。
如上所述，通过改变换算因数信息，可以完成每帧的编码过程。但是，在每帧的MDCT过程中，显然要考虑到重迭部分。这一点将参照图13来叙述。图13中PCM采样表示成一组按时间顺序排列的点。当对第N帧和第N+1帧改变换掳因数信息进行编码过程时，则实现对第n+512个到第n+1023个PCM采样的电平调整功能或类似编辑过程。但是，因为第n个到第n+511wh PCM采样和第n+1024个到第n+1535个PCM采样与沿编辑的相邻帧相重迭，所以对这些PCM采样并没完成编辑过程。
此外，至多对应增加或减小归一化信息的一个值(如2分贝)来完成电平调整。再有，滤波功能或类似功能也只限于一帧的单元块数，且对应各单元块的频率划分宽度。换句话说，编辑过程受到所用编码方法和编码数据格式的限制。
图14表示暂时解码的编码数据的结构实例。它包括完成解码PCM采样的编辑过程，且把已编辑过的PCM采样再按照本发明进行编码。通过终端801，把编辑数据提供给解码电路802。该解码电路802部分将提供的编码数据解码并产生PCM采样。解码电路802按照用户或相当用户从一操作面板发出的命令，部分对编码数据解码换句话说，用户可以指定要解码电路802进行解码的部分编码数据。解码电路802产生PCM采样并将它们提供给存贮器803。存贮器803暂存这些PCM采样。
数据修正电路804完成多路修正过程之一如对存在存贮器803中PCM采样进行的编辑过程。该修正过程的实例是混响过程，回声过程，滤波过程，压缩过程和量化过程。数据修正电路804为延迟补偿电路805提供修正的PCM采样。该延迟补偿电路805对修正的PCM采样完成延迟补偿过程，补偿过的PCM采样暂时存放在存贮器806，编码电路807给输出终端输出产生的编码数据。这样，已被编辑过的编码数据通过输出终端记录在记录介质上。
接下来将详细叙述延迟补偿电路805的过程。延迟补偿过程是一种位相调整过程，用来补偿编码电路807的输出数据相对从终端801输入的编码数据，因解码电路802和编码电路807的操作时间周期所造成的时间滞后。这样，延迟补偿电路805保证从编码电路807输出帧和从终端801输入帧之间的时间顺序关系。延迟量与分频滤波或合频滤波(如组数目，滤波器的输入时序，零数据PCM采样的数目以及MDCT过程中用的缓冲窗)的结构有关。
例如，图1所示分频滤波器101和102各所包含的组数目是48，同样图9中每个合频滤波器702和701包含的组数目也是48。当与第1帧相重迭的虚拟帧512个零数据PCM采样时，因编码过程和解码过程造成的延迟量变成653个PCM采样。延迟补偿电路805可以安排在解码电路802的输出以及编码电路807的输出之间的任何位置。延迟补偿电路805可以有一个缓冲存贮器或类似设备用于补偿延迟量。另一种情况，延迟补偿电路805可以是一个时序控制电路，回来控制存贮器803和806，以至于仅在考虑延迟量的时刻才能被存取。
图14中表明的解码电路802具有图9所示的结构。另一方面，图14所示的编码电路807有图1所示的结构。图14所示结构部分暂时解码编码数据，完成解码PCM采样的编辑过程，编码编码过的PCM采样并把生成的编码数据写入记录介质。除磁光盘以外，举例的记录介质可以有盘状记录(如磁盘)、带状记录介质(如磁带或光带)或半导体存贮器(如IC存贮器，存贮条或存贮卡)。
接着，参照图16将详细叙述通过输出终端801提供的编码数据和通过输出终端808输出的编码数据之间的时间顺序关系。在图16中，表示的帧N-1，N，N+1帧N+2和帧N+3代表由输入终端801输入的编码数据的帧。从这些帧解码出的PCM采样用一组按时间顺序方向排列的点标出。被解码的PCM采样的时间顺序关系并不会改变，即使编辑了如图12所示的信号振幅值。但是，为了保持编码电路807产生的编码数据帧和未经编辑的编码数据帧之间的时间顺序关系，应该对653点补偿延迟。
当用帧M-1表示经延迟补偿过的编码PCM采样的第一帧。该帧M-1中最后512个PCM采样是起始位置经653个采样延迟后的512个编码PCM采样。在此，因为该帧M-1是第一个编码帧，它的前512个采样应该是零数据PCM采样。然后帧M+1，M+2和M+3相继编码，并通过输出终端808输出。在这种情况下，帧M-1对应帧N-1；帧M对应帧N；帧M+1对应帧N+1，帧M+2对应帧N+2，和帧M+3对应帧N+3。
在这种关系中，为产生如帧M的PCM采样，必须将帧N-1和帧M+1都进行解码。换句话说，为了编辑所需的帧并对它编码，至少需要当前帧的前一帧和后一帧。
但是，对从输出终端808输出的帧M-1，帧M和帧M+1，应该考虑重迭关系。换句话说，要编辑图16中的部分e。如果编辑帧N，然后用帧M替代，由于跟帧M+1有重迭部分，不能得到所要的编辑结果。在这种情况下，为了得到所要的编辑结果，必须编辑帧N+1，然后用帧M+1替代该结果。在这种情况下，如上所述，必须解码帧N到帧N+3。
换句话说，为了编辑部分e和得到所要结果，必须提取帧N-1到帧N+3，并进行解码。这样，产生PCM采样并进行了编辑。其结果，得到帧M和帧M+1，用来替代帧N和帧N+1。此外，通过考虑为得到所要编辑结果而产生的数据和为产生PCM采样而要解码的一帧间的时间顺序关系。能够编辑相当长时间周期的数据。再有，按照本发明的实施例，不考虑窗函数对正交变换的影响。但是，如果考虑了它，编辑过程能更好完成。
这一点将参照图15A、15B和15C实用地进行叙述。
图15A表明记录在记录介质上的信号。在图15A中，F1、F2、F3、F4、F5和F6表示在记录介质上形成的帧。每个帧是一个数据记录单元。每帧包含一个可用信号波形代表的数字编码信号。
接下来将叙述图15A所示帧F3和F4完成的实施过程。帧F3和帧F4，完成实施过程后输入终端801，如图14所示。然后把帧F3和F4解码，并把解码后的帧送入存贮器803。存贮器803存贮解码帧。存在存贮器803中的帧F3和F4的数字化解码信号提供给数据变换电路804。数据变换电路804完成帧F3和F4的数字化解码信号的实施过程。解码过程和实施过程的结果造成延迟D2，如图15B所示。换句话说，如上所述，帧F3作为第一帧，其前面必须要有含512个零数据的PCM采样的虚拟帧帧F3被处理成与虚拟帧重迭。当用帧DF3和帧DF4分别表示处理过的帧F3和帧F4时，可以用具有延迟D2的部分波形代表。换句话说，帧DF3和帧DF4是作为信号波形的一部分来生成的，只是在信号波形开始之前填充了一个零数据信号，如图15A所示。
当带有延迟D1的信号用编码电路807编码时，和解码情况一样，会发生延迟D2，作为一部分信号，延迟D1和延迟D2加入图15A所示信号波形，于是产生帧DDF3和帧DDF4。换句话说，帧DDF3和帧DDF4是信号波形的一部分，从记录介质的帧1开始按延迟D1和延迟D2的周期填充零数据信号。
当把帧DDF3和帧DDF4重写入记录介质上对应帧DDF3和帧DDF4的时间信息的位置时，如果延迟补偿电路805没有完成对帧DDF3和帧DDF4的延迟补偿过程，则帧DDF3复写到记录介质上帧F5和帧F6的位置。另一方面，帧DDF4复写到记录介质上帧F6和帧F7的位置。
这样，帧F1、F2、F3和F4，帧F5的一部分，经有效处理过的帧DDF3和帧DDF4，和部分帧F7都被记录在记录介质上。其结果信号的连续性丢失了。
为解决这个问题，生成帧DDF3和帧DDF4的时间信息按延迟量D1和D2的总时间周期进行偏移。这样，帧DDF3和帧DDF4可分别重写到记录介质上帧F3和帧F4的位置。其结果，可提供包含经有效处理过的帧的记录介质。
接着，参照图17A、17B和17C将叙述把记录介质上记录的部分编码PCM数据解码，编辑后重写回记录介质的情况。
图17A表明输入PCM数据用窗口滤波并按帧编码的情况。本例中，各个窗口的大小和每个帧大小相同。本例中每个窗口大小为1024个采样。
例如，输入PCM数据的帧N，用三个窗口W2、W3和W4进行滤波，然后组合。
当图17A中所示部分A的PCM数据进行编码时，部分A是和帧N-2及帧N-1起产生的。此外，要用经窗口W1和W2滤波过的PCM数据。
因为部分A是PCM数据的开始部分，它只和帧N的一边相邻，所以只有一个邻近帧。因此，在对应窗口W1前一半的帧里要加空数据。其结果，部分A的两个相邻帧中的一个是空帧。
当对图17A所示PCM数据进行编码时，则把帧N-1，N，N+1，N+2，…，和N+5都记录在记录介质上。但是，空帧不要录入记录介质。这样，只把包含输入PCM数据的最少数量的帧录入记录介质，换句话说，编码过程所需要的帧是不录入记录介质的。
接下来，参照图17B将叙述部分经编码并录入如图17A所示记录介质的PCM数据的情况。
本例中，经编码并录入如图17A所示记录介质的PCM数据的如图17B所示部分EDIT被编辑。在这种情况下，应该对帧N，N+1，N+2和N+3进行解码。在图17B所示例中，便于理解，对帧N+也进行了解码。
当这五帧解码时，第一帧N-1和最后一帧N+3都只有一个相邻帧，不能解码。因此为了对N-1和帧N+3进行解码，把另一个相邻帧空帧。对解码后的PCM数据进行编码。如上所述，帧N-1的起始位置因空帧位相延迟产生时间逻辑编离，滤波器组的数目要按653帧。
当对解码后PCM数据的部分EDIT进行编辑时，显然对应记录介质上录入数据的波形不同被编辑部分的波形。
为什么帧N+3的后一半波形不同于记录介质上录入数据的波形的理由是当帧N+3的后一半被解码时，是用空帧替代帧N+4的前一半。
另一方面，因为帧N-1是用空帧编码，当帧N-1解码时，用空帧解码的PCM数据波形与输入PCM信号的波形相同。
有必要把编辑过程的PCM信号重写入记录介质上相关帧的位置。
由此，当PCM信号用如图17A所示相同窗口进行编码时(即窗口W1、W2、W3，等等)，在解码过程中，这些窗口通过延迟产生偏离。
为解决此问题，当信号用如图17B所新窗口W11、W12，W13，…和W16进行滤波时，能得到与如图17A所示相同时间顺序关系的信号。
因此，可以说如图17B所示窗口W11对应于如图17A所示窗口W1；图17B所示窗口W12对应图17A所示窗口W2；以及图17B所示窗口W13对应图17A所示窗口W3。
其结果，当利用窗口把滤波器按如图17C所示延迟补偿量进行移动时，可以把已编码的帧N，N+1和N+2重写入记录介质上的对应帧位置。
按照本发明的第一实施例和第二实施例，用组合MDCT，对相应高效编码方法，编码数据的多次谐频，完成了考虑人所觉特性的分频，多次谐频的位分配，归一化过程和是化过程。另一种选样，将本发明用于另一种编码方法，如对应于MPEG声频标准的编码数据格式。图18表示对应MPEG声频标准的编码数据格式。
标题由32位(固定长度)组成。标题包含同步字、ID、层、保护位、位速率索引，采样频率、填充位、专用位、模式，版权保护状态码、原始／复制表示码、和增强等诸如此类的信息，标题后面跟的是可任选的出错检验数据。接着是声频数据。因为声频数据包含环形分配信息和换算因数信息，以及本发明为这种格式采用的采样数据。
相应于该编码方法，可不用换算因数信息而用归一化信息。在这种情况下，能采用本发明。
按照本发明，对应一个例如数字声频信号临时形成的编码数据能部分地解码、编辑然后再次编码。这样，因电平调整宽度，滤波函数和时间顺序处理造成的约束在编辑过程中能得到抑制。因此能更好地进行编辑。
参照实现图例，叙述完了本发明的特殊实施例，可以明了本发明并不局限于这种精确的实施例，这方面是专业人员只要不违背本发明附加的权利要求，可以施加多种改变和修正。
权利要求
1．一种处理输入数字信号的数字信号处理设备，该输入数字信号已经分段成块，每一块有预定的数据量，并随同邻近块一起经高效编码，其特征在于包含把高效编码数字信号随同邻近块一起进行解码的解码装置；修正解码数字信号的修正处理装置；把修正后的数字信号随同邻近块一起进行高效编码的编码装置；以及对用所述解码方法解码的信号补偿延迟的延迟补偿装置。
2．如权利要求1所述的数字信号处理设备，其特征在于所述编码装置包含把所述输入数字信号分成多个频带分量的分频装置；分块和编码装置，用于把以多个频带分量排列的一序列样本按照时间顺序方向和／或频率方向分成块并进行编码；归一化经所述编码方法编码过的每块并产生归一化信息的归一化处理装置；计算能代表所述信号分量各块特征的量化系数的量化系数计算装置；位分配装置，用于决定由所述量化系数计算装置得到的所述量化系数的每块位分配量的；以及编码数据产生装置，用于重新量化对应由所述归一化处理装置和按所述位分配装置获得的所述位分配量产生的所述归一化信息的每块并接预定格式产生编码数据。
3．如权利要求1所述的信号处理设备，其特征在于所述解码装置是按各块的信息压缩参数对所述数字信号进行解码。
4．如权利要求1所述的信号处理设备，其特征在于允许所述用户指定要进行编码的高效编码信号。
5．如权利要求1所述的信号处理设备，其特征在于从一种记录介质中读出已经高效编码的输入信号。
6．如权利要求5所述数字信号处理设备，其特征在于对用所述编码方法高效编码信号按所述延迟补偿装置补偿延迟，然后把所述已补偿信号写入所述记录介质，使所述已补偿信号的所述位相与从所述记录介质读出的所述数字信号的所述位相匹配。
7．一种用于处理按预定数据量分块并随同邻近块一起高效编码的输入数字信号的数字信号处理方法，其特征在于包括下列步骤(a)把高效已编码信号随同邻近块一起解码；(b)修正所述解码信号；以及(c)对已改变的所述数字信号随同邻近块一起进行高效编码，并对按所述(a)步骤解码的解码信号补偿-延迟。
8．如权利要求7所述的数字信号处理方法，其特征在于步骤(a)包含下列步骤(d)把所述输入数字信号分成多个频带分量，(e)按照时间顺序方向和／或频率方向，把以多个频率分量排列的一序列采样分段成块，并对所述块进行编码；(f)对用所述编码方法编码过的每块归一化并产生归一化信息；(g)计算代表所述信号分量各块所述特征的量化系数；(h)按照步骤(g)算得的量化系数，决定各块所述位分配量；以及(i)按照步骤(f)产生的归一化信息和步骤(h)得到的所述位分配量，重新量化各块，并产生对应一种预定格式的编码数据。
9．如权利要求7所述的数字信号处理方法，其特征在于步骤(a)是通过对应各块的所述信息压缩参数将所述数字信号解码来完成的。
10．如权利要求7所述的数字信号处理方法，其特征在于还包括下列步骤(j)允许所述用户指定要编辑的高效已编码数字信号。
11．如权利要求7所述数字信号处理方法，其特征在于已高效编码的输入信号读自一记录介质。
12．如权利要求11所述的数字信号处理方法，其特征在于按步骤(a)高效编码的所述数字信号在步骤(c)补偿-延迟，然后将所述已补偿信号写入所述记录介质，使所述已补偿信号的所述位相和读自所述记录介质的所述数字信号的所述位相匹配。
全文摘要
将一数字信号进行解码、编辑,然后再高效编码。该信号的输入数据已经按预定数据量分段成块,各块并随同邻近块一起进行编码。对这种信号处理过程中产生的延迟进行补偿。这样能对数字信号中经高效编码过的一部分数字信号进行编辑。
文档编号G10L21/02GK1291766SQ00126979
公开日2001年4月18日申请日期2000年9月1日优先权日1999年9月1日
发明者小谷田智弘申请人:索尼株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：小谷田智弘
技术所有人：索尼株式会社
我是此专利的发明人

上一篇：更新歌曲的方法和装置及支持管理系统中歌曲更新的方法
上一篇：改变声音声调及减少其噪声的装置的制作方法