专利名称:设置检测编码图像数据运动向量的搜索范围的方法和装置的制作方法
技术领域:
本发明涉及一种用于运动补偿视频图像数据,对该运动补偿图像数据编码并记录这种编码视频图像数据的技术。
一个高效编码系统可以按照一个运动图像成像编码专家组(MPEG)标准。这个MPEG系统来自一个按ITU-T(国际电信联合电信标准部)的规定H.261在px64k比特/秒时用于视听服务的视频码的一个国际标准惯例。MPEG系统有一个存储媒体,例如一个CD-ROM或其它,并可利用用于帧间预测的运动补偿预测,可利用离散余弦转换(DCT)作为正交转换。
图8说明了一个利用了上述MPEG系统的图像编码设备200。如图所示,这个图像编码设备200包括一个减法电路201,一个DCT电路202,一个量化电路203,一个变长编码电路204,一个逆量化电路205,一个逆DCT电路206,一个加法电路207,帧存储器208和帧存储器210,一个运动补偿电路209,以及一个运动向量检测电路211。
来自一个当前标准帧的可代表具有预定大小(如16×16像素块)的像素块的视频信号可提供给图像编码设备200的一个输入端。这种视频信号从此处作为参考帧数据被提供给帧存储器210、运动向量检测电路211和减法电路201的一个输入端。
帧存储器210存储从输入端接收的参考帧数据。运动向量检测电路211通过读出以前存储在帧存储器210中的帧数据,利用这种读出的帧数据作为一个所谓的搜索帧,并确定/检测接收到的参考帧的每个块对应于搜索帧的哪个块或块的位置,来检测或确定运动向量。在这种运动向量检测处理过程中,可利用一个具有预置大小的运动向量检测或搜索范围。通过运动向量检测电路211获得的运动向量被提供给运动补偿电路209和变长编码电路204。
除了来自输入端的参考帧数据以外,减法电路201还从运动补偿电路209接受运动补偿帧数据。减法电路201减去该接收数据以获得参考帧数据与运动补偿帧数据之间的差。这个差数据被提供给DCT电路202,在其中执行离散余弦转换处理过程。来自DCT电路202的一个输出信号被提供给量化电路203,在其中接收数据以一个预定方式被量化。来自量化电路203的量化数据被提供给变长编码电路204,同时,来自运动向量检测电路211的运动向量也被提供给变长编码电路204。如前所述。变长编码电路204以变长码对接收到的信号编码并将编码后的数据提供给一个输出端。
来自量化电路203的量化数据还被提供给逆量化电路205,其中的基本过程与量化电路203所执行的相反。逆量化电路205的一个输出被提供给逆DCT电路206,其中的基本过程与DCT电路202所执行的相反,以获得当前的帧数据。这种当前帧数据被提供给加法电路207的一个输入端并且来自运动补偿电路209的运动补偿帧数据被提供给加法电路的另一个输入端。加法电路207将接收到的信号相加,并将其提供给帧存储器208,使该输出信号存储于其中。
运动补偿电路209接收被运动向量检测电路211检测到的运动向量并从帧存储器208读以前存储的帧数据。运动补偿电路209根据接收数据执行运动补偿处理过程以形成提供给减法电路201和加法电路207的运动补偿帧数据。
关于变长编码电路204所执行的处理或编码过程,变长编码电路204所用的码表中的变长码的长度可以随着运动向量检测电路211所用的搜索范围的大小而变化。例如,在变长码表中码的长度或大小可以随着搜索范围的增大而增加。其结果是,如果利用具有一个恒定大小的搜索范围来执行运动向量检测过程,分配给一个运动向量的码长则可能大于所需的码长,例如在处理一个具有相对小的运动的运动图像的情况下。因此,这种处理或编码过程可能产生了大量不需要的信息。
而且,如果搜索范围大于所需或实际的运动,一个与大于实际运动的运动相对应的运动向量将被错误地检测。此时,分配给错误的大运动向量的码长大于正确的运动向量的码长,其结果是,对这个错误的运动向量编码所产生的信息量增加了。
此外,对参考帧数据与运动补偿先前帧数据之间的差值进行变长编码可导致运动向量的分布不光滑。其结果是,对运动向量编码所产生的信息量可能增加。
本发明的一个目的是提供一种用于编码图像数据和/或用于记录编码的图像数据的技术,其中在涉及一个运动向量的编码过程中所产生的信息量相对较小。
本发明的另一个目的是提供一种前述技术,其特征在于可从编码图像数据获得相对高质量的再现图像。
依据本发明的一个方面,提供了一种图像编码方法,用于通过利用一个先前帧的视频信号检测一个代表一帧的输入视频信号的运动向量,根据检测到的运动向量对先前帧的视频信号进行运动补偿并对运动补偿的视频信号进行编码。该方法包括以下步骤检测一帧输入视频信号的运动向量的分布范围;根据检测到的分布范围预测运动向量的搜索范围并设置该搜索范围;以及在设置的搜索范围内检测输入视频信号的运动向量。
依据本发明的另一个方面,提供了一种图像编码装置,它含有一个运动向量检测设备,用于通过利用一个先前帧的视频信号检测一个代表一帧的输入视频信号的运动向量,基于由运动向量检测设备获得的检测到的运动向量对先前帧的视频信号进行运动补偿并对运动补偿的视频信号进行编码。该装置包括一个分布检测设备,用于检测从运动向量检测设备得到的运动向量的分布范围;以及一个控制设备,用于根据分布检测设备检测到的运动向量分布范围控制运动向量检测设备检测到的运动向量的搜索范围。该控制装置在运动向量检测设备中预测视频信号运动向量的搜索范围并在运动向量检测设备中设置该运动向量的搜索范围。运动向量检测设备在控制设备设置的搜索范围内检测输入视频信号的运动向量。
依据本发明的另一个方面,提供了一种用于将编码视频数据记录在一个记录媒体上的记录装置,其中通过利用一个先前帧的视频信号检测一个代表一帧的输入视频信号的运动向量,基于检测到的运动向量运动补偿先前帧的视频信号并进行编码,以形成编码的视频数据。该装置包括一个运动向量检测设备,用于检测运动向量;一个分布检测设备,用于检测从运动向量检测设备得到的运动向量的分布范围;以及一个控制设备,用于根据分布检测设备检测到的运动向量分布范围控制运动向量检测设备检测到的运动向量的搜索范围。该控制装置预测运动向量检测设备中视频信号运动向量的搜索范围并设置运动向量检测设备的运动向量的搜索范围。运动向量检测设备在控制设备设置的搜索范围内检测输入视频信号的运动向量。
从下面的详细说明中,本发明的其他目的,特征和优点是显而易见的。在下面的附图中,相同的部件具有相同的标号。
图1是依据本发明实施例的一个图像编码装置示意图;图2A和2B是解释图1图像编码装置操作的参考图;图3是解释图1图像编码装置所执行的运动向量检测操作的参考流程图;图4是解释图1图像编码装置所执行的搜索范围设置操作的参考流程图;图5A,5B和5C是解释图1图像编码装置操作的参考图;图6是解释图1图像编码装置操作的参考图;图7是根据本发明的另一个实施例,用于将编码图像数据记录到一个盘媒体上的装置示意图;以及图8是解释本发明背景技术中的图像编码装置的参考图。
下面将参照附图详细描述本发明的最佳实施例。
图1说明了一个图像编码设备100。这个图像编码设备100一般包括一个减法电路1,一个DCT电路2,一个量化电路3,一个变长编码电路4,一个逆量化电路5,一个逆DCT电路6,一个加法电路7,帧存储器8和10,一个运动补偿电路9,一个运动向量检测电路11,以及一个运动向量分布判断电路12,其连接关系如图1所示。
减法电路1被用于从一个输入端接收一个视频数据信号,从运动补偿电路9接收一个运动补偿信号,并将这两个信号相减以获得一个提供给DCT电路2的差数据信号。DCT电路2根据接收到的数据执行预定的DCT处理,例如16×16像素二维DCT处理,以将数据从一个时间域或空间轴转换成一个频率域或轴并产生DCT系数。这些DCT系数被提供给用于以一个预定量化级量化接收系数并将量化后的数据提供给变长编码电路4的量化电路3。变长编码电路4也可以从运动向量检测电路11接收一个输出信号。这个编码电路用于给接收数据赋予变长码并将编码后的数据提供给一个输出端。
来自量化电路3的量化数据还被提供给逆量化电路5,其执行过程基本上与量化电路3所执行的相反。逆量化电路5的一个输出被提供给逆DCT电路6,其中的执行过程基本上与DCT电路2所执行的相反。逆DCT电路6的一个输出和来自运动补偿电路9的运动补偿信号被提供给加法电路7,其中所接收的信号相加并提供给帧存储器8以便于存储在其中。帧存储器8具有预定存储容量,可使相应于两帧或更多帧的数据存储于其中。运动补偿电路从运动向量检测电路11接收一个输出或一个运动向量,从帧存储器8接收存储数据,并依据接收数据执行运动补偿过程以形成提供给减法电路1和加法电路7的运动补偿信号如前所述。
在输入端接收到的视频数据信号还被提供给运动向量检测电路11和帧存储器10以便于存在其中。与帧存储器8相似的帧存储器10具有存储两帧或多帧数据的存储能力。运动向量检测电路11包括一个运动向量搜索范围控制电路111。
如下面更详细描述的,运动向量检测电路11可从帧存储器10接收存储数据,从一个输入端接收视频数据,并检测所接收数据信号的一个或多个运动向量,并将这些运动向量提供给运动向量分布判断电路12。运动向量分布判断电路12适用于确定接收到的运动向量的分布范围并向运动向量搜索范围控制电路111提供一个表示这个分布范围的输出信号。根据接收到的分布范围信号,运动向量搜索范围控制电路111设置一个用于运动向量检测的搜索范围并控制运动向量检测电路11以便于在该搜索范围内执行运动向量检测操作。
图像编码设备100可使用一种预定的编码技术,例如所谓的MPEG2系统。MPEG2可使用多个特征或可被应用于多种不适于上述MPEG系统的情况,从而MPEG2系统被认为是MPEG系统的改进系统。例如,MPEG2系统不仅可应用于存储媒体,而且可应用于通信或广播媒体,MPEG2系统可应用于一个具有较高的图像质量的电视系统,例如HDTV(高清晰度电视),MPEG2系统可应用于非交叉和交叉图像,MPEG2系统可显示分辨率(RESOLUTION),并在MPEG2系统中,帧和/或场(FIELD)可被赋予一个图像。而且,一个MPEG2解码器可对MPEG位流解码,从而提供了低序(LOWER-ORDER)兼容能力。
在MPEG2系统中,视频或图像数据可被处理或压缩在一个预定的基上,例如一个帧基。在这样的系统中,可有三类处理过程或帧(图像),即一个内部编码(I)帧(图像),一个内部帧预测编码(P)帧(图像)和一个双向预测编码(B)帧(图像)。通过只使用相关帧或图像中的数据产生一个I帧。通过使用来自一个临时先前并已被预先解码的I或P图像或帧的数据,可产生一个P帧。通过使用来自一个临时先前或后继并已被解码的I或P图像或帧或是其组合的数据,可产生一个B帧。这些帧或图像可按第一顺序处理或编码,并被重组以便于按第二顺序显示。例如,这些帧或图像可按I,B1,B2,P等的顺序显示,并且这些帧或图像按I,P,B1,B2等的顺序处理,这些顺序上的差别是所执行的处理过程的类型引起的。例如,由于一个B帧是基于一个后继的I或P帧,所以这个I或P帧在相应的B帧之前被处理。
此外,利用了MPEG2系统从图像编码设备100可提供相应于三帧的一个I帧和一个P帧之间的距离。例如,如图2A所示,在这个I帧和P帧之间的距离可具有一个B1帧和B2帧。
下面说明图像编码设备100的操作。
图像信号被提供给图像编码设备100,在其上按编码顺序执行这些接收信号的处理或编码过程。即,接收到的图像信号的编码顺序可能是I(1),P(4),B1(2),B2(3),P(7),B1(5),B2(6),P(10),……(在此顺序中,括号中的数字表示显示帧数字)。因此,图像编码设备100首先对I(1)编码,然后对P(4)帧编码,然后是B1(2)帧等。下面将描述这个编码过程。
I(1)帧的数据通过图像编码设备100的输入端被提供给帧存储器10并存在其中。这个I(1)数据还被提供给减法电路1的一个输入端。由于不对I帧执行运动补偿,所以接收到的I(1)帧数据通过减法电路1到达DCT电路2。DCT电路2根据接收到的I(1)帧数据执行16×16像素二维DCT过程,将I(1)帧数据从时间域或空间轴转换到频率域或频率轴并产生DCT系数,这些DCT系数被提供给量化电路3。量化电路3以一个预定量化级量化接收的DCT系数以获得提供给变长编码电路4和逆量化电路5的量化后的数据。变长编码电路4给接收到的量化数据赋予变长码并将编码后的数据提供给一个输出端。逆量化电路5在一个与量化电路3相对应的量化级对从量化电路3接收到的量化数据进行逆量化以将数据恢复到供给逆DCT电路6的DCT系数。逆DCT电路6按照逆DCT处理该DCT系数以将其从频率域(频率轴)上的数据转换成时间域(空间轴)上的数据。来自逆DCT电路6的转换数据或当前的I(1)帧数据通过加法电路7被提供给帧存储器8并存在其中。
下面描述I(1)帧之后的P(4)帧的编码过程。
P(4)帧数据通过输入端被提供给帧存储器10并存在其中。如前所述由于帧存储器10中可以存储两帧数据,所以P(4)帧数据可与以前存储的I(1)帧数据一起存在帧存储器10中。来自输入端的P(4)帧数据还作为参考帧数据提供给运动向量检测电路11。运动向量检测电路11从帧存储器10中读存储的I(1)帧数据并将读出的数据用作一个搜索帧。即,运动向量检测电路11在一个预定的搜索范围内确定相应于参考帧数据的16×16像素参考块的I(1)帧数据块的位置,如下文更完整描述的。图2A说明了参考帧P(4)与搜索帧I(1)之间的关系。(箭头指示搜索帧I(1))。由运动向量检测电路11确定的块位置或运动向量被提供给运动补偿电路9,运动向量分布判断电路12和变长编码电路4。
根据从运动向量检测电路11接收到的运动向量,运动补偿电路9从帧存储器8中读出存储的I(1)帧数据并对I(1)帧执行运动补偿。即,运动补偿电路9可从被从运动向量检测电路11接收的运动向量指定或与之相应的所存储的I(1)数据中读出块数据,并对这个数据进行运动补偿。运动补偿电路所产生的运动补偿块数据被提供给减法电路1,减法电路1确定参考帧(P(4))的数据和运动补偿的I(1)帧之间的差值。这个差值或相应/匹配于余数的内部块被提供给DCT电路2和按相似于前面所述的方式处理接收数据的量化电路3。
量化电路3的一个输出,即,经DCT处理并量化的余数被逆量化电路5和逆DCT电路6解码。这个解码后的余数和来自运动补偿电路9的I(1)帧数据的运动补偿数据可被同时提供给加法电路7,在其中这些接收数据被相加或组合以将该数据恢复为存在帧存储器10中的当前P(4)帧数据。
量化电路3的输出还被提供给变长编码电路4。如下文更完整描述的,变长编码电路4给来自量化电路3的余数和来自运动向量检测电路11的运动向量赋予变长码,并将产生的编码数据提供给输出端。
变长编码电路4按照来自运动向量检测电路11的差值或运动向量分配变长码(或将接收数据转换为码)。下列表1说明了变长码作为运动码函数的实例。
表1
从表1可以看到,分配给运动向量或差值的变长码的长度随着它的值而变化。即,运动向量(运动码)的值越小,码的长度越短。
而且,在表1中,运动向量值的搜索范围是-16到+16。但是,如果为了超出从-16到+16的范围而设置了运动向量值搜索范围,则分配给运动向量值的码的长度会增加。其结果是,如果错误地将搜索范围设置为大于所需的或大于运动向量的可能值,则与使用正常大小的搜索范围相比,编码的运动向量的信息量将会增加。
上述搜索范围可由运动向量搜索范围控制电路111初始设置。此后,可利用运动向量检测电路11,运动向量搜索范围控制电路111和运动向量分布判断电路12来确定和设置搜索范围。即,运动向量分布判断电路12确定由运动向量检测电路11得到的运动向量值的分布范围。根据这个确定的分布范围,运动向量搜索范围控制电路111设置一个用于运动向量检测电路11的运动向量检测的搜索范围并在该搜索范围内控制其以检测一个运动向量。
下面参照图3说明运动向量检测过程。
开始,在步骤S31,运动向量搜索范围控制电路111设置一个搜索范围的初始值,并控制运动向量检测电路11以便在初始值搜索范围内进行第一帧的运动向量检测。同样,在对P(4)帧编码的过程中在初始值搜索范围内进行运动向量检测。
在步骤S32,运动向量检测电路11在运动向量搜索范围控制电路111的控制下,在设置的搜索范围内检测运动向量。此后,过程进行到S33,其中运动向量分布判断电路12确定运动向量检测电路11获得的运动向量的分布范围。根据这个确定的分布范围,运动向量搜索范围控制电路111设置用于在步骤S34检测下一个运动向量的搜索范围。然后,过程转回步骤S32。
图3显示了运动向量搜索范围的设置操作,下面将参照图4来更全面描述该操作。在图4中,步骤S41和S42-S45分别对应于图3中的步骤S33和S34。
在步骤S41,运动向量分布判断电路12确定运动向量检测电路11获得的运动向量的分布范围。特别是,运动向量分布判断电路12确定该运动向量水平方向上的一个最大值Sx(Sx(max))和一个最小值-Sx(Sx(min))以及该运动向量垂直方向上的一个最大值Sy(Sy(max))和一个最小值-Sy(Sy(nin)),如图2B所示。
然后进行到步骤S42,其中运动向量搜索范围控制电路111确定由下列表达式1-4得到的绝对值是否大于一个门限值Ts。
Sx(max)×α…(1)Sx(min)×α…(2)
Sy(max)×α…(3)Sy(min)×α…(4)在表达式1-4中,Sx(max),Sx(min),Sy(max),Sy(min)表示上述由运动向量分布判断电路12获得的值,α表示一个所谓的帧距比,即,正在被确定的运动向量的检测搜索距离与确定当前运动向量分布时得到的帧距之比。如果表达式1-4得到的绝对值大于一个门限值Ts,则到步骤S43,其中运动向量搜索范围控制电路111将水平方向上的搜索范围设置成Sx(min)×α到Sx(max)×α,并将垂直方向上的搜索范围设置成Sy(min)×α到Sy(max)×α。
另一方面,如果步骤S42的判定结果是负的使得由表达式1-4得到的绝对值不大于门限值Ts,则到步骤S44和S45,其中运动向量搜索范围控制电路111将设置一个不同于步骤S43的搜索范围。特别是,在步骤S44,满足下面等式5-8的m,n的最小值被确定。=<2m…(5)[ABS(Sx(max)的最大值×α]=<2m…(6)[ABS(Sy(min)的最大值×α]=<2n…(7)[ABS(Sy(max)的最大值×α]=<2n…(8)在步骤S45,水平方向和垂直方向上的搜索范围分别被设置成-2m到+2m和-2n到+2n。
因此,如上所述,如果表达式1-4得到的绝对值大于门限值Ts,则水平方向上和垂直方向上的搜索范围不是被设置成-2m到+2m和-2n到+2n,而是被设置成一个较小的搜索范围,即,水平方向上被设置成Sx(min)×α到Sx(max)×α,垂直方向上被设置成Sy(mim)×α到Sy(max)×α。因此,一个余数值大于门限值Ts的运动向量不可能是固有运动并因此被估值取消。通过以这种方式阻止运动向量值的变化,运动向量的变化被平滑以降低余数的值。这可以降低或减少在运动向量的编码过程中产生的信息量。
在MPEG2系统中,指定上述搜索范围的数据f-code被同时传输以在解码的同时由变长码得到原始的运动向量。表2举例说明了搜索范围和数据f-code之间的关系。
表2
因此,P(4)帧如上所述被编码。顺序地,下面描述对B1(2)帧的编码。
B1(2)帧的数据通过图像编码设备100的输入端被提供给帧存储器10并存在其中,并且还作为参考帧数据被提供给运动向量检测电路11。运动向量检测电路11从帧存储器10中读出I(1)帧和P(4)帧的存储数据,并将这些数据作为运动向量检测的搜索帧。尤其是,如下面更完整描述的,在一个由运动向量搜索范围控制电路111控制下设置的搜索范围内,运动向量检测电路11在以B1(2)帧为参考的I(1)帧中检测运动向量,同时在以B1(2)帧为参考的P(4)帧中检测运动向量。
参考帧B1(2)与搜索帧I(1)和P(4)之间的关系或距离如图5A所示。由于B1(2)帧和I(1)帧之间的帧距为一帧,所以以B1(2)帧为参考的I(1)帧的运动向量搜索范围可以是以前所述的用于对P(4)帧编码的运动向量搜索范围的三分之一,如果该运动是光滑的。其结果是,运动向量搜索范围控制电路111控制运动向量检测电路11,使得如果对P(4)帧编码的运动向量搜索范围在水平方向上是-Sx到+Sx,垂直方向上是-Sy到+Sy,则当前的搜索范围被设置成水平方向上为-Sx/3到+Sx/3,垂直方向上为-Sy/3到+Sy/3,如图5B所示。从而,在此搜索范围内可以检测运动向量。另一方面,由于B1(2)帧和P(4)帧之间的帧距为两帧,如图5A所示,所以运动向量搜索范围控制电路111使得以B1(2)帧为参考的P(4)帧的运动向量搜索范围被设置成水平方向上为-2Sx/3到+2Sx/3,垂直方向上为-2Sy/3到+2Sy/3,如图5C所示,从而,在此搜索范围内可以检测运动向量。
对B1(2)帧编码的其余操作与前面所述的P(4)帧的编码操作基本相似,为简略起见,在此省略了对其的进一步描述。
完成了对B1(2)帧的编码之后,对B2(3)帧进行编码。其编码过程与前面所述的B1(2)帧的编码过程相似。但是,由于B2(3)帧与P(4)帧间的帧距为一帧,如图6所示,所以以B2(3)帧为参考的P(4)帧的运动向量搜索范围被设置成水平方向上为-Sx/3至+Sx/3,垂直方向上为-Sy/3到+Sy/3。此外,由于B2(3)帧和I(1)帧之间的帧距为两帧,所以以B2(3)帧为参考的I(1)帧的运动向量搜索范围被设置成水平方向上为-2Sx/3到+2Sx/3,垂直方向上为-2Sy/3到+2Sy/3。
通过如上所述设置运动向量搜索范围,在变长编码过程中将较短长度的码分配给检测到的运动向量。此外,可将较短长度的码分配给不同的数据并且对于那些用于对所得到的不同数据变长编码的相应块的运动向量之差来说,可以达到光滑的运动向量分布。其结果是,可减少编码过程中所产生的信息量。
可替换地,下面的过程可用于设置一个运动向量搜索范围。
以B1(2)帧为参考的I(1)帧的运动向量搜索范围被确定。假设这个搜索范围在水平方向上为-Sxa到+Sxa,垂直方向上是-Sya到+Sya。那么,由于B2(3)帧和I(1)帧之间的帧距为B1(2)帧和I(1)帧之间的帧距的两倍,所以以B2(3)帧为参考的I(1)帧的运动向量搜索范围是水平方向上为-2Sxa到+2Sxa,垂直方向上为-2Sya到+2Sya。同样,假设以B1(2)帧为参考的P(4)帧的运动向量搜索范围在水平方向上为-Sxb到+Sxb,垂直方向上为-Syb到+Syb。那么,由于B2(3)帧和P(4)帧之间的帧距为B1(2)帧和P(4)帧之间的帧距的二分之一,所以以B2(3)帧为参考的P(4)帧的运动向量搜索范围是水平方向上为-Sxb/2到+Sxb/2,垂直方向上为-Syb/2到+Syb/2。
在上述的图像编码装置中,设置或限定了用于检测运动向量的搜索范围。但是,如下文所述,用于检测运动向量的搜索范围可以被改变。
假定具有一个一帧间距的运动向量搜索范围被设置成在水平方向上为-Sx到+Sx,垂直方向上为-Sy到+Sy,并且帧I(0),B(1),B(2),P(3)按一个时间顺序被编码,即,按I(0),B(1),B(2),P(3)的顺序。这样,在以B(1)帧为参考的I(0)帧中,用于检测运动向量的运动向量搜索范围被设置成在水平方向上为-Sx到至+Sx,垂直方上为-Sy到+Sy。由于B(2)帧和I(0)帧之间的帧距为两帧,所以以B(2)帧为参考的I(0)帧的运动向量搜索范围是在水平方向上为-2Sx到+2Sx,垂直方向上为-2Sy到+2Sy。如果运动向量分布范围在水平方向上为-Ax到+Bx,垂直方向上为-Ay到+By,则以B(2)帧为参考的I(0)帧的运动向量搜索范围被设置成水平方向上为-(Ax+Sx)到+(Bx+Sx),垂直方向上为-(Ay+Sy)到+(By+Sy)。
当从B(1)帧到I(0)帧只有很小或没有运动时,运动向量分布范围可基本集中在(0,0)使得Ax,Bx,Ay和By的值基本等于0。在这种情况下,以B(1)帧为参考的I(0)帧的运动向量搜索范围被设置成在水平方向上为-Sx到+Sx,垂直方向上为-Sy到+Sy,类似于有一个一帧间距的运动向量搜索范围。
另一方面,考虑从B(1)帧到I(0)帧存在基本运动的情形,运动向量分布范围可以类似于一帧间距的运动向量搜索范围的情况(即,垂直方向上为-Sx到+Sx,水平方向上为-Sy到+Sy)。在这种情况下,以B(1)帧为参考的I(0)帧的运动向量搜索范围可设置成在水平方向上为-2Sx到+2Sx,垂直方向上为-2Sy到+2Sy。(在确定这些范围的过程中,可以使用关系式Ax=Sx,Bx=Sx,Ay=Sy,By=Sy)。而且,这个范围可以代表最大搜索范围。
通过如上所述适当地改变搜索范围,在降低或最小化搜索次数的同时,可以检测运动向量。其结果是,在对涉及这种运动向量的编码过程中所产生的信息量将减少。
下面参照图7说明依据本发明的用于记录编码图像数据的装置。如图所示,这个记录装置一般包括图像编码设备100,一个记录调制电路110和一个记录或盘形媒体120。图像编码设备100与图1所描述的基本相同,在此不详细描述。
在本记录装置中,一个输出信号或来自图像编码设备100的编码数据被提供给记录调制电路110,其中该信号按一预定技术被调制并被记录到盘形媒体120上。因此,记录到盘形媒体上的编码图像数据可包括减少了的运动向量编码信息量。这样记录的结果是,再现时可以产生一个相对高质量图像。
因此,在本图像编码装置中,一个或多个运动向量被检测并且被检测的运动向量的分布范围被确定。根据这个分布范围,一个运动向量搜索范围被预测并设置。在这个设置的搜索范围中检测下一个运动向量。其结果是,在涉及该被检测的运动向量的变长编码过程中,长度较短的码被分配。而且,在判定各个块的运动向量的差别和对不同的数据进行变长编码时,长度较短的码被分配给不同的数据以确保一个光滑的运动向量分布。其结果是,编码过程中所产生的信息量被减少。
而且,无论何时在任意两个I,P和B图像之间进行搜索,均可以更新运动向量分布。可替换地,只有在I,P,B图像中某一个之间进行搜索,才可以进行这样的更新,例如在一个I和P图像之间。
而且,按一个I1,B1,B2,P1,B3,B4,P2,B5,B6,P3,B7,B8,P4,……的帧顺序,可在预定的帧对排列间确定运动向量分布。例如,这个分布可以在下列的帧对排列间被确定(I1,P1),(P1,P2),(P2,P3),(P3,P4)……可替换地,也可使用排列(I1,B1),(B1,B2),(B2,P1),(P1,B3)……此外,本记录装置使得按现有的编码技术编码的图像数据被记录在一个记录磁盘或媒体上。在再现这种记录图像数据时,可产生相对高质量的图像。
尽管本编码装置中使用的视频数据信号描述为表示视频帧,但本发明并不仅限于此。也就是说,也可以使用代表视频数据/图像的其它排列的视频数据信号,例如视频场等。同样,本编码装置也不限于使用上述的16×16块大小的像素块,可以使用其它的块大小。
而且,本编码装置不限于上述的MPEG2系统和特定的I,P,B图像顺序。即,本编码装置可按其它类型的编码技术被操作,例如MPEG,和其它的I,P,B图像顺序(它们之间可有不同的帧距)。
而且,本编码装置不限于上述的特定大小的搜索范围,即也可以使用其它大小的搜索范围。
尽管本发明详细描述了最佳实施例,但不应将本发明仅限于此。本领域技术人员对本发明所做出的任何修改和改进均包括在本发明权利要求范围之内。
权利要求
1.一种图像编码方法,用于通过利用一个先前帧的视频信号检测一个代表一帧的输入视频信号运动向量,根据检测到的运动向量运动补偿先前帧的视频信号并对运动补偿的视频信号进行编码,所述方法包括以下步骤检测一帧输入视频信号的运动向量的分布范围;根据检测到的分布范围预测运动向量的搜索范围并设置该搜索范围;以及在设置的搜索范围内检测输入视频信号的运动向量。
2.一种图像编码装置,它有一个运动向量检测设备,用于通过利用一个先前帧的视频信号检测一个代表一帧的输入视频信号的运动向量,基于检测到的运动向量运动补偿先前帧的视频信号并对运动补偿的视频信号进行编码,所述装置包括分布检测设备,用于检测从所述运动向量检测设备得到的运动向量的分布范围;控制设备,用于根据所述分布检测设备检测到的运动向量分布范围控制所述运动向量检测设备检测到运动向量的搜索范围,所述控制装置在所述运动向量检测设备中预测视频信号运动向量的搜索范围并设置该运动向量搜索范围;所述运动向量检测设备在所述控制设备设置的搜索范围内检测输入视频信号的运动向量。
3.一种用于将编码视频数据记录在一个记录媒体上的记录装置,其中通过利用一个先前帧的视频信号检测一个代表一帧的输入视频信号的运动向量,基于检测到的运动向量运动补偿先前帧的视频信号并对运动补偿的视频信号进行编码,以形成编码的视频数据,所述装置包括运动向量检测设备,用于检测所述运动向量;分布检测设备,用于检测从所述运动向量检测设备得到的运动向量的分布范围;以及控制设备,用于根据所述分布检测设备检测到的运动向量分布范围控制所述运动向量检测设备检测到的运动向量的搜索范围,所述控制装置在所述运动向量检测设备中预测视频信号运动向量的搜索范围并设置用于所述运动向量的检测设备的运动向量搜索范围;所述运动向量检测设备在所述控制设备设置的搜索范围内检测输入视频信号的运动向量。
4.一种用于对代表多个图像的视频信号编码的装置,所述装置包括运动向量检测装置,用于在一个搜索范围内检测输入视频信号的运动向量;用于确定所述运动向量检测装置以前检测的至少一个运动向量的分布范围并根据所述分布范围确定所述搜索范围的装置;以及用于根据检测到的运动向量对输入视频信号编码的装置。
5.一种处理装置,包括用于接收代表多个视频帧或图像的编码视频数据的装置;用于检测第一运动向量的装置;用于确定检测到的第一运动向量的分布范围并根据所述分布范围确定一个搜索范围的装置;以及用于在所述搜索范围内检测第二运动向量的装置。
6.如权利要求5所述的处理装置,其中接收到的编码视频数据表示多个内部编码(I),内部帧预测编码(P)和双向预测编码(B)视频帧或图像。
7.如权利要求6所述的处理装置,其中接收到的视频数据按照一种MPEG2技术被编码。
8.如权利要求6所述的处理装置,其中接收到编码视频数据代表一个预定的I,P和B视频帧或图像顺序并且其中所述预定顺序为I,P,B,B,P,B,B和P。
9.如权利要求6所述的处理装置,进一步包括用于按照检测到的运动向量对接收到的视频数据进行变长编码的装置。
10.如权利要求9所述的处理装置,进一步包括用于将经过变长编码的视频数据记录到一个记录媒体上的装置。
11.一种处理方法,包括步骤接收代表多个视频帧或图像的编码视频数据;检测第一运动向量;确定检测到的第一运动向量的分布范围并根据所述分布范围确定一个搜索范围;以及在所述搜索范围内检测第二运动向量。
12.如权利要求11所述的处理方法,其中接收到的编码视频数据表示多个内部编码(I),内部帧预测编码(P)和双向预测编码(B)视频帧或图像。
13.如权利要求12所述的处理方法,其中接收到的视频数据按照一种MPEG2技术被编码。
14.如权利要求12所述的处理方法,其中接收到编码视频数据代表一个预定的I,P和B视频帧或图像顺序并且其中所述预定顺序为I,P,B,B,P,B,B和P。
15.如权利要求12所述的处理方法,进一步包括按照检测到的运动向量对接收到的视频数据进行变长编码的步骤。
16.如权利要求15所述的处理方法,进一步包括将经过变长编码的视频数据记录到一个记录媒体上的步骤。
17.一种装置,用于处理代表多个内部编码(I),内部帧预测编码(P)和双向预测编码(B)视频帧或图像并按一个预定顺序排列的视频数据,以使得其间有相应的帧距,所述装置包括用于确定第一搜索范围的装置;用于在所述第一搜索范围内检测第一运动向量的装置,所述第一运动向量表示两个视频帧间的运动;用于在第二搜索范围内检测第二运动向量的装置,所述第二运动向量表示另外两个视频帧间的运动;用于根据所述第一搜索范围以及与所述第一运动向量相关的两个视频帧间的距离和与所述第二运动向量相关的另两个视频帧间的距离的关系确定所述第二搜索范围的装置;以及用于按照检测到的运动向量对视频数据进行变长编码的装置。
18.如权利要求17所述的处理视频数据的装置,其中确定第一搜索范围的所述装置包括用于确定先于所述第一运动向量被检测到的运动向量的分布范围的装置和根据所述分布范围确定所述第一搜索范围的装置。
19.一种方法,用于处理代表多个内部编码(I),内部帧预测编码(P)和双向预测编码(B)视频帧或图像并按一个预定顺序排列的视频数据,以使得其间有相应的帧距,所述方法包括步骤确定第一搜索范围;在所述第一搜索范围内检测第一运动向量,所述第一运动向量表示两个见频帧间的运动;在第二搜索范围内检测第二运动向量,所述第二运动向量表示另外两个视频帧间的运动;根据所述第一搜索范围以及与所述第一运动向量相关的两个视频帧间的距离和与所述第二运动向量相关的另两个视频帧间的距离的关系确定所述第二搜索范围;以及按照检测到的运动向量对视频数据进行变长编码。
20.如权利要求19所述的处理视频数据的方法,其中确定第一搜索范围的步骤包括确定先于第一运动向量被检测到的运动向量的分布范围和根据所述分布范围确定所述第一搜索范围。
全文摘要
用于对图像数据编码的装置和方法,检测一个运动向量并确定检测到的运动向量的分布范围。根据这个分布范围,预测并设置一个运动向量搜索范围。在设置搜索范围中,执行下一个运动向量的检测。图像数据和/或运动向量被变长编码,其中可使用长度相对较短的码。其结果是,在这个编码过程中产生的信息量相对较少。在再现这个编码数据时,可以产生相对高质量的图像。
文档编号H04N5/92GK1151664SQ96113220
公开日1997年6月11日 申请日期1996年8月16日 优先权日1995年8月16日
发明者小仓英史 申请人:索尼公司