专利名称:变换域中零的早期检测的制作方法
技术领域:
本发明涉及视频压缩系统。
背景技术:
活动图像的实时传输被用于若干应用中,例如电视会议、网络会议、电视广播和可视电话。
但是,表示活动图像需要大量信息,因为通常通过以8位(1字节)表示图像中的每个像素来描述数字视频。这种未压缩的视频数据产生大的位用量,并且因有限带宽而无法通过传统的通信网络和传输线路实时传递。
因此,实现实时视频传输需要很大程度的数据压缩。但是,数据压缩可能与图像质量进行折衷。因此,进行了大量工作来开发允许高质量视频通过带宽限制的数据连接实时传输的压缩技术。
在视频压缩系统中,主要目标是采用尽可能少的容量来表示视频信息。采用作为常数值或者作为位/时间单位的位来定义容量。在两种情况中,主要目标都是减少位数。
在MPEG*和H.26*标准中描述了最常见的视频编码方法。视频数据在传输之前经过四个主要过程,即预测、变换、量化以及熵编码。
预测过程显著减少了要传递的视频序列中各图像所需的位数量。它利用序列的一些部分与序列的另一些部分的相似性。由于预测值部分是编码器和解码器都已知的,因此只需要传递差值。这个差值的表示通常需要少得多的容量。预测主要基于来自先前重构图像的图像内容,其中内容的位置由运动矢量来定义。通常对正方形块大小(例如16×16像素)执行预测过程。注意,在一些情况中,采用基于相同图像中的相邻像素而不是先前图像的像素的像素预测。这称作帧内预测,与帧间预测相对。
表示为数据块(例如4×4像素)的剩余部分仍然包含内部相关性。利用这的众所周知的方法是执行二维块变换。ITU建议H.264采用4×4整数型变换。这把4×4像素变换为4×4变换系数,并且它们通常可由比像素表示更少的位来表示。具有内部相关性的4×4像素阵列的变换可能产生4×4变换系数块,其中具有比原始4×4像素块少得多的非零值。
变换系数的直接表示对于许多应用仍然代价过高。执行量化过程以便进一步减小数据表示。因此,变换系数经过量化。变换系数的可能值范围被分为值区间,各由最高及最低判定值限制并且被分配固定量化值。然后,变换系数被量化为与各个系数所在的区间关联的量化值。低于最低判定值的系数被量化为零。应当指出,这种量化过程导致重构的视频序列与未压缩序列相比略有不同。
如上所述,要编码的视频内容的一个特性在于,描述序列的位的要求极大地变化。对于若干应用,本领域的技术人员众所周知的是,图像的相当大的部分的内容从帧到帧没有改变。H.264扩展这个定义,使得具有恒定运动的图像的部分也可不使用附加信息来编码。从帧到帧极少或没有变化的区域需要最少数量的位来表示。这类区域中包含的块被定义为“跳过”,表明相对于相应的先前块没有出现变化或者只出现可预测运动,因此,不需要数据来表示这些块,只是指明这些块将被解码为“跳过”。这个指示可能是若干宏块共同的。
由于H.264为解码规范,因此它没有描述用于在变换和量化过程之前检测边缘或没有变化的区域的任何方法。因此,这些区域可能经过运动搜索、变换和量化,即使它们最后将被定义为跳过并且不采用任何数据来表示。由于这些操作需要处理容量,因此,这是编码器中的资源的不必要消耗。处理资源的有效利用在H.264方面极为重要,因为它需要大量处理资源。因此,至少对于一些应用,极其希望减小编码器复杂度。
与H.264关联的另一个问题在于,在各图像带有一定的误差被重构的意义上,编码通常是“有损的”。这个事实与源信号上的噪声一起表示在未编码块与先前图像中处于同一位置的块之间的差异始终存在,即使图像内容没有实际变化。因此,典型的编码过程可能往往使这被编码为残留信号。这通常将产生块的客观重构的细微改进,但是会在图像的静止区域中产生令人不快的闪烁效果。
发明概述本发明的一个目的是提供一种避免上述问题的方法。
所附独立权利要求中定义的特征表征了这个方法。
具体来说,本发明提供一种视频编码方法,用于通过整数变换函数来变换活动图像的第一残留像素值块,产生相应的第二整数变换系数块,然后采用多个判定值所定义的量化区间对整数变换系数进行量化,其中所述方法包括以下步骤通过二进制变换函数来变换第一块,产生相应的第三二进制变换系数块;以及如果第三块的左上角的一个或多个二进制变换系数小于预定义的门限,则把第二块定义为仅包括零。
附图概述为了更易于理解本发明,以下论述将参照附图进行。
图1说明分为4×4像素块的单一16×16宏块,4×4像素块进一步分为4×4变换块。
本发明的详细描述下面通过描述一个优选实施例以及通过参照附图来论述本发明。但是,在所附独立权利要求中定义的本发明的范围内,本领域的技术人员会认识到其它应用和修改。
本发明提供一种方法,用于在比ITU H.263和H.264标准的其它简单实现更早的编码过程的阶段检测将被表示为跳过的块。
根据本发明的一个优选实施例,在检测标记为“跳过”的块时,考虑每个单一16×16宏块。在执行主要判定过程之前,对于相应宏块需要一些预备步骤。
第一个预备步骤旨在查找所谓的跳过矢量。跳过矢量的导出仿效H.264中定义的16×16块的相应运动矢量的预测。主要差异在于,跳过矢量在某些条件下设置为零,而16×16预测矢量则不是。这些条件也在H.264标准中定义。16×16宏块的跳过矢量通过附近已经编码的宏块的矢量来定义。该过程在H.264中明确定义。然后,根据导出的跳过矢量,判定是否进入所述宏块的下一个步骤。如同按照H.263,用于进行、即用于假定宏块是在早期阶段被定义为跳过的候选者的标准可能是跳过矢量等于零。这表示只是通过没有任何运动来进一步检查该情况,而H.264还保留了采用不同于零的跳过矢量预测把宏块定义为跳过的空间。但是,下面假定跳过矢量被确定为等于零。
下一个预备步骤是根据要编码的宏块与先前解码帧中的处于同一位置的块之间的像素差来查找被定义为像素的剩余部分。这是相当简单的过程,不需要很多处理容量。跳过矢量等于零的上述假定意味着,通过从先前处于同一位置的块中减去当前宏块的像素,始终会找到剩余部分,而不是具有相对空间偏移的块。
在通过跳过检测过程的预备步骤之后,就开始研究宏块以便查看它的至少一些部分是否满足被分类为跳过的预定义标准。
跳过检测的最简单方式只是根据基于像素的剩余部分。可定义某个门限,而标准可能是最大值、平均值或像素的另外某个组合是否超过这个门限。
另一方面,已知的是,在对宏块编码时,对剩余像素值执行变换。后续的量化过程很可能引入许多零值,因为最低判定值以下的所有变换值将设置为零。如果所有变换系数在量化之后为零,则宏块将被定义为跳过。由于变换值的最低判定值不是直接可导出到像素域的门限的,因此,与进行变换域中的相同比较相比,与像素域中的门限的比较往往给出不同结果。另一方面,执行所有系数的变换及后续检查以便查找用零填充的块的步骤是消耗容量的。
根据本发明,为了在普通变换之前检测所跳过的块,通过引入简化且不苛刻的变换来避免对所跳过的块的全变换。为了说明简化变换,图1说明根据H.264的图像像素的分区的一部分。16×16宏块被分为16个4×4块,准备通过二维整数变换对各4×4块进行变换,产生4×4变换系数。根据H.264的实际变换中使用的变换是4×4整数型变换,其系数经过组织,使得已变换块的左上值表示所有像素的和或平均值。在移动到右下时,变换系数在水平和垂直方向上表示更高频率的成分。因此,信号的“能量”的大部分在统计上朝变换的低频(左上)成分集中。左上系数往往称作DC系数。因此,集中于朝向4×4块的左上的4个系数是足够的假设是适当的。这些系数在图1中以阴影表示。注意,根据所使用的变换,代表待变换值的“能量”的大部分的DC系数及其它“低频”系数不是限制于位于左上角。
一般来说,块的“低频”系数位于块的低坐标位置。
但是,如前面所述,根据本发明,简化变换用于检测所跳过的块。根据本发明的一个优选实施例的变换从Hadamard变换中推导。与4×4整数型变换不同,Hadamard变换的基本矢量的元素仅取二进制值+1和-1。因此,它们极适合需要计算简单性的数字信号处理应用。下面给出简化变换的基本矢量。
1 1 1 1 1 1-1-11 1 1 1 1 1-1-11 1 1 1 1 1-1-11 1 1 1 1 1-1-11 1 1 1 1 1-1-11 1 1 1 1 1-1-1-1-1-1-1-1-1 1 1-1-1-1-1-1-1 1 1
通过把块与相应系数位置关联的基本矢量相乘来导出块的系数。采用上述基本矢量,计算简化成加法和减法。这种变换将称作二进制变换。
采用上述基本矢量来导出四个左上系数的步骤提供适当接近H.264中指定的4×4整数型变换的相应系数的结果。实际上,左上系数将与实际变换相同。因此,4×4整数型变换的DC系数的最低判定级可直接用作简化变换的相应四个系数的门限。
这样,实现了用于检测零系数的极佳测试,因为已知这四个系数在统计上为最大,如果这四个系数低于门限,则假定其余系数为零。
本发明提供一种在变换和量化之前检测系数零的简单方法,由于避免了运动矢量搜索以及较少变换和量化而使得节省大量计算。
另外,本发明代表检测尽可能多的没有变化的宏块以及尽可能少的宏块在被编码时被定义为跳过的两种要求之间的良好平衡。
本发明还由于接近零的值的变换的数量减少而限制了变换引入的噪声。
权利要求
1.一种视频编码方法,用于通过整数变换函数来变换活动图像的第一残留像素值块,产生相应的第二整数变换系数块,然后采用多个判定值所定义的量化区间对所述整数变换系数进行量化,其特征在于通过二进制变换函数来变换第一块,产生相应的第三二进制变换系数块,如果第三块中的最低坐标的一个或多个二进制变换系数小于预定义的门限,则把第二块定义为仅包括零。
2.如权利要求1所述的方法,其特征在于,所述预定义的门限是与第二块中的最低变换坐标的系数的量化关联的多个判定值中的最小判定值。
3.如权利要求1或2所述的方法,其特征在于,所述视频编码根据H.264进行,以及整数变换函数是其中定义的整数变换。
4.如以上权利要求其中之一所述的方法,其特征在于,所述块表示活动图像中4×4像素的相同第一正方形区域。
5.如权利要求4所述的方法,其特征在于,所述第一正方形区域覆盖表示所述活动图像中的16×16像素的第二正方形区域的宏块的十六分之一。
6.如权利要求5所述的方法,其特征在于以下步骤根据所述活动图像中在空间上相邻的块的现有运动矢量来确定所述宏块的跳过矢量,仅当所述跳过矢量等于零时,才执行通过二进制变换函数来变换第一块的步骤。
7.如以上权利要求其中之一所述的方法,其特征在于,所述二进制变换函数是Hadamard变换或者从所述Hadamard变换中导出的变换。
8.如以上权利要求其中之一所述的方法,其特征在于,所述一个或多个二进制变换系数是第三块的左上角的四个二进制变换系数。
9.如以上权利要求其中之一所述的方法,其特征在于,在通过整数变换函数来变换第一块的步骤之前,执行通过二进制变换函数来变换第一块的步骤,如果第二块已经被定义为仅包含零,则跳过通过整数变换函数来变换第一块的步骤。
全文摘要
本发明应用于视频编码,并且公开了一种方法,用于在比ITUH.263和H.264标准的简单实现中的情况更早的编码过程的阶段检测将被表示为跳过的块。这通过采用二进制变换函数变换具有零跳过矢量的宏块中的4×4块来提供。具有低于预定义门限的四个左上角二进制变换系数值的块被定义为跳过。因此,不需要对这些块的其它代价高的计算要求苛刻的变换或量化。
文档编号H03MGK1813480SQ200480017937
公开日2006年8月2日 申请日期2004年4月27日 优先权日2003年6月27日
发明者G·比约恩特加德 申请人:坦德伯格电信公司