专利名称:采用顶点编码技术的目标轮廓编码方法及设备的制作方法
技术领域:
本发明涉及视频信号中目标轮廓编码的方法和设备。更具体地说,涉及通过使用采用基于八分区(octant)的顶点编码技术和链式编码技术的的自适应编码方案对轮廓进行编码的方法和设备。
在可视电话、电话会议及高清晰度电视系统等的数字电视播送系统中,因为视频帧信号的视频行信号由一系列被称为象素值的数字数据组成,就需要用大量数字数据来定义每个视频帧信号。现有传输信道的可用频率带宽有限,为了传输大量的数字数据,就必须采用各种数据压缩技术压缩或减少数据量,对于如可视电话及电话会议系统等的低比特率视频信号编码器就更是如此。
在低比特率编码系统的视频信号编码技术中有一种被称为面向目标分析综合编码技术,是将输入的视频图象分成许多目标,定义每个目标的运动、轮廓和象素数据的3组参数经过不同的编码信道进行处理。
处理视频信号中的目标轮廓时,表示构成轮廓的轮廓象素位置的轮廓信息对于目标形状的分析和综合是很重要的。过去用来表示轮廓信息的经典编码方法是链式编码技术,尽管它不会产生轮廓信息的损失,但需要大量的比特来表达轮廓信息。
因此,为了克服链式编码技术的缺点,人们提出了诸如多边形逼近法、B样条逼近法及结合多边形逼近技术的DST(离散正弦变换)法等等许多方法来编码轮廓信息。这些逼近技术中,轮廓是用一段一段的直线或曲线来逼近的,每段连接着轮廓上相邻的一对顶点,这些顶点采用被称为基于八分区的局部自适应顶点编码技术进行编码(例如参见K.O′Connell、P.G erken和J.H.Kim的“S4a的修正描述--几何表示法”,1996年7月30日,形状编码AHG,ISO/IEC JTCI/SC29/WG11,运动图象和音响信息编码,国际标准化组织)。
图1所示为常规的通过采用基于八分区的顶点编码技术对视频信号中目标轮廓顶点进行编码的设备的示意方框图。
二进制表征码被输入到轮廓抽取单元10,二进制表征码中每个象素依据该象素是在目标上还是在背景区而用一个是0或1的二进制值表示。
轮廓抽取单元10从二进制表征码中抽取出目标一轮廓并向顶点选择单元20该提供轮廓图象。该轮廓由轮廓象素组成,各轮廓象素是位于目标边界上的一个目标象素。
顶点选择单元20利用如多边形逼近技术等的常规迭代细化技术选择多个顶点,其中分开距离最大的一对轮廓象素被首先确定作为起始顶点,其它轮廓象素逐一被选为另一顶点,直到连接一对相邻顶点间的直线到由该对顶点定义的轮廓线段的最大垂直距离dmax不超过预置阈值Dmax。这些顶点在编码单元30被编码。
上述用于编码顶点的常规设备中,如果预置阈值Dmax较大就可用较少的顶点数粗糙地表示轮廓,所以阈值Dmx越小越有利于有意义的逼近。但是,如果阈值太小,如Dmax小于或等于象素间距离的一半,用迭代细化技术确定的顶点数就急剧增加到一个限度,超过这个限度选用常规链式编码技术编码轮廓更有利。
另外,用常规的编码设备不能对所有轮廓有效地编码。例如,由多条直线组成的轮廓,象图2A所示的多边形,不管阈值Dmx的大小,采用迭代细化技术比链式编码技术更为有利。而如图2B所示起伏强烈的轮廓,因顶点数增加太多用链式编码技术就比迭代细化技术更好。
因此,尽管前述迭代细化技术可以减少传输数据量,但是寻找进一步减少传输数据量的更好方法的研究仍在继续着。
本发明的主要目的是提供一种改进的轮廓编码方法和设备,它通过使用采用基于八分区的顶点编码技术和链式编码技术的自适应编码方案以进一步削减传输数据量。
本发明提出了一种根据迭代细化技术编码目标轮廓视频信号的方法,其中在具有轮廓象素的轮廓上确定多个顶点并且轮廓上两相邻顶点间的轮廓线段被连接所述两相邻顶点的直线逼近。此方法由下列步骤构成(a)计算轮廓象素比特数,其中轮廓象素比特数代表了编码所有轮廓象素所需的比特数。
(b)估算顶点比特数,其中顶点比特数表示编码轮廓上所有顶点所需的比特数。
(c)比较轮廓象素比特数和顶点比特数经生成一个表示两种比特数中较少的一种的确定信号。
(d)根据该确定信号编码轮廓信息以产生编码数据,其中该轮廓信息表示这些顶点或这些轮廓象素。
通过以下结合附图对最佳实施例的描述,本发明的前面所述及其他目的和特证将逐渐清晰地表达出来。附图中,图1所示为用于编码视频信号中目标轮廓顶点的常规设备示意方框图。
图2A和图2B分别表示一个多边形和一个起伏强烈的轮廓,以说明常规的迭化细化技术的缺陷。
图3表示根据本发明的编码输入轮廓图象数据的设备的方框图。
图4提供了用于说明图3中范围确定单元功能的解释性轮廓。
图5给出了用于说明相对地址八分区区域的解释图。
图3所示为根据本发明的用于编码输入轮廓图象数据的设备100的方框图,其中输入轮廓图象数据表示构成目标轮廓的轮廓象素位置。输入轮廓图象数据被送到顶点确定单元110、轮廓象素计数器140和链式编码单元170。链式编码单元170采用常规链式编码技术编码多个轮廓象素以将链式编码数据提供给选择单元180,其中常规链式编码技术采用依据输入轮廓图象数据的基于八分区的顶点编码技术编码相邻最近的轮廓象素间的位移。
同时,顶点确定单元110采用常规迭代细化技术确定轮廓上的多个顶点。轮廓上的顶点按处理顺序排列,有关所列顶点的信息被逐个送入初始顶点选择单元115和顶点计数器130。
顶点计数器130对从顶点确定单元110顺序提供的顶点数进行计数并将顶点数N送入顶点比特数计算单元135和顶点编码单元160,N是正整数。
同时,初始顶点选择单元115采用常规顶点重排序技术选出初始顶点和结尾顶点。在常规顶点重排序技术中,各对相邻顶点间位移的水平分量R(x)和垂直分量R(y)及其值X-mag和Y-mag被计算出来;且与所有X-mag和Y-mag中最大值相应的两个顶点被选出作为初始和结尾顶点,即,轮廓上的第1及第N顶点,N为顶点总数。如图4所示,该N个,例如5个顶点沿着该轮廓从第1个开始向第N个顶点被顺序标出。图4中,顶点V1和V5这对顶点的X-mag值X51是从V1至V5得到的这5对X-mag和Y-mag中最大的。有关这些顶点的信息被送到范围确定单元120和顶点编码单元160。
再回到图3,范围确定单元120根据自初始顶点选择单元115馈送的顶点信息确定X-动态范围和Y-动态范围。轮廓的X-动态范围和Y-动态范围,临界于确定编码重排序顶点所需的总位数,分别表示位移Ri的X-mag和Y-mag最大值,其中对于i=1,2…,N-1,Ri=Pi+1-Pi,Pi是顶点Vi的位置矢量。图4中,位移R2=P3-P2的X-mag值X23和位移R4=P5-P4的Y-mag值Y45分别被确定为轮廓的X-动态范围和Y-动态范围。最好不考虑第1和第N顶点间的位移。在范围确定单元120计算出X-比特数和Y-比特数并将其送到顶点比特数计算单元135和顶点编码单元160,其中X-比特数和Y-比特数分别是编码X-动态范围和Y-动态范围所要求的比特数。
顶点编码单元160根据来自范围确定单元120馈送的X-比特数和Y-比特数对来自初始顶点选择单元115的顶点进行顺序编码。顶点总数N、X-比特数,Y-比特数和第1顶点V1的绝对位置被编码,而其它各个顶点,即,对于i=1~(N-1)的顶点Vi+1,根据其前一顶点Vi的位移Ri=Pi+1被编码。该顶点编码数据被送到选择单元180。
具体到如图5所示情况,根据位移Ri的X分量Ri(X)和Y分量Ri(Y)在八分区0至八分区7中确定顶点Vi+1所属的八分区,其中与原点最近的8个点(图5中由闭合圆标示)表示8个八分区的起始点。
确定顶点Vi+1的八分区后,八分区的指数通过采用常规微分链式编码技术被编码,并且Ri(X)和Ri(Y)分量的值X-mag和Y-mag,表示相对于先前顶点Vi的顶点Vi+1的相对位置矢量,分别通过使用根据X-动态范围和Y-动态范围被确定的比特来编码。
作为另一基于八分区顶点编码技术的例子,通过采用称为语法自适应算术编码(SAAC)交替编码八分区指数和Ri。在SAAC中,可能的符号数目取决于动态范围最大值,即max(X-动态范围,Y-动态范围)。(关于基于八分区的顶点编码技术的进一步细节,参见前面所述的O′Connell等人的文献)。
回到图3,顶点比特数计算单元135根据来自顶点计数器130的顶点数N和来自范围确定单元120的X-比特数及Y-比特数计算出顶点比特数,其中顶点比特表示编码所有顶点所需的比特数。顶点比特数最好被确定为通过将顶点数N乘以X-比特数与Y-比特数之和。顶点比特数被送到比较单元150。
同时,轮廓象素计数器140根据输入轮廓图象数据对表示轮廓的轮廓象素数进行计数,并且根据轮廓象素数计算出轮廓象素比特数,其中轮廓象素比特数等于轮廓象素数与预定权重的积,如果考虑可变长度编码技术和量化则最好使用被1.5为该权重。轮廓象素比特数被送入比较单元150。
比较单元150根据顶点比特数和轮廓象素比特数决定轮廓信息是被顶点编码还是被链式编码,以向选择单元180提供一确定信号。若轮廓象素比特数比顶点比特数大,产生选择顶点编码数据的第一确定信号。反之,就产生选择链式编码数据的第二确定信号。
选择单元180根据该确定信号在来自顶点编码单元160的顶点编码数据和来自链式编码单元170的链式编码数据之间选择编码数据,将选择的输入轮廓图象数据的编码数据提供给发射装置(图中未示出)。
尽管本发明已根据具体的实施例被加以阐述,但不脱离由所附权利要求定义的本发明范围和精神做出各种改动和修改对于熟悉本领域的人来说将是显而易见的。
权利要求
1.一种根据迭代细化技术对目标轮廓的视频信号进行编码的方法,其中在具有轮廓象素的轮廓上确定有多个顶点且轮廓上由两相邻顶点定义的各轮廓线段被由连接所述两相邻顶点的直线逼近,此方法则以下步骤构成(a)计算轮廓象素比特数,其中该轮廓象素比特数代表编码所有轮廓象素所需的比特数;(b)估算顶点比特数,其中该顶点比特数代表编码该轮廓上所有顶点所需的比特数;(c)比较该轮廓象素比特数和顶点比特数以生成代表两种比特数中较少一个的确定信号。(d)根据该确定信号编码轮廓信息以生成编码数据,其中该轮廓信息代表顶点或轮廓象素。
2.根据权利要求1的方法,其中所述之计算步骤(a)包括以下步骤(a1)对轮廓象素数目进行计数以生成轮廓象素数;及(a2)将轮廓象素数与1-10范围内的一个预定权重相乘以生成轮廓象素比特数。
3.根据权利要求1的方法,其中所述之估算步骤(b)包括以下步骤(b1)对顶点数目进行计数以生成顶点数N,N是一正整数;(b2)确定所有顶点的X-比特数和Y-比特数,其中该X-比特数和Y-比特数分别代表编码所有相邻顶点对间位移的水平和垂直分量所需的比特数。(b3)将顶点数与X-比特数与Y-比特数之和相乘以生成顶点比特数。
4.根据权利要求3的方法,其中所述之检测步骤(b2)包括以下步骤(b21)对所有顶点中各相邻顶点对的X-mag和Y mag进行计算,其中该X-mag和Y-mag分别代表上述各对相邻顶点间位移的水平和垂直分量的值;(b22)在N个顶点中选择第1和第N顶点,其中在N个顶点的X-mag和Y-mag中选择对应于最大值的两相邻顶点作为第1和第N顶点;(b23)确定轮廓的X-动态范围和Y-动态范围,其中X-动态范围和Y-动态范围分别代表位移Ri的X-mag和Y-mag的最大值,对于i=1,2,…,N-1,Ri=Pi+1-Pi,Pi为第i个顶点Vi的位置矢量;及(b24)分别将X-动态范围和Y-动态范围变换成X-比特数和Y-比特数。
5.根据权利要求4的方法,其中所述之编码步骤(d)包括下列步骤(d1)对顶点信息进行顶点编码以生成顶点编码数据,该顶点信息代表所有对相邻顶点间的位移;(d2)对轮廓象素信息进行链式编码以生成链式编码数据,该轮廓象素信息代表所有对相邻轮廓象素间的位移;及(d3)根据确定信号选择顶点编码数据或链式编码数据,其中如果顶点比特数比轮廓象素比特数少,就选择顶点编码数据。反之,就选择链式编码数据。
6.根据权利要求5的方法,其中所述之顶点编码数据包括顶点数N;X-比特数;Y-比特数;第1顶点的绝对位置;及根据X-比特数和Y-比特数待被编码的各对相邻顶点间位移的水平和垂直分量。
7.根据权利要求5的方法,其中所述之顶点编码步骤(d1)是通过利用基于八分区的局部自适应顶点编码技术而实现的。
8.一种根据迭代细化技术对一目标轮廓视频信号进行编码的设备,其中在具有轮廓象素的轮廓上确定有多个顶点且两相邻顶点确定的各轮廓线段被连接所述两相邻顶点的直线所逼近,该设备包括计算轮廓象素比特数的装置,其中轮廓象素比特数代表编码所有轮廓象素所需的比特数;估算顶点比特数的装置,其中顶点比特数代表编码轮廓上所有顶点所需的比特;比较轮廓象素比特数与顶点比特数以产生代表两种比特数中较少一个的确定信号的比较器;根据该确定信号编码轮廓信息以生成编码数据的装置,其中该轮廓信息代表顶点或轮廓象素。
9.根据权利要求8的设备,其中所述之计算装置包括对轮廓象素进行计数以产生轮廓象素数的轮廓象素计数器;将轮廓象素数与1-10范围内的一个预定权重相乘以生成轮廓象素比特数的乘法器。
10.根据权利要求8的设备,其中所述之估算装置包括对顶点数目进行计数以产生顶点数N的顶点计数器,N为正整数。确定所有顶点的X-比特数和Y-比特数的装置,其中该X-比特数和Y-比特数分别代表编码所有对相邻顶点间位移的水平和垂直分量所需的比特数。将顶点数乘以X-比特数与Y-比特数之和以生成顶点比特数的乘法器。
11.根据权利要求10的设备,其中所述之确定装置包括对所有顶点计算每对相邻顶点的X-mag和Y-mag的装置,其中该X-mag和Y-mag分别代表所述各对相邻顶点间位移的水平和垂直分量值;在N个顶点中选择第1和第N顶点的装置,与该N个顶点中的所有X-mag和Y-mag中的最大值相对应的两个顶点被分别选择为第1和第N顶点;确定轮廓的X-动态范围和Y-动态范围的装置,其中该X-动态范围和Y-动态范围分别代表位移Ri的X-mag和Y-mag的最大值,对于i=1,2,…,N-1,Ri=Pi+1-Pi,Pi是第i个顶点Vi的位置矢量;及将X-动态范围和Y-动态范围分别变换成X-比特数和Y-比特数的装置。
12.根据权利要求11的设备,其中所述之编码器包括编码顶点信息以生成顶点编码数据的顶点编码装置,该顶点信息代表所有对相邻顶点间的位移;编码轮廓象素信息以生成链式编码数据的链式编码装置,该轮廓象素信息代表所有对相邻轮廓象素间的位移;根据确定信号选择顶点编码数据或链式编码数据的装置,其中如果顶点比特数少于轮廓象素比特数,就选择顶点编码数据;反之,选择链式编码数据。
13.根据权利要求12的设备,其中所述之顶点编码数据包括顶点数据N、X-比特数、Y-比特数、第1顶点的绝对位置和根据X-比特数与Y-比特数而待被编码的各对两相邻顶点间位移的水平和垂直分量。
14.根据权利要求12的设备,其中所述之顶点编码装置是通过使用基于八分区的局部自适应顶点编码技术而被实现。
全文摘要
一种根据迭代细化技术对目标轮廓的视频信号进行编码的方法,在轮廓上确定多个顶点;并计算编码所有轮廓象素所需的轮廓象素比特数及编码所有顶点所需的顶点比特数。在生成表示轮廓象素比特数和顶点比特数中较少一个的确定信号后,根据该确定信号编码表示顶点或轮廓象素的轮廓信息以生成编码数据。
文档编号G06T9/20GK1188377SQ9711242
公开日1998年7月22日 申请日期1997年6月3日 优先权日1997年1月15日
发明者金镇宪 申请人:大宇电子株式会社