应用于视频压缩且使用像素匹配欠采样的运动估计方法

文档序号：7918751阅读：213来源：国知局

专利名称：应用于视频压缩且使用像素匹配欠采样的运动估计方法
技术领域：
本发明与运动估计(motion estimation)有关，尤其是关于在碎见频压缩(video compression)中应用i"象素匹酉己欠采才羊(sub-sampling)4支术的运动j古i十方法。
背景技术：
运动估计是一种被广泛使用于视频压缩中的技术，用以降低视频帧间的时间冗余信息(temporal redundancy)。利用移动向量(motion vector)来取代视频数据中重复出现的类似视频内容，编码视频数据时所需的存储器需求便可随之降低，也就是说，在视频压缩时采用运动估计技术可使得在大多数情况下不严重降低视频质量的同时，减少视频数据的大小。
请参阅图1，图1所示为现有技术的帧运动估计(frame Motion Estimation, frame ME)的示意图。如同先前所述，运动估计的目的即为用来降低视频帧(例如当前帧120以及参考帧110)之间的时间冗余信息 (temporal redundancy )。参考帧110中包含有参考宏块115 ，而当前帧 120包含有当前宏块125。如图1所示，当前帧120被划分成多个宏块 (macroblock,MB),用以与参考帧 110中的多个候选宏块(candidate macroblock)进行匹配。如同本领域内技术人员所知，在视频压缩技术中，宏块的大小可依据使用者对于计算效率以及精准度的需求而折衷选择；然而，在大多数的算法中，宏块的尺寸是16像素xl6像素。
在宏块完成划分之后，利用一个预定的误差量度机制，当前帧120 中的每个宏块即与参考帧110中每个候选宏块做匹配以分别找出与当前帧120中每个宏块最匹配(matching)的候选宏块。在视频压缩的算法中，代表两帧中彼此匹配的宏块的距离的移动向量130便被标示出来，并在压缩算法中取代当前帧120中的当前宏块125。
举例来说，如图1所示，当前帧120中有一个含才奉球的当前宏块125，其可合理地匹配至参考帧110中的一个含棒球的参考宏块115，另外，图1的移动向量130则代表了与当前宏块125相互匹配的宏块 115由参考帧110移动至当前帧120的位移量。
相较于储存实际的宏块数据，储存位移向量需要较少的存储器，因此，当运动估计被应用于压缩算法中时，存储器的使用量便可大幅度地降低。在视频重建(reconstruction)的过程中，在参考帧内由移动向量所标示出的宏块会用来预测当前帧的信息；而这种视频重建的技术 #尤是3见有才支术的移动才卜〗尝子贞观'J(motion compensated prediction)或移动补偿(motion compensation)。
在采用移动补偿技术时，参考帧中由移动向量所标示出且对应到当前帧中的宏块的相匹配的宏块会被复制到重建后的帧当中。请继续参阅图1，当执行移动补偿时，当前帧中的当前宏块125之前并未被储存至存储器中，而是根据移动向量130来以参考帧110中的参考宏块115取代当前帧120中的当前宏块125。
在视频压缩的领域中，采用移动补偿所产生的视频质量可随着用来计算移动向量的算法而改变，也就是说，一个不精准的移动向量往往会导致一个不近似的预测结果，并因此造成不佳的视频质量。因此，误差量度(error measure)即被应用在运动估计的块匹配中，以确定出宏块彼此间的近似程度，而在进行块匹配时，绝对误差总和(Sum of Absolute Differences, SAD)与均方i吴差总和(Sum of Squared Error, SSE)是其中广泛使用的误差量度值。
前述的帧运动估计-技术通常纟皮 <吏用在循序扫描的纟见频源 (progressive video source),其中4见频图4象的完整帧(full frame)会连续显示，除此之外，运动估计运算也可使用到交错扫描的视频源中。请参阅图2,图2所示为现有技术交错帧200的组成的示意图。如图2 所示，在交错扫描的视频中，交错帧200包含有奇图场(odd field) 210 以及偶图场(even field)220,其中奇图场210由奇数编号的水平扫描线构成，而偶图场220由偶数编号的水平扫描线构成。因此，当针对交错扫描的^L频执行运动估计时，相较于比4交完整的宏块，当前帧中宏块内的图场会与参考帧中宏块的图场相比较，而上述针对交错扫描视频的运动估计也被称作图场运动估计(field Motion Estimation, fieldME)。
帧运动估计以及图场运动估计均可应用于交错扫描的视频而产生不同的运算结果，举例来说，对于内容基本静止的视频序列(即仅具有程度有限的移动)，此时帧运动估计运算相较于图场运动估计会得到较佳的匹配结果；然而，对于内容大致上动态的视频序列(即具有较大程度的移动)，选用图场运动估计会得到较佳的匹配结果。由于图场运动估计以及交错扫描的视频的相关技术为本领域内技术人员所知，故详细i兌明在此省略而不另赘述。
一般而言，在确定彼此匹配的宏块的过程中，可能会针对匹配的像素(matching pixel)进行采样来降低运算的复杂度，因此，当前宏块以及候选宏块(即位于参考帧/图场中的宏块)中的某些特定像素会被选取以计算这些像素的特征值(characterizing value)，而特征值一4殳而言会是绝对误差总和(SAD)或均方误差总和(SSE)。在求出不同候选宏块的特征值之后，会比较这些候选宏块的特征值。
请参阅图3，图3所示为根据大小为32"6(像素)的宏块对(MB pair) 进行采样的示意图，其中，运动估计包含有匹配两个大小为32*16像素的宏块对，以及采用一个四皇后棋才各欠采样格式 (four-queen sub-sampling pattern)310。如图3所示，在此范例中，当前宏块对以及候选宏块对的大小都为16*32像素，而一个四皇后棋格(four-queen)格式340是由每4*4大小的块中选出四个l象素，以重复地构成大小为 16*32像素的四皇后棋格欠采样格式310,而四皇后棋格欠采样格式 310会同时应用在当前宏块对以及参考宏块对，也就是说，仅有被选取出的像素会使用在误差量度的计算之中。
然而，尽管前述应用在帧运动估计中的四皇后棋格欠采样格式 310看起来似乎是均匀分布的，然而当应用于图场运动估计时，欠采样格式320、 330反而是不均匀的，由于对图场运动估计而言缺乏均匀的采样分布，故使得匹配结果无法达到最佳化，也附带降低了视频压缩的图像质量。

发明内容
为了解决运动估计采样分布不均匀的技术问题，本发明提供一种应用4象素匹配欠采才羊(matching-pixel sub國sampling)的运动4古i十方法，
来解决前述的问题。欠采样才各式可同时应用在循序扫描^L频源以及交错扫描视频源之中，并使得帧运动估计以及图场运动估计都可得到具有较均匀的采样分布结果。
根据本发明的实施方式，其揭示一种应用在视频压缩且使用像素匹配欠采样的运动估计方法。此运动估计方法包含有获取第一帧的当前宏块对，以及对第二帧的候选宏块对与上述当前宏块对执行块匹配操作当前宏块对以及候选宏块对才艮据欠采样格式进行欠采样以获取欠采样结果，以及根据欠采样结果对当前宏块对以及候选宏块对之间进行误差量度。欠采样格式是由多个重复单元所构成，以及每一个重复单元是由第一格式单元以及第二格式单元所构成。
本发明利用构造欠采样格式，使得视频压缩的欠采样技术更加有效率以及具有优越的运动估计能力。

图1为现有技术的帧运动估计的示意图。图2为现有技术交错帧的组成的示意图。
图3为使用四皇后棋格格式在运动估计中的帧欠采样格式以及交错图场采样格式的示意图。
图4为本发明建构欠采样格式的实施方式的示意图。图5为本发明欠采样格式的实施方式的示意图。图6为本发明运动估计方法的实施方式的流程图。
具体实施例方式
在说明书及权利要求书当中使用了某些词汇来称呼特定的元件。本领域的技术人员应可理解，硬件制造商可能会用不同的名词来称呼同一个元件。本说明书及权利要求书并不以名称的差异来作为区分元件的方式，而是以元件在功能上的差异来作为区分的准则。在通篇说明书及权利要求书当中所提及的"包含"是开放式的用语，故应解释成"包含但不限定于"。此外，"耦接，，一词在此是包含任何直接及间接的电气连接手段。因此，若文中描述第一装置耦接于第二装置，则代表第一装置可直接电气连接于第二装置，或通过其它装置或连接手段间接地电气连接到第二装置。
如同现有技术的段落中所述，在依据视频的相关移动(relative translational motion)选出所需的4言息后，帧运动估计以及图场运动估计两者都可使用在交错扫描的视频之中，然而，进行交错扫描视频的视频处理时，判断应该采用帧运动估计或图场运动估计来对视频数据进行编码在实际运作上具有一定的难度。在这种情况下，在处理流程中会进行图场运动估计以及帧运动估计两种运动估计方法，而经由绝对误差总和的计算或均方误差总和的计算等误差量度方法来判定出当前帧以及参考帧中彼此宏块的不近似度之后，能产生较佳运算结果的运动估计方法(图场运动估计或帧运动估计)便会被采用。因此，为了选出较佳的运动估计方法，在执行误差量度运算时会需要一个同时可使用于帧运动估计以及图场运动估计的欠采样格式，且此欠采样格式对于帧运动估计以及图场运动估计均可产生一个均匀的欠采样分布结果，以4是升速率-失真性能(rate-distortion performance, R-D performance)。欠采样格式所使用的这些采样点会在帧运动估计以及图场运动估计中重复使用，以降低其运算复杂度。而本发明所揭露的欠采样格式不仅可同时提供一个良好的编码结果给帧运动估计以及图场运动估计，且本发明的欠采样格式可经由一个简单的算法而产生。
本发明的欠采样格式是包含有多个重复单元(repeating unit),其中每个重复单元至少具有两个彼此相异的才各式单元(pattern unit)，而这两个格式单元可以是完全不相同的格式，或是由一个格式单元经由反转 (inverted)、 4竟射(reflected),向左/向右平移(left /right shift)、向上/向下平移(up/down shifted)、或旋转来产生另一个格式单元，也就是说，一个重复单元内的第二个格式单元可由第一个才各式单元加以反转、镜射、左移、右移、上移、下移、旋转或上述方法合并使用而产生。
在本发明的一些实施方式中，一个格式单元的大小为N*N个像素，而一个重复单元的大小则为N*2N个像素。通过采用由不同格式单元所构成的一个欠采样格式，应用于交错扫描视频处理的帧运动估计以及图场运动估计两者都可以得到均勻的采样分布，其细节将在后续的揭示中详细i兑明。请参阅图4,图4所示为本发明建构欠采样格式的实施方式的示意图。在本实施方式中，欠采样格式是用来对当前宏块对及候选宏块对进行像素采样，而每个欠采样格式是由多个重复单元所构成。举例来说，大小为16*32像素的宏块对可经由图3所示的四皇后棋格欠采样格式310来进行采样，其中四皇后棋格欠采样格式310的重复单元为大小为4*4像素的格式单元。在本发明的一些实施方式中，利用结合两个或两个以上的4*4像素的格式单元来构成欠采样格式中的每个重复单元。如图4所示的范例中，大小为4*4像素的格式单元400被选定为第一才各式单元，用来与才各式单元410、 420、 430中所选出的第二格式单元进行结合，来构成大小为4*8像素的重复单元。在本实施
方式中，重复单元中的第二格式单元必须相异于第一格式单元，但是第二格式单元可允许从第一格式单元书f生而出。举例来说，如图所示，
格式单元410经由对第一格式单元400进行逆时钟旋转90度而产生出的衍生格式；相似地，格式单元420经由第一才各式单元400相对于纵轴的镜射而产生，以及格式单元430是经由第一才各式单元400相对于横轴的镜射而衍生出来的。一旦第二格式单元被选定之后，两个选定的格式单元(第一格式单元以及第二格式单元)便可构成大小为4*8像
素的重复单元以供欠采样格式来使用。在本实施方式中，一个欠采样格式经由16个大小为4*8像素的重复单元所构成，而欠采样格式用来在运动估计运算中，对第一个帧中的当前宏块对以及第二帧中的候选宏块对进行适当的采样。
请参阅图5，图5所示为本发明欠采样格式的实施方式的示意图。如图5所示，本实施方式将两个格式单元结合以构成欠采样格式所需的重复单元。在本实施方式中，第一格式单元510 (其大小为4*4像素)位于欠采样格式500中的左上方角落；而第二格式单元520 (其大小为4*4像素)则位于第一格式单元510的正下方，且第二格式单元520为第一格式单元510沿横轴(或可沿纵轴)镜射而成的衍生格式。欠采样格式500是由不断重复第一格式单元510以及第二格式单元 520而成。在本实施方式中，经由使用整个欠采样格式500,可在执行帧运动估计时由宏块对取得具有均匀分布特性的采样点。除此之外，在处理图场运动估计时，欠采样格式530可供奇图场使用，而欠采样格式540则可供偶图场使用，且两个欠采样格式530以及540均可由宏块对中提取出具有均匀分布特性的采样点，因此，相较于现有技术的图场运动估计(如图3所示)，本发明欠采样格式(例如欠采样格式5 3 0 与540)中^f皮此间隔的垂直线之间不再出现未^皮采样的区域了。因此本发明的欠采样格式500可同时提供图场运动估计以及帧运动估计一个较均匀的采样分布。
在这里请注意到，在前述的实施方式中尽管使用了四皇后棋格欠采样格式中的一个格式单元及由上述格式单元变化而成的衍生格式，然而在本发明其它实施方式中，也可采用一些不同欠采样格式中的格式单元，举例来说，这些不同欠采样格式可以是全域采样格式(full sampling pattern)、四分之一才各式(quarter pattern)、或/\皇后4其才各才各式 (8-queen pattern)。这些用以采样当前宏块对以及候选宏块对的欠采样格式，其至少包含有两个相异的格式单元。除此之外，在不同的实施方式中，这些格式单元也可具有不同的变化组合以符合特定压缩需求或特定采样需求。另外，在本发明其它实施方式中，欠采样格式的重复单元可将不同的格式单元并排地结合在一起，举例来说，可利用将第二格式单元置于第一格式单元的右侧来构成大小为8*4像素的重复单元。
另外，本发明所揭示的欠采样格式设计可同时适用于交错扫描的 -现频源和循序扫描的-见频源，由于循序扫描^L频的块匹配单元为宏块而非宏块对，故应用于循序扫描视频源的欠采样格式的大小可为 16*16像素。
如前述的揭示，欠采样格式是用来由当前宏块对以及候选宏块对中选取出某些像素以进行误差量度的计算，而对于参考帧的搜索范围内的候选宏块对来说，这些候选宏块对的误差量度则被彼此比较，以根据这些误差量度之中的最小误差量度来确定移动向量，且上述移动向量标示出相匹配宏块对的位置。所选用的误差量度值可根据本发明的不同实施方式而变，且所选用的误差量度值可包含有绝对误差总和 (Sum of Absolute Differences, SAD)。
请参阅图6,图6所示为本发明应用于视频压缩的运动估计方法的实施方式的流程图。请注意到，倘若实质上可达到相同的结果，并不一定需要遵照图6所示的流程中的步骤顺序来依序进行。本流程包
含有以下步骤
步骤610:将第一帧划分成多个宏块对，其中包含当前宏块对。步骤620:在第二帧的候选宏块上进行对上述当前宏块对的块匹配操作。
步骤630:根据欠采样格式对上述当前宏块对以及上述候选宏块对进行釆样以获取欠采样结果，其中上述欠采样格式是由多个重复单元所构成，而其中每个重复单元包含有第一格式单元以及第二格式单元。
步骤640:根据上述欠采样结果对上述当前宏块对以及上述候选宏块对进行误差量度。
在图6所述的运动估计方法的其它实施方式中，也可使用第三格式单元来构成上述欠采样格式，而上述这些设计变化提供了在不同采样需求下所需的特定采样分布。
利用提供由不同格式单元所构成的欠采样格式，在交错扫描的视频中，帧运动估计以及图场运动估计两种运动估计方法都可以得到均匀的采样分布。在本发明的其它实施方式中，可从第一格式单元经由旋转、镜射、水平/垂直平移等操作来衍生出第二格式单元，而使用第一、第二格式单元可轻易地产生出本发明的欠采样格式，而这第一格式单元可以是一个被广泛使用在像素匹配欠采样技术中的传统格式 (例如四皇后棋格格式)的格式单元。总结来说，本发明提供的视频压
缩的欠采样技术更加有效率以及具有优越的运动估计能力。
本发明虽用较佳实施方式说明如上，然而其并非用来限定本发明的范围，任何本领域中技术人员，在不脱离本发明的精神和范围内，做的任何更动与改变，都在本发明的保护范围内，具体以权利要求界定的范围为准。
权利要求
1.一种应用于视频压缩且使用像素匹配欠采样的运动估计方法，其包含有获取第一帧的当前宏块对；以及对第二帧的候选宏块对与上述当前宏块对执行块匹配操作，其中上述块匹配操作包含有根据欠采样格式对上述当前宏块对以及上述候选宏块对进行欠采样以获取欠采样结果；以及根据上述欠采样结果对上述当前宏块对以及上述候选宏块对进行误差量度；其中上述欠采样格式是由多个重复单元所构成，以及每一重复单元是由第一格式单元以及第二格式单元所构成。
2. 如权利要求1所述的应用于视频压缩且使用像素匹配欠采样的运动估计方法，其特征在于，每一格式单元的大小为4*4像素，以及每一重复单元的大小为4*8像素。
3. 如权利要求2所述的应用于视频压缩且使用像素匹配欠采样的运动估计方法，其特征在于，上述第一格式单元为四皇后棋格格式中的一个重复单元。
4. 如权利要求1所述的应用于视频压缩且使用像素匹配欠采样的运动估计方法，其特征在于，上述第二格式单元是衍生自上述第一格式单元。
5. 如权利要求4所述的应用于视频压缩且使用像素匹配欠采样的运动估计方法，其特征在于，上述第二格式单元是经由上述第一格式单元旋转预定角度而成。
6. 如权利要求4所述的应用于视频压缩且使用像素匹配欠采样的运动估计方法，其特征在于，上述第二格式单元是经由上述第一格式单元沿着横轴或纵轴镜射而成。
7. 如权利要求4所述的应用于视频压缩且使用像素匹配欠采样的运动估计方法，其特征在于，上述第二格式单元是经由上述第一格式单元向左平移或向右平移预定列而成。
8. 如权利要求4所述的应用于视频压缩且使用像素匹配欠采样的运动估计方法，其特征在于，上述第二格式单元是经由上述第一格式单元向上平移或向下平移预定4亍而成。
9. 如4又利要求1所述的应用于^L频压缩且使用像素匹配欠采样的运动估计方法，其特征在于，更包含有重复对多个候选宏块对进行上述当前宏块对的上述块匹配操作，用以计算出多个误差量度；以及根据上述多个误差量度中的最小误差量度来确定移动向量。
10. 如权利要求1所述的应用于浮见频压缩且使用像素匹配欠采样的运动估计方法，其特征在于，上述误差量度是绝对误差总和。
11. 如权利要求1所述的应用于视频压缩且使用像素匹配欠采样的运动估计方法，其特征在于，上述多个重复单元的上述第一格式单元与上述第二格式单元为彼此水平相邻或垂直相邻。
12. 如权利要求1所述的应用于一见频压缩且使用像素匹配欠采样的运动估计方法，其特征在于，上述第一格式单元的大小为N+N像素。
全文摘要
一种应用于视频压缩且使用像素匹配欠采样(sub-sampling)的运动估计方法。运动估计方法包含有获取第一帧的当前宏块对，以及对第二帧的候选宏块对与当前宏块对执行块匹配操作根据欠采样格式对当前宏块对以及候选宏块对进行欠采样以获取欠采样结果，以及根据欠采样结果对当前宏块对以及候选宏块对之间进行误差量度。其中上述欠采样格式是由多个重复单元所构成，以及每一个重复单元是由第一格式单元以及第二格式单元所构成。本发明对图场运动估计而言具有均匀的采样分布，故使得匹配结果达到最佳化，也附带增强了视频压缩的图像质量。
文档编号H04N7/26GK101409839SQ20081014713
公开日2009年4月15日申请日期2008年8月20日优先权日2007年10月10日
发明者郭志辉, 陈拓维, 黄毓文申请人:联发科技股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈拓维;黄毓文;郭志辉
技术所有人：联发科技股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。