用于以分级流形式编码视频内容的装置和方法

文档序号：7938300阅读：250来源：国知局

专利名称：用于以分级流形式编码视频内容的装置和方法
技术领域：
本发明总体上涉及以时间分级流形式编码视频内容的领域。具体而言，本发明涉及用于以时间分级流形式编码视频内容的装置和方法，其中
所述视频内容由第一隔行图像组(a first group of interlaced pictures)和第二逐行图像组(a second group of progressive pictures)表示，所述隔畔亍图像由隔行的(interlaced)第一场和第二场形成。
背景技术：
多层编码(multi-layer coding)方法适于以编码数据的分级流形式编码视频内容。可分级性(scalability)表示对信息进行分级以使该信息能够以数个分辨率和/或质量和/或时间频率等级编码的能力。由这种类型的编码方法产生的数据流一般被分为数个层，具体而言是底层(base layer)以及一个或多个增强层(enhancement layer)。这种编码方法能够使视频内容以单一流形式编码但例如适于接收装置的各种能力(从CPU 意义而言显示装置的特征等方面)。第一接收装置只能解码所述流关于底层的一部分，而更有效的第二接收装置解码整个流。这种编码方法对于以单一流形式编码图像特别有效，其中底层相对于内容的第一版本，例如HD 1080i30Hz版本，增强层相对于相同视频内容的第二版本，例如HD 1080p 60Hz版本。这种编码数据流非常适合用能够以HD 1080i 30Hz格式重建 (reconstruct)内容现有解码平台来解码。此相同内容将来还能够用以HD 1080p 60Hz格式重建内容的未来解码平台来解码。现有平台只解码所述流相对于底层的部分，而未来的平台将解码整个流。
这种编码方法适于通过采用名为层间预测(inter-layer prediction) 的工具由底层图像部分编码增强层图像或图像的部分(例如块或宏块)。这种工具在2007年1月出版的名为"Joint Draft 9 of SVC amendment" 的ISO/IEC MPEG和ITU-T VCEG的文件JVT-V201中定义。i亥文件描述了 MPEG-4AVC与可分级性相关的SVC扩展。更具体地，增强层图像的图像数据块被空间预测(帧内编码模式)或时间预测(帧间编码模式)。在后一种情况下，根据标准预测模型从增强层的图像块(例如双向预测模型 (bidirectional prediction mode)、直接予员测模型(direct prediction mode)、预期预测模型(anticipated prediction mode)等)进行预观U，或者根据层间预测模型从底层的图像块进行预测。在后一种情况下，运动数据(例如将宏块划分为块，可能的运动矢量和参考图像索引)以及与增强层的图像块相关的可能的图像数据从与底层的图像块相关的图像数据的运动数据分别推导(deduced)或继承(inherited)而来。
并且，已知某些编码方法适于根据用于逐行图像的例如图l所示层次图像组GOP (Group Of Pictures)结构每GOP地编码视频内容。在图1 中，根据二元图像间时间相依性结构(M.Flierl et B. Girod， "Generalized B Pictures and the Draft JVT/H. 264 Video Compression standard" ， IEEE Trans, on Circuits and Systems for Video Technology' vol. 13， pp. 587-597， 2003年7月)对G0P进行编码。图像之间的时间相依性由虚线显示。图像2时间相依于图像0和4， SP，图像2或图像2
5的一部分可以根据图像0和4通过时间预测进行编码。根据这种结构，图
像在多个时间级(temporal level)上被编码，给定时间级上的图像只能够根据低时间级或者相同时间级的图像以及先前编码的其自身来进行编码。这种结构被称为二元(dyadic),当给定时间级位于频率F，如果下一时间级的图像被加入，则获得等于前一频率两倍的频率，即2F。这种结构的优点是能够通过提供高压縮比产生时间分级数据流。事实上，通过忽略较高时间级，即通过不解码与这些时间级相关的编码数据流，相对于通过解码整个编码数据流而重建的视频的时间频率，此视频的时间频率将减小。为了达到此目的，一项时间级信息被插入至流中。该信息特别地由解码方法使用以识别与给定时间级相关的编码数据分组(data packet),并因而识别需忽略的编码数据分组以在给定频率重建视频内容。根据SVC标准，时间级信息编码于每个NAL (网络适配层)型分组的头(header)中。
在隔行视频的情况下，每个图像由隔行的第一场和第二场形成。当隔行视频以图像模式编码时，图像的两场同时编码。当隔行视频以场模式编码时，图像的两场连续地编码，即第二场紧随在第一场之后编码。这种类型编码的有益之处在于能够降低解码器需要的存储空间。事实上，如果同一图像的两场未连续编码，如果需要，在解码器侧，将重建的第一场存储在存储器中，直至第二场本身被重建，从而能够恢复整个图像。这种方法需要更多的存储空间。
如果所述第一场是所谓的奇场或顶场(TOP场)，则第二场是偶场或底场(BOTTOM场)，反之亦然。在逐行视频的情况下使用图1所示层次G0P 结构，在以场模式编码的隔行视频情况下，用组成图像的两场替换图像，如图2所示。在此图中，顶场由实线显示，底场用虚线显示。在图2中，
系数为k的隔行图像由顶场kT和底场kB构成。在此图中，图像2的两场 2T和2B连续编码，即图像2的第二场紧随图像2的第一场编码。这使得对图像2的编码并因而对于所述图像未来的解码不引入任何时间。在此图中，场2T的全部或者部分都可以根据先前编码的场0T、 0B、 4T和4B编码。请注意此场还可以以帧内模式(即独立于该序列的任何其他图像)全部或者部分地编码。对于场2B，可以根据先前编码的场OT、 0B、 4T和4B 以及根据场2T编码。此结构在隔行的情况下具有与逐行的情况相同的优点(即高压縮率和时间分级性)。
另外，在已知的多层编码方法中，底层和增强层根据图l和图2所示的层次GOP结构进行编码。这种两层层次GOP结构(即隔行的底层和逐行的增强层)示于图3。在此图中，增强层的逐行图像由系数k表示。时间戳(timestamp)与增强层的每个图像以及底层的每个场相关联。在图3 中，具有相同时间戳的增强层的图像以及底层的场垂直地重合。增强层的图像可以根据在底层中对应的即具有相同的时间戳的场利用层间预测工具进行编码，或者根据增强层的一个或多个先前编码的图像甚至独立于该序列的其他图像进行编码(帧内编码)。例如，增强层的图像2可以由底层的场1T的数据利用层间预测方法进行全部或者部分编码。但是，当这种结构用于SVC标准的范畴之内时,增强层的某些图像不能利用层间预测。时间级3的图像就是这种情况。事实上，SVC标准只允许相同时间级的图像之间的层间预测。但是，图像1位于时间级3，而相同时间戳的场即场 0B位于时间级0。并且，通过"型(profile)"的定义，SVC标准限制了适于存储参考图像的存储空间。由于存储空间的这种限制，在增强层的图像的编码过程中，图像0B不再出现在所述参考图像存储器中。事实上，
图像和帧是按照下面的顺序编码0T、 0B、 0、 4B、 4T、 8、 2T、 2B、 4、 1T、 1B、 2、 3T、 3B、 6、 1、 3、 5、 7、 9。因此，假设参考图像存储器的容量能够存储4个参考图像，则在图像1的编码过程中无法使用图像0T、 0B和0作为参考。为了在图像1与对应的场OB之间进行层间预测，必须在存储器中存储15个参考图像。这种无法通过层间预测编码增强层的某些图像的事实对于编码性能有负面影响。

发明内容
本发明的目的是克服现有技术的至少一个缺点。
本发明涉及一种以时间分级流形式编码视频内容的方法。所述内容由第一隔行图像组和第二逐行图像组表示，其中所述第一隔行图像组由隔行的第一场和第二场形成，每个第二逐行图像组的图像与第一隔行图像组的场相重合。所述方法包括下述步骤
按照第一预定编码顺序在M个时间级上编码第一隔行图像组的场，其中M是绝对大于1的整数，从而隔行图像的第二场紧随隔行图像的第一场
之后编码，并且
按照第二预定编码顺序在M个时间级上编码第二逐行图像组的图像。根据本发明，第二预定编码顺序与第一预定编码顺序相同。优选地，所述方法使增强层的每个图像根据底层的场通过层间预测进行完全或者部分编码。
根据本发明的另外一个方面，以绝对高于第一隔行图像组的图像的第一场编码的时间级的时间级编码第一隔行图像组的图像的第二场，并且以绝对高于与第一场重合的第二逐行图像组的图像编码的时间级的时间级编码与第二场重合的第二逐行图像组的图像。
根据本发明，根据在低于或者等于给定时间级的时间级先前编码的场完全或者部分编码以给定时间级编码的场。
本发明涉及一种以时间分级流形式编码视频内容的装置。所述内容由第一隔行图像组和第二逐行图像组表示，其中所述第一隔行图像组由隔行的第一场和第二场形成，每个第二逐行图像组的图像与第一隔行图像组的场相重合。所述装置包括
第一编码装置，用于按照第一预定编码顺序在M个时间级上编码第一隔行图像组的场，其中M是绝对大于1的整数，从而隔行图像的第二场紧随隔行图像的第一场之后编码，并且
第二编码装置，用于按照第二预定编码顺序在M个时间级上编码第二
逐行图像组的图像。
根据本发明，第二预定编码顺序与第一预定编码顺序相同。

通过下面参照附图对本发明实施方式的详细说明，本发明的上述方面、特点和优势将得到更清楚的理解。其中
图r是根据现有技术的逐行图像组的层次结构；
图2是根据现有技术的隔行图像组的层次结构；
图3是根据现有技术的图像组的多层结构；
图4是根据本发明第一实施方式的图像组的多层结构；图5是根据本发明第二实施方式的图像组的多层结构； .图6示出了根据本发明的编码方法；图7示出了根据本发明的编码装置；图8示出了根据本发明另一方式的编码装置。具体实M^r式本发明涉及一种以时间分级流形式编码视频内容的方法和装置。所述内容由第一隔行图像组和第二逐行图像组表示，即所述第一隔行图像组由隔行的第一场和第二场形成，每个第二逐行图像组的图像与第一隔行图像组的场时间相重合，即具有相同时间戳。被称为底层图像的所述第一隔行图像组的图像以底层的形式编码，被称为增强层图像的所述第二逐行图像组的图像以增强层的形式编码。下面将参照图4和图6说明本发明的第一实施方式，其中具有第一M/2 隔行图像组、即M场，以及第二M逐行图像组，其中M是正整数。在图4 和图6中，M=10。 10个图像或场根据层次GOP的二元结构在3个时间级0， 1和2上编码。本发明包括底层的隔行图像的场模式的编码步骤10。例如，底层的图像根据IS0/IEC文件14496-10: 2005中定义的MPEG-4 AVC编码，时间相依性由根据图2定义的G0P结构确定。底层的帧按照预定的编码顺序进行编码。在本实施例中，时间级O的场在更高时间级的场之前按照下面的顺序进行编码0T、 0B、 4T和4B。然后时间级1的场按照下面的顺序编码2T和2B并可以根据时间级0的场进行编码。随后，时间级2的场按照下面的顺序进行编码1T、 1B、 3T和3B。场1T根据先前编码的较低层的帧完全或部分编码并且在其编码时仍存储在存储器中。类似地，场1B、 3T和3B根据较低时间级的场或者根据相同的先前编码的时间级进行编码。本发明的步骤10与根据图2所示的现有技术的方法的底层编码方法相同。根据本发明，在步骤20中，增强层的图像根据图1和图3中所示的现有技术的标准层次GOP结构进行编码。根据此目的，对图3中所示的G0P 结构进行修改，使增强层图像按照与底层的场相同的编码顺序进行编码。与底层相同图像的两场时间重合的增强层的两个图像连续编码，第二图像紧随在第一图像之后编码，这与标准结构是不同的。例如，采用标准层次 G0P结构，图像1并非紧随在图像0之后编码。事实上，在图像0和1之间，图像8、 4、 2和6被编码。新的层次GOP结构使得增强层的图像能够按照与底层相同的编码顺序成对编码，即与底层的图像的第二场具有相同时间戳的增强层的图像紧随与底层的图像的第一场具有相同时间戳的增强层的图像编码。在此实施方式中，图像和帧按照下述顺序编码0T、 0B、 0、 1、 4T、 4B、 8、 9、 2T、 2B、 4、 5、 1T、 1B、 2、 3、 3T、 3B、 6、 7。底层的图像因而按照下述顺序编码0、 1、 8、 9、 4、 5、 2、 3、 6、 7，与底层的场的编码顺序相同，即 0T、 0B、 0、 1、 4T、 4B、 2T、 2B、 1T、 1B、 3T、 3B。因此，假设参考图像存储器具有存储4个参考图像的容量，因而在图像1的编码过程中可以利用图像0T、 0B和0作为参考，而这与图3所示的二元G0P结构不同。在后一种情况中，需要存储15个参考图像以使得图像1能够受益于层间预测。因此，系数2k的增强层图像能够受益于k顶场的层间预测，而图像 2k+l受益于k底场的层间预测。因为图像2k和图像2k+l连续编码，即与底层的场具有相同编码顺序，k底场不可用的问题不会产生。因而具有奇数系数的图像能够受益于其对应的底场(图4中灰色矩形所示)的层间预测，这使得视频内容的编码效率得以提高。这种GOP结构给予用于增强层的全部图像的层间预测优先级。但是，虽然其通过除去(shedding)更高时间级即时间级2的图像获得时间可分级性，时间可分级性没有图3所示G0P结构精细，因为两个连续图像需要被除去，例如图像2和3以及图像6和7。根据本发明的另外一个方面，在参照图5的说明中，与图像和场相关联的时间级相应于图4所示的图像和场的时间级进行修改。在SVC标准框架内，时间级如上所述编码在每个NAL单元的头中。根据本发明，对于底层的每个图像，时间级与所述图像的第二场即底场相关联，其高于与所述图像的第一场即顶场相关联的时间级。例如，时间级0与场OT相关联，时间级3与场0B相关联，时间级1与场2T相关联，时间级4与场2B相关联。类似地，对于增强层的每个图像对，时间级相关联于与所述底层的图像的第二场(即图5中的底场)重合的所述对，其高于相关联于与所述底层的图像的第一场(即图5中的顶场)重合的所述对的图像的时间级。更一般而言，高于底层的顶场的时间级并分别高于偶数系数增强层图像的时间级的时间级被分配给底层的全部底场和奇数系数增强层的全部图像。一般而言，时间级因而按照下列方式与图像和帧相关对于i=0至N-l，其中N是满足下列条件的正整数2N+2=M，即 N二log(M-2)/log2。对于底层，对于满足k*2N—1处于0和2N-1之间的任何系数k:时间级i与系数k*2N—1的顶场相关联；时间级i+N分配给系数k*2N—i的底场。对于增强层，对于满足k*2N+1—'处于0和2X+1-1之间的任何系数k: 时间级i与系数k*2N+1—i的图像相关联；时间级i+N与系数l+k*2N+1—i的图像相关联。并且，为了符合svc编码标准的规定，给定时间级的场或图像不能根据更高时间级的图像或者根据先前未编码的图像编码。例如，根据本发明，与时间级3相关联的图像1不能用作与时间级2相关联的图像2的时间参考。有利地，通过不解码与最高时间级(即时间级3、 4和5)对应的NAL 单元可以获得与图3所示的二元G0P结构相同的时间分级性。因此，通过将时间级与图像和场相关联，增强层的全部图像可以通过利用层间预测由底层的相应场进行编码，同时保持更好精细度的时间可分级性。请参看图7，本发明涉及编码装置6。图7中只示出本发明的主要元件。现有技术的视频编码器中对于本领域普通技术人员已知的元件(例如运动估计模块、运动补偿模块等)在图中未示出。所示模块均为功能单元，在可以对应或者不对应物理上可以区分的单元。例如，这些模块或者其中的部分模块可以分组为单一部件或者构成同一软件的功能。另一方面，某些模块可以构成不同的物理实体。所述编码装置包括第一输入60、第二输入62、第一编码模块64、第一存储器66、第二存储器67、第二编码模块 68、复用模块70和输出72。第一输入60用于接收表示视频内容的第一隔行图像组II，称为底层图像。第二输入62用于接收表示相同视频内容的第二逐行图像组I2，称为增强层图像。第一编码模块64用于从第一输入60接收底层的隔行图像并以第一流si的形式按照场模式编码所述图像。底层的图像例如根据视频编码标准MPEG-4 AVC编码，场之间的时间相依性由图2所示层次G0P 结构确定。出于此目的，按照预定的编码顺序对所述场进行编码。场可以根据先前编码的场完全或者部分编码，并重建以及存储在第一存储器66 中。在编码并重建之后，场可以存储在第一存储器66和第二存储器67中。第一编码模块执行根据本发明方法的步骤10。
根据本发明的重要特征，第二编码模块68用于从第二输入62接收增强层的逐行图像并以第一流S2的形式按照与底层的场相同的编码顺序编码所述图像。与底层的相同图像的两场时间重合的增强层的两个图像连续编码，第二图像紧随在第一图像之后编码，这与标准结构不同。例如，采用标准层次GOP结构，图像1不是紧随在图像0之后编码。事实上，在图像0和1之间，图像8、 4、 2和6被编码。在编码并重建之后，场可以存储在第二存储器66中。第二编码模块执行根据本发明方法的步骤20。
复用模块70接收第一编码模块64和第二编码模块68的流Sl和S2 并将流Sl和S2复用为单一流S，该流S被发送至输出72。
根据图8所示的不同实施方式，编码装置7包括单一输入80，用于接收第二图像组。所述编码装置7还包括处理模块82，用于由第一图像组产生第二图像组I2。
根据本发明的另外一个方面，编码装置6用于根据本发明所述方法将时间级与底层的场以及增强层的图像相关联。
当然，本发明并不局限于所述实施方式。具体而言，本领域普通技术人员可以对所述实施方式进行任何改变以将其结合以获得各种优点。显然，在SVC视频编码标准的框架内对本发明进行了说明，但是本发明并不局限于所属标准。本发明以两层为例进行了说明，即隔行图像的底层和逐行图像的增强层，但是本发明也可以扩展至数个增强层。另外，在将底层图像编码为场模式的框架内对本发明进行了说明，其中顶图像(top picture)在底图像(bottom picture)之前编码("顶场优先"模式)，但本发明也可以按照相同方式应用于将底层图像编码为场模式的情况，其中底图像在顶图像之前编码("底场优先"模式)。
权利要求
1.一种以包括底层和增强层的时间分级流形式编码视频内容的方法，所述内容由第一隔行图像组和第二逐行图像组表示，其中所述第一隔行图像组由隔行的第一场和第二场形成，每个所述第二逐行图像组的图像与所述第一隔行图像组的场相重合，所述方法包括下述步骤按照第一预定编码顺序在M个时间级上编码第一隔行图像组的场作为底层(10)，其中M是大于1的整数，从而隔行图像的第二场紧随所述隔行图像的第一场之后编码，并且按照第二预定编码顺序在M个时间级上编码第二逐行图像组的图像作为增强层(20)，其特征在于，所述第二预定编码顺序与所述第一预定编码顺序相同。
2. 根据权利要求l所述方法，其中所述第一隔行图像组的图像的第二场以高于所述图像的第一场编码的时间级的时间级编码，并且与所述第二场重合的第二逐行图像组的图像以高于与所述第一场重合的第二逐行图像组的图像编码的时间级的时间级编码。
3. 根据权利要求1或2所述方法，其中以给定时间级编码的场根据在低于或者等于给定时间级的时间级先前编码的场完全或者部分编码。
4. 一种以包括底层和增强层的时间分级流形式编码视频内容的装置，所述内容由第一隔行图像组和第二逐行图像组表示，其中所述第一隔行图像组由隔行的第一场和第二场形成，每个第二逐行图像组的图像与第一隔行图像组的场相重合，所述方法包括下述步骤第一编码装置(64)，用于按照第一预定编码顺序在M个时间级上编码第一隔行图像组的场作为底层，.其中M是大于1的整数，从而隔行图像的第二场紧随所述隔行图像的第一场之后编码，和第二编码装置(68)，用于按照第二预定编码顺序在M个时间级上编码第二逐行图像组的图像作为增强层，其特征在于，所述第二预定编码顺序与所述第一预定编码顺序相同。
全文摘要
本发明涉及一种以时间分级流形式编码视频内容的方法。所述内容由第一隔行图像组和第二逐行图像组表示，其中所述第一隔行图像组由隔行的第一场和第二场形成，每个所述第二逐行图像组的图像与所述第一隔行图像组的场相重合。所述方法包括下述步骤按照第一预定编码顺序在M个时间级上编码第一隔行图像组的场，其中M是大于1的整数，从而隔行图像的第二场紧随所述隔行图像的第一场之后编码，并且按照第二预定编码顺序在M个时间级上编码第二逐行图像组的图像作为。根据本发明的特征，所述第二预定编码顺序与所述第一预定编码顺序相同。
文档编号H04N7/46GK101682766SQ200880018814
公开日2010年3月24日申请日期2008年5月30日优先权日2007年6月5日
发明者克里斯托夫·舍望斯, 樊尚·博特罗, 热罗姆·维耶龙, 爱德华·弗朗索瓦申请人:汤姆逊许可公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：爱德华.弗朗索瓦;樊尚.博特罗;克里斯托夫.舍望斯;热罗姆.维耶龙
技术所有人：汤姆逊许可公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。