解码图像的方法和使用其的装置制造方法
【专利摘要】根据本发明的用于解码图像的方法,包括步骤:接收和分析参数集,该参数集包括表示存在要在未来使用的预留信息的指示信息;当指示信息表示存在预留信息时,接收和分析包括预留信息的片头;和根据与预留信息相对应的语义和值解码图像。因此,所提供的是用于描述在支持分层图像的比特流中的附加扩展信息指示的方法和装置。
【专利说明】解码图像的方法和使用其的装置
【技术领域】
[0001]本发明涉及视频压缩技术,尤其是,涉及用于解码在比特流中的视频信息的方法和装置。
【背景技术】
[0002]近来,对高分辨率和高质量图片的需求已经在各种应用领域中增长。随着图片具有更高的分辨率和更高的质量,有关图片的信息的量也增大。
[0003]随着信息量增大,引入具有各种环境的多功能的设备和网络。因此,可以以不同的质量水平使用相同的内容。
[0004]特别地,由于终端能够支持不同质量的图片,并且建立各种网络环境,在一个环境下允许具有常规质量的图片,而在另一个环境下更高质量的图片是可用的。
[0005]例如,用户可以在家在具有更高分辨率的大屏幕显示器上欣赏通过便携式终端购买的视频内容。
[0006]近年来,随着高清(HD)广播服务可用,大量的用户习惯于高分辨率和高质量的视频,并且服务提供者和服务用户也关注具有比HDTV高四倍的分辨率的超高清(UHD)服务。
[0007]因此,需要基于对高容量视频高效率的编码和解码方法,对视频质量,例如,图像质量、分辨率、视频的大小和帧率提供可伸缩性,以便在不同的环境下对用户的需求提供变化的视频服务质量。
【发明内容】
[0008]技术问题
[0009]本发明的一个方面是提供用于描述在支持分层视频的比特流中的附加扩展信息指示的方法和装置。
[0010]本发明的另一个方面是提供用于表示附加扩展信息指示和附加扩展信息的方法和装置。
[0011]技术方案
[0012]本发明的一个实施例提供一种视频解码方法,包括:接收和分析参数集,该参数集包括指定是否存在供未来使用的预留信息的指示信息,当存在指定预留信息的指示信息时,接收和分析包括预留信息的片头,以及基于与预留信息对相对应的语义和值解码视频。
[0013]指示信息可以是被包括在图片参数集中而被接收的。
[0014]指示信息可以是指定对于片头增加的额外的片头比特数以包括预留信息的信息,并且当比特流支持单层视频时,额外的片头比特数可以是O。
[0015]指示信息可以在指定在图片参数集中激活的序列参数集(SPS)的SPS标识符(ID)的语法元素和指定是否存在指示片头是否是相关的片头的标记信息的语法元素之后的位置上被用信号发送。
[0016]预留信息可以包括与额外的片头比特数相对应的语义和值的数目。
[0017]预留信息可以在当前片不是相关的片时被接收。
[0018]预留信息可以用于多视点层和支持空间可伸缩性的视频或者三维(3D)视频。
[0019]指示信息和预留信息可以包括在网络提取层(NAL)单元的有效载荷中被接收。
[0020]有益效果
[0021]本发明的一个实施例提供用于描述在支持分层视频的比特流中的附加扩展信息指示的方法和装置。
[0022]本发明的另一个实施例提供用于表示附加扩展信息指示和附加扩展信息的方法和装置。
【专利附图】
【附图说明】
[0023]图1是示意地图示根据本发明的一个示例性实施例的视频编码装置的方框图。
[0024]图2是示意地图示根据本发明的一个示例性实施例的视频解码装置的方框图。
[0025]图3是示意地图示根据本发明的一个示例性实施例使用多个层的可伸缩的视频编译结构的示意图。
[0026]图4图示根据本发明由解码装置处理的编译的视频的层状结构。
[0027]图5图示根据本发明一个示例性实施例的VCL NAL单元的NAL单元头部标记扩展。
[0028]图6图示根据本发明一个示例性实施例的非VCL NAL单元的NAL单元头部标记扩展。
[0029]图7是图示根据本发明的视频解码装置的方框图。
[0030]图8是图示根据本发明的视频解码方法的流程图。
【具体实施方式】
[0031]本发明可以不同地变化和修改,并且参考不同的示例性实施例图示,其中一些将在附图中详细描述和示出。但是,这些实施例不意欲限制本发明。在此处使用的术语仅仅是为了描述特定的实施例的目的,并且不意欲限制本发明的技术思想。如在此处使用的,单数形式“一”、“一个”和“该”意欲同样包括复数形式,除非上下文另外清楚地表示。应该进一步理解,当在本说明书中使用时,术语“包括”和/或“具有”指定陈述的特征、整数、步骤、操作、元件、部件和/或其组合的存在,但是,不排除一个或多个其它的特征、整数、步骤、操作、元件、部件和/或其组合的存在或者增加。
[0032]虽然为了描述在视频编码装置/解码装置中不同的区别功能的方便起见,在附图中图示的元件被单独地示出,这样的配置不表示每个元件由单独的硬件组成或者软件组成来构成。也就是说,至少两个元件可以被合并为单个元件,或者单个元件可以被分成多个元件去执行功能。应当注意,不脱离本发明的本质,某些元件被集成为一个组合元件,和/或一个元件被分成多个单独的元件的实施例包括在本发明的范围中。
[0033]在下文中,本发明的示例性实施例将参考伴随的附图被详细描述。在附图中相同的附图标记自始至终指的是相同的元件,并且相同的元件的冗余描述在文中将被省略。
[0034]图1是示意地图示根据本发明的一个示例性实施例的视频编码装置的方框图。可伸缩视频编码/解码方法或者装置可以通过扩展没有提供可伸缩性性的常规视频编码/解码方法或者装置来实现,并且可伸缩性视频编码装置可以基于图2的视频编码装置来配置。
[0035]参考图1,视频编码装置100包括图片分割模块105、预测模块110、变换模块115、量化模块120、重新排列模块125、熵编码模块130、去量化模块135、反变换模块140、滤波模块145,和存储器150。
[0036]图片分割模块105可以将输入图片划分为作为处理单元的至少一个块。在这里,作为处理单元的块可以是预测单元(PU)、变换单元(TU),或者编译单元(CU)。
[0037]由图片分割模块105划分的处理单元块可以具有四树结构。
[0038]预测模块110可以包括执行帧间预测的帧间预测模块,和执行帧内预测的帧内预测模块,这将被描述。预测模块110通过对来自分割模块105的图片的处理单元执行预测产生预测块。在预测模块110中的图片的处理单元可以是CU、TU或者PU。此外,预测模块110可以确定对处理单元执行的预测是帧间预测还是帧内预测,并且可以确定每个预测方法的细节(例如,预测模式)。在这里,用于执行预测的处理单元可以不同于用于确定预测方法和有关预测方法细节的处理单元。例如,预测方法和预测模式可以通过PU确定,而预测可以通过TU执行。
[0039]在帧间预测中,预测块可以通过基于有关当前图片的先前的和/或后续的图片的至少一个的信息执行预测来产生。在帧内预测中,预测块可以通过基于有关在当前图片内的像素的信息执行预测来产生。
[0040]跳跃模式、合并模式或者运动矢量预测(MVP)模式可以用作帧间预测方法。在帧间预测中,可以选择用于PU的参考图片,并且可以选择对应于的参考块。参考块可以作为像素间单元被选择。随后,产生具有与当前PU最小残留信号和最小大小运动矢量的预测块。
[0041]预测块可以作为整数采样单元或者作为分数像素单元,诸如1/2像素单元和1/4像素单元产生。在这里,运动矢量也可以以分数像素表示。
[0042]包括帧间预测中选择的参考像素的索引、运动矢量(例如,运动矢量预测器)和残留信号的信息被熵编码,并且被传送给解码装置。在跳跃模式中,由于预测块可以是重建块,所以残留可以不被产生、变换、量化和传送。
[0043]在帧内预测中,预测模式可以由确定,并且预测可以由执行。或者,预测模式可以由确定,并且帧内预测可以在TU中执行。
[0044]帧内预测可以包括33个方向预测模式,和两个或更多个无方向模式。无方向模式可以包括DC预测模式和平面模式。
[0045]在帧内预测中,预测块可以在对参考采样应用滤波之后产生。在这里,可以针对帧内预测模式和/或当前块的大小确定是否将滤波应用于参考采样。
[0046]I3U可以是具有不同大小/形式的块。例如,在帧间预测中,I3U可以是2NX2N、2NXN、NX2N或者NXNi夹(N是整数)。在帧内预测中,I3U可以是2NX 2N或者NXN块(N是整数)。在这里,具有NXN大小的PU可以仅仅应用于特定的情形。例如,NXN PU仅仅对于具有最小大小的CU,或者仅仅对于帧内预测是可用的。除了具有先前的大小的之夕卜,PU还可以包括NXmN、mNXN、2NXmN和mNX2N块 (m〈l)。
[0047]在产生的预测块和原始块之间的残留值(或者,残留块或者残留信号)被输入给变换模块115。此外,有关用于预测的预测模式和运动矢量的信息通过熵编码模块130与残留值一起编码,并且传送给解码装置。
[0048]变换模块115通过TU变换残留块,并且产生变换系数。
[0049]变换块是相同的变换被应用到的采样的矩形块。变换块可以是TU,并且具有四树结构。
[0050]变换模块115可以基于应用于残留块的预测模式和该块的大小执行变换。
[0051]例如,当帧内预测应用于残留块,并且该块具有4X4残留阵列时,变换模块115可以使用离散余弦变换(DST)变换残留块。否则,变换模块115可以使用离散正弦变换(DST)变换残留块。
[0052]变换模块115可以通过变换产生变换系数的变换块。
[0053]量化模块120可以量化由变换模块115变换的残留值,即,变换系数,以产生量化的变换系数。由量化模块120产生的系数被提供给去量化模块135和重新排列模块125。
[0054]重新排列模块125重新排列由量化模块120提供的量化的变换系数。重新排列量化的变换系数可以提高在熵编码模块130中的编码效率。
[0055]重新排列模块125可以使用系数扫描将量化的变换系数的二维(2D)块重新排列为一维(ID)矢量。
[0056]熵编码模块130可以熵编码由重新排列模块125重新排列的量化的变换系数。各种编码方法,诸如指数Golomb、上下文自适应可变长度编译(CAVLC),和上下文自适应二进制算术编译(CABAC)可以用于熵编码。熵编码模块130可以编码从重新排列模块125和预测模块110接收的各种类型的信息,诸如量化的变换系数信息和有关CU的块类型信息、预测模式信息、分割单元信息、PU信息、传送单元信息、运动矢量信息、参考图片信息、块内插信息和滤波信息。
[0057]必要时,熵编码模块130也可以将变化应用于接收的参数集或者语法。
[0058]去量化模块135去量化由量化模块120量化的值,也就是说,量化的变换系数,并且反变换模块140反变换由去量化模块135去量化的值。
[0059]通过去量化模块135和反变换模块140产生的残留值与由预测模块110预测的预测块合并,从而产生重建块。
[0060]图1图示通过经由加法器将残留块与预测块合并产生重建块。在这里,加法器可以被认为是用于产生重建块的单独模块(重建块产生模块)。
[0061]滤波模块145可以将去块滤波、自适应循环滤波(ALF)和采样自适应偏移(SAO)应用于重建的图片。
[0062]去块滤波可以除去在重建的图片中的块之间的边界上产生的块失真。ALF可以基于通过将重建的图片与原始图片比较获得的值来执行滤波,重建的图片是通过使用去块滤波器对块滤波而获得的。可以仅仅为了高效率而采用ALF。SAO以像素为单位重建在已经对其应用了去块滤波的残留块与原始图片之间的偏移差,其中使用带偏移或者边缘偏移。
[0063]同时,滤波模块145可以不必将滤波应用于在帧间预测中使用的重建块。
[0064]存储器150可以存储重建块或者经由滤波模块145获得的图片。存储在存储器150中的重建块或者图片可以被提供给执行帧间预测的预测模块110。
[0065]图2是示意地示出根据本发明的一个示例性实施例的视频解码装置的方框图。如上图1所述,可伸缩的视频编码/解码方法或者装置可以通过扩展没有提供可伸缩性的常规视频编码/解码方法或者装置来实现,并且可伸缩的视频解码装置可以基于图2的视频解码装置配置。
[0066]参考图2,视频解码装置200可以包括熵解码模块210、重新排列模块215、去量化模块220、反变换模块225、预测模块230、滤波器模块235,和存储器240。
[0067]当视频比特流被从视频编码装置输入时,输入的比特流可以根据与由视频编码装置使用的处理视频信息的相同的过程被解码。
[0068]例如,如果视频编码装置使用可变长度编译(VLC),诸如CAVLC,执行熵编码,则熵解码模块210可以通过配置与在编码装置中使用的相同的VLC表执行熵解码。此外,如果视频编码装置使用CABAC执行熵编码,则熵解码模块210也可以使用CABAC执行熵解码。
[0069]在由熵解码模块210解码的信息之中用于产生预测块的信息可以被提供给预测模块230。由熵解码模块210熵解码的残留值,S卩,量化的变换系数,可以输入到重新排列模块 215。
[0070]重新排列模块215可以基于在编码装置中使用的重新排列方法重新排列有关由熵解码模块210熵解码的比特流的信息,即,量化的变换系数。
[0071]重新排列模块215可以重建和重新排列系数的ID矢量为系数的2D块。重新排列模块215可以基于当前块(变换块)的预测模式和变换块的大小扫描系数以产生系数(量化的变换系数)的2D块。
[0072]去量化模块220可以基于从编码装置提供的量化参数和重新排列的块系数执行去量化。
[0073]反变换模块225可以响应于由编码装置的变换模块执行的DCT和DST,对由视频编码装置执行的量化结果执行反DCT和/或反DST。
[0074]反变换可以基于由视频编码装置确定的图片的传送单元或者分割单元执行。视频编码装置的变换模块可以取决于多个信息元素,诸如,预测方法、当前块的大小和预测方向来有选择地执行DCT和/或DST,并且视频解码装置的反变换模块225可以基于有关由视频编码装置的变换模块执行的变换的信息执行反变换。
[0075]预测模块230可以基于有关从熵解码模块210提供的预测块的产生的信息,和有关由存储器240提供的先前解码的块和/或图片的信息产生预测块。
[0076]当用于当前的预测模式是帧内预测模式时,帧内预测可以基于有关在当前图片中的像素的信息执行以产生预测块。
[0077]当用于当前PU的预测模式是帧间预测模式时,用于当前的帧间预测可以基于有关当前图片的先前的和后续的图片的至少一个的信息执行。在这里,用于由视频编码装置提供的当前PU的帧间预测所必需的运动信息,例如,有关运动矢量和参考图片索引的信息可以通过检查从编码装置接收的跳越标记和合并标记推导出。
[0078]重建块可以使用由预测模块230产生的预测块和由反变换模块225提供的残留块产生。图2图示重建块通过加法器将预测块与残留块合并来产生。在这里,加法器可以被认为是用于产生重建块的单独的模块(重建块产生模块)。
[0079]当使用跳跃模式时,预测块可以是重建块,而无需发送残留块。
[0080]重建块和/或图片可以提供给滤波模块235。滤波模块235可以将去块滤波、SAO和/或AFL应用于重建块和/或图片。
[0081]存储器240可以存储要用作参考图片或者参考块的重建的图片或者块,并且将重建的图片提供给输出单元。
[0082]在解码装置200的熵解码模块210、重新排列模块215、去量化模块220、反变换模块225、预测模块230、滤波器模块235和存储器240之中直接与视频解码相关的部件,例如,熵解码模块210、重新排列模块215、去量化模块220、反变换模块225、预测模块230和滤波器模块235,与其它的部件分离,可以被定义为解码器或者解码单元。
[0083]此外,解码装置200可以进一步包括分析模块(未示出),用于分析有关包括在比特流中的编码的视频的信息。分析模块可以包括熵解码模块210或者被包括在熵解码模块210中。分析模块可以作为解码单元的一个部件提供。
[0084]图3是示意地图示根据本发明的一个示例性实施例使用多个层的可伸缩的视频编码结构的示意图。在图3中,图片组(GOP)表示图片组,也就是说,一组图片。
[0085]为了发送视频数据,根据各种网络环境,需要传输介质,并且对于每个传输介质其性能是不同的。对于各种传输介质或者网络环境的应用,可以提供可伸缩的视频编码方法。
[0086]可伸缩的视频编译方法是利用在层之间的纹理信息、运动信息、残留信号等等除去在层之间冗余,从而提高编码和解码性能的编译方法。可伸缩的视频编译方法可以根据外界条件,诸如,传输比特率、传输差错率和系统资源,在各种空间、时间和质量方面提供可伸缩性。
[0087]可伸缩的视频编译可以通过使用多层结构执行,以便提供可应用于各种网络情形的比特流。例如,可伸缩的视频编码结构可以包括视频数据使用常规视频解码方法压缩和处理的基础层,并且还包括视频数据使用基础层的解码信息和常规视频解码方法两者压缩和处理的增强层。
[0088]在这里,层指的是根据空间方面(例如,图片大小)、时间方面(例如,解码顺序、图片输出顺序和帧率)、图片质量、复杂度等等划分的图片和比特流集合。此外,基础层可以指的是参考层或者基础层,并且增强层可以指的是加强层。多个层可以相互具有相关性。
[0089]例如,参考图3,基础层可以由标清(SD)、15Hz帧率和IMbps比特率限定,第一增强层可以由高清(HD) ,30Hz帧率和3.9Mbps比特率限定,并且第二增强层可以由4K超高清(UHD) ,60Hz帧率和27.2Mbps限定。这些格式、帧率和比特率仅仅是为了说明性的目的提供的,并且可以根据需要变化和修改。此外,不限于当前的实施例,使用的层的数目可以取决于情形变化。
[0090]例如,当传输带宽是4Mbps时,第一增强层HD可以以降低到15Hz或者更低的帧率发送。可伸缩的视频编译方法可以使用如上参考图3所述的方法提供空间、时间和质量可伸缩性。
[0091]可伸缩的视频编译指的是在编码时可伸缩的视频编码,和在解码时可伸缩的视频解码。
[0092]如上所述,由于不同种类的通信网络和各种类型的终端,可伸缩性是在当前视频格式中的重要的功能。
[0093]同时,包括多个层的比特流由网络提取层(NAL)单元形成,这便于通过分组交换网络的视频自适应传输。类似于多个层,在比特流中包括多个多视图图片的多视图视频编译中,在多个视点之间的关系类似于在支持多个层的视频中在空间层之间的关系。
[0094]图4图示由解码装置处理的编译的视频的层状结构。
[0095]编译的视频被分成负责解码视频和处理视频本身的视频编译层(VCL),以及位于VCL和下层系统之间的NAL,该下层系统发送和存储编码的信息。
[0096]作为NAL的基本单元的NAL单元用于根据预置的标准、实时输送协议(RTP)和输送流(TS)将编译的视频映射到下层系统的比特串上,诸如,文件格式。
[0097]同时,VCL被划分为对应于序列和图片的头部的参数集(图片参数集、序列参数集和视频参数集)和另外对于视频解码所需的辅助增强信息(SEI)消息,以及有关视频(片数据)的信息。包括有关视频的信息的VCL包括片数据和片头。
[0098]如图4所示,NAL单元包括在VCL中产生的NAL头部和原始字节序列有效载荷(RBSP,从视频压缩产生的数据)两个部分。NAL头部包括有关对应的NAL单元的类型的信肩、O
[0099]NAL单元取决于在VCL中产生的RBSP被划分为VCL NAL单元和非VCL NAL单元。VCL NAL单元是包括有关视频的信息的NAL单元,并且非VCL NAL单元是包括解码视频所需的信息(参数集或者SEI消息)的NAL单元。
[0100]VCL NAL单元可以根据包括在NAL单元中图片的属性和类型划分为不同的类型。
[0101]本发明公开了在能够支持多个层的比特流中有效地描述和用信号发送有关视频的可伸缩性信息的方法和实现其的装置。
[0102]在以下的描述中,为了描述方便起见,比特流被划分为两个类型。仅支持时间可伸缩性的比特流称为基础类型,而除了时间可伸缩性之外还支持空间、质量和视点可伸缩性的比特流称为扩展类型。
[0103]有关比特流的可伸缩性信息是非常重要的,以便有效地和高效地在内容传递路径中的所有节点上转换比特流。在作为用于单层的当前视频编译标准的高效率视频编译(HEVC)中,NAL单元头部具有2字节的长度,也就是说,16比特的固定长度。NAL单元头部的语法元素在表I中图示。
[0104][表 I]
[0105]
nal—unit—header () {描述符
forbiddenzero—bitf(I)
nalunittypeu(6)
nuh—reserved—zero—6bits u(6)
nuhtemporalid—pluslu(3)
}
[0106]在表I中,在NAL单元头部中包括的信息之中,forbidden_zero_bit将是0。
[0107]nal_unit_type指定在NAL单元中包含的RBSP数据结构的类型,并且基于RBSP的数据结构以多个类型提供。
[0108]作为可用于支持可伸缩性的扩展类型,诸如三维(3D)视频编译扩展类型的信息的nuh_reserved_zero_6bits用于标识存在于编译的视频序列(CVS)之中的附加层。这样的层可以包括空间可伸缩层、质量可伸缩层、纹理视图或者深度视图。
[0109]当比特流是基础类型时,nuh_reserved_zero_6bits是O,其可用于确定在比特流的解码单元中包括的数据量。
[0110]由nuh_temporal_id_pIus I指定的值指的是用于NAL单元的时间层的标识符(ID)0时间层指定由VCL NAL单元形成的比特流层,并且是时间可伸缩的,并且具有特定的temporal_id 值。
[0111]在表I中示出的NAL单元头部的设计,用于基于单层的视频编译表示用于多个层的视频的扩展版本,是非常受限制的。此外,表I的NAL单元头部仅仅允许最小变化。
[0112]基础型比特流仅支持时间可伸缩性,这由语法temporal_id描述。但是,在扩展类型中,层信息或者相关性信息需要被包括在NAL单元头部中,并且不用于基础型的nuh_reserved_zero_6bits用于发送这样的信息。例如,对于支持多层的视频,诸如,可伸缩的扩展或者3D视频扩展,nuh_reserved_zero_6bits可用于标识NAL单元的层。
[0113]在NAL单元头部的语法元素之中,仅仅nuh_reserved_zero_6bits可以改变以便用信号发送对扩展类型请求的附加信息。但是,仅仅nuh_reserved_zero_6bits可能不足以发送对扩展类型请求的所有信息。对于扩展类型的视频,附加信息、指示和标记需要在NAL单元头部级别/传输层级别中必要地用信号发送。
[0114]例如,指定当前NAL单元有效载荷的片/图片是否是对于在上层,S卩,上可伸缩层中的片/图片的预测所必需的的指示信息,指定当前的NAL单元有效载荷的片/图片是否是对于另一个视点层的片/图片的预测所必需的的指示信息,和指定当前的NAL单元有效载荷的片/图片是对于具有与上层/另一个视点层所需的相同的可伸缩性的片/图片的预测所必需的指示信息,需要用信号发送。
[0115]虽然需要用信号发送附加信息是,但是NAL单元头部具有2字节有限的长度,并且NAL单元头部的所有比特已经用于用信号发送其它的信息,并且从而,没有用于用信号发送该附加信息的空间。
[0116]因此,需要用于扩展NAL单元头部空间的结构来发送附加信息/标记。在下文中,将描述用于用信号发送没有在NAL单元头部中用信号发送的信息/标记的NAL单元头部的标记扩展结构。
[0117]对于扩展类型的某些预留标记尚未确定最终的语义,例如,语法元素slice_reserved_undetermined_flag[i]。预留的标记指定当前未指定以便以后用于扩展类型的预留信息,并且可以具有对应于要用信号发送的信息的语义和值。也就是说,预留的标记指的是用于附加信息信号发送的额外的比特,不是表示真或假的标记信息。在下文中,将使用术语“NAL单元头部标记扩展”描述用信号发送没有在NAL单元头部中用信号发送的预留的标记,即,用于扩展类型的标记。
[0118]在本发明中,为了分析预留的标记,不仅NAL单元头部,而且NAL单元头部之后直至NAL单元有效载荷也被分析。也就是说,术语“NAL单元头部标记扩展”也可以用于指的是扩展分析和解码预留的标记的过程。
[0119]同时,当前的预留的标记,诸如,slice_reserved_undetermined_flag[i]被用信号发送,其太远离片头的开始,并且因此,很难在应用终端上发现、分析和检测该标记。此夕卜,slice_reserved_undetermined_flag[i]可以存在或者不存在,并且因此,在另一个语法元素之后用信号发送,这可能导致在确定标记的精确位置方面的困难,使得难以处理预留的标记。因此,预留的标记,诸如slice_reserved_undetermined_flag[i]在接受NAL单元头部标记扩展的思想方面具有困难。
[0120]本发明的以下的实施例考虑修改用信号发送slice_reserved_undetermined_flag[i],以便应用NAL单元头部标记扩展的思想。也就是说,本发明扩展NAL单元头部的空间,以提出NAL单元头部标记扩展,从而接受更多的信息/指示。
[0121]图5和6图示根据本发明示例性实施例的NAL单元头部标记扩展。图5图示包括视频信息的VCL NAL单元的NAL单元头部标记扩展,而图6图示包括解码视频所需的信息(参数集或者SEI消息)的非VCL NAL单元的NAL单元头部标记扩展。
[0122]如图5和6所示,NAL单元头部具有2字节的固定比特数,并且在NAL单元头部之后用信号发送的NAL单元有效载荷包括VCL NAL单元中的片头和片有效载荷,并且包括非VCL NAL单元中的参数集有效载荷。
[0123]根据本发明的NAL单元头部标记扩展的概念可以参考图5和6描述如下。
[0124]-在NAL单元头部的结束和NAL单元有效载荷之间不允许间隙。VCLNAL单元的NAL单元有效载荷包括片头和片有效载荷。
[0125]-NAL单元头部标记扩展的扩展标记大体上属于片头,或者是片头的一部分。扩展标记可以包括预留的标记。
[0126]-NAL单元头部标记扩展的扩展标记在片头中的最早可能的位置用信号发送。在这里,NAL单元头部标记扩展的扩展标记可以不必起始于片头的第一比特。
[0127]-指定扩展标记是否存在于片头的指示信息可以被包括在参数集,诸如视频参数集(VPS)、序列参数集(SPS)或者图片参数集(PPS)中。在这里,包括该指示信息的参数集可以有选择地应用。
[0128]如图5和6所示,扩展标记,S卩,预留的标记,可以在两个单独的部分中用信号发送。
[0129]第一部分是用于表示NAL单元头部标记是否如图5所示扩展的信令结构,其中,这个指示信息可以被包括在参数集,诸如VPS、SPS和PPS的一个中用信号发送。第二部分是在片头中的NAL单元头部标记扩展的信令结构。
[0130]也就是说,第一部分可以用信号发送是否存在预留的标记,而第二部分可以用信号发送该预留的标记。
[0131]在这个信令结构中,多个选项可以应用于两个部分,其中第一部分的选项可以与第二部分的选项组合,反之亦然。
[0132]第一部分:用于表示NAL单元头部标记扩展的信令结构
[0133]有关是否存在NAL单元头部标记扩展的指示信息可以利用作为语法元素的num_extra_sIice_header_bits 用信号发送,num_extra_slice_header_bits 指定在片头中 NAL单元头部标记扩展,即,扩展标记,以多少比特用信号发送。
[0134]num_extra_sIice_header_bits指定可能存在于用于编译的图片的片头RBSP之中的额外的片头比特数。
[0135]设置为O的额外比特数(num_extra_slice_header_bits)指定没有额外的比特在片头中用信号发送。也就是说,NAL单元头部标记扩展,S卩,预留的标记,不存在。额外比特数可以限于特定的值并且被清楚地显示以便容易地分析。例如,可以给出三个比特,诸如u (3)。
[0136]关于用信号发送num_extra_slice_header_bits的位置可以存在多种选项。
[0137]第一部分-诜项I
[0138]根据选项I, num_extra_slice_header_bits可以经由PPS用信号发送,并且安排在PPS中最早可能的位置上。
[0139]当num_extra_slice_header_bits 包括在 PPS 中时, num—extra—sIi ce—header—bits可以就在PPS中的SPS ID之后的位置上,或者就在PPS中的d印endent—slice—segments—enabled—flag之后的位置上用信号发送。
[0140]在这里,num—extra—slice—header—bits在同一序列的所有PPS中需要具有相同的值。
[0141]根据当前的选项的PPS具有在表2或者表3中列出的语法元素。
[0142][表2]
[0143]
pic_parameter_set_rbsp () {描述符
pic_parameter_set_idue(v)
seq_parameter—set—idue(v)
numextrasIi ceheaderb itsu(3)
dependent—slice—segments—enabled—flagu (I)
I
[0144]参考表2,pic—parameter—set—id指定PPS ID以标识由另一个语法元素参考的PPSo
[0145]seq—parameter—set—id 指定激活的 SPS 的 SPS ID。
[0146]等于O的num—extra—slice—header—bits指定额外的片头比特不存在于用于在PPS中参考的编译的图片的片头RBSP中,并且是O的num—extra—slice—header—bits用于支持单层视频的比特流。num—extra—slice—header—bits的另一个值在视频的扩展类型中预留供未来使用。
[0147]等于 I 的 dependent_slice_segments_enabled_flag 指定 dependent_slice_segment—flag存在于用于引用PPS的编译的图片的片分段头中,而等于O的dependent—slice_segments_enabled_flag 指定 dependent_slice_segment_flag 不存在于用于弓I用PPS的编译的图片的片分段头中。
[0148]在表2 中,num—extra—slice—header—bits 被安排在用信号发送 SPS ID 的 SPS IDseq—parameter—set—id之后并用信号发送。
[0149][表3]
[0150]
【权利要求】
1.一种视频解码方法,包括: 接收和分析参数集,所述参数集包括指定是否存在供未来使用的预留信息的指示信息; 当所述指示信息指定存在所述预留信息时,接收和分析包括所述预留信息的片头;和 基于与所述预留信息相对应的语义和值解码视频。
2.根据权利要求1所述的视频解码方法,其中,所述指示信息是被包括在图片参数集中而被接收的。
3.根据权利要求2所述的视频解码方法,其中,所述指示信息是指定对于所述片头增加的额外片头比特数以包括所述预留信息的信息,并且当比特流支持单层视频时,所述额外片头比特数是O。
4.根据权利要求2所述的视频解码方法,其中,所述指示信息在指定在所述图片参数集中激活的序列参数集(SPS)的SPS标识符(ID)的语法元素和指定是否存在表示所述片头是否是相关的片头的标记信息的语法元素之后的位置处被用信号发送。
5.根据权利要求2所述的视频解码方法,其中,所述预留信息包括与所述额外片头比特数相对应的语义和值的数目。
6.根据权利要求1所述的视频解码方法,其中,所述预留信息是在当前片不是相关的片时接收的。
7.根据权利要求1所述的视频解码方法,其中,所述预留信息用于多视点层和支持空间可伸缩性的视频或者三维(3D)视频。
8.根据权利要求1所述的视频解码方法,其中,所述指示信息和所述预留信息被包括在网络提取层(NAL)单元的有效载荷中。
【文档编号】H04N21/434GK104137561SQ201380011238
【公开日】2014年11月5日 申请日期:2013年12月9日 优先权日:2012年12月10日
【发明者】亨得利·亨得利, 朴俊永, 金哲瑾, 全柄文, 金廷宣 申请人:Lg电子株式会社