视频数据编码和解码的制作方法

文档序号:32164899发布日期:2022-11-12 04:03阅读:90来源:国知局
视频数据编码和解码的制作方法

1.本公开涉及视频数据编码和解码。


背景技术:

2.本文提供的“背景技术”描述是为了总体呈现本公开的上下文。在本背景技术部分中描述的范围内,目前命名的发明人的工作,以及在提交时可能不符合现有技术条件的说明书各方面,均未明确或暗示地承认为本公开的现有技术。
3.存在几种系统,例如视频或图像数据编码和解码系统,其涉及将视频数据转换为频域表示,量化频域系数,然后对量化系数应用某种形式的熵编码。这可以实现视频数据的压缩。应用相应的解码或解压缩技术来恢复原始视频数据的重构版本。


技术实现要素:

4.本公开解决或减轻了由该处理引起的问题。
5.本公开的各个方面和特征在所附权利要求中定义。
6.应当理解,上述总体描述和以下详细描述都是本技术的示例性描述,但不是限制性描述。
附图说明
7.当结合附图考虑时,通过参考以下详细描述,可以更好地理解本公开及其许多伴随的优点,因此可以容易地获得对本公开的更全面的理解,其中:
8.图1示意性地示出使用视频数据压缩和解压缩的音频/视频(a/v)数据发送和接收系统;
9.图2示意性地示出使用视频数据解压缩的视频显示系统;
10.图3示意性地示出使用视频数据压缩和解压缩的音频/视频存储系统;
11.图4示意性地示出使用视频数据压缩的摄像机;
12.图5和图6示意性地示出存储介质;
13.图7提供了视频数据压缩和解压缩设备的示意性概览;
14.图8示意性地示出一个预测器;
15.图9和图10示意性地示出编码级别的集合;
16.图11示意性地示出参数集的使用;
17.图12示意性地示出解码设备的各个方面;
18.图13是说明方法的示意性流程图;
19.图14示意性地示出编码设备的各个方面;以及
20.图15是说明方法的示意性流程图。
具体实施方式
21.现在参考附图,提供图1至图4以给出使用下面结合本技术的实施例描述的压缩和/或解压缩设备的设备或系统的示意性示图。
22.要在以下描述的所有数据压缩和/或解压缩设备可以以硬件、在诸如通用计算机的通用数据处理设备上运行软件实现,作为诸如专用集成电路(asic)或现场可编程门阵列(fpga)的可编程硬件或作为其组合。在实施例由软件和/或固件实现的情况下,将认识到,这样的软件和/或者由固件以及非瞬态数据存储介质被视为本技术的实施例,其中,这样的软件或固件由非瞬态数据存储介存储或以其他方式提供。
23.图1示意性地示出使用视频数据压缩和解压缩的音频/视频数据发送和接收系统。在该示例中,待编码或解码的数据值表示图像数据。
24.输入音频/视频信号10被提供给视频数据压缩设备20,该设备至少压缩音频/视频数据10的视频分量,以便沿着发送路径30(例如电缆、光纤、无线链路等)发送。压缩信号由解压缩设备40处理以提供输出音频/视频信号50。对于返回路径,压缩设备60压缩音频/视频数据,以便沿着发送路径30发送到解压缩设备70。
25.因此,压缩设备20和解压缩设备70可以形成发送链路的一个节点。解压缩设备40和解压缩设备60可以形成发送链路的另一节点。当然,在发送链路是单向的情况下,只有一个节点需要压缩设备,而另一节点只需要解压缩设备。
26.图2示意性地示出使用视频数据解压缩的视频显示系统。具体地,经压缩的音频/视频信号100由解压缩设备110处理,以提供可以显示在显示器120上的解压缩信号。解压缩设备110可以被实现为显示器120的一组成部分,例如设置在与显示装置相同的外壳内。可替代地,解压缩设备110可以被设置为(例如)所谓的机顶盒(stb),注意,表达“机顶盒”并不意味着要求将机顶盒放置在相对于显示器120的任何特定方向或位置;其只是本领域中使用的一个术语,用于指示可连接到显示器作为外围装置的装置。
27.图3示意性地示出使用视频数据压缩和解压缩的音频/视频存储系统。输入音频/视频信号130被提供给压缩设备140,压缩设备140生成经压缩的信号,以用于由存储装置150(例如磁盘装置、光盘装置、磁带装置、诸如半导体内存或其他存储装置的固态存储装置)存储。为了重放,从存储装置150读取压缩数据并将其传递到解压缩设备160用于解压缩,以提供输出音频/视频信号170。
28.应理解,经压缩或编码的信号以及存储该信号的存储介质(例如机器可读非暂时存储介质)被视为本技术的实施例。
29.图4示意性地示出使用视频数据压缩的摄像机。在图4中,图像捕获装置180(例如电荷耦合器件(ccd)图像传感器和相关的控制和读出电子设备)生成传递到压缩设备190的视频信号。麦克风(或多个麦克风)200生成要传递到压缩设备190的音频信号。压缩设备190生成要存储和/或发送(被一般示出为示意性的步骤220)的压缩音频/视频信号210。
30.下面将描述的技术主要涉及视频数据压缩和解压缩。应当理解,许多现有技术可以与将要描述的视频数据压缩技术结合用于音频数据压缩,以生成压缩的音频/视频信号。因此,将不提供对音频数据压缩的单独讨论。还将认识到,与视频数据(特别是广播质量视频数据)相关联的数据速率通常远高于与音频数据(无论是压缩的还是未压缩的)相关联数据速率。因此将理解,未压缩音频数据可以伴随压缩视频数据以形成压缩音频/视频信号。
应进一步理解,尽管本示例(如图1至图4所示)涉及音频/视频数据,但下文所述的技术可用于简单处理(即,压缩、解压缩、存储、显示和/或发送)视频数据的系统。也就是说,在不必具有任何相关联的音频数据处理的情况下,实施例可以应用于视频数据压缩。
31.因此,图4提供了视频捕获设备的示例,该视频捕获设备包括图像传感器和下面将讨论的类型的编码设备。因此,图2提供了下面将讨论的类型的解码设备的示例,以及输出解码图像的显示器。
32.图2和图4的组合可以提供视频捕获设备,该视频捕获设备包括图像传感器180和编码设备190、解码设备110以及输出解码图像的显示器120。
33.图5和图6示意性地示出了存储介质,其存储(例如)由设备20、60生成的压缩数据,压缩数据输入到设备110或存储介质或步骤150、220。图5示意性地示出磁盘存储介质,图6示意性地示出固态存储介质,如闪存。注意,图5和图6还可以提供非瞬态机器可读存储介质的示例,其存储计算机软件,当由计算机执行这些计算机软件时,会使计算机执行下面讨论的一种或多种方法。
34.因此,上述布置提供了体现任何本技术的视频存储、捕获、发送或接收设备的示例。
35.图7提供了视频或图像数据压缩(编码)和解压缩(解码)设备的概述示图,以用于对表示一个或多个图像的视频或图像进行编码和/或解码。
36.控制器343控制设备的整体操作,并且特别是在参考压缩模式时,通过充当选择器来控制测试编码处理,以选择各种操作模式,例如块尺寸和形状,以及视频数据是否将被无损编码。控制器被认为是组成图像编码器或图像解码器(视情况而定)的一部分。输入视频信号300的连续图像被提供给加法器310和图像预测器320。下面将参考图8更详细地描述图像预测器320。图像编码器或解码器(视情况而定)加上图8的图像内预测器可使用来自图7的设备的特征。但这并不意味着图像编码器或解码器必然需要图7的每个特征。
37.加法器310实际上执行减法(负加法)运算,因为其在“+”输入上接收输入视频信号300,在
“‑”
输入上接收图像预测器320的输出,从而从输入图像中减去预测图像。结果是生成表示实际图像和预测图像之间的差的所谓残差图像信号330。
38.生成残差图像信号的一个理由如下。待描述的数据编码技术,即将应用于残差图像信号的技术,当待编码图像中的“能量”较少时,倾向于更有效地工作。这里,术语“有效”指的是生成少量编码数据;对于特定的图像质量水平,希望(并认为“有效”)生成尽可能少的数据。残差图像中对“能量”的引用与残差图像包含的信息量有关。如果预测图像与实际图像相同,则两者之间的差值(即,残差图像)将包含零信息(零能量),并且将非常容易编码为少量编码数据。一般来说,如果可以使预测过程合理地工作,使得预测图像内容类似于待编码图像内容,则期望残差图像数据将包含比输入图像更少的信息(更少的能量),因此将更容易编码成少量编码数据。
39.因此,编码(使用加法器310)涉及:预测待编码图像的图像区域;以及根据预测图像区域与待编码图像的对应区域之间的差值来生成残差图像区域。结合下面要讨论的技术,数据值的有序阵列包括残差图像区域的表示的数据值。解码涉及预测待解码图像的图像区域;生成指示预测图像区域和待解码图像的对应区域之间的差值的残差图像区域;其中数据值的有序阵列包括表示残差图像区域的数据值;以及组合预测图像区域和残差图像
区域。
40.现在将描述用作编码器(对残差或差分图像进行编码)的设备的其余部分。
41.残差图像数据330被提供给转换单元或电路340,转换单元或转换电路340生成残差图像数据的块或区域的离散余弦转换(dct)表示。dct技术本身是公知的,这里不再详细描述。还应注意,dct的使用仅说明一个示例性布置。可以使用的其他转换包括例如离散正弦转换(dst)。转换还可以包括单个转换的序列或级联,例如一个转换之后(无论是否直接)是另一个转换的排列。转换的选择可以明确地确定和/或取决于用于配置编码器和解码器的边信息。在其他示例中,可以选择性地使用所谓的“转换跳过”模式,在该模式中不应用转换。
42.因此,在示例中,编码和/或解码方法包括预测待编码图像的图像区域;并根据预测图像区域与待编码图像的对应区域之间的差值生成残差图像区域;其中数据值的有序阵列(将在下面讨论)包括表示残差图像区域的数据值。
43.转换单元340的输出(也就是说(在一个示例中),用于图像数据的每个转换块的一组dct系数)被提供给量化器350,视频数据压缩领域中已知各种量化技术,范围从简单乘以量化比例因子到在量化参数控制下应用复杂查找表。总体目标有两方面。首先,量化处理减少了转换数据的可能值的数量。其次,量化处理可以增加转换数据值为零的可能性。这两种方法都可以使下文描述的熵编码处理在生成少量压缩视频数据时更有效地工作。
44.扫描单元360应用数据扫描处理。扫描处理的目的是对量化转换数据进行重新排序,以便将尽可能多的非零量化转换系数聚集在一起,当然,也因此将尽可能多的零值系数聚集在一起来。这些特征可以允许有效地应用所谓的游程编码或类似技术。因此,扫描处理涉及根据“扫描顺序”从量化转换数据中选择系数(具体地,从与经转换和量化的图像数据块相对应的系数块中选择系数),从而使得(a)所有系数作为扫描的一部分被选择一次,并且(b)扫描趋向于提供所需的重新排序。可以趋向于给出有用结果的一个示例扫描顺序是所谓的右上对角扫描顺序。
45.在跳过转换块与转换块(已经经历了至少一次空间频率转换的块)之间,扫描顺序可以不同。
46.然后将经扫描的系数传递给熵编码器(ee)370。同样,可以使用各种类型的熵编码。有两个示例,是所谓的上下文自适应二进制算术编码(cabac)系统的变体和所谓的上下文适应性可变长度编码(cavlc)系统。一般而言,cabac被认为提供了更好的效率,并且在一些研究中已经显示,与cavlc相比,对于可比较的图像质量,cabac的编码输出数据的数量减少了10%至20%。然而,cavlc被认为代表了比cabac低得多的复杂度(就其实现而言)。注意,扫描处理和熵编码处理被示为单独的处理,但实际上可以组合或一起处理。也就是说,可以按照扫描顺序将数据读取到熵编码器中。相应的考虑适用于下面将描述的各个反向过程。
47.熵编码器370的输出连同附加数据(上面提到和/或下面讨论的),例如定义了预测器320生成预测图像的方式,无论压缩数据是被转换还是被跳过转换等等,提供压缩输出视频信号380。
48.然而,还提供了返回路径390,因为预测器320本身的操作取决于压缩输出数据的解压缩版本。
49.此特征的原因如下。在扫描解压缩处理的适当阶段(将在下面描述),生成残差数据的解压缩版本。该解压缩的残差数据必须被添加到预测图像以生成输出图像(因为原始残差数据是输入图像和预测图像之间的差值)。为了使该处理在压缩侧与解压缩侧之间可比较,由预测器320生成的预测图像在压缩处理期间和扫描解压缩处理期间应当相同。当然,在解压缩时,该设备不能访问原始输入图像,而只能访问解压缩图像。因此,在压缩时,预测器320将其预测(至少对于图像间编码)基于压缩图像的解压缩版本。
50.由熵编码器370执行的熵编码处理被认为(在至少一些示例中)是“无损的”,也就是说,其可以被逆转以获得与第一次提供给熵编码器370的数据完全相同的数据。因此,在这种示例中,返回路径可以在熵编码阶段之前实现。实际上,由扫描单元360执行的扫描处理也被认为是无损的,因此在本实施例中,返回路径390从量化器350的输出到互补反向量化器420的输入。在由级引入损耗或潜在损耗的情况下,该级(及其反向级)可以包括在由返回路径形成的反馈回路中。例如,熵编码阶段可以至少在原则上是有损的,例如通过在奇偶校验信息内编码位的技术。在这种情况下,熵编码和解码应形成反馈回路的一部分。
51.一般而言,熵解码器410、反向扫描单元400、反向量化器420和反向转换单元或电路430提供熵编码器370、扫描单元360、量化器350和转换单元340的相应反向函数;下面将单独讨论解压缩输入压缩视频信号的过程。
52.在压缩处理中,扫描的系数通过返回路径390从量化器350传递到反向量化器420,反向量化器执行扫描单元360的反向运算。反向量化和反向转换处理由单元420、430执行,以生成解压缩的压缩残差图像信号440。
53.图像信号440在加法器450处与预测器320的输出相加,以生成重构的输出图像460(尽管这在输出之前可能经受所谓的回路滤波和/或其他滤波——见下文)。这形成对图像预测器320的一个输入,如下所述。
54.现在转到应用于对接收到的压缩视频信号470进行解压缩的解码处理,该信号被提供给熵解码器410,并且在被加法器450添加到图像预测器320的输出之前,从熵解码器410提供给反向扫描单元400、反向量化器420和反向转换单元430的链,解码器重构残差图像的版本,然后(通过加法器450)将其应用于图像的预测版本(逐块地),以便解码每个块。简单地说,加法器450的输出460形成输出解压缩视频信号480(经受下面讨论的滤波处理)。在实践中,在输出信号之前,可选地应用进一步的滤波(例如,通过图8所示的回路滤波器565,但为了图7的更高级别图的清晰性,从图7中省略)。
55.图7和图8的设备可以用作压缩(编码)设备或解压缩(解码)设备。两种类型的设备的功能基本上重叠。扫描单元360和熵编码器370不用于解压缩模式,并且预测器320(其将在下文详细描述)和其他单元的操作遵循接收的压缩位流中包含的模式和参数信息,而不是生成这些信息本身。
56.图8示意性地示出预测图像的生成,特别是图像预测器320的操作。
57.存在由图像预测器320执行的两种基本预测模式:所谓的图像内预测和所谓的图像间或运动补偿(mc)预测。在编码器侧,每个预测模式都涉及检测关于要预测的当前块的预测方向,并根据其他样本(在同一(帧内)或另一(帧间)图像中)生成样本的预测块。借助于单元310或450,对预测块和实际块之间的差值进行编码或应用,以便分别对块进行编码或解码。
58.(在解码器处,或者在编码器的反向解码侧,预测方向的检测可以响应于与编码器的编码数据相关联的数据,指示在编码器处使用了哪个方向。可替代地,检测可以响应与在编码器处做出决定的因素相同的因素)。
59.图像内预测基于来自同一图像内的数据来预测图像的块或区域的内容。这对应于其他视频压缩技术中的所谓i帧编码。然而,与涉及通过帧内编码对整个图像进行编码的i帧编码不同,在本实施例中,可以逐块地进行帧内编码和帧间编码之间的选择,尽管在其他实施例中仍然是按照图像进行选择。
60.运动补偿预测是图像间预测的一个示例,并利用运动信息,该运动信息试图在另一临近或附近图像中定义要在当前图像中编码的图像细节的源。因此,在理想示例中,预测图像中的图像数据块的内容可以非常简单地编码为指向临近图像中相同或略微不同位置处的对应块的参考(运动向量)。
61.一种称为“块复制”预测的技术在某些方面是两种预测的混合,因为其使用一个向量来指示在同一图像中从当前预测块移位的位置处的样本块,该块应被复制以形成当前预测块。
62.返回图8,显示了两种图像预测布置(对应于图像内和图像间预测),其结果由多路复用器500在模式信号510(例如,来自控制器343)的控制下选择,以便设置预测图像的块以提供给加法器310和450,并且该选择在编码的输出数据流内以信号通知给解码器。在这种情况下,可以检测图像能量,例如,通过从输入图像中执行预测图像的两个版本的面积的测试减法,对差分图像的每个像素值求平方,对平方值求和,并且识别两个版本中的哪一个导致与该图像区域相关的差分图像较低的均方值。在其他示例中,可以对每个选择或潜在选择执行尝试编码,然后根据每个潜在选择的成本,在编码所需的位数和图片失真中的一个或两个方面进行选择。
63.在帧内编码系统中,实际预测是基于作为信号460的一部分接收的图像块(通过回路滤波来滤波;见下文)进行的,也就是说,预测基于编码的解码图像块,以便可以在解压缩设备处进行完全相同的预测。然而,可以通过帧内模式选择器520从输入视频信号300导出数据,以控制帧内图像预测器530的操作。
64.对于图像间预测,运动补偿(mc)预测器540使用运动信息,例如由运动估计器550从输入视频信号300导出的运动向量。这些运动向量由运动补偿预测器530应用于重构图像460的处理版本,以生成图像间预测的块。
65.因此,单元530和540(与估计器550一起操作)各自充当检测器以检测关于要预测的当前块的预测方向,并且充当生成器以根据由预测方向定义的其他样本生成样本的预测块(形成传递到单元310和450的预测的一部分)。
66.现在将描述应用于信号460的处理。
67.首先,信号可以由所谓的回路滤波器565滤波。可以使用各种类型的回路滤波器。一种技术涉及应用“去块”滤波器以移除或至少倾向于减少由转换单元340执行的基于块的处理和后续操作的影响。还可以使用涉及应用所谓的采样自适应偏移(sao)滤波器的另一技术。一般而言,在样本自适应偏移滤波器中,滤波器参数数据(在编码器处导出并传送到解码器)定义了一个或多个偏移量,该偏移量将由样本自适应偏移滤波根据以下值选择性地与给定的中间视频样本(信号460的样本)组合:(i)给定的中间视频采样;或(ii)与给定
的中间视频样本具有预定空间关系的一个或多个中间视频样本。
68.此外,自适应回路滤波器可选地使用由处理重构信号460和输入视频信号300而导出的系数来应用。自适应回路滤波器是一种使用已知技术将自适应滤波器系数应用于待滤波数据的滤波器。也就是说,滤波器系数可以根据各种因素而变化。定义要使用的滤波器系数的数据被包括作为编码输出数据流的一部分。
69.下面将讨论的技术涉及与滤波器的操作相关的参数数据的处理。实际的滤波操作(例如sao滤波)可以使用其他已知的技术。
70.当设备作为解压缩设备运行时,来自回路滤波器单元565的滤波输出实际上形成输出视频信号480。其还被缓冲在一个或多个图像或帧存储器570中;连续图像的存储是运动补偿预测处理的要求,特别是运动向量的生成。为了节省存储需求,图像存储器570中存储的图像可以保持为压缩形式,然后解压缩以用于生成运动向量。为此特定目的,可以使用任何已知的压缩/解压缩系统。所存储的图像可以被传递到插值滤波器580,其生成所存储图像的更高分辨率版本;在该示例中,生成中间样本(子样本),使得由插值滤波器580输出的插值图像的分辨率是4倍于存储在用于4:2:0的亮度通道的图像存储器570中的图像的分辨率(在每个维度上)和8倍于存储在用于4:2:0色度通道的图像存储570中图像的分辨率(在每个维上)。插值图像作为输入传递到运动估计器550,并且还传递到运动补偿预测器540。
71.现在将描述分割图像用于压缩处理的方式。在基本级别上,要压缩的图像被视为样本块或样本区域区域的阵列。可以通过决策树将图像分割成这样的块或区域,如series h所描述的:视听服务的视听和多媒体系统基础设施——运动视频编码——高效视频编码建议itu-t h.265 12/2016(audiovisual and multimedia systems infrastructure of audiovisual services

coding of moving video high efficiency video coding recommendation itu-t h.265 12/2016)。此外:high efficiency video coding(hevc)algorithms and architectures,第3章,编辑:madhukarbudagavi,gary j.sullivan,vivienne sze;isbn978-3-319-06894-7;2014(high efficiency video coding(hevc)algorithms and architectures,chapter 3,editors:madhukarbudagavi,gary j.sullivan,vivienne sze;isbn 978-3-319-06894-7;2014),其各自的整体通过引用并入本文。此外,在[1]“通用视频编码(草案8)”,jvet-q2001-ve,b.bross,j.chen,s.liu and y-k.wang(“versatile video coding(draft 8)”,jvet-q2001-ve,b.bross,j.chen,s.liu and y-k.wang)中提供了进一步的背景信息,其也通过引用全部并入本文。
[0072]
在一些示例中,生成的块或区域具有尺寸,并且在某些情况下具有形状,借助于决策树,这些形状通常可以遵循图像内的图像特征的配置。这本身可以提高编码效率,因为表示或遵循类似图像特征的样本将倾向于通过这种布置分组在一起。在一些示例中,可以选择不同尺寸的正方形块或区域(例如4x4的样本,例如64x64或更大的块)。在其他示例性布置中,可以使用不同形状的块或区域,例如矩形块(例如,垂直或水平定向)。设想了其他非正方形和非矩形块。将图像分割成这样的块或区域的结果是(至少在本示例中)将图像的每个样本分配给一个且仅一个这样的块或者区域。
[0073]
下面将讨论的本公开的实施例涉及用于在编码器和解码器处表示编码级别的技术。
[0074]
参数集和编码级别
[0075]
当通过上述技术对视频数据进行编码以用于后续解码时,对于处理的编码侧,将编码处理的一些参数传送到处理的最终解码侧是合适的。考虑到每当对编码视频数据进行解码时都需要这些编码参数,例如,将这些参数与编码视频数据流本身相关联是有用的(虽然不一定是唯一的,因为这些参数可以通过单独的发送信道“带外”发送),将这些参数作为所谓的参数集嵌入编码视频数据数据流本身。
[0076]
参数集可以表示为信息层次结构,例如视频参数集(vps)、序列参数集(sps)和图片参数集(pps)。pps预计在每个图片中出现一次,并包含与该图片中的所有编码切片相关的信息,sps较不频繁(每个图片序列一次),vps也较不频繁。更频繁出现的参数集(例如pps)可以实现为对该参数集的先前编码示例的引用,以避免重新编码的成本。每个编码图像切片参考单个活动pps、sps和vps,以提供用于解码该切片的信息。特别地,每个切片报头可包含pps标识符以引用pps,pps继而引用sps,sps继而引用vps。
[0077]
在这些参数集中,sps包含与以下讨论相关的示例信息,即定义要使用的所谓配置文件、层和编码级别的数据。
[0078]
配置文件定义了一组要使用的解码工具或功能。示例配置文件包括与8位的4:2:0视频相关的“主配置文件”,以及允许10位分辨率和与主配置文件相关的其他扩展的“主要10配置文件”。
[0079]
编码级别对最大采样率和图片尺寸等问题提供了限制。该层规定了最大数据速率。
[0080]
在联合视频专家组(jvet)关于多功能视频编码(vvc)的提案中,如上文引用的规范jvet-q2001-ve(在提交日期)所定义的,定义了从1到6.2的各种级别。
[0081]
最高可能的级别是级别8.5,该限制源自所使用的编码,因为级别以8位被编码为级别*30,这意味着级别8.0被编码为最大8位值255。
[0082]
当前规范还定义了以下条件,即符合特定层的特定级别的给定配置文件的解码器应能够解码适用以下条件的所有位流,也就是说,位流被指示为符合不是级别8.5并且低于或等于指定级别的级别(给定层处的给定配置文件的)。
[0083]
图9示意性地显示了示出当前定义的具有示例图片尺寸和帧速率的级别,其表示了jvet文件的两个示例表(a.1和a.2)所施加的相应条件的合并。级别的主要分量(指示最大亮度图片尺寸,并随着最大亮度图片尺寸的增加而单调增加)由左列中的整数表示;级别的次要分量(指示最大亮度采样率和最大帧率中的至少一个,其中对于给定的第一分量,第二分量随着最大亮度采样速率的增加而单调增加,并且随着最大帧率的增加而单调增加)由小数点后的数字表示。
[0084]
请注意,原则上,最大亮度采样率和最大帧速率中的一个可以从另一个和最大亮度图片尺寸中导出,所以,尽管为了解释清楚,这两者都在表中指定,但原则上只需要指定其中一者。
[0085]
为亮度(或亮)分量定义数据速率、图片尺寸等;然后,可从使用的色度子采样格式(例如4:2:0或4:4:4,对于给定数量的亮度样本,其定义了相应数量的色度样本)导出色度(色)的相应数据。
[0086]
请注意,标记为“示例最大亮度尺寸”的列仅提供了亮度图片配置的示例,该配置
符合由相应最大亮度图片尺寸定义的样本数量,也符合当前规范其他部分施加的纵横比约束;本列旨在帮助本说明,不构成本规范的一部分。
[0087]
有待解决的潜在事项
[0088]
当前级别规范存在若干潜在问题,这些问题可以至少部分地通过下面讨论的示例实施例来解决。
[0089]
首先,根据定义,在不同的现有级别之间创建新级别是不值得的。例如,级别5.2和级别6具有相同的maxlumasr值。唯一可能的改变是具有一些中间图片尺寸,但这并不特别有用。
[0090]
其次,对于给定级别的图片尺寸,不可能超过120fps(每秒帧数)。唯一的选择是使用具有较大图片尺寸的关卡。这是因为帧速率超过120fps的变化将使最大亮度采样率超过适用于下一级别的采样率。例如,不能为240fps的4k定义新的级别(例如,5.3),因为这将需要当前级别6的两倍采样率,并且当前要求级别6解码器必须解码级别5.x流。
[0091]
第三,最大级别为8.5,这在当前规范中未定义,但意味着(通过4以上级别的现有指数关系)最大图像尺寸至少为32k(例如,32768x17408)。例如,对于使用子图像的未来全方位应用程序,虽然这似乎不是一个直接的问题,但其可能会导致问题。
[0092]
为了解决这些问题,提出了一种用于编码(和解码)级别的方法和设备。此外,还提出了对解码流的能力的替代约束。
[0093]
示例实施例中的级别编码
[0094]
提出了一种替代的级别编码,如下所示:
[0095]
该级别以8位编码为主要*16+次要。
[0096]
这里,“主要”是指整数值,“次要”是指小数点后的数值,因此对于(比如)级别5.2,主要=5,次要=2。
[0097]
因此,例如,级别4.1被编码为65,最大级别为15.15。
[0098]
这一布置意味着由于上述原因无法定义的级别代码,该级别集不会“浪费”,或者至少不会在当前系统的范围内浪费这些代码。
[0099]
此外,反过来将最高可能值从8.5扩展到15.15。
[0100]
另一方面,替代编码也使得级别代码在十六进制转储表示中容易可见,因为第一个十六进制数字将表示主要分量,第二个十六进制数表示次要分量。
[0101]
请注意,下面将给出一个替代示例。任何一个示例(或实际上其他示例)都可以被认为在所附权利要求的范围内。
[0102]
级别解码的约束
[0103]
为了解决在不使用更高级别的情况下当前不可能实现更高帧速率的问题(并因此强制使用更长的行缓冲器等),示例性实施例改变了对解码流的能力的约束。
[0104]
替换约束定义,符合给定层的特定级别d.d(其中d表示主要分量,d表示次要分量)的给定配置文件的解码器应能够解码以下条件适用的所有位流(给定层的给定简表的位流),即,位流被指示为符合不是级别15.15的级别s.s(主要、次要),并且s小于或等于d,且s*2+s小于或等于d*2+d。
[0105]
使用这些布置,在不需要用于下一个主级别的解码器能够解码较高的采样率的情况下,可以添加用于较高帧速率的新的次要别。
[0106]
此约束与当前定义的所有级别完全向后兼容。此约束也不会影响任何解码器。然而,其现在允许在比当前可能的更低层生成高帧率解码器。
[0107]
示例

图10
[0108]
图10提供了一个示例,在图9的列表中插入了一个新的级别5.3,其最大亮度图片尺寸与其他主要级别=5的级别相同,但最大亮度采样率和最大帧速率是前一级别5.2的两倍。
[0109]
应用上述表示,新的级别5.3将占用(16*5)+3=83的未使用的编码。
[0110]
应用上述解码约束,级别5.3视频数据流将可由级别6.1解码器解码,因为:
[0111]
·
5小于或等于6,以及
[0112]
·
5*2+3小于或等于6*2+1。
[0113]
因此,示例实施例提供了用于编码所提出的级别的替代方法,该方法将最大级别从8.5增加到15.15,连同还提出了一种替代约束,在不需要所有更高级别解码器能够解码增加的位率的情况下,该约束允许添加具有更高帧率的级别。
[0114]
示例实施例
[0115]
现在将参考附图描述示例实施例。
[0116]
图11示意性地示出视频参数集和序列参数集的使用,如上所述。具体地,这些形成前面提到的参数集的层次结构的一部分,使得多个序列参数集1100、1110、1120可以引用视频参数集1130,并且其本身依次由相应的序列1102、1112、1122引用。在示例性实施例中,在序列参数集中提供适用于相应序列的级别信息。
[0117]
然而,在其他实施例中,将理解,可以以不同的形式或不同的参数集提供级别信息。
[0118]
类似地,尽管图11的示图示出了作为整个视频数据流1140的一部分提供的序列参数集,但序列参数集(或承载级别信息的其他数据结构)可以由单独的通信信道提供来替代。在任一情况下,级别信息与视频数据流1140相关联。
[0119]
示例操作-解码器
[0120]
图12示意性地示出了解码设备的各个方面,解码设备被配置为接收输入(编码)视频数据流1200并使用上文参考图7讨论的形式的解码器1220生成和输出解码视频数据流1210。为了本解释的清晰性,图7的控制电路或控制器343与解码器1220的其余部分分开绘制。
[0121]
在控制器或控制电路343的功能内是参数集(ps)检测器1230,其从输入视频数据流1200的适当字段中检测包括vps、sps和pps的各种参数集。参数集检测器1230从包括如上所述的级别的参数集导出信息。该信息被传递到控制电路343的其余部分。注意,参数集检测器1230可以对级别进行解码,或者可以简单地将编码级别提供给控制电路344进行解码。
[0122]
控制电路343还响应于一个或多个解码器参数1240,例如,一个或多个解码器参数1240至少定义了解码器1220能够解码的使用上述编号方案的级别(主要、次要)。
[0123]
控制电路343检测对于给定或当前输入视频数据流1200,解码器1220是否能够解码该输入视频数据,并相应地控制解码器1220。控制电路343还可以响应于从由参数集检测器1230检测到的参数集获得的信息,向解码器1220提供各种其他操作参数。
[0124]
图13是说明解码器侧这些操作的示意性流程图。
[0125]
在步骤1300,参数集解码器1230检测sps并将该信息提供给控制电路343。控制电路通过一百43也检测解码器参数1240。
[0126]
根据编码级别,控制电路343检测(在步骤1310)级别模数n,其中n是第一预定常数(在该示例中为16),并且在步骤1320检测级别的剩余部分除以m,其中n为第二预定常数(在此示例中为1,尽管其可以是例如2或4,或者在另一示例中为3)。步骤1310的结果提供主要分量,而步骤1320的结果则提供次要分量。
[0127]
然后,在步骤1330,对解码器参数值d.d和输入视频流参数值s.s,控制电路343通过应用如上所述的以下测试来检测当前输入视频数据流1200是否可解码:
[0128]
·
编码级别是否=255(s.s代表15.15)?如果是,则不可解码,因为15.15是指示非标准级别的特殊情况。如果否,则通过下一个测试:
[0129]
·
s是否小于或等于d且s*2+s是否小于等于d*2+d?如果是,则可解码;如果否,则不可解码
[0130]
该测试的第一部分可以选择性地省略。
[0131]
如果答案是否定的,则控制转到步骤1340,在步骤1340中控制电路343指示解码器1220不解码输入视频数据流。
[0132]
然而,如果答案是肯定的,则控制转到步骤1350和1360,在该步骤中,最大亮度图片尺寸(步骤1350)和最大亮度采样率和/或最大帧速率(步骤1360)使用由存储表(如图10所示)提供的映射进行检测。基于这些导出的参数,控制电路343在步骤1370控制解码器1220以对输入视频数据流1200进行解码。
[0133]
因此,这提供了操作视频数据解码器的方法的示例,该方法包括:
[0134]
检测(1300)与输入视频数据流相关联的参数值,该参数值指示从多个编码级别当中选择出的编码级别,每个编码级别至少定义最大亮度图片尺寸和最大亮度采样率;
[0135]
编码级别定义第一数值分量和第二数值分量,该第二数值分量是大于或等于零的数值;其中:
[0136]
对于第二数值分量为零的编码级别,第一数值分量随着最大亮度图片尺寸的增加而单调增加;并且
[0137]
第二分量随最大亮度采样率而变化;
[0138]
参数值是编码级别的数值编码,为:第一预定常数乘以第一数值分量与第二预定常数乘以第二数值分量相加;
[0139]
执行(1330)与给定输入视频数据流相关联的参数相对于视频数据解码器的能力数据的预定测试;
[0140]
当与给定的输入视频数据流相关联的参数值通过相对于视频数据解码器的能力数据的预定测试时,控制(1370)视频数据解码器解码给定的输入视频流;以及
[0141]
当与给定的输入视频数据流相关联的参数值未通过相对于视频数据解码器的能力数据预定测试时,控制(1340)视频视频数据解码器不解码给定的输入视频流。
[0142]
根据图13的方法操作的图12的布置提供了一个设备示例,包括:
[0143]
视频数据解码器1220,被配置为解码输入视频数据流,该视频数据解码器响应于与输入视频数据流相关联的参数值,该参数值指示从多个编码级别当中选择出的编码级别,每个编码级别至少定义最大亮度图片尺寸和最大亮度采样率;
[0144]
编码级别定义第一数值分量和第二数值分量,该第二数值分量是大于或等于零的数值;其中:
[0145]
对于第二数值分量为零的编码级别,第一数值分量随着最大亮度图片尺寸的增加而单调增加;并且
[0146]
第二分量随最大亮度采样率而变化;
[0147]
参数值是编码级别的数值编码,为:乘以第一数值分量的第一预定常数加上乘以第二数值分量的第二预定常数;
[0148]
比较器343,被配置为执行与给定的输入视频数据流相关联的参数值相对于视频数据解码器的能力数据的预定测试;以及
[0149]
控制电路343,被配置为当与给定的输入视频数据流相关联的参数值通过相对于视频数据解码器的能力数据的预定测试时,控制视频数据解码器解码给定的输入视频流,并且当与给定的输入视频数据流相关联的参数值未通过相对于视频数据解码器的能力数据的预定测试时,控制视频数据解码器不解码给定的输入视频流。
[0150]
示例操作-编码器
[0151]
以类似的方式,例如,图14示意性地示出了包括上文参考图7讨论的类型的编码器1400的编码设备的各个方面。为了解释清楚,编码器的控制电路343被单独绘制。编码器在控制电路343的控制下作用于输入视频数据流1410以生成输出编码视频数据流1420,控制电路343又响应于包括要应用的编码级别的定义的编码参数1430。
[0152]
控制电路343还包括或控制参数集生成器1440,其生成参数集,该参数集包括例如将要包括在输出编码视频数据流内的vp、sps和pps,其中sps携带如上所述编码的级别信息。
[0153]
现在将参考图15的示意性流程图描述该设备的操作方面。
[0154]
步骤1500表示例如通过编码参数1430建立编码级别,编码级别由(主要、次要)或换句话说以(第一分量、第二分量)表示。
[0155]
在步骤1510,控制电路343根据建立的编码级别控制编码器1400。
[0156]
单独地,为了对编码级别进行编码,参数集生成器1440在步骤1520处,将第一分量(主要分量)乘以第一预定常数n(在该示例中为16),并在步骤1530将第二分量(次要分量)乘以第二预定常数m(在该示例中为1,但在下文将讨论的其他示例中为3),然后在步骤1540将两个结果相加以生成编码级别信息。由此,参数集生成器在步骤1550生成所需的参数集,包括编码级别信息。
[0157]
因此,这提供了一种方法的示例,包括:
[0158]
编码(响应于1510)输入视频数据流以根据从多个编码级别当中选择的编码级别生成输出编码视频数据流,每个编码级别至少定义最大亮度图片尺寸和最大亮度采样率,其中,编码级别定义第一数值分量和第二数值分量,该第二数值分量是大于或等于零的数值;其中:
[0159]
对于第二数值分量为零的编码级别,第一数值分量随着最大亮度图片尺寸的增加而单调增加;并且
[0160]
第二分量随最大亮度采样率而变化;并且
[0161]
对与输出编码视频数据流相关联的参数值编码(1520、1530、1540、1550),参数值
是编码级别的数值编码,为:第一预定常数乘以第一数值分量加上乘以第二数值分量的第二预定常数。
[0162]
根据图15的方法中操作的图14的布置提供了一个设备示例,包括:
[0163]
视频数据编码器1400,被配置为根据从多个编码级别当中选择出的编码级别对输入视频数据流进行编码以生成输出编码视频数据流,每个编码级别至少定义最大亮度图片尺寸和最大亮度采样率,其中,编码级别定义第一数值分量和第二数值分量,该第二数值分量是大于或等于零的数值;其中:
[0164]
对于第二数值分量为零的编码级别,第一数值分量随着最大亮度图片尺寸的增加而单调增加;并且
[0165]
第二分量随最大亮度采样率而变化;并且
[0166]
参数值编码电路1440,被配置为对与输出编码视频数据流相关联的参数值进行编码,该参数值是编码级别的数值编码,为:第一预定常数乘以第一数值分量与第二预定常数乘以第二数值分量相加。
[0167]
在上述编码或解码示例中,第二分量可以随着最大亮度采样率单调增加。在其他示例中,对于给定的第一数值分量,第二分量可以随最大亮度采样率而变化。在其他示例中,对于给定的第一数值分量,第二分量可以随着最大亮度采样率单调增加。
[0168]
在其他示例中,对于具有至少第一分量的阈值的编码级别:第一分量随着最大亮度图片尺寸的增加而单调增加;并且第二分量指示最大亮度采样率中的至少一个,其中,对于给定的第一分量,第二分量随最大亮度采样速率而变化。
[0169]
第二数值分量为零通过在附表中缺少第二个数(小数点后)的排版方式表示。
[0170]
关于文本“对于第二数值分量为零的编码级别,第一数值分量随着最大亮度图片尺寸的增加而单调增加”,这表明当m》n时,级别m.0(或“m”)的最大亮度图片尺寸至少与级别n.0(“或“n”)的最大亮度图片尺寸一样。
[0171]
另外的示例
[0172]
提出了另一种可选的级别编码,如下所示:
[0173]
该级别以8位编码为主要*16+次要*3。
[0174]
这里,如上所述,“主要”是指整数值,“次要”是指小数点后的数值,因此对于(比如)5.2级,主要=5,次要=2。
[0175]
因此,例如,级别4.1被编码为67,并且通过该技术可以编码的最大级别为15.5。
[0176]
如上所述,这一布置意味着,由于上述原因无法定义的级别代码,该级别集不会“浪费”,或者至少不会浪费到当前系统的程度。
[0177]
此外,这反过来将最高可能值从8.5扩展到15.5。
[0178]
使用这种布置的编码级别的示例如下:
[0179][0180][0181]
编码视频数据
[0182]
通过这里公开的任何技术编码的视频数据也被认为代表本公开的实施例。
[0183]
附录-jvet-q2001-ves规范草案更改以反映实施例
[0184]
[a.3.1主要10配置文件]
[0185]
符合主要10配置文件的位流应遵守以下约束:
[0186]

引用的sps的chroma_format_idc应等于0或1。
[0187]

引用的sps的bit_depth_minus8应在0到2(含)的范围内。
[0188]

引用的sps的sps_palette_enabled_flag应等于0。
[0189]

对于vps(如可用)和引用的sps中的所有i值的general_level_idc和sublayer_level_idc[i]不得等于255(表示级别15.15)。
[0190]

应满足章节a.4条(如适用)中主要10配置文件规定的层和级别约束。
[0191]
位流与主要10配置文件的一致性由general_profile_idc等于1表示。
[0192]
在特定级别处的符合特定层主要10配置文件的解码器,特定层d.d应能够解码对于以下所有条件均适用的所有位流:
[0193]

指示位流符合主要10配置文件。
[0194]

指示位流符合低于或等于指定层的层。
[0195]

指示位流符合不是级别15.15的级别s.s,且低于或等于15.15的级别s.s,且低于或等于d且s*2+s低于或等于d*2+d。
[0196]
[a.3.2主要4:4:4 10配置文件]
[0197]
符合主要4:4:4 10配置文件的位流应遵守以下约束:
[0198]

引用的sps的chroma_format_idc应在0到3(含)的范围内。
[0199]

引用的sps的bit_depth_minus8应在0到2(含)的范围内。
[0200]

对于vps(如可用)和参考sps中的所有i值的general_level_idc和sublayer_level_idc[i]不得等于255(表示15.15)。
[0201]

应满足第a.4条中主要4:4:4 10配置文件规定的层和级别约束(如适用)。
[0202]
位流与主4:4:4 10配置文件的一致性由general_profile_idc等于2表示。
[0203]
符合特定层d.d特定级别的主要4:4:4 10配置文件的解码器应能够解码适用于以下所有条件的所有位流:
[0204]

指示位流符合主4:4:4 10或主要10配置文件。
[0205]

指示位流符合低于或等于指定层的层。
[0206]

指示位流符合不是级别15.15的级别s.s,且低于或等于15.15的级别s.s,且低于或等于d且s*2+s低于或等于d*2+d。
[0207]
[a.4.1一般层和级别限制]
[0208]
表a.1规定了除级别15.15以外的每一层的每个级别的限值。
[0209]
位流符合的层和级别由语法元素general_tier_flag和general_level_idc表示,子层表示符合的级别由语法元素sublayer_level_idc[i]表示,如下所示:
[0210]

如果指定级别不是级别15.15,则根据表a.1中规定的级别约束,等于0的general_tier_flag表示符合主层,等于1的general_tier_flag表示符合高层,对于低于级别4的级别(对应于表a.2中以
“‑”
标记的条目),general_tier_flag应等于0。否则(指定级别为15.15级),位流一致性要求general_tier_flag应等于1,general_tier_flag的值0保留供itu-t|iso/iec将来使用,解码器应忽略general_tier_flag的值。
[0211]

general_level_idc和sublayer_level-idc[i]的值应设置为等于表a.1中规定的主要级别编号的16倍与次要级别编号的1倍相加。
[0212]
级别8.5的所有其他引用也更改为15.15级。
[0213]
作为替代方案,15.15名称可以改为使用变量名称(如“limitless_level_idc”)在整个过程中指定级别,该变量定义为15.15。
[0214]
参考上述备选实施例,以下内容涉及2020年10月第20次jvet会议的jvet-t2001-v1附录4.1(其内容通过引用并入本文):
[0215]
位流符合的层和级别由语法元素general_tier_flag和general_level_idc表示,子层表示符合的级别由语法元素sublayer_level_idc[i]表示,如下所示:
[0216]

如果指定级别不是15.5级,则根据表135中规定的级别约束,general_tier_flag等于0表示符合主层,general_tier_flag等于1表示符合高层。对于低于级别4的级别(对应于表135中以
“‑”
标记的条目),general_tier_flag应等于0。否则(指定级别为级别15.5),位流一致性的要求是general_tier_flag应等于1,general_tier_flag的值0保留供itu-t|iso/iec将来使用,解码器应忽略general_tier_flag的值。
[0217]

对于表135中规定的级别编号,应将general_level_idc和sublayer_level-idc
[i]设置为等于general_level_idc的值。
[0218]
(注意,上面结合替代实施例再现了表135)。
[0219]
就本公开的实施例已经被描述为至少部分地由软件控制的数据处理设备实现而言,应当理解,承载这种软件的非瞬态机器可读介质,例如光盘、磁盘、半导体存储器等,也被认为代表本公开的一个实施例。类似地,包括根据上述方法生成的编码数据的数据信号(无论是否体现在非瞬态机器可读介质上)也被认为代表本公开的实施例。
[0220]
显然,根据上述教导,本公开的许多修改和变化是可能的。因此,应当理解,在所附条款的范围内,本技术可以在本文中具体描述的情况之外实施。
[0221]
将理解,为了清楚起见,上述描述已经参考不同的功能单元、电路和/或处理器描述了实施例。然而,显而易见的是,在不偏离实施例的情况下,可以使用不同功能单元、电路和/或处理器之间的任何适当的功能分布。
[0222]
所描述的实施例可以以任何合适的形式实现,包括硬件、软件、固件或其任何组合。所描述的实施例可以可选地至少部分地实现为在一个或多个数据处理器和/或数字信号处理器上运行的计算机软件。任何实施例的元件和组件可以以任何合适的方式在物理上、功能上和逻辑上实现。实际上,该功能可以在单个单元、多个单元或作为其他功能单元的一部分来实现。因此,所公开的实施例可以在单个单元中实现,或者可以在不同单元、电路和/或处理器之间物理地和功能地分布。
[0223]
尽管已经结合一些实施例描述了本公开,但本公开不限于本文所描述的具体形式。此外,虽然可以结合特定实施例来描述特征,但本领域技术人员将认识到,所描述的实施例的各种特征可以以适合于实现该技术的任何方式组合。
[0224]
各个方面和特征由以下编号条款定义:
[0225]
1.一种设备,包括:
[0226]
视频数据解码器,被配置为对输入视频数据流进行解码,视频数据解码器响应于与输入视频数据流相关联的参数值,参数值指示从多个编码级别当中选择出的一编码级别,每个编码级别至少定义最大亮度图片尺寸和最大亮度采样率;
[0227]
编码级别定义第一数值分量和第二数值分量,第二数值分量是大于或等于零的数值;其中:
[0228]
对于第二数值分量为零的编码级别,第一数值分量随着最大亮度图片尺寸的增加而单调增加;并且
[0229]
第二分量随着最大亮度采样率而变化;
[0230]
参数值是编码级别的数值编码,为:第一预定常数乘以第一数值分量与第二预定常数乘以第二数值分量相加;
[0231]
比较器,被配置为执行与给定的输入视频数据流相关联的参数值相对于视频数据解码器的能力数据的预定测试;以及
[0232]
控制电路,被配置为当与给定的输入视频数据流相关联的参数值通过了相对于视频数据解码器的能力数据的预定测试时,控制视频数据解码器对给定的输入视频流进行解码,并且当与给定的输入视频数据流相关联的参数值未通过相对于视频数据解码器的能力数据的预定测试时,控制视频数据解码器不对给定的输入视频流进行解码。
[0233]
2.根据条款1的设备,其中,预定测试包括针对由与给定的输入视频数据流相关联
的参数值表示的第一数值分量(s)和第二数值分量(s)、以及针对视频数据解码器的能力数据的第一数值分量(d)和第二数值分量(d)进行以下的检测:
[0234]
是否(i)s小于或等于d、以及(ii)s*2+s小于或等于d*2+d。
[0235]
3.根据条款1或条款2的设备,包括检测器,检测器被配置为从与输入视频数据流相关联的参数集中检测参数值。
[0236]
4.根据条款3的设备,其中,参数集是序列参数集。
[0237]
5.根据前述条款中任一项的设备,其中,第一预定常数为16。
[0238]
6.根据前述条款中任一项的设备,其中,第二预定常数为1。
[0239]
7.根据条款1至5中任一项的设备,其中,第二预定常数为3。
[0240]
8.根据前述条款中任一项的设备,其中,参数值包括8位值。
[0241]
9.根据前述条款中任一项的设备,其中,预定测试包括检测与输入视频流相关联的参数值是否不等于255。
[0242]
10.一种视频存储、捕获、发送或接收设备,包括根据前述条款中任一项的设备。
[0243]
11.一种设备,包括:
[0244]
视频数据编码器,被配置为根据从多个编码级别当中选择出的一编码级别对输入视频数据流进行编码以生成输出编码视频数据流,每个编码级别至少定义最大亮度图片尺寸和最大亮度采样率,其中,编码级别定义第一数值分量和第二数值分量,第二数值分量是大于或等于零的数值;其中:
[0245]
对于第二数值分量为零的编码级别,第一数值分量随着最大亮度图片尺寸的增加而单调增加;并且
[0246]
第二分量随着最大亮度采样率而变化;以及
[0247]
参数值编码电路,被配置为对与输出编码视频数据流相关联的参数值进行编码,参数值是编码级别的数值编码,为:第一预定常数乘以第一数值分量与第二预定常数乘以第二数值分量相加。
[0248]
12.根据条款11的设备,其中,参数值编码电路被配置为将参数值编码为与输出编码视频数据流相关联的参数集的至少一部分。
[0249]
13.根据条款12的设备,其中,参数集是序列参数集。
[0250]
14.根据条款11至13中任一项的设备,其中,第一预定常数为16。
[0251]
15.根据条款11至14中任一项的设备,其中,第二预定常数为1。
[0252]
16.根据条款11至14中任一项的设备,其中,第二预定常数为1。
[0253]
17.根据条款11至16中任一项的设备,其中,参数值包括8位值。
[0254]
18.一种视频存储、捕获、发送或接收设备,包括根据条款11至17中任一项的设备。
[0255]
19.一种操作视频数据解码器的方法,方法包括:
[0256]
检测与输入视频数据流相关联的参数值,参数值指示从多个编码级别当中选择出的一编码级别,每个编码级别至少定义最大亮度图片尺寸和最大亮度采样率;
[0257]
编码级别定义第一数值分量和第二数值分量,第二数值分量是大于或等于零的数值;其中:
[0258]
对于第二数值分量为零的编码级别,第一数值分量随着最大亮度图片尺寸的增加而单调增加;并且
[0259]
第二分量随着最大亮度采样率而变化;
[0260]
参数值是编码级别的数值编码,为:第一预定常数乘以第一数值分量与第二预定常数乘以第二数值分量相加;
[0261]
执行与给定的输入视频数据流相关联的参数值相对于视频数据解码器的能力数据的预定测试;
[0262]
当与给定的输入视频数据流相关联的参数值通过了相对于视频数据解码器的能力数据的预定测试时,控制视频数据解码器对给定的输入视频流进行解码;并且
[0263]
当与给定的输入视频数据流相关联的参数值未通过相对于视频数据解码器的能力数据的预定测试时,控制视频数据解码器不对给定的输入视频流进行解码。
[0264]
20.一种机器可读非瞬态存储介质,存储计算机软件,计算机软件在由计算机执行时使计算机执行条款19的方法。
[0265]
21.一种方法,包括:
[0266]
根据从多个编码级别当中选择出的一编码级别对输入视频数据流进行编码以生成输出编码视频数据流,每个编码级别至少定义最大亮度图片尺寸和最大亮度采样率,其中,编码级别定义第一数值分量和第二数值分量,第二数值分量是大于或等于零的数值;其中:
[0267]
对于第二数值分量为零的编码级别,第一数值分量随着最大亮度图片尺寸的增加而单调增加;并且
[0268]
第二分量随着最大亮度采样率而变化;以及
[0269]
对与输出编码视频数据流相关联的参数值进行编码,参数值是编码级别的数值编码,为:第一预定常数乘以第一数值分量与第二预定常数乘以第二数值分量相加。
[0270]
22.一种机器可读非瞬态存储介质,存储计算机软件,计算机软件在由计算机执行时使计算机执行条款21的方法。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1