用于视频编码的方法和装置与流程

文档序号:35059798发布日期:2023-08-06 21:16阅读:38来源:国知局
用于视频编码的方法和装置与流程

本公开内容描述了一般地与视频编码有关的实施方式。


背景技术:

1、本文提供的背景技术描述是出于大概呈现本公开内容的上下文的目的。就本背景技术部分中描述的工作而言,目前署名的发明人的工作以及在提交时可能不符合作为现有技术的说明书的各方面,既没有明确地也没有隐含地被承认为针对本公开内容的现有技术。

2、可以使用具有运动补偿的帧间图片预测来执行视频编码和解码。未压缩的数字视频可以包括一系列图片,每个图片的空间维度为例如1920×1080亮度样本和相关联的色度样本。该一系列图片可以具有例如每秒60个图片或60hz的固定的或可变的图片速率(也被非正式地称为帧速率)。未压缩的视频具有显著的比特率要求。例如,每样本8比特的1080p60 4:2:0视频(60hz帧速率下1920×1080亮度样本分辨率)需要接近1.5gbit/s的带宽。一小时的这样的视频需要大于600gb的存储空间。

3、视频编码和解码的目的之一是通过压缩来减少输入视频信号中的冗余。压缩可以帮助减少以上提及的带宽或存储空间需求,在一些情况下减少两个数量级或更多。可以采用无损和有损压缩及其组合。无损压缩是指可以根据压缩的原始信号重建原始信号的精确副本的技术。当使用有损压缩时,重建的信号可能与原始信号不同,但是原始信号与重建的信号之间的失真足够小,以使重建的信号对于预期应用有用。在视频的情况下,有损压缩应用广泛。容忍的失真量取决于应用;例如,某些消费者流式应用的用户可能比电视分配应用的用户容忍更高的失真。可达到的压缩比可以反映出:更高的可允许/可容忍的失真可以产生更高的压缩比。

4、运动补偿可以是有损压缩技术,并且可以涉及下述技术:来自先前重建的图片或其一部分(参考图片)的样本数据的块在由运动矢量(此后被称为mv(motion vector,mv))指示的方向上被空间移位之后,被用来预测新重建的图片或图片部分。在一些情况下,参考图片可以与当前处于重建中的图片相同。mv可以具有两个维度x和y,也可以具有三个维度,第三维度是使用中的参考图片的指示(后者间接地可以是时间维度)。

5、在一些视频压缩技术中,可以根据其他mv预测适用于样本数据的特定区域的mv,例如,根据与在空间上相邻于重建中的区域的样本数据的另一区域有关、并且在解码顺序上先于该mv的mv。这样做可以大幅减少对mv进行编码所需的数据量,从而消除冗余并且增加压缩。mv预测可以有效地工作,例如,因为在对从摄像装置得到的输入视频信号(被称为自然视频)进行编码时,存在统计上的可能性,即,比单个mv适用的区域大的区域在相似的方向上移动,并且因此可以在一些情况下使用根据邻近区域的mv得到的相似运动矢量被进行预测。这使得针对给定区域找到的mv与根据周围mv预测的mv相似或相同,并且又可以在熵编码之后以比直接对mv进行编码的情况下将使用的比特数小的比特数来表示。在一些情况下,mv预测可以是根据原始信号(即:样本流)得到的信号(即:mv)的无损压缩的示例。在其他情况下,mv预测本身可以是有损的,例如由于根据若干周围mv计算预测器时的舍入误差。

6、在h.265/hevc(itu-t h.265建议书,“high efficiency video coding”,2016年12月)中描述了各种mv预测机制。在h.265提供的多种mv预测机制中,本文描述的是在下文被称为“空间合并”的技术。

7、参照图1,当前块(101)包括在运动搜索处理期间已经由编码器发现的能够根据已经进行空间移位的相同大小的先前块被预测的样本。替代直接对mv进行编码,mv可以根据与例如来自(按解码顺序)最近的参考图片的一个或更多个参考图片相关联的元数据、使用与被表示为a0、a1和b0、b1、b2(分别地,102到106)的五个周围样本中的任一样本相关联的mv来得到。在h.265中,mv预测可以使用来自相邻块正在使用的相同参考图片的预测器。


技术实现思路

1、本公开内容的各方面提供了用于视频解码的方法和装置。在一些示例中,用于视频解码的装置包括处理电路。该处理电路从已编码视频比特流解码当前图片中的当前块的预测信息并且预测信息指示帧间预测。该处理电路针对当前块确定运动信息,运动信息包括第一运动矢量(mv),第一运动矢量具有x分量和y分量,其中,x分量和y分量中的每一个具有分数mv精度,分数mv精度为当前块中的样本大小的2-n,并且x分量和y分量中的每一个具有拥有分数mv精度的2l+1个mv值中的一个。n为大于2的整数并且l为正整数。该处理电路基于运动信息来重建当前块的至少一个样本。

2、在实施方式中,第一mv的x分量和y分量中的每一个由(l+1)比特来表示,(l+1)比特包括用于量值(magnitude)的l比特和用于方向的1比特,并且2l+1个mv值在mv范围[-2l,2l-1]内。

3、在实施方式中,处理电路将运动信息存储在存储空间中。存储空间的大小为至少j比特,j比特是为第一mv和第二mv、第一参考索引、第二参考索引及用于帧间预测方向的指示符而保留的。第二mv的x分量和y分量中的每一个由(l+1)比特表示,第一参考索引由k比特表示并且指示第一参考列表中与第一mv相关联的第一参考图片,第二参考索引由k比特表示并且指示第二参考列表中与所述第二mv相关联的第二参考图片,指示符由i比特表示。帧间预测方向是以下之一:与第一mv和第一参考图片相关联的前向单向预测、与第二mv和第二参考图片相关联的后向单向预测、以及与第一mv和第二mv及第一参考图片和第二参考图片相关联的双向预测。k为正整数,i是以下之一:0和2,并且j等于(4(l+1)+2k+i)。

4、在示例中,l为17,n为4,k为4,i为2,并且为存储空间保留的j比特为82,将18比特用于第一mv和第二mv的x分量和y分量中的每一个。

5、在示例中,l为18,n为4,k为4,并且i为2。因此,将19比特用于第一mv和第二mv的x分量和y分量中的每一个,将4比特用于第一参考索引和第二参考索引中的每一个,将2比特用于指示符,并且为存储空间保留的j比特为86。

6、在示例中,l为18,n为4,k为5,并且i为0。在示例中,l为19,n为4,k为4,并且i为2。在示例中,l为22,n为4,k为4,并且i为2。在示例中,l为22,n为4,k为5,并且i为0。在示例中,l为23,n为5,k为4,并且i为2。

7、在实施方式中,运动信息还包括:第二mv、第一参考索引、第二参考索引及指示双向预测的指示符。

8、在实施方式中,处理电路基于mv差和mv预测器的对应的x分量和y分量分别确定第一mv的x分量和y分量。在示例中,预测信息指示用于帧间预测的合并模式。处理电路在没有mv差的情况下基于mv预测器的对应的x分量和y分量来确定x分量和y分量。

9、在实施方式中,运动信息还包括第一参考索引,第一参考索引指示第一参考列表中与第一mv相关联的第一参考图片。处理电路从当前块的时间候选获得当前块的初始mv,第一时间距离在第一参考图片与当前图片之间,第二时间距离在时间候选的第三参考图片与当前图片之间。处理电路基于第一时间距离和第二时间距离,分别对初始mv的x分量和y分量进行缩放,以获得第一mv的x分量和y分量。对于第一mv的x分量和y分量中的每一个,当相应分量在mv范围[-2l,2l-1]之外时,该处理电路将相应分量裁剪到mv范围[-2l,2l-1]内。

10、在实施方式中,具有整数mv精度的整数mv范围是[-2m,2m-1]并且对应于mv范围,mv范围中的2l+1个mv值中的2n个对应于整数mv范围中的2m+1个mv值中的一个,其中,整数mv精度为样本大小并且m为(l-n)。

11、本公开内容的方面还提供了存储指令的非暂态计算机可读介质,该指令在由计算机执行以用于视频解码时使计算机执行用于视频解码的方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1