本公开涉及视频处理技术,尤其涉及用于视频编解码的方法和相关装置。
背景技术:
1、本文中提供的背景描述是出于总体上呈现本公开内容的背景的目的。就本背景技术部分中描述的工作的程度而言,目前署名的发明人的工作以及说明书在提交时可能不符合现有技术的某些方面,既没有明确地也没有隐含地被承认为针对本公开内容的现有技术。
2、可以使用具有运动补偿的图片间预测来执行视频编码和解码。未压缩的数字视频可以包括一系列图片,每个图片具有空间维度,例如1920×1080的亮度样本和相关联的色度样本。该一系列图片可以具有例如每秒60个图片或60hz的固定的或可变的图片速率(也被非正式地称为帧速率)。未压缩的视频具有高的比特率要求。例如,每样本8位的1080r604:2:0视频(60hz帧速率下1920×1080亮度样本分辨率)需要接近1.5gbit/s的带宽。一小时这样的视频需要多于600gb的存储空间。
3、视频编码和解码的一个目的可以是通过压缩来减少输入视频信号的冗余。压缩可以帮助减少以上提及的带宽或存储空间需求,在一些情况下可以减少两个数量级或更多。可以采用无损压缩、有损压缩及其组合。无损压缩是指可以从压缩的原始信号重建原始信号的精确副本的技术。当使用有损压缩时,重建的信号可能与原始信号不同,但是原始信号与重建的信号之间的失真足够小,以使重建的信号对于预期应用是有用的。在视频的情况下,有损压缩应用广泛。容忍的失真量取决于应用;例如,某些消费者流应用的用户可能比电视贡献应用的用户容忍更高的失真。可达到的压缩比可以反映出:更高的可允许/可容忍的失真可以产生更高的压缩比。
4、视频编码器和解码器可以利用来自若干宽泛类别的技术,包括例如运动补偿、变换、量化和熵编码。
5、视频编解码技术可以包括被称为帧内编码的技术。在帧内编码中,在不参考来自先前重建的参考图片的样本或其他数据的情况下来表示样本值。在一些视频编解码器中,图片在空间上被细分为样本块。当在帧内模式下对所有样本块进行编码时,该图片可以是帧内图片。帧内图片及其派生,例如独立解码器刷新图片,可以用于重置解码器状态,并且因此可以用作已编码视频比特流和视频会话中的第一图片或用作静止图像。可以使帧内块的样本进行变换,并且可以在熵编码之前对变换系数进行量化。帧内预测可以是使预变换域中的样本值最小化的技术。在一些情况下,变换之后的dc值越小,并且ac系数越小,则在给定量化步长下表示熵编码之后的块所需的比特就越少。
6、诸如从例如mpeg-2代编码技术已知的传统帧内编码不使用帧内预测。然而,一些较新的视频压缩技术包括根据例如在空间上相邻的编码/解码期间获得并且在解码顺序上在前的周围样本数据和/或元数据尝试数据块的技术。这样的技术此后被称为“帧内预测”技术。应注意,在至少一些情况下,帧内预测仅使用来自重建中的当前图片的参考数据,而不使用来自参考图片的参考数据。
7、可以有许多不同形式的帧内预测。当可以在给定视频编码技术中使用多于一种这样的技术时,可以在帧内预测模式下对使用的技术进行编码。在某些情况下,模式可以具有子模式和/或参数,并且子模式和/或参数可以被单独地编码或被包括在模式码字中。针对给定模式/子模式/参数组合使用哪个码字可以通过帧内预测对编码效率增益产生影响,并且因此用于将码字转换成比特流的熵编码技术也会对编码效率增益产生影响。
8、帧内预测的某些模式由h.264引入、在h.265中被细化,并且在诸如联合勘探模型(jem)、通用视频编码(vvc)、基准集(bms)的较新的编码技术中被进一步细化。可以使用属于已经可用的样本的邻近样本值来形成预测值块。根据方向将邻近样本的样本值复制到预测值块中。使用的方向的参考可以在比特流中进行编码,或者其本身可以被预测。
9、然而,目前视频处理例如视频解码的相关技术中帧内预测所使用的比特数目过多,如何改善非正方形块的帧内预测是亟需解决的问题。
技术实现思路
1、本公开内容的一方面提供了用于视频编码的方法,所述方法包括:确定至少一个语法元素,所述至少一个语法元素指示需编码的非正方形块的块尺寸;基于所述块尺寸,并根据用于正方形块的第二组帧内预测方向确定用于所述非正方形块的第一组帧内预测方向,所述第一组帧内预测方向包括所述第二组帧内预测方向的第一角度子范围,不包括所述第二组帧内预测方向中的被修改的第二角度子范围;其中,所述被修改的第二角度子范围包括所述第二角度子范围的第一端,但不包括所述第二角度子范围的第二端,所述第一端对应于所述第二组帧内预测方向覆盖的角度范围的一端;基于所述非正方形块的第一组帧内预测方向来对所述非正方形块和所述至少一个语法元素进行编码。
2、本公开内容的另一方面提供用于视频编码的装置。在一些实施例中,用于视频解码的装置包括处理电路。该处理电路确定至少一个语法元素,所述至少一个语法元素指示需编码的非正方形块的块尺寸;基于所述块尺寸,并根据用于正方形块的第二组帧内预测方向确定用于所述非正方形块的第一组帧内预测方向,所述第一组帧内预测方向包括所述第二组帧内预测方向的第一角度子范围,不包括所述第二组帧内预测方向中的被修改的第二角度子范围;其中,所述被修改的第二角度子范围包括所述第二角度子范围的第一端,但不包括所述第二角度子范围的第二端,所述第一端对应于所述第二组帧内预测方向覆盖的角度范围的一端;基于所述非正方形块的第一组帧内预测方向来对所述非正方形块和所述至少一个语法元素进行编码。
3、本公开内容的又一方面还提供了一种存储程序的非暂态计算机可读存储介质,该程序能够由用于视频编码的至少一个处理器执行以执行用于视频编码的方法中的任何方法。
4、本公开内容的再一方面还提供了一种计算机设备,设备包括处理器以及存储器:存储器用于存储程序代码,并将程序代码传输给处理器;处理器用于根据程序代码中的指令执行前述用于视频编码的方法。
5、由上述方案可以看出,本公开的一些实现方式可以改善非正方形块的帧内预测。此外,在一些实施例中,该处理通过使所使用的方向的数目最小化来执行,从而优化处理效率。
1.一种用于视频编码的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,被修改的子范围覆盖与对角线方向在顺时针方向上成22.5°的角度范围,而添加的子范围覆盖与对角线方向的相反方向在逆时针方向上成22.5°的角度范围。
3.根据权利要求1所述的方法,其特征在于,被修改的子范围覆盖与对角线方向在顺时针方向上成37.5°的角度范围,而添加的子范围覆盖与对角线方向的相反方向在逆时针方向上成37.5°的角度范围。
4.根据权利要求1所述的方法,其特征在于,用于所述第一组帧内预测方向的帧内预测模式不包括用于所述第二组帧内预测方向中所述一个帧内预测方向的帧内预测模式。
5.根据权利要求1所述的方法,其特征在于,用于所述第二组帧内预测方向中所述一个帧内预测方向的一个帧内预测模式被分配给所述第一组帧内预测方向中的一个帧内预测方向,所述第一组帧内预测方向中所述一个帧内预测方向不被包括在所述第二组帧内预测方向中。
6.根据权利要求5所述的方法,其特征在于,在由所述第一组帧内预测方向和所述第二角度子范围覆盖的组合的角度范围中,所述第一组帧内预测方向中所述一个帧内预测方向对应于所述组合的角度范围的第一端,并且所述第二角度子范围包括所述组合的角度范围的第二端,所述第二端为所述第二组帧内预测方向覆盖的角度范围的所述一端。
7.根据权利要求5所述的方法,其特征在于,
8.根据权利要求5所述的方法,其特征在于,不包括在所述第二组帧内预测方向中的所述第一组帧内预测方向的数目等于不包括在所述第一组帧内预测方向中的所述第二组帧内预测方向的数目。
9.根据权利要求1所述的方法,其特征在于,所述第二组帧内预测方向中所述一个帧内预测方向是基于所述非正方形块的形状确定的。
10.根据权利要求1-9任一项所述的方法,其特征在于,所述第二组帧内预测方向中的所述一个帧内预测方向是基于所述非正方形块的长宽比确定的。
11.一种用于视频编码的装置,包括处理电路,所述处理电路被配置成:
12.根据权利要求11所述的装置,其特征在于,被修改的子范围覆盖与对角线方向在顺时针方向上成22.5°的角度范围,而添加的子范围覆盖与对角线方向的相反方向在逆时针方向上成22.5°的角度范围。
13.根据权利要求11所述的装置,其特征在于,被修改的子范围覆盖与对角线方向在顺时针方向上成37.5°的角度范围,而添加的子范围覆盖与对角线方向的相反方向在逆时针方向上成37.5°的角度范围。
14.根据权利要求12所述的装置,其特征在于,用于所述第一组帧内预测方向的帧内预测模式不包括用于所述第二组帧内预测方向中所述一个帧内预测方向的帧内预测模式。
15.根据权利要求12所述的装置,其特征在于,用于所述第二组帧内预测方向中所述一个帧内预测方向的一个帧内预测模式被分配给所述第一组帧内预测方向中的一个帧内预测方向,所述第一组帧内预测方向中所述一个帧内预测方向不被包括在所述第二组帧内预测方向中。
16.根据权利要求15所述的装置,其特征在于,在由所述第一组帧内预测方向和所述第二角度子范围覆盖的组合的角度范围中,所述第一组帧内预测方向中所述一个帧内预测方向对应于所述组合的角度范围的第一端,并且所述第二角度子范围包括所述组合的角度范围的第二端,所述第二端为所述第二组帧内预测方向覆盖的角度范围的所述一端。
17.根据权利要求15所述的装置,其特征在于,
18.根据权利要求15所述的装置,其特征在于,不包括在所述第二组帧内预测方向中的所述第一组帧内预测方向的数目等于不包括在所述第一组帧内预测方向中的所述第二组帧内预测方向的数目。
19.根据权利要求12所述的装置,其特征在于,所述第二组帧内预测方向中所述一个帧内预测方向是基于所述非正方形块的形状确定的。
20.根据权利要求11所述的装置,其特征在于,包括在所述第一组帧内预测方向以及所述第二组帧内预测方向中的所述帧内预测方向是所述第二组帧内预测方向中的多个相邻帧内预测方向。
21.一种存储程序的非暂态计算机可读存储介质,所述程序能够由至少一个处理器执行如权利要求1-10任一项所述的方法。