本公开涉及视频编码,并且更具体地涉及用于发送信号通知编码视频的神经网络后置滤波器参数信息的系统和方法。
背景技术:
1、数字视频功能可以结合到各种设备中,包括数字电视、笔记本计算机或台式计算机、平板计算机、数字录音设备、数字媒体播放器、视频游戏设备、蜂窝电话(包括所谓的智能电话)、医学成像设备等。可以根据视频编码标准对数字视频进行编码。视频编码标准定义了封装编码视频数据的兼容比特流的格式。兼容比特流是可以由视频解码设备接收和解码以生成重构视频数据的数据结构。视频编码标准还定义了解码过程,并且遵循该解码过程的解码器可以说是符合的解码器。视频编码标准可以结合视频压缩技术。视频编码标准的示例包括iso/iec mpeg-4visual和itu-th.264(也被称为iso/iec mpeg-4avc)、高效视频编码(hevc)和多功能视频编码(vvc)。hevc在2019年11月的rec.itu-t h.265的高效视频编码中有所描述,该文献在本文中被称为itu-t h.265。vvc在2022年4月的rec.itu-th.266的多功能视频编码中有所描述,该文献以引用方式并入本文,并且在本文中被称为itu-t h.266。目前正在考虑对itu-th.266进行扩展和改善以开发下一代视频编码标准。例如,itu-t视频编码专家组(vceg)和iso/iec活动图片专家组(mpeg)(被统称为联合视频研究组(jvet))正在致力于标准化超越vvc标准的功能的增强的视频编码技术。以引用方式并入本文的增强的压缩模型7(ecm 7)、增强的压缩模型7(ecm 7)的算法描述、iso/iec jtc1/sc29文档:jvet-ab2025(2022年10月20日至28日,德国,美因茨)描述了在联合测试模型研究下的编码特征,该技术是超越itu-t h.266功能的潜在增强的视频编码技术。应当指出的是,ecm 7的编码特征在ecm参考软件中实施。如本文所用,术语ecm可集体指包括在ecm 7中的算法以及ecm参考软件的具体实施。
2、视频压缩技术能够减少存储和传输视频数据的数据需求。视频压缩技术可以通过利用视频序列中固有的冗余来减少数据需求。视频压缩技术可将视频序列再分成连续较小的部分(即,视频序列内的一组图片、一组图片内的图片、图片内的区域、区域内的子区域等)。可以使用帧内预测编码技术(例如,图片内的空间预测技术)和帧间预测技术(即图片间的技术(时间))来生成待编码的单位视频数据与视频数据的参考单元之间的差值。该差值可以被称为残差数据。残差数据可以被编码为量化变换系数。语法元素可以涉及残差数据和参考编码单元(例如,帧内预测模式索引和运动信息)。可以对残差数据和语法元素进行熵编码。熵编码的残差数据和语法元素可以包括在形成兼容比特流的数据结构中。
技术实现思路
1、一般来讲,本公开描述了用于对视频数据进行编码的各种技术。具体地,本公开描述了用于发送信号通知视频编码中的神经网络后置滤波器参数信息的技术。应当指出的是,尽管本公开的技术是相对于itu-t h.264、itu-t h.265、itu-t h.266和ecm描述的,但本公开的技术可普遍应用于视频编码。例如,除了包括在itu-t h.264、itu-t h.265、itu-h.266和ecm中的那些技术,本文所述的编码技术可并入视频编码系统(包括基于未来视频编码标准的视频编码系统),包括视频块结构、帧内预测技术、帧间预测技术、变换技术、滤波技术和/或其他熵编码技术。因此,对itu-t h.264、itu-t h.265、itu-t h.266和/或ecm的参考是出于描述性目的,并且不应被解释为限制本文所述的技术的范围。此外,应当指出的是,将文献以引用方式并入本文是出于描述性目的,并且不应被解释为限制或产生关于本文所用术语的歧义。例如,在某个并入的参考文献中提供的对某个术语的定义不同于另一个并入的参考文献和/或如本文所用的该术语的情况下,则该术语应以广泛地包括每个相应定义的方式和/或以包括替代方案中每个特定定义的方式来解释。
2、在一个示例中,一种对视频数据进行编码的方法包括:发送信号通知神经网络后置滤波器特性消息、发送信号通知来自神经网络后置滤波器特性消息的指示针对每个经隔行扫描的输入图片生成的输出图片的数量的第一语法元素,以及发送信号通知来自神经网络后置滤波器特性消息的指定输入图片是否被旋转的第二语法元素。
3、在一个示例中,一种设备包括一个或多个处理器,该一个或多个处理器被配置为:发送信号通知神经网络后置滤波器特性消息、发送信号通知来自神经网络后置滤波器特性消息的指示针对每个经隔行扫描的输入图片生成的输出图片的数量的第一语法元素,以及发送信号通知来自神经网络后置滤波器特性消息的指定输入图片是否被旋转的第二语法元素。
4、在一个示例中,一种非暂态计算机可读存储介质包括存储在其上的指令,这些指令在被执行时,使得设备的一个或多个处理器:发送信号通知神经网络后置滤波器特性消息、发送信号通知来自神经网络后置滤波器特性消息的指示针对每个经隔行扫描的输入图片生成的输出图片的数量的第一语法元素,以及发送信号通知来自神经网络后置滤波器特性消息的指定输入图片是否被旋转的第二语法元素。
5、在一个示例中,一种装置包括:用于发送信号通知神经网络后置滤波器特性消息的构件、用于发送信号通知来自神经网络后置滤波器特性消息的指示针对每个经隔行扫描的输入图片生成的输出图片的数量的第一语法元素的构件,以及用于发送信号通知来自神经网络后置滤波器特性消息的指定输入图片是否被旋转的第二语法元素的构件。
6、在一个示例中,一种对视频数据进行解码的方法包括:接收神经网络后置滤波器特性消息、解析来自神经网络后置滤波器特性消息的指示针对每个经隔行扫描的输入图片生成的输出图片的数量的第一语法元素,以及解析来自神经网络后置滤波器特性消息的指定输入图片是否被旋转的第二语法元素。
7、在一个示例中,一种设备包括一个或多个处理器,该一个或多个处理器被配置为:接收神经网络后置滤波器特性消息、解析来自神经网络后置滤波器特性消息的指示针对每个经隔行扫描的输入图片生成的输出图片的数量的第一语法元素,以及解析来自神经网络后置滤波器特性消息的指定输入图片是否被旋转的第二语法元素。
8、在一个示例中,一种非暂态计算机可读存储介质包括存储在其上的指令,这些指令在被执行时,使得设备的一个或多个处理器:接收神经网络后置滤波器特性消息、解析来自神经网络后置滤波器特性消息的指示针对每个经隔行扫描的输入图片生成的输出图片的数量的第一语法元素,以及解析来自神经网络后置滤波器特性消息的指定输入图片是否被旋转的第二语法元素。
9、在一个示例中,一种装置包括:用于接收神经网络后置滤波器特性消息的构件、用于解析来自神经网络后置滤波器特性消息的指示针对每个经隔行扫描的输入图片生成的输出图片的数量的第一语法元素的构件,以及用于解析来自神经网络后置滤波器特性消息的指定输入图片是否被旋转的第二语法元素的构件。
10、在以下附图和描述中阐述了一个或多个示例的细节。根据描述和附图以及权利要求书,其他特征、对象和优点将显而易见。