用于算术编码的自适应多假设概率模型的方法和装置与流程

文档序号：36045581发布日期：2023-11-17 18:34阅读：30来源：国知局

本公开总体上涉及通信系统，并且更具体地涉及用于算术编码的自适应多假设概率模型的方法和装置。

背景技术：

1、开放媒体联盟(alliance for open media，aomedia)视频1(aomedia video1，av1)是一种开放的视频编码格式，为互联网上的视频传输而设计。这种编码格式是由aomedia开发的用于接替vp9的视频编码格式，该联盟成立于2015年，包括半导体公司、视频点播提供商、视频内容生产商、软件开发公司和网络浏览器供应商。av1项目的许多组成部分来自联盟成员以前的研究工作。个人贡献者在几年前就开始了实验技术平台：xiph/mozilla基金会的daala项目已经在2010年发布了代码，谷歌(google)的实验性vp9进化项目vp10于2014年9月12日发布，思科(cisco)的thor项目于2015年8月11日发布。在vp9的代码基础上，av1结合了其他技术，其中一些技术是以这些实验格式开发的。av1参考编解码器的第一个版本(0.1.0)于2016年4月7日发布。联盟于2018年3月28日宣布发布av1码流规范，以及基于软件的参考编码器和解码器。2018年6月25日，该规范的验证版本(1.0.0)发布。2019年1月8日，该规范的包含勘误表1的验证版本(1.0.0)发布。av1码流规范包括参考视频编解码器。当前用于多假设概率模型的编码标准没有充分考虑诸如帧类型、块大小、预测模式等的其他信息。

技术实现思路

1、以下呈现本公开的一个或多个实施例的简化概述，以便提供对这些实施例的基本理解。本概述不是所有预期实施例的广泛概述，既不旨在识别所有实施例的关键或关键要素，也不旨在描绘任何或所有的实施例范围。其唯一目的是以简化的形式呈现本公开的一个或多个实施例的一些概念，作为稍后呈现的更详细描述的前奏。

2、本公开公开了用于执行用于算术编码的自适应多假设概率建模的方法、装置和非暂时性计算机可读介质。

3、根据示例性实施例，一种由视频解码器的至少一个处理器执行的方法，包括：接收已编码视频码流，所述已编码视频码流包括根据多假设算术编码来编码的至少一个图片和一个或多个语法元素。该方法还包括：基于所述多假设算术编码对所述一个或多个语法元素中的每个语法元素进行解码。该方法还包括：基于预定条件从多个概率更新率中选择概率更新率，所述多个概率更新率包括高于第二概率更新率的第一概率更新率。该方法还包括：基于所选择的概率更新率来更新在所述多假设算术编码中使用的至少一个概率模型。该方法还包括：基于解码的一个或多个语法元素对所述至少一个图片中的至少一个块进行解码。

4、根据示例性实施例，视频解码器包括被配置为存储计算机程序代码的至少一个存储器，以及被配置为访问计算机程序代码并按照计算机程序代码指示进行操作的至少一个处理器。计算机程序代码包括：接收代码，被配置为使得所述至少一个处理器接收已编码视频码流，所述已编码视频码流包括根据多假设算术编码来编码的至少一个图片和一个或多个语法元素。计算机程序代码还包括：第一解码代码，被配置为使得所述至少一个处理器基于所述多假设算术编码对所述一个或多个语法元素中的每个语法元素进行解码。计算机程序代码还包括：选择代码，被配置为使得所述至少一个处理器基于预定条件从多个概率更新率中选择概率更新率，所述多个概率更新率包括高于第二概率更新率的第一概率更新率。计算机程序代码还包括：更新代码，被配置为使得所述至少一个处理器基于所选择的概率更新率来更新在所述多假设算术编码中使用的至少一个概率模型。计算机程序代码还包括：第二解码代码，被配置为使得所述至少一个处理器基于解码的一个或多个语法元素对所述至少一个图片中的至少一个块进行解码。

5、根据示例性实施例，一种存储指令的非暂时性计算机可读介质，所述指令在由视频解码器中的处理器执行时，使得所述处理器执行一种方法，所述方法包括：接收已编码视频码流，所述已编码视频码流包括根据多假设算术编码来编码的至少一个图片和一个或多个语法元素。该方法还包括：基于所述多假设算术编码对所述一个或多个语法元素中的每个语法元素进行解码。该方法还包括：基于预定条件从多个概率更新率中选择概率更新率，所述多个概率更新率包括高于第二概率更新率的第一概率更新率。该方法还包括：基于所选择的概率更新率来更新在所述多假设算术编码中使用的至少一个概率模型。该方法还包括：基于解码的一个或多个语法元素对所述至少一个图片中的至少一个块进行解码。

6、附加的实施例将在下面的描述中阐述(并且部分地，将从描述中变得更加明显)，和/或可以通过实践本公开的所呈现的实施例来学习。

技术特征：

1.一种由视频解码器的至少一个处理器执行的方法，所述方法包括：

2.根据权利要求1所述的方法，其中，所述预定条件指定所述至少一个图片的帧类型。

3.根据权利要求2所述的方法，其中，所述选择包括：响应于确定所述至少一个图片的帧类型是关键帧和帧内帧中的一者，选择所述第一概率更新率。

4.根据权利要求2所述的方法，其中，所述选择包括：响应于确定所述至少一个图片的帧类型是帧间帧，选择所述第二概率更新率。

5.根据权利要求2所述的方法，其中，所述多假设算术编码包括多个概率模型的线性组合，其中，每个概率模型使用所述多个概率更新率中对应的概率更新率导出，以及

6.根据权利要求5所述的方法，其中，与确定所述帧类型是帧间帧相比，当确定所述帧类型是关键帧和帧内帧中的一者时，使用更大的权重。

7.根据权利要求1所述的方法，其中，所述预定条件指定所述至少一个块的块大小。

8.根据权利要求7所述的方法，其中，响应于确定所述至少一个块是n×m的块，选择所述第一概率更新率，其中，n是4和8中的一个，并且m是4和8中的一个。

9.根据权利要求7所述的方法，其中，响应于确定所述至少一个块是n×m的块，选择所述第二概率更新率，其中，n大于等于16，并且m大于等于16。

10.根据权利要求7所述的方法，其中，所述多假设算术编码包括多个概率模型的线性组合，其中，每个概率模型使用所述多个概率更新率中对应的概率更新率导出，以及

11.根据权利要求10所述的方法，其中，针对第一块的所述多个权重中的第一权重大于针对第二块的所述多个权重中的第二权重，所述第一块小于所述第二块。

12.根据权利要求2所述的方法，其中，所述预定条件指定所述至少一个块的预测模式。

13.根据权利要求12所述的方法，其中，响应于确定所述至少一个块的预测模式是帧内预测模式，选择所述第一概率更新率。

14.根据权利要求12所述的方法，其中，响应于确定所述至少一个块的预测模式是帧间预测模式，选择所述第二概率更新率。

15.根据权利要求12所述的方法，其中，所述多假设算术编码包括多个概率模型的线性组合，其中，每个概率模型使用所述多个概率更新率中对应的概率更新率导出，以及

16.根据权利要求15所述的方法，其中，与确定所述预测模式是帧间预测模式相比，当确定所述预测模式是帧内预测模式时，所述权重更大。

17.一种视频解码器，包括：

18.根据权利要求17所述的视频解码器，其中，所述预定条件指定所述至少一个图片的帧类型。

19.根据权利要求18所述的视频解码器，其中，所述选择代码还被配置为使得所述至少一个处理器：响应于确定所述至少一个图片的帧类型是关键帧和帧内帧中的一者，选择所述第一概率更新率。

20.一种非暂时性计算机可读介质，存储有指令，当所述指令在由视频解码器中的处理器执行时，使得所述处理器执行一种方法，所述方法包括：

技术总结
一种由视频解码器的至少一个处理器执行的方法，包括：接收已编码视频码流，所述已编码视频码流包括根据多假设算术编码来编码的至少一个图片和一个或多个语法元素。该方法还包括：基于所述多假设算术编码对所述一个或多个语法元素中的每个语法元素进行解码。该方法还包括：基于预定条件从多个概率更新率中选择概率更新率，所述多个概率更新率包括高于第二概率更新率的第一概率更新率。该方法还包括：基于所选择的概率更新率来更新在所述多假设算术编码中使用的至少一个概率模型。该方法还包括：基于解码的一个或多个语法元素对所述至少一个图片中的至少一个块进行解码。

技术研发人员：马杜·柏林加色·克里什南,赵欣,刘杉
受保护的技术使用者：腾讯美国有限责任公司
技术研发日：
技术公布日：2024/1/16

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马杜
技术所有人：腾讯美国有限责任公司
我是此专利的发明人

上一篇：基于网络认证快速刷结算IC卡机井控制终端及IC卡的制作方法
上一篇：一种洗衣机排水管结构的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。