视频图像的处理方法、装置、电子设备和存储介质与流程

文档序号：36799821发布日期：2024-01-23 12:24阅读：17来源：国知局

本申请涉及视频图像处理，具体涉及一种视频图像的处理方法、装置、电子设备和存储介质。

背景技术：

1、目前，在视频编码领域中，为了获得较好的视频质量，需要对视频数据进行不同模式的分块，并对不同帧的视频数据进行压缩处理，以保证不同的应用需求。

2、但是，在对视频数据进行编码和分块的处理过程中，需要递归遍历所有可能的划分方式，并选择其中失真代价最小的处理模式对视频数据进行处理，在对视频数据中的不同区域进行划分后，通常还会根据位置信息对不同的宏块(如，32*32等)进行简单的划分，易导致对视频中的物体的运动估计不准确，且对应的运动补偿不能满足图像的使用需求的问题。

3、上述处理过程虽然提升了视频压缩率，但极大地增加了计算复杂度，延长了对视频文件的处理时长，无法满足用户对视频文件的处理实时性需求。

技术实现思路

1、本申请提供一种视频图像的处理方法、装置、电子设备和存储介质。

2、本申请实施例提供一种视频图像的处理方法，方法包括：将待处理视频图像输入到多尺度光流运动估计网络中进行运动估计，获得待处理视频图像的运动估计信息，多尺度光流运动估计网络为表征不同尺度的光流和光流引导信息的网络；将待处理视频图像及其对应的运动估计信息输入到编码器中进行编码，获得目标图像。

3、本申请实施例提供一种视频图像的处理装置，其包括：运动估计模块，被配置为将待处理视频图像输入到多尺度光流运动估计网络中进行运动估计，获得待处理视频图像的运动估计信息，多尺度光流运动估计网络为表征不同尺度的光流和光流引导信息的网络；编码模块，被配置为将待处理视频图像及其对应的运动估计信息输入到编码器中进行编码，获得目标图像。

4、本申请实施例提供一种电子设备，包括：一个或多个处理器；存储器，其上存储有一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现本申请实施例中的任意一种视频图像的处理方法。

5、本申请实施例提供了一种可读存储介质，该可读存储介质存储有计算机程序，计算机程序被处理器执行时实现本申请实施例中的任意一种视频图像的处理方法。

6、根据本申请实施例的视频图像的处理方法、设备、电子设备和存储介质，通过将待处理视频图像输入到多尺度光流运动估计网络中进行运动估计，获得待处理视频图像的运动估计信息，能够使待处理视频图像的运动估计信息体现待处理视频图像对应的不同尺度的运动估计信息，方便后续对待处理视频图像进行处理；将待处理视频图像及其对应的运动估计信息输入到编码器中进行编码，能够分别基于不同尺度的运动估计信息对待处理视频图像进行编码，降低计算复杂度，提升图像的处理效率，减少对图像的处理时长，从而使获得的目标图像能够准确体现待处理视频图像中的物体的运动轨迹，满足用户对视频图像的使用需求。

7、关于本申请的以上实施例和其他方面以及其实现方式，在附图说明、具体实施方式和权利要求中提供更多说明。

技术特征：

1.一种视频图像的处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将待处理视频图像输入到多尺度光流运动估计网络中进行运动估计，获得所述待处理视频图像的运动估计信息，包括：

3.根据权利要求2所述的方法，其特征在于，每层所述待处理图像包括多个宏块，每个所述宏块包括多个像素点，所述运动估计参数包括运动向量均值；

4.根据权利要求3所述的方法，其特征在于，所述待处理视频图像至少包括：连续的第一帧样本图像和第二帧样本图像，其中，所述第一帧样本图像对应第一金字塔图像，所述第二帧样本图像对应第二金字塔图像，所述第一金字塔图像和所述第二金字塔图像的层数相同；

5.根据权利要求3所述的方法，其特征在于，所述依据各层所述待处理图像对应的残差值和预设残差阈值，确定所述待处理视频图像的运动估计信息，包括：

6.根据权利要求1至5中任一项所述的方法，其特征在于，所述将待处理视频图像输入到多尺度光流运动估计网络中进行运动估计，获得所述待处理视频图像的运动估计信息之前，还包括：

7.根据权利要求1至5中任一项所述的方法，其特征在于，所述将所述待处理视频图像及其对应的运动估计信息输入到编码器中进行编码，获得目标图像，包括：

8.根据权利要求7所述的方法，其特征在于，所述预设图像质量评价指标，包括：尖峰信噪比、图像相似度和编码速度中的至少一种。

9.一种视频图像的处理装置，其特征在于，其包括：

10.一种电子设备，其特征在于，包括：

11.一种可读存储介质，其特征在于，所述可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的视频图像的处理方法。

技术总结
本申请提出一种视频图像的处理方法、装置、电子设备和存储介质，涉及视频图像处理技术领域。该方法包括：将待处理视频图像输入到多尺度光流运动估计网络中进行运动估计，获得待处理视频图像的运动估计信息，多尺度光流运动估计网络为表征不同尺度的光流和光流引导信息的网络；将待处理视频图像及其对应的运动估计信息输入到编码器中进行编码，获得目标图像。能够分别基于不同尺度的运动估计信息对待处理视频图像进行编码，降低计算复杂度，提升图像的处理效率，减少对图像的处理时长，从而使获得的目标图像能够准确体现待处理视频图像中的物体的运动轨迹，满足用户对视频图像的使用需求。

技术研发人员：陈杰,易自尧,徐科,孔德辉
受保护的技术使用者：深圳市中兴微电子技术有限公司
技术研发日：
技术公布日：2024/1/22

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈杰,易自尧,徐科,孔德辉
技术所有人：深圳市中兴微电子技术有限公司
我是此专利的发明人

上一篇：洗涤装置的制作方法
上一篇：冷轧工序的物流平衡方法、系统、设备及可读存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。