本申请涉及视频图像处理,具体涉及一种视频图像的处理方法、装置、电子设备和存储介质。
背景技术:
1、目前,在视频编码领域中,为了获得较好的视频质量,需要对视频数据进行不同模式的分块,并对不同帧的视频数据进行压缩处理,以保证不同的应用需求。
2、但是,在对视频数据进行编码和分块的处理过程中,需要递归遍历所有可能的划分方式,并选择其中失真代价最小的处理模式对视频数据进行处理,在对视频数据中的不同区域进行划分后,通常还会根据位置信息对不同的宏块(如,32*32等)进行简单的划分,易导致对视频中的物体的运动估计不准确,且对应的运动补偿不能满足图像的使用需求的问题。
3、上述处理过程虽然提升了视频压缩率,但极大地增加了计算复杂度,延长了对视频文件的处理时长,无法满足用户对视频文件的处理实时性需求。
技术实现思路
1、本申请提供一种视频图像的处理方法、装置、电子设备和存储介质。
2、本申请实施例提供一种视频图像的处理方法,方法包括:将待处理视频图像输入到多尺度光流运动估计网络中进行运动估计,获得待处理视频图像的运动估计信息,多尺度光流运动估计网络为表征不同尺度的光流和光流引导信息的网络;将待处理视频图像及其对应的运动估计信息输入到编码器中进行编码,获得目标图像。
3、本申请实施例提供一种视频图像的处理装置,其包括:运动估计模块,被配置为将待处理视频图像输入到多尺度光流运动估计网络中进行运动估计,获得待处理视频图像的运动估计信息,多尺度光流运动估计网络为表征不同尺度的光流和光流引导信息的网络;编码模块,被配置为将待处理视频图像及其对应的运动估计信息输入到编码器中进行编码,获得目标图像。
4、本申请实施例提供一种电子设备,包括:一个或多个处理器;存储器,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本申请实施例中的任意一种视频图像的处理方法。
5、本申请实施例提供了一种可读存储介质,该可读存储介质存储有计算机程序,计算机程序被处理器执行时实现本申请实施例中的任意一种视频图像的处理方法。
6、根据本申请实施例的视频图像的处理方法、设备、电子设备和存储介质,通过将待处理视频图像输入到多尺度光流运动估计网络中进行运动估计,获得待处理视频图像的运动估计信息,能够使待处理视频图像的运动估计信息体现待处理视频图像对应的不同尺度的运动估计信息,方便后续对待处理视频图像进行处理;将待处理视频图像及其对应的运动估计信息输入到编码器中进行编码,能够分别基于不同尺度的运动估计信息对待处理视频图像进行编码,降低计算复杂度,提升图像的处理效率,减少对图像的处理时长,从而使获得的目标图像能够准确体现待处理视频图像中的物体的运动轨迹,满足用户对视频图像的使用需求。
7、关于本申请的以上实施例和其他方面以及其实现方式,在附图说明、具体实施方式和权利要求中提供更多说明。
1.一种视频图像的处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述将待处理视频图像输入到多尺度光流运动估计网络中进行运动估计,获得所述待处理视频图像的运动估计信息,包括:
3.根据权利要求2所述的方法,其特征在于,每层所述待处理图像包括多个宏块,每个所述宏块包括多个像素点,所述运动估计参数包括运动向量均值;
4.根据权利要求3所述的方法,其特征在于,所述待处理视频图像至少包括:连续的第一帧样本图像和第二帧样本图像,其中,所述第一帧样本图像对应第一金字塔图像,所述第二帧样本图像对应第二金字塔图像,所述第一金字塔图像和所述第二金字塔图像的层数相同;
5.根据权利要求3所述的方法,其特征在于,所述依据各层所述待处理图像对应的残差值和预设残差阈值,确定所述待处理视频图像的运动估计信息,包括:
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述将待处理视频图像输入到多尺度光流运动估计网络中进行运动估计,获得所述待处理视频图像的运动估计信息之前,还包括:
7.根据权利要求1至5中任一项所述的方法,其特征在于,所述将所述待处理视频图像及其对应的运动估计信息输入到编码器中进行编码,获得目标图像,包括:
8.根据权利要求7所述的方法,其特征在于,所述预设图像质量评价指标,包括:尖峰信噪比、图像相似度和编码速度中的至少一种。
9.一种视频图像的处理装置,其特征在于,其包括:
10.一种电子设备,其特征在于,包括:
11.一种可读存储介质,其特征在于,所述可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的视频图像的处理方法。