图像处理方法、深度学习模型训练方法及装置与流程

文档序号：36258759发布日期：2023-12-05 11:46阅读：59来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本公开涉及人工智能，尤其涉及计算机视觉、增强现实、虚拟现实、深度学习等，具体涉及图像处理方法、深度学习模型训练方法及装置。

背景技术：

1、基于单目视觉的三维重建是指通过单幅或多幅二维图像的特征推导出图像的深度信息，根据深度信息重建得到三维图像的过程。

2、随着三维重建技术在影视特效、虚拟形象、ar(augmented reality，增强现实)、vr(virtual reality，虚拟现实)等领域的广泛应用，对三维图像的重建精度的需求也在日益提高。

技术实现思路

1、本公开提供了一种图像处理方法、深度学习模型训练方法及装置。

2、根据本公开的一方面，提供了一种图像处理方法，包括：基于预定图像，对待处理图像执行关键点对齐操作，得到目标二维图像；提取目标二维图像的图像特征，其中，图像特征表征与用于三维重建待处理图像的重建参数匹配的目标特征；对图像特征进行识别，得到用于三维重建待处理图像的目标参数；以及基于目标参数，对目标二维图像进行三维重建，得到目标三维图像。

3、根据本公开的另一方面，提供了一种深度学习模型的训练方法，包括：利用初始模型对样本二维图像执行如下操作：基于预定图像，对样本二维图像执行关键点对齐操作，得到目标样本二维图像；对目标样本二维图像进行局部掩码处理，得到掩码图像；提取掩码图像的掩码图像特征和目标样本二维图像的样本图像特征；对掩码图像特征进行识别，得到用于三维重建样本二维图像的目标样本参数；基于目标样本参数，对目标样本二维图像进行三维重建，得到与样本二维图像对应的样本三维图像；基于目标损失函数，根据掩码图像特征、样本图像特征、样本二维图像和样本三维图像，得到损失值；以及基于损失值，调整初始模型的模型参数，得到经训练的深度学习模型。

4、根据本公开的另一方面，提供了一种图像处理装置，包括：第一对齐模块、第一特征提取模块、第一特征识别模块和第一特征重建模块。第一对齐模块，用于基于预定图像，对待处理图像执行关键点对齐操作，得到目标二维图像。第一特征提取模块，用于提取目标二维图像的图像特征，其中，图像特征表征与用于三维重建待处理图像的重建参数匹配的目标特征。第一特征识别模块，用于对图像特征进行识别，得到用于三维重建待处理图像的目标参数。第一特征重建模块，用于基于目标参数，对目标二维图像进行三维重建，得到目标三维图像。

5、根据本公开的另一方面，提供了一种深度学习模型的训练装置，包括：第二对齐模块、掩码模块、第二特征提取模块、第二特征识别模块、第二特征重建模块、损失计算模块和调整模块。第二对齐模块，用于基于预定图像，对样本二维图像执行关键点对齐操作，得到目标样本二维图像。掩码模块，用于对目标样本二维图像进行局部掩码处理，得到掩码图像。第二特征提取模块，用于提取掩码图像的掩码图像特征和目标样本二维图像的样本图像特征。第二特征识别模块，用于对掩码图像特征进行识别，得到用于三维重建样本二维图像的目标样本参数。第二特征重建模块，用于基于目标样本参数，对目标样本二维图像进行三维重建，得到与样本二维图像对应的样本三维图像。损失计算模块，用于基于目标损失函数，根据掩码图像特征、样本图像特征、样本二维图像和样本三维图像，得到损失值。调整模块，用于基于损失值，调整初始模型的模型参数，得到经训练的深度学习模型。

6、根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与上述至少一个处理器通信连接的存储器；其中，上述存储器存储有可被上述至少一个处理器执行的指令，上述指令被上述至少一个处理器执行，以使上述至少一个处理器能够执行如上的方法。

7、根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，上述计算机指令用于使所述计算机执行如上的方法。

8、根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，上述计算机程序在被处理器执行时实现如上的方法。

9、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种图像处理方法，包括：

2.根据权利要求1所述的方法，其中，所述基于预定图像，对待处理图像执行关键点对齐操作，得到目标二维图像，包括：

3.根据权利要求2所述的方法，其中，所述基于第一关键点组和所述第二关键点组中的关键点之间的对应关系，对所述待处理图像执行对齐操作，得到目标二维图像，包括：

4.根据权利要求1所述的方法，其中，所述提取目标二维图像的图像特征，包括：

5.根据权利要求1所述的方法，其中，所述对所述图像特征进行识别，得到用于三维重建所述待处理图像的目标参数，包括：

6.根据权利要求1所述的方法，其中，所述目标参数包括目标表情参数、目标纹理参数、目标光照参数、目标采集设备参数和目标身份参数；所述基于所述目标参数，对所述待处理图像进行三维重建，得到目标三维图像，包括：

7.一种深度学习模型的训练方法，包括：

8.根据权利要求7所述的方法，其中，所述基于目标损失函数，根据所述掩码图像特征、所述样本图像特征、所述样本二维图像和所述样本三维图像，得到损失值，包括：

9.根据权利要求8所述的方法，其中，所述基于第二损失函数，根据所述样本二维图像和所述样本三维图像，得到重建损失值，包括：

10.根据权利要求8或9所述的方法，还包括：

11.根据权利要求7所述的方法，其中，所述初始模型包括特征提取模块、特征识别模块和特征重建模块；所述损失值包括掩码特征损失值、重建损失值和关键点特征损失值；

12.根据权利要求7所述的方法，其中，所述对目标样本二维图像进行局部掩码处理，得到掩码图像，包括：

13.根据权利要求7所述的方法，其中，所述基于预定图像，对样本二维图像执行关键点对齐操作，得到目标样本二维图像，包括：

14.根据权利要求13所述的方法，其中，所述基于第一样本关键点组和所述第二样本关键点组中的关键点之间的对应关系，对所述样本二维图像执行对齐操作，得到目标样本二维图像，包括：

15.根据权利要求7所述的方法，其中，所述提取所述掩码图像的掩码图像特征和所述目标样本二维图像的样本图像特征，包括：

16.一种图像处理装置，包括：

17.根据权利要求16所述的装置，其中，所述第一对齐模块包括：

18.根据权利要求17所述的装置，其中，第一对齐子模块包括：

19.根据权利要求16所述的装置，其中，所述第一特征提取模块包括：

20.根据权利要求16所述的装置，其中，所述第一特征识别模块包括：

21.根据权利要求16所述的装置，其中，所述目标参数包括目标表情参数、目标纹理参数、目标光照参数、目标采集设备参数和目标身份参数；所述第一特征重建模块包括：

22.一种深度学习模型的训练装置，包括：

23.根据权利要求22所述的装置，其中，所述损失计算模块包括：

24.根据权利要求23所述的装置，其中，所述重建损失计算子模块包括：

25.根据权利要求23或24所述的装置，其中，所述损失计算模块还包括：

26.根据权利要求25所述的装置，其中，所述初始模型包括特征提取模块、特征识别模块和特征重建模块；所述损失值包括掩码特征损失值、重建损失值和关键点特征损失值；所述调整模块包括：

27.根据权利要求22所述的装置，其中，所述掩码模块包括：

28.根据权利要求22所述的装置，其中，所述第二对齐模块包括：

29.根据权利要求28所述的装置，其中，所述第二对齐子模块包括：

30.根据权利要求22所述的装置，其中，所述第二特征提取模块包括：

31.一种电子设备，包括：

32.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-15中任一项所述的方法。

33.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-15中任一项所述的方法。

技术总结
本公开提供了图像处理方法、深度学习模型训练方法及装置，涉及人工智能技术领域，尤其涉及计算机视觉、增强现实、虚拟现实、深度学习等技术领域，可应用于元宇宙的场景。该图像处理方法的具体实现方案为：基于预定图像，对待处理图像执行关键点对齐操作，得到目标二维图像；提取目标二维图像的图像特征，其中，图像特征表征与用于三维重建待处理图像的重建参数匹配的目标特征；对图像特征进行识别，得到用于三维重建待处理图像的目标参数；以及基于目标参数，对目标二维图像进行三维重建，得到目标三维图像。

技术研发人员：周航,徐志良,朱家树,梁柏荣,刘经拓
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周航徐志良朱家树梁柏荣刘经拓
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

上一篇：一种智能测距装置的制作方法
上一篇：一种铝塑软包装的无溶剂复合方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。