基于深度学习的人脸三维重建方法、计算机设备与介质

文档序号:34139512发布日期:2023-05-12 21:00阅读:71来源:国知局
基于深度学习的人脸三维重建方法、计算机设备与介质

本发明涉及人脸三维重建,特别是涉及一种基于深度学习的人脸三维重建方法、计算机设备与介质。


背景技术:

1、室内人脸三维重建技术主要从图像、雷达等信息中恢复出人脸三维形状,其在虚拟现实、人机交互、游戏图形图像等诸多领域均有广泛的应用。人脸三维重建是计算机视觉领域非常重要的问题,如何进行高精度的重建是目前学界和工业界比较具有挑战性的任务之一。


技术实现思路

1、本发明的目的是提供一种基于深度学习的人脸三维重建方法、计算机设备与介质,可提高人脸重建的精度。

2、为实现上述目的,本发明提供了如下方案:

3、一种基于深度学习的人脸三维重建方法,所述方法包括:

4、s1:获取目标人脸的多张不同视角图像;

5、s2:对于每一所述视角图像,以所述视角图像作为源视角图像,将所述源视角图像与目标视角图像输入训练好的粗匹配网络模型中,得到所述源视角图像到所述目标视角图像的预测光流;所述目标视角图像为所有视角图像中除所述源视角图像之外的视角图像;所述训练好的粗匹配网络模型是以样本源视角图像和样本目标视角图像为输入,以所述样本源视角图像到所述样本目标视角图像的样本光流为标签训练得到的模型;

6、s3:根据所述预测光流和所述视角图像对应的真实相机参数对所有所述视角图像进行融合,生成所述目标人脸的粗糙人脸;

7、s4:将所述粗糙人脸分割成若干个图像块,并生成每一所述图像块对应的虚拟相机参数,通过所述图像块对应的虚拟相机参数生成所述图像块对应的初始深度图;

8、s5:对于每一所述图像块,将所有所述视角图像和所述图像块对应的初始深度图输入训练好的曲面重建网络中,得到所述图像块的曲面预测编码;将所述曲面预测编码和所述图像块对应的初始深度图上每一像素点的坐标输入至训练好的曲面解码器中,得到所述图像块对应的初始深度图上每一像素点的重建深度值;所述训练好的曲面重建网络为以样本人脸的所有样本视角图像和样本初始深度图为输入,以样本曲面编码为标签训练得到的模型;所述训练好的曲面解码器为以样本曲面预测编码和样本点坐标为输入,以所述样本点对应的真实深度值为标签训练得到的模型;

9、s6:基于所有所述图像块对应的初始深度图上每一像素点的重建深度值确定所述目标人脸的重建人脸。

10、可选的,s3具体包括:

11、根据所述预测光流和所述视角图像对应的真实相机参数生成每一所述视角图像对应的真实深度图;

12、将所有所述视角图像对应的真实深度图进行融合,生成所述目标人脸的粗糙人脸。

13、可选的,所述训练好的粗匹配网络模型包括依次连接的rgb特征提取模块以及光流预测模块;

14、所述rgb特征提取模块,包括若干依次连接的卷积层,用于对所述源视角图像和所述目标视角图像进行特征提取;

15、所述光流预测模块,采用u-net网络,用于根据提取到的特征得到所述源视角图像到所述目标视角图像的预测光流。

16、可选的,所述生成每一所述图像块对应的虚拟相机参数,具体包括:

17、对于每一所述图像块,执行下述步骤:

18、采用主成分分析法对所述图像块进行处理,得到三个特征向量;

19、按照特征值从大到小的顺序对三个所述特征向量进行排序,将排序位于第一的特征向量记为第一特征向量,将排序位于第二的特征向量记为第二特征向量,将排序位于第三的特征向量记为第三特征向量;

20、将所述第一特征向量、所述第二特征向量分别作为虚拟相机的x轴和y轴,将所述第三特征向量的反方向作为虚拟相机的z轴,生成所述图像块对应的虚拟相机的虚拟相机坐标系;

21、分别确定所述第一特征向量、所述第二特征向量和所述第三特征向量在世界坐标系下的真实坐标;

22、根据所述真实坐标确定外参旋转矩阵r;

23、根据所述外参旋转矩阵r确定外参平移矩阵t;

24、根据所述图像块上图像点的坐标和所述外参旋转矩阵r以及所述外参平移矩阵t确定每一图像点的虚拟相机坐标;

25、根据所有图像点的虚拟相机坐标中x轴方向的最大值和y轴方向的最大值确定缩放系数s;

26、根据所述外参旋转矩阵r、所述外参平移矩阵t和所述缩放系数s生成虚拟相机的外参;

27、根据所述图像块对应的初始深度图的分辨率确定虚拟相机的内参;所述虚拟相机的外参和所述虚拟相机的内参组成所述虚拟相机的虚拟相机参数。

28、可选的,所述训练好的曲面重建网络包括依次连接的特征金字塔网络、特征互相关模块和曲面编码回归模块;

29、所述特征金字塔网络用于对每一所述视角图像进行特征提取,得到每一所述视角图像的特征;

30、所述特征互相关模块用于在所述图像块对应的初始深度图中选取若干个搜索点;对于每一所述视角图像,基于所述视角图像对应的真实相机参数将每一个所述搜索点的坐标投影到所述视角图像对应的图像坐标系下,得到每一个所述搜索点在所述视角图像对应的图像坐标系下的投影坐标,并基于所述视角图像的特征和所述投影坐标计算每一个所述搜索点在所述视角图像下对应的视角特征;对于每一个所述搜索点,将所述搜索点在所有所述视角图像下对应的视角特征进行两两互相关计算,得到每一个所述搜索点的互相关计算结果;将所有所述搜索点的互相关计算结果进行融合,得到深度方向代价体积;

31、所述曲面编码回归模块用于对每一所述视角图像的特征、所述深度方向代价体积和所述图像块对应的初始深度图进行编码,得到所述图像块的曲面预测编码。

32、可选的,在s5之前,还包括:对曲面解码器进行训练,训练过程如下:

33、获取第一样本集;所述第一样本集包括样本人脸的样本初始深度图和样本点坐标以及样本点对应的真实深度值;

34、利用第一样本集对曲面编码解码网络进行训练,得到训练好的曲面编码解码网络;所述训练好的曲面编码解码网络包括依次连接的训练好的曲面编码器和训练好的曲面解码器。

35、可选的,所述曲面编码解码网络训练过程中采用的损失函数包括深度损失函数与法向量损失函数;

36、所述深度损失函数的表达式为:

37、

38、其中,lossd表示深度损失函数值,n表示样本初始深度图上像素点的个数,表示样本初始深度图上第i个像素点的真实深度值;表示样本初始深度图上第i个像素点的重建深度值;

39、所述法向量损失函数的表达式为:

40、

41、其中,lossn表示法向量损失函数值,表示样本初始深度图上第i个像素点的真实法向量,表示样本初始深度图上第i个像素点的预测法向量。

42、所述预测法向量的确定过程如下:

43、在x轴和y轴方向上分别选取样本初始深度图上像素点的相邻像素点,得到x相邻像素点和y相邻像素点;

44、将所述x相邻像素点、所述y相邻像素点与所述像素点连接,得到一三角面片;

45、根据所述x相邻像素点、所述y相邻像素点和所述像素点的重建深度值和所述样本初始深度图对应的虚拟相机参数确定所述x相邻像素点、所述y相邻像素点和所述像素点的虚拟相机坐标;

46、根据所述x相邻像素点、所述y相邻像素点和所述像素点的虚拟相机坐标确定所述三角面片每条边的方向向量;

47、选取所述三角面片任意两条边,将两条边的方向向量进行叉乘,得到所述样本初始深度图上像素点的预测法向量。

48、本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述基于深度学习的人脸三维重建方法的步骤。

49、本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序适用于由处理器加载并执行上述基于深度学习的人脸三维重建方法。

50、根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的基于深度学习的人脸三维重建方法、计算机设备与介质,该方法通过训练好的粗匹配网络模型对目标人脸的多张不同视角图像进行预测,得到每一视角图像到目标视角图像的预测光流,然后根据预测光流和真实相机参数生成粗糙人脸,将粗糙人脸分割成若干个图像块,并通过图像块对应的虚拟相机参数生成每一图像块对应的初始深度图,然后通过训练好的曲面重建网络对目标人脸的所有视角图像和初始深度图进行编码,得到每一图像块的曲面预测编码,再通过训练好的曲面解码器对曲面预测编码进行解码,得到每一图像块对应的对应的初始深度图上每一像素点的重建深度值,最后基于重建深度值得到重建人脸。本发明通过深度学习模型基于多视角图像之间的匹配信息还原深度信息,提高了人脸重建的精度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1