1.本技术属于电子技术领域,具体涉及一种基模型的构建方法及其装置。
背景技术:2.随着人工智能技术的发展,三维(3dimensions,3d)人脸重建技术逐渐被应用于游戏、社交以及支付等网络虚拟场景中。在三维人脸重建技术中,可以通过将采集到的二维(2dimensions,2d)人脸图片输入至基模型中,通过基模型获取到二维人脸图像的人脸网格(mesh)。
3.目前,在构建基模型的过程中,通常是通过扫描设备扫描大量的不同人脸真实的人脸网格,然后对扫描到的人脸网格进行配准以及主成分分析(principal components analysis,pca)等,得到基模型。但是,由于通过扫描得到的人脸网格的数量通常有限,从而导致得到的基模型的模型能力不足,进而降低基模型输出的人脸网格的准确性。
技术实现要素:4.本技术实施例的目的是提供一种基模型的构建方法及其装置,能够解决基模型输出的人脸网格的准确性低的问题。
5.第一方面,本技术实施例提供了一种基模型的构建方法,包括:
6.基于初始基模型,构建三维重建网络,所述三维重建网络包括与所述初始基模型中的目标基参数的参数值关联的网络层;
7.对所述三维重建网络进行训练,以更新所述三维重建网络中各所述网络层,得到预测模型,所述预测模型中所述目标基参数关联的网络层的参数值为目标参数值;
8.基于所述预测模型生成目标基模型,所述目标基模型中所述目标基参数的参数值为所述目标参数值。
9.第二方面,本技术实施例提供了一种基模型的构建装置,包括:
10.网络构建模块,用于基于初始基模型,构建三维重建网络,所述三维重建网络包括与所述初始基模型中的目标基参数的参数值关联的网络层;
11.训练模块,用于对所述三维重建网络进行训练,以更新所述三维重建网络中各所述网络层,得到预测模型,所述预测模型中所述目标基参数关联的网络层的参数值为目标参数值;
12.模型生成模块,用于基于所述预测模型生成目标基模型,所述目标基模型中所述目标基参数的参数值为所述目标参数值。
13.第三方面,本技术实施例提供了一种电子设备,该电子设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
14.第四方面,本技术实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
15.第五方面,本技术实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
16.第六方面,本技术实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所述的方法。
17.在本技术实施例中,先通过初始基模型构建三维重建网络,使得构建的三维重建网络包括初始基模型中的目标及参数的参数值关联的网络层;然后,对构建的三维重建网络进行训练,以更新三维重建网络中各网络层(包括与目标基参数关联的网络层),得到目标基参数为目标参数值的预测模型,且该预测模型中目标基参数关联的网络层的参数值为目标参数值;最后,基于预测模型生成目标基模型,该目标基模型的目标基参数的参数值为目标参数值,且目标基模型的模型能力强于初始基模型的模型能力。如此,在初始基模型的模型能力不够的情况下,可以结合对三维重建网络的训练,实现对基模型中的目标基参数的参数值的更新,从而得到模型能力更强的基模型,进而提升基模型输出的人脸网格的准确性。
附图说明
18.图1是本技术提供的基模型的构建方法的实施例的流程示意图;
19.图2是本技术提供的基模型的构建方法的实施例中三角面片的法向量示意图;
20.图3是本技术提供的基模型的构建方法的实施例中三角面片的顶点示意图
21.图4是本技术提供的基模型的构建装置的实施例的结构示意图;
22.图5是本技术提供的电子设备的实施例的结构示意图;
23.图6是本技术提供的另一电子设备的实施例的硬件结构示意图。
具体实施方式
24.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本技术保护的范围。
25.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
26.下面结合附图,通过具体的实施例及其应用场景对本技术实施例提供的基模型的构建方法进行详细地说明。
27.请参见图1,是本技术实施例提供的基模型的构建方法的流程示意图。该基模型的构建方法应用于电子设备,如图1所示,方法包括如下步骤:
28.步骤101、基于初始基模型,构建三维重建网络,三维重建网络包括与初始基模型中的目标基参数的参数值关联的网络层。
29.上述初始基模型是指模型能力不足的基模型,即初始基模型在构建人脸网格的过程中,对于输入的二维图像中的部分人脸的形状和表情中的至少一项无法识别,导致输出的该二维图像的人脸网格与二维图像中的实际人脸不匹配。
30.例如,在输入的二维图像中的人脸存在张嘴的表情的情况下,上述初始基模型对于人脸中张嘴的表情无法识别,使得输出的人脸网格中并不存在张嘴的网格,因此,该初始基模型对于人脸中张嘴表情的基模型能力不足,等等。
31.本技术实施例中,在上述电子设备基于初始基模型,构建三维重建网络之前,电子设备还可以获取初始基模型。
32.上述获取初始基模型,可以是获取预设数量的预设人脸网格,对该预设数量的预设人脸网格进行基模型构建处理,得到上述初始基模型。其中,上述基模型构建处理可以是对人脸网格依次进行配准和主成分分析(principal components analysis,pca)等,由于配准和主成分分析等过程为本领域已知,在此并不进行赘述。
33.上述获取预设数量的预设人脸网格,可以是通过扫描设备扫描不同人脸得到上述预设人脸网格;或者,也可以以是通过人脸网格制作工具(例如,maya等),制作得到不同人脸的预设人脸网格。
34.上述预设数量可以根据实际需要进行设置,由于获取预设人脸网格的工作量较大,通常可以获取到的预设人脸网格数量不多。例如,上述预设数量可以是设置为几百或者几千等。
35.需要说明的是,上述基模型不仅仅是用于通过二维人脸图像构建人脸网格,还可以是用于通过人体其他部位的图像,构建人体其他部位的网格,例如,可以是构建人体的手臂网格(即此时手臂网格可以理解为上述的人脸网格),等等。
36.上述基于初始基模型,构建三维重建网络,可以是在初始的三维重建网络中增加与初始基模型的目标基参数的参数值关联的全连接层,以形成网络层包括上述全连接层的三维重建网络。
37.上述三维重建网络可以是用于人脸重建的任意深度神经网络,由于深度神经网络为本领域已知,在此并不赘述。
38.上述目标基参数可以包括上述初始基模型中的表情基参数和形状基参数中的至少一项。具体地,上述目标基参数可以包括上述表情基参数和形状基参数。
39.形状基参数可以是初始基模型中各个可以描绘人脸的形状的参数;上述表情基参数可以是初始基模型中各个可以描绘人脸的表情的参数。由于表情基参数和形状基参数的定义为本领域已知,在此并不进行赘述。
40.示例性地,基模型可以通过如下公式(1)表达:
[0041][0042]
上述公式(1)中,s
model
表示通过二维图像输出的人脸网格;
[0043]
表示平均的网格人脸;
[0044]
m为正整数,其表示形状基参数的数量,例如,可以是有80个形状基参数;
[0045]
si表示第i个形状(shape)基参数的参数值,此处i为小于或者等于m的正整数;
[0046]
αi表示第i个形状基参数的系数;
[0047]
n为正整数,其表示表情基参数的数量,例如,可以是有80个形状基参数;
[0048]ei
表示第i个表情(exp)基参数的参数值,此处i为小于或者等于n的正整数;
[0049]
βi表示第i个表情基参数的系数。
[0050]
其中,基模型中各形状基参数和各表情基参数的参数值是固定的,通过调节各形状基参数以及表情基参数的系数,可以实现输出不同的人脸网格。
[0051]
步骤102、对三维重建网络进行训练,以更新三维重建网络中各网络层,得到预测模型,预测模型中目标基参数的参数值为目标参数值。上述对三维重建网络进行训练,可以是在训练过程中,判断训练得到的三维重建网络的损失函数的损失值是否达到预设条件,例如,可以是判断损失值是否趋向于不变等,在未达到训练停止条件的情况下,对训练得到的三维重建网络进行迭代,即对训练得到的三维重建网络中各网络层的参数值进行调节,并继续下一轮训练,直至损失函数的损失值达到训练停止条件,训练停止得到上述预测模型,此时,该预测模型中目标基参数关联的网络层的参数值为上述目标参数值。
[0052]
上述对三维重建网络进行训练,可以是预先构建有训练集,该训练集中包括大量训练样本,且各训练样本包括二维图像以及与该二维图像对应的标注人脸网格,并将各训练样本的二维图像输入至三维重建网络中,根据三维重建网络的输出结果与对应的标注人脸网格,对三维重建网络进行迭代,实现对三维重建网络的有监督训练。
[0053]
在一些实施方式中,三维重建网络包括目标损失函数,目标损失函数用于约束三维重建网络输出的人脸网格出现不平滑。
[0054]
上述对三维重建网络进行训练,以更新三维重建网络中各网络层,得到预测模型,可以包括:
[0055]
通过二维图像集对三维重建网络进行训练;
[0056]
根据目标损失函数的损失值对三维重建网络中各网络层的参数值进行迭代更新,得到预测模型。
[0057]
本实施方式中,通过在三维重建网络中设置用于约束三维重建网络输出的人脸网格出现不平滑的目标损失函数,使得在通过二维图像集中的二维图像对三维重建网络进行半监督训练的过程中,可以通过目标损失函数的约束作用,提升预测模型输出的人脸网格的平滑度,进而提升目标基模型的模型能力。
[0058]
上述二维图像集可以是包括大量二维图像,该二维图像可以是通过数据库获取。具体地,在上述通过二维图像集对三维重建网络进行训练之前,方法还可以包括:从开源数据库中获取二维图像。其中,为增加基模型的鲁棒性,上述二维图像集中的二维图像可以是包括不同肤色、年龄、性别、表情以及长相等的图像。
[0059]
上述根据目标损失函数的损失值对三维重建网络中各网络层的参数值进行迭代更新,得到预测模型,可以是在训练过程中,判断目标损失函数的损失值是否达到训练停止条件,并根据判断结果对训练停止的参数值进行更新,得到预测模型。
[0060]
需要说明的是,上述三维重建网络还设置有除上述目标损失函数之外的其他损失函数,上述根据目标损失函数的损失值对三维重建网络中各网络层的参数值进行迭代更新,可以是根据目标损失函数的损失值以及其他损失函数的损失值,对三维重建网络中各网络层的参数值进行迭代更新。例如,可以是判断目标损失函数的损失值以及其他损失函数的损失值之和是否达到训练停止条件。
[0061]
上述目标损失函数可以是任意的能够用于约束三维重建网络输出的人脸网格出现不平滑的损失函数。
[0062]
在一些实施方式中,目标损失函数包括如下至少一项:
[0063]
对目标基参数产生约束的第一损失子函数;
[0064]
对三维重建网络输出的人脸网格中,各三角面片的法向量产生约束的第二损失子函数;
[0065]
对三维重建网络输出的人脸网格中,各三角面片的位移产生约束的第三损失子函数;
[0066]
对对三维重建网络输出的人脸网格中,三角面片的顶点的位移产生约束的第四损失子函数。
[0067]
本实施方式中,上述目标损失函数可以是包括上述第一损失子函数、第二损失子函数、第三损失子函数和第四损失子函数中的至少一项,从而使得目标损失函数的设置方式更灵活。
[0068]
上述目标损失函数可以是包括上述第一损失子函数、第二损失子函数、第三损失子函数和第四损失子函数中的至少一项。具体地,上述目标损失函数可以是包括上述第一损失子函数、第二损失子函数、第三损失子函数和第四损失子函数。
[0069]
上述第一损失子函数可以是任意的对目标基参数产生约束的损失函数。例如,上述第一损失子函数可以是用于约束三维重建网络中目标基参数的参数值,与初始模型中目标基参数的参数值的比值,等等。
[0070]
上述第二损失子函数可以是任意能够用于对三维重建网络输出的人脸网格中,各三角面片的法向量产生约束的损失函数。例如,上述第二损失函数可以是用于约束各三角面片的法向量与预设法向量之间的角度,等等。
[0071]
上述第三损失子函数可以是任意能够用于对三维重建网络输出的人脸网格中,各三角面片的位移产生约束的损失函数。例如,第三损失子函数可以用于约束各三角面片的中心点的位移,等等。
[0072]
上述第四损失子函数可以是任意能够用于对三维重建网络输出的人脸网格中,三角面片的顶点的位移产生约束的损失函数。例如,上述第四损失子函数可以用于约束人脸网格中的三角面片的各顶点的平均位移,等等。
[0073]
在一些实施方式中,第一损失子函数用于约束三维重建网络中目标基参数的参数值,与初始模型中目标基参数的参数值之差的绝对值。
[0074]
第二损失子函数可以用于约束各三角面片的法向量与其相邻的三角面片的法向量之间的角度。
[0075]
第三损失子函数可以用于约束各三角面片的顶点的位移的平均值。
[0076]
第四损失子函数可以用于约束三角面片的各顶点的目标绝对值,目标绝对值为顶点的位移与其相邻顶点的位移的平均值之差的绝对值。
[0077]
本实施方式中,通过设置上述第一损失子函数、第二损失子函数、第三损失子函数和第四损失子函数,可以提升上述目标损失函数的约束效果,进一步提升预测模型输出的人脸网格的平滑度,进而提升目标基模型的模型能力。
[0078]
需要说明的是,上述各损失子函数所约束的三角面片可以是人脸网格中的全部三
角面片,也可以是部分三角面片,该部分三角面片可以是根据需要进行设定。
[0079]
例如,如图2所示,人脸网格是由n三角面片组成,训练模型基导致的人脸网格不平整的表现形式就是三角面片的连接顶点隆起,这样就会导致相邻面片的法向量不一致;为了解决顶点隆起的问题,提出法向量损失函数(即第二损失子函数),此法向量损失函数是求所有面片的法向量,并且分别求每个法向量与其相邻面片法向量的之间的角度,对于面片较多的人脸模型,相邻的面片,法向量应当是趋近于一致。进一步的,由于人脸有很多曲折的部分,比如鼻子,那么可选择需要平滑的面片来算法向量损失函数,例如,可以是脸蛋的三角面片(即部分三角面片)。
[0080]
又一示例,顶点邻域的位移损失函数(即第四损失子函数)可以是以单个顶点连接的多个顶点为单位,如图3所示,对每个顶点p求其相邻顶点(p0、p1、p2
…
pn-1)的位移,取平均,用当前顶点p和平均值求差的绝对值,保证每个顶点的位移比较平滑。
[0081]
步骤103、基于预测模型生成目标基模型,目标基模型中目标基参数的参数值为目标参数值。在上述步骤103中,在训练得到上述预测模型之后,上述电子设备基于预测模型生成目标基模型,以使目标基模型中目标基参数的参数值为目标参数值,从而相比初始基模型,可以提升目标基模型的模型能力,即上述目标基模型的模型能力强于上述初始基模型的模型能力。
[0082]
上述目标基模型的模型能力强于上述目标初始基模型的模型能力,可以理解为:目标基模型不仅能够识别初始基模型能够识别的人脸,还能够识别初始基模型不能识别的人脸中的至少部分人脸。
[0083]
在一些实施方式中,基于预测模型生成目标基模型,包括:
[0084]
将初始基模型中目标基参数的参数值替换为目标参数值,得到目标基模型。
[0085]
本实施方式中,通过直接将初始基模型中目标基参数的参数值替换为目标参数值,得到目标基模型,从而可以提升生成目标基模型的效率。
[0086]
或者,基于预测模型生成目标基模型,包括:
[0087]
将多张二维图像输入至预测模型中,通过预测模型输出多个人脸网格;
[0088]
对预测模型输出的多个人脸网格进行基模型构建处理,构建得到目标基模型。
[0089]
本实施方式中,通过预测模型输出的多个人脸网格进行基模型构建处理,得到目标基模型,从而使得生成目标基模型的方式更灵活。
[0090]
上述多张二维图像可以是上述二维图片集中的部分或者全部图片,或者也可以是上述二维图片集之外的图片。
[0091]
在一些实施方式中,上述将多张二维图像输入至预测模型中,通过预测模型输出多个人脸网格之前,方法还可以包括:
[0092]
将预设二维图片集中的二维图片输入至初始基模型中,得到各二维图片的人脸网格;
[0093]
确定二维图片集中的二维图片的人脸网格中,与其对应的二维图片匹配的第一人脸网格,以及,与其对应二维图片不匹配的第二人脸网格。
[0094]
上述多张二维图像输入至预测模型中,通过预测模型输出多个人脸网格,可以包括:
[0095]
将多张第二人脸网格对应的二维图片输入至预测模型中,通过预测模型输出多个
第三人脸网格。
[0096]
上述对预测模型输出的多个人脸网格进行基模型构建处理,可以包括:
[0097]
对得到的第一人脸网格和第三人脸网格进行基模型构建处理。
[0098]
本实施方式中,通过上述第一人脸网格和第三人脸网格进行基模型构建处理,构建得到上述目标基模型,从而可以提升生成上述目标基模型的效率。
[0099]
本技术实施例中,先通过初始基模型构建三维重建网络,使得构建的三维重建网络包括初始基模型中的目标及参数的参数值关联的网络层;然后,对构建的三维重建网络进行训练,以更新三维重建网络中各网络层(包括与目标基参数关联的网络层),得到目标基参数为目标参数值的预测模型,且该预测模型中目标基参数关联的网络层的参数值为目标参数值;最后,基于预测模型生成目标基模型,该目标基模型的目标基参数的参数值为目标参数值。如此,在初始基模型的模型能力不够的情况下,可以结合对三维重建网络的训练,实现对基模型中的目标基参数的参数值的更新,从而得到模型能力更强的基模型,进而提升基模型输出的人脸网格的准确性。本技术实施例提供的基模型的构建方法,执行主体可以为基模型的构建装置。本技术实施例中以基模型的构建装置执行基模型的构建方法为例,说明本技术实施例提供的基模型的构建装置。
[0100]
请参见图4,是本技术实施例提供的基模型的构建装置的结构示意图。如图4所示,基模型的构建装置400包括:
[0101]
网络构建模块401,用于基于初始基模型,构建三维重建网络,三维重建网络包括与初始基模型中的目标基参数的参数值关联的网络层;
[0102]
训练模块402,用于对三维重建网络进行训练,以更新三维重建网络中各网络层,得到预测模型,预测模型中目标基参数关联的网络层的参数值为目标参数值;
[0103]
模型生成模块403,用于基于预测模型生成目标基模型,目标基模型中目标基参数的参数值为目标参数值。
[0104]
在一些实施方式中,三维重建网络包括目标损失函数,目标损失函数用于约束三维重建网络输出的人脸网格出现不平滑。
[0105]
训练模块402,具体可用于:
[0106]
通过二维图像集对三维重建网络进行训练,并根据目标损失函数的损失值对三维重建网络中各网络层的参数值进行迭代更新,得到预测模型。
[0107]
在一些实施方式中,目标损失函数包括如下至少一项:
[0108]
对目标基参数产生约束的第一损失子函数;
[0109]
对三维重建网络输出的人脸网格中,各三角面片的法向量产生约束的第二损失子函数;
[0110]
对三维重建网络输出的人脸网格中,各三角面片的位移产生约束的第三损失子函数;
[0111]
对三维重建网络输出的人脸网格中,三角面片的顶点的位移产生约束的第四损失子函数。
[0112]
在一些实施方式中,第一损失子函数用于约束三维重建网络中目标基参数的参数值,与初始模型中目标基参数的参数值之差的绝对值。
[0113]
第二损失子函数可用于约束各三角面片的法向量与其相邻的三角面片的法向量
之间的角度。
[0114]
第三损失子函数可用于约束各三角面片的顶点的位移的平均值。
[0115]
第四损失子函数可用于约束三角面片的各顶点的目标绝对值,目标绝对值为顶点的位移与其相邻顶点的位移的平均值之差的绝对值。
[0116]
在一些实施方式中,模型生成模块403,具体用于:
[0117]
将初始基模型中目标基参数的参数值替换为目标参数值,得到目标基模型。
[0118]
在一些实施方式中,模型生成模块403,包括:
[0119]
预测单元,用于将多张二维图像输入至预测模型中,通过预测模型输出多个人脸网格;
[0120]
模型构建单元,用于对预测模型输出的多个人脸网格进行基模型构建处理,构建得到目标基模型。
[0121]
本技术实施例中的基模型的构建装置可以是电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(mobile internet device,mid)、增强现实(augmented reality,ar)/虚拟现实(virtual reality,vr)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,umpc)、上网本或者个人数字助理(personal digital assistant,pda)等,还可以为服务器、网络附属存储器(network attached storage,nas)、个人计算机(personal computer,pc)、电视机(television,tv)、柜员机或者自助机等,本技术实施例不作具体限定。
[0122]
本技术实施例中的基模型的构建装置可以为具有操作系统的装置。该操作系统可以为安卓(android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本技术实施例不作具体限定。
[0123]
本技术实施例提供的基模型的构建装置能够实现图1的方法实施例实现的各个过程并达到相同的技术效果,为避免重复,这里不再赘述。
[0124]
可选地,如图5所示,本技术实施例还提供一种电子设备500,包括处理器501和存储器502,存储器502上存储有可在处理器501上运行的程序或指令,该程序或指令被处理器501执行时实现上述基模型的构建方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0125]
需要说明的是,本技术实施例中的电子设备包括上述的移动电子设备和非移动电子设备。
[0126]
图6为实现本技术实施例的一种电子设备的硬件结构示意图。
[0127]
该电子设备600包括但不限于:射频单元601、网络模块602、音频输出单元603、输入单元604、传感器605、显示单元606、用户输入单元607、接口单元608、存储器609、以及处理器610等部件。
[0128]
本领域技术人员可以理解,电子设备600还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器610逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图6中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布
置,在此不再赘述。
[0129]
其中,处理器610,用于:
[0130]
基于初始基模型,构建三维重建网络,三维重建网络包括与初始基模型中的目标基参数的参数值关联的网络层;
[0131]
对三维重建网络进行训练,以更新三维重建网络中各网络层,得到预测模型,预测模型中目标基参数关联的网络层的参数值为目标参数值;
[0132]
基于预测模型生成目标基模型,目标基模型中目标基参数的参数值为目标参数值。
[0133]
在一些实施方式中,三维重建网络包括目标损失函数,目标损失函数用于约束三维重建网络输出的人脸网格出现不平滑。
[0134]
处理器610,还可用于:
[0135]
通过二维图像集对三维重建网络进行训练,并根据目标损失函数的损失值对三维重建网络中各网络层的参数值进行迭代更新,得到预测模型。
[0136]
在一些实施方式中,目标损失函数包括如下至少一项:
[0137]
对目标基参数产生约束的第一损失子函数;
[0138]
对三维重建网络输出的人脸网格中,各三角面片的法向量产生约束的第二损失子函数;
[0139]
对三维重建网络输出的人脸网格中,各三角面片的位移产生约束的第三损失子函数;
[0140]
对三维重建网络输出的人脸网格中,三角面片的顶点的位移产生约束的第四损失子函数。
[0141]
在一些实施方式中,第一损失子函数用于约束三维重建网络中目标基参数的参数值,与初始模型中目标基参数的参数值之差的绝对值;
[0142]
第二损失子函数用于约束各三角面片的法向量与其相邻的三角面片的法向量之间的角度;
[0143]
第三损失子函数用于约束各三角面片的顶点的位移的平均值;
[0144]
第四损失子函数用于约束三角面片的各顶点的目标绝对值,目标绝对值为顶点的位移与其相邻顶点的位移的平均值之差的绝对值。
[0145]
在一些实施方式中,处理器610,还用于:
[0146]
将初始基模型中目标基参数的参数值替换为目标参数值,得到目标基模型。
[0147]
在一些实施方式中,处理器610,还用于:
[0148]
将多张二维图像输入至预测模型中,通过预测模型输出多个人脸网格;
[0149]
对预测模型输出的多个人脸网格进行基模型构建处理,构建得到目标基模型。
[0150]
本技术实施例提供的电子设备能够实现图1的方法实施例实现的各个过程并达到相同的技术效果,为避免重复,这里不再赘述。
[0151]
应理解的是,本技术实施例中,输入单元604可以包括图形处理器(graphics processing unit,gpu)6041和麦克风6042,图形处理器6041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元606可包括显示面板6061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板
6061。用户输入单元607包括触控面板6071以及其他输入设备6072中的至少一种。触控面板6071,也称为触摸屏。触控面板6071可包括触摸检测装置和触摸控制器两个部分。其他输入设备6072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
[0152]
存储器609可用于存储软件程序以及各种数据。存储器609可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器609可以包括易失性存储器或非易失性存储器,或者,存储器609可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synch link dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,drram)。本技术实施例中的存储器609包括但不限于这些和任意其它适合类型的存储器。
[0153]
处理器610可包括一个或多个处理单元;可选的,处理器610集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器610中。
[0154]
本技术实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述基模型的构建方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0155]
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器rom、随机存取存储器ram、磁碟或者光盘等。
[0156]
本技术实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述基模型的构建方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0157]
应理解,本技术实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
[0158]
本技术实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如上述基模型的构建方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0159]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该
要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本技术实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
[0160]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本技术各个实施例所述的方法。
[0161]
上面结合附图对本技术的实施例进行了描述,但是本技术并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本技术的启示下,在不脱离本技术宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本技术的保护之内。