模型参数的更新方法、装置、设备及存储介质与流程

文档序号:21878412发布日期:2020-08-18 16:21阅读:195来源:国知局
模型参数的更新方法、装置、设备及存储介质与流程

本发明涉及金融科技(fintech)的人工智能技术领域,尤其涉及一种模型参数的更新方法、装置、设备及存储介质。



背景技术:

随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(fintech)转变,人工智能技术也不例外,但由于金融行业的安全性、实时性要求,也对人工智能技术提出的更高的要求。

跨年龄的人脸生成在很多场景中都能得到应用,比如说在直播软件中,跨年龄人脸生成作为一种人脸特效,用户选择该特效后,可以根据用户的人脸图像,生成该用户任意年龄的人脸图像,比如若干年后的样貌;另一个应用场景是用于长时的罪犯追踪,假设只有罪犯若干年前的照片,如果能通过跨年龄人脸生成,生成当前用户的长相,对于追捕罪犯会有很大的帮助;另外,对于寻找失踪的儿童,该技术也有潜在的价值。

目前的跨年龄的人脸生成方案是通过渲染的方法:首先通过人脸关键点识别以及人脸区域分割,找出人脸的眼睛、鼻子,嘴巴,头发,眉毛,额头,脸颊等区域,认为这些区域会随着年龄变化而变化;然后通过传统的图像处理方式,给这些区域做渲染,比如说,根据年龄,将头发渲染成相应的颜色,比如灰白色,比如在额头区域,添加上皱纹,在眼睛眼角区域,增加上鱼尾纹等等。这种方式需要设计大量的模型,且生成的方式比较固定,每个人的生成方式都大同小异,只是对不同年龄有不同的处理方式。

由此可知,目前的跨年龄的人脸图像生成方案中无法衡量所生成的人脸图像和原始人脸图像之间的相似度,目前采用的做法是在生成的人脸图像和原始人脸图像之间加入一个像素级别的损失函数,然而这种约束过于强,导致所生成的人脸图像和原始人脸图像非常相似,并没有体现出年龄变化的真实特点。综上所述,目前的跨年龄人脸图像的生成方法所生成的跨年龄人脸图像准确率低下。



技术实现要素:

本发明的主要目的在于提供一种模型参数的更新方法、装置、设备及存储介质,旨在解决现有的跨年龄人脸图像的生成方法所生成的跨年龄人脸图像准确率低下的技术问题。

为实现上述目的,本发明提供一种模型参数的更新方法,所述模型参数的更新方法包括步骤:

获取待训练数据,其中,所述待训练数据至少包括目标年龄、第一人脸图像、第二人脸图像和第三人脸图像,所述第一人脸图像和所述第二人脸图像属于同一用户的人脸图像,所述第一人脸图像和所述第三人脸图像属于不同用户的人脸图像;

基于预设生成式对抗网络的生成模型,根据所述第一人脸图像和所述目标年龄得到第四人脸图像;

基于预设人脸特征提取模型和生成式对抗网络的判别模型,根据所述第四人脸图像、所述第二人脸图像和所述第三人脸图像得到目标损失值;

根据所述目标损失值更新所述生成模型的第一模型参数。

可选地,所述基于预设人脸特征提取模型和生成式对抗网络的判别模型,根据所述第四人脸图像、所述第二人脸图像和所述第三人脸图像得到目标损失值的步骤包括:

基于预设生成式对抗网络的判别模型,根据所述第三人脸图像和所述第四人脸图像得到第一损失值;

将所述第二人脸图像和所述第四人脸图像输入至预设的人脸特征提取模型中,得到第二损失值;

根据所述第一损失值和所述第二损失值得到目标损失值。

可选地,所述将所述第二人脸图像和所述第四人脸图像输入至预设的人脸特征提取模型中,得到第二损失值的步骤包括:

将所述第二人脸图像和所述第四人脸图像输入至预设的人脸特征提取模型中,得到所述第二人脸图像对应的第一人脸特征和所述第四人脸图像对应的第二人脸特征;

根据所述第一人脸特征和所述第二人脸特征计算得到第二损失值。

可选地,所述根据所述第一损失值和所述第二损失值得到目标损失值的步骤包括:

获取所述第一损失值对应的第一权重,以及获取所述第二损失值对应的第二权重;

将所述第一损失值乘以所述第一权重,得到第一乘积,以及将所述第二损失值乘以所述第二权重,得到第二乘积;

将所述第一乘积与所述第二乘积相加,得到目标损失值。

可选地,所述根据所述目标损失值更新所述生成模型的第一模型参数的步骤之后,还包括:

根据所述目标损失值更新所述判别模型的第二模型参数。

可选地,所述根据所述目标损失值更新所述生成模型的第一模型参数的步骤之后,还包括:

根据所述目标损失值确定所述生成模型是否处于收敛状态;

若确定所述生成模型未处于所述收敛状态,则返回执行所述获取待训练数据的步骤;

若确定所述生成模型处于收敛状态,则将收敛状态对应的生成模型确定为目标生成模型。

可选地,所述根据所述目标损失值更新所述生成模型的第一模型参数的步骤之后,还包括:

若接收到第一年龄的人脸图像后,确定所述第一年龄的人脸图像对应的第二年龄;

将所述第一年龄的人脸图像和对应的第二年龄输入至所述生成模型中,得到所述第二年龄对应的人脸图像,其中,所述生成模型为处于收敛状态的模型。

可选地,所述将所述第一年龄的人脸图像和对应的第二年龄输入至所述生成模型中,得到所述第二年龄对应的人脸图像的步骤包括:

将所述第一年龄的人脸图像和所述第二年龄输入至所述生成模型中,通过所述生成模型对所述第一年龄的人脸图像和所述第二年龄进行特征提取,得到所述第一年龄的人脸图像对应的第一特征和所述第二年龄对应的第二特征;

连接所述第一特征和所述第二特征得到目标特征,将所述目标特征输入卷积神经网络中得到所述第二年龄对应的人脸图像。

可选地,所述根据所述目标损失值更新所述生成模型的第一模型参数的步骤包括:

根据所述目标损失值计算所述生成模型中各第一模型参数对应的第一梯度值;

根据所述第一梯度值对应更新所述第一梯度值对应的第一模型参数。

此外,为实现上述目的,本发明还提供一种模型参数的更新装置,所述模型参数的更新装置包括:

获取模块,用于获取待训练数据,其中,所述待训练数据至少包括目标年龄、第一人脸图像、第二人脸图像和第三人脸图像,所述第一人脸图像和所述第二人脸图像属于同一用户的人脸图像,所述第一人脸图像和所述第三人脸图像属于不同用户的人脸图像;

确定模块,用于基于预设生成式对抗网络的生成模型,根据所述第一人脸图像和所述目标年龄得到第四人脸图像;基于预设人脸特征提取模型和生成式对抗网络的判别模型,根据所述第四人脸图像、所述第二人脸图像和所述第三人脸图像得到目标损失值;

更新模块,用于根据所述目标损失值更新所述生成模型的第一模型参数。

此外,为实现上述目的,本发明还提供一种模型参数的更新设备,所述模型参数的更新设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的模型参数的更新程序,所述模型参数的更新程序被所述处理器执行时实现如联邦学习服务器对应的模型参数的更新方法的步骤。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有模型参数的更新程序,所述模型参数的更新程序被处理器执行时实现如上所述的模型参数的更新方法的步骤。

本发明通过获取待训练数据,其中,待训练数据至少包括目标年龄、第一人脸图像、第二人脸图像和第三人脸图像,第一人脸图像和第二人脸图像属于同一用户的人脸图像,第一人脸图像和第三人脸图像属于不同用户的人脸图像,基于预设生成式对抗网络的生成模型,根据第一人脸图像和目标年龄得到所述第四人脸图像;基于预设人脸特征提取模型和生成式对抗网络的判别模型,根据第四人脸图像、第二人脸图像和所述第三人脸图像得到目标损失值,根据目标损失值更新生成模型的第一模型参数,实现了在训练生成模型过程中,通过人脸特征提取模型来指导训练生成模型的训练,且在更新生成模型的模型参数过程中,通过生成式对抗网络和人脸特征提取模型来优化生成模型的模型参数,从而提高了通过生成模型生成跨年龄人脸图像的准确率。

附图说明

图1是本发明模型参数的更新方法第一实施例的流程示意图;

图2是本发明实施例中模型参数的更新方法对应模型框架的一种结构示意图;

图3是本发明模型参数的更新装置较佳实施例的功能示意图模块图;

图4是本发明实施例方案涉及的硬件运行环境的结构示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明提供一种模型参数的更新方法,参照图1,图1为本发明模型参数的更新方法第一实施例的流程示意图。

本发明实施例提供了模型参数的更新方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

模型参数的更新方法应用于服务器或者终端中,终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(personaldigitalassistant,pda)等移动终端,以及诸如数字tv、台式计算机等固定终端。在模型参数的更新方法的各个实施例中,为了便于描述,省略执行主体进行阐述各个实施例。模型参数的更新方法包括:

步骤s10,获取待训练数据,其中,所述待训练数据至少包括目标年龄、第一人脸图像、第二人脸图像和第三人脸图像,所述第一人脸图像和所述第二人脸图像属于同一用户的人脸图像,所述第一人脸图像和所述第三人脸图像属于不同用户的人脸图像。

获取待训练数据,其中,一组待训练数据至少目标年龄、第一人脸图像、第二人脸图像和第三人脸图像,第一人脸图像和第二人脸图像属于同一用户的人脸图像,第一人脸图像和第三人脸图像属于不同用户的人脸图像,目标年龄是跨年龄人脸图像对应的年龄,如当目标年龄为60岁时,表明最终要生成60岁的跨年龄人脸图像,第一人脸图像和第二人脸图像为第一用户的人脸图像,第一人脸图像和第二人脸图像可以为第一用户同一年龄的人脸图像,也可以为第一用户不同年龄的人脸图像,第三人脸图像为目标年龄对应的第二用户的人脸图像,第一用户和第二用户是不同的用户。在本实施例中,不限制第一人脸图像和第二人脸图像对应的年龄。

在本实施例中,所获取的待训练数据的数量可根据具体需要而设置,如可以获取30组待训练数据,也可以获取100组待训练数据。具体地,可在侦测到获取指令时,根据获取指令获取待训练数据,该获取指令可由用户根据需要而触发,也可由预先设置好的定时任务定时触发。

步骤s20,基于预设生成式对抗网络的生成模型,根据所述第一人脸图像和所述目标年龄得到第四人脸图像。

当获取到待训练数据后,获取预先设置好的生成式对抗网络中的生成模型,将第一人脸图像和目标年龄输入至生成模型中,得到生成模型的输出,本实施例为了便于描述,将生成模型的输出记为第四人脸图像,第四人脸图像就是第一人脸图像在目标年龄下对应的人脸图像。具体地,在将第一人脸图像和目标年龄输入生成模型中后,通过生成模型可对第一人脸图像和目标年龄进行特征提取,然后将从第一人脸图像中提取的特征与目标年龄对应特征连接起来,通过卷积神经网络生成第四人脸图像。其中,可获取预设数量某个年龄的人脸图像,以及获取与该人脸图像另一年龄的,同一用户的另一人脸图像,将某个年龄的人脸图像和另一年龄作为卷积神经网络模型输入,将同一用户另一年龄对应的人脸图像作为机器学习的输出,即作为卷积神经网络模型输入的标签,以训练得到生成模型,这两个年龄可以相等,也可以不相等。需要说明的是,生成式对抗网络通过框架中(至少)两个模块:生成模型(generativemodel)和判别模型(discriminativemodel)的互相博弈学习产生相当好的输出。

步骤s30,基于预设人脸特征提取模型和生成式对抗网络的判别模型,根据所述第四人脸图像、所述第二人脸图像和所述第三人脸图像得到目标损失值。

当得到第四人脸图像后,获取预先设置的人脸特征提取模型和生成式对抗网络中的判别模型,并基于预设的判别模型和人脸特征提取模型,根据第四人脸图像、第二人脸图像和第三人脸图像得到目标损失值。需要说明的是,通过该判别模型可识别一个人脸图像是真实拍摄的人脸图像还是通过生成模型生成的人脸图像;通过人脸特征提取模型可以提取人脸图像中的人脸特征,将人脸映射成一个固定维度的人脸特征来表示,该人脸特征可通过向量来表示,然后通过计算两个人脸特征之间的距离,来确定两幅人脸图像中的人脸是否属于同一用户。可以理解的,当两个人脸特征之间的距离越小,表示对应两幅人脸图像中的人脸越有可能属于同一用户;当两个人脸特征之间的距离越大,表示对应两幅人脸图像中的人脸越不可能属于同一用户。在本实施例中,不限制人脸特征对应的维度,如可人脸特征的维度可以是256维或者512维等。

需要说明的是,判别模型的训练过程为获取真实拍摄的人脸图像,并为真实拍摄的人脸图像添加真实标签,以及获取生成模型生成的人脸图像,并为生成模型生成的人脸图像添加生成标签,本实施例不限制真实标签和生成标签的表现形式。当得到携带真实标签的人脸图像和生成标签的人脸图像后,将携带真实标签的人脸图像和携带生成标签的人脸图像输入至判别模型对应的基础模型中,得到判别模型,其中,判别模型的基础模型可为机器学习模型或者神经网络模型等。人脸特征提取模型就是用于提取人脸图像中的人脸特征的人脸识别模型。

进一步地,步骤s30包括:

步骤a,基于预设生成式对抗网络的判别模型,根据所述第三人脸图像和所述第四人脸图像得到第一损失值。

进一步地,当得到判别模型后,将第三人脸图像和第四人脸图像输入至判别模型中,得到判别模型的输出,其中,判别模型的输出为一个损失值,为了便于区分不同模型输出的损失值,将判别模型的输出的损失值记为第一损失值。

步骤b,将所述第二人脸图像和所述第四人脸图像输入至预设的人脸特征提取模型中,得到第二损失值。

当得到第四人脸图像和人脸特征提取模型后,将第二人脸图像和第四人脸图像输入至人脸特征提取模型中,得到人脸特征提取模型输出的损失值,并将人脸特征提取模型输出的损失值记为第二损失值。

进一步地,步骤b包括:

步骤b1,将所述第二人脸图像和所述第四人脸图像输入至预设的人脸特征提取模型中,得到所述第二人脸图像对应的第一人脸特征和所述第四人脸图像对应的第二人脸特征。

步骤b2,根据所述第一人脸特征和所述第二人脸特征计算得到第二损失值。

当得到第二人脸图像和第四人脸图像后,将第二人脸图像和第四人脸图像输入至预设的人脸提取模型中,得到第二人脸图像对应的人脸特征和第四人脸图像对应的人脸特征。在本实施例中,为了便于区分,将第二人脸图像对应的人脸特征记为第一人脸特征,将第四人脸图像对应的人脸特征记为第二人脸特征。当得到第一人脸特征和第二人脸特征后,根据第一人脸特征和第二人脸特征计算得到第二损失值。

进一步地,步骤b2包括:

步骤b21,计算所述第一人脸特征和所述第二人脸特征之间的特征距离。

步骤b22,根据所述特征距离计算得到第二损失值。

具体地,当得到第一人脸特征和第二人脸特征后,计算第一人脸特征和第二人脸特征之间的特征距离,根据特征距离计算得到第二损失值。其中,本实施例可通过余弦距离算法计算第一人脸特征和第二人脸特征之间的特征距离。若将第一人脸特征记为第二人脸特征记为将第二损失值记为lrecog,则计算第二损失值的损失函数可用如下公式表示:

其中,f()表示人脸特征提取模型,a'i=g(ai,a)表示对第一人脸图像ai和目标年龄a的跨年龄人脸图像,得到a'i,即a'i表示第四人脸图像,g()表示生成模型,“||||”表示特征距离。

进一步地,在其它实施例中,也可以通过计算第二人脸图像和第四人脸图像之间的图像相似度,根据图像相似度得到第二损失值。

步骤c,根据所述第一损失值和所述第二损失值得到目标损失值。

当得到第一损失值和第二损失值后,根据第一损失值和第二损失值得到目标损失值。如可以直接将第一损失值和第二损失值相加,将第一损失值和第二损失值相加所得的值确定为目标损失值。

进一步地,步骤c包括:

步骤c1,获取所述第一损失值对应的第一权重,以及获取所述第二损失值对应的第二权重。

步骤c2,将所述第一损失值乘以所述第一权重,得到第一乘积,以及将所述第二损失值乘以所述第二权重,得到第二乘积。

步骤c3,将所述第一乘积与所述第二乘积相加,得到目标损失值。

进一步地,当得到第一损失值和第二损失值后,获取第一损失值对应的第一权重,以及获取第二损失值对应的第二权重,其中,第一权重和第二权重是预先设置好的。可以理解的是,第一权重和第二权重之间的和等于1。当得到第一损失值、第一权重、第二损失值和第二权重后,将第一损失值乘以第一权重,得到第一损失值和第一权重之间的第一乘积,并将第二损失值乘以第二权重,得到第二损失值和第二权重之间的第二乘积。当得到第一乘积和第二乘积后,将第一乘积与第二乘积相加,得到目标损失值。若将第一权重记为α,第二权重记为β,目标损失值记为l,第一损失值记为lgan,则计算得到目标损失值的过程可用公式l=αlgan+βlrecog表示。

具体地,可参照图2,在图2中,a为第一人脸图像,b为第二人脸图像,a’为第四人脸图像,c为第三人脸图像,lgan为通过损失函数得到的第一损失值,lrecog为通过损失函数得到第二损失值。

步骤s40,根据所述目标损失值更新所述生成模型的第一模型参数。

需要说明的是,在本发明实施例中,人脸特征提取模型的模型参数是不需要更新的,生成模型和判别模型的模型参数需要更新。当得到目标损失值后,根据目标损失值更新生成模型的第一模型参数。

进一步地,所述模型参数的更新方法还包括:

步骤o,根据所述目标损失值更新所述判别模型的第二模型参数。

进一步地,当得到目标损失值后,根据目标损失值更新判别模型的第二模型参数。

进一步地,步骤s40包括:

步骤d,根据所述目标损失值计算所述生成模型中各第一模型参数对应的第一梯度值。

具体地,当确定目标损失值后,根据目标损失值计算生成模型各个第一模型参数对应的第一梯度值。进一步地,根据目标损失值计算判别模型中各个第二模型参数对应的第二梯度值。需要说明的是,不管是在生成模型中,还是在判别模型中,每个模型参数都存在对应的梯度值。在本实施例中,基于目标损失值,通过矩阵求导链式法则可以得到各个模型参数的对应的梯度值。

步骤e,根据所述第一梯度值对应更新所述第一梯度值对应的第一模型参数。

当得到第一梯度值和第二梯度值后,根据第一梯度值更新各个第一梯度值对应的第一模型参数,从而得到更新后的第一模型参数,根据更新后的第一模型参数得到更新后的生成模型;进一步地,根据第二梯度值更新第二梯度值对应的第二模型参数,得到更新后的第二模型参数,根据更新后的第二模型参数得到更新后的判别模型。具体地,可计算梯度值与对应模型参数的更新系数之间的乘积,然后将原来,未更新的模型参数减去对应梯度值与更新系数之间的乘积,从而得到更新后的模型参数,其中,更新系数可根据具体需要而设置,各个模型参数对应的更新系数可以相同,也可以不相同。在其它实施例中,也可以直接将未更新的模型参数减去梯度值,得到更新后的模型参数。

本实施例通过获取待训练数据,其中,待训练数据至少包括目标年龄、第一人脸图像、第二人脸图像和第三人脸图像,第一人脸图像和第二人脸图像属于同一用户的人脸图像,第一人脸图像和第三人脸图像属于不同用户的人脸图像,基于预设生成式对抗网络的生成模型,根据第一人脸图像和目标年龄得到所述第四人脸图像;基于预设人脸特征提取模型和生成式对抗网络的判别模型,根据第四人脸图像、第二人脸图像和所述第三人脸图像得到目标损失值,根据目标损失值更新生成模型的第一模型参数,实现了在训练生成模型过程中,通过人脸特征提取模型来指导训练生成模型的训练,且在更新生成模型的模型参数过程中,通过生成式对抗网络和人脸特征提取模型来优化生成模型的模型参数,从而提高了通过生成模型生成跨年龄人脸图像的准确率。

进一步地,需要说明的是,本实施例通过人脸特征提取模型保证通过生成模型所生成的跨年龄人脸图像与原始人脸图像之间的特征的距离足够小,从而保证了所生成的跨年龄人脸图像的真实度,且通过生成式对抗网络保证所生成的跨年龄人脸图像中的关键特征不丢失,不容易发生图像映射歧义,从而提高了所生成的跨年龄人脸图像的准确率。

进一步地,提出本发明模型参数的更新方法第二实施例。所述模型参数的更新方法第二实施例与所述模型参数的更新方法第一实施例的区别在于,所述模型参数的更新方法还包括:

步骤f,根据所述目标损失值确定所述生成模型是否处于收敛状态。

步骤g,若确定所述生成模型未处于所述收敛状态,则返回执行所述获取待训练数据的步骤。

步骤h,若确定所述生成模型处于收敛状态,则将收敛状态对应的生成模型确定为目标生成模型。

当得到目标损失值后,根据目标损失值确定生成模型是否处于收敛状态。具体地,判断目标损失值是否小于预设阈值,其中,预设阈值的大小可根据具体需要而设置,本实施例与预设阈值的大小不做具体限制。若确定目标损失值小于预设阈值,则确定生成模型处于收敛状态;若确定目标损失值大于或者等于预设阈值,则确定生成模型未处于收敛状态。当确定生成模型处于收敛状态时,将收敛状态对应的生成模型确定为目标生成模型,即将确定生成模型处于收敛状态时目标损失值更新所得的生成模型确定为目标生成模型;当确定生成模型未处于收敛状态时,则继续获取待训练数据,继续训练生成模型,直到生成模型处于收敛状态。需要说明的是,根据目标损失值确定判别模型是否处于收敛状态的过程和根据目标损失值确定生成模型是否处于收敛状态的过程相同,在此不再重复赘述。

进一步地,也可计算生成模型的第一模型参数的更新次数,当更新次数大于预设次数时,确定生成模型处于收敛状态,将最后一次更新第一模型参数所得的生成模型确定为目标生成模型;当更新次数小于或者等于预设次数时,确定生成模型未处于收敛状态,继续获取待训练数据更新生成模型的第一模型参数。其中,预设次数的大小可根据具体需要而设置,本实施例不限制预测次数的大小。需要说明的是,生成模型的第一模型参数每更新一次,表明生成模型经过了一次的迭代训练。

进一步地,所述模型参数的更新方法还包括:

步骤i,若接收到第一年龄的人脸图像后,确定所述第一年龄的人脸图像对应的第二年龄。

当得到目标生成模型后,检测是否接收到第一年龄的人脸图像,其中,该第一年龄的人脸图像可为通过摄像状态拍摄的,也可为预先存储的,或者是其它终端设备发送的。若检测到未接收到第一年龄的人脸图像,则继续检测是否接收到第一年龄的人脸图像;若接收到第一年龄的人脸图像,确定第一年龄的人脸图像对应的第二年龄,该第二年龄是预先设置好的,也可以是携带在第一年龄的人脸图像中的。可以理解的是,第一年龄和第二年龄不相等。

步骤j,将所述第一年龄的人脸图像和对应的第二年龄输入至所述生成模型中,得到所述第二年龄对应的人脸图像,其中,所述生成模型为处于收敛状态的模型。

当得到第一年龄的人脸图像和第二年龄后,将第一年龄的人脸图像和对应的第二年龄输入至生成模型中,得到第二年龄对应的人脸图像,即生成模型的输出就是跨年龄后的人脸图像,其中,本实施例中的生成模型是处于收敛状态的模型,即本实施例中的生成模型是目标生成模型,在得到第一年龄的人脸图像和第二年龄后,将第一年龄的人脸图像和对应的第二年龄输入至目标生成模型中,得到第二年龄对应的人脸图像。如第二年龄为60岁,而第一年龄的人脸图像为25岁,则跨年龄后的人脸图像的年龄为60岁,即跨年龄后的人脸图像对应的年龄为第二年龄。可以理解的是,第二年龄对应的人脸图像就是所需要生成的跨年龄人脸图像。

进一步地,步骤j包括:

步骤j1,将所述第一年龄的人脸图像和所述第二年龄输入至所述生成模型中,通过所述生成模型对所述第一年龄的人脸图像和所述第二年龄进行特征提取,得到所述第一年龄的人脸图像对应的第一特征和所述第二年龄对应的第二特征。

步骤j2,连接所述第一特征和所述第二特征得到目标特征,将所述目标特征输入卷积神经网络中得到所述第二年龄对应的人脸图像。

具体地,在得到第一年龄的人脸图像和第二年龄后,将第一年龄的人脸图像和第二年龄输入至生成模型中,通过生成模型对第一年龄的人脸图像和所述第二年龄进行特征提取,得到第一年龄的人脸图像对应的第一特征和第二年龄对应的第二特征。当得到第一特征和第二特征后,连接第一特征和第二特征,并将连接后的第一特征和第二特征记为目标特征,然后将目标特征输入卷积神经网络中,以得到第二年龄对应的人脸图像,可以理解的是,卷积神经网络的输出就是第二年龄对应的人脸图像。

本实施例通过在更新生成模型的模型参数后,根据目标损失值判断生成模型是否处于收敛状态;若生成模型处于收敛状态,则收敛状态对应的生成模型确定为目标生成模型,否则继续训练生成模型,从而进一步地提高了所生成目标生成模型进行跨年龄人脸图像生成的准确率。

此外,本发明还提供一种模型参数的更新装置,参照图3,所述模型参数的更新装置包括:

获取模块10,用于获取待训练数据,其中,所述待训练数据至少包括目标年龄、第一人脸图像、第二人脸图像和第三人脸图像,所述第一人脸图像和所述第二人脸图像属于同一用户的人脸图像,所述第一人脸图像和所述第三人脸图像属于不同用户的人脸图像;

确定模块20,用于基于预设生成式对抗网络的生成模型,根据所述第一人脸图像和所述目标年龄得到第四人脸图像;基于预设人脸特征提取模型和生成式对抗网络的判别模型,根据所述第四人脸图像、所述第二人脸图像和所述第三人脸图像得到目标损失值;

更新模块30,用于根据所述目标损失值更新所述生成模型的第一模型参数。

进一步地,所述确定模块20包括:

确定单元,用于基于预设生成式对抗网络的判别模型,根据所述第三人脸图像和所述第四人脸图像得到第一损失值;

第一输入单元,用于将所述第二人脸图像和所述第四人脸图像输入至预设的人脸特征提取模型中,得到第二损失值;

所述确定单元还用于根据所述第一损失值和所述第二损失值得到目标损失值。

进一步地,所述第一输入单元包括:

输入子单元,用于将所述第二人脸图像和所述第四人脸图像输入至预设的人脸特征提取模型中,得到所述第二人脸图像对应的第一人脸特征和所述第四人脸图像对应的第二人脸特征;

第一计算子单元,用于根据所述第一人脸特征和所述第二人脸特征计算得到第二损失值。

进一步地,所述确定单元包括:

获取子单元,用于获取所述第一损失值对应的第一权重,以及获取所述第二损失值对应的第二权重;

第二计算子单元,用于将所述第一损失值乘以所述第一权重,得到第一乘积,以及将所述第二损失值乘以所述第二权重,得到第二乘积;将所述第一乘积与所述第二乘积相加,得到目标损失值。

进一步地,所述更新模块30还用于根据所述目标损失值更新所述判别模型的第二模型参数。

进一步地,所述确定模块20还用于根据所述目标损失值确定所述生成模型是否处于收敛状态;

所述模型参数的更新装置还包括:

执行模块,用于若确定所述生成模型未处于所述收敛状态,则返回执行所述获取待训练数据的步骤;

所述确定模块20还用于若确定所述生成模型处于收敛状态,则将收敛状态对应的生成模型确定为目标生成模型。

进一步地,所述确定模块20还用于若接收到第一年龄的人脸图像后,确定所述第一年龄的人脸图像对应的第二年龄;

所述模型参数的更新装置还包括:

输入模块,用于将所述第一年龄的人脸图像和对应的第二年龄输入至所述生成模型中,得到所述第二年龄对应的人脸图像,其中,所述生成模型为处于收敛状态的模型。

进一步地,所述输入模块包括:

第二输入单元,用于将所述第一年龄的人脸图像和所述第二年龄输入至所述生成模型中;

特征提取单元,用于通过所述生成模型对所述第一年龄的人脸图像和所述第二年龄进行特征提取,得到所述第一年龄的人脸图像对应的第一特征和所述第二年龄对应的第二特征;

连接单元,用于连接所述第一特征和所述第二特征得到目标特征;

所述第二输入单元还用于将所述目标特征输入卷积神经网络中得到所述第二年龄对应的人脸图像。

进一步地,所述更新模块30包括:

计算单元,用于根据所述目标损失值计算所述生成模型中各第一模型参数对应的第一梯度值;

更新单元,用于根据所述第一梯度值对应更新所述第一梯度值对应的第一模型参数。

本发明模型参数的更新装置具体实施方式与上述模型参数的更新方法各实施例基本相同,在此不再赘述。

此外,本发明还提供一种模型参数的更新设备。如图4所示,图4是本发明实施例方案涉及的硬件运行环境的结构示意图。

需要说明的是,图4即可为模型参数的更新设备的硬件运行环境的结构示意图。本发明实施例模型参数的更新设备可以是pc,便携计算机等终端设备。

如图4所示,该模型参数的更新设备可以包括:处理器1001,例如cpu,存储器1005,用户接口1003,网络接口1004,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图4中示出的模型参数的更新设备结构并不构成对模型参数的更新设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图4所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及模型参数的更新程序。其中,操作系统是管理和控制模型参数的更新设备硬件和软件资源的程序,支持模型参数的更新程序以及其它软件或程序的运行。

在图4所示的模型参数的更新设备中,用户接口1003主要用于连接终端设备,与终端设备进行数据通信,如接收终端设备发送的待训练数据;网络接口1004主要用于后台服务器,与后台服务器进行数据通信;处理器1001可以用于调用存储器1005中存储的模型参数的更新程序,并执行如上所述的模型参数的更新方法的步骤。

本发明模型参数的更新设备具体实施方式与上述模型参数的更新方法各实施例基本相同,在此不再赘述。

此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有模型参数的更新程序,所述模型参数的更新程序被处理器执行时实现如上所述的模型参数的更新方法的步骤。

本发明计算机可读存储介质具体实施方式与上述模型参数的更新方法各实施例基本相同,在此不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1