本技术涉及人工智能,尤其涉及一种基于人工智能的人脸识别方法、装置、电子设备及存储介质。
背景技术:
1、在电子支付、金融风控等需要人脸识别场景中,通常根据采集的人脸图像得到人脸识别结果,但采集到的人脸图像中人脸的姿态和背景环境往往是不同的,同时,一张人脸图像中会同时出现多个人脸,影响人脸识别的精度。
2、目前,针对以上问题,通常利用人脸检测算法得到人脸图像中每一个人脸的区域图像,再对每一个人脸的区域图像进行人脸识别得到人脸识别结果,然而,这种方法并不能消除区域图像中人脸的不同姿态和背景环境对人脸识别精度的影响,不能适用于不同人脸识别的场景,导致人脸识别的鲁棒性和精度较低。
技术实现思路
1、鉴于以上内容,有必要提出一种基于人工智能的人脸识别方法及相关设备,以解决如何提高人脸识别的鲁棒性和精度这一技术问题,其中,相关设备包括基于人工智能的人脸识别装置、电子设备及存储介质。
2、本技术提供基于人工智能的人脸识别方法,所述方法包括:
3、采集相同人脸在不同状态下的人脸图像以获取所述人脸的图像子集,并储存所有图像子集以作为训练图像集;
4、搭建人脸识别网络;
5、基于所述训练图像集训练所述人脸识别网络得到目标人脸识别网络,所述目标识别网络的输入为人脸图像,输出为所述人脸图像的注意力图和显著特征图,所述显著特征图包括相同人脸在不同状态下的共性特征;
6、将待识别人脸图像输入所述目标人脸识别网络以输出待识别注意力图和待识别显著特征图,将基准图像输入所述目标人脸识别网络以输出基准注意力图和基准显著特征图,所述基准图像包括人脸识别标签;
7、基于所述待识别注意力图、所述基准注意力图、所述待识别显著特征图、所述基准显著特征图和所述人脸识别标签获取所述待识别人脸图像人脸识别结果。
8、在一些实施例中,所述采集相同人脸在不同状态下的人脸图像以获取所述人脸的图像子集,并储存所有图像子集以作为训练图像集,包括:
9、采集相同人脸在不同状态下的多张人脸图像,所述不同状态至少包括不同人脸姿态和不同背景环境中的至少一个;
10、储存相同人脸的多张人脸图像作为所述人脸的图像子集;
11、采集不同人脸的图像子集以获取训练图像集。
12、在一些实施例中,所述搭建人脸识别网络包括:
13、所述人脸识别网络的输入为人脸图像,所述人脸识别网络包括特征提取层、自注意力层和融合层;
14、所述特征提取层对输入的人脸图像进行特征提取得到特征图;
15、所述自注意力层将输入的人脸图像分割为预设数量的等大的子图,并对所有子图进行特征提取得到注意力图,所述注意力图与所述特征图的尺寸相同;
16、所述融合层将所述注意力图和所述特征图进行融合以获取输入的人脸图像的显著特征图,所述显著特征图用于反应输入的人脸图像中人脸区域的特征,所述显著特征图满足关系式:
17、r=f⊙a
18、其中,f为所述特征图,a为所述自注意力图,f⊙a表示计算f和a之间的哈达玛积,r为所述显著特征图;
19、将所述注意力图和所述显著特征图作为所述人脸识别网络的输出结果。
20、在一些实施例中,所述基于所述训练图像集训练所述人脸识别网络得到目标人脸识别网络,包括:
21、a1,搭建两个人脸识别网络,在一个人脸识别网络的末端连接一个分类层作为学生网络,在另一个人脸识别网络的末端依次连接一个偏置层和一个分类层作为教师网络,所述偏置层包括偏置矩阵;
22、a2,从所述训练图像集的任意一个图像子集中不放回地随机挑选两张人脸图像以作为训练对,将所述训练对中的两张人脸图像分别记为第一人脸图像和第二人脸图像;
23、a3,将所述第一人脸图像分别输入所述学生网络和所述教师网络以获取第一学生输出和第一教师输出,将所述第二人脸图像分别输入所述学生网络和所述教师网络以获取第二学生输出和第二教师输出;
24、a4,基于所述第一学生输出、所述第一教师输出、所述第二学生输出和所述第二教师输出计算预设损失函数值,并基于所述预设损失函数值和梯度下降法更新所述学生网络中的网络参数;
25、a5,基于所述学生网络中更新后的网络参数更新所述教师网络中除所述偏置层之外的网络参数,所述网络参数的更新过程满足关系式:
26、
27、其中,θt为更新前所述教师网络中除所述偏置层之外的网络参数,为更新后所述教师网络中除所述偏置层之外的网络参数,θs为所述学生网络中更新后的网络参数,λ为参数更新系数,取值范围为[0,1];
28、a6,基于所述第一教师输出和所述第二教师输出更新所述偏置层中的偏置矩阵,所述偏置矩阵的更新过程满足关系式:
29、
30、其中,c为更新前的偏置矩阵,分别为所述第一人脸图像和所述第二人脸图像输入所述教师网络中的人脸识别网络输出的显著特征图,c*为更新后的偏置矩阵,m为偏置更新系数,取值范围为[0,1];
31、a7,重复步骤a2到步骤a6,不断从所述训练图像集中挑选新的训练对,不断更新所述学生网络和所述教师网络中的网络参数,直至所述预设损失函数值不再变化时,停止更新,得到训练完毕的学生网络和教师网络;
32、a8,分别提取训练完毕的学生网络和教师网络中的人脸识别网络,将两个人脸识别网络的网络参数进行融合以获取目标人脸识别网络,所述融合过程满足关系式:
33、
34、其中,为训练完毕的教师网络中人脸识别网络的网络参数,为训练完毕的学生网络中人脸识别网络的网络参数,θfinal为目标人脸识别网络的网络参数,ε为融合系数,取值范围为[0,1]。
35、在一些实施例中,所述偏置层用于将教师网络中人脸识别网络输出的显著特征图加上所述偏置矩阵,得到偏置特征图,所述偏置特征图满足关系式:
36、
37、其中,rt为所述教师网络中人脸识别网络输出的显著特征图,c为所述偏置矩阵,所述偏置矩阵与所述显著特征图的尺寸相同,为所述偏置特征图;在所述教师网络中,所述偏置特征图输入所述分类层以获取所述教师网络的输出结果。
38、在一些实施例中,所述预设损失函数值满足关系式:
39、
40、其中,分别为所述第一教师输出和所述第二教师输出中第i行的数值,分别为所述第一学生输出和所述第二学生输出中第i行的数值,n为所述第一学生输出、所述第一教师输出、所述第二学生输出和所述第二教师输出的行数,loss为所述预设损失函数值。
41、在一些实施例中,所述基准图像的数量至少为一个,每一个基准图像均对应一个基准注意力图和一个基准显著特征图,所述基于所述待识别注意力图、所述基准注意力图、所述待识别显著特征图、所述基准显著特征图和所述人脸识别标签获取所述待识别人脸图像人脸识别结果,包括:
42、计算所述待识别注意力图和所述基准注意力图之间的相似度以作为第一相似度;
43、计算所述待识别显著特征图和所述基准显著特征图之间的相似度以作为第二相似度;
44、对所述第一相似度和所述第二相似度进行加权求和以获取所述待识别人脸图像与每一个基准图像的目标相似度,并获取所有目标相似度的最大相似度;
45、对比所述最大相似度与预设预阈值,若所述最大相似度大于所述预设预阈值,则将所述最大相似度对应的基准图像的人脸识别标签作为所述待识别人脸图像的人脸识别结果;若所述最大相似度不大于所述预设预阈值,则以预设方式发出报警。
46、本技术实施例还提供一种基于人工智能的人脸识别装置,所述装置包括:
47、采集单元,用于采集相同人脸在不同状态下的人脸图像以获取所述人脸的图像子集,并储存所有图像子集以作为训练图像集;
48、搭建单元,用于搭建人脸识别网络;
49、训练单元,用于基于所述训练图像集训练所述人脸识别网络得到目标人脸识别网络,所述目标识别网络的输入为人脸图像,输出为所述人脸图像的注意力图和显著特征图,所述显著特征图包括相同人脸在不同状态下的共性特征;
50、输入单元,用于将待识别人脸图像输入所述目标人脸识别网络以输出待识别注意力图和待识别显著特征图,将基准图像输入所述目标人脸识别网络以输出基准注意力图和基准显著特征图,所述基准图像包括人脸识别标签;
51、人脸识别单元,用于基于所述待识别注意力图、所述基准注意力图、所述待识别显著特征图、所述基准显著特征图和所述人脸识别标签获取所述待识别人脸图像人脸识别结果。
52、本技术实施例还提供一种电子设备,所述电子设备包括:
53、存储器,存储至少一个指令;
54、处理器,执行所述存储器中存储的指令以实现所述的基于人工智能的人脸识别方法。
55、本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述的基于人工智能的人脸识别方法。
56、综上,本技术通过目标人脸识别网络中的自注意力层和特征提取层能够从人脸图像中提取到相同人脸在不同状态下的共性特征,避免人脸姿态和背景环境等状态因素对人脸识别结果的影响,提高人脸识别的鲁棒性和准确性。