本发明涉及人脸识别,具体涉及人脸识别模型训练方法、人脸识别方法及装置。
背景技术:
1、人脸识别技术是一种通过分析和识别人脸特征来识别以及验证个体身份的技术,在支付授权、视频监控及门禁系统等多种场景中得到了广泛的应用,为人们的生活提供了便利。其中,基于深度学习的人脸识别模型能够实现较高的人脸识别精度。但是,基于深度学习的人脸识别模型可以被攻击,使人脸识别模型产生错误的识别结果。对抗攻击属于一种新型的用于攻击人脸识别模型的方法,通过在真实样本上增加难以察觉的对抗扰动而生成的对抗样本,使人脸识别模型输出错误的结果。因此,有效提高人脸识别模型防御对抗样本攻击的能力,成为了本领域技术人员研究的重点。
技术实现思路
1、有鉴于此,本发明能够提供一种人脸识别模型训练方法、人脸识别方法及装置,以解决对抗样本容易使人脸识别模型产生错误的识别结果的问题,提高人脸识别模型防御对抗样本攻击的能力。
2、第一方面,本发明提供了一种人脸识别模型训练方法,该方法包括:
3、利用多个批次的源样本对人脸识别模型进行训练,并通过任一批次的源样本迭代训练人脸识别模型之后确定人脸识别模型的性能值;
4、判断人脸识别模型的性能值是否大于预设性能阈值;
5、如果性能值大于预设性能阈值,在人脸识别模型的损失函数上增加正则项,以及使用多个批次的对抗样本对人脸识别模型进行训练;正则项基于源样本、对抗样本以及目标样本确定,对抗样本表示在源样本基础上添加过对抗扰动的样本,目标样本表示在源样本基础上构建的具有指定目标类别的样本。
6、本发明在训练过程中自动监测模型的性能值,当性能值满足预设性能阈值时在损失函数上增加正则项和利用对抗样本训练模型,确保模型在取得高精度的同时还具备对抗鲁棒性,可见本发明实现了通过动态学习策略训练人脸识别模型,基于本发明得到的人脸识别模型具有更好的鲁棒性,能够抵御对抗样本攻击,从而能够应用到对安全性要求很高的场景中。
7、在一种可选的实施方式中,该方法还包括:
8、如果性能值小于或者等于预设性能阈值,在人脸识别模型的损失函数上禁止正则项,并继续利用源样本对人脸识别模型进行训练。
9、本发明能够在当前性能值不满足预设性能阈值时,自动禁止正则项,从而确保人脸识别模型在源样本上的性能。
10、在一种可选的实施方式中,判断人脸识别模型的性能值是否大于预设性能阈值,包括:
11、判断当前批次的源样本的总体损失值是否小于预设精度阈值;其中,当前批次的源样本为多个批次的源样本中当前用于训练人脸识别模型的一个批次的源样本;
12、如果总体损失值小于预设精度阈值,确定人脸识别模型的性能值大于预设性能阈值;
13、如果总体损失值大于或者等于预设精度阈值,确定人脸识别模型的性能值不大于预设性能阈值。
14、本发明还能够通过当前批次的源样本的总体损失值与预设精度阈值的比较结果,准确地判断出人脸识别模型的性能值是否大于预设性能阈值。
15、在一种可选的实施方式中,多个批次的源样本均为良性样本;其中,良性样本表示未添加过对抗扰动的真实样本。
16、本发明能够自动监测模型在良性样本集合上面的性能,确保训练算法聚焦于提升人脸识别模型在良性样本集合上面的性能。
17、在一种可选的实施方式中,多个批次的源样本中的任一个批次的源样本包括从源集合中抽样得到的样本和从目标集合中抽样得到的样本,源集合和目标集合组成训练集。
18、本发明中的每个批次的源样本从源集合和目标集合中获取,该方式提高了每个批次的源样本多样性,有助于进一步提升训练完成的人脸识别模型的识别性能。
19、在一种可选的实施方式中,从源集合中抽样得到的样本的数量,与从目标集合中抽样得到的样本的数量相同。
20、本发明分别从源集合和目标集合中获取的样本数量相同,通过该方式得到的不同批次的源样本之间存在的差异更大,更有助于人脸识别模型的训练。
21、在一种可选的实施方式中,训练集中的源样本包括第一数量的人脸图像和第二数量的类别标签,第一数量至少是第二数量的多倍。
22、基于人脸图像的数量是类别标签的数量的多倍,本发明使用的训练集具备更高的深度,从而进一步提高训练完成的人脸识别模型的识别精度。
23、在一种可选的实施方式中,损失函数包括示性函数与正则项的乘积与第一结果的第一总和,第一结果为当前批次的源样本的总体损失值的第一预设比例;在人脸识别模型的损失函数上增加正则项,包括:控制示性函数的返回值为1。
24、基于示性函数的返回值为1,本发明能够实现在损失函数中使用正则项的功能。
25、在一种可选的实施方式中,在人脸识别模型的损失函数上禁止正则项,包括:控制示性函数的返回值为0。
26、基于示性函数的返回值为0,本发明能够实现在损失函数中不使用正则项的功能。
27、在一种可选的实施方式中,损失函数为第一总和与目标批次的对抗样本的总体损失值的第二预设比例的第二总和,目标批次的对抗样本为基于当前批次的源样本形成的对抗样本。
28、基于示性函数的返回值为1或0,本发明能够实现在损失函数中是否使用对抗样本的总体损失值的功能。
29、在一种可选的实施方式中,第一预设比例与第二预设比例的和为1。
30、本发明设定第一预设比例与第二预设比例的和为1,是一种优选的方式,有助于更好地训练人脸识别模型。
31、在一种可选的实施方式中,当前批次的源样本的总体损失值通过基于角度的第一损失函数确定;目标批次的对抗样本的总体损失值通过基于角度的第二损失函数确定。
32、基于角度的损失函数的使用,本发明能够适用于更多种类的用于构建人脸识别模型的卷积神经网络,使本发明具有更广泛的应用范围。
33、在一种可选的实施方式中,损失函数通过如下方式表示:
34、
35、
36、其中,表示在一个批次上所有样本的总体损失值,表示在一个批次上良性样本的总体损失值,表示在一个批次上对抗样本的总体损失值,表示正则项,表示示性函数,表示预设精度阈值,用于控制示性函数的输出值,表示超参数。
37、在一种可选的实施方式中,正则项用于约束相对应的对抗样本与源样本之间的第一特征距离小于对抗样本与目标样本之间的第二特征距离。
38、本发明能够当性能值满足预设性能阈值时增加正则项到原始损失函数,使得模型识别的对抗样本逐渐靠近对应的原始样本(对应的源样本)的同时远离其他类别的样本,提高模型的对抗鲁棒性。
39、在一种可选的实施方式中,对抗样本与源样本之间的第一特征距离为余弦距离;对抗样本与目标样本之间的第二特征距离也为余弦距离。
40、本发明基于余弦距离计算特征距离的方式使正则项与原始目标函数在相同的向量空间(度量空间)进行优化,有利于正则项和原始目标函数相互协作,使本发明能够适用于更多的人脸识别模型。
41、在一种可选的实施方式中,正则项用于计算第一特征距离、第二特征距离的差值与预设阈值的第三总和,以及用于在第三总和与预设值之间选择最大值。
42、基于上述的正则项,本发明能够进一步提高模型抵御对抗样本攻击的能力。
43、第二方面,本发明提供了一种人脸识别方法,该方法包括:
44、获取待识别的人脸图像;
45、将待识别的人脸图像输入至基于上述第一方面或其对应的任一实施方式的训练方法得到的人脸识别模型,利用人脸识别模型输出识别结果。
46、在一种可选的实施方式中,识别结果为第一人脸特征向量;人脸识别方法还包括:
47、将第一人脸特征向量与待查询人脸库中的多个第二人脸特征向量进行比对,以得到多个相似度;相似度表示第一人脸特征向量与第二人脸特征向量的相似度;
48、将多个相似度中的最大值对应的第二人脸特征向量作为目标人脸特征向量,并确定与目标人脸特征向量对应的类别标签。
49、本发明提供的人脸识别方法能够更好地抵御对抗样本攻击,提高识别对抗样本的能力,准确地识别出与人脸图像相匹配的类别标签。
50、在一种可选的实施方式中,将第一人脸特征向量与待查询人脸库中的多个第二人脸特征向量进行比对,包括:计算第一人脸特征向量与多个第二人脸特征向量的余弦相似度。
51、基于余弦相似度的计算方式,本发明能够更准确地计算第一人脸特征向量与第二人脸特征向量的相似度。
52、在一种可选的实施方式中,识别结果为与待识别的人脸图像相对应的类别标签。
53、在一种可选的实施方式中,获取待识别的人脸图像,包括:获取多张人脸图像;
54、将待识别的人脸图像输入人脸识别模型,利用人脸识别模型输出识别结果,包括:将多张人脸图像输入人脸识别模型,得到多张人脸图像的人脸特征向量的均值,第一人脸特征向量为多张人脸图像的人脸特征向量的均值。
55、基于上述的方式,本发明还能够实现基于多张人脸图像的人脸识别功能,以更准确地识别人脸。
56、第三方面,本发明提供了一种人脸识别模型训练装置,该装置包括:
57、第一训练模块,用于利用多个批次的源样本对人脸识别模型进行训练,并用于通过任一批次的源样本迭代训练人脸识别模型之后确定人脸识别模型的性能值;
58、性能判断模块,用于判断人脸识别模型的性能值是否大于预设性能阈值;
59、第二训练模块,用于根据性能值大于预设性能阈值,在人脸识别模型的损失函数上增加正则项,以及使用多个批次的对抗样本对人脸识别模型进行训练;正则项基于源样本、对抗样本以及目标样本确定,对抗样本表示在源样本基础上添加过对抗扰动的样本,目标样本表示在源样本基础上构建的具有指定目标类别的样本。
60、第四方面,本发明提供了一种人脸识别装置,该装置包括:
61、图像获取模块,用于获取待识别的人脸图像;
62、人脸识别模块,用于将待识别的人脸图像输入至基于上述第一方面或其对应的任一实施方式的训练方法得到的人脸识别模型,利用人脸识别模型输出识别结果。
63、第五方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的人脸识别模型训练方法或者上述第二方面或其对应的任一实施方式的人脸识别方法。
64、第六方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的人脸识别模型训练方法或者上述第二方面或其对应的任一实施方式的人脸识别方法。