1.本发明涉及模式识别技术领域,具体涉及一种提高活体检测算法泛化能力的方法和系统。
背景技术:2.随着人脸识别相关技术的日渐成熟,人脸识别也走进了我们生活的方方面面,如门禁打卡、考勤通行、入住酒店等。我们在享受技术带来方便的同时,也要应对其潜在的风险,一旦虚假人脸攻击成功,极有可能对用户带来重大损失,所以活体检测算法的性能尤为重要。
3.当前的活体算法根据设备的不同,主要分为基于二维平面rgb相机的活体检测算法,基于红外ir相机的活体检测算法,基于三维深度相机的活体检测算法。目前虚假人脸主要是照片类、视频类和面具类。攻击方式和场景的多样性,会导致攻击人脸在设备上成像和真人成像差距很小,甚至肉眼难以区分,而活体算法为了提高性能,会学习到一些很细微的可区分特征。当设备isp芯片和摄像头模组等设备硬件更换,会导致整体图像成像效果和成像质量发生改变,当变化较大时,算法在原有的真人数据和攻击数据上学到的细微的可区分特征,在新设备上并不适用,即算法的泛化能力较差。这个时候,往往需要在新设备采集大量的真人和攻击训练数据来优化算法,如果新设备比较多,会需要一直重复采集训练数据来优化,耗时耗力。
技术实现要素:4.有鉴于此,本公开实施例提供一种提高活体检测算法泛化能力的方法和系统,至少部分解决现有技术中存在的问题。
5.第一方面,本公开实施例提供了一种提高活体检测算法泛化能力的方法,包括如下步骤:
6.基于第一训练数据集训练第一特征提取算法,用来学习不同硬件设备成像的固有特征;
7.在第一数据集中,随机选取若干张由每种硬件设备采集的第一样本图片,输入第一特征提取算法计算特征向量,得到该硬件设备的中心特征向量,即第一中心特征向量,将所有硬件设备的第一中心特征向量组成第一特征向量组;
8.基于新硬件设备采集真人和攻击体的小批量第二样本图片;
9.将第二样本图片输入第一特征提取算法计算特征向量,得到第二特征向量组;
10.在第一特征向量组中随机选取一个随机特征向量,将随机特征向量与第二特征向量组进行拟合,得到二者之间的拟合关系;
11.根据第二特征向量组计算新硬件设备的中心特征向量,即第二中心特征向量,加入到第一特征向量组;
12.随机抽取一部分随机特征向量对应的图片进行拟合关系变换,将变换后的图片加
入训练集,训练优化原活体算法得到新的活体算法。
13.进一步地,所述第一中心特征向量由特征向量求平均得到。
14.进一步地,所述第一特征提取算法输入不同硬件设备采集的图像,特征提取标签为硬件设备编号,输出为一维特征向量。
15.可选地,特征向量长度可以为512。
16.可选地,所述第一样本图片可以为1000-5000张图片。
17.进一步地,所述第二样本图片包括不同环境下的多个真人和不同环境下不同攻击方式的多个攻击体图片。
18.进一步地,所述拟合关系可以为二次多项式。
19.可选地,所述拟合关系表达式为:
[0020][0021]
其中,b={b1,b2,
…
,bn},a={a1,a2,
…
,an},b为第二特征向量组,a为特征向量,r1、r2、r3为拟合参数。
[0022]
第二方面,本公开实施例提供了一种提高活体检测算法泛化能力的系统,包括:
[0023]
第一样本图片采集模块、第一特征提取模块、第一特征向量组获取模块、第二样本图片采集模块、第二特征向量组获取模块、拟合模块、训练优化模块,其中:
[0024]
第一样本图片采集模块用于基于不同硬件设备采集第一样本图片;
[0025]
第一特征提取模块,其用于基于第一训练数据集训练第一特征提取算法,用来学习不同硬件设备成像的固有特征;
[0026]
第一特征向量组获取模块用于在第一数据集中,随机选取若干张由每种硬件设备采集的第一样本图片,输入第一特征提取算法计算特征向量,将得到的特征向量求平均,得到该硬件设备的中心特征向量,即第一中心特征向量,将所有硬件设备的第一中心特征向量组成第一特征向量组;
[0027]
第二样本图片采集模块用于基于新硬件设备采集真人和攻击体的小批量图片;
[0028]
第二特征向量组获取模块用于将第二样本图片输入第一特征提取算法计算特征向量,得到第二特征向量组;根据第二特征向量组计算新硬件设备的中心特征向量,即第二中心特征向量,加入到第一特征向量组;
[0029]
拟合模块用于在第一特征向量组中随机选取一个随机特征向量,将随机特征向量与第二特征向量组进行拟合,得到二者之间的拟合关系;
[0030]
训练优化模块用于随机抽取一部分随机特征向量对应的图片进行拟合关系变换,将变换后的图片加入训练集,训练优化原活体算法得到新的活体算法。
[0031]
第三方面,本公开实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述第一方面或第一方面的任一实现方式中的提高活体检测算法泛化能力的方法。
附图说明
[0032]
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0033]
图1为本公开实施例提供的一种提高活体检测算法泛化能力的方法的流程示意图;
[0034]
图2为本公开实施例提供的一种提高活体检测算法泛化能力的系统的示意图。
具体实施方式
[0035]
下面结合附图对本公开实施例进行详细描述。
[0036]
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0037]
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
[0038]
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
[0039]
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
[0040]
图1示出了根据本发明的提高活体检测算法泛化能力的方法100的示意图。
[0041]
如图1所示,在步骤s102处,基于第一训练数据集训练第一特征提取算法,用来学习不同硬件设备成像的固有特征。
[0042]
具体而言可以包括所述第一特征提取算法输入不同硬件设备采集的图像,特征提取标签为硬件设备编号,输出为一维特征向量。
[0043]
接下来,转到步骤s104处,在第一数据集中,随机选取若干张由每种硬件设备采集的样本图片,即第一样本图片,输入第一特征提取算法计算特征向量,将得到的特征向量求平均,得到该硬件设备的中心特征向量,即第一中心特征向量,将所有硬件设备的第一中心特征向量组成第一特征向量组。
[0044]
具体而言,例如,在根据本公开的实施例的一些方面,所述第一样本图片可以为1000-5000张图片。
[0045]
接下来转到步骤s106,在步骤s106处,基于新硬件设备采集真人和攻击体的小批量图片,即第二样本图片;
[0046]
进一步地,所述第二样本图片包括不同环境下的多个真人和不同环境下不同攻击方式的多个攻击体图片;
[0047]
所述第二样本图片样本数量为1000-5000。
[0048]
接下来转到步骤s108,在步骤s108处,将第二样本图片输入第一特征提取算法计算特征向量,得到第二特征向量组。
[0049]
接下来转到步骤s110,在步骤s110处,在第一特征向量组中随机选取一个随机特征向量a,将随机特征向量a与第二特征向量组进行拟合,得到二者之间的拟合关系f。
[0050]
具体而言,例如,在根据本公开的实施例的一些方面,所述拟合关系f可以为二次多项式;表达式为:
[0051][0052]
其中,b={b1,b2,
…
,bn},a={a1,a2,
…
,an},b为第二特征向量组,a为随机特征向量,r1、r2、r3为拟合参数。
[0053]
接下来转到步骤s112,在步骤s112处,根据第二特征向量组计算新硬件设备的中心特征向量,即第二中心特征向量,加入到第一特征向量组。
[0054]
接下来转到步骤s114,在步骤s114处,随机抽取一部分特征向量a对应的图片进行拟合关系f变换,将变换后的图片加入训练集,训练优化原活体算法得到新的活体算法。
[0055]
如上参照步骤s102-s114,本实施例通过构建训练算法f,找到新硬件设备上采集的图像和原硬件设备上采集的图像之间的映射关系,对原数据集中的部分数据进行数据变换,相当于对原数据集做数据增广,这样训练得到的活体算法在新设备上也能表现优异,从而避免了大量采集新设备图像来优化算法模型。
[0056]
图2示出了根据本发明的提高活体检测算法泛化能力的系统300。
[0057]
如图2所示,装置300包括第一样本图片采集模块302、第一特征提取模块304、第一特征向量组获取模块306、第二样本图片采集模块308、第二特征向量组获取模块310、拟合模块312、训练优化模块314。
[0058]
第一样本图片采集模块302用于基于不同硬件设备采集第一样本图片;
[0059]
第一特征提取模块304,其用于基于第一训练数据集训练第一特征提取算法,用来学习不同硬件设备成像的固有特征;
[0060]
其中,所述第一特征提取算法输入不同硬件设备采集的图像,特征提取标签为硬件设备编号,输出为一维特征向量。
[0061]
可选地,特征向量长度可以为512。
[0062]
第一特征向量组获取模块306用于在第一数据集中,随机选取若干张由每种硬件设备采集的第一样本图片,输入第一特征提取算法计算特征向量,将得到的特征向量求平均,得到该硬件设备的中心特征向量,即第一中心特征向量,将所有硬件设备的第一中心特征向量组成第一特征向量组。
[0063]
第二样本图片采集模块308用于基于新硬件设备采集真人和攻击体的小批量图片;
[0064]
进一步地,所述第二样本图片包括不同环境下的多个真人和不同环境下不同攻击方式的多个攻击体图片;
[0065]
第二特征向量组获取模块310用于将第二样本图片输入第一特征提取算法计算特
征向量,得到第二特征向量组;根据第二特征向量组计算新硬件设备的中心特征向量,即第二中心特征向量,加入到第一特征向量组。
[0066]
拟合模块312用于在第一特征向量组中随机选取一个随机特征向量a,将特征向量a与第二特征向量组进行拟合,得到二者之间的拟合关系f。
[0067]
可选地,所述拟合关系f可以为二次多项式;表达式为:
[0068][0069]
其中,b={b1,b2,
…
,bn},a={a1,a2,
…
,an},b为第二特征向量组,a为随机特征向量,r1、r2、r3为拟合参数。
[0070]
训练优化模块314用于随机抽取一部分特征向量a对应的图片进行拟合关系f变换,将变换后的图片加入训练集,训练优化原活体算法得到新的活体算法。
[0071]
在根据本发明的另一方面中,还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令当由一个或多个处理器执行时,使所述一个或多个处理器执行前述的提高活体检测算法泛化能力的方法。
[0072]
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。