活体检测的方法、系统、电子装置和存储介质与流程

文档序号:30056563发布日期:2022-05-17 18:36阅读:103来源:国知局
活体检测的方法、系统、电子装置和存储介质与流程

1.本技术涉及计算机技术领域,特别是涉及活体检测的方法、系统、电子装置和存储介质。


背景技术:

2.近年来,随着人脸识别技术的发展,“刷脸”可以应用的场景越来越多,例如刷脸支付、刷脸打卡签到、刷脸解锁电子设备、刷脸解锁门禁等,具有操作方便、快捷等特点。作为人脸识别技术中至关重要的一项技术,活体检测在辨别图像真伪、抵抗欺骗攻击,保护整个人脸识别系统的安全性方面起着重要作用。普通的活体检测模型通常使用真伪样本进行训练,但得到的模型鲁棒性低,存在对易错样本的误判,在相关技术中,会通过对一个样本进行数据增强生成一批样本,如果模型对这批样本预测效果不好,则说明该样本为易错样本,将获得的易错样本对模型进行训练来提高模型的鲁棒性,但是利用数据增强来挑选易错样本所需时间成本高。
3.目前针对相关技术中普通的活体检测模型鲁棒性低,以及通过对样本做数据增强来挑选易错样本对模型进行训练,时间成本高的问题,尚未提出有效的解决方案。


技术实现要素:

4.本技术实施例提供了一种活体检测的方法、系统、电子装置和存储介质,以至少解决相关技术中普通的活体检测模型鲁棒性低,以及通过对样本做数据增强来挑选易错样本对模型进行训练,时间成本高的问题。
5.第一方面,本技术实施例提供了一种活体检测的方法,所述方法包括:s101,获取活体检测模型对样本集的预测结果以及特征向量,所述特征向量包括预测类特征值和非预测类特征值;s102,根据所述样本集的预测结果将样本集划分为分类正确的样本和分类错误的样本,获取所有所述分类正确的样本预测类特征值的均值,记为第一均值,获取所有所述分类错误的样本预测类特征值的均值,记为第二均值;s103,在所述第一均值和所述第二均值的差大于预测类特征差阈值的情况下,若样本的预测类特征值小于所述第二均值,则所述样本为第一易错样本,获取所有所述第一易错样本;s104,根据所有所述第一易错样本对所述活体检测模型进行训练,获得更新后的活体检测模型;s105,根据所述更新后的活体检测模型对人脸进行检测,获得活体检测结果。
6.在其中一些实施例中,根据所述样本集的预测结果将样本划分为分类正确的样本和分类错误的样本之后,所述方法还包括:判断所述分类错误的样本数量是否大于预设阈值;若判断结果为是,则执行步骤s102至步骤s105,若判断结果为否,则通过所述样本
集对所述活体检测模型进行训练,获得更新后的活体检测模型。
7.在其中一些实施例中,根据所有所述第一易错样本对所述活体检测模型进行训练之后,所述方法还包括:统计对所述活体检测模型的训练次数,判断所述训练次数是否达到预设次数;若判断结果为否,则循环执行步骤s101至s105,直至所述训练次数达到所述预设次数,结束训练,获得更新后的活体检测模型;若判断结果为是,则结束训练,获得更新后的活体检测模型。
8.在其中一些实施例中,获取所有所述第一易错样本之后,所述方法还包括:获取所有所述分类正确的样本预测类特征值与非预测类特征值的差的均值,记为第三均值,获取所有所述分类错误的样本预测类特征值与非预测类特征值的差的均值,记为第四均值;在所述第三均值和所述第四均值的差大于特征差阈值的情况下,若样本预测类特征值和非预测类特征值的差小于所述第四均值,则所述样本为第二易错样本,获取所有所述第二易错样本;根据所有所述第一易错样本和所有所述第二易错样本对所述活体检测模型进行训练,获得更新后的活体检测模型。
9.在其中一些实施例中,获取所有所述第一易错样本和所有所述第二易错样本之后,所述方法还包括:使所述易错样本的预测类特征值和非预测类特征值相等,获得所述易错样本修正后的特征向量,其中,所述易错样本包括所述第一易错样本和所述第二易错样本;根据普通样本的特征向量和所述易错样本修正后的特征向量对所述活体检测模型进行训练,获得更新后的活体检测模型。
10.在其中一些实施例中,使所述易错样本的预测类特征值和非预测类特征值相等包括:使所述易错样本的预测类特征值等于非预测类特征值。
11.在其中一些实施例中,所述获取活体检测模型对样本集的预测结果以及特征向量之前,所述方法包括:根据样本集对模型进行训练,直至获取训练好的活体检测模型,其中,所述样本集包括活体样本和假体样本。
12.第二方面,本技术实施例提供了一种活体检测的系统,所述系统包括获取模块、划分模块、比较模块、训练模块和检测模块,所述获取模块,用于获取活体检测模型对样本集的预测结果以及特征向量,所述特征向量包括预测类特征值和非预测类特征值;所述划分模块,用于根据所述样本集的预测结果将样本集划分为分类正确的样本和分类错误的样本,获取所有所述分类正确的样本预测类特征值的均值,记为第一均值,获取所有所述分类错误的样本预测类特征值的均值,记为第二均值;所述比较模块,用于在所述第一均值和所述第二均值的差大于预测类特征差阈值的情况下,若样本的预测类特征值小于所述第二均值,则所述样本为第一易错样本,获取所有所述第一易错样本;所述训练模块,用于根据所有所述第一易错样本对所述活体检测模型进行训练,
获得更新后的活体检测模型;所述检测模块,用于根据所述更新后的活体检测模型对人脸进行检测,获得活体检测结果。
13.第三方面,本技术实施例提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的活体检测的方法。
14.第四方面,本技术实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的活体检测的方法。
15.相比于相关技术,本技术实施例提供的活体检测的方法,通过获取活体检测模型对样本集的预测结果以及特征向量,特征向量包括预测类特征值和非预测类特征值,根据样本集的预测结果将样本集划分为分类正确的样本和分类错误的样本,获取所有分类正确的样本预测类特征值的均值,记为第一均值,获取所有分类错误的样本预测类特征值的均值,记为第二均值,在第一均值和第二均值的差大于预测类特征差阈值的情况下,若样本的预测类特征值小于第二均值,则该样本为第一易错样本,根据所有第一易错样本对活体检测模型进行训练,获得更新后的活体检测模型,根据更新后的活体检测模型对人脸进行检测,获得活体检测结果,解决了相关技术中普通的活体检测模型鲁棒性低,以及通过对样本做数据增强来挑选易错样本对模型进行训练,时间成本高的问题。
附图说明
16.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:图1是根据本技术实施例的活体检测的方法的流程图;图2是根据本技术实施例的另一种活体检测的方法的流程图;图3是根据本技术实施例的第三种活体检测的方法的流程图;图4是根据本技术实施例的活体检测的系统的结构框图。
具体实施方式
17.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。基于本技术提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本技术公开的内容相关的本领域的普通技术人员而言,在本技术揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本技术公开的内容不充分。
18.在本技术中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本技术所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
19.除非另作定义,本技术所涉及的技术术语或者科学术语应当为本技术所属技术领域内具有一般技能的人士所理解的通常意义。本技术所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本技术所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本技术所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本技术所涉及的“多个”是指大于或者等于两个。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。本技术所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
20.本实施例提供了一种活体检测的方法,图1是根据本技术实施例的活体检测的方法的流程图,如图1所示,该方法包括如下步骤:步骤s101,获取活体检测模型对样本集的预测结果以及特征向量,特征向量包括预测类特征值v1和非预测类特征值v2;本实施例中,由于活体检测模型用于判断人脸为活体还是假体,为二分类模型,因此活体检测模型输出二维的特征向量,二维的特征向量中较大的特征值为预测类特征值v1,另一个特征值为非预测类特征值v2。
21.可选的,预先根据样本集对模型进行训练,直至获取训练好的活体检测模型,其中,样本集包括活体样本和假体样本。具体的,记样本为x,样本标签为y,则模型为,设定热身周期,在热身周期内,将样本集传入模型,前向传播计算损失,反向传播更新模型参数,直至热身周期结束,获得训练好的活体检测模型。
22.步骤s102,根据样本集的预测结果将样本集划分为分类正确的样本和分类错误的样本,获取所有分类正确的样本预测类特征值的均值,记为第一均值,获取所有分类错误的样本预测类特征值的均值,记为第二均值;本实施例中,可以将样本的预测结果与样本标签进行比较,判断样本是否分类正确。
23.步骤s103,在第一均值和第二均值的差大于预测类特征差阈值的情况下,若样本的预测类特征值小于第二均值,则该样本为第一易错样本,获取所有第一易错样本;在实际应用中,普通样本为容易被分类正确的样本,因此预测类特征值v1较大,施加微小的扰动也不会分类错误,而易错样本相反,预测类特征值v1和非预测类特征值v2的值相差较近,因此,施加微小的扰动后会使预测结果发生变化。例如,假设两个样本,的特征向量分别是(50,-7),(1,-7),预测类置信度e由下述公式1求出:
ꢀꢀꢀ
公式1因此样本,的预测类置信度均为99%,且由于1和-7的值相差较近,施加微小的扰动后会使预测结果发生变化,因此样本为高置信度易错样本。
24.当样本量足够时,根据中心极限定理,易错样本和普通样本的分布近似服从正态
分布,因此,当易错样本与普通样本之间的分布存在差异时,利用易错样本的分布特性即可判定哪些样本可以被认为是易错样本,即时,说明易错样本和普通样本之间存在差异,利用能够挑选出易错样本,即当样本的预测类特征值v1小于所有分类错误的样本预测类特征值的均值,说明该样本为易错样本,该易错样本可能是高置信度的易错样本,也可能是低置信度的易错样本。
25.步骤s104,根据所有第一易错样本对活体检测模型进行训练,获得更新后的活体检测模型;步骤s105,根据更新后的活体检测模型对人脸进行检测,获得活体检测结果。
26.通过步骤s101至步骤s105,相对于相关技术中普通的活体检测模型鲁棒性低,以及通过对样本做数据增强来挑选易错样本对模型进行训练,时间成本高的问题,本实施例通过获取活体检测模型对样本集的预测结果以及特征向量,特征向量包括预测类特征值和非预测类特征值,根据样本集的预测结果将样本集划分为分类正确的样本和分类错误的样本,获取所有分类正确的样本预测类特征值的均值,记为第一均值,获取所有分类错误的样本预测类特征值的均值,记为第二均值,在第一均值和第二均值的差大于预测类特征差阈值的情况下,若样本的预测类特征值小于第二均值,则该样本为第一易错样本,根据所有第一易错样本对活体检测模型进行训练,获得更新后的活体检测模型,根据更新后的活体检测模型对人脸进行检测,获得活体检测结果,解决了相关技术中普通的活体检测模型鲁棒性低,以及通过对样本做数据增强来挑选易错样本对模型进行训练,时间成本高的问题。
27.如果某一批样本集中,分类错误的样本较少,计算出的错误样本预测类特征值的均值并不能代表易错样本预测类特征值的集中趋势,因此难以确定易错样本和普通样本的分布差异,会导致挑选的易错样本不准确,因此,在其中一些实施例中,根据样本集的预测结果将样本划分为分类正确的样本和分类错误的样本之后,判断分类错误的样本数量是否大于预设阈值,若判断结果为是,则执行上述步骤s102至步骤s105,若判断结果为否,则通过样本集对活体检测模型进行训练,获得更新后的活体检测模型。
28.具体的,在一次训练中,若某批样本集中分类错误的样本较少,则无需执行挑选易错样本的操作,而是直接通过该样本集对活体检测模型进行训练,若下一次训练中,下一批样本集分类错误的样本数量大于预设阈值,则执行上述步骤s102至步骤s105,即挑选出易错样本后,通过易错样本对活体检测模型进行训练,降低了活体检测模型对易错样本的误判率。
29.在其中一些实施例中,根据所有第一易错样本对活体检测模型进行训练之后,统计对活体检测模型的训练次数,判断训练次数是否达到预设次数;若判断结果为否,则循环执行上述步骤s101至s105,直至训练次数达到预设次数,结束训练,获得更新后的活体检测模型;若判断结果为是,则结束训练,获得更新后的活体检测模型。
30.本实施例中,要通过多次训练才能使模型更加准确,因此,在训练次数没有达到预测次数时,循环执行上述步骤s101至s105,通过活体检测模型输出新一批样本集的预测结果和特征向量,并最终挑选出易错样本,根据易错样本再次对活体检测模型进行训练,直至训练次数达到预设次数。
31.在其中一些实施例中,图2是根据本技术实施例的另一种活体检测的方法的流程图,如图2所示,获取所有第一易错样本之后,该方法还包括如下步骤:步骤s201,获取所有分类正确的样本预测类特征值v1与非预测类特征值v2的差的均值,记为第三均值,获取所有分类错误的样本预测类特征值v1与非预测类特征值v2的差的均值,记为第四均值;步骤s202,在第三均值和第四均值的差大于特征差阈值的情况下,若样本预测类特征值和非预测类特征值的差小于第四均值,则该样本为第二易错样本,获取所有第二易错样本;由于能够衡量预测类和非预测类的相似程度,当某个样本的较小时,说明该样本预测类的置信度较低,因此这样的样本属于低置信度易错样本,即挑选出的第二易错样本为低置信度的易错样本,在时,说明易错样本与普通样本之间的分布存在差异,利用能够挑选出低置信度的易错样本。
32.步骤s203,根据所有第一易错样本和所有第二易错样本对活体检测模型进行训练,获得更新后的活体检测模型。
33.通过图1所示的实施例,可以挑选出高置信度或低置信度的易错样本,还可以通过本实施例挑选出没有被挑选出的低置信度的易错样本,使获得的易错样本的数量更多,效率更高。
34.在其中一些实施例中,获取所有第一易错样本和所有第二易错样本之后,使易错样本的预测类特征值和非预测类特征值相等,获得易错样本修正后的特征向量,其中,易错样本包括第一易错样本和第二易错样本,根据普通样本的特征向量和易错样本修正后的特征向量对活体检测模型进行训练,获得更新后的活体检测模型。
35.本实施例中,强制易错样本的预测类特征值与非预测类特征值相等,从决策边界的角度来看,这种做法使得易错样本落在决策边界上,也就是使易错样本成为绝对难样本;且由于模型更新相当于调整决策边界,而决策边界的调整需要保证更多的样本分类正确,因此这种做法使得决策边界调整时更多地考虑到易错样本,从损失的角度来说,对特征向量进行修正来增加易错样本的损失,增大了易错样本对梯度的贡献,避免使用大量的样本进行训练并且增强了活体检测模型的鲁棒性。
36.可选的,若易错样本的特征向量为,可以使,将易错样本的特征向量修正为,也可以使,使得易错样本的特征向量修正为,均会使易错样本落在决策边界上,但由于,因此使更能拉开易错样本和普通样本的差距,使活体检测模型的学习效果更好。
37.活体检测模型最优化问题可以通过下述公式2来描述:
ꢀꢀꢀ
公式2其中,表示模型参数,表示损失函数,表示样本,表示易错样本,表示特征向量,表示样本标签,表示修正后的特征向量,和表示预测结果,
表示为求损失最小的。
38.在其中一些实施例中,图3是根据本技术实施例的第三种活体检测的方法的流程图,如图3所示,该方法包括如下步骤:步骤s301,开始,将样本集输入到活体检测模型;步骤s302,活体检测模型输出样本的预测结果和特征向量v;步骤s303,统计分类错误样本的个数,并判断是否大于预设阈值m,若是,则执行步骤s304和步骤s305,若否,则执行步骤s309;步骤s304,判断是否大于,若是,则执行步骤s306,若否,则执行步骤s309;步骤s305,判断是否大于,若是,则执行步骤s307,若否,则执行步骤s309;步骤s306,判断v1是否小于,若是,则执行步骤s308,若否,则执行步骤s309;步骤s307,判断是否小于若是,则执行步骤s308,若否,则执行步骤s309;步骤s308,将易错样本的特征向量修正为;步骤s309,特征向量通过softmax层后计算损失,反向传播更新模型;步骤s310,判断是否达到训练周期数,即预设次数,若是,则执行步骤s311,若否,则执行步骤s302,活体检测模型输出新一批样本的预测结果和特征向量v;步骤s311,结束。
39.通过步骤s301至步骤s311,解决了相关技术中普通的活体检测模型鲁棒性低,以及通过对样本做数据增强来挑选易错样本对模型进行训练,时间成本高的问题,提高了活体检测模型的鲁棒性。
40.需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
41.本实施例还提供了一种活体检测的系统,该系统用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
42.图4是根据本技术实施例的活体检测的系统的结构框图,如图4所示,该系统包括获取模块41、划分模块42、比较模块43、训练模块44和检测模块45,获取模块41用于获取活体检测模型对样本集的预测结果以及特征向量,特征向量包括预测类特征值和非预测类特征值;划分模块42用于根据样本集的预测结果将样本集划分为分类正确的样本和分类错误的样本,获取所有分类正确的样本预测类特征值的均值,记为第一均值,获取所有分类错误的样本预测类特征值的均值,记为第二均值;比较模块43用于在第一均值和第二均值的差大于预测类特征差阈值的情况下,若样本的预测类特征值小于第二均值,则样本为第一易
错样本,获取所有第一易错样本;训练模块44用于根据所有第一易错样本对活体检测模型进行训练,获得更新后的活体检测模型;检测模块45用于根据更新后的活体检测模型对人脸进行检测,获得活体检测结果,解决了相关技术中普通的活体检测模型鲁棒性低,以及通过对样本做数据增强来挑选易错样本对模型进行训练,时间成本高的问题,提高了活体检测模型的鲁棒性。
43.需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
44.本实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
45.可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
46.需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
47.另外,结合上述实施例中的活体检测的方法,本技术实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种活体检测的方法。
48.在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种活体检测的方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
49.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink) dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
50.本领域的技术人员应该明白,以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,
只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
51.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1