活体检测方法、装置、终端设备和可读存储介质与流程

文档序号：33556998发布日期：2023-03-22 12:21阅读：39来源：国知局

1.本发明涉及计算机视觉技术领域，特别是涉及一种活体检测方法、装置、终端设备和可读存储介质。

背景技术：

2.随着深度学习的使用，人脸识别系统已经出现在众多产品中，随之而来的人脸活体检测成为计算机视觉中的热门研究课题之一。它需要将所识别的人脸判断是活体还是假体，防止犯罪分子盗用他人信息。
3.现在活体检测模型主要方式还是监督训练，数据标签采用one-hot形式的类别标签，该类别标签形式单一，信息量少，由于假体数据中存在假体类型复杂性和不确定性，采用目前的检测方法无法能够准确得检测出活体。

技术实现要素：

4.鉴于上述问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种活体检测方法、装置、终端设备和可读存储介质。
5.第一个方面，本发明实施例提供一种活体检测方法，所述方法包括：
6.获取待检测图像；
7.采用语言描述方式，为所述待检测的图像设置多个语言标签；
8.根据所述待检测图像，确定所述待检测图像中的关键区域和关键点信息，并对所述关键区域进行切图和校正处理，得到校正后的图像；
9.将所述语言标签输入到语言编码模型中，得到语言监督特征；
10.将所述校正后的图像输入到图像编码模型中，得到待检测图像的图像特征；
11.计算所述语言监督特征和所述图像特征的相似度，根据所述相似度值，判断所述待检测图像是否为活体图像。
12.可选地，所述采用语言描述方式，为所述待检测的图像设置多个语言标签，包括：
13.采用语言描述作为数据标记，对所述待检测图像中的活体数据进行标记，得到多个语言标签，所述语言标签至少包括数据类型，所述数据类型至少包括活体或假体，所述假体至少包括假体材质、配饰或光照中的一种或多种。
14.可选地，所述根据所述待检测图像，确定所述待检测图像中的关键区域和关键点信息，并对所述关键区域进行切图和校正处理，得到校正后的图像，包括：
15.将所述待检测图像输入到预先建立的人脸检测模型，得到所述待检测图像中的人脸图像，并根据所述人脸图像，确定所述检测图像中的人脸区域和非人脸区域；
16.将所述人脸区域进行切图处理，得到切分图像；
17.将所述切分图像输入到预先建立的关键点检测模型，得到所述切分图像中的人脸关键点信息；
18.根据所述人脸关键点信息，将所述人脸区域映射到预先建立的人脸标准模型，对
所述待检测图像中的人脸区域与标准人脸图像进行对齐校准，得到校正后的图像。
19.可选地，所述方法还包括：
20.将所述校正后的图像进行旋转、移动、倾斜、缩放和颜色抖动的操作，的得到处理后的图像，将所述处理后的图像增加到图像数据集中。
21.可选地，所述将所述校正后的图像输入到图像编码模型中，得到待检测图像的图像特征，包括：
22.将所述切分图像输入到预先建立的图像编码模型中进行特征编码，提取所述切分图像中活体特征向量，其中，所述预先建立的图像编码模型为vit网络模型。
23.可选地，所述将所述语言标签输入到语言编码模型中，得到语言监督特征，包括：
24.将所述语言标签转换成bpe二进制形式的文本数据；
25.将所述bpe二进制形式的文本数据输入到预先建立的语言编码模型中，提取标签语义特征，并将所述标签语义特征确定为语言监督特征，其中，所述语言编码模型至少为transformer网络语言模型。
26.可选地，所述计算所述语言监督特征和所述图像特征的相似度，包括：
27.根据下列公式，计算所述图像特征与所述语言监督特征的相似度；
[0028][0029]
其中，i为图像特征；t为语言监督特征。
[0030]
第二个方面，本发明实施例提供一种活体检测装置，所述装置包括：
[0031]
获取模块，用于获取待检测图像；
[0032]
设置模块，用于采用语言描述方式，为所述待检测的图像设置多个语言标签；
[0033]
识别模块，用于根据所述待检测图像，确定所述待检测图像中的关键区域和关键点信息，并对所述关键区域进行切图和校正处理，得到校正后的图像；
[0034]
第一编码模块，用于将所述语言标签输入到语言编码模型中，得到语言监督特征；
[0035]
第二编码模块，用于将所述校正后的图像输入到图像编码模型中，得到待检测图像的图像特征；
[0036]
检测模块，用于计算所述语言监督特征和所述图像特征的相似度，根据所述相似度值，判断所述待检测图像是否为活体图像。
[0037]
可选地，所述设置模块用于：
[0038]
采用语言描述作为数据标记，对所述待检测图像中的活体数据进行标记，得到多个语言标签，所述语言标签至少包括数据类型，所述数据类型至少包括活体或假体，所述假体至少包括假体材质、配饰或光照中的一种或多种。
[0039]
可选地，所述识别模块用于：
[0040]
将所述待检测图像输入到预先建立的人脸检测模型，得到所述待检测图像中的人脸图像，并根据所述人脸图像，确定所述检测图像中的人脸区域和非人脸区域；
[0041]
将所述人脸区域进行切图处理，得到切分图像；
[0042]
将所述切分图像输入到预先建立的关键点检测模型，得到所述切分图像中的人脸关键点信息；
[0043]
根据所述人脸关键点信息，将所述人脸区域映射到预先建立的人脸标准模型，对所述待检测图像中的人脸区域与标准人脸图像进行对齐校准，得到校正后的图像。
[0044]
可选地，所述识别模块还用于：
[0045]
将所述校正后的图像进行旋转、移动、倾斜、缩放和颜色抖动的操作，的得到处理后的图像，将所述处理后的图像增加到图像数据集中。
[0046]
可选地，所述第一编码模块用于：
[0047]
将所述语言标签转换成bpe二进制形式的文本数据；
[0048]
将所述bpe二进制形式的文本数据输入到预先建立的语言编码模型中，提取标签语义特征，并将所述标签语义特征确定为语言监督特征，其中，所述语言编码模型至少为transformer网络语言模型。
[0049]
可选地，所述第二编码模块用于：
[0050]
将所述切分图像输入到预先建立的图像编码模型中进行特征编码，提取所述切分图像中活体特征向量，其中，所述预先建立的图像编码模型为vit网络模型。
[0051]
可选地，所述检测模块用于：
[0052]
根据下列公式，计算所述图像特征与所述语言监督特征的相似度；
[0053][0054]
其中，i为图像特征；t为语言监督特征。
[0055]
第三个方面，本发明实施例提供一种终端设备，包括：至少一个处理器和存储器；
[0056]
所述存储器存储计算机程序；所述至少一个处理器执行所述存储器存储的计算机程序，以实现第一个方面提供的活体检测方法。
[0057]
第四个方面，本发明实施例提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，所述计算机程序被执行时实现第一个方面提供的活体检测方法。
[0058]
本发明实施例包括以下优点：
[0059]
本发明实施例提供的活体检测方法、装置、终端设备和可读存储介质，通过获取待检测图像；采用语言描述方式，为待检测的图像设置多个语言标签；根据待检测图像，确定待检测图像中的关键区域和关键点信息，并对关键区域进行切图和校正处理，得到校正后的图像；将语言标签输入到语言编码模型中，得到语言监督特征；将校正后的图像输入到图像编码模型中，得到待检测图像的图像特征；计算语言监督特征和图像特征的相似度，根据相似度值，判断待检测图像是否为活体图像，利用基于语言描述监督的方式进行活体训练，即利用了详细标签，并且随着假体类型的增多，数据的变化，完全不影响模型，加大系统易扩展性，提高了活体检测的准确性。
附图说明
[0060]
图1是本发明的一种活体检测方法实施例的步骤流程图；
[0061]
图2是本发明的又一种活体检测方法实施例的步骤流程图；
[0062]
图3是本发明的一种活体检测系统实施例的结构示意图；
[0063]
图4是本发明的一种活体检测装置实施例的结构框图；
[0064]
图5是本发明的一种终端设备的结构示意图。
具体实施方式
[0065]
为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0066]
本发明一实施例提供一种活体检测方法，用于对图像中的活体进行检测。本实施例的执行主体为活体检测装置，设置在终端设备上，其中，该终端设备至少包括计算机、平板终端等。
[0067]
参照图1，示出了本发明的一种活体检测方法实施例的步骤流程图，该方法具体可以包括如下步骤：
[0068]
s101、获取待检测图像；
[0069]
具体地，终端设备获取待检测图像，该待检测图像至少包括人脸图像，也有可能包括假体。
[0070]
s102、采用语言描述方式，为待检测的图像设置多个语言标签；
[0071]
终端设备使用语言具体描述数据，建立详细复杂的标签，如a photo of a{label},a type of paper,a type of glass；为待检测的图像中的活体和假体设置语言标签。
[0072]
活体数据在进行标注时，放弃了one-hot类型的类别标签，采用了更为详尽灵活的语言描述作为数据标记，对数据进行详尽描述，如数据类型是活体还是假体描述子，假体材质描述子，配饰描述子，光照描述子等，提供详细信息。
[0073]
s103、根据待检测图像，确定待检测图像中的关键区域和关键点信息，并对关键区域进行切图和校正处理，得到校正后的图像；
[0074]
s104、将语言标签输入到语言编码模型中，得到语言监督特征；
[0075]
具体地，终端设备将语言标签输入语言编码encoder模型中，提取语言监督特征，将校准后人脸图片输入图像编码encode模型提取图片特征；
[0076]
将语言文本标签转换成bpe二进制形式，之后输入到语言encoder网络提取标签语义特征，作为语言监督特征，encoder的具体方法为transformer网络语言模型。
[0077]
s105、将校正后的图像输入到图像编码模型中，得到待检测图像的图像特征；
[0078]
具体地，由于待检测图像存在人脸位置不确定和姿态不稳定问题，待检测图像即原始图像经过人脸检测模型，获得人脸位置，区分图像的人脸区域和非人脸区域，将人脸区域切图，送入关键点检测模型之后，获得人脸关键点，按照人脸关键点位置，将人脸区域映射到人脸标准模型，进行人脸对齐校准。
[0079]
s106、计算语言监督特征和图像特征的相似度，根据相似度值，判断待检测图像是否为活体图像。
[0080]
具体的，终端设备计算语言监督特征和图像特征的相似度，并根据相似度值的大小来判断待检测图像是否为活体图像，例如，选取相似度最高的作为图像类别。
[0081]
本发明实施例提供的活体检测方法，通过获取待检测图像；采用语言描述方式，为待检测的图像设置多个语言标签；根据待检测图像，确定待检测图像中的关键区域和关键点信息，并对关键区域进行切图和校正处理，得到校正后的图像；将语言标签输入到语言编
码模型中，得到语言监督特征；将校正后的图像输入到图像编码模型中，得到待检测图像的图像特征；计算语言监督特征和图像特征的相似度，根据相似度值，判断待检测图像是否为活体图像，利用基于语言描述监督的方式进行活体训练，即利用了详细标签，并且随着假体类型的增多，数据的变化，完全不影响模型，加大系统易扩展性，提高了活体检测的准确性。
[0082]
图2是本发明的又一种活体检测方法实施例的步骤流程图，该活体体检方法包括：
[0083]
s1、标注活体数据标签时，采用语言描述，放弃了one-hot类型的类别标签，如a photo of a{label},a type of paper,a type of glass，可以根据不同活体需求，创建不同语言标签。
[0084]
s2、将图像进行人脸区域提取和关键点提取，进行人脸切图和校准。
[0085]
s3、将语言标签输入语言encoder模型提取语言特征，将校准人脸图片输入语言encode模型提取图片特征。
[0086]
s4、计算图像特征与各语言特征的相似度，选取相似度最高的作为图像类型。
[0087]
如图3所示，本发明又一实施例对上述实施例提供的活体检测方法做进一步补充说明。
[0088]
可选地，采用语言描述方式，为待检测的图像设置多个语言标签，包括：
[0089]
采用语言描述作为数据标记，对待检测图像中的活体数据进行标记，得到多个语言标签，语言标签至少包括数据类型，数据类型至少包括活体或假体，假体至少包括假体材质、配饰或光照中的一种或多种。
[0090]
具体地，语言监督模块摒弃了one-hot类标签，将语言描述映射为特征向量，采用了度量学习方式，一张图像与自对应的语言标签特征为正样本对，除了自对应的语言标签，在活体语言标签中通常存在包含关系，如假体包含面具假体，面具假体包含带戴眼镜的面具假体，因此一张图片与自对应语言标签组成正样本对，与包含关系的语言标签组成正样本对，除此之外，其它为负样本对，具体伪代码如下所示
[0091]
i_f＝image_encoder(i)#[n,d_i]
[0092]
t_f＝text_encoder(t)#[n,d_t]
[0093]
i_e＝l2_normalize(np.dot(i_f,w_i),axis＝1)
[0094]
t_e＝l2_normalize(np.dot(t_f,w_t),axis＝1)
[0095]
logits＝np.dot(i_e,t_e.t)*np.exp(t)
[0096]
构建正负样本对labels
[0097]
loss_i＝sigmoid_entropy_loss(logits,labels,axis＝0)
[0098]
loss_t＝sigmoid_entropy_loss(logits,labels,axis＝1)
[0099]
loss＝(loss_i+loss_t)/2
[0100]
所述图像监督模块中没有one-hot类别标签,无法直接使用分类器，但由于语言标注中存在包含关系，因此图像数据本身也可以组成正负样本对，一张图片与语言描述存在包含关系的图像组成正样本对，其它为负样本对，本模块采用度量学习方式，具体伪代码如下所示
[0101]
i_f＝image_encoder(i)#[n,d_i]
[0102]
i_e＝l2_normalize(np.dot(i_f,w_i),axis＝1)
[0103]
logits＝np.dot(i_e,i_e.t)*np.exp(t)
[0104]
构建正负样本对labels
[0105]
loss_i＝sigmoid_entropy_loss(logits,labels,axis＝0)
[0106]
loss_t＝sigmoid_entropy_loss(logits,labels,axis＝1)
[0107]
loss＝(loss_i+loss_t)/2
[0108]
所述图像正样本对与负样本对标准与one-hot类标签不同，在语言描述中，存在包含关系，如假体包含纸质假体，3d面具假体等，细分之后，3d面具假体包含石膏材质假体、石墨材质假体等，根据不同需要可组建不同正负样本对标准。
[0109]
本发明活体检测系统没有分类器，因此不能直接得出活体和假体得分，但也因此没有固定类别数，增加了模型的灵活性，在本发明中，利用语言描述特征作为类中心，由于语言描述可以有多种表达方式，如表达1：a photo of fake；表达2：a photo of fake,a type of mask，通过输入不同的语言描述，获得不同的文本特征向量，作为类中心，同时可以降不同类中心进行特征融合，起到模型融合效果，如类中心均值，提升模型精度。
[0110]
在传统活体数据标注时，采用one-hot方式类标签，如假体为0，活体为1，此种标签信息量少，本发明采用语言标签，语言标签可以灵活的，详细的描述数据，提供丰富的监督信息，如一张纸质材质的假体，并且配饰为眼镜：a photo of a fake,a type of paper,a type of glass；
[0111]
可选地，根据待检测图像，确定待检测图像中的关键区域和关键点信息，并对关键区域进行切图和校正处理，得到校正后的图像，包括：
[0112]
将待检测图像输入到预先建立的人脸检测模型，得到待检测图像中的人脸图像，并根据人脸图像，确定检测图像中的人脸区域和非人脸区域；
[0113]
将人脸区域进行切图处理，得到切分图像；
[0114]
将切分图像输入到预先建立的关键点检测模型，得到切分图像中的人脸关键点信息；
[0115]
根据人脸关键点信息，将人脸区域映射到预先建立的人脸标准模型，对待检测图像中的人脸区域与标准人脸图像进行对齐校准，得到校正后的图像。
[0116]
具体地，输入图像首先进行人脸检测，根据人脸检测框，进行人脸区域切图，将切好的人脸区域送入关键点检测模型，获得人脸关键点，根据人脸关键点进行人脸校正，获得校准后数据；
[0117]
在一些实施例中，人脸关键点模型采用五点模型，即左右眼中心、鼻尖和左右嘴角；
[0118]
在一些实施例中，校正算法采用放射变换；
[0119]
可选地，该方法还包括：
[0120]
将校正后的图像进行旋转、移动、倾斜、缩放和颜色抖动的操作，的得到处理后的图像，将处理后的图像增加到图像数据集中。
[0121]
可选地，将校正后的图像输入到图像编码模型中，得到待检测图像的图像特征，包括：
[0122]
将切分图像输入到预先建立的图像编码模型中进行特征编码，提取切分图像中活体特征向量，其中，预先建立的图像编码模型为vit网络模型。
[0123]
vit网络输入要求为图像斑块，因此需要将图像分割成16*16大小的不连续的图像
斑块，向量表示为xp＝[xp1；xp2；...,xpn]，同时加入类标记向量xcls，z0，＝[xcls；xp1；xp2；...,xpn]，作为encoder的输入。
[0124]
，所述将校准后的图像输入到图像encoder网络进行特征编码，提取活体特征向量，encoder的具体实现方法为transformer网络中的vit网络
[0125]
可选地，将语言标签输入到语言编码模型中，得到语言监督特征，包括：
[0126]
将语言标签转换成bpe二进制形式的文本数据；
[0127]
将bpe二进制形式的文本数据输入到预先建立的语言编码模型中，提取标签语义特征，并将标签语义特征确定为语言监督特征，其中，语言编码模型至少为transformer网络语言模型。
[0128]
在一些实施例中，语言模型采用transformer，网络层数为12，宽度为512，注意力头部数为8，词袋数量为49152，输入使用bpe表示，同时限制了输入长度最大为76，送入语言encoder后，获得语言特征；
[0129]
在一些实施例中，语言特征长度为512维；
[0130]
在一些实施例中，将输入的rgb图像分割成不重叠的斑块，每个所述斑块被认为是一个标记，具体包括：
[0131]
每个rgb图像i∈r(h
×w×
c)，其中h、w和c分别表示高度、宽度和通道的数量；
[0132]
产生的斑块数量n可以描述为其中ph和pw表示每个图像斑块的分辨率；
[0133]
将图像i重塑为一串扁平化的二维斑块
[0134]
在一些实施例中，设定为ph＝pw＝16，当把大小为224x224的rgb图像作为输入时；总共会产生196个斑块；
[0135]
在一些实施例中，图像encoder模型采用vit网路，将斑块送入vit网络结构中进行编码，获得图像特征。
[0136]
在一些实施例中，图像特征长度为512维；
[0137]
可选地，计算语言监督特征和图像特征的相似度，包括：
[0138]
根据下列公式，计算图像特征与语言监督特征的相似度；
[0139][0140]
其中，i为图像特征；t为语言监督特征。
[0141]
需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。
[0142]
本发明实施例提供的活体检测方法，通过获取待检测图像；采用语言描述方式，为待检测的图像设置多个语言标签；根据待检测图像，确定待检测图像中的关键区域和关键点信息，并对关键区域进行切图和校正处理，得到校正后的图像；将语言标签输入到语言编
码模型中，得到语言监督特征；将校正后的图像输入到图像编码模型中，得到待检测图像的图像特征；计算语言监督特征和图像特征的相似度，根据相似度值，判断待检测图像是否为活体图像，利用基于语言描述监督的方式进行活体训练，即利用了详细标签，并且随着假体类型的增多，数据的变化，完全不影响模型，加大系统易扩展性，提高了活体检测的准确性。
[0143]
本发明另一实施例提供一种活体检测装置，用于执行上述实施例提供的活体检测方法。
[0144]
参照图4，示出了本发明的一种活体检测装置实施例的结构框图，该装置具体可以包括如下模块：获取模块401、设置模块402、识别模块403、第一编码模块404、第二编码模块405和检测模块406，其中：
[0145]
获取模块401用于获取待检测图像；
[0146]
设置模块402用于采用语言描述方式，为待检测的图像设置多个语言标签；
[0147]
识别模块403用于根据待检测图像，确定待检测图像中的关键区域和关键点信息，并对关键区域进行切图和校正处理，得到校正后的图像；
[0148]
第一编码模块404用于将语言标签输入到语言编码模型中，得到语言监督特征；
[0149]
第二编码模块405用于将校正后的图像输入到图像编码模型中，得到待检测图像的图像特征；
[0150]
检测模块406用于计算语言监督特征和图像特征的相似度，根据相似度值，判断待检测图像是否为活体图像。
[0151]
本发明实施例提供的活体检测装置，通过获取待检测图像；采用语言描述方式，为待检测的图像设置多个语言标签；根据待检测图像，确定待检测图像中的关键区域和关键点信息，并对关键区域进行切图和校正处理，得到校正后的图像；将语言标签输入到语言编码模型中，得到语言监督特征；将校正后的图像输入到图像编码模型中，得到待检测图像的图像特征；计算语言监督特征和图像特征的相似度，根据相似度值，判断待检测图像是否为活体图像，利用基于语言描述监督的方式进行活体训练，即利用了详细标签，并且随着假体类型的增多，数据的变化，完全不影响模型，加大系统易扩展性，提高了活体检测的准确性。
[0152]
本发明又一实施例对上述实施例提供的活体检测装置做进一步补充说明。
[0153]
可选地，设置模块用于：
[0154]
采用语言描述作为数据标记，对待检测图像中的活体数据进行标记，得到多个语言标签，语言标签至少包括数据类型，数据类型至少包括活体或假体，假体至少包括假体材质、配饰或光照中的一种或多种。
[0155]
可选地，识别模块用于：
[0156]
将待检测图像输入到预先建立的人脸检测模型，得到待检测图像中的人脸图像，并根据人脸图像，确定检测图像中的人脸区域和非人脸区域；
[0157]
将人脸区域进行切图处理，得到切分图像；
[0158]
将切分图像输入到预先建立的关键点检测模型，得到切分图像中的人脸关键点信息；
[0159]
根据人脸关键点信息，将人脸区域映射到预先建立的人脸标准模型，对待检测图像中的人脸区域与标准人脸图像进行对齐校准，得到校正后的图像。
[0160]
可选地，识别模块还用于：
[0161]
将校正后的图像进行旋转、移动、倾斜、缩放和颜色抖动的操作，的得到处理后的图像，将处理后的图像增加到图像数据集中。
[0162]
可选地，第一编码模块用于：
[0163]
将语言标签转换成bpe二进制形式的文本数据；
[0164]
将bpe二进制形式的文本数据输入到预先建立的语言编码模型中，提取标签语义特征，并将标签语义特征确定为语言监督特征，其中，语言编码模型至少为transformer网络语言模型。
[0165]
可选地，第二编码模块用于：
[0166]
将切分图像输入到预先建立的图像编码模型中进行特征编码，提取切分图像中活体特征向量，其中，预先建立的图像编码模型为vit网络模型。
[0167]
可选地，检测模块用于：
[0168]
根据下列公式，计算图像特征与语言监督特征的相似度；
[0169][0170]
其中，i为图像特征；t为语言监督特征。
[0171]
需要说明的是，本实施例中各可实施的方式可以单独实施，也可以在不冲突的情况下以任意组合方式结合实施本技术不做限定。
[0172]
对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
[0173]
本发明实施例提供的活体检测装置，通过获取待检测图像；采用语言描述方式，为待检测的图像设置多个语言标签；根据待检测图像，确定待检测图像中的关键区域和关键点信息，并对关键区域进行切图和校正处理，得到校正后的图像；将语言标签输入到语言编码模型中，得到语言监督特征；将校正后的图像输入到图像编码模型中，得到待检测图像的图像特征；计算语言监督特征和图像特征的相似度，根据相似度值，判断待检测图像是否为活体图像，利用基于语言描述监督的方式进行活体训练，即利用了详细标签，并且随着假体类型的增多，数据的变化，完全不影响模型，加大系统易扩展性，提高了活体检测的准确性。
[0174]
本发明再一实施例提供一种终端设备，用于执行上述实施例提供的活体检测方法。
[0175]
图5是本发明的一种终端设备的结构示意图，如图5所示，该终端设备包括：至少一个处理器501和存储器502；
[0176]
存储器存储计算机程序；至少一个处理器执行存储器存储的计算机程序，以实现上述实施例提供的活体检测方法。
[0177]
本实施例提供的终端设备，通过获取待检测图像；采用语言描述方式，为待检测的图像设置多个语言标签；根据待检测图像，确定待检测图像中的关键区域和关键点信息，并对关键区域进行切图和校正处理，得到校正后的图像；将语言标签输入到语言编码模型中，得到语言监督特征；将校正后的图像输入到图像编码模型中，得到待检测图像的图像特征；计算语言监督特征和图像特征的相似度，根据相似度值，判断待检测图像是否为活体图像，利用基于语言描述监督的方式进行活体训练，即利用了详细标签，并且随着假体类型的增
多，数据的变化，完全不影响模型，加大系统易扩展性，提高了活体检测的准确性。
[0178]
本技术又一实施例提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，计算机程序被执行时实现上述任一实施例提供的活体检测方法。
[0179]
根据本实施例的计算机可读存储介质，通过获取待检测图像；采用语言描述方式，为待检测的图像设置多个语言标签；根据待检测图像，确定待检测图像中的关键区域和关键点信息，并对关键区域进行切图和校正处理，得到校正后的图像；将语言标签输入到语言编码模型中，得到语言监督特征；将校正后的图像输入到图像编码模型中，得到待检测图像的图像特征；计算语言监督特征和图像特征的相似度，根据相似度值，判断待检测图像是否为活体图像，利用基于语言描述监督的方式进行活体训练，即利用了详细标签，并且随着假体类型的增多，数据的变化，完全不影响模型，加大系统易扩展性，提高了活体检测的准确性。
[0180]
本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。
[0181]
本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0182]
本发明实施例是参照根据本发明实施例的方法、电子设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理电子设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理电子设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0183]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理电子设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0184]
这些计算机程序指令也可装载到计算机或其他可编程数据处理电子设备上，使得在计算机或其他可编程电子设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程电子设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0185]
尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
[0186]
最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意
在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者电子设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者电子设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括要素的过程、方法、物品或者电子设备中还存在另外的相同要素。
[0187]
以上对本发明所提供的一种活体检测方法和一种活体检测装置，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：肖良才胡文杰
技术所有人：深圳市新良田科技股份有限公司
我是此专利的发明人

上一篇：一种洗沙制沙集水一体化生产线的制作方法
上一篇：一种物理机设备的算力调度方法、装置、设备及存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。