一种跨姿态人脸识别方法

文档序号：25626059发布日期：2021-06-25 16:30阅读：257来源：国知局

1.本发明涉及人工智能技术领域，尤其涉及一种计算机视觉技术。

背景技术：

2.人脸识别，是人工智能领域的重要研究课题，在智慧安防、智慧城市、智慧商业、智能金融和智能家居等领域，具有重要的应用前景和商业价值。日常生活中，低头、转脸等头部运动会造成姿态过大，从而造成人脸显著特征的缺失，会严重损害人脸识别方法的性能。
3.现如今，有代表性的跨姿态人脸识别方法，主要分为三类：
4.人脸旋转：
5.代表性工作有tp
‑
gan、ff
‑
gan、capg
‑
gan、pim、3d
‑
pim和ffwm等。这类工作期望通过将侧脸转正的方式，一方面减小侧脸与正脸之间的差异，另一方面期望生成器能够在转正的过程中补充侧脸丢失的信息。然而，将大角度侧脸转正，涉及到巨大的几何形变和像素改变，在这样剧烈的变化过程中保持住身份信息是一件非常困难的事情。同时，为了提升效果，这类方法的生成器网络通常非常复杂。这两点极大地限制了人脸旋转方法的落地。
6.人脸几何校正：
7.代表性工作有alignment learning和gridface等。这类工作往往在人脸识别模型前加入一个人脸几何校正网络，并和后端人脸识别模型同时进行end
‑
to
‑
end训练。由于后端人脸识别模型需要同时进行优化，需要在大规模人脸数据上重新进行训练，因此训练成本较高。同时，大角度人脸进行几何变换时保持住身份信息仍然较为困难。
8.特征映射：
9.代表性工作有dream。该方法从人脸识别模型学到的特征出发，对已经学错的特征重新进行变换，最终识别性能提升有限。

技术实现要素：

10.本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
11.为此，本发明的第一个目的在于提出一种一种跨姿态人脸识别方法，解决了现有人脸识别方法在大角度情况下性能受限的问题，极大的提升后端人脸识别模型的性能；
12.本发明的第二个目的在于提出一种跨姿态人脸识别装置；
13.本发明的第三个目的在于提出一种计算机设备；
14.本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
15.为达上述目的，本发明第一方面实施例提出了一种跨姿态人脸识别方法，包括：
16.采集第一待识别人脸图像；
17.将所述待识别人脸图像输入至预先构建的人脸生成网络，通过所述人脸生成网络获取所述第一待识别人脸图像的语义信息，并对所述第一待识别人脸图像的语义信息进行修正，根据修正后的语义信息生成第二待识别人脸图像，其中，所述第二待识别人脸图像包含的人脸特征信息多于所述第一待识别人脸图像包含的人脸特征信息；
18.将所述第二待识别人脸图像输入至人脸识别网络，通过所述人脸识别网络对所述第二待识别人脸图像进行人脸识别，以获得所述第二待识别人脸图像对应的人脸识别结果。
19.可选地，在本申请实施例中，在所述将所述待识别人脸图像输入至预先构建的人脸生成网络之前，还包括：
20.获取第一人脸图像样本和第二人脸图像样本，其中，所述第一人脸图像样本和第二人脸图像样本所属的用户id信息相同；
21.将所述第一人脸图像样本和第二人脸图像样本输入至人脸识别网络，通过所述人脸识别网络对所述第一人脸图像样本和第二人脸图像样本进行人脸识别，以分别获得所述第一人脸图像样本对应的第一人脸特征，以及所述第二人脸图像样本对应的第二人脸特征；
22.根据所述第一人脸特征和所述第二人脸特征，采用人脸信息保持损失函数构建所述人脸生成网络。
23.可选地，在本申请实施例中，所述第一人脸图像样本包括用户的正面图像或小角度图像，所述第二人脸图像样本包括与所述用户的正面图像或小角度图像具有不同姿态的图像。
24.可选地，在本申请实施例中，所述人脸信息保持损失函数为：
[0025][0026]
其中，分别表示输入图像和经过后端人脸识别网络提取到的特征。是经过人脸生成网络后生成的图像，和具有相同的人脸id信息，但是是小角度人脸或正脸图像，是大角度人脸图像。
[0027]
为达上述目的，本发明第二方面实施例提出了一种跨姿态人脸识别装置，包括：
[0028]
采集模块，用于采集第一待识别人脸图像；
[0029]
处理模块，用于将所述待识别人脸图像输入至预先构建的人脸生成网络，通过所述人脸生成网络获取所述第一待识别人脸图像的语义信息，并对所述第一待识别人脸图像的语义信息进行修正，根据修正后的语义信息生成第二待识别人脸图像，其中，所述第二待识别人脸图像包含的人脸特征信息多于所述第一待识别人脸图像包含的人脸特征信息；
[0030]
识别模块，用于将所述第二待识别人脸图像输入至人脸识别网络，通过所述人脸识别网络对所述第二待识别人脸图像进行人脸识别，以获得所述第二待识别人脸图像对应的人脸识别结果。
[0031]
可选地，在本申请实施例中，所述采集模块还用于获取第一人脸图像样本和第二人脸图像样本，其中，所述第一人脸图像样本和第二人脸图像样本所属的用户id信息相同；
[0032]
将所述第一人脸图像样本和第二人脸图像样本输入至人脸识别网络，通过所述人脸识别网络对所述第一人脸图像样本和第二人脸图像样本进行人脸识别，以分别获得所述第一人脸图像样本对应的第一人脸特征，以及所述第二人脸图像样本对应的第二人脸特征；
[0033]
根据所述第一人脸特征和所述第二人脸特征，采用人脸信息保持损失函数构建所
述人脸生成网络。
[0034]
可选地，在本申请实施例中，所述第一人脸图像样本包括用户的正面图像或小角度图像，所述第二人脸图像样本包括与所述用户的正面图像或小角度图像具有不同姿态的图像。
[0035]
可选地，在本申请实施例中，所述人脸信息保持损失函数为：
[0036][0037]
其中，分别表示输入图像和经过后端人脸识别网络提取到的特征。是经过人脸生成网络后生成的图像，和具有相同的人脸id信息，但是是小角度人脸或正脸图像，是大角度人脸图像。
[0038]
为达上述目的，本申请的第三方面实施例提出了一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现本申请实施例所述的方法。
[0039]
为达上述目的，本申请的第四方面实施例提出了一种非临时性计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现本申请实施例所述的方法。
[0040]
由此，本申请实施例提出的一种跨姿态人脸识别方法预先构建的人脸生成网络，通过预先构建的人脸生成网络获取第一待识别人脸图像的语义信息，并对第一待识别人脸图像的语义信息进行修正，根据修正后的语义信息生成第二待识别人脸图像，其中，第二待识别人脸图像包含的人脸特征信息多于第一待识别人脸图像包含的人脸特征信息；将第二待识别人脸图像输入至人脸识别网络，通过人脸识别网络对第二待识别人脸图像进行人脸识别，以获得第二待识别人脸图像对应的人脸识别结果，从而解决现有技术中人脸识别方法在大角度情况下性能受限的问题的技术问题，提升已有的训练好的人脸识别器的识别精度。
[0041]
本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。
附图说明
[0042]
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：
[0043]
图1为本发明实施例所提供的一种跨姿态人脸识别方法的流程示意图；以及
[0044]
图2是构建本发明实施例中人脸生成网络的一种构建实例。
具体实施方式
[0045]
下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。
[0046]
下面参考附图描述本发明实施例的一种跨姿态人脸识别方法方法和装置。
[0047]
图1为本发明实施例所提供的一种跨姿态人脸识别方法的流程示意图。
[0048]
针对这一问题，本发明实施例提供了一种跨姿态人脸识别方法，以解决现有人脸识别方法在大角度情况下性能受限的问题，如图1所示，该跨姿态人脸识别方法包括以下步骤：
[0049]
采集第一待识别人脸图像；
[0050]
将所述待识别人脸图像输入至预先构建的人脸生成网络，通过所述人脸生成网络获取所述第一待识别人脸图像的语义信息，并对所述第一待识别人脸图像的语义信息进行修正，根据修正后的语义信息生成第二待识别人脸图像，其中，所述第二待识别人脸图像包含的人脸特征信息多于所述第一待识别人脸图像包含的人脸特征信息；
[0051]
将所述第二待识别人脸图像输入至人脸识别网络，通过所述人脸识别网络对所述第二待识别人脸图像进行人脸识别，以获得所述第二待识别人脸图像对应的人脸识别结果。
[0052]
可选地，在本申请实施例中，在所述将所述待识别人脸图像输入至预先构建的人脸生成网络之前，还包括：
[0053]
获取第一人脸图像样本和第二人脸图像样本，其中，所述第一人脸图像样本和第二人脸图像样本所属的用户id信息相同；
[0054]
将所述第一人脸图像样本和第二人脸图像样本输入至人脸识别网络，通过所述人脸识别网络对所述第一人脸图像样本和第二人脸图像样本进行人脸识别，以分别获得所述第一人脸图像样本对应的第一人脸特征，以及所述第二人脸图像样本对应的第二人脸特征；
[0055]
根据所述第一人脸特征和所述第二人脸特征，采用人脸信息保持损失函数构建所述人脸生成网络。
[0056]
可选地，在本申请实施例中，所述第一人脸图像样本包括用户的正面图像或小角度图像，所述第二人脸图像样本包括与所述用户的正面图像或小角度图像具有不同姿态的图像。
[0057]
可选地，在本申请实施例中，所述人脸信息保持损失函数为：
[0058][0059]
其中，分别表示输入图像和经过后端人脸识别网络提取到的特征。是经过人脸生成网络后生成的图像，和具有相同的人脸id信息，但是是小角度人脸或正脸图像，是大角度人脸图像。
[0060]
为了实现上述实施例，本发明还提出一种跨姿态人脸识别装置，包括：
[0061]
采集模块，用于采集第一待识别人脸图像；
[0062]
处理模块，用于将所述待识别人脸图像输入至预先构建的人脸生成网络，通过所述人脸生成网络获取所述第一待识别人脸图像的语义信息，并对所述第一待识别人脸图像的语义信息进行修正，根据修正后的语义信息生成第二待识别人脸图像，其中，所述第二待识别人脸图像包含的人脸特征信息多于所述第一待识别人脸图像包含的人脸特征信息；
[0063]
识别模块，用于将所述第二待识别人脸图像输入至人脸识别网络，通过所述人脸识别网络对所述第二待识别人脸图像进行人脸识别，以获得所述第二待识别人脸图像对应
的人脸识别结果。
[0064]
可选地，在本申请实施例中，所述采集模块还用于获取第一人脸图像样本和第二人脸图像样本，其中，所述第一人脸图像样本和第二人脸图像样本所属的用户id信息相同；
[0065]
将所述第一人脸图像样本和第二人脸图像样本输入至人脸识别网络，通过所述人脸识别网络对所述第一人脸图像样本和第二人脸图像样本进行人脸识别，以分别获得所述第一人脸图像样本对应的第一人脸特征，以及所述第二人脸图像样本对应的第二人脸特征；
[0066]
根据所述第一人脸特征和所述第二人脸特征，采用人脸信息保持损失函数构建所述人脸生成网络。
[0067]
可选地，在本申请实施例中，所述第一人脸图像样本包括用户的正面图像或小角度图像，所述第二人脸图像样本包括与所述用户的正面图像或小角度图像具有不同姿态的图像。
[0068]
可选地，在本申请实施例中，所述人脸信息保持损失函数为：
[0069][0070]
其中，分别表示输入图像和经过后端人脸识别网络提取到的特征。是经过人脸生成网络后生成的图像，和具有相同的人脸id信息，但是是小角度人脸或正脸图像，是大角度人脸图像。
[0071]
为了使本领域技术人员更好的理解本申请，现以一种基于图上下文学习的异常点检测方法为例；
[0072]
下面参考附图描述本申请实施例的方法：
[0073]
本申请的目的是解决现有人脸识别方法在大角度情况下性能受限的问题。通过在人脸识别模型前端加入一个轻量级的人脸生成网络，利用人脸信息保持损失函数监督、修正人脸生成网络输出的人脸图像语义信息，进而提升后端人脸识别模型的性能。
[0074]
本申请提出了利用人脸生成网络提升跨姿态人脸识别性能的方法，可以有效提升已有方法在大角度下人脸识别的性能。
[0075]
图1为本发明实施例所提供的一种跨姿态人脸识别方法的流程示意图；
[0076]
本申请提出一种基于人脸生成的跨姿态人脸识别方法。具体地，首先构建一个前端人脸生成网络，在尽可能保持原像素的情况下修正输入人脸图像的语义信息；然后将重新生成后的人脸图像送入后端人脸识别方法进行人脸识别。训练过程中，后端识别网络保持不变，只利用人脸信息保持损失函数对前端人脸生成网络进行监督训练。
[0077]
具体步骤如下：
[0078]
s1：构建前端人脸生成网络
[0079]
本发明首先构建一个前端网络，在尽可能保持原像素的情况下修正输入人脸图像的语义信息，如图1所示。图2是一种人脸生成网络的构建实例，可以采用更复杂的卷积神经网络构建方式。
[0080]
s2：人脸识别
[0081]
将重新生成的人脸图像送入已有的人脸识别方法，即可提升后端人脸识别方法对
大角度人脸的识别精度。
[0082]
s3：训练过程
[0083]
训练过程中，后端人脸识别网络保持不变，使用人脸信息保持损失函数监督前端人脸生成网络的训练。具体地，人脸信息保持损失函数定义如下：
[0084][0085]
其中，分别表示输入图像和经过后端人脸识别网络提取到的特征。是经过人脸生成网络后生成的图像，和具有相同的人脸id信息，但是是小角度人脸或正脸图像，是大角度人脸图像。
[0086]
本申请构建轻量级的人脸生成网络，在尽可能保持原像素的情况下修正输入人脸图像的语义信息；
[0087]
本申请利用人脸生成网络辅助后端人脸识别方法，训练过程中后端识别模型保持不变，只利用人脸信息保持损失函数对前端人脸生成网络进行监督训练。
[0088]
图2是构建本发明实施例中人脸生成网络的一种构建实例；
[0089]
在本申请实施例中，所述前端人脸生成网络可以进一步变化，如加宽、加深，预期可以获得更好的性能。
[0090]
其中，所述前端人脸生成网络主要是由编码器、解码器和处理器构成；
[0091]
进一步地，所述编码器将所述第一待识别人脸图像映射到一个高维特征图，所述解码器再将高维特征图恢复至与所述第一待识别人脸图像大小相同的所述第二待识别人脸图像，获得人脸图像需要修正的语义信息；
[0092]
最后processor对所述第一待识别人脸图像和修正的语义信息进行处理，获得修正后的所述第二待识别人脸图像；
[0093]
所述processor使用逐像素减法操作，但加法或其他方式也可以获得类似效果。
[0094]
其中，图2中的参数解释如下：
[0095]
conv3x3 block是一个核函数为3x3大小的卷积层，后面跟一个leaky relu；deconv2x2 block是一个核函数为2x2大小的反卷积层，后面跟一个leaky relu；conv2d，1x1是一个核函数为1x1大小的卷积层；inverted residual block是mobilenet v2提出的一种结构，膨胀因子设为1；sigmoid就是sigmoid激活函数；subtraction是逐像素相减。
[0096]
为了实现上述实施例，本申请的第三方面实施例提出了一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现本申请实施例所述的方法。
[0097]
为了实现上述实施例，本申请的第四方面实施例一种非临时性计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现本申请实施例所述的方法。
[0098]
在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任
一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0099]
此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。
[0100]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。
[0101]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式光盘只读存储器(cdrom)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。
[0102]
应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。
[0103]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。
[0104]
此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。
[0105]
上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描
述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：鲁继文;王国利;周杰
技术所有人：清华大学
我是此专利的发明人

上一篇：一种双层牛皮纸垫对折压平装置的制作方法
上一篇：一种新型牵引架的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。