1.本发明涉及视频编辑技术领域,尤其涉及基于深度学习的人脸及属性识别方法、系统及计算机设备。
背景技术:2.现有的人脸识别方法大多基于传统技术开发,泛化能力不强,识别误差较大且识别速度较慢,精度低,仅仅只是停留在人脸识别的基础上。
技术实现要素:3.本发明实施例提供了基于深度学习的人脸及属性识别方法、系统及计算机设备,旨在解决现有技术中识别速度慢、精度低的问题。
4.第一方面,本发明实施例提供了一种基于深度学习的人脸及属性识别方法,包括:
5.获取摄像头拍摄的监控视频,截取所述监控视频的每一帧监控图像,并对每一帧监控图像进行人脸检测,得到每一帧监控图像中的人脸的人脸位置信息和人脸关键点信息,并根据人脸位置信息对所述人脸进行截取,得到初始人脸图像;
6.根据人脸关键点信息计算所述初始人脸图像的人脸旋转角度,按照所述人脸旋转角度对所述初始人脸图像进行旋转,并对旋转后的初始人脸图像进行尺寸调整以及边缘处理,得到目标人脸图像;
7.将所述目标人脸图像输入至人脸特征编码模型中进行特征编码,得到当前人脸特征向量,并将当前人脸特征向量与人脸库中的历史人脸特征向量进行比对,得到人脸归属信息;
8.以及,将所述目标人脸图像输入至人脸属性识别模型中进行人脸属性识别,得到所述目标人脸图像中人脸的年龄信息和性别信息,并向外输出所述目标人脸图像的人脸归属信息、年龄信息和性别信息。
9.第二方面,本发明实施例提供了一种基于深度学习的人脸及属性识别系统,其包括:
10.初始人脸图像获取单元,用于获取摄像头拍摄的监控视频,截取所述监控视频的每一帧监控图像,并对每一帧监控图像进行人脸检测,得到每一帧监控图像中的人脸的人脸位置信息和人脸关键点信息,并根据人脸位置信息对所述人脸进行截取,得到初始人脸图像;
11.目标人脸图像获取单元,用于根据人脸关键点信息计算所述初始人脸图像的人脸旋转角度,按照所述人脸旋转角度对所述初始人脸图像进行旋转,并对旋转后的初始人脸图像进行尺寸调整以及边缘处理,得到目标人脸图像;
12.人脸归属信息获取单元,用于将所述目标人脸图像输入至人脸特征编码模型中进行特征编码,得到当前人脸特征向量,并将当前人脸特征向量与人脸库中的历史人脸特征向量进行比对,得到人脸归属信息;
13.人脸属性获取单元,用于将所述目标人脸图像输入至人脸属性识别模型中进行人脸属性识别,得到所述目标人脸图像中人脸的年龄信息和性别信息,并向外输出所述目标人脸图像的人脸归属信息、年龄信息和性别信息。
14.第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于深度学习的人脸及属性识别方法。
15.本发明实施例提供了基于深度学习的人脸及属性识别方法、系统及计算机设备,该方法包括:获取摄像头拍摄的监控视频,截取所述监控视频的每一帧监控图像,并对每一帧监控图像进行人脸检测,得到每一帧监控图像中的人脸的人脸位置信息和人脸关键点信息,并根据人脸位置信息对所述人脸进行截取,得到初始人脸图像;根据人脸关键点信息计算所述初始人脸图像的人脸旋转角度,按照所述人脸旋转角度对所述初始人脸图像进行旋转,并对旋转后的初始人脸图像进行尺寸调整以及边缘处理,得到目标人脸图像;将所述目标人脸图像输入至人脸特征编码模型中进行特征编码,得到当前人脸特征向量,并将当前人脸特征向量与人脸库中的历史人脸特征向量进行比对,得到人脸归属信息;以及,将所述目标人脸图像输入至人脸属性识别模型中进行人脸属性识别,得到所述目标人脸图像中人脸的年龄信息和性别信息,并向外输出所述目标人脸图像的人脸归属信息、年龄信息和性别信息。本发明实施例利用人脸特征编码模型和人脸属性识别模型分别获取人脸归属信息和年龄信息以及性别信息,提高了识别效率,识别效果更加准确。
附图说明
16.为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1为本发明实施例提供的基于深度学习的人脸及属性识别方法的流程示意图;
18.图2为本发明实施例提供的基于深度学习的人脸及属性识别系统的示意性框图。
具体实施方式
19.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施倒是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
20.应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
21.还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
22.还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
23.请参阅图1,图1为本发明实施例提供的一种基于深度学习的人脸及属性识别方法的流程示意图,该方法包括步骤s101~s104。
24.s101、获取摄像头拍摄的监控视频,截取所述监控视频的每一帧监控图像,并对每一帧监控图像进行人脸检测,得到每一帧监控图像中的人脸的人脸位置信息和人脸关键点信息,并根据人脸位置信息对所述人脸进行截取,得到初始人脸图像;
25.s102、根据人脸关键点信息计算所述初始人脸图像的人脸旋转角度,按照所述人脸旋转角度对所述初始人脸图像进行旋转,并对旋转后的初始人脸图像进行尺寸调整以及边缘处理,得到目标人脸图像;
26.s103、将所述目标人脸图像输入至人脸特征编码模型中进行特征编码,得到当前人脸特征向量,并将当前人脸特征向量与人脸库中的历史人脸特征向量进行比对,得到人脸归属信息;
27.s104、以及,将所述目标人脸图像输入至人脸属性识别模型中进行人脸属性识别,得到所述目标人脸图像中人脸的年龄信息和性别信息,并向外输出所述目标人脸图像的人脸归属信息、年龄信息和性别信息。
28.在本实施例中,对摄像头拍摄的监控视频内的每一帧监控图像进行人脸检测,得到每一帧监控图像中的所有人脸的人脸位置信息和人脸关键点信息,然后根据每个人脸对应的人脸位置信息截取每个人脸的初始人脸图像;对每个初始人脸图像按照人脸旋转角度进行旋转,并进行尺寸调整和边缘处理得到对应的目标人脸图像;将所述目标人脸图像分别输入至人脸特征编码模型和人脸属性识别模型进行特征编码以及人脸属性识别,得到所述目标人脸图像的的人脸归属信息、年龄信息和性别信息。
29.具体的,抓取usb摄像头拍摄的监控视频,并对每一帧监控图像进行截取并检测所述监控图像内是否存在人脸,若存在人脸则进一步监测人脸数量,并获取每个人脸的人脸位置信息和人脸关键点信息;其中,本实施例中的人脸关键点设置有五个,分别是左眼、右眼、鼻尖、左嘴角、右嘴角;然后根据每个人脸的人脸位置信息生成人脸框,并根据所述人脸框对人脸进行截取,得到该人脸对应的初始人脸图像;根据人脸关键点的左眼、右眼关键点信息判断人脸是否处于水平状态,如果未处于水平状态则会计算两眼与水平线之间的夹角θ,然后通过仿射变换将初始人脸图像围绕中心点顺时针旋转θ使两眼处于水平位置,并将人脸进行resize操作(即尺寸调整)将其尺寸固定在112*112大小,对边缘缺失部分使用padding(填充)进行补0操作,得到目标人脸图像;随后将目标人脸图像分别输入至人脸特征编码模型和人脸属性识别模型内分别进行特征编码和属性识别;在人脸特征编码模型中,目标人脸图像将会由112*112维度编码为128维度的编码向量,然后通过1:n的方式与人脸库中的向量进行比对,其中n为人脸库数量大小,通过计算人脸之间的余弦距离、余弦相似度以此来确定人脸归属信息;在人脸属性识别模型中,目标人脸图像进行归一化、标准化等操作,之后通过属性识别模型,输出当前人脸的年龄信息和性别信息。
30.本实施例采用1:n人脸库比对进行人脸识别,通过计算当前人脸的特征编码向量和人脸库人脸之间的余弦距离来实现判别人脸归属,计算公式如下所示:经化简可得distance=2(1-cos(a,b))。其中,cos(a,b)为两向量之间的余弦相似度,distance为最终的余弦距离。相对传统的欧式距离,采用余弦距离在高维度的向量中来计算人脸之间相似度的方式更加简单,计算量也更
小。最后,计算得到的n个距离数值distance中数值最小的将会索引到人脸库对应特征的标签,并且输出人脸归属信息,如“张三”、“李四”等。
31.在一实施例中,所述对每一帧监控图像进行人脸检测,得到每一帧监控图像中的人脸的人脸位置信息和人脸关键点信息,包括:
32.将每一帧监控图像输入至基于mobilenet网络的神经网络模型内对所述监控图像进行尺寸调整以及减均值操作,并利用人脸检测算法模型对所述监控图像进行人脸检测,得到所述监控图像中的人脸数量以及每个人脸对应的人脸位置信息和人脸关键点信息。
33.在本实施例中,基于mobilenet的主干网搭建神经网络模型,并对监控图像进行尺寸调整和减均值处理,并利用人脸检测算法模型对所述监控图像进行人脸检测,得到当前帧的监控图像中的人脸数量以及对应的人脸位置信息和人脸关键点信息。
34.具体的,基于mobilenet的主干网搭建神经网络模型,监控图像首先将会被resize为640*640尺寸的图像,然后进行减均值的操作,在r、g、b三个通道中分别减去[104,117,123]的均值,之后监控图像经过人脸检测算法模型进行人脸识别,输出当前帧监控图像中检测出来的人脸数量和每个人脸的人脸位置信息和人脸关键点信息。
[0035]
在一实施例中,所述将所述目标人脸图像输入至人脸特征编码模型中进行特征编码,得到当前人脸特征向量,包括:
[0036]
将所述目标人脸图像进行卷积处理,并输入至bn层中进行批标准化处理,并利用激活函数进行激活得到第一卷积结果;
[0037]
将所述第一卷积结果输入至残差网络模块内进行卷积处理,得到第二卷积结果;
[0038]
利用预先构建的降维映射矩阵对所述第二卷积结果进行降维处理,得到具有指定维度的当前人脸特征向量。
[0039]
在本实施例中,将所述目标人脸图像依次输入至卷积层、bn层,并利用激活函数进行激活,再继续输入至残差网络内进行卷积,最后利用预先构建的降维映射矩阵进行降维处理,从而得到具有指定维度的当前人脸特征向量。本实施例构建了25088*128的映射矩阵,将计算量缩减到:25088*128=3.2m,降低了75%的参数数量,减少了计算量,提高了运行速度。
[0040]
在一实施例中,所述将所述第一卷积结果输入至残差网络模块内进行卷积处理,得到第二卷积结果,包括:
[0041]
将所述第一卷积结果输入至前段残差网络单元内进行卷积处理,得到第一前段残差结果,并将所述第一前段残差结果输入至中段残差网络单元内进行卷积处理,得到第一中段残差结果,并将所述第一中段残差结果输入至后段残差网络单元内进行卷积处理,得到第一后段残差结果;
[0042]
将所述第一后段残差结果输入至前段残差网络单元内进行卷积处理,得到第二前段残差结果,并将所述第二前段残差结果输入至多个连续的中段残差网络单元内进行卷积处理,得到第二中段残差结果,并将所述第二中段残差结果输入至后段残差网络单元内进行卷积处理,得到第二后段残差结果;
[0043]
将所述第二后段残差结果输入至前段残差网络单元内进行卷积处理,得到第三前段残差结果,并将所述第三前段残差结果输入至多个连续的中段残差网络单元内进行卷积处理,得到第三中段残差结果,并将所述第三中段残差结果输入至后段残差网络单元内进
行卷积处理,得到第三后段残差结果;
[0044]
将所述第三后段残差结果输入至前段残差网络单元内进行卷积处理,得到第四前段残差结果,并将所述第四前段残差结果输入至中段残差网络单元内进行卷积处理,得到第四中段残差结果,并将所述第四中段残差结果输入至后段残差网络单元内进行卷积处理,得到第四后段残差结果。
[0045]
在本实施例中,所述残差网络模块包括第一残差单元、第二残差单元、第三残差单元和第四残差单元,所述第一残差单元、第二残差单元、第三残差单元和第四残差单元均包括有前段残差网络单元、中段残差网络单元和后段残差网络单元。其中,第一残差单元包括一个前段残差网络单元、一个中段残差网络单元和一个后段残差网络单元;第二残差单元包括一个前段残差网络单元、两个中段残差网络单元和一个后段残差网络单元;第三残差单元包括一个前段残差网络单元、四个中段残差网络单元和一个后段残差网络单元;第四残差单元包括一个前段残差网络单元、一个中段残差网络单元和一个后段残差网络单元。
[0046]
所述第一残差单元的处理过程为:将所述第一卷积结果输入至前段残差网络单元内进行卷积处理,得到第一前段残差结果,并将所述第一前段残差结果输入至中段残差网络单元内进行卷积处理,得到第一中段残差结果,并将所述第一中段残差结果输入至后段残差网络单元内进行卷积处理,得到第一后段残差结果;所述第二残差单元的处理过程为:将所述第一后段残差结果输入至前段残差网络单元内进行卷积处理,得到第二前段残差结果,并将所述第二前段残差结果输入至两个连续的中段残差网络单元内进行卷积处理,得到第二中段残差结果,并将所述第二中段残差结果输入至后段残差网络单元内进行卷积处理,得到第二后段残差结果;所述第三残差单元的处理过程为:将所述第二后段残差结果输入至前段残差网络单元内进行卷积处理,得到第三前段残差结果,并将所述第三前段残差结果输入至四个连续的中段残差网络单元内进行卷积处理,得到第三中段残差结果,并将所述第三中段残差结果输入至后段残差网络单元内进行卷积处理,得到第三后段残差结果;所述第四残差单元的处理过程为:将所述第三后段残差结果输入至前段残差网络单元内进行卷积处理,得到第四前段残差结果,并将所述第四前段残差结果输入至中段残差网络单元内进行卷积处理,得到第四中段残差结果,并将所述第四中段残差结果输入至后段残差网络单元内进行卷积处理,得到第四后段残差结果。
[0047]
本实施例中多次描述了将数据输入至前段残差网络单元、中段残差网络单元以及后段残差网络单元内进行卷积处理,并非重复将数据输入至相同的前段残差网络单元、中段残差网络单元以及后段残差网络单元内,而是指设置有多个相同结构的前段残差网络单元、中段残差网络单元以及后段残差网络单元,并按照上述顺序进行排列。
[0048]
在残差网络模块内采用了尺寸为3*3、步长为2的最大池化和尺寸为1*1,步长为1的卷积核连接的方式来构建前段残差网络单元、中段残差网络单元以及后段残差网络单元中的残差连接,避免了相对传统单纯使用步长为2,尺寸为1*1的卷积造成的局部信息丢失问题。
[0049]
在一实施例中,所述将所述第一卷积结果输入至前段残差网络单元内进行卷积处理,得到第一前段残差结果,包括:
[0050]
将所述第一卷积结果输入至卷积核为1
×
1的卷积层进行卷积处理,并将卷积结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第一前段卷积结果;
[0051]
将所述第一前段卷积结果输入至卷积核为3
×
3的卷积层进行卷积处理,并将卷积结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第二前段卷积结果;
[0052]
将所述第二前段卷积结果输入至卷积核为1
×
1的卷积层进行卷积处理,并将卷积结果输入至bn层中进行批标准化处理,得到第一批标准化处理结果,并将所述第一批标准化处理结果与所述第一卷积结果进行特征融合,得到第一前段残差结果。
[0053]
在本实施例中,先将第一卷积结果依次输入至卷积核为1
×
1的卷积层、bn层,并利用relu激活函数进行激活,得到第一前段卷积结果,然后再将第一前段卷积结果继续输入至卷积核为3
×
3的卷积层、bn层,并利用relu激活函数进行激活,得到第二前段卷积结果,最后将第二前段卷积结果输入至卷积核为1
×
1的卷积层以及bn层进行处理,得到第一批标准化处理结果,将第一批标准化处理结果与第一卷积结果进行特征相融处理,得到第一前段残差结果。
[0054]
在一实施例中,所述将所述第一前段残差结果输入至中段残差网络单元内进行卷积处理,得到第一中段残差结果,包括:
[0055]
将所述第一前段残差结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第一中段卷积结果;
[0056]
将所述第一中段卷积结果输入至卷积核为1
×
1的卷积层进行卷积处理,并将卷积结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第二中段卷积结果;
[0057]
将所述第二中段卷积结果输入至卷积核为3
×
3的卷积层进行卷积处理,并将卷积结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第三中段卷积结果;
[0058]
将所述第三中段卷积结果输入至卷积核为1
×
1的卷积层进行卷积处理,并将卷积结果与所述第一前段残差结果进行特征融合,得到第一中段残差结果。
[0059]
在本实施例中,先将第一前段残差结果输入至bn层中进行批标准化处理,利用relu激活函数进行激活,得到第一中段卷积结果,然后将第一中段卷积结果输入至卷积核为1
×
1的卷积层、bn层,并利用relu激活函数进行激活,得到第二中段卷积结果,然后再将第二中段卷积结果继续输入至卷积核为3
×
3的卷积层、bn层,并利用relu激活函数进行激活,得到第三中段卷积结果,最后将第三中段卷积结果输入至卷积核为1
×
1的卷积层内进行卷积,并将卷积结果与第一前段残差结果进行特征相融处理,得到第一中段残差结果。
[0060]
本实施例中,若设置有多个连续的中段残差网络单元,则在第一个中段残差网络单元中,先输入至bn层内进行批标准化处理,剩余的中段残差网络单元中,则将该bn层删除,直接利用relu激活函数进行激活。
[0061]
在一实施例中,所述将所述第一中段残差结果输入至后段残差网络单元内进行卷积处理,得到第一后段残差结果,包括:
[0062]
将所述第一中段残差结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第一后段卷积结果;
[0063]
将所述第一后段卷积结果输入至卷积核为1
×
1的卷积层进行卷积处理,并将卷积结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第二后段卷积
结果;
[0064]
将所述第二后段卷积结果输入至卷积核为3
×
3的卷积层进行卷积处理,并将卷积结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第三后段卷积结果;
[0065]
将所述第三后段卷积结果输入至卷积核为1
×
1的卷积层进行卷积处理,并将卷积结果与所述第一中段残差结果进行特征融合,并将特征融合结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第一后段残差结果。
[0066]
在本实施例中,先将第一中段残差结果输入至bn层中进行批标准化处理,利用relu激活函数进行激活,得到第一后段卷积结果,然后将第一后段卷积结果输入至卷积核为1
×
1的卷积层、bn层,并利用relu激活函数进行激活,得到第二后段卷积结果,然后再将第二后段卷积结果继续输入至卷积核为3
×
3的卷积层、bn层,并利用relu激活函数进行激活,得到第三后段卷积结果,最后将第三后段卷积结果输入至卷积核为1
×
1的卷积层内进行卷积,并将卷积结果与第一前段残差结果进行特征相融处理,并将特征相融结果输入至bn层中进行批标准化处理,最后利用relu激活函数进行激活,得到第一后段残差结果。
[0067]
在一实施例中,所述将所述目标人脸图像输入至人脸属性识别模型中进行人脸属性识别,得到所述目标人脸图像中人脸的年龄信息和性别信息,包括:
[0068]
将所述目标人脸图像的每个像素进行归一化处理使每个像素处于[0,1]之间;
[0069]
为所述目标人脸图像的每个像素通道设置对应的标准化均值系数和方差系数,以对所述目标人脸图像进行标准化处理;
[0070]
将标准化处理后的目标人脸图像输入至shufflenet分类型神经网络内进行特征编码,得到对应的目标特征向量,根据预先构建的分量映射矩阵对所述目标特征向量进行分类,得到年龄信息和性别信息。
[0071]
在本实施例中,将所述目标人脸图像进行归一化处理,即将所述目标人脸图像的每个像素由int类型转换为float类型,并缩小255倍,使每个像素处于[0,1]之间,然后再进行标准化处理,并输入至shufflenet分类型神经网络内进行特征编码,得到对应的目标特征向量,根据预先构建的分量映射矩阵对所述目标特征向量进行分类,得到年龄信息和性别信息。
[0072]
所述标准化处理的具体过程为:分别对图像的rgb三个通道进行处理,并且设定通道1标准化均值系数为0.485,方差系数为0.229;通道2的均值系数为0.456,方差系数为0.224;通道3的均值系数为0.406,方差系数为0.225;
[0073]
在经过归一化和标准化处理后,重新构建的图像矩阵将会经过shufflenet分类型神经网络,将图像矩阵编码为1024维度的特征向量,根据预先构建的1024*2的映射矩阵,将该特征向量进行分类,第一类输出为性别信息(男/女),第二类为年龄信息(0-100岁)。
[0074]
请参阅图2,图2为本发明实施例提供的一种基于深度学习的人脸及属性识别系统的示意性框图,该基于深度学习的人脸及属性识别系统200包括:
[0075]
初始人脸图像获取单元201,用于获取摄像头拍摄的监控视频,截取所述监控视频的每一帧监控图像,并对每一帧监控图像进行人脸检测,得到每一帧监控图像中的人脸的人脸位置信息和人脸关键点信息,并根据人脸位置信息对所述人脸进行截取,得到初始人脸图像;
[0076]
目标人脸图像获取单元202,用于根据人脸关键点信息计算所述初始人脸图像的人脸旋转角度,按照所述人脸旋转角度对所述初始人脸图像进行旋转,并对旋转后的初始人脸图像进行尺寸调整以及边缘处理,得到目标人脸图像;
[0077]
人脸归属信息获取单元203,用于将所述目标人脸图像输入至人脸特征编码模型中进行特征编码,得到当前人脸特征向量,并将当前人脸特征向量与人脸库中的历史人脸特征向量进行比对,得到人脸归属信息;
[0078]
人脸属性获取单元204,用于将所述目标人脸图像输入至人脸属性识别模型中进行人脸属性识别,得到所述目标人脸图像中人脸的年龄信息和性别信息,并向外输出所述目标人脸图像的人脸归属信息、年龄信息和性别信息。
[0079]
在一实施例中,所述初始人脸图像获取单元201,包括:
[0080]
人脸信息获取单元,用于将每一帧监控图像输入至基于mobilenet网络的神经网络模型内对所述监控图像进行尺寸调整以及减均值操作,并利用人脸检测算法模型对所述监控图像进行人脸检测,得到所述监控图像中的人脸数量以及每个人脸对应的人脸位置信息和人脸关键点信息。
[0081]
在一实施例中,所述人脸归属信息获取单元203,包括:
[0082]
第一卷积结果获取单元,用于将所述目标人脸图像进行卷积处理,并输入至bn层中进行批标准化处理,并利用激活函数进行激活得到第一卷积结果;
[0083]
残差网络模块处理单元,用于将所述第一卷积结果输入至残差网络模块内进行卷积处理,得到第二卷积结果;
[0084]
当前人脸特征向量获取单元,用于利用预先构建的降维映射矩阵对所述第二卷积结果进行降维处理,得到具有指定维度的当前人脸特征向量。
[0085]
在一实施例中,所述残差网络模块处理单元,包括:
[0086]
第一残差处理单元,用于将所述第一卷积结果输入至前段残差网络单元内进行卷积处理,得到第一前段残差结果,并将所述第一前段残差结果输入至中段残差网络单元内进行卷积处理,得到第一中段残差结果,并将所述第一中段残差结果输入至后段残差网络单元内进行卷积处理,得到第一后段残差结果;
[0087]
第二残差处理单元,用于将所述第一后段残差结果输入至前段残差网络单元内进行卷积处理,得到第二前段残差结果,并将所述第二前段残差结果输入至多个连续的中段残差网络单元内进行卷积处理,得到第二中段残差结果,并将所述第二中段残差结果输入至后段残差网络单元内进行卷积处理,得到第二后段残差结果;
[0088]
第三残差处理单元,用于将所述第二后段残差结果输入至前段残差网络单元内进行卷积处理,得到第三前段残差结果,并将所述第三前段残差结果输入至多个连续的中段残差网络单元内进行卷积处理,得到第三中段残差结果,并将所述第三中段残差结果输入至后段残差网络单元内进行卷积处理,得到第三后段残差结果;
[0089]
第四残差处理单元,用于将所述第三后段残差结果输入至前段残差网络单元内进行卷积处理,得到第四前段残差结果,并将所述第四前段残差结果输入至中段残差网络单元内进行卷积处理,得到第四中段残差结果,并将所述第四中段残差结果输入至后段残差网络单元内进行卷积处理,得到第四后段残差结果。
[0090]
在一实施例中,所述第一残差处理单元,包括:
[0091]
第一前段卷积结果获取单元,用于将所述第一卷积结果输入至卷积核为1
×
1的卷积层进行卷积处理,并将卷积结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第一前段卷积结果;
[0092]
第二前段卷积结果获取单元,用于将所述第一前段卷积结果输入至卷积核为3
×
3的卷积层进行卷积处理,并将卷积结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第二前段卷积结果;
[0093]
第一前段残差结果获取单元,用于将所述第二前段卷积结果输入至卷积核为1
×
1的卷积层进行卷积处理,并将卷积结果输入至bn层中进行批标准化处理,得到第一批标准化处理结果,并将所述第一批标准化处理结果与所述第一卷积结果进行特征融合,得到第一前段残差结果。
[0094]
在一实施例中,所述第一残差处理单元,包括:
[0095]
第一中段卷积结果获取单元,用于将所述第一前段残差结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第一中段卷积结果;
[0096]
第二中段卷积结果获取单元,用于将所述第一中段卷积结果输入至卷积核为1
×
1的卷积层进行卷积处理,并将卷积结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第二中段卷积结果;
[0097]
第三中段卷积结果获取单元,用于将所述第二中段卷积结果输入至卷积核为3
×
3的卷积层进行卷积处理,并将卷积结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第三中段卷积结果;
[0098]
第一中段残差结果获取单元,用于将所述第三中段卷积结果输入至卷积核为1
×
1的卷积层进行卷积处理,并将卷积结果与所述第一前段残差结果进行特征融合,得到第一中段残差结果。
[0099]
在一实施例中,所述第一残差处理单元,包括:
[0100]
第一后段卷积结果获取单元,用于将所述第一中段残差结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第一后段卷积结果;
[0101]
第二后段卷积结果获取单元,用于将所述第一后段卷积结果输入至卷积核为1
×
1的卷积层进行卷积处理,并将卷积结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第二后段卷积结果;
[0102]
第三后段卷积结果获取单元,用于将所述第二后段卷积结果输入至卷积核为3
×
3的卷积层进行卷积处理,并将卷积结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第三后段卷积结果;
[0103]
第一后段残差结果获取单元,用于将所述第三后段卷积结果输入至卷积核为1
×
1的卷积层进行卷积处理,并将卷积结果与所述第一中段残差结果进行特征融合,并将特征融合结果输入至bn层中进行批标准化处理,并利用relu激活函数进行激活,得到第一后段残差结果。
[0104]
在一实施例中,所述人脸属性获取单元204,包括:
[0105]
归一化处理单元,用于将所述目标人脸图像的每个像素进行归一化处理使每个像素处于[0,1]之间;
[0106]
标准化处理单元,用于为所述目标人脸图像的每个像素通道设置对应的标准化均
值系数和方差系数,以对所述目标人脸图像进行标准化处理;
[0107]
年龄及性别获取单元,用于将标准化处理后的目标人脸图像输入至shufflenet分类型神经网络内进行特征编码,得到对应的目标特征向量,根据预先构建的分量映射矩阵对所述目标特征向量进行分类,得到年龄信息和性别信息。
[0108]
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的基于深度学习的人脸及属性识别方法。
[0109]
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
[0110]
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。