一种用于脸部分类的方法和装置与流程

文档序号:16899304发布日期:2019-02-19 17:48阅读:246来源:国知局
一种用于脸部分类的方法和装置与流程

本发明涉及一种图像处理方法,具体地,涉及一种用于脸部分类的方法和装置。



背景技术:

随着对深度学习技术研究的深入,越来越多依托深度学习技术开发的产品渐渐走向我们的生活。以脸部识别,脸部检测为代表的技术在各类用户终端中被广泛的应用。特别是近年来对于脸部属性方面的研究,更凸显了深度学习相较传统方法的优越。

现有的智能相册的主页界面大多比较直观,通过导航栏,可以选择采用时间、人物和地图的方式对相册进行浏览,同时文件夹上可以显示图片的数量,使得相册管理清晰简单。

但是,目前还没有通过脸部图像的内容,分析脸部属性,按照脸部属性,如年龄、性别、种族,自动对脸部图像进行分类的方法。



技术实现要素:

本发明提供的一种用于脸部分类的方法和装置,能够有效的解决目前缺乏通过脸部图像的内容,分析脸部属性,按照脸部属性自动对脸部图像进行分类的问题。

根据本发明的第一方面,提供一种用于脸部分类的方法,该方法包括:

获取目标脸部的彩色图像,所述彩色图像包括至少一个通道的信息,将所述目标脸部的彩色图像的至少一个通道的信息输入神经网络,所述神经网络根据所述目标脸部的彩色图像的至少一个通道的信息以及第一参数对所述目标脸部进行分类,所述第一参数包括至少一个脸部类别以及用于识别所述目标脸部类别的第一参数数据。

根据本发明的第一方面,在本发明的第一方面的第一可执行方式中,所述方法还包括:根据所述对所述目标脸部进行分类的结果,将所述目标脸部的彩色图像放入至少一个相应的文件夹。

根据本发明的第一方面或本发明的第一方面的第一可执行方式,在本发明的第一方面的第二可执行方式中,所述目标脸部的彩色图像的至少一个通道的信息包括目标脸部的rgb格式的彩色图像的三个通道的信息,或,目标脸部的yuv格式的彩色图像的三个通道的信息。

根据本发明的第一方面、本发明的第一方面的第一可执行方式或第二可执行方式,在本发明的第一方面的第三可执行方式中,在所述将所述目标脸部的彩色图像的至少一个通道的信息输入神经网络之前,所述方法还包括:根据下述参数中的至少一个确定所述目标脸部的彩色图像合格:俯仰角、偏航角、翻滚角、尺寸以及光照条件。

根据本发明的第一方面的第三可执行方式,在本发明的第一方面的第四可执行方式中,所述根据下述参数中的至少一个确定所述目标脸部的彩色图像合格:俯仰角、偏航角、翻滚角、尺寸以及光照条件,包括:根据下述参数中的至少一个确定所述目标脸部的彩色图像合格:所述俯仰角小于或等于第一角度,所述偏航角小于或等于第二角度,所述翻滚角小于或等于第三角度,所述目标脸部的彩色图像的像素数大于或等于第一阈值,以及,光照强度大于或等于第二阈值。

根据本发明的第一方面、或本发明的第一方面的第一可执行方式到本发明的第一方面的第四可执行方式中任一可执行方式,在本发明的第一方面的第五可执行方式中,在所述将所述目标脸部的彩色图像的至少一个通道的信息输入神经网络之前,所述方法还包括:对所述目标脸部的彩色图像的至少一个通道的信息进行相同的第一处理,所述第一处理包括下述中的至少一个:确定所述目标脸部的彩色图像的至少一个通道的信息的特征点,以所述特征点为基准对所述目标脸部的彩色图像的至少一个通道的信息进行旋转;对所述目标脸部的彩色图像的至少一个通道的信息进行镜像处理、线性变换以及仿射变换;将所述目标脸部的彩色图像的至少一个通道的信息的特征点对齐设定的位置;对所述目标脸部的彩色图像的至少一个通道的信息进行图像的灰度拉伸;以及,对所述目标脸部的彩色图像的至少一个通道的信息进行图像像素值归一化处理。

根据本发明的第一方面的第五可执行方式,在本发明的第一方面的第六可执行方式中,所述对所述目标脸部的彩色图像的至少一个通道的信息进行图像像素值归一化处理,包括:将所述目标脸部的彩色图像的至少一个通道的信息的像素值由[0,255]归一化到[0,1]。

根据本发明的第一方面或本发明的第一方面的第一可执行方式到第六可执行方式中任一可执行方式,在本发明的第一方面的第七可执行方式中,所述用于识别所述目标脸部类别的第一参数数据由多个脸部样本的彩色图像通过所述神经网络训练得到;所述脸部样本的彩色图像包括:所述脸部样本的彩色图像的至少一个通道的信息。

根据本发明的第一方面的第七可执行方式,在本发明的第一方面的第八可执行方式中,在所述多个脸部样本的彩色图像由所述神经网络训练之前,所述方法还包括:对所述脸部样本的彩色图像的至少一个通道的信息进行相同的第二处理,所述第二处理包括下述中的至少一个:确定所述脸部样本的彩色图像的至少一个通道的信息的特征点,以所述特征点为基准对所述脸部样本的彩色图像的至少一个通道的信息进行旋转;对所述脸部样本的彩色图像的至少一个通道的信息进行镜像处理、线性变换以及仿射变换;将所述脸部样本的彩色图像的至少一个通道的信息的特征点对齐所述设定的位置;对所述脸部样本的彩色图像的至少一个通道的信息进行图像的灰度拉伸;以及,对所述脸部样本的彩色图像的至少一个通道的信息进行图像像素值归一化处理。

根据本发明的第一方面的第八可执行方式,在本发明的第一方面的第九可执行方式中,所述对所述脸部样本的彩色图像的至少一个通道的信息进行图像像素值归一化处理,包括:将对所述脸部样本的彩色图像的至少一个通道的信息的像素值由[0,255]归一化到[0,1]。

根据本发明的第一方面的第七可执行方式到第九可执行方式中的任一可执行方式,在本发明的第一方面的第十可执行方式中,所述脸部样本带有下述脸部类别中的至少一个:性别、人种、年龄范围以及年龄值;所述脸部样本以及所述脸部样本的彩色图像的至少一个通道的信息分别带有同样的所述脸部类别。

根据本发明的第一方面的第十可执行方式,在本发明的第一方面的第十一可执行方式中,所述神经网络还包括所述脸部样本带有的分别对应所述不同脸部类别的代价函数;所述神经网络还包括第一代价函数,所述第一代价函数包括所述对应所述不同脸部类别的代价函数的加权和。

根据本发明的第一方面以及本发明的第一方面的第一可执行方式到第十一可执行方式中任一可执行方式,在本发明的第一方面的第十二可执行方式中,所述神经网络包括的脸部类别包括下述的至少一个:性别、人种、年龄范围以及年龄值。

根据本发明的第一方面的第五可执行方式到第十二可执行方式中任一可执行方式,在本发明的第一方面的第十三可执行方式中,所述特征点为眼睛点。

根据本发明的第一方面或本发明的第一方面的第一可执行方式到第十三可执行方式中任一可执行方式,在本发明的第一方面的第十四可执行方式中,所述神经网络包括卷积神经网络。

根据本发明的第一方面的第十四可执行方式,在本发明的第一方面的第十五可执行方式中,所述卷积神经网络包括输入层,3个小组层,2个全连接层以及4个输出层;所述小组层包括卷积层,激活层,下采样层。

根据本发明的第一方面的第七可执行方式到第十五可执行方式中任一可执行方式,在本发明的第一方面的第十六可执行方式中,所述脸部样本的彩色图像的至少一个通道的信息为脸部样本的rgb格式的彩色图像的三个通道的信息,或,脸部样本的yuv格式的彩色图像的三个通道的信息。

根据本发明的第二方面,提供了一种用于脸部分类的装置,所述装置包括:获取模块,用于获取目标脸部的彩色图像,所述彩色图像包括至少一个通道的信息;输入模块,用于将所述目标脸部的彩色图像的至少一个通道的信息输入神经网络;神经网络,用于根据所述目标脸部的彩色图像的至少一个通道的信息以及第一参数对所述目标脸部进行分类,所述第一参数包括至少一个脸部类别以及用于识别所述目标脸部类别的第一参数数据。

根据本发明的第二方面,在本发明的第二方面的第一可执行方式中,所述装置还包括图像分类放置模块,所述图像分类放置模块,用于根据所述对所述目标脸部进行分类的结果,将所述目标脸部的彩色图像放入至少一个相应的文件夹。

根据本发明的第二方面的第一可执行方式,在本发明的第二方面的第二可执行方式中,所述目标脸部的彩色图像的至少一个通道的信息包括目标脸部的rgb格式的彩色图像的三个通道的信息,或,目标脸部的yuv格式的彩色图像的三个通道的信息。

根据本发明的第二方面,以及本发明的第二方面的第一可执行方式或第二可执行方式,在本发明的第二方面的第三可执行方式中,所述装置还包括图像合格判定模块,所述图像合格判定模块,用于在所述输入模块将所述目标脸部的彩色图像的至少一个通道的信息输入神经网络之前,根据下述参数中的至少一个确定所述目标脸部的彩色图像合格:俯仰角、偏航角、翻滚角、尺寸以及光照条件。

根据本发明的第二方面,以及本发明的第二方面的第一可执行方式到第三可执行方式,在本发明的第二方面的第四可执行方式中,所述图像合格判定模块,具体用于根据下述参数中的至少一个确定所述目标脸部的彩色图像合格:所述俯仰角小于或等于第一角度;所述偏航角小于或等于第二角度;所述翻滚角小于或等于第三角度;所述目标脸部的彩色图像的像素数大于或等于第一阈值;以及,光照强度大于或等于第二阈值。

根据本发明的第二方面,以及本发明的第二方面的第一可执行方式到第四可执行方式,在本发明的第二方面的第五可执行方式中,所述装置还包括第一处理模块,所述第一处理模块,用于在所述输入模块将所述目标脸部的彩色图像的至少一个通道的信息输入所述神经网络之前,对所述目标脸部的彩色图像的至少一个通道的信息进行相同的第一处理,所述第一处理模块包括下述子模块中的至少一个:第一旋转子模块,第一变换子模块,第一对齐子模块,第一灰度拉伸子模块,以及第一归一化处理子模块;所述第一旋转子模块,用于确定所述目标脸部的彩色图像的至少一个通道的信息的特征点,以所述特征点为基准对所述目标脸部的彩色图像的至少一个通道的信息进行旋转;所述第一变换子模块,用于对所述目标脸部的彩色图像的至少一个通道的信息进行镜像处理、线性变换以及仿射变换;所述第一对齐子模块,用于将所述目标脸部的彩色图像的至少一个通道的信息的特征点对齐设定的位置;所述第一灰度拉伸子模块,用于对所述目标脸部的彩色图像的至少一个通道的信息进行图像的灰度拉伸;以及,所述第一归一化处理子模块,用于对所述目标脸部的彩色图像的至少一个通道的信息进行图像像素值归一化处理。

根据本发明的第二方面的第五可执行方式,在本发明的第二方面的第六可执行方式中,所述第一归一化处理子模块,具体用于将所述目标脸部的彩色图像的至少一个通道的信息的像素值由[0,255]归一化到[0,1]。

据本发明的第二方面,以及本发明的第二方面的第一可执行方式到第六可执行方式,在本发明的第二方面的第七可执行方式中,所述用于识别所述目标脸部类别的第一参数数据由多个脸部样本的彩色图像通过所述神经网络训练得到;所述脸部样本的彩色图像包括:所述脸部样本的彩色图像的至少一个通道的信息。

根据本发明的第二方面的第七可执行方式,在本发明的第二方面的第八可执行方式中,所述装置还包括第二处理模块,所述第二处理模块,用于在所述神经网络训练所述多个脸部样本的彩色图像之前,对所述脸部样本的彩色图像的至少一个通道的信息进行相同的第二处理,所述第二处理模块包括下述子模块中的至少一个:第二旋转子模块,第二变换子模块,第二对齐子模块,第二灰度拉伸子模块,以及第二归一化处理子模块;所述第二旋转子模块,用于确定所述脸部样本的彩色图像的至少一个通道的信息的特征点,以所述特征点为基准对所述脸部样本的彩色图像的至少一个通道的信息进行旋转;所述第二变换子模块,用于对所述脸部样本的彩色图像的至少一个通道的信息进行镜像处理、线性变换以及仿射变换;所述第二对齐子模块,用于将所述脸部样本的彩色图像的至少一个通道的信息的特征点对齐所述设定的位置;所述第二灰度拉伸子模块,用于对所述脸部样本的彩色图像的至少一个通道的信息进行图像的灰度拉伸;以及,所述第二归一化处理子模块,用于对所述脸部样本的彩色图像的至少一个通道的信息进行图像像素值归一化处理。

根据本发明的第二方面的第八可执行方式,在本发明的第二方面的第九可执行方式中,所述第二归一化处理子模块,具体用于将对所述脸部样本的彩色图像的至少一个通道的信息的像素值由[0,255]归一化到[0,1]。

根据本发明的第二方面的第七可执行方式到第九可执行方式中任一可执行方式,在本发明的第二方面的第十可执行方式中,所述脸部样本带有下述脸部类别中的至少一个:性别、人种、年龄范围以及年龄值;所述脸部样本以及所述脸部样本的彩色图像的至少一个通道的信息分别带有同样的所述脸部类别。

根据本发明的第二方面的第七可执行方式到第十可执行方式中任一可执行方式,在本发明的第二方面的第十一可执行方式中,所述神经网络还包括所述脸部样本带有的分别对应所述不同脸部类别的代价函数;所述神经网络还包括第一代价函数,所述第一代价函数包括所述对应所述不同脸部类别的代价函数的加权和。

根据本发明的第二方面的第十可执行方式到第十一可执行方式中任一可执行方式,在本发明的第二方面的第十二可执行方式中,所述神经网络包括的脸部类别包括下述的至少一个:性别、人种、年龄范围以及年龄值。

根据本发明的第二方面的第五可执行方式到第十二可执行方式中任一可执行方式,在本发明的第二方面的第十三可执行方式中,所述特征点为眼睛点。

根据本发明的第二方面,以及本发明的第二方面的第一可执行方式到第十三可执行方式中任一可执行方式,在本发明的第二方面的第十四可执行方式中,所述神经网络包括卷积神经网络。

根据本发明的第二方面的第十四可执行方式,在本发明的第二方面的第十五可执行方式中,所述卷积神经网络包括输入层,3个小组层,2个全连接层以及4个输出层;所述小组层包括卷积层,激活层,下采样层。

根据本发明的第二方面,以及本发明的第二方面的第一可执行方式到第十五可执行方式中任一可执行方式,在本发明的第二方面的第十六可执行方式中,所述脸部样本的彩色图像的至少一个通道的信息为脸部样本的rgb格式的彩色图像的至三个通道的信息,或,脸部样本的yuv格式的彩色图像的三个通道的信息。

根据本发明的第三方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被第一处理器执行时实现如本发明第一方面,或本发明第一方面的第一可执行方式到第十六可执行方式中任一可执行方式所述方法的步骤。

根据本发明的第四方面,提供一种用于脸部分类的装置,包括存储器、第二处理器以及存储在所述存储器中并可在所述第二处理器上运行的计算机程序,其特征在于,所述计算机程序被第二处理器执行时实现如本发明第一方面,或本发明第一方面的第一可执行方式到第十六可执行方式中任一可执行方式所述方法的步骤。

本发明提供的一种用于脸部分类的方法和装置,能够通过脸部图像的内容分析脸部属性,并有效的根据脸部图像的属性,对大量的包括脸部的图像自动进行分类,减少了人工分类劳动,使得对包括脸部的图像的存储更加清晰有序,提高了分类效率。

附图说明

图1为本发明实施例一提供的一种用于脸部分类的方法的流程图;

图2为本发明实施例二提供的又一种用于脸部分类的方法的流程图;

图3为本发明实施例三提供的一种用于脸部分类的装置结构示意图;

图4为本发明实施例四提供的一种用于脸部分类的装置结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行详细地描述。

本发明的说明书和权利要求书记忆上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于限定特定顺序。

其中,本发明实施例中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。

在本发明实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明实施例中被描述为“示例性的”或“例如”的任何实施例或设计方案不应该被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

应当说明的是,为了图示的简洁和清楚起见,附图中所示的元件没有必要按照比例进行绘制。例如,为了清楚,可以相对于其他元件,增大一些元件的尺寸。另外,在认为合适的地方,可以在附图间重复附图标记,以指示相对应或类似的元件针对这一问题。

应该说明的是,由于视频等是由若干图片组成,因此,本发明实施例中描述的关于图片、成像、图像等的处理方法可以应用于视频等方面,本领域技术人员根据本发明揭示的方法不需要付出创造性的劳动即可修改为应用于视频等的处理方法,这种修改后的方法在本发明的保护范围内。

本发明的各个实施例以人脸为例进行详细说明,本发明的技术方案同样也适用于不同客体的脸部分类,如不同动物的脸部分类,或是具有人脸类似特点的目标物体。

下面结合附图1具体阐述本发明实施例一提供的一种用于脸部分类的方法。如图1所示,该方法包括:

步骤101,获取目标脸部的彩色图像,所述彩色图像包括至少一个通道的信息。

可选的,该获取步骤可以为从存储器中获取摄像装置拍摄的目标脸部的彩色图像。

可选的,目标脸部的彩色图像的至少一个通道的信息包括目标脸部的rgb格式的彩色图像的三个通道,或,目标脸部的yuv格式的彩色图像的三个通道。

步骤102,将所述目标脸部的彩色图像的至少一个通道的信息输入神经网络。

可选的,输入该神经网络的可以为目标脸部的彩色图,输入该神经网络的还可以为目标脸部的彩色图像的rgb格式的三个通道,或目标脸部的彩色图像的yuv格式的三个通道。

可选的,上述的神经网络包括卷积神经网络,该卷积神经网络包括输入层,3个小组层,2个全连接层以及4个输出层,所述小组层包括卷积层,激活层,下采样层。

步骤103,所述神经网络根据所述目标脸部的彩色图像的至少一个通道的信息以及第一参数对所述目标脸部进行分类,所述第一参数包括至少一个脸部类别以及用于识别所述目标脸部类别的第一参数数据。所述彩色图像的至少一个通道输入到卷积神经网络后,得到多维输出向量,将所述多维输出向量,输入到所述神经网络的不同全连接层以及输出层,依次得到关于所述目标脸部类别的输出结果,如目标脸部的年龄,性别,种族等。

上述神经网络包括上述的第一参数,该第一参数包括的脸部类别包括下述的至少一个:性别、人种、年龄范围以及年龄值。可选的,在一个实施例中,上述的第一参数包括性别、人种、年龄范围以及年龄值,以及用于识别所述四种类别的第一参数数据。上述的参数性别的值可以为:男、女或不清楚,取值可以为0,1,2;人种的值可以为:白种人、黑种人、黄种人或不清楚,取值可以为0,1,2,3;年龄范围的值可以为:[0,5),[6,15),[16,25),[26,35),[36,48),[49,60),[60,+∞),取值可以为0,1,2,3,4,5,6;年龄值可以为大于等于0的任一整数。

可选的,在上述第一参数包括一个脸部类别的情况下,该神经网络可以用于判断上述的目标脸部是否是该第一参数包括的该脸部类别。

可选的,上述方法还包括:根据所述对所述目标脸部进行分类的结果,将所述目标脸部的彩色图像放入至少一个相应的文件夹。上述的至少一个的含义是可以将该目标脸部的彩色图像放入一个文件夹,也可以复制进多个表示相应属性的文件夹内。

示例性的,可以分别建立男、女两个文件夹,建立白种人、黑种人、黄种人三个文件夹,以及再分别建立对应上述7个年龄段的文件夹,如果某个目标脸部的彩色图像最后的分类结果是男性的白种人,年龄段是[36,48),年龄值是40,则可以将该目标脸部的彩色图像分别复制到表示男性、白种人、年龄段为[36,48)的三个文件夹内。在另一个实施例中,可以按照人种的差别分别建立黑种人、白种人、黄种人三个人种的文件夹,在每一个人种文件夹下面建立男、女两个文件夹,再分别男、女两个文件夹下面分别建立7个上述年龄段的子文件夹,如果某个目标脸部的彩色图像最后的分类结果是男性的白种人,年龄段是[36,48),年龄值是40,则可以将该目标脸部的彩色图像复制进白种人下面的男性下面的表示年龄段是[36,48)的文件夹内;也可以将该目标脸部的彩色图像复制进表示白种人的文件夹,也复制进白种人文件夹下面的表示男性的文件夹,也复制进白种人下面的男性下面的表示年龄段是[36,48)的文件夹内。

可选的,在所述将所述目标脸部的彩色图像的至少一个通道的信息输入神经网络之前,所述方法还包括:根据下述参数中的至少一个确定所述目标脸部的彩色图像合格:俯仰角、偏航角、翻滚角、尺寸以及光照条件。

所述根据下述参数中的至少一个确定所述目标脸部的彩色图像合格:俯仰角、偏航角、翻滚角、尺寸以及光照条件,包括:

根据下述参数中的至少一个确定所述目标脸部的彩色图像合格:所述俯仰角小于或等于第一角度,所述偏航角小于或等于第二角度,所述翻滚角小于或等于第三角度,所述目标脸部的彩色图像的像素数大于或等于第一阈值,以及,光照强度大于或等于第二阈值。示例性的,该第一角度可以为30°,该第二角度可以为30°,该第三角度可以为44°,该第一阈值可以为40x40pixels(像素),该第二阈值可以为5lux(勒克斯)。可选的,上述的第一角度和第二角度可以相同也可以不同。

所述目标脸部的彩色图像的像素数大于或等于第一阈值可以包括:所述目标脸部的彩色图像的像素总数大于或等于该第一阈值,或,所述目标脸部的彩色图像的水平像素数大于或等于该第一阈值,或,所述目标脸部的彩色图像的垂直像素数大于或等于该第一阈值。

可选的,当判定上述目标脸部的彩色图像不合格时,停止对该目标脸部的彩色图像的分类。当判断上述目标脸部的彩色图像合格时,可以进行下述的特征点定位以及第一处理步骤。

可选的,为应对获得的目标脸部姿态不理想或是光照条件不理想的情况,可以对目标脸部的彩色图像的至少一个通道进行相同的第一处理以近似达到标准脸部的要求,或使用的要求,具体地,如在所述将所述目标脸部的彩色图像的至少一个通道的信息输入神经网络之前,所述方法还包括:对所述目标脸部的彩色图像的至少一个通道的信息进行相同的第一处理,所述第一处理包括下述中的至少一个:确定所述目标脸部的彩色图像的至少一个通道的信息的特征点,以所述特征点为基准对所述目标脸部的彩色图像的至少一个通道的信息进行旋转;对所述目标脸部的彩色图像的至少一个通道的信息进行镜像处理、线性变换以及仿射变换;将所述目标脸部的彩色图像的至少一个通道的信息的特征点对齐设定的位置;对所述目标脸部的彩色图像的至少一个通道的信息进行图像的灰度拉伸;以及,对所述目标脸部的彩色图像的至少一个通道的信息进行图像像素值归一化处理。

示例性的,以上述的所述目标脸部的彩色图像为rgb格式为例,上述的对所述目标脸部的rgb格式的彩色图像的三个通道的信息进行相同的第一处理可以包括:对目标脸部的彩色图像的红通道信息,绿通道信息,以及蓝通道信息进行相同的线性变换、仿射变换以及灰度拉伸。可选的,上述的对所述目标脸部的彩色图像的三个通道的信息进行相同的第一处理可以包括:将所述目标脸部的彩色图像先分解为三个通道的信息再进行上述的第一处理,或是为先对所述目标脸部的彩色图像的整体进行上述的第一处理,再将处理后的彩色图像分解为三个通道的信息,再输入所述神经网络。

可选的,上述的特征点可以为眼睛点,还可以为鼻尖点等其他的脸部特征。上述将所述至少一个通道的信息的特征点对齐的设定的位置可以为某个标准脸部图像的特征点,如眼睛点,也可以为预先设定的位置,还可以为训练上述神经网络时输入的脸部样本统一对齐的特征点,如眼睛点。

可选的,上述的对所述至少一个通道的信息进行图像的灰度拉伸,可以包括根据目标脸部的彩色图像的特点,对所述目标脸部的彩色图像的至少一个通道的信息进行分段灰度拉伸。也可以包括根据所述目标脸部的至少一个通道的信息的像素值的大小,对所述像素值进行分段灰度拉伸。

可选的,所述对所述目标脸部的彩色图像的至少一个通道的信息进行图像像素值归一化处理,包括:将所述目标脸部的彩色图像各个通道的像素值由[0,255]归一化到[0,1]。上述的各个通道可以包括:目标脸部的彩色图像的rgb图的三个通道,或目标脸部的彩色图像的yuv格式的三个通道。

通常情况下,以人脸为例,摄像装置获取的目标人脸的彩色图像除了包括脸部以外还包括有脖子肩膀等冗余部位,需要通过人脸检测定位到人脸框位置,再将其扣取出来,再定位上述的脸部特征,如眼睛点,进而进行上述的第一处理,如仿射变换、旋转、对齐特征点等,以达到或近似达到标准脸部的要求,或使用的要求。上述的要求包括特征点位置,尺寸等,如可以与标准脸部或脸部样本的特征点的位置对齐,和/或与标准脸部或脸部样本的尺寸相同或类似。

可选的,上述用于识别所述目标脸部类别的第一参数数据由多个脸部样本的彩色图像通过所述神经网络训练得到,所述脸部样本的彩色图像包括:所述脸部样本的彩色图像的至少一个通道的信息。所述脸部样本的彩色图像的至少一个通道的信息为脸部样本的rgb格式的彩色图像的三个通道的信息,或,脸部样本的yuv格式的彩色图像的三个通道的信息。具体的,所述脸部样本的彩色图像为rgb格式,可以将该脸部样本的红、绿、蓝三个通道的信息输入上述神经网络,该神经网络使用梯度下降法和反向传播算法进行迭代以训练所述神经网络。可选的,所述脸部样本带有下述脸部类别中的至少一个:性别、人种、年龄范围以及年龄值,所述脸部样本以及所述脸部样本的彩色图像的至少一个通道的信息分别带有同样的所述脸部类别。上述神经网络可以通过上述的识别脸部样本的类别的迭代过程确定出识别脸部样本的类别准确率高的参数组合,如神经网络至少一个节点的权值,作为识别该目标脸部的类别的第一参数,该第一参数的具体内容可以参见上文。可选的,第一参数可以是在线下通过训练上述脸部样本得到的,提供实际使用的用于进行脸部类别识别的产品中可以不包括上述的脸部样本。

可选的,为应对获得的脸部样本姿态不理想或是光照条件不理想的情况,可以对脸部样本的彩色图像的至少一个通道进行相同的第二处理以近似达到标准脸部的要求或使用的要求,具体地,如在所述多个脸部样本的彩色图像由所述神经网络训练之前,所述方法还包括:对所述脸部样本的彩色图像的至少一个通道的信息进行相同的第二处理,所述第二处理包括下述中的至少一个:确定所述脸部样本的彩色图像的至少一个通道的信息的特征点,以所述特征点为基准对所述脸部样本的彩色图像的至少一个通道的信息进行旋转;对所述脸部样本的彩色图像的至少一个通道的信息进行镜像处理、线性变换以及仿射变换;将所述脸部样本的彩色图像的至少一个通道的信息的特征点对齐所述设定的位置;对所述脸部样本的彩色图像的至少一个通道的信息进行图像的灰度拉伸;以及,对所述脸部样本的彩色图像的至少一个通道的信息进行图像像素值归一化处理。上述的第二处理可以与第一处理相同,也可以不同。

示例性的,以所述脸部样本的彩色图像的格式为rgb格式为例,对所述脸部样本的彩色图像的至少一个通道的信息进行相同的第二处理可以包括:对上述脸部样本的彩色图像的红通道、绿通道以及蓝通道均进行相同参数上述的线性变换、仿射变换以及灰度拉伸。可选的,上述的对所述脸部样本的彩色图像的至少一个通道的信息进行相同的第二处理可以包括:对所述脸部样本的彩色图像的至少一个通道进行上述的第二处理,再将进行第二处理后的各个通道的信息输入神经网络进行训练;也可以先对所述脸部样本的彩色图像的整体图像进行上述第二处理,再分解为各个通道输入神经网络进行训练。

可选的,上述的特征点可以为眼睛点,还可以为鼻尖点等其他的脸部特征。上述将多个脸部样本的彩色图像的特征点对齐的设定的位置可以为某个标准脸部图像的特征点,如眼睛点,也可以为预先设定的位置,还可以为训练上述神经网络时输入的脸部样本统一对齐的特征点,如眼睛点。

可选的,上述的对所述脸部样本的彩色图像的至少一个通道进行图像的灰度拉伸,可以包括根据脸部样本的彩色图像的至少一个通道的特点,对所述脸部样本的彩色图像的至少一个通道进行分段灰度拉伸,也可以包括根据所述脸部样本的彩色图像的至少一个通道的像素值的大小,对所述像素值进行分段灰度拉伸。

可选的,对所述脸部样本的彩色图像的至少一个通道的信息进行图像像素值归一化处理,包括:将对所述脸部样本的彩色图像的至少一个通道的信息的像素值由[0,255]归一化到[0,1]。

在进行所述第二处理之前,还可以根据下述参数中的至少一个确定所述脸部样本的彩色图像合格:根据下述参数中的至少一个确定所述脸部样本的彩色图像合格:俯仰角、偏航角、翻滚角、尺寸以及光照条件。具体的,判断标准可以为:所述俯仰角小于或等于第一角度,所述偏航角小于或等于第二角度,所述翻滚角小于或等于第三角度,所述目标脸部的彩色图像的像素数大于或等于第一阈值,以及,光照强度大于或等于第二阈值。示例性的,该第一角度可以为30°,该第二角度可以为30°,该第三角度可以为44°,该第一阈值可以为40x40pixels(像素),该第二阈值可以为5lux(勒克斯)。

所述脸部样本的彩色图像的像素数大于或等于第一阈值可以包括:所述脸部样本的彩色图像的像素总数大于或等于该第一阈值,或,所述脸部样本的彩色图像的水平像素数大于或等于该第一阈值,或,所述脸部样本的彩色图像的垂直像素数大于或等于该第一阈值。

可选的,当判定上述脸部样本的彩色图像不合格时,停止将该脸部样本的彩色图像输入神经网络进行训练。可选的,上述的第一角度和第二角度可以相同也可以不同。当判断上述脸部样本的彩色图像合格时,可以进行下述的特征点定位以及上述的第二处理步骤。

通常情况下,以人脸为例,摄像装置获取的脸部样本的彩色图像除了包括脸部以外还包括有脖子肩膀等冗余部位,需要通过人脸检测定位到人脸框位置,再将其扣取出来,再定位上述的脸部特征,如眼睛点,进而进行上述的第二处理,如仿射变换、旋转、对齐特征点等,以达到或近似达到标准脸部的要求,或使用的要求。上述的要求包括特征点位置,尺寸等,如可以与某个脸部样本的特征点的位置对齐,和/或与标准脸部或脸部样本的尺寸相同或类似。

在使用卷积神经网络训练的过程中,使用梯度下降法和反向传播算法训练所述卷积神经网络,优化所述卷积神经网络中的各个参数。该卷积神经网络的结构是1个输入层、3个小组层、2个全连接层以及4个输出层。小组层包括卷积层,激活层,和下采样层。可选的,将经过上述第二处理的尺寸为60*60的脸部样本输入卷积神经网络。所述卷积层的激活函数选用relu函数。每个卷积层的输入与该层权重相乘之后,会得到一个数值,relu函数的原理就是,如果这个数值大于0,那么输出值就保存这个计算值,如果这个值小于0,那么输出值就置为0。当然,relu函数也可以换成其他的激活函数。全连接层也使用relu激活函数。输出层的作用是把全连接产生的实值变成[0,1]之间的概率。

在训练阶段,多个脸部样本中的每一个都将输入至卷积神经网络,并且计算输出以确定输出结果与期望的输出结果有多远。这个过程被称为“正向传递”forward。然后,根据输出结果与期望结果的差异,确定卷积神经网络的模型参数的误差度,根据误差修正模型参数,从而进行卷积神经网络学习,这个过程被称为“反向传递”backward。通过调整卷积神经网络中每层的权重值,使得卷积神经网络的输出值与实际脸部样本的脸部类别的值之间的差距越来越小,直到所述神经网络的输出值与脸部类别值一致或保持最小差距不再变化,则最终得到所需要的卷积神经网络以及其包括的第一参数。

可选的,所述神经网络还包括所述脸部样本带有的分别对应所述不同脸部类别的代价函数;所述神经网络还包括第一代价函数,所述第一代价函数包括所述对应所述不同脸部类别的代价函数的加权和。

代价函数(costfunction)需要输出的单个脸部类别值与脸部样本的类别值进行比较。在本发明中的神经网络,代价函数采用多个脸部类别值与脸部样本对应的类别分别比较,求出每个脸部类别的代价函数,再将多个脸部类别的代价函数加权,得到整体的代价函数,也就是从卷积神经网络代价函数上看,考虑到了每一种脸部类别,训练的目标是使得所有脸部类别的整体误差最低。这种方式支持各种不同脸部类别的组合。比如,年龄,性别,人种的代价函数分别为,l_age,l_gender,l_race,当需要输出年龄性别两种属性的时候,整体的代价函数为l_all=a*l_age+b*l_gender。当需要输出年龄、性别、人种三种属性的时候,整体的代价函数为l_all=a*l_age+b*l_gender+c*l_race,如果再加上年龄值的脸部类别,则整体的代价函数为l_all=a*l_age+b*l_gender+c*l_race+d*l_agevalue。

本发明提供的一种用于脸部分类的方法,能够通过脸部图像的内容分析脸部属性,并有效的根据脸部图像的属性,对大量的包括脸部的图像自动进行分类,减少了人工分类劳动,使得对包括脸部的图像的存储更加清晰有序,提高了分类效率。

下面结合图2具体阐述本发明实施例二提供的一种用于脸部分类的装置200。如图2所示,该装置200包括:

获取模块201,用于获取目标脸部的彩色图像,所述彩色图像包括至少一个通道的信息。

可选的,该获取模块201可以为从存储器中获取摄像装置拍摄的目标脸部的彩色图像。

可选的,目标脸部的彩色图像的至少一个通道的信息包括目标脸部的rgb格式的彩色图像的三个通道,或,目标脸部的yuv格式的彩色图像的三个通道。

输入模块202,用于将所述目标脸部的彩色图像的至少一个通道的信息输入神经网络203。

可选的,输入该神经网络的可以为目标脸部的彩色图,输入该神经网络的还可以为目标脸部的彩色图像的rgb格式的三个通道,或目标脸部的彩色图像的yuv格式的三个通道。

可选的,上述的神经网络203包括卷积神经网络,该卷积神经网络包括输入层,3个小组层,2个全连接层以及4个输出层,所述小组层包括卷积层,激活层,下采样层。

神经网络203,用于根据所述目标脸部的彩色图像的至少一个通道的信息以及第一参数对所述目标脸部进行分类,所述第一参数包括至少一个脸部类别以及用于识别所述目标脸部类别的第一参数数据。所述彩色图像的至少一个通道输入到卷积神经网络后,得到多维输出向量,将所述多维输出向量,输入到所述卷积神经网络的不同全连接层以及输出层,依次得到关于所述目标脸部类别的输出结果,如目标脸部的年龄,性别,种族等。

上述神经网络203包括上述的第一参数,该第一参数包括的脸部类别包括下述的至少一个:性别、人种、年龄范围以及年龄值。可选的,在一个实施例中,上述的第一参数包括性别、人种、年龄范围以及年龄值,以及用于识别所述四种脸部类别的第一参数数据。上述的参数性别的值可以为:男、女或不清楚,取值可以为0,1,2;人种的值可以为:白种人、黑种人、黄种人或不清楚,取值可以为0,1,2,3;年龄范围的值可以为:[0,5),[6,15),[16,25),[26,35),[36,48),[49,60),[60,+∞),取值可以为0,1,2,3,4,5,6;年龄值可以为大于等于0的任一整数。

可选的,在上述第一参数包括一个脸部类别的情况下,该神经网络203可以用于判断上述的目标脸部是否是该第一参数包括的该脸部类别。

可选的,所述装置还包括图像分类放置模块,所述图像分类放置模块,用于根据所述对所述目标脸部进行分类的结果,将所述目标脸部的彩色图像放入至少一个相应的文件夹。上述的至少一个的含义是图像分类放置模块可以将该目标脸部的彩色图像放入一个文件夹,也可以复制进多个表示相应属性的文件夹内。

示例性的,可以分别建立男、女两个文件夹,建立白种人、黑种人、黄种人三个文件夹,以及再分别建立对应上述7个年龄段的文件夹,如果某个目标脸部的彩色图像最后的分类结果是男性的白种人,年龄段是[36,48),年龄值是40,则可以将该目标脸部的彩色图像分别复制到表示男性、白种人、年龄段为[36,48)的三个文件夹内。在另一个实施例中,可以按照人种的差别分别建立黑种人、白种人、黄种人三个人种的文件夹,在每一个人种文件夹下面建立男、女两个文件夹,再分别男、女两个文件夹下面分别建立7个上述年龄段的子文件夹,如果某个目标脸部的彩色图像最后的分类结果是男性的白种人,年龄段是[36,48),年龄值是40,则可以将该目标脸部的彩色图像复制进白种人下面的男性下面的表示年龄段是[36,48)的文件夹内;也可以将该目标脸部的彩色图像复制进表示白种人的文件夹,也复制进白种人文件夹下面的表示男性的文件夹,也复制进白种人下面的男性下面的表示年龄段是[36,48)的文件夹内。

可选的,所述装置还包括图像合格判定模块,所述图像合格判定模块,用于在所述输入模块将所述目标脸部的彩色图像的至少一个通道的信息输入神经网络之前,根据下述参数中的至少一个确定所述目标脸部的彩色图像合格:俯仰角、偏航角、翻滚角、尺寸以及光照条件。

所述图像合格判定模块,具体用于根据下述参数中的至少一个确定所述目标脸部的彩色图像合格:所述俯仰角小于或等于第一角度;所述偏航角小于或等于第二角度;所述翻滚角小于或等于第三角度;所述目标脸部的彩色图像的像素数大于或等于第一阈值;以及,光照强度大于或等于第二阈值。示例性的,该第一角度可以为30°,该第二角度可以为30°,该第三角度可以为44°,该第一阈值可以为40x40pixels(像素),该第二阈值可以为5lux(勒克斯)。

所述目标脸部的彩色图像的像素数大于或等于第一阈值可以包括:所述目标脸部的彩色图像的像素总数大于或等于该第一阈值,或,所述目标脸部的彩色图像的水平像素数大于或等于该第一阈值,或,所述目标脸部的彩色图像的垂直像素数大于或等于该第一阈值。

可选的,当图像合格判定模块判定上述目标脸部的彩色图像不合格时,停止对该目标脸部的彩色图像的分类。当图像合格判定模块判断上述目标脸部的彩色图像合格时,可以进行下述的特征点定位以及第一处理步骤。

可选的,为应对获得的目标脸部姿态不理想或是光照条件不理想的情况,可以对目标脸部的彩色图像的至少一个通道进行相同的第一处理以近似达到标准脸部的要求,或使用的要求,具体地,如所述装置还包括第一处理模块,所述第一处理模块,用于在所述输入模块将所述目标脸部的彩色图像的至少一个通道的信息输入所述神经网络之前,对所述目标脸部的彩色图像的至少一个通道的信息进行相同的第一处理,所述第一处理模块包括下述子模块中的至少一个:第一旋转子模块,第一变换子模块,第一对齐子模块,第一灰度拉伸子模块,以及第一归一化处理子模块;

所述第一旋转子模块,用于确定所述目标脸部的彩色图像的至少一个通道的信息的特征点,以所述特征点为基准对所述目标脸部的彩色图像的至少一个通道的信息进行旋转;所述第一变换子模块,用于对所述目标脸部的彩色图像的至少一个通道的信息进行镜像处理、线性变换以及仿射变换;所述第一对齐子模块,用于将所述目标脸部的彩色图像的至少一个通道的信息的特征点对齐设定的位置;所述第一灰度拉伸子模块,用于对所述目标脸部的彩色图像的至少一个通道的信息进行图像的灰度拉伸;以及,所述第一归一化处理子模块,用于对所述目标脸部的彩色图像的至少一个通道的信息进行图像像素值归一化处理。

示例性的,以上述的所述目标脸部的彩色图像为rgb格式为例,上述的第一处理模块具体可以用于对目标脸部的彩色图像的红通道信息,绿通道信息,以及蓝通道信息进行相同的线性变换、仿射变换以及灰度拉伸。可选的,上述的第一处理模块具体可以用于将所述目标脸部的彩色图像先分解为三个通道的信息再进行上述的第一处理,或是为先对所述目标脸部的彩色图像的整体进行上述的第一处理,再将处理后的彩色图像分解为三个通道的信息,再输入所述神经网络。

可选的,上述的特征点可以为眼睛点,还可以为鼻尖点等其他的脸部特征。上述将所述至少一个通道的信息的特征点对齐的设定的位置可以为某个标准脸部图像的特征点,如眼睛点,也可以为预先设定的位置,还可以为训练上述神经网络时输入的脸部样本统一对齐的特征点,如眼睛点。

可选的,所述第一灰度拉伸子模块,具体用于根据目标脸部的彩色图像的特点,对所述目标脸部的彩色图像的至少一个通道的信息进行分段灰度拉伸。也可以根据所述目标脸部的至少一个通道的信息的像素值的大小,对所述像素值进行分段灰度拉伸。

可选的,所述第一归一化处理子模块,具体用于将所述目标脸部的彩色图像各个通道的像素值由[0,255]归一化到[0,1]。上述的各个通道可以包括:目标脸部的彩色图像的rgb图的三个通道,或目标脸部的彩色图像的yuv格式的三个通道。

通常情况下,以人脸为例,摄像装置获取的目标人脸的彩色图像除了包括脸部以外还包括有脖子肩膀等冗余部位,需要通过人脸检测定位到人脸框位置,再将其扣取出来,再定位上述的脸部特征,如眼睛点,进而再通过第一处理模块进行上述的第一处理,如仿射变换、旋转、对齐特征点等,以达到或近似达到标准脸部的要求,或使用的要求。上述的要求包括特征点位置,尺寸等,如可以与标准脸部或脸部样本的特征点的位置对齐,和/或与标准脸部或脸部样本的尺寸相同或类似。

可选的,上述用于识别所述目标脸部类别的第一参数数据由多个脸部样本的彩色图像通过所述神经网络训练得到,所述脸部样本的彩色图像包括:所述脸部样本的彩色图像的至少一个通道的信息。所述脸部样本的彩色图像的至少一个通道的信息为脸部样本的rgb格式的彩色图像的三个通道的信息,或,脸部样本的yuv格式的彩色图像的三个通道的信息。

具体的,所述脸部样本的彩色图像为rgb格式,可以通过输入模块202将该脸部样本的红、绿、蓝三个通道的信息输入上述神经网络203,该神经网络203使用梯度下降法和反向传播算法进行迭代以训练所述神经网络。可选的,所述脸部样本带有下述脸部类别中的至少一个:性别、人种、年龄范围以及年龄值,所述脸部样本以及所述脸部样本的彩色图像的至少一个通道的信息分别带有同样的所述脸部类别。上述神经网络203可以通过上述的识别脸部样本的类别的迭代过程确定出识别脸部样本的类别准确率高的参数组合,如神经网络至少一个节点的权值,作为识别该目标脸部的类别的第一参数,该第一参数的具体内容可以参见上文。可选的,第一参数可以是在线下通过训练上述脸部样本得到的,提供实际使用的用于进行脸部类别识别的产品中可以不包括上述的脸部样本。

可选的,为应对获得的脸部样本姿态不理想或是光照条件不理想的情况,可以对脸部样本的彩色图像的至少一个通道进行相同的第二处理以近似达到标准脸部的要求或使用的要求,具体地,如所述装置还包括第二处理模块,所述第二处理模块,用于在所述神经网络训练所述多个脸部样本的彩色图像之前,对所述脸部样本的彩色图像的至少一个通道的信息进行相同的第二处理,所述第二处理模块包括下述子模块中的至少一个:第二旋转子模块,第二变换子模块,第二对齐子模块,第二灰度拉伸子模块,以及第二归一化处理子模块;

所述第二旋转子模块,用于确定所述脸部样本的彩色图像的至少一个通道的信息的特征点,以所述特征点为基准对所述脸部样本的彩色图像的至少一个通道的信息进行旋转;所述第二变换子模块,用于对所述脸部样本的彩色图像的至少一个通道的信息进行镜像处理、线性变换以及仿射变换;所述第二对齐子模块,用于将所述脸部样本的彩色图像的至少一个通道的信息的特征点对齐所述设定的位置;所述第二灰度拉伸子模块,用于对所述脸部样本的彩色图像的至少一个通道的信息进行图像的灰度拉伸;以及,所述第二归一化处理子模块,用于对所述脸部样本的彩色图像的至少一个通道的信息进行图像像素值归一化处理。

示例性的,上述第二处理模块,具体用于对上述脸部样本的彩色图像的红通道、绿通道以及蓝通道均进行相同参数上述的线性变换、仿射变换以及灰度拉伸。上述第二处理模块,具体用于对所述脸部样本的彩色图像的至少一个通道进行上述的第二处理,再将进行第二处理后的各个通道的信息输入神经网络进行训练;也可以先对所述脸部样本的彩色图像的整体图像进行上述第二处理,再分解为各个通道输入神经网络进行训练。

可选的,上述的特征点可以为眼睛点,还可以为鼻尖点等其他的脸部特征。上述将多个脸部样本的彩色图像的特征点对齐的设定的位置可以为某个标准脸部图像的特征点,如眼睛点,也可以为预先设定的位置,还可以为训练上述神经网络时输入的脸部样本统一对齐的特征点,如眼睛点。

可选的,所述第二灰度拉伸子模块,具体用于根据脸部样本的彩色图像的至少一个通道的特点,对所述脸部样本的彩色图像的至少一个通道进行分段灰度拉伸,也可以根据所述脸部样本的彩色图像的至少一个通道的像素值的大小,对所述像素值进行分段灰度拉伸。

所述第二归一化处理子模块,具体用于将对所述脸部样本的彩色图像的至少一个通道或各个通道的信息的像素值由[0,255]归一化到[0,1]。

可选的,上述的图像合格判定模块还可以用于根据下述参数中的至少一个确定所述脸部样本的彩色图像合格:根据下述参数中的至少一个确定所述脸部样本的彩色图像合格:俯仰角、偏航角、翻滚角、尺寸以及光照条件。具体的,判断标准可以为:所述俯仰角小于或等于第一角度,所述偏航角小于或等于第二角度,所述翻滚角小于或等于第三角度,所述目标脸部的彩色图像的像素数大于或等于第一阈值,以及,光照强度大于或等于第二阈值。示例性的,该第一角度可以为30°,该第二角度可以为30°,该第三角度可以为44°,该第一阈值可以为40x40pixels(像素),该第二阈值可以为5lux(勒克斯)。

所述脸部样本的彩色图像的像素数大于或等于第一阈值可以包括:所述脸部样本的彩色图像的像素总数大于或等于该第一阈值,或,所述脸部样本的彩色图像的水平像素数大于或等于该第一阈值,或,所述脸部样本的彩色图像的垂直像素数大于或等于该第一阈值。

可选的,上述图像合格判定模块还可以用于判定上述脸部样本的彩色图像不合格时,停止将该脸部样本的彩色图像输入神经网络进行训练。可选的,上述的第一角度和第二角度可以相同也可以不同。当判断上述脸部样本的彩色图像合格时,可以进行下述的特征点定位以及上述的第二处理步骤。

通常情况下,以人脸为例,摄像装置获取的脸部样本的彩色图像除了包括脸部以外还包括有脖子肩膀等冗余部位,需要通过人脸检测定位到人脸框位置,再将其扣取出来,再定位上述的脸部特征,如眼睛点,进而通过上述的第二处理模块进行上述的第二处理,如仿射变换、旋转、对齐特征点等,以达到或近似达到标准脸部的要求,或使用的要求。上述的要求包括特征点位置,尺寸等,如可以与某个脸部样本的特征点的位置对齐,和/或与标准脸部或脸部样本的尺寸相同或类似。

上述神经网络具体用于使用梯度下降法和反向传播算法训练所述卷积神经网络,优化所述卷积神经网络中的各个参数。该卷积神经网络的结构是1个输入层、3个小组层、2个全连接层以及4个输出层。小组层包括卷积层,激活层,和下采样层。可选的,将经过上述第二处理的尺寸为60*60的脸部样本输入卷积神经网络。所述卷积层的激活函数选用relu函数。每个卷积层的输入与该层权重相乘之后,会得到一个数值,relu函数的原理就是,如果这个数值大于0,那么输出值就保存这个计算值,如果这个值小于0,那么输出值就置为0。当然,relu函数也可以换成其他的激活函数。全连接层也使用relu激活函数。输出层的作用是把全连接产生的实值变成[0,1]之间的概率。

在训练阶段,多个脸部样本中的每一个都将输入至卷积神经网络,并且计算输出以确定输出结果与期望的输出结果有多远。这个过程被称为“正向传递”forward。然后,根据输出结果与期望结果的差异,确定卷积神经网络的模型参数的误差度,根据误差修正模型参数,从而进行卷积神经网络学习,这个过程被称为“反向传递”backward。通过调整卷积神经网络中每层的权重值,使得卷积神经网络的输出值与实际脸部样本的脸部类别的值之间的差距越来越小,直到所述神经网络的输出值与脸部类别值一致或保持最小差距不再变化,则最终得到所需要的卷积神经网络以及其包括的第一参数。

可选的,所述神经网络203还包括所述脸部样本带有的分别对应所述不同脸部类别的代价函数;所述神经网络203还包括第一代价函数,所述第一代价函数包括所述对应所述不同脸部类别的代价函数的加权和。

代价函数(costfunction)需要将输出的单个脸部类别值与脸部样本的类别值进行比较。在本发明中的神经网络203,代价函数采用多个脸部类别值与脸部样本对应的类别分别比较,求出每个脸部类别的代价函数,再将多个脸部类别的代价函数加权,得到整体的代价函数,也就是从卷积神经网络代价函数上看,考虑到了每一种脸部类别,训练的目标是使得所有脸部类别的整体误差最低。这种方式支持各种不同脸部类别的组合。比如,年龄,性别,人种的代价函数分别为,l_age,l_gender,l_race,当需要输出年龄性别两种属性的时候,整体的代价函数为l_all=a*l_age+b*l_gender。当需要输出年龄、性别、人种三种属性的时候,整体的代价函数为l_all=a*l_age+b*l_gender+c*l_race,如果再加上年龄值的脸部类别,则整体的代价函数为l_all=a*l_age+b*l_gender+c*l_race+d*l_agevalue。

本发明提供的一种用于脸部分类的装置,能够通过脸部图像的内容分析脸部属性,并有效的根据脸部图像的属性,对大量的包括脸部的图像自动进行分类,减少了人工分类劳动,使得对包括脸部的图像的存储更加清晰有序,提高了分类效率。

下面结合图3具体阐述本发明实施例提供的一种计算机可读存储介质300,所述计算机可读存储介质300存储有计算机程序,其特征在于,所述计算机程序被第一处理器301执行时实现如上述实施例1所述方法的步骤。

本发明提供的一种计算机可读存储介质300,能够通过脸部图像的内容分析脸部属性,并有效的根据脸部图像的属性,对大量的包括脸部的图像自动进行分类,减少了人工分类劳动,使得对包括脸部的图像的存储更加清晰有序,提高了分类效率。

下面结合图4具体阐述本发明实施例提供的一种用于脸部分类的装置400,该装置400包括存储器401、第二处理器402以及存储在所述存储器401中并可在所述第二处理器402上运行的计算机程序,其特征在于,所述计算机程序被第二处理器402执行时实现如实施例1所述方法的步骤。

本发明提供的一种用于脸部分类的装置400,能够通过脸部图像的内容分析脸部属性,并有效的根据脸部图像的属性,对大量的包括脸部的图像自动进行分类,减少了人工分类劳动,使得对包括脸部的图像的存储更加清晰有序,提高了分类效率。

示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述装置/终端设备中的执行过程。

所述装置/终端设备可以是手机、平板电脑、桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述装置/终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,本发明的示意图仅仅是装置/终端设备的示例,并不构成对装置/终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述装置/终端设备还可以包括输入输出设备、网络接入设备、总线等。

上述处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述装置/终端设备的控制中心,利用各种接口和线路连接整个装置/终端设备的各个部分。

所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述装置/终端设备的各种功能。所述存储器可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如视频数据、图像等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

所述装置/终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。

上述各个实施例中的目标物体的成像可以目标物体的局部成像,也可以整体成像。无论是局部成像,或整体成像都适用或对局部成像,或整体成像相应做出调整后适用本发明提供的方法或装置,上述调整本领域普通技术人员不需要付出创造性劳动,应属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1