基于人脸结构特征的多方向多层次双交叉鲁棒性识别方法与流程

文档序号：11691297阅读：637来源：国知局

本发明涉及图像处理技术领域，特别是基于人脸结构特征的多方向多层次双交叉鲁棒性识别方法。

背景技术：

人脸识别，是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人脸进行脸部的一系列相关技术，通常也叫做人像识别、面部识别。

人脸识别系统的研究始于20世纪60年代，80年代后随着计算机技术和光学成像技术的发展得到提高，而真正进入初级的应用阶段则在90年后期，并且以美国、德国和日本的技术实现为主；人脸识别系统成功的关键在于是否拥有尖端的核心算法，并使识别结果具有实用化的识别率和识别速度；“人脸识别系统”集成了人工智能、机器识别、机器学习、模型理论、专家系统、视频图像处理等多种专业技术，同时需结合中间值处理的理论与实现，是生物特征识别的最新应用，其核心技术的实现，展现了弱人工智能向强人工智能的转化。人脸识别系统主要包括四个组成部分，分别为：人脸图像采集及检测、人脸图像预处理、人脸表征特征提取以及匹配与识别。

目前现有传统算法在进行特征提取时因许多使面部图像的外观因素影响，产生显著个体差异，外观因素例如，光照变化、姿势变化、遮拦、图像模糊和表情变化等等，使得人脸识别的准确率难以提高；此外，现有的人脸识别的计算量仍然巨大，拖慢了人脸识别的速率，这种延时往往会给数据带来很大的误差，系统给人以不友好感受。

技术实现要素：

本发明所要解决的技术问题是克服现有技术的不足而提供基于人脸结构特征的多方向多层次双交叉鲁棒性识别方法，本发明可有效的减少计算量，提高人脸识别的准确率和识别速度。

本发明为解决上述技术问题采用以下技术方案：

根据本发明提出的一种基于人脸结构特征的多方向多层次双交叉鲁棒性识别方法，包括以下步骤：

步骤1、输入人脸图像h(xk，yk)，h(xk，yk)为灰度图像，人脸图像训练集pk：{pk|1,...,m}，其中，m为训练集图像样本总数，k为整数且1≤k≤m；

设输入人脸图像的两眼之间距离为d，以两眼中点为坐标原点o(0，0)，左右两眼的坐标值分别为(-0.5d，0)、(0.5d，0)，进入步骤2；

步骤2、对步骤1的人脸图像，以o为基准，以左右各距o为d，垂直两眼连线方向的上方向取0.5d和下方向1.5d之间构成矩形区域进行剪切，得到矩形区域，该矩形区域为表情子区域，剪切后的该矩形区域的图像为表情子区域图像；

步骤3、对步骤2的表情子区域图像进行尺度变换，统一尺寸和规格后进入步骤4；

步骤4、对统一尺寸后的表情子区域图像中的每一个像素点，以其为圆心画内外两个圆，在内外圆上各取0、π、和这八个方向；

步骤5、对步骤4中像素点的八个方向上的纹理信息进行量化，分配一个唯一的十进制数：定义函数s(y)：y是变量，io、分别是点0、ai、bi的灰度值；ai、bi分别是步骤4中像素点内圆、外圆上的点，dcpi是第i方向上的纹理信息量；第0-第7方向分别指0、π、和

步骤6、对于步骤5中的dcpi,定义{dcp0，dcp2，dcp4，dcp6}作为第一子集、{dcp1，dcp3，dcp5，dcp7}作为第二子集；这两个子集构建一个十字的形状，构成双交叉模式，出现最大联合熵；

步骤7、将步骤6中的两个子集分组为两个交叉编码器，分别命名为dcp-1、dcp-2，在表情子区域图像中的像素点的代码表述为：两个交叉编码器构成总描述符dcp:dcp＝{dcp-1,dcp-2}，由总描述符产生两个分别被映射成非重叠区域的网格编码图；在此网格编码图中计算每个区域的所有直方图，并将所有直方图连接起来，形成总体人脸表示框架，进入步骤8；

步骤8、将步骤7中最后形成的总体人脸表示框架通过高斯滤波器，以中心点o为原点，使用高斯算子的一阶导数公式：n＝(cosθ,sinθ)是代表滤波方向的法向量，θ是滤波方向的角度，是二维高斯多方向滤波器，xk、yk是人脸图像h(xk，yk)的坐标值，σ是该函数的方差；

步骤9、把步骤8中通过滤波器的人脸表示总体框架作为训练数据，初始化训练样本的权值分布，即每一个训练样本最开始时都被赋予相同的权值即：d1＝(w11，w12…w1j…,w1m),d1是训练集初始化权值分布，w1j为初始化第j个样本权重；

步骤10、对步骤9中训练样本的权重进行多轮迭代；

101、设m为迭代次数，初始化迭代次数m＝1时，此刻初始化权值为d1；

102、使用具有权值分布dm的训练数据集学习，dm为第m次迭代后的样本权重；选取让误差率最低的阈值来设计基本分类器gm(x)：gm(x):x→{-1,1}，x是变量，gm(x)在训练数据集上的分类误差率em，em是被gm(x)误分类的样本权值和，且wmj是第m次迭代时第j个样例权重，i(gm(xk)≠yk)是gm(xk)≠yk处的灰度值；

103、若m＜m，则m＝m+1，重复步骤102，否则停止循环；

步骤11、计算步骤10中gm(x)的系数，得到基本分类器gm(x)在最终分类器g(x)中所占的权重αm：αm≥0；从而得到最终分类器g(x)：最终得到多个面部特征点，从而形成多方向多级双交叉模式鲁棒性人脸识别。

作为本发明所述的一种基于人脸结构特征的多方向多层次双交叉鲁棒性识别方法进一步优化方案，步骤6采用的基于人脸对称特征的双交叉分组方式，出现最大联合熵，形成鲁棒性方式，进入步骤7双交叉编码。

作为本发明所述的一种基于人脸结构特征的多方向多层次双交叉鲁棒性识别方法进一步优化方案，步骤8采用高斯滤波，是二维高斯多方向滤波器，使得灰度面部图像转换为对照明变化有鲁棒性的多方向梯度图像，图像信噪比最大化，增大图像鲁棒性。

作为本发明所述的一种基于人脸结构特征的多方向多层次双交叉鲁棒性识别方法进一步优化方案，步骤8中，θ∈(0,π)。

作为本发明所述的一种基于人脸结构特征的多方向多层次双交叉鲁棒性识别方法进一步优化方案，步骤10中，取训练集图像样本总数m为200。

本发明采用以上技术方案与现有技术相比，具有以下技术效果：

(1)本发明在确定面部特征点的时候，采用迭代算法，把弱分类器集合构成最强分类器，减轻分类误差，“聚焦于”那些较难分的样本上；

(2)本发明采用双交叉模式的编码方法，概括了八个方向，成功利用了人脸的对称结构特性，简化了算法步骤，减小了计算量；

(3)本发明利用高斯滤波器转换图像，解决了传统的算法在进行特征提取时因许多使面部图像的外观产生显著个体差异的因素影响，例如，光照变化、姿势变化、遮拦、图像模糊和表情变化等等，使得灰度面部图像转换为对照明变化有鲁棒性的多方向梯度图像，使图像信噪比最大化，边缘位置精度保持且从单响应变成单边；

附图说明

图1是本发明基于人脸结构特征的多方向多层次双交叉鲁棒性识别方法的流程图。

图2是脸部几何归一化中心。

图3是局部采样点集。

图4是双交叉分组编码；其中，(a)为由0，π，这四个方向构成的一个十字子集，(b)为由这四个方向构成的另一个十字子集。

图5是图像人脸的多个特征点。

具体实施方式

下面结合附图对本发明的技术方案做进一步的详细说明：

在具体实施中，图1是基于人脸结构特征的多方向多层次双交叉鲁棒性识别方法的流程，输入人脸图像h(xk，yk)，h(xk，yk)为灰度图像，人脸图像训练集pk：{pk|1,...,m}，其中，m为训练集图像样本总数，k为整数且1≤k≤m；设输入人脸图像的两眼之间距离为d，以两眼中点为坐标原点o(0，0)，左右两眼的坐标值分别为(-0.5d，0)、(0.5d，0)。

对上述已经标注好坐标值的人脸图像，以o为基准，以左右各距o为d，垂直两眼连线方向的上方向取0.5d和下方向1.5d之间构成矩形区域进行剪切，得到矩形区域，该矩形区域为表情子区域，剪切后的该矩形区域的图像为表情子区域图像，如图2所示。这样更有利于表情特征的提取。

接着对表情子区域图像进行尺度变换，统一尺寸和规格后，对表情子区域图像中的像素点，以其为圆心画内外两个圆，在内外圆上各取0、π、和这八个方向。

然后对像素点的八个方向上的纹理信息进行量化，分配一个唯一的十进制数：定义函数s(y)：y是变量，io、分别是点0、ai、bi的灰度值；ai、bi分别是步骤4中像素点内圆、外圆上的点，dcpi是第i方向上的纹理信息量；第0-7方向分别指0、π、和如图3所示。

对于上述的dcpi,定义{dcp0，dcp2，dcp4，dcp6}作为第一子集、{dcp1，dcp3，dcp5，dcp7}作为第二子集；这两个子集构建一个十字的形状，构成双交叉模式，出现最大联合熵，如图4中的(a)、(b)所示。

将这两个子集分组为两个交叉编码器，分别命名为dcp-1、dcp-2，在表情子区域图像中的像素点的代码表述为：两个交叉编码器构成总描述符dcp:dcp＝{dcp-1,dcp-2}，由总描述符产生两个分别被映射成非重叠区域的网格编码图；在此网格编码图中计算每个区域的所有直方图，并将所有直方图连接起来，形成总体人脸表示框架。

把上述行成的总体人脸表示框架通过高斯滤波器，以中心点o为原点，使用高斯算子的一阶导数公式：n＝(cosθ,sinθ)是代表滤波方向的法向量，θ是滤波方向的角度，是二维高斯多方向滤波器，xk、yk是上文提到的人脸图像h(xk，yk)的坐标值，σ是该函数的方差。通过滤波器从而使得灰度面部图像转换为对照明变化有鲁棒性的多方向梯度图像，使图像信噪比最大化。

接着把通过滤波器的人脸表示总体框架作为训练数据，初始化训练样本的权值分布，即每一个训练样本最开始时都被赋予相同的权值即：d1＝(w11，w12…w1j…,w1m),d1是训练集初始化权值分布，w1j为初始化第j个样本权重；

然后对上述训练样本的权重进行多轮迭代：

(1)、设定m为迭代次数，记初始迭代次数m＝1时，步骤9中的d1为此刻初始化权值，即dm当m＝1时的值；

(2)、使用具有权值分布dm的训练数据集学习，dm为第m次迭代后的样本权重；选取让误差率最低的阈值来设计基本分类器gm(x)：gm(x):x→{-1,1}，x是变量，gm(x)在训练数据集上的分类误差率em，em是被gm(x)误分类的样本权值和，且wmj是第m次迭代时第j个样例权重，i(gm(xk)≠yk)是gm(xk)≠yk处的灰度值；

(3)、若m＜m，则m＝m+1，重复步骤(2)，否则停止循环。

最后，计算gm(x)的系数，得到基本分类器gm(x)在最终分类器g(x)中所占的权重αm：αm≥0；从而得到最终分类器g(x)：最终得到多个面部特征点，从而形成多方向多级双交叉模式鲁棒性人脸识别，如图5所示。

本发明不但解决了传统的算法在进行特征提取时因许多使面部图像的外观产生显著个体差异的因素影响，例如，光照变化、姿势变化、遮拦、图像模糊和表情变化等等。还减轻了计算量，提高了人脸识别的准确率和速度。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：樊小萌;陈志;岳文静;黄雅楠;李熠
技术所有人：南京邮电大学
我是此专利的发明人

上一篇：交易行为识别方法和交易行为识别系统与流程
上一篇：基于无人机平台的作物生长分析方法及其分析系统与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。