针对注册人脸和待识别人脸图片质量不同的人脸识别方法
【技术领域】
[0001 ]本发明涉及一种人脸识别方法。
【背景技术】
[0002] 已有的人脸识别都是基于系统中已注册人脸和待识别人脸图像的质量相同的假 设。而实际应用中的人脸识别,比如视频监控应用中,通常都是已注册人脸和待识别人脸质 量存在很大不同,通常情况是数据库系统中注册的人脸图像质量高(正脸、分辨率高、光照 条件良好等),而监控视频中采集到的待识别人脸图像质量低(侧脸、分辨率低、光照较暗、 模糊等)。如果仅仅是将已注册人脸和待识别人脸变换到同一尺寸,会导致极大的信息损 失,从而影响人脸识别的精度。
【发明内容】
[0003] 本发明的目的是提供一种更加高效、更加鲁棒的人脸识别方法。
[0004] 为了达到上述目的,本发明的技术方案是提供了一种针对注册人脸和待识别人脸 图片质量不同的人脸识别方法,其特征在于:针对不同质量的图像训练不同的神经网络以 提取特征,并通过度量学习的方法来计算两不同质量图像特征之间的距离,该算法包括以 下步骤:
[0005] 第一步、构建一个Nh层的高质量卷积神经子网络,待学习参数为0H、WH,及一个N L层 的低质量卷积神经子网络,待学习参数为9^1^如>凡,将目标函数1定义为:
[0006]
[0007]
[0008]
中:g( ·)表示罗杰斯特损失函数,τ表示边缘位置,μ表 示与边缘的最小距离,h用于标定第i个由高质量的人脸图像/f和低质量的人脸图像/?构 成的人脸对中的脸是否为同一个人的人脸,如果第i个由高质量的人脸图像和低质量的 人脸图像/?构成的人脸对中的脸是同一个人的脸,则1 i = 1,否则,1 i = - 1,
表示第i个由高质量的人脸图像jf和低质量 2. 的人脸图像构成的人脸对中的两张脸之间的距离,表示高质量卷积神经子网络 的未经过特征对齐的输出,表示低质量卷积神经子网络的未经过特征对齐的输出, 表示高质量卷积神经子网络的第η层滤波器,表示低质量卷积神经子网络的第η 层滤波器,λ表示卷积神经子网络的正则项系数,γ表示用于特征对齐的全连接层的正则项 系数,表示向量的F范数;
[0009] 第二步、利用样本集对高质量卷积神经子网络及低质量卷积神经子网络,学习得 到参数0h、Wh、9l、Wl,其中,样本集包括多对数据对,每对数据对由一张高质量的人脸图像及 一张低质量的人脸图像组成;
[0010] 第三步、在人脸识别系统中注册高质量的人脸图像,实时捕获低质量的人脸图像 后,将低质量的人脸图像与已注册的高质量的人脸图像一一比对,第i对已注册的高质量的 人脸图像/f与低质量的人脸图像/f的比对步骤包括:
[0011] 步骤3.1、分别将高质量的人脸图像/f及低质量的人脸图像/f输入训练后的高 质量卷积神经子网络及低质量卷积神经子网络,得到对齐后的输出 % Gf)及 若心则人脸图像/f与人脸图像jf属于同一个人,否则,属于不同人。
[0013] 优选地,所述高质量卷积神经子网络为8层,第一层为高质量图像输入层,最后一 层为高质量图像全连接层,由高质量图像输入层至高质量图像全连接层依次为:卷积层一、 最大池化层一、卷积层二、最大池化层二、卷积层三、最大池化层三。
[0014] 优选地,所述低质量卷积神经子网络为6层,第一层为低质量图像输入层,最后一 层为低质量图像全连接层,由低质量图像输入层至低质量图像全连接层依次为:卷积层一、 最大池化层一、卷积层二、最大池化层二。
[0015] 本发明在两个公共数据集上与其他方法进行比较,包括C0X和PaSC。识别率可以作 为衡量算法鲁棒性和高效性的评判标准,性能评估是用R0C曲线来展现的。
[0016] 在两个数据集的不同实验设置情况下,本发明与现有最好技术的准确率对比,如 下表所示(该表表示在PaSC和C0X两个数据集上面不同方法的人脸认证准确率)。
[0017]
[0018] 注:SRDML表示本发明提供的算法。
【附图说明】
[0019] 图1为高质量卷积神经子网络的网络结构;
[0020] 图2为低质量卷积神经子网络的网络结构;
[0021] 图3特征对齐示意图;
[0022] 图4为在COX数据集上面,本发明方法与现有最好技术的ROC曲线的对比图;
[0023] 图5A为本发明在椒盐噪声影响下的鲁棒性分析图;
[0024] 图5B为本发明在高斯噪声影响下的鲁棒性分析图;
[0025] 图5C为本发明在遮挡的影响下的鲁棒性分析图;
[0026] 图6为不同分辨率下本发明的算法高效性示意图;
[0027]图7A及图7B为本发明方法在PaSC数据集上部分人脸距离度量的结果,图7A为高质 量图像的特征分布图,图7B为低质量图像的特征分布图,图中,subjectl至subject5为不同 个人。
【具体实施方式】
[0028]为使本发明更明显易懂,兹以优选实施例,并配合附图作详细说明如下。
[0029]本发明需要解决给定一个人脸图像对,判断该图像对是否属于同一个人的问题。 详细说明如下:数据集中第i个人脸对可以表示成(if,if、it分别表示高、低质量的 人脸图像。基于深度神经网络的方法会学习到if、/?的更加具有区分性的特征表达 算法的目标是解决如下问题:当人脸对属于同一个人的时候,d2 当人脸对属于不同 人的时候,d22 τ+μ。
[0030]本发明提供了一种针对注册人脸和待识别人脸图片质量不同的人脸识别方法,包 括以下步骤:
[0031] 第一步、构建一个ΝΗ层的高质量卷积神经子网络,待识别参数为0H、WH,及一个N L层 的低质量卷积神经子网络,待识别参数为9L、WL,NH>N L。
[0032] 对于高质量卷积神经子网络而言,其输入的图像尺寸更大,因此其神经网络的层 数更深;对于低质量卷积神经子网络而言,其输入的图像尺寸更小,因此其神经网络的层数 略浅。如图1及图2所示,在本实施例中,高质量卷积神经子网络为8层,第一层为高质量图像 输入层,最后一层为高质量图像全连接层,由高质量图像输入层至高质量图像全连接层依 次为:卷积层一、最大池化层一、卷积层二、最大池化层二、卷积层三、最大池化层三。
[0033] 低质量卷积神经子网络为6层,第一层为低质量图像输入层,最后一层为低质量图 像全连接层,由低质量图像输入层至低质量图像全连接层依次为:卷积层一、最大池化层 一、卷积层二、最大池化层二。
[0034] 在图1及图2中,最外圈的数字表示图像的尺寸大小,而位于外圈左下角的数字表 示对应的通道数,例如对于图1的第一层高质量图像输入层而言,其图像大小为134*107,对 应的通道数为3。由此可见,高质量卷积神经子网络的输入尺寸更大,低质量卷积神经子网 络的输入尺寸更小。而且两个子网络的输入尺寸是由所有训练样本尺寸的中位数决定的。 每一层的中间方框的一圈数字表示该层的滤波器的尺寸,用于进行卷积操作;卷积层的方 块对应的数字表示经过卷积后的特征图的尺寸和对应的通道数,通过卷积运算,可以使原 信号特征增强,并且降低噪音。例如对于图1的第一层高质量图像输入层而言,其滤波器尺 寸为9*9。由图1及图2可知,图像在经过最大池化层操作后,池化后的特征具有更低的维度, 同时还会改善结果(不容易过拟合)。图1及图2中,最后一层,即全连接层的长方体的数字表 示对应神经元的个数,全连接层的操作相当于特征对齐的过程。
[0035] 在本实施例中,特征对齐的过程参见图3,最底层神经元的颜色较浅部分表示与人 脸中眼睛特征有关的神经元,颜色较深部分表示与人脸中嘴巴特征有关的