本发明公开了一种快速协同表示人脸分类方法,涉及到表示学习,字典优化以及数据降维技术。具体说来包括类内变量字典的构造、pca降维、二次稀疏协同优化以及lda鉴别重构误差评估;属于图像处理和模式识别的技术领域。
背景技术:
人脸识别(fr)是模式识别、计算机视觉和生物识别技术中最热门的研究领域之一。但是它时常受诸多因素,例如:姿势、表情、光照以及遮挡等影响。此外,并不是所有采集得到的高维数据对分类都起作用,为获得高效的人脸识别性能,研究者近年提出了各种经典的降维方法,例如:主元分析(pca)、线性判别分析(lda)、拉普拉斯特征映射、局部保持映射(lpp)、局部线性嵌入(lle)等,从而取得了在降维统计学习模型中的巨大成功。在这些典型的特征变换方法中,pca是一种无监督的线性降维方法,它的目标是通过某种线性投影,将高维数据映射到低维空间,并期望在所投影的维度上达到数据方差最大。lda是一种有监督的线性降维算法,它通过寻找投影向量将数据降维,同时保证不同类别的数据尽可能的分开,同类的数据尽可能的聚合。因此,上述这些转换方法在将数据投射到新的子空间时都具备某些自身重要的特性。
与此同时,近年出现的稀疏表示分类方法(src)由于其简洁的理论结构和大量成功的应用实例,也引发了各国研究者的重点关注。src的目的在于,从大量不同对象构成的字典中选出少量的训练样本,来重构表示一个新的对象。为了实现这一目标,src在目标函数中使用l1范式约束以获得稀疏向量。但在实际应用中,每类训练样本往往没有足够的甚至只有一个样本数据,导致src算法效果不佳,这就是著名的小样本问题。为此,一些字典学习方法被提出用来提高src的性能。例如,deng通过构造类内变量字典提出一个扩展的src方法(esrc)解决了单训练样本下的人脸表示优化问题。yang和zhu在协同表达分类(crc)中引入特征的相似性与辨别性,获得一个更一般的模型。song根据人脸表达分类模型设计出半脸字典集成算法,该方法在量化集成学习原子时,成功构造出双列(行)半脸的训练矩阵,这种虚拟人脸已被证实有利于人脸识别。
目前,关于src的研究主要集中在提高稀疏表示能力和分类性能两方面,对于如何解决稀疏分解过程中的降维优化问题以提高算法时间复杂度却少有研究。传统的src方法利用高维数据构造单一范式的优化模型进行图像分类,忽视了测试样本与训练样本间的信息冗余,导致不确定性的决策分类。
发明目的
在训练样本不足的情况下,针对传统表示学习优化方法在解决高维原始数据重构的过程中忽视样本间的信息冗余和缺乏鉴别性的问题,同时为避免利用l1范式求解最小化问题所导致的极大时间开销等缺陷,提出一种快速协同表示人脸分类方法,该方法在建立数据降维模型后,通过设计基于混合范式的二次优化策略获得更加鲁棒的稀疏系数向量,从而加快优化速度,并提高人脸识别精度。
技术实现要素:
技术方案:一种快速协同表示人脸分类方法,包括如下步骤:
(a)获取所有待检测人员脸部图像,且每个检测人员在不同光照、表情以及遮挡环境下都拍摄若干张图像,一个检测人员的所有脸部图像代表一类,从而将所有检测人员的脸部图像组合成为样本数据集;
(b)从已存有的样本数据集中,随机挑选出15~25%的样本类来构造类内变量字典di,选取剩下样本类中的部分样本作为训练样本集a,同时建立各个类别的测试样本数据集;
(c)将训练样本集a投射到pca子空间,得到该样本集的特征脸u;
(d)用di和u来线性描述测试样本y,得到降维约束优化的稀疏表示模型,构造基于混合范式的二次优化方法迭代计算出重构测试样本的pca系数z;
(e)将z与pca子空间的训练样本投射到lda子空间,分别得到重构测试样本的lda系数
(f)计算每一类训练样本k的lda系数centersk;
(g)分别统计
作为优选,所述步骤(b)中,包括如下步骤:
(b1)假设挑选出p类共m个样本构建类内变量字典,记
(b2)为构造类内变量字典,将同类的其他图像减去该类的自然图像,记
作为优选,所述步骤(d)中,包括如下步骤:
(d1)针对测试样本y∈rd,通过训练样本集的特征脸和类内变量字典来线性描述y=uz+diβ+t,其中t∈rd是不能由变量字典表示的误差项,β为变量字典系数;
(d2)将上式y=uz+diβ+t看作一个典型的最小二乘问题,得到变量字典系数β的解β=(ditdi+λi)-1dit(y-uz),其中λ为正扰动项,i是单位矩阵;
(d3)根据测试样本的线性描述,求解重构测试样本pca系数z的值z=ut(y-diβ);
(d4)重复第(d2)和(d3)步,直到最小二乘法的迭代次数达到规定阈值时,终止迭代计算操作;
(d5)再次构造1范式优化模型,通过二次引入l1约束,得到β更加精确的解
作为优选,所述步骤(e)中,将z与pca子空间的训练样本投射到lda子空间,分别得到重构测试样本的lda系数
作为优选,所述步骤(f)中,假设训练样本集a包含k类样本,计算每类训练样本的lda系数
作为优选,所述步骤(g)中,通过构造重构误差公式
一种快速协同表示人脸分类方法,包括:
获取所有待检测人员的若干脸部图像,组合成为样本数据集;从已存有的样本数据集中,随机挑选出15~25%的样本类来构造类内变量字典di,选取剩下样本类中的部分样本作为训练样本集a,同时建立各个类别的测试样本数据集;将训练样本集a投射到pca子空间,得到该样本集的特征脸u;用di和u来线性描述测试样本y,得到降维约束优化的稀疏表示模型,构造基于混合范式的二次优化方法计算出重构测试样本的pca系数z;将z与pca子空间的训练样本投射到lda子空间,分别得到重构测试样本的lda系数
有益效果:与现有技术相比,本发明建立低维训练模型来线性表示测试样本,并在字典空间中通过l2范式迭代计算初始字典系数,随后二次引入l1范式进行系数精确优化,有效解决了表示学习方法单纯计算l1最小化问题引起的巨大时间开销,同时又充分保证了算法的识别性能。该技术最后在lda鉴别空间中完成识别任务,不仅提升了对测试样本稀疏表示的鲁棒性,也进一步增强了src算法的鉴别能力。
附图说明
图1为本发明实施例的方法流程图;
图2为本发明训练样本的部分人脸数据示意图;
图3为本发明测试人脸样本示意图;
图4为本发明类内变量字典的部分变量示意图;
图5为本发明训练样本集的部分特征脸人脸示意图;
图6为本发明求解类内变量字典系数和重构测试样本pca系数时两种不同计算顺序下的实验结果折线图;
图7为本发明迭代计算l2范式后,二次引入l1范式优化系数后的识别率;
图8为本发明的识别率与在原始字典下仅运用l1范式进行优化方法的比较;
图9为本发明的运算速度与在原始字典下仅运用l1范式运算速度的比较。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,一种快速协同表示人脸分类方法,包括如下步骤:
(a)获取所有待检测人员脸部图像,且每个检测人员在不同光照、表情以及遮挡环境下都拍摄若干张图像,一个检测人员的所有脸部图像代表一类,从而将所有检测人员的脸部图像组合成为样本数据集;
(b)从已存有的样本数据集中,随机挑选出15~25%的样本类来构造类内变量字典di,如图4。选取剩下样本类中的部分样本作为训练样本集a,如图2。同时建立各个类别的测试样本数据集,如图3,测试样本数据集可以通过获取训练样本集中待检测人员脸部图像构建;
所述步骤b包括如下步骤:
(b1)假设挑选出p类共m个样本构建类内变量字典,记
(b2)为构造类内变量字典,将同类的其他图像减去该类的自然图像,记
c、将剩余的训练样本集a投射到pca子空间,得到该样本集的特征脸u,如图5给出了训练样本集的部分特征脸人脸示意图;
d、用di和u来线性描述测试样本y,得到降维约束优化的稀疏表示模型,构造基于混合范式的二次优化方法迭代计算出重构测试样本的pca系数z;
所述步骤d包括如下步骤:
(d1)针对测试样本y∈rd,通过训练样本集的特征脸和类内变量字典来线性描述y=uz+diβ+t,其中t∈rd是不能由变量字典表示的误差项,β为变量字典系数;
(d2)将上式y=uz+diβ+t看作一个典型的最小二乘问题,得到变量字典系数β的解β=(ditdi+λi)-1dit(y-uz),其中λ为正扰动项,i是单位矩阵;
(d3)根据测试样本的线性描述,求解重构测试样本pca系数z的值z=ut(y-diβ);
(d4)重复第(d2)和(d3)步,直到最小二乘法的迭代次数达到规定阈值时,终止迭代计算操作;
(d5)再次构造1范式优化模型,通过二次引入l1约束,得到β更加精确的解
e、将z与pca子空间的训练样本投射到lda子空间,分别得到重构测试样本的lda系数
f、假设训练样本集a包含k类样本,计算每类训练样本的lda系数
g、通过构造重构误差公式
在本发明中,关于对小样本问题的研究,现有的多数算法主要通过对原始高维样本扩充数据集来进行改进。因此,此类方法往往忽视了样本之间的冗余信息,它不仅增加了巨大的时间开销,有时也会降低识别精度。本发明设计一种快速协同表示人脸分类方法,该方法通过构造类内变量字典来表示测试样本与训练样本之间的差异,并且在稀疏表达中构造pca与lda的降维约束条件,从而有效降低样本扩展所带来的干扰,从而使稀疏表达优化过程更加鲁棒。在此约束优化条件下,测试样本能够被快速地线性表示并执行分类。此外,传统的表达学习方法通常利用l1范式计算表达系数。但是,相关的研究表明l1范式的计算量大,时间复杂度高。事实上,l2范式已被证明与l1范式有着相似的作用,并且能够大大降低时间开销。因此,本发明建立了一种快速的降维稀疏优化模型,在该模型中,首先用训练样本特征脸和类内变量字典线性表示测试样本。考虑到类内变量字典中包含有各种类内差异,其系数必然稀疏,我们因此采用最小二乘法求解,间接获得了特征脸的系数。但另一个关键问题也应引起注意,那就是测试样本与训练样本间的信息冗余,依然会导致不确定性的识别结果。为了攻克这一难点,我们在得到上述初始字典系数的基础上,二次引入l1约束,从而得到类内变量字典系数和重构的测试样本pca系数更加精确的解。上述方法使得样本的干扰信息包括光照、表情以及遮挡等在优化过程中被有效剔除。以下是对该优化过程详细的有益效果分析:
首先,讨论类内变量字典系数和特征脸系数计算顺序的问题。图6展示了两种系数在不同计算顺序下的实验结果折线图,该实验在ar数据集上进行。可以看出,当最小二乘法的迭代次数为1时,先计算特征脸系数的识别效果更好。但迭代次数大于1时,先计算类内变量字典系数拥有更高的识别率。此外,随着迭代次数不断增加,识别曲线渐渐平缓,这意味着精确的识别效果并不需要大量的迭代次数,一旦迭代达到某一阈值,识别率便会收敛。其次,讨论本发明运用最小二乘法迭代求解类内变量字典系数后,二次引入l1范式的有效性。图7展示了迭代计算l2范式后二次引入l1范式的识别效果。明显可以看出,二次引入l1范式的识别率不仅比直接利用最小二乘法迭代求解系数的方法优异,而且其曲线也更加平稳。换句话说,本发明所构造的降维约束优化模型,获得了更加精确的识别效果,因此运用l2范式迭代求解类内变量字典系数后再引入l1范式是有效的。最后,总结本发明所构造的字典优化过程以及它们的总识别效果。图8和图9分别展了本发明的识别率和识别速度,以及与在原始字典下仅运用l1范式优化方法的比较。可以看出,本发明的识别率比后者略高,但识别速度获得大幅提高。可以看出,本发明公开的快速协同表示人脸分类方法确实有效提升了人脸协同表示的识别性能。
总之,本发明运用低维约束模型来训练并线性表示测试样本,并通过设计新型最小化目标函数能够同时得到更加鲁棒的稀疏系数向量和重构样本pca系数,并在lda鉴别子空间里完成了识别任务。本发明在字典空间中通过迭代计算l2范式,并二次引入l1范式进行系数的精确优化,有效解决了表示学习方法单纯利用l1范式计算最小化问题所引起的巨大时间开销,同时又充分保证了算法的识别性能。与现有同类技术相比,该模型的鲁棒性更好。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。