一种基于稀疏保持距离度量的人脸识别方法
【技术领域】
[0001] 本发明属于数据挖掘与人工智能技术领域,具体涉及一种基于稀疏保持距离度量 的人脸识别方法。
【背景技术】
[0002] 传统的身份验证方式一钥匙、口令等,存在繁琐、容易被盗取等缺点。随着多媒体 时代的发展,这些传统的身份验证方式已经被逐渐取代。人脸识别技术就是当前应用极为 广泛的身份验证方式之一。简单的说,人脸识别技术即是将待分类人脸数据进行处理,与数 据库中人脸数据进行相关性比对,对捕捉的人脸进行识别。近些年,研究人员提出了很多人 脸识别的方法,基于人脸模板匹配、维数约简、神经网络、SVM分类器等方法均在一定程度上 取得了不错的人脸识别效果。
[0003] 然而,为了获得更好的人脸识别系统,使用一个恰当的距离度量来衡量人脸图像 间的相似性是至关重要的。现有技术中很多距离度量算法(ITML,LMNN等)未充分利用所有 无标签样本数据,并且大多数算法考虑了样本的类别标签而忽略样本间的空间位置信息, 使得距离度量算法在很多应用中很难进一步提高识别精度。因此,使用一个恰当的距离度 量算法对于很多应用(如人脸识别)具有至关重要的影响。
【发明内容】
[0004] 本发明的目的在于针对现有技术中的不足,提供一种基于稀疏保持距离度量的人 脸识别方法,充分利用所有样本数据(标签样本与无标签样本),并充分保持样本数据的稀 疏结构化?目息,以提尚人脸识别的精度。
[0005] 本发明的目的通过下述技术方案实现:一种基于稀疏保持距离度量的人脸识别方 法,具体实现方法如下:
[0006] 步骤1,从所有已存储人脸数据中提取带标签信息的人脸数据,基于人脸数据,使 用最大边界理论构建距离度量算法的框架;
[0007] 步骤2,使用稀疏表示理论,挖掘样本间的稀疏结构化信息,构建稀疏权值矩阵;
[0008] 步骤3,构建稀疏保持优化函数,使得在新构建的距离度量空间中,样本的稀疏结 构化信息得以最大化的保存;
[0009] 步骤4,利用正则化框架,将最大边界理论与稀疏保持优化函数结合,得到稀疏保 持距1?度
[0010] 步骤5,使用特征描述子,提取待识别人脸的图像特征,并在稀疏保持距离度量下, 进行人脸识别实验,对测试人脸数据进行分类。
[0011] 进一步,步骤1具体包括:
[0012] 根据样本的标签信息,计算在使用距离度量矩阵A的情况下,不同类样本间距离平 方和,计算公式为:
[0013]
[0014] 其中,(Xl,Xj)eD表示样本x^x谏自不同类,dA(Xl, Xj)表示在使用距离度量矩阵 A的情况下,样本^与幻之间的距离,T表示矩阵的转置;
[0015] 根据样本的标签信息,计算在使用距离度量矩阵A的情况下,相同类样本间距离平 方和,计算公式为:
[0016]
[0017] 其中,(xk,xi) ES表示样本xk与XI来自同一类,dA(xk,xi)表示在使用距离度量矩阵 A的情况下,样本X1J^X1之间的距离,T表示矩阵的转置;使用最大边界理论,构建距离度量框 架,使得在距离度量矩阵A下,不同类样本间距离之和最大的同时同类样本间距离之和最 小,距离度量框架如下:
[0018]
[0019] 其4
(Xi,Xj) GD表示样本Xi与Xj来自不同类, (Xk,XI) E s表示样本Xk与XI来自同一类,Nd为集合D中约束对的个数,Ns为集合S中约束对的 个数,α为正则化参数,权衡不同类样本间距离之和与同类样本间距离之和的比例;
[0020] 将4=117带入公式(3)进行求解,通过矩阵的特征分解,求得最优投影矩阵W,进而 得到距离度量矩阵A;其中WT*W的转置矩阵。
[0021] 进一步,步骤3具体包括:
[0022] 通过保持稀疏表不构成样本间稀疏权值关系,构建稀疏保持优化函数如下:
[0023] (10)
[0024] 式中,Sl是除Xl以外所有样本线性组成^的稀疏系数,其表*Xl与其他所有样本的 稀疏相关性;乂二匕^^…^一是由所有样本组成的字典矩阵^为正整数;
[0025]对公式(10)进行等价变换如下:
[0026] (II)
[0027]式中,5=[81,82,'",811]是稀疏权值矩阵;[0028] 将公式(11)转化为最大化问题并加入约束条件如下:
[0029] (12)
[0030] 式中,S是稀疏权值矩阵,X为字典矩阵,W为投影矩阵。
[0031]进一步,步骤4具体包括:
[0033]
[0032] 将权利要求1步骤3中稀疏保持优化函数通过正则化结构加入距离度量框架中,得 到稀疏保持距离度量的目标函数如下:
[0034] +ST_STS)XT,a与β均是正则化参数,用于均衡各部分的比重,以得到最优的度量子空间。
[0035] 与现有技术相比本发明的有益效果是:该方法恰当地保持了人脸数据样本间的稀 疏结构化信息,并充分使用了大量的无标签人脸数据,使得距离度量算法对样本流形结构 有更深入的理解,最终使得人脸识别系统的识别精度得到进一步提高。
【附图说明】
[0036]图1是本发明的流程图。
[0037]图2是本发明不同类样本分散开且同类样本聚集的示意图;
[0038]图3是不同距离度量方法在0RL人脸数据上的识别精度比较图;
[0039]图4是不同距离度量方法在AR人脸数据上的识别精度比较图。
【具体实施方式】
[0040] 下面结合附图所示的各实施方式对本发明进行详细说明,但应当说明的是,这些 实施方式并非对本发明的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、 或者结构上的等效变换或替代,均属于本发明的保护范围之内。
[0041] 参图1所示,本实施例提供了一种基于稀疏保持距离度量的人脸识别方法,具体 实现方法如下:
[0042]步骤S1,从所有已存储人脸数据中(标签数据与无标签数据)提取带标签信息的人 脸数据,基于人脸数据,使用最大边界理论构建距离度量算法的框架。
[0043]具体包括以下步骤:
[0044]步骤①.最大边界理论利用了所有的标签数据,使得在新的距离度量下,不同类样 本间距离之和最大的同时,同类样本间距离之和最小。首先定义不同类间距离之和如下:
[0045] t ' ⑴
[0046] 其中,(Xl,Xj)eD表示样本x々x谏自不同类,集合D中包含了所有来自不同类的 成对样本,最大化公式(1)使得不同类样本间的距离之和最大。
[0047]步骤②.根据样本的标签信息,定义在距离度量矩阵Α下,同类样本间距离之和如 下: _] (2)
[0049]其中,(xk,xi)es表示样本xk与XI来自同一类,集合S中包含了所有来自相同类的 成对样本,最大化公式(2)使得同类样本间的距离之和最小。
[0050] 步骤③.使用最大边界理论,即求得最优距离度量矩阵A,使得不同类样本尽可能 的分散开的同时,同类样本尽可能聚集(如图2所示),从而构建距离度量框架如下:
[0051] ⑶
[0052] 其中,其中
且(Xi,Xj) eD表示样本Xi与Xj来自不 同类,(xk,XI) e S表示样本xk与XI来自同一类,Nd为集合D中约束对的个数,Ns为集合S中约 束对的个数,α权衡两项的比例,以获得最优的距离度量矩阵A。
[0053] 步骤④.为了便捷的得到度量矩阵Α,将A=ffffTS入公式(3)可得:
[0054] 、 ' (4)
[0055]这里tr( ·)代表矩阵的迹,为了以更紧凑的形式表示公式(4),我们定义了以下两 个等式-
[0056] (5)
[0057] (6)
[0058]因此,最大边界理论可以构建距离度量框架如下:
[0059] ff=arg max2tr(ffT(MD-aMs)ff)
[0060] s.t.ffTff=I (7)
[0061 ]其中公式(7)中约束条件为了防止退化解。W= [wi,W2,…,wd],其中wi,W2,…,wd是 MD-aMs大于0的d个特征值对应的特征向量。
[0062]通过最大边界理论初步得到的距离度量矩阵即为A = ffffT。最大边界理论充分利用 了样本的标签信息,在其构建的度量空间中,不同类样本间距离之和尽可能大的同时,同类 样本间距离尽可能的小。因此,最大边界理论能进一步的提高人脸识别系统的准确性。
[0063] 步骤S2,使用稀疏表示理论,充分挖掘样本间的稀疏结构化信息,构建稀疏权值矩 阵。
[0064] 由于最大边界理论仅利用了标签样本,浪费了大量无标签样本的同时,忽略了数 据集中样本间的空间结构。本发明利用稀疏表示理论,充分挖掘并保持了数据集的稀疏结 构化信息。具体包括以下步骤:
[0065] 步骤①.利用稀疏表示,使用数据集中除样本Χι&外所有样本来构建对xi的最稀 疏的表示如下:
[0066] (8