一种邻域保持判别嵌入人脸识别方法及系统的制作方法
【专利摘要】一种邻域保持判别嵌入人脸识别方法及系统,本发明方法包括以下步骤。S1、对已有的人脸训练样本集进行初始降维,并根据训练样本矩阵确定初始降维训练样本矩阵。S2、寻找最优变换AX1,令二次降维训练样本矩阵X2=AX1,并获取二次降维训练样本集。S3、建立测试样本并将其进行二次降维获得二次降维测试样本,在二次降维训练样本中查找与所述二次降维测试样本相邻的样本,并将占比较高的二次降维训练样本的类别赋予所述测试样本。
【专利说明】一种邻域保持判别嵌入人脸识别方法及系统
【技术领域】
[0001]本发明涉及一种邻域保持判别嵌入人脸识别方法及系统,尤其涉及一种基于类别信息的邻域保持判别嵌入人脸识别方法及系统。
【背景技术】
[0002]在许多科学研究领域中,数据都是以高维形式存在的,比如图像分类、文本分类、语音识别等,它们的维度(属性)通常可以达到成百上千维,甚至更高。如何从高维数据中挖掘出用户感兴趣的特征,是近年来研究的一个热点问题。而由于“维灾”的影响,也使得高维数据挖掘变得异常地困难,必须采用一些特殊的手段进行处理。
[0003]人脸识别是基于人的脸部特征信息进行身份识别的一种识别技术。在人脸识别技术中,需要把人脸数据从高维空间映射到低维子空间。人脸是一种复杂、多变、高维的模式。尽管人们识别熟悉的人脸是容易的,但对机器来说如何准确识别出人脸,仍是一件困难的事情。然而,由于人脸识别在身份验证、安全系统等方面具有广泛用途,这一问题吸引众多的研究者,使其成为计算机视觉和模式识别中一个重要的研究领域。
[0004]由于原始图像数据的高维性,需要将训练数据集投影到低维线性子空间进行降维。现有技术中的降维方法主要有主成分分析方法和邻域保持嵌入算法。其中,主成分分析(Principal Component Analysis, PCA)方法是常用的降维方法,是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。但该方法只适合于线性表示的数据。He等人提出了邻域保持嵌入(Neighborhood Preserving Embedding, NPE)算法,该方法适用于流形数据,已经被成功地应用到人脸识别领域。在有监督学习中,判别信息对人脸识别问题是非常重要的。然而,NPE在进行线性重构时没有对邻域作类别判断,忽略了样本本身的类别信息。因此,该方法也存在一定缺陷。
[0005]鉴于上述原因,需要提供一种在NPE算法基础上引入判别信息,基于类别信息的邻域保持判别嵌入人脸识别方法,使得样本点的低维坐标能够同时保持流形的局部几何结构和分类信息,提高人脸识别的效率。
【发明内容】
[0006]本发明提供一种邻域保持判别嵌入人脸识别方法,包括以下步骤:
[0007]S1、对已有的人脸训练样本集进行初始降维,并根据训练样本矩阵确定初始降维训练样本矩阵;
[0008]S2、寻找最优变换AX1,令二次降维训练样本矩阵X2=AX1,并获取二次降维训练样本集;
[0009]S3、建立测试样本并将其进行二次降维获得二次降维测试样本,在二次降维训练样本中查找与所述二次降维测试样本相邻的样本,并将占比较高的二次降维训练样本的类别赋予所述测试样本。
[0010]优选的,在步骤SI中,若人脸训练样本集为彳X1,.V,丨U Xi e Rd,yi={l,2,...,(:},进行所述初始降维后获得β
[0011]优选的,在步骤SI中’若训练样本矩阵为乂=^,^,...^」e RDX1,则初始降维训练样本矩阵为X1=A1X,其中D是样本的维数,I是样本数据的个数,c是数据的类别数,A1 e Rdxn是利用PCA获得的投影矩阵。
[0012]优选的,在步骤SI中,创建具有分类信息的矩阵.=其中
Ji € I'且当yi=j时,^的第j个分量为1,否则为O。
[0013]优选的,在步骤SI中,初始降维采用主成分分析方法。
[0014]优选的,在步骤S2中,使得军卜-写,#,
【权利要求】
1.一种邻域保持判别嵌入人脸识别方法,其特征在于,包括以下步骤: s1、对已有的人脸训练样本集进行初始降维,并根据训练样本矩阵确定初始降维训练样本矩阵; s2、寻找最优变换AX1,令二次降维训练样本矩阵X2=AX1,并获取二次降维训练样本集; s3、建立测试样本并将其进行二次降维获得二次降维测试样本,在二次降维训练样本中查找与所述二次降维测试样本相邻的样本,并将占比较高的二次降维训练样本的类别赋予所述测试样本。
2.根据权利要求1所述的方法,其特征在于,在步骤SI中,若人脸训练样本集为
Xi e Rd, Yi = {1,2,...,0},进行所述初始降维后获得
3.根据权利要求1所述的方法,其特征在于,在步骤SI中,若训练样本矩阵为X=[X1, x2,..., X1] e RDX1,则初始降维训练样本矩阵为X1=A1X,其中D是样本的维数,I是样本数据的个数,c是数据的类别数,A1 e Rdxn是利用PCA获得的投影矩阵。
4.根据权利要求1所述的方法,其特征在于,在步骤SI中,创建具有分类信息的矩阵
5.根据权利要求1所述的方法,其特征在于,在步骤SI中,初始降维采用主成分分析方法。
6.根据权利要求1所述的方法,其特征在于,在步骤S2中,使得
7.根据权利要求1所述的方法,其特征在于,在步骤S2中,所述二次降维训练样本集为{χVIi1^1 ?Λ = β(Χ?ΜΧ? + !Z1 F 其中 M=(1-W)T(1-W),I 为单位矩阵。* , ,
8.根据权利要求1所述的方法,其特征在于,在步骤S3中,利用K近邻分类器,在二次降维训练样本中找到K个和二次降维测试样本相邻的样本,并挑选占比较高的二次降维训练样本的类别。
9.一种邻域保持判别嵌入人脸识别系统,其特征在于,包括预处理降维模块、二次降维模块及分类模块,所述预处理降维模块连接二次降维模块,所述二次降维模块连接分类模块,所述预处理降维模块,用于以主成分分析方法对训练样本集进行初始降维; 所述二次降维模块,用于对已进行初始降维的训练样本进行二次降维,得到二次降维训练样本; 所述分类模块,用于在二次降维训练样本集中,利用K近邻分类器,对二次降维测试样本进行分类。
【文档编号】G06K9/62GK103577839SQ201310625378
【公开日】2014年2月12日 申请日期:2013年11月28日 优先权日:2013年11月28日
【发明者】张莉, 包兴, 赵梦梦, 杨季文, 王邦军, 何书萍, 李凡长 申请人:苏州大学