本发明属于图像处理
技术领域:
,更进一步涉及模式识别
技术领域:
中的一种基于非线性特征和模型合并的线性判别式分析LDA(LinearDiscriminantAnalysis)人脸识别方法。本发明可用于视频监控环境下通过人脸识别进行人的身份确认,同时还可用于在网络入口端,通过人脸识别对人员身份进行判断,以及在影像拍摄中通过人脸识别对人物进行定位。
背景技术:
:人脸识别不同于虹膜识别、指纹识别等,是比较容易为人们所接受的非侵犯性识别手段,从而成为计算机视觉和模式识别
技术领域:
需要突破的一种技术。人脸识别的主要任务是根据提取的待识别人脸的特征,将其和数据库中的人脸图像进行比对,确定待识别人脸的身份。目前,对任意人脸图像进行识别的方法通常分为两类:第一类是基于特征提取的方法,第二类是基于分类器的方法。基于人脸特征的方法需要对人脸进行特征提取或选择,使用LDA提取人脸特征是常用的提取人脸特征的技术,该方法主要通过求解投影矩阵,使得原始数据样本经过投影后获得的特征,具有不同类之间的相似性最小同时同类之间的相似性最大的特点,然后利用分类器对提取到的特征进行人脸识别。该方法存在的不足是,首先无法提取到人脸非线性的特征,使得提取的特征不准确,算法鲁棒性较差,识别率较低,其次无法处理实时的问题,当有新样本加入时需要与原有样本合并到一起计算投影方向,浪费计算机资源,最后,大数据量的情况下,对涉及大矩阵特征分解,计算复杂并且耗时,计算结果也无法重复利用,不能应用于分布式的场景。Kim等人在其发表的论文“Incrementallineardiscriminantanalysisusingsufficientspanningsetsanditsapplications”(InternationalJournalofComputerVision,vol.91,no.2,pp.216-232,2011)中提出了一种增量线性判别分析ILDA(IncrementalLinearDiscriminantAnalysis)特征提取方法。该方法首先将新数据的特征空间的主成分向量和均值向量投影到原始数据的特征空间,分别计算出对应的残差向量,并进行正交化和旋转处理,获得最终投影向量;然后利用投影矩阵对训练样本和测试样本进行投影提取特征;最后将提取的特征送入分类器得到人脸识别结果。该方法可以较好的应用到在线数据量较大的实际情况,但是,该方法仍然存在的不足之处,首先是该方法使用线性的特征提取方式,忽略了数据中可能存在的非线性特征,从而降低了人脸识别率,其次是计算复杂和计算时间长,不能用于分布式场景。西安电子科技大学在其申请的专利文献“基于增量线性判别分析的多类标场景分类方法”(申请号:CN201510227553.5,公开号:CN104809475A)中公开了一种基于ILDA的多标场景分类方法。该方法首先将多类标分解成多个单类标;其次使用初始样本计算初始线性判别分析的变换矩阵,使用新增样本增量更新线性判别分析的变换矩阵,并将高维数据投影到低维空间;再从降维后的样本集中随机选取训练样本和测试样本,使用单示例多标记的K最近邻分类器对降维后的特征样本分类,并得到测试样本输出值;最后,预测出测试样本的标签,得到分类结果。该方法可用于快速处理海量高维度并且类别较多的多类标数据分类问题。但是,该方法仍然存在的不足之处是,该方法中使用的是线性的特征提取方式,使得提取的特征不准确,从而降低了识别率。技术实现要素:本发明的目的在于克服上述已有技术的不足,提出一种非线性特征和模型合并的LDA人脸识别方法。本发明的技术方案是:在大量的人脸数据到来时,划分人脸数据样本集;提取人脸非线性特征集;划分特征组;构建人脸特征模型库;获得全局人脸特征模型;求解线性判别式分析LDA的投影矩阵;投影人脸非线性特征集;采用K最近邻分类器,对投影后的人脸特征进行分类识别。本发明实现的具体步骤如下:(1)划分人脸数据样本集:(1a)采用向量化方法,将人脸图像库中所有人脸图片转化为与其类别标签对应的图像向量;(1b)从每类图像向量中随机选取一定比例的图像向量作为训练样本集,其余的图像向量作为测试样本集;(2)提取人脸非线性特征集:采用欧拉公式,分别从训练样本集和测试样本集中提取对应的人脸非线性特征训练集和人脸非线性特征测试集;(3)划分特征组:将人脸非线性特征训练集随机分成β个特征组;(4)构建人脸特征模型库:(4a)从所有特征组中任意选取一个特征组,按照下式,计算所选特征组的总离散度矩阵和类间离散度矩阵:其中,St表示所选特征组的总离散度矩阵,N表示所选的特征组中特征样本总数,Σ表示求和操作,m表示所选特征组中特征样本的序号,ym表示所选特征组中的第m个特征样本,μ表示所选特征组的总均值向量,T表示转置操作,Sb表示所选特征组的类间离散度矩阵,c表示所选特征组中特征样本的类别总数,j表示所选特征组中特征样本的类别序号,nj表示所选特征组第j类特征样本的总数,γj表示所选特征组第j类特征样本的均值;(4b)按照下式,构建所选特征组的模型:M={μ,N,P,Λ,Q,Δ,nj,γj}其中,M表示所选特征组的模型,P和Λ分别表示对总离散度矩阵进行特征分解得到特征向量矩阵和特征值矩阵,Q和Δ分别表示对类间离散度矩阵进行特征分解得到特征向量矩阵和特征值矩阵;(4c)判断是否选完所有的特征组,若是,则执行步骤(4d),否则,执行步骤(4a);(4d)获得每一个特征组对应的人脸特征模型,用所有人脸特征模型组成人脸特征模型库;(5)获得全局人脸特征模型:(5a)从人脸特征模型库中任意取出两个模型,合并所选的两个模型,将合并后的模型再放入人脸特征模型库中;(5b)判断人脸特征模型库中是否只剩一个模型,若是,则执行步骤(5c),否则,执行步骤(5a);(5c)将人脸特征模型库中剩下的最后一个模型作为全局人脸模型;(6)求解线性判别式分析LDA的投影矩阵:(6a)按照下式,计算辅助矩阵:其中,Ψ表示辅助矩阵,和分别表示全局人脸特征模型中总离散度矩阵的特征向量矩阵和特征值矩阵,-1/2表示对矩阵中每个元素求-1/2次幂操作,和分别表示全局人脸特征模型中类间离散度矩阵的特征向量矩阵和特征值矩阵;(6b)对辅助矩阵进行特征分解,得到辅助矩阵的特征向量矩阵;(6c)按照下式,计算线性判别式分析LDA的投影矩阵:其中,U表示线性判别式分析LDA的投影矩阵,W表示辅助矩阵的特征向量矩阵;(7)投影人脸非线性特征集:采用投影公式,利用线性判别式分析LDA的投影矩阵,对人脸非线性特征训练集和测试集分别进行投影;(8)采用K最近邻分类器,对投影后的人脸特征进行分类识别。与现有技术相比,本发明有以下优点:第一,由于本发明在人脸识别中提取到了人脸非线性特征,克服了现有技术因没有提取到非线性特征,特征不准确,算法鲁棒性较差,从而降低了分类精度的不足,使得本发明在人脸识别的过程中提高了人脸识别率。第二,由于本发明在大数据量的人脸识别中采用划分特征组,从特征组中提取模型并合并模型的方法,克服了现有技术因在大数据量的情况下,对大矩阵特征分解,计算复杂并且耗时的不足,使得本发明在人脸识别的过程中具有运行时间较短,使用计算资源较少的优点。第三,由于本发明在人脸识别中采用划分特征组,从特征组中提取模型并合并模型的方法,可以将多次的模型构建和合并操作并行化处理,可以用模型替换原始数据保存计算结果,克服了现有技术因数据量大,计算结果无法重复利用,不能应用于分布式场景的不足,使得本发明具有应用范围更广,应用更灵活的优点。附图说明图1是本发明的流程图;图2是CMU-PIE数据库人脸样本示意图;图3是对图2加入不同程度黑白块噪声后的人脸样本示意图;图4是本发明仿真结果对比的曲线图。具体实施方式下面结合附图对本发明做进一步的详细描述参照图1,对本发明的具体步骤做进一步的详细描述。步骤1,划分人脸数据样本集。采用向量化方法,将人脸图像库中所有人脸图片转化为与其类别标签对应的图像向量。向量化方法的步骤如下:第一步,从包含类别标签的人脸图像库中随机选取一张图片,将所选图片中的每一列依次作为一个列向量;第二步,将所有列向量依次首尾相接,组成所选图片对应的图像向量;第三步,判断是否选完人脸图像库中所有的图片,若是,则执行第四步,否则,执行第一步;第四步,完成人脸图像库中所有的图片的向量化。从每类图像向量中随机选取一定比例的图像向量作为训练样本集,其余的图像向量作为测试样本集。随机选取一定比例是指,所选取的图像向量的数量占所有图像向量总数为[20%,80%]中的任意一个比例。步骤2,提取人脸非线性特征集。采用欧拉公式分别从训练样本集和测试样本集中提取对应的人脸非线性特征训练集和人脸非线性特征测试集。其中,Y表示包含有人脸非线性特征训练集和人脸非线性特征测试集的人脸非线性特征集,e(·)表示以自然常数e为底的指数操作,i表示虚数单位符号,α表示常数,其取值范围为[0.1,1.9],X表示包含有训练样本集和测试样本集的人脸数据样本集。步骤3,划分特征组。将人脸非线性特征训练集随机分成β个特征组。其中,分组个数β的取值为大于1的任意一个自然数,β应满足通过分组将每组的特征样本个数限定在[300,500]的范围内的条件。步骤4,构建人脸特征模型库。第一步,从所有特征组中任意选取一个特征组,按照下式,计算所选特征组的总离散度矩阵和类间离散度矩阵:其中,St表示所选特征组的总离散度矩阵,N表示所选的特征组中特征样本总数,∑表示求和操作,m表示所选特征组中特征样本的序号,ym表示所选特征组中的第m个特征样本,μ表示所选特征组的总均值向量,T表示转置操作,Sb表示所选特征组的类间离散度矩阵,c表示所选特征组中特征样本的类别总数,j表示所选特征组中特征样本的类别序号,nj表示所选特征组第j类特征样本的总数,γj表示所选特征组第j类特征样本的均值。第二步,按照下式,构建所选特征组的模型:M={μ,N,P,Λ,Q,Δ,nj,γj}其中,M表示所选特征组的模型,P和Λ分别表示对总离散度矩阵进行特征分解得到特征向量矩阵和特征值矩阵,Q和Δ分别表示对类间离散度矩阵进行特征分解得到特征向量矩阵和特征值矩阵;第三步,判断是否选完所有的特征组,若是,则执行第四步,否则,执行第一步;第四步,获得每一个特征组对应的人脸特征模型,用所有人脸特征模型组成人脸特征模型库。特征分解是按照下式,将可对角化矩阵分解为其特征值和特征向量矩阵之积的方法:A=GΦG-1其中,A表示待分解的矩阵,G表示矩阵A的特征向量矩阵,Φ表示矩阵A的特征值矩阵,-1表示矩阵求逆操作;步骤5,获得全局人脸特征模型。第一步,从人脸特征模型库中任意取出两个模型,合并所选的两个模型,将合并后的模型再放入人脸特征模型库中;第二步,判断人脸特征模型库中是否只剩一个模型,若是,则执行第三步,否则,执行步骤第一步;第三步,将人脸特征模型库中剩下的最后一个模型作为全局人脸模型。合并所选的两个模型的具体步骤如下:按照下式,计算合并后的模型的总离散度矩阵:其中,表示合并后的模型的总离散度矩阵,P1表示合并中的第一个模型总离散度矩阵的特征向量矩阵,Λ1表示合并中的第一个模型总离散度矩阵的特征值矩阵,1/2表示求平方根操作,P2表示合并中的第二个模型总离散度矩阵的特征向量矩阵,Λ2表示合并中的第二个模型总离散度矩阵的特征值矩阵,N1表示合并中的第一个模型的特征样本总数,N2表示合并中的第二个模型的特征样本总数,表示合并后的模型的特征样本总数,μ1表示合并中的第一个模型中特征样本的总均值向量,μ2表示合并中的第二个模型中特征样本的总均值向量;按照下式,计算合并后的模型的类间离散度矩阵:其中,表示合并后的模型的类间离散度矩阵,Q1表示合并中的第一个模型类间离散度矩阵的特征向量矩阵,Δ1表示合并中的第一个模型类间离散度矩阵的特征值矩阵,Q2表示合并中的第二个模型类间离散度矩阵的特征向量矩阵,Δ2表示合并中的第二个模型类间离散度矩阵的特征值矩阵,N1表示合并中的第一个模型的特征样本总数,nk1表示合并中的第一个模型第k类特征样本的总数,nk2表示合并中的第二个模型第k类特征样本的总数,表示合并后的模型中第k类特征样本的总数,γk1表示合并中的第一个模型第k类特征样本的均值,γk2表示合并中的第一个模型第k类特征样本的均值;将合并后特征样本的总均值、总离散度矩阵的特征向量矩阵、总离散度矩阵的特征值矩阵、类间离散度矩阵的特征向量矩阵、类间离散度矩阵的特征值矩阵、合并后每类特征样本的个数、合并后每类特征样本均值组成合并后的模型。步骤6,求解线性判别式分析LDA的投影矩阵。按照下式,计算辅助矩阵:其中,Ψ表示辅助矩阵,和分别表示全局人脸特征模型中总离散度矩阵的特征向量矩阵和特征值矩阵,-1/2表示对矩阵中每个元素求-1/2次幂操作,和分别表示全局人脸特征模型中类间离散度矩阵的特征向量矩阵和特征值矩阵。对辅助矩阵进行特征分解,得到辅助矩阵的特征向量矩阵。按照下式,计算线性判别式分析LDA的投影矩阵:其中,U表示线性判别式分析LDA的投影矩阵,W表示辅助矩阵的特征向量矩阵。步骤7,投影人脸非线性特征集。采用投影公式,利用线性判别式分析LDA的投影矩阵,对人脸非线性特征训练集和测试集分别进行投影。对人脸非线性特征训练集和测试集分别进行投影的公式如下:Z=UTY其中,Z表示投影后的人脸特征。步骤8,采用K最近邻分类器,对投影后的人脸特征进行分类识别。K最近邻分类器是一种分类算法,其具体实现步骤如下:在已知类别的数据集中找到与待分类数据点距离最近的K个邻域点,统计该K个邻域点的类别情况,将出现次数最多的类别作为该数据的分类结果。本发明中使用的距离度量方式按照下式定义:其中,d表示两个数据v1和v2的距离,v1和v2表示两个数据点,H表示厄米共轭操作。本发明的效果可以通过以下仿真实验进一步说明。1.仿真条件:本发明的仿真实验采用软件MATLABR2015a作为仿真工具,计算机配置为IntelCorei7/3.6GHz/16G,64位Windows7操作系统。本发明的仿真实验使用CMU-PIE人脸数据库作为实验数据,该数据库是由卡耐基梅隆大学创建,包含68位志愿者在13种不同姿态、4种不同表情和43种不同光照的条件下拍摄的超过41368张的人脸图像组成。实验中用C05姿态(接近正面姿态)子集,C05中包括68个人,每人有49张图像,裁剪成64*64的大小,本发明的图2是CMU-PIE数据库人脸样本示意图,为验证算法的鲁棒性,在每人的图像中随机选取10张图像加上5%-15%的黑白块噪声,图3是对图2加入不同程度黑白块噪声后的人脸样本示意图。2.仿真实验内容:本发明的仿真实验在CMU-PIE人脸数据库上进行,将本发明的方法分别与现有技术的线性判别式分析LDA和增量线性判别式分析ILDA两种特征提取方法在分类识别上做比较。每次实验分别从每类图像中随机选择21张图像作为训练样本,剩下的所有图像作为测试样本。实验过程中利用每种方法计算出的投影矩阵对测试样本进行投影,利用K最近邻分类器对投影后的测试样本进行分类,得出分类识别率,其中识别率高则表示提取的特征更好,鲁棒性更好;同时,记录每种方法计算出投影矩阵所用的时间,其中时间短则表示该方法运行快,计算效率高,节省计算资源。实验中本发明方法的分组方式采用平均分4组,参数α为1.1。仿真实验一共重复15次,分别取识别率和运行时间的平均值。本发明的仿真结果见表1,实验中三种方法的平均识别率随投影矩阵的列数变化的曲线图见图4。3.实验结果和分析表1:采用三种方法在CMU-PIE人脸数据库上的平均识别率和平均运行时间表方法类型LDAILDA本发明方法最高平均识别率(%)78.5978.9188.18平均运行时间(秒)14.0167.8566.756表1的最高平均识别率表明,本发明方法的最高平均识别率高于现有技术线性判别式分析LDA和增量线性判别式分析ILDA的最高识别率,其原因正是由于本发明方法采用欧拉公式,提取到了非线性特征,特征提取更准确,使得本发明方法的识别率更高,本发明方法鲁棒更强。表1的平均运行时间表明,本发明求解投影矩阵所用的时间更短,其原因正是由于本发明方法,使用分组提取特征模型并合并获得全局模型的方法,避免大矩阵分解,使得本发明更加节省计算资源,计算效率更高。图4是线性判别式分析LDA、增量线性判别式分析ILDA和本发明方法在CMU-PIE数据库中进行人脸识别的平均识别率随投影矩阵的列数变化的曲线图。图4中,横坐标表示投影矩阵的列数,纵坐标表示人脸识别的平均识别率(%)。由图4可见,本发明方法在不同的投影矩阵列数下都可以获得较高的识别率,说明本发明方法提取的人脸特征更准确,鲁棒性更强。综上所述,本发明在人脸识别中提取到了人脸非线性特征,使得本发明在人脸识别的过程中提高了人脸识别率。由于本发明在大数据量的人脸识别中采用划分特征组,从特征组中提取模型并合并模型的方法,使得本发明在人脸识别的过程中具有运行时间较短,使用计算资源较少的优点。本发明方法可以将多次的模型构建和合并操作并行化处理,可以用模型替换原始数据保存计算结果,使得本发明具有应用范围更广,应用更灵活的优点。当前第1页1 2 3