一种图像的特征提取与分类联合方法及系统的制作方法

文档序号：9844418阅读：479来源：国知局

一种图像的特征提取与分类联合方法及系统的制作方法
【技术领域】
[0001] 本发明涉及计算机视觉和图像识别技术领域，更具体的说，是涉及一种图像的特征提取与分类联合方法及系统。
【背景技术】
[0002] 在大量的实际应用中，现实中的数据可用高维的属性或特征进行描述。但是原始特征的维度可能很大，或者说样本是处于一个很高维的空间中，而通过特征映射或特征变换的方法，可将高维数据变换到一个低维空间。从高维特征中提取得到对分类最有效的特征一直以来是计算机视觉与图像识别等研究领域中非常重要而困难的研究课题之一。
[0003] 为了提取出描述更好的特征，在特征提取的过程中常常需要考虑数据之间的相似性或局部性。局部线性嵌入算法(Locally Linear Embedding，LLE)是一种有效的非线性降维方法，能够使降维后的数据保持原有的拓扑结构。LLE算法认为每一个数据点都可以由其近邻点的线性加权组合构造得到。算法的主要步骤分为三步：（1)寻找每个样本点的K个近邻点；（2)通过最小化重构误差
> 其中Σ 5^ = 1，计算得到样本点的局部重构系数矩阵SJ3)通过如下问题将所有样本点映射到低维空间Y:
[0004]
[0005] 该算法具有处理非线性数据的优点，但是是一种直推式方法，即无法高效处理新来的样本数据。
[0006] 在LLE算法的基础上，邻域保持嵌入算法(Neighborhood Preserving Embedding， NPE)被提出。NPE算法是LLE算法的线性化方法，也是一种非监督的降维方法，相比于LLE算法只能在训练数据点产生映射，NPE算法的优势在于可以将新的测试数据映射到低维空间。但和LLE-样，NPE也是采用传统的Frobenius范数距离对近邻重构错误进行度量，因此二者的共同缺点是无法准确度量近邻重构错误，且Frobenius范数对于噪音非常敏感。此外，二者均为降维方法，没有考虑分类错误，即无法确保提取得到的近邻保持特征对于分类来说是最优的，其特征提取的有效性和分类的准确性低。
[0007] 因此，提供一种可靠性更好的近邻重构错误度量方法，以及最小化近邻保持错误的同时最小化分类错误，确保得到的特征对于分类是最优的，是本领域技术人员亟待解决的问题。

【发明内容】

[0008] 有鉴于此，本申请提供一种图像的特征提取与分类方法及系统，基于核范数在度量重构错误时比Frobenius范数更有效的优点，本发明采用基于核范数度量的近邻重构错误最小化，以及L2，l-范数正则化的联合问题，提高了特征提取的有效性和分类的准确性。
[0009] 为了实现上述目的，现提出的方案如下：
[0010] -种图像特征提取与分类联合方法，包括：
[0011]获取训练样本的近邻样本，构造近邻图，并计算所述训练样本的重构系数矩阵；
[0012] 根据所述重构系数矩阵，基于核范数度量的近邻重构错误最小化的非线性流形学习，对训练样本进行低维流形特征学习，得到一个能提取低维流行特征的线性投影矩阵；
[0013] 基于所述线性投影矩阵提取的低维流行特征对分类器进行更新，通过最小化L2， 1-范数正则化的分类错误，完成分类器学习；
[0014] 利用所述线性投影矩阵提取测试样本的低维流行特征，利用学习后的分类器对测试样本分类。
[0015] 优选的，所述获取训练样本的近邻样本，包括：
[0016] 采用K最近邻分类算法，得到训练样本的K个近邻样本。
[0017]优选的，所述计算重构系数矩阵，包括：
[0018] 基于计算公式：
[0019]
[0020] 计算重构系数矩阵；
[0021] 其中，其中，分别为训练图像样本的第i，j个数据，NN(Xl)为训练图像样本^ 的近邻集合，xjGNN(xi)表示xj为样本xi近邻，| | | |表示向量的L2范数。
[0022] 优选的，所述根据所述重构系数矩阵，基于核范数度量的近邻重构错误最小化的非线性流形学习，对训练样本进行低维流形特征学习，得到一个能提取低维流行特征的线性投影矩阵，包括：
[0023]基于凸优化问题：
[0024]
[0025]输出所述线性投影矩阵；
[0026] 其中，α为权衡参数，S为得到的重构权重系数矩阵，| | | I*表示矩阵的核范数，| If为矩阵Frobenius范数，YT-SYT为近邻重构错误，ΡΧ-Υ为特征近似错误，Ρ为线性投影矩阵，Y为低维流行特征。
[0027] 优选的，所述基于所述线性投影矩阵提取的低维流行特征对分类器进行更新，通过最小化L2，1-范数正则化的分类错误，完成分类器学习，包括；
[0028]基于凸优化问题：
[0029]
[0030]完成分类器的学习；
[0031] 其中，W为分类器矩阵，β为权衡参数，^[^^，{(加拉^为训练样本的原始标签矩阵，其中L为样本的原始标签，c为类别数，对于每个有标签的数据^，如果属于类别i (1《i < c)则hi,j = l，否则hi,j = 0, | | | |f表示Frobenius范数，| | | |2,ι表示L2，l-范数。
[0032] -种图像特征提取与分类联合系统，包括：
[0033]训练预处理模块，用于获取训练样本的近邻样本，构造近邻图，并计算所述训练样本的重构系数矩阵；
[0034] 特征学习模块，用于根据所述重构系数矩阵，基于核范数度量的近邻重构错误最小化的非线性流形学习，对训练样本进行低维流形特征学习，得到一个能提取低维流行特征的线性投影矩阵；
[0035] 分类器学习模块，用于基于所述线性投影矩阵提取的低维流行特征对分类器进行更新，通过最小化L2，1-范数正则化的分类错误，完成分类器学习；
[0036] 测试模块，用于利用所述线性投影矩阵提取测试样本的低维流行特征，利用学习后的分类器对测试样本分类。
[0037]优选的，所述训练预处理模块包括
[0038]数据采集单元，用于采用K最近邻分类算法，得到训练样本的K个近邻样本，构造近邻图；
[0039]计算单元，用于基于计算公式：
[0040]
[0041] 计算重构系数矩阵；
[0042]其中，其中，xdPXj分别为训练图像样本的第i，j个数据，NN(Xl)为训练图像样本^ 的近邻集合，xjGNN(xi)表示xj为样本xi近邻，| | | |表示向量的L2范数。
[0043] 经由上述技术方案可知，本发明公开了一种图像特征提取与分类联合方法及其系统，首先根据训练样本间的相似性，构造训练样本的近邻图，并计算重构系数矩阵。进而引入基于核范数度量的近邻重构错误最小化的非线性流形学习，对训练图像样本进行低维流形特征学习，得到一个可获取样本低维流形特征的线性投影矩阵;再利用所述训练样本低维特征，最小化L2，l_范数正则化的分类错误，完成鲁棒稀疏分类器学习，输出一个最优分类器，从而对测试样本进行特征提取和分类。与现有技术相比，本发明通过采用核范数度量和L2，l_范数正则化的联合问题，有效提高了提取特征的描述性与分类准确率。
【附图说明】
[0044] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张召;张妍;李凡长;张莉;王邦军
技术所有人：苏州大学
我是此专利的发明人

上一篇：结合深度数据的异常行为检测方法及系统的制作方法
上一篇：一种人物画像与职位匹配的方法及系统的制作方法