基于近邻边界最大的半监督高光谱数据降维方法

文档序号:6547005阅读:317来源:国知局
基于近邻边界最大的半监督高光谱数据降维方法
【专利摘要】本发明公开了一种基于近邻边界最大的半监督高光谱数据降维方法,主要解决现有技术需要大量监督信息且降维后数据判别性差的问题。其步骤为:1.将遥感数据库样本集划分为训练数据集和标记样本集;2.生成标记样本集的散度矩阵;3.生成训练数据集的空间近邻矩阵;4.生成训练数据集的相似度矩阵;5.根据散度矩阵,通过最大边界准则构造半监督判别项;6.构造半监督正则项;7.通过最小化判别项和正则项之和获取最优投影矩阵,以实现降维。本发明采用低秩表示的流形正则和空间一致性的空间正则来构造正则项,采用空谱联合的正则策略,使得投影矩阵更加鲁棒、完备,提高了降维后数据的判别的性能,可用于高光谱数据的分类识别。
【专利说明】基于近邻边界最大的半监督高光谱数据降维方法
【技术领域】
[0001]本发明属于图像处理【技术领域】,更进一步涉及一种数据降维方法,可用于遥感影像数据的降维与分类。
【背景技术】
[0002]高光谱遥感技术现已经成功应用于国防安全,环境监测,资源勘查等领域,是现代高科技技术之一,但是,高光谱遥感影像的数据处理技术的发展则相对滞后于影像成像设备等硬件方面的发展,这使得高光谱遥感技术进一步的推广应用受到制约。分类是对高光谱遥感影像丰富的地物信息进行分析和对遥感信息解译的重要途径,因此,对高光谱遥感数据地物分类的研究有着十分重要的实用价值。
[0003]高光谱遥感影像包含丰富的地物空间、辐射和光谱信息,具有较高光谱分辨率和空间分辨率等优点,并且,将决定地物性质的光谱和决定地物空间与几何特性的图像有机的结合在一起,有利于进行地物的分类和目标识别。
[0004]高光谱遥感数据提供了丰富的地物信息,但是,在带来丰富信息的同时,其海量的高维数据也给传统的分类算法提出了很大的挑战。一方面,对于高光谱遥感影像的分类算法,有监督分类算法需要较大规模的标记样本,否则分类精度很低,再者高维的海量数据为数据训练学习带来巨大的时间复杂度和计算复杂度,因此,在减少运算量的同时提高分类精度,已成为高光谱遥感领域的研究热点。另一方面,高光谱数据中相邻波段之间存在高度的冗余性,因此,在对高光谱遥感数据进行利用之前对数据进行预处理,减少冗余信息,不仅可以降低数据的维数,为后续的分类处理减少计算量,并且还可以获取更加鲁棒、精准的分类结果。
[0005]现有的经典的降维方法主要有以下三类:
[0006](一)无监督降维方法:如主成分分析PCA,是通过最大方差理论,将数据投影到最大方差的方向。这种方法由于没有监督信息,降维后的数据不具有很好的判别性能。
[0007]( 二)监督降维方法:如线性判别分析LDA,通过最大化类间散度矩阵和最小化类内散度矩阵的比值而获得投影矩阵,LDA比PCA具有较好的判别性能,但LDA降维后的最高维数为c-1,且不适合非高斯分布数据的降维,使得普适性变差,其中c为样本类别数。
[0008](三)半监督降维方法:通过大量无标记样本来学习数据的结构,是无监督学习的重点。现有的半监督方法主要集中在数据的流形正则,没有考虑到数据的全局结构,且忽略了影像数据的空间信息,使得影像数据的空间结构信息不能有效地利用。

【发明内容】

[0009]本发明的目的在于针对上述已有技术的不足,提出一种基于近邻边界最大的半监督降维方法,利用少量的监督信息,实现对高光谱遥感数据的高效降维。
[0010]实现本发明目的的技术方案是:通过低秩表示正则获取数据的结构和空间一致性约束获取影像的空间结构信息,进而通过特征值分解获得最优投影矩阵,实现数据的降维。具体步骤包括如下:
[0011](I)将遥感影像数据库样本集划分为训练数据集X和标记样本集Y ;
[0012](2)生成标记样本集的散度矩阵:
[0013]2a)通过相似散度矩阵公式生成标记样本集的相似散度矩阵:
【权利要求】
1.一种基于近邻边界最大的半监督高光谱数据降维方法,包括以下步骤 (1)将遥感影像数据库样本集划分为训练数据集X和标记样本集Y; (2)生成标记样本集的散度矩阵: 2a)通过相似散度矩阵公式生成标记样本集的相似散度矩阵:
2.根据权利要求1所述的基于近邻边界最大的半监督高光谱数据的降维方法,其中,步骤(1)所述的将遥感影像数据库样本集划分为训练数据集X和标记样本集Y,按如下步骤进行: Ia)将待处理遥感数据集中,随机选择40%的数据构成训练样本数据集X e Rdxm,剩余的60%数据作为测试样本数据集T e Rdxt,其中,D表示训练集样本和测试集样本的维数,Rn表示η维实数空间,M表示训练集样本的总数,T表示测试集样本的总数; Ib)在训练数据集X中,每类随机选取k个样本构成有监督信息的标记样本集Y e Rdxq,其中Q = cXk,c为类别数; Ic)在标记样本集Y中,对每个标记样本yi通过欧式距离计算其同质近邻集J \和异质近邻集I"、
【文档编号】G06K9/62GK104008394SQ201410213709
【公开日】2014年8月27日 申请日期:2014年5月20日 优先权日:2014年5月20日
【发明者】杨淑媛, 焦李成, 冯志玺, 刘芳, 缑水平, 侯彪, 王爽, 杨丽霞, 邓晓政, 任宇 申请人:西安电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1