基于稀疏特征和邻域同属性的高光谱图像分类方法
【专利摘要】本发明提供的是一种基于稀疏特征和邻域同属性的高光谱图像分类方法。包括:1、读入高光谱图像数据;2、求解字典D;3、求解稀疏特征A;4、设定训练集和测试集;5、支持向量机(Support?Vector?Machines,SVM)二分类;6、确定多分类结果;7、读入邻域尺度集合C;8、邻域划分;9、邻域同属性判定;10、重复进行步骤8和步骤9的循环操作,直到得到邻域同属性分类结果Yl,其为最终分类结果YM。本发明具有分类效果好、处理高维数据时花费代价低,且适用性强等优点。
【专利说明】基于稀疏特征和邻域同属性的高光谱图像分类方法
【技术领域】
[0001]本发明涉及一种高光谱图像的分类方法,特别是一种基于稀疏特征和邻域同属性的高光谱图像分类方法,属于遥感信息处理【技术领域】。
【背景技术】
[0002]高光谱数据的特点是数据量大、冗余多,维数较高,同时在波段之间存在着很强的相关性,从而为后续的处理带来了挑战。图像地物分类是遥感技术处理的主要内容,其依据是:相同类别的像元在光谱特征和空间特征上具有一致性,不同地物类别在光谱特征、空间特征上具有明显的差别。遥感图像分类过程,即将像元划分到相同类别中的过程。分类过程在高光谱图像处理中占有很重要的位置,如何使原始数据中丰富的地物信息在得到很好地描述的同时使其维数降低是一项十分重要的工作,因此如何充分的进行信息描述并取得较好的分类效果是一项关键技术。
[0003]在传统的分类方法中,对高维度数据进行特征信息提取之前,需要对数据进行降维处理,用较少的综合变量来代替原来较多的变量,同时综合变量要尽可能多的反映原来多变量包含的信息。其中经典的降维方法就是利用所有的波段通过主成分分析(PrincipalComponents Analysis,PCA)变换来压缩数据,该变换主要采用线性投影法将数据投影到新的坐标空间中,从而使得到的新成分按照信息量分布,第一主成分包含的信息量最大,第二主成分与第一主成分无关并且在剩余成分中包含的信息量最大,依此类推,其在降低数据维数的同时最大限度的保持了原始数据信息。随后用所提取出来的主成分做为分类特征进行分类。
[0004]传统的高光谱数据分类方法中存在以下几个问题:1、高光谱数据分类结果中存在“噪声”像元。2、分类精度不高3、处理时间较长。4、没有充分利用邻域信息。针对以上问题,本发明提出一种稀疏特征和邻域同属性的高光谱图像分类方法。
【发明内容】
[0005]本发明的目的是提供一种具有更优的分类效果,分类视觉效果好,分类精度高、处理高维数据时花费代价低,适用性强的基于稀疏特征和邻域同属性的高光谱图像分类方法。
[0006]本发明的目的是这样实现的:
[0007]( I)、读入高光谱图像数据
[0008]读入高光谱高维数据,进行维数转换,并对其作归一化处理得到X,其中含有样本类别数为s ;
[0009](2)、求解字典D
[0010]对X进行字典学习,得到高光谱数据所对应的字典D ;
[0011](3)、求解稀疏特征A
[0012]利用X和已经求得的字典D求解高光谱数据的稀疏特征A ;[0013]( 4 )、设定训练集和测试集
[0014]从A中将s个类别各选取一部分样本来构成训练集E,测试集设定为整个A ;
[0015](5)、支持向量机(Support Vector Mach1nes, SVM) 二分类
[0016]将具有监督信息的训练样本中属于第1,1 < 1 < s类样本对应的样本标号标记为+1,其余S-1的类别对应的样本标号标记为-1,训练样本经过SVM训练进而对测试样本进行二分类,并对分类结果进行存储;
[0017](6)、确定多分类结果
[0018]由步骤(5)的分类结果确定多分类的分类结果,得到稀疏分类结果Ytl ;
[0019](7)、读入邻域尺度集合C
[0020]确定其中尺度的个数为1,1≤1,其中C中尺度元素为cm,1≤m≤1 ;
[0021](8)、邻域划分
[0022]对稀疏分类结果Y0进行尺度为cm,1≤m≤1的划分,得到一系列cmX Cm尺寸的方形邻域;
[0023](9)、邻域同属性判定
[0024]计算各邻域结构的异属度,进行邻域同属性判定处理,输出分类结果Ym ;
[0025](10)、重复进行步骤(8)和步骤(9)的循环操作
[0026]其中步骤(8)中第m次的输入为步骤(9)中第m_l次的处理结果Ylrt,直到得到邻域同属性分类结果Y1,其为最终分类结果Ym ;
[0027]求解完毕,Ym即为基于稀疏特征和邻域同属性的高光谱图像分类方法的分类结果O
[0028]本发明至少包括以下特点中的一个:提取高光谱图像的稀疏特征来作为分类特征;采用支持向量机(Support Vector Mach1nes, SVM)—对余分类模型来进行多分类;采用邻域同属性判定的方法来对前期的分类结果来进行处理。主要特点体现在:
[0029](1)所述的基于稀疏特征和邻域同属性的高光谱图像分类方法,采用的高光谱图像的稀疏特征来作为分类特征。
[0030](2)多分类计算是利用一对余的SVM模型来完成。
[0031](3)所述的⑵中的一对余的SVM模型可以替换为其他多分类模型。
[0032](4)采用邻域同属性判定的方法来对(2)所得的分类结果进行处理。
[0033](5) (4)中邻域同属性判定采用的邻域尺度集合中尺度个数大于等于1。
[0034]本发明的优势在于其应用稀疏特征使得图像得到很好的表述,同时能够降低处理时所花费的代价;能够对图像中的邻域信息充分的利用,能够很好的消除“噪声”像元优化了分类效果;能够适用于不同的高光谱图像,其适用性强等优点。
【专利附图】
【附图说明】
[0035]图1为本发明的流程图。
[0036]图2为实验中的1nd1an P1nes高光谱数据的真实图像。
[0037]图3为实验中在1nd1an P1nes高光谱数据中所选取的原始各类的地物分布图。
[0038]图4为实验中在1nd1an P1nes高光谱数据中所选取的样本名称和样本数量表。
[0039]图5为实验中的Saunas高光谱数据的真实图像。[0040]图6为实验中在Saunas高光谱数据中所选取的原始各类的地物分布图。
[0041]图7为实验中在Saunas高光谱数据中所选取的样本名称和样本数量表。
[0042]图8a_图8d为实验中采用的两种不同方法对两个数据集分类后与之对应的各类地物的分类分布图,其中图8a、图8b、图8c、图8d分别对应着数据集一 PCA+SVM分类分布图,数据集一本发明方法分类分布图,数据集二 PCA+SVM分类分布图和数据集二本发明方法分类分布图。
[0043]图9为实验中采用的两种不同方法对两个数据集分类的评价指标表。
[0044]图10为实验中采用的两种不同方法对两个数据集运行的时间表。
【具体实施方式】
[0045]下面结合附图对本发明做出更详细的描述。
[0046]具体步骤如下:
[0047]1、读入高光谱图像数据。
[0048]读入三维的高光谱高维数据,对其进行维数转换使其从三维转换为二维数据以方便后续的处理,并对所得的二维数据作归一化处理得到X,确定要处理的样本类别数为S。
[0049]2、求解字典D 。
[0050]高光谱遥感图像数据集Z =字典=
( 每一列f 为一个原子),可以把稀疏表示表达为如下形式的优化问题:
[0051]min —IlX-DaII" +/?ΙΙαΙΙ s.t.dJ < I, V/ e 1,...,/--(I)
D,a 2丨丨,2
[0052]其中,a e 9?mxn为系数矩阵(每一列a7' e9T为高光谱数据xi对应的系数向量),入>0,参数λ平衡重构误差和稀疏性之间的折中关系。
[0053]通过对式(I)优化求解,最终得到高光谱数据所对应的字典D。
[0054]3、求解稀疏特征Α。
[0055]可以将像元X e X表示为字典D中原子的稀疏线性组合:
[0056]a(x) = arg min||x - Daf2 +(2)
[0057]则某像元X在字典D上的稀疏表示特征即为2 = ?(.ν)(,通过对式⑵的优化求解可以得到高光谱数据的稀疏特征Α。
[0058]这里需要说明步骤2和步骤3的求解可以通过SPAMS(SPArse ModelingSoftware)工具包来求解实现。
[0059]4、设定训练集和测试集。
[0060]从A中将s个类别各选取一部分样本来构成训练集E,测试集设定为整个A。
[0061]5、SVM 二分类。
[0062]5.1、进行样本标号。
[0063]将具有监督信息的训练样本中属于第i (I < i < s)类样本对应的样本标号标记为+1,其余s-Ι的类别对应的样本标号标记为-1。
[0064]5.2、SVM 二分类。[0065]A中的元素p的分类决策函数为仁(p)为式(3):
[0066]f ± (P) =<w, p>+b (3)
[0067]其中,截距b为
【权利要求】
1.一种基于稀疏特征和邻域同属性的高光谱图像分类方法,其特征是: (1)、读入高光谱图像数据 读入高光谱高维数据,进行维数转换, 并对其作归一化处理得到X,其中含有样本类别数为S ; (2)、求解字典D 对X进行字典学习,得到高光谱数据所对应的字典D ; (3)、求解稀疏特征A 利用X和已经求得的字典D求解高光谱数据的稀疏特征A ; (4)、设定训练集和测试集 从A中将s个类别各选取一部分样本来构成训练集E,测试集设定为整个A ; (5)、支持向量机即SVM二分类 将具有监督信息的训练样本中属于第i,1 ≤ i ≤ s类样本对应的样本标号标记为+1,其余s-Ι的类别对应的样本标号标记为-1,训练样本经过SVM训练进而对测试样本进行二分类,并对分类结果进行存储; (6)、确定多分类结果 由步骤(5)的分类结果确定多分类的分类结果,得到稀疏分类结果Ytl ; (7)、读入邻域尺度集合C 确定其中尺度的个数为1,l≥1,其中C中尺度元素为cm,1≤m≤l ; (8)、邻域划分 对稀疏分类结果Ytl进行尺度为cm,1 ≤ m ≤ l的划分,得到一系列CmX Cm尺寸的方形邻域; (9)、邻域同属性判定 计算各邻域结构的异属度,进行邻域同属性判定处理,输出分类结果Ym; (10)、重复进行步骤(8)和步骤(9)的循环操作 其中步骤(8)中第m次的输入为步骤(9)中第m-1次的处理结果Ylrt,直到得到邻域同属性分类结果Y1,其为最终分类结果Ym ; 求解完毕,Ym即为基于稀疏特征和邻域同属性的高光谱图像分类方法的分类结果。
【文档编号】G06K9/62GK103903010SQ201410120917
【公开日】2014年7月2日 申请日期:2014年3月28日 优先权日:2014年3月28日
【发明者】王立国, 杨京辉, 刘鲁涛, 林云 申请人:哈尔滨工程大学