基于局部空间信息的封装式高光谱波段选择方法

文档序号:10489412阅读:790来源:国知局
基于局部空间信息的封装式高光谱波段选择方法
【专利摘要】本发明提出一种基于局部空间信息的封装式高光谱波段选择方法,其步骤如下:1)输入待波段选择的高光谱图像,将其转换为矩阵形式的高光谱数据并作归一化处理;2)使用支撑向量机SVM作为分类器,采用交叉验证的方法选择M个初始波段;3)将M个波段与剩余波段逐一组合,计算出各组合波段的能量函数E(f);4)使用现有图切方法对组合波段的能量函数E(f)进行能量最小化;5)根据各组合波段能量函数值的大小进行波段选择。本发明对高光谱图像中的光谱信息和局部空间信息进行了有效融合,相对于只利用光谱维信息的方法,选择波段的识别性能有了很大提升,可用于高光谱图像的数据降维。
【专利说明】
基于局部空间信息的封装式高光谱波段选择方法
技术领域
[0001] 本发明属于图像处理技术领域,更进一步涉及高光谱影像波段选择领域中的封装 式高光谱波段选择方法,可用于高光谱图像处理中的数据降维。
【背景技术】
[0002] 遥感技术经过20世纪后半叶的发展,在理论上、技术上以及应用上都有重大进步, 而其中高光谱图像技术尤为突出。高光谱图像通过搭载在空间平台上的高光谱传感器,即 成像光谱仪,在电磁波谱的紫外、可见光、近红外和中红外区域,以数十乃至数百个连续且 细分的光谱波段对目标区域同时成像。高光谱图像技术使得图像的谱分辨率有了很大的提 高,是遥感发展的一个重大突破。一个高光谱图像数据集包含数百个具有极高光谱分辨率 的光谱波段,运用高光谱图像中丰富的光谱信息可以达到精确的目标识别。但是其庞大的 数据量、高维的数据形式、信息的高度冗余也给后续的数据处理带来巨大挑战。因此,如何 最大程度地保留高光谱数据丰富的光谱信息,同时又降低数据维度成为了高光谱图像处理 的重要技术问题之一。
[0003] 高光谱图像常用的降维方法有两种,分别是特征提取和波段选择。特征提取法通 过结合原始波段集合来生成新的波段集合,一般是通过线性或非线性的方法将高维波段空 间映射至低维波段空间,新生成的波段集合维数小于原始波段集合维数,从而达到降维的 目的。常用方法有PCA主成分分析法,FLD线性判别法等等。特征提取法新生成的波段是原始 波段经过变换组合后得到的,改变了原始的数据,破坏了原始数据中包含的内在物理意义。 波段选择法是通过在原始波段集合中挑选出部分波段组成新的波段集合,并没有对其做任 何改变,保持了数据的完整性,同时也保留了波段所对应的物理含义,并且达到缩小数据 量、消除噪声波段等目的。
[0004] 根据波段选择步骤与分类器模型的不同结合方式,波段选择可以分为三种类型, 分别是过滤式、封装式和嵌入式,其中:
[0005] 过滤式波段选择,其步骤完全独立于分类器模型,通过数据自身的性质来获取波 段的相关性。该方法会对每个波段计算出一个相关性值,根据相关性值来挑选波段,通常选 择相关性值大的波段,剔除掉相关性值小的波段,在波段选择完成之后,将波段选择子集对 应的数据输入到分类器中。过滤式波段选择忽略了波段选择与分类器之间的联系,选择的 波段子集不能很好地匹配学习算法,因此在后续分类应用上性能并不好。
[0006]封装式波段选择,其步骤与分类器模型完全结合在一起。具体的实现方式是:在每 一步的波段选择过程中,将待选波段与已选波段组合起来输入到分类器,使用分类器的分 类精度作为指标,挑选出使分类器性能达到最优的波段,直到达到结束条件为止,所以封装 式方法所选择的波段子集的分类性能较过滤式和嵌入式更好。封装式完全由分类器来指导 波段选择的过程,与所选分类器关系密切,然而现有的分类器,只利用了高光谱数据的谱信 息,未能将空间信息与谱信息进行有机结合。
[0007]嵌入式波段选择,其结合了学习算法和波段选择机制去评价学习过程中被考虑的 波段,学习训练和波段选择同时进行,互相结合,构造分类模型的过程就是选择波段的过 程,重复循环迭代,当分类模型构造结束时,波段选择的最后结果即为分类模型中包括的波 段。这种嵌入式波段选择方法由于同时结合了过滤式和封装式,因此处理过程更为复杂。

【发明内容】

[0008] 本发明的目的在于针对以上现有技术的不足,提出一种基于局部空间信息的封装 式高光谱波段选择方法,以提高分类精度。
[0009] 本发明的技术思路是:同时利用高光谱数据的光谱信息和图像的空间信息,将建 立在能量函数最小化基础上的graph-cut作为评价波段性能的标准,从而得到性能较好的 波段,达到高光谱数据降维的目的。其实现方案包括如下:
[0010] (1)输入待波段选择的高光谱图像,假设图像的原始波段数目为P,并将该高光谱 图像转换为矩阵形式的高光谱数据;
[0011] (2)对高光谱数据进行归一化处理,将其光谱值归一化到0-1之间;
[0012] (3)使用支撑向量机SVM作为分类器,采用交叉验证的方法从归一化后的高光谱图 像中选择出M个初始波段;
[0013] (4)将已选的M个波段分别与原始波段集合中剩余的未选波段逐一结合成组合波 段,利用支撑向量机得出每个组合波段中的像素样本的初始标签集f和像素样本分别属于 高光谱图像某个类别的估计概率P;
[0014] (5)根据每一个像素的类别估计概率p计算出像素本身的光谱能量项,将所有像素 的光谱能量项相加得到光谱项Ed;
[0015] (6)根据波特模型计算出每个像素与其空间上相邻像素之间的空间能量项,将所 有像素的空间能量项相加得到空间项E s;
[0016] (7)由光谱项Ed和空间项Es相加得到各个组合波段的能量函数E(f);
[0017] (8)利用graph-cut图切方法对各组合波段的能量函数进行能量最小化,得到各组 合波段的最终标签集7和能量£'(y);
[0018] (9)对比所有组合波段的能量玢;?),选择其中五(乃最小的组合波段,该组合波段 中的第M+1个波段即为所需波段。
[0019] 本发明与现有技术相比具有以下优点:
[0020] 1.现有的波段选择方法大多只利用了高光谱数据的光谱维信息,而忽略了其空间 信息,本发明将高光谱的空间信息加入到评价波段性能的标准中,所选择出的波段能同时 反映光谱信息与空间信息,表达能力更强。
[0021] 2.本发明将现有波段选择方法所忽略的空间信息结合到光谱信息中,利用了高光 谱数据的更多信息,所以其分类精度更高。
【附图说明】
[0022]图1是本发明的实现流程图;
[0023] 图2是在印第安纳州高光谱图像上本发明与已有技术的选择效果对比曲线图;
[0024] 图3是在博茨瓦纳高光谱图像上本发明与已有技术的选择效果对比曲线图;
[0025] 图4是在肯尼迪航天中心高光谱图像上本发明与已有技术的选择效果对比曲线 图。
【具体实施方式】
[0026] 参照附图1,本发明的实现步骤如下:
[0027] 步骤1、输入数据。
[0028] 输入待波段选择的高光谱图像,假设图像的原始波段数目为P,将图像转换为矩阵 形式的高光谱数据。
[0029]步骤2、对高光谱数据作归一化处理。
[0030]为方便后续数据处理,对高光谱数据作归一化处理,将高光谱图像的光谱值归一 化到0-1之间。
[0031] 步骤3、选取标记样本。
[0032] 从高光谱图像中选具有类别信息的像素点作为样本点,再从样本点中随机选取百 分之十作为标记样本,参与后续运算。
[0033]步骤4、基于交叉验证方法使用支撑向量机SVM在原始波段中进行波段选择。
[0034] (4a)设已经选择的波段集合为S,起始时S为空,即S=[];
[0035] (4b)选择第一个波段
[0036] (4b. 1)使用5折交叉验证的方法,将已知标记样本平均分为五等份,交替使用其中 一份作为训练样本,其余的四份作为测试样本,用支撑向量机SVM对标记样本进行分类,本 例中SVM分类器使用I ibsvm-3.20实现,参数为c = 1024,g = 2_7,其余参数为默认值,得到P个 原始波段的分类准确度;
[0037] (4b. 2)从P个原始波段的分类准确度中选择分类准确度最高的波段,将该波段记 为si;
[0038] (4b. 3)在原始波段集合中去掉波段S1,将波段81加入已选波段集合S,则已选波段 集合S=[si];
[0039] (4c)选择第二个波段:
[0040] (4c. 1)使用5折交叉验证的方法,进行第二个波段的选择,即将已经被选择的波段 S1分别与剩余未选波段组合,得到P-I个组合波段,用支撑向量机SVM对标记样本进行分类, 得到P-I个组合波段的分类准确度;
[0041] (4c. 2)从P-I个组合波段的分类准确度中选择准确度最高的组合波段,将该组合 波段中的第二个波段记作S2 ;
[0042] (4c. 3)在原始波段集合中去掉波段S2,将波段82加入已选波段集合S,则已选波段 集合S=[S1,S2];
[0043] (4d)选择第m+1个波段:
[0044] (4d.l)使用5折交叉验证的方法,即将P-m个剩余原始波段中的任意一个波段记作 b,此时已选波段S=[ S1,S2...Sm],将已选波段S与b组合得到P-m个组合波段,记作Q=[… s m,b],用支撑向量机SVM对标记样本进行分类,得到P-m个组合波段的分类准确度;
[0045] (4d. 2)从P-m个组合波段的分类准确度中选择准确度最高的组合波段,将该组合 波段中的波段b记作sm+1;
[0046] (4d.3)在剩余原始波段中去掉波段sm+1,将sm+1加入已选波段集合S,则此时已选波 段集合S - [ SI,S2 · · · Sm,Sm+1 ];
[0047] (4e)重复执行步骤(4d),直至选择波段达到所需的波段数目,此时已选集合S即为 所需波段,本例中共选择了 M个波段。
[0048] 步骤5、计算光谱项Ed。
[0049] (5a)选择P-M个波段中的一个波段记为b,将波段b与已选波段集合S结合为一个组 合波段,记为G=[S b];
[0050] (5b)使用支撑向量机SVM得到组合波段G中样本点的类别估计概率P(L1Ix 1),其中 ^表示高光谱图像中的样本点,1^表示高光谱图像的类标,计算衡量给样本^赋以类标1^的 误差:
[0051] Vi(Li) =_ln(p(Li I Xi))
[0052] 其中,I < i <n,n表示高光谱图像中样本点的个数;
[005"π 、'一一…光谱项Ed:
[005
[0055] 步骤6、计算空间项Es。
[0056] (6a)选择P-M个波段中的一个波段记为b,将波段b与已选波段集合S结合为一个组 合波段,记为G=[S b];
[0057] (6b)使用支撑向量机SVM得到G的样本点的初始标签集f,将f表示为[L1, T ? 2 · · · T ? 1T ? j · · · ] I
[0058] (6b)计算空间上两个样本Xi和Xj的差异性:
[0059] 1
[0060]
[0061]
[0062]
[0063]
[0064]其中,i~j表示空间上相邻的一对样本。
[0065] 步骤7、计算组合波段G的能量函数E(f)。
[0066] E(f)=Ed+Es
[0067] 其中,Ed表示波段集合的光谱项,Es表示波段集合的空间项。
[0068]步骤8、使用graph-cut图切方法对组合波段进行能量最小化。
[0069] (8a)随机将初始标签集f中的部分标签Li换成标签α,其中α为高光谱图像的类标 之一,得到调整后的标签集f' ;
[0070] (8b)根据调整后的标签集f',利用argmin寻参函数计算使组合波段G的能量函数 最小的候选标签集:/ = arg min \其中,E(f ')表示调整后的标签集f '的能量函数;
[0071] (8c)计算最终标签集7":
[0072]
[0073] 其中,表示调整后的标签集/的能量函数;
[0074] (8d)反复迭代步骤(Sa)-(Sc),直到标签集7不再变化为止,则该标签集;?对应的 能量函数MY)即为组合波段G的能量值。
[0075]步骤9、进行波段选择。
[0076]比较所有组合波段的能量函数选择其中哥:?最小的组合波段G,将G中的波 段b作为已选波段加入波段集合S,同时从未选波段集中去掉该波段;
[0077]重复执行步骤5至步骤8,直至选择波段达到所需的波段数目,此时已选集合S即为 所需波段。
[0078]以下结合仿真图对本发明的效果做进一步的说明。
[0079] 1.仿真条件:
[0080] 硬件平台为:处理器为Inter Core i7-5557U,主频为3 .IOGHz,内存为4GB;
[0081 ] 软件平台为:Windows 10家庭版64位操作系统,MatlabR2015b。
[0082] 2.仿真数据:
[0083]本例中采用的是通过机载可见光及红外成像光谱仪AVIRIS获取的印第安纳州高 光谱图像,由NASA EO-I获取的博茨瓦纳高光谱图像,以及NASA AVIRIS获取的肯尼迪航天 中心高光谱图像进行分类算法仿真;将印第安纳州高光谱图像记为Indian pines,将博茨 瓦纳高光谱图像记为Botswana,将肯尼迪航天中心高光谱图像记为KSC。
[0084] 三幅图像的高光谱数据以及对应的ground truth图来自于:
[0085] http://www.ehu.es/ccwintco/index.php?titIe = Hyperspectral_Remote_ Sensing_Sce nes.
[0086] 3.仿真内容:
[0087] 为了验证波段选择的有效性,一般在进行波段选择以后,会以ground truth图中 的类别作为标签,进行高光谱图像分类实验,以分类准确度作为波段选择性能的判断标准。
[0088] (3.1)仿真一:
[0089] 实验选择现有四个具有代表性的波段选择方法与本发明进行比较,这四种方法分 别是基于相似度的无监督高光谱波段选择方法SBBS、基于交叉验证精度的支撑向量机波段 选择方法SVMCV、代表分量分析法ECA、最大相关最小冗余法MRMR;
[0090] 用本发明与现有四种波段选择方法对Indian pines图像作波段选择,共选取100 个波段,对高光谱图像的所有样本提取所选波段组成新的样本集合X,根据新的样本集合对 高光谱数据进行分类,从X中随机选择10%的样本作为训练样本,剩余样本作为测试样本, 使用支撑向量机SVM分类器做分类实验,分别得到五种方法的分类准确度;本实验中SVM分 类器使用libsvm-3.20实现,SVM采用径向基函数核,参数为c = 1024,g = 2-7,其余参数为默 认值;结果如附图2;
[0091] 附图2中呈现了五种方法分别挑选出10至100个波段后用于分类得到的准确度。从 图2中可以看出,本发明的效果优于现有四种方法,尤其是本发明挑选出20个波段所取得的 效果就已经优于现有四种方法获取50个波段时候的性能,说明本发明的波段选择性能更优 秀。
[0092] (3.2)仿真二:
[0093]用本发明与上述现有四种波段选择方法对Botswana图像作波段选择,共选取50个 波段,对高光谱图像的所有样本提取所选波段组成新的样本集合Y,根据新的样本集合对高 光谱数据进行分类,从Y中随机选择10 %的样本作为训练样本,剩余样本作为测试样本,使 用支撑向量机SVM分类器做分类实验,分别得到五种方法的分类准确度;本实验中SVM分类 器使用Iibsvm-3.20实现,SVM采用径向基函数核,参数为c = 1024,g = 2-7,其余参数为默认 值;结果如附图3;
[0094] 附图3中呈现了五种方法分别挑选出5至50个波段后用于分类得到的准确度。从图 3中可以看出,本发明的效果优于现有四种方法,尤其是本发明挑选出15个波段所取得的效 果就已经优于现有四种方法获取50个波段时候的性能,说明本发明的波段选择性能更优 秀。
[0095] (3.3)仿真三:
[0096] 用本发明与上述现有四种波段选择方法对KSC图像作波段选择,共选取100个波 段,对高光谱图像的所有样本提取所选波段组成新的样本集合Z,根据新的样本集合对高光 谱数据进行分类,从Z中随机选择10%的样本作为训练样本,剩余样本作为测试样本,使用 支撑向量机SVM分类器做分类实验,分别得到五种方法的分类准确度;本实验中SVM分类器 使用I ibsvm-3.20实现,SVM采用径向基函数核,参数为c = 1024,g = 2_7,其余参数为默认值; 结果如附图4;
[0097] 附图4中呈现了五种方法分别挑选出10至100个波段后用于分类得到的准确度。从 图4中可以看出,本发明的效果优于现有四种方法,尤其是本发明挑选出20个波段所取得的 效果就已经优于现有四种方法获取100个波段时候的性能,说明本发明的波段选择性能更 优秀。
[0098] 综上,本发明的效果明显优于其它几种方法,在不同波段数目的情况下,相对其他 方法性能都有了明显提升,表明本发明是十分有效的。
【主权项】
1. 一种基于局部空间信息的封装式高光谱波段选择方法,包括: (1) 输入待波段选择的高光谱图像,假设图像的原始波段数目为P,并将该高光谱图像 转换为矩阵形式的高光谱数据; (2) 对高光谱数据进行归一化处理,将其光谱值归一化到0-1之间; (3) 使用支撑向量机SVM作为分类器,采用交叉验证的方法从归一化后的高光谱图像中 选择出Μ个初始波段; (4) 将已选的Μ个波段分别与原始波段集合中剩余的未选波段逐一结合成组合波段,利 用支撑向量机得出每个组合波段中的像素样本的初始标签集f和像素样本分别属于高光谱 图像某个类别的估计概率P; (5) 根据每一个像素的类别估计概率P计算出像素本身的光谱能量项,将所有像素的光 谱能量项相加得到光谱项Ed; (6) 根据波特模型计算出每个像素与其空间上相邻像素之间的空间能量项,将所有像 素的空间能量项相加得到空间项Es; (7) 由光谱项Ed和空间项Es相加得到各个组合波段的能量函数E(f); (8) 利用graph-cut图切方法对各组合波段的能量函数进行能量最小化,得到各组合波 段的最终标签集/和能量巧7); (9) 对比所有组合波段的能量巧.不),选择其中巧y)最小的组合波段,该组合波段中的第 M+1个波段即为所需波段。2. 根据权利要求1中所述的基于局部空间信息的封装式高光谱波段选择方法,其特征 在于,步骤(3)中使用支撑向量机SVM进行波段选择,按如下步骤进行: (3a)选择高光谱图像中具有类别信息的像素点作为样本点,并在样本点中随机选取 10 %作为标记样本; (3b)设已经选择的波段集合为S,起始时S为空,即S=[]; (3c)使用5折交叉验证的方法,进行第一个波段的选择,即将已知标记样本平均分为五 等份,交替使用其中一份作为训练样本,其余的四份作为测试样本,用支撑向量机SVM对标 记样本进行分类,得到P个原始波段的分类准确度,选择其中准确度最高的波段,将该波段 记为S1,并在原始波段集合中去掉波段S1,将波段S1加入已选波段集合S,则已选波段集合S =[S1]; (3d)使用5折交叉验证的方法,进行第二个波段的选择,即将已经被选择的波段S1分别 与剩余未选波段组合,得到P-1个组合波段;用支撑向量机SVM对标记样本进行分类,得到P- 1个组合波段的分类准确度,选择其中准确度最高的组合波段中的未选波段,将该波段记作 S2,并在原始波段集合中去掉波段S2,将S2加入已选波段集合S,则已选波段集合S=[S1,S2]; (3e)使用5折交叉验证的方法,进行第m+1个波段的选择,即将P-m个剩余原始波段中的 任意一个波段记作b,此时已选波段S= ,S2. . . Sm],将已选波段S与b组合得到p-m个组合 波段,记作Q=[S1. . .Sm,b],用支撑向量机SVM对标记样本进行分类,得到P-m个组合波段的 分类准确度,选择其中准确度最高的组合波段中的未选波段,将该未选波段记作Sm+l,并在 剩余原始波段中去除掉该波段,将Sm+1加入已选波段集合S,则此时已选波段集合S=[S1, S2 . . . S皿 J S皿+1 ]; (3f)重复执行步骤(3e),选择波段直至达到所需的波段数目,此时已选集合S即为所需 波段。3. 根据权利要求1中所述的基于局部信息的封装式高光谱波段选择方法,其特征在于, 步骤(5)中计算光谱项Ed,按如下步骤进行: (5a)选择未选波段中的一个波段记为b,将波段b与已选波段集合S结合为一个组合波 段,记为G=[S b]; (5b)使用支撑向量机SVM得到G中样本点的类别估计概率p ai I xi),其中xi表示高光谱 图像中的样本点,L康示高光谱图像的类标,计算衡量给样本xi赋W类标k的误差: Vi(Xi) = -ln(p(Xi|xi)) 其中,1 < i <n,n表示高光谱图像中样本点的个数; 巧C)计算组合波段G的光谱项Ed:4. 根据权利要求1中所述的基于局部信息的封装式高光谱波段选择方法,其特征在于, 步骤(6)中计算空间项Es,按如下步骤进行: (6a)选择未选波段中的一个波段记为b,将波段b与已选波段集合S结合为一个组合波 段,记为G = [S b]; (6b)使用支撑向量机SVM得到G的样本点的初始标签集f,将f表示为[Li, L/2 · · · LiLj] S (6b)计算空间上两个样本义1和^的差异性: Wi.jai,Lj)=iKi-sai,Lj))其中,β是控制空间平滑性重要程度的参数,取值为β=1; (6c)计算组合波段G的空间项Es:其中,i~j表示空间上相邻的一对样本。5. 根据权利要求1中所述的基于局部信息的封装式高光谱波段选择方法,其特征在于, 步骤(8)中使用graph-cut图切方法对组合波段进行能量最小化,按如下步骤进行: (8a)随机将初始标签集f中的部分标签以换成标签α,其中α为高光谱图像的类标之一, 得到调整后的标签集f'; (8b)根据调整后的标签集f',利用argmin寻参函数计算使组合波段G的能量函数最小 的候选标签集/./ = argmin£(/')其中,E(f')表示调整后的标签集f'的能量函数; (8c)计算最终标签集7;其中,表示调整后的标签集/的能量函数; (8d)反复迭代步骤(8a)-(8c),直到标签集7不再变化为止,则该标签集7对应的能量 函数幻'y')即为组合波段G的能量值。
【文档编号】G06K9/00GK105844297SQ201610164988
【公开日】2016年8月10日
【申请日】2016年3月22日
【发明人】曹向海, 梁甜, 李泽瀚, 李星华, 焦李成
【申请人】西安电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1