基于熵与互信息的高光谱图像超像元分割方法与流程

文档序号:18034391发布日期:2019-06-28 23:05阅读:179来源:国知局
基于熵与互信息的高光谱图像超像元分割方法与流程

本发明属于高光谱图像超像元分割技术领域,具体涉及一种高光谱图像超像元分割方法。



背景技术:

在高光谱图像的处理中,如果把像元直接作为最小处理单元,由于处理单元小、空间特性考虑不足,在处理的过程中会存在数据冗余处理、椒盐噪声多等诸多问题。在高光谱图像中,空间相邻的若干像元很大几率上表示的是同一地物,其光谱特性十分相似,通过合适的分割后,把同一分割区域作为最小处理单元既能大大减少数据冗余,又能体现地物空间特性,所以图像分割成为高光谱图像的重要预处理方式。

ren和malik首先提出了超像元的概念,近年来,人们不断提出新的超像元分割算法。liu提出了一种熵率超像元分割算法,该算法由两部分组成:图上随机游走的熵率和平衡项。bergh通过能量驱动采样提出了一种超像元分割算法。从最初的超像元分区开始,它通过修改边界来不断地细化超像元。zhang提出将高光谱图像预聚类成简单线性迭代聚类(slic)超像元,然后以超像元作为输入执行基于le或se的维数降低。他们实现了高光谱图像的低维表示而不牺牲随后的分类性能。he和liu提出了一种简单主成分分析后第一主成分图像的超像元分割方法,显示了超像元分割尺度在高光谱图像稀疏表示分类领域的充分潜力。通过回顾这项研究,很明显在hsis细分中,虽然超像元分割仍在研究中,但它已经显示出了良好的前景。目前现有的大多数超像元分割方法主要仅基于对局部图像信息的分析,这些方法可能无法正确分割具有高强度变异性的图像区域,因此,目前现有的超像元分割方法存在着对超像元边界分割的准确度较低的问题。



技术实现要素:

本发明的目的是为了解决现有的超像元分割方法的边界分割的准确度低的问题。

本发明为解决上述技术问题采取的技术方案是:基于熵与互信息的高光谱图像超像元分割方法,该方法包括以下步骤:

步骤一、分别计算出高光谱图像的每个光谱带的熵;

步骤二、确定窗口大小为m,阈值因子为σ,对高光谱图像的光谱带进行初次选择,获得初次选择出来的光谱带;

步骤三、使用cie1931补充标准色度观察者颜色匹配函数对步骤二初次选择出来的光谱带进行第二次光谱带选择,获得选择出的光谱带集合

步骤四、计算光谱带集合中的光谱带之间的互信息i(xrn,ybn,zgn),其中:i(xrn,ybn,zgn)是光谱带xrn、ybn和zgn之间的互信息,光谱带光谱带光谱带利用三阶归一化互信息从光谱带集合中挑选出具有最大信息量和最小冗余的光谱带,利用挑选出的光谱带合成假彩色图像;

步骤五、设定分割幅度阈值u,对步骤四得到的假彩色图像进行初次分割,得到初次分割结果;

步骤六、利用颜色直方图驱动函数对步骤五获得的初次分割结果进行评估;

步骤七,调整步骤五初次分割结果中超像元的边界,获得假彩色图像的新的分割方案,再利用颜色直方图驱动函数对新的分割方案进行评估;

步骤八、重复步骤七的过程,直至达到设置的最大迭代次数时停止迭代,将最后一次迭代获得的分割方案作为假彩色图像最终的分割结果。

本发明的有益效果是:本发明的基于熵与互信息的高光谱图像超像元分割方法,本发明基于熵和颜色匹配函数对光谱带进行初步选择,排除了一些不相关的光谱带;再利用互信息越小,光谱带所含信息量越大、冗余越小的原则选择3n个光谱带(三组光谱带)来合成包含主要光谱信息的假彩色图像,最后利用评估函数,不断对已有超像元的边界进行调整,最终实现高光谱图像超像元分割,与现有方法相比,本发明方法在性能上优于现有的高光谱图像超像元分割方法,本发明方法可以将超像元边界分割准确度至少提高1.5%。

本发明适合应用于高光谱图像预处理阶段,对高光谱图像处理具有重要意义。

附图说明

图1是利用二值化阈值方法进行光谱带选择的示意图;

图2是本发明采用的paviac数据集的地物真实标记的示意图;

图3是采用本发明方法对paviac数据集图像进行超像元分割的分割结果示意图。

具体实施方式

具体实施方式一:如图1所示,本实施方式所述的基于熵与互信息的高光谱图像超像元分割方法,该方法包括以下步骤:

步骤一、分别计算出高光谱图像的每个光谱带的熵;

步骤二、确定窗口大小为m,阈值因子为σ,对高光谱图像的光谱带进行初次选择,获得初次选择出来的光谱带;

步骤三、使用cie1931补充标准色度观察者颜色匹配函数(cmf)对步骤二初次选择出来的光谱带进行第二次光谱带选择,获得选择出的光谱带集合

利用光谱带之间的差异性,将光谱带尽可能分成含有不同信息的三个集合,以便从三个集合中挑选出含有最大信息量的光谱带,高效且准确地实现高光谱数据降维。

步骤四、计算光谱带集合中的光谱带之间的互信息i(xrn,ybn,zgn),其中:i(xrn,ybn,zgn)是光谱带xrn、ybn和zgn之间的互信息,光谱带光谱带光谱带利用三阶归一化互信息从光谱带集合中挑选出具有最大信息量和最小冗余的光谱带,利用挑选出的光谱带合成假彩色图像;

步骤四将互信息理论与高光谱图像分割领域相结合,有效的实现了高光谱数据降维。

步骤五、设定分割幅度阈值u,对步骤四得到的假彩色图像进行初次分割,得到初次分割结果;

步骤六、利用颜色直方图驱动函数对步骤五获得的初次分割结果进行评估;

步骤七,调整步骤五初次分割结果中超像元的边界,获得假彩色图像的新的分割方案,再利用颜色直方图驱动函数对新的分割方案进行评估;

步骤八、重复步骤七的过程,直至达到设置的最大迭代次数时停止迭代,将最后一次迭代获得的分割方案作为假彩色图像最终的分割结果。

本实施方式提出了一种基于熵和互信息的超像元分割方法,它不仅可以捕获重要的全局图像属性,而且超像元分割的边界准确度等指标优于现有方法。

具体实施方式二:本实施方式与具体实施方式一不同的是:所述步骤一的具体过程为:

高光谱图像的每个光谱带均等效为一个对应的随机变量,且每个光谱带包含的所有像元都是对应的随机变量的事件;

若光谱带b对应的随机变量为x,则光谱带b的熵h(b)如公式(1)所示:

其中:xi′是随机变量x的第i′个事件,p(xi′)是xi′的概率密度,b是对数的底数,m0代表光谱带b包含的像元的个数;

同理,计算出高光谱图像的每个光谱带的熵。

具体实施方式三:本实施方式与具体实施方式一不同的是:所述步骤二的具体过程为:

通过公式(2)分别计算出每个窗口内的光谱带熵的平均值

其中:h(bi+p)代表窗口内第i+p个光谱带的熵;当m为奇数时,对-m/2向下取整得到p的取值;

对于每个窗口,均选择出窗口内满足公式(3)的光谱带bi;

其中:σ是阈值因子,将窗口内熵值在公式(3)的区间内的光谱带选择出来,完成初次光谱带选择。

对于某一个窗口,若窗口内光谱带熵的平均值为则选择出该窗口内的,且熵值处于区间内的光谱带。对于其他窗口,则采用同样的方法对光谱带进行选择。

采用本实施方式的目的是排除不相关的光谱带,以减少计算量,并提高边界分割的准确度。

具体实施方式四:本实施方式与具体实施方式一不同的是:所述步骤三的具体过程为:

将波长λ=360nm等效为第一有效的红外成像光谱带(aviris),将波长λ=830nm等效为最后有效的红外成像光谱带,在第一有效的红外成像光谱带与最后有效的红外成像光谱带之间进行线性插值来执行拉伸;

如图1所示,通过二值化阈值方法,从步骤二初次选择出来的光谱带中选择出光谱带集合即获得第二次光谱带选择结果;

其中:代表利用红色cmf系数选择出的光谱带集合,代表利用蓝色cmf系数选择出的光谱带集合,代表利用绿色cmf系数选择出的光谱带集合。

红色cmf系数、绿色cmf系数和蓝色cmf系数分别为cie颜色匹配曲线中的红刺激值(redtristimulusvalues)、绿刺激值(greentristimulusvalues)和蓝刺激值(bluetristimulusvalues);

图1中水平线代表频谱阈值分别为t=0.1和t=0.5的情况,保留光谱带cmf系数高于阈值t的那部分,得到光谱带集合同理可以得到

具体实施方式五:本实施方式与具体实施方式四不同的是:所述二值化阈值方法中的二值化阈值t的设定采用自动设置方法,即将二值化阈值t定义为最大化丢弃信息量的阈值;

二值化阈值t由公式(4)给出:

公式(4)即求取满足的最大的t值;

其中:为通过使用二值化阈值t对cmf系数进行阈值处理而删除的光谱带集合,为通过使用二值化阈值t对cmf系数进行阈值处理而选择出的光谱带集合;是所选择出的光谱带的熵的总和,是被删除的光谱带的熵的总和。

具体实施方式六:本实施方式与具体实施方式一不同的是:所述步骤四中利用三阶归一化互信息从光谱带集合中挑选出具有最大信息量和最小冗余的光谱带,利用挑选出的光谱带合成假彩色图像,其具体过程为:

三阶归一化互信息ni3(xrn,ybn,zgn)定义如下:

其中:h(xrn)是光谱带xrn的熵,h(ybn)是光谱带ybn的熵,h(zgn)是光谱带zgn的熵;

ni3(xrn,ybn,zgn)越小,说明被选择的光谱带所含信息越多,得到的降维结果越好;

选择出最小的n个互信息ni3(xrn,ybn,zgn)对应的光谱带,利用挑选出的3n个光谱带合成含有主要光谱信息且便于处理的假彩色图像。

找到使得ni3(xrn,ybn,zgn)最小,第二小…第n小,最后,将挑选出的3n个光谱带合成含有主要光谱信息且便于处理的假彩色图像。

互信息的计算原理为:

当这些信息测量应用于高光谱图像时,认为光谱带xrn等效于随机变量x,并且光谱带xrn的所有像元都是x的事件,光谱带ybn等效于随机变量y,并且光谱带ybn的所有像元都是y的事件,光谱带zgn等效于随机变量z,并且光谱带zgn的所有像元都是z的事件;

随机变量x的熵可以表示为:

其中xi是x的事件,p(xi)是xi的概率密度,b是对数的底数。

两个随机变量x和y,其中x有n种取值,y有m种取值,则x和y的联合熵表示为:

两个随机变量x和y的互信息表示为:

其中:h(x)是随机变量x的熵,h(y)是随机变量y的熵,h(x,y)是随机变量x和y的联合熵。

而三个随机变量的互信息可以表示为:

i(x;y;z)=h(x,z)+h(y,z)-h(x,y,z)

=-h(z)-i(x,y)

其中h(x,y,z)是三个随机变量x,y,z的三阶联合熵。

具体实施方式七:本实施方式与具体实施方式一不同的是:所述步骤五的具体过程为:

设定分割幅度阈值u,根据步骤四合成的假彩色图像的总像元数n和分割幅度阈值u得到初始超像元的大小如公式(6)所示:

式中:l是方形超像元大小,f(·)代表求上偶数(例如f(6.43)=8,f(7.89)=8),利用总像元数n和方形超像元大小l对假彩色图像进行初次分割,获得初次分割结果。

具体实施方式八:本实施方式与具体实施方式一不同的是:所述步骤六的具体过程为:

利用颜色直方图驱动函数对步骤五获得的初次分割结果进行评估,获得初次分割结果的颜色直方图驱动函数e(s)的函数值;

颜色直方图驱动函数e(s)的组成为:

e(s)=h(s)+g(s)(7)

式中:s表示分割结果中的分割区域,e(s)是分割区域的能量驱动函数,h(s)是颜色直方图度量函数;g(s)是边界平滑函数,g(s)代表所有的超像元的边界平滑能量的总和。

具体实施方式九:本实施方式与具体实施方式一不同的是:所述步骤七的具体过程为:

在初次分割结果的基础上,在超像元spl中的像元组成的边界方形像元块中随机选择出一个方形像元块,将选择出的方形像元块移位到与选择出的方形像元块距离最近的超像元中,再将超像元spl的剩余像元中的边界上任意一个像元移位到与该像元最邻近的超像元中;其中:spl代表初次分割结果中的第l个超像元;

当对初次分割结果中的所有超像元均遍历完成后,获得假彩色图像的新的分割方案;利用颜色直方图驱动函数对新的分割方案进行评估,得到新的分割方案对应的颜色直方图驱动函数e(s)的函数值。

本实施方式利用颜色直方图驱动函数e(s)对每次迭代获得的分割方案进行评估,可以促使分割方案向着更好的方向调整。

实施例

在本实验中采用paviac数据集,该数据集为rosis高光谱传感器系统在意大利南部的pavia市paviauniversity附近的市中心上空拍摄的。数据大小为1096×715像元,进行噪声波段去除后,图像总共包含102个光谱波段,分辨率达到1.3m。该地区包含9种地物,地物真实信息如图2所示。

整个分割过程如下:

第一,计算102个光谱波段的熵;

第二,选择合适的窗口大小m和阈值因子σ,得到初次选择的光谱带集合;

第三,利用cie1931补充标准色度观察者颜色匹配函数(cmf),将λ=360nm等效为被选择的光谱带集合中的第一有效光谱带,将λ=830nm等效为被选择光谱带集合的最后有效的光谱带,并在他们之间进行线性插值来执行拉伸,利用自动设置阈值的二值化阈值方法,得到光谱集合

第四,利用三阶归一化互信息最小的原则,挑选出3n个光谱带,并将其合成假彩色图像。

通过多次实验我们得知当n=1,m=20,σ=0.05时,分割效果最好。

第五,设定分割幅度阈值u,对得到的假彩色图像进行初次分割,得到分割结果;

第六,利用颜色直方图驱动函数e(s)对初次分割结果进行评估,e(s)的函数值越高评价越好;

第七,调整分割结果图中超像元的边界;

第八,不断进行迭代,当迭代次数满足条件时,停止,得到最终分割结果。

如图3所示为迭代次数取10,挑选光谱带组数n=1,窗口大小m=20,阈值因子σ=0.05时得到的高光谱图像效果图。

与现有的超像元分割方法相比,本发明方法的边界分割准确度至少提高1.5%。

本发明的上述算例仅为详细地说明本发明的计算模型和计算流程,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1