本发明属于遥感影像智能化分析技术领域,特别涉及一种输电线路走廊区域自动选择特征的植被分类方法。
背景技术:
随着国民经济快速增长,电网建设迅猛发展,输电线路的安全稳定运行是保障人们生活的重要条件。我国输电线路送电距离长、跨越区域广、沿途地形与地质条件复杂。植被是陆地生态系统的主体,作为绿地系统主要组成部分,其在整个生态系统中发挥着不可替代的作用。对电力系统中高压输电线路而言,林木植被的走向和分布对输电线路的设计和运行有着重大影响。例如,输电线路杆塔高度、杆塔选址以及输电线路的设计均受植被生长情况的影响。特别是近年来,输电线路走廊附近山林火灾、烧荒等引发的线路跳闸事故频发,造成巨大的经济损失。除人为因素外,山林植被自燃造成的火灾是引发跳闸的主要原因。随着电网建设的不断发展,高压、特高压输电线路将覆盖更多复杂环境的地区,无论是已经开发和利用的耕地、针叶林,还是未经开发的自然保护区,对植被种类及生长情况的监测都将成为输电线路建设和安全运行所必须面对的关键问题。我国输电线路覆盖范围广,沿途植被种类繁多,通过遥感手段进行植被分类可以有效判断易燃植被类型和植被区域,从而确定山林火灾易发区,对预防山林火灾、防止线路跳闸、保障输电线路安全运行意义重大。
资源三号(ZY-3)卫星是中国第一颗自主的民用高分辨率立体测绘卫星,通过立体观测,可测制1∶5万比例尺地形图,无需野外实地测量,即可实现数据的准确采集,同时也实现了影像加工和整理的整体数字化。卫星的主要任务是长期、连续、稳定、快速地获取覆盖中国的高分辨率立体影像和多光谱影像,为国土资源调查与监测、防灾减灾、农林水利、生态环境、城市规划与建设、交通、国家重大工程等领域的应用提供服务。
从输电线路设计和运行情况来看,郊区、户外的输电线路均不同程度地经过植被覆盖区域,这直接决定了输电线路的设计和运行。因此,深入调查输电线路走廊区域的植被分布和特性显得尤为重要。分类是遥感图像解译的一个重要环节,也是遥感研究领域的热点。如今随着图像分辨率的大幅提高,其所包含的地物目标细节更加明显,形状纹 理结构等信息也更加突出。面对丰富的特征信息,选择有针对性的特征是提高分类性能的一个关键环节。孙显等人[1]的研究结果表明,利用形状和颜色特征可有效提取高分辨率遥感图像中建筑物目标。等人[2]将遥感影像的语义标注与LDA(Latent Dirichlet Allocation)模型[3]结合,取得了一定效果。LIU C等人[4]的研究结果表明,将若干特征组合,分类效果要优于单特征,但并非使用特征的种类越多分类效果就越好。对于如何选出有针对性的特征,LIU C等人[4]提出利用增广LDA模型(augmented LDA,aLDA)完成特征的最优选择。
近年来,为能够得到有助于进行图像由底层至高层而进行的多层次特征表达与学习,深度学习特征在机器学习中受到了广泛关注。Hinton研究组提出了深度信念网络(deep belief network)[5]。从结构上讲,深度信念网络与传统的多层感知机区别不大,并且与有监督学习算法一样。唯一不同的是,深度信念网络在做有监督学习前需先进行非监督学习,然后将非监督学习所得权值作为监督学习的初值进行训练。深度信念网络在对比分歧算法(contrastive divergence,CD)的基础上提出CD-n算法,只需采样n次即可更新一次权值。当学习完一个受限玻尔兹曼机模型后就固定权值;再叠加一层新隐层单元,使原来受限玻尔兹曼机模型的隐层变成输入层,这样就构造了一个新的受限玻尔兹曼机模型。之后再用同样的方法学习新的受限玻尔兹曼机模型的权值。依此类推,可叠加出多个受限玻尔兹曼机模型,从而构成深度信念网络。将受限玻尔兹曼机模型学习到的权值作为深度信念网络的初始权值,再用反向传播(Back Propagation)算法进行学习,从而形成深度信念网络的学习方法。
文中涉及如下参考文献:
[1]孙显,王宏琦,张正.基于对象的Boosting方法自动提取高分辨率遥感图像中建筑物目标[J].电子与信息学报,2009,31(1):177-181。
[2]DATCU M.Semantic annotation of satellite images using latent dirichlet allocation[J].IEEE,Geoscience and Remote Sensing Letters,2009,7(1):28-32.
[3]BLEI.D.M,NGA.Y,JORDAN.M.I.Latent dirichlet allocation[J].Journal of Machine Learning Research,2003,3:993-1022.
[4]LIU C,SHARANL,ADELSONEH,et al.Exploring features in a Bayesian framework for material recognition[C].IEEE Conference on Computer Vision and Pattern Recognition(CVPR).Washington,DC:IEEE Computer Society,2010:239-246.
[5]G.E.Hinton,S.Osindero,Y.-W.Teh,A fast learning algorithm for deep belief nets,Neural Computation,2006,vol.18,pp.1527~1554
[6]FAN Rong-En,CHANG Kai-Wei,HSIEH Cho-Jui,et al.LIBLINEAR:A library for large linear classification[J].The Journal of Machine Learning Research,2008,9:1871-1874.
技术实现要素:
本发明的目的是提供一种可提高分类算法效率和分类精度的输电线路走廊区域植被分类方法。
本发明引入包括深度学习特征的多种遥感影像特征,并对这些特征进行优化选择,将优化选择后的特征进行组合后用于进行植被分类。
为达到上述目的,本发明采用如下技术方案:
一种输电线路走廊区域植被分类方法,包括:
步骤1,提取训练样本和交叉验证样本的特征,本步骤进一步包括:
1.1从遥感影像训练样本提取场景单元,将场景单元分为训练样本和交叉验证样本;
1.2采用人工目视方式定义各场景单元的场景类别并标记类别标号,记为定义类别标号,场景类别包括植被类和非植被类;
1.3提取各场景单元的多种特征;
步骤2,基于交叉验证法进行特征优化选择,本步骤进一步包括:
2.1将特征集中各种特征分别量化为视觉词汇,形成各种特征对应的视觉词汇表Di,将各视觉词汇表Di输入LDA模型,获取各种特征对应的潜语义分布概率向量θi;所述的特征集即交叉验证样本的多种特征构成的集合;
2.2将交叉验证样本各种特征对应的θi及定义类别标号输入分别正则化逻辑回归分类器进行交叉验证,获得各种特征的分类准确率,分类准确率最高的特征记为最优特征,采用最优特征的分类准确率初始化r;
2.3将其它一种特征与最优特征进行串联组合,记为组合特征,采用其它一种特征对最优特征对应的视觉词汇表D进行扩充,得到新视觉词汇表D',所述的其它一种特征指特征集中除最优特征外的任一特征;
2.4将新视觉词汇表D'输入LDA模型,得潜语义发生概率向量θ';
2.5将θ'和交叉验证样本的定义类别标号输入正则化逻辑回归分类器进行交叉验 证,根据输出的交叉验证样本预测类别标号获得当前组合特征的分类准确率rnew;
2.6若rnew>r,将rnew赋值给r,将当前组合特征记为最优特征,继续步骤2.3;否则,当前组合特征即优选特征;
步骤3,遥感影像测试数据的分类,本步骤进一步包括:
3.1采用训练样本和交叉验证样本的优化特征对应的潜语义分布概率向量以及定义类别标号训练分类器;
3.2从遥感影像测试数据提取场景单元,提取各场景单元的优化特征;
3.3基于各场景单元优化特征对应的潜语义分布概率,采用已训练的分类器对遥感影像测试数据进行分类,其中被分为植被类的场景单元构成植被区域;
上述潜语义分布概率向量通过将优化特征对应的视觉词汇表输入LDA模型获得。
上述多种特征包括SIFT特征、DAISY特征、LBP特征、BRIEF特征和CNN特征。
子步骤2.1中采用k均值法或稀疏编码法将特征量化为视觉词汇,即对各种特征分别进行聚类,各种特征的聚类中心即其对应的视觉词汇。
子步骤1.1和子步骤3.1中提取场景单元,具体为:
采用均匀网格划分遥感影像,一个网格即代表一个场景单元,相邻场景单元间无重叠,所述的遥感影像为遥感影像训练样本或遥感影像测试数据。
步骤3中采用的分类器为正则化逻辑回归分类器或SVM分类器。
和现有技术相比,本发明具有如下优点和有益效果:
本发明方法在特征选择阶段无需进行大量迭代计算,经优化选择后所得组合特征具有鲁棒性,将组合特征用于遥感影像输电线路走廊区域的植被分类,可显著提高算法计算效率和分类精度。
附图说明
图1为本发明方法的具体流示意图。
具体实施方式
下面将结合附图对本发明的具体实施方式进行详细说明。本发明技术方案可采用计算机软件自动运行。
步骤1,遥感影像的预处理。
遥感影像的预处理包括遥感影像训练样本和遥感影像测试数据的预处理。
遥感影像训练样本的预处理包括提取场景单元和人工目视方式定义场景类别。首先,将大幅遥感影像训练样本划分为若干大小相同的图像子块,即场景单元;采用人工目视方式定义各场景单元的场景类别并标记类别标号,该标记的类别标号记为定义类别标号。将遥感影像训练样本划分的场景单元分为训练样本和交叉验证样本。本发明中场景类别仅包括植被类和非植被类,森林和草地属于植被,耕地和裸地属于非植被,遥感影像测试数据的预处理即提取其场景单元。
具体实施时,遥感影像为“资源三号”全色影像,采用均匀网格划分遥感影像,网格即就代表一个场景单元,相邻场景单元间无重叠。本发明最终目标是给遥感影像测试数据所有场景单元赋予一个场景类别标号,并采用不同颜色区分。本实施例中,场景单元大小为100像素*100像素。
步骤2,场景单元的多种特征提取。
要对遥感影像进行场景分类,首先要提取场景单元图像描述特征。图像描述特征各种各样,在表达时各有所侧重,在分类应用中各有所长。由于遥感影像中输电线路走廊区域内植被密度并非完全均匀,边缘形状多样,具有较强的纹理、颜色特性。鉴于遥感影像特征多种多样,为了说明本方法的有效性,特选用5种具有代表性特征构建的特征集合为例,应用本发明时不局限于此。
(1)SIFT(Scale Invariant Feature Transform,尺度不变特征变换)特征提取。
SIFT特征为局部性特征,对于图像平移、缩放、旋转均具有不变性,并且对于仿射变换、视角变化、光照变化及噪声等具有很强的匹配鲁棒性,可通过对图像尺度空间中寻找到的局部极值点位置、方向和尺度信息进行表示而获得。
本发明利用现有的SIFT特征工具包提取场景单元的SIFT特征,具体实施方式如下:
检测尺度空间极值点获得极值点的精确定位和关键点的方向分配,生成特征点描述算子;生成特征点描述算子时,以关键点为中心选取大小为16×16的像素区域,将该像素区域划分为大小为4×4个的子块,分别各子块上计算8个方向的梯度直方图,即SIFT特征。所提取的SIFT特征向量有16×8=128维。所述的关键点图像在不同尺度空间下所检测出有方向信息的局部极值点。
(2)DAISY(雏菊式)特征提取。
DAISY是面向稠密特征提取的可快速计算的局部图像特征描述子,其本质思想和SIFT类似:分块统计各子块的梯度方向直方图。不同的是,DAISY在分块策略上进行 了改进,利用高斯卷积进行梯度方向直方图的分块汇聚,利用高斯卷积的可快速计算性可快速稠密地进行DAISY特征的提取。
DAISY特征可采用现有的DAISY特征工具包进行提取。
(3)LBP(Local Binary Pattern,局域二值模式)特征提取。
LBP特征是一种用来描述图像局部纹理特征的算子,具有旋转不变性和灰度不变形等显著优点。LBP特征可利用现有的LBP特征工具包进行,具体实施方式如下:
(a)将检测窗口划分为16×16的小区域,记为cell。
(b)本步骤对cell中各像素点逐一进行:将当前像素点相邻的8个像素点的灰度值与当前像素点进行比较,若相邻像素点灰度值大于当前像素点的灰度值,则当前像素点被标记为1,否则为0。这样,当前像素点3×3邻域内的相邻8个像素点经比较可产生8位二进制数,即当前像素点的LBP值。
(c)计算cell中各像素点被标记数值(0和1)出现的频率,得cell中所有像素点LBP值的直方图,对所有cell的直方图进行归一化处理。
(d)所有cell归一化后的直方图连接成的特征向量,即LBP特征向量。
(4)BRIEF(Binary Robust Independent Element Feature,二值鲁棒独立元素)特征提取。
BRIEF特征采用二进制编码法提取特征点周围区域的特征描述算子,BRIEF特征描述算子计算简单,存储空间也小于SIFT特征描述算子。由于BRIEF特征描述算子采用Hamming距离进行比较,匹配速度更快。
BRIEF特征可利用现有的BRIEF特征工具包进行提取,具体实施方式如下:
(a)以特征点为中心选定正方形的区域,所述的特征点即检测出的具方向信息的局部极值点。
(b)对该区域进行高斯核卷积,消除部分噪声。
(c)在该区域内随机生成点对<x,y>,若x的像素值大于y,则返回值1;反之返回0。
(d)重复步骤(c)N次,N为经验值,即得到一256维的二进制编码的特征描述,即BRIEF特征。
(5)CNN特征(卷积神经网络特征)提取。
CNN特征包含卷积层(convolution layer)、池化层(pooling layer)和全连接层(fully connected layer)。完整的深度卷积神经网络由多个卷积、池化和全连接层串联组合构成。卷积层中,输入图像或输入特征图与若干滤波器组(也称为卷积核)进行卷积滤波得特征图;然后,对所得特征图非线性化处理后送入池化层,上述非线性化处理采用非线性函数进行,常用的非线性函数有Sigmoid函数、Tanh函数、ReLU(Rectified Linear Unit)函数等。
池化层中对输入的特征图进行池化操作。池化操作即将特征图划分成大小相同的方形区域,对各区域计算统计量,如特征图中固定大小窗口所有像素响应值的平均值或最大值。通过池化层,相当于对特征图进行下采样,获得了一个尺寸较小的特征图。池化层的输出可以再连接一个卷积层,该卷积层的输出再连接另一池化层,在合理的网络层数前提下,按照卷积层-池化层的顺序迭代。最后一层池化层输出的统计量送入全连接层中。
全连接层由若干全连接隐层以及Softmax Regression决策层构成。卷积神经网络的训练利用反向传播算法完成。训练完成得到每一层的网络参数后,对任意一幅输入图像可通过前馈(Feed-forward)方式计算得该输入图像的特征,即CNN特征。CNN特征具有良好的平移和尺度不变性。
步骤3,基于语义模型的特征优化选择
针对训练样本和交叉验证样本,基于语义模型,从步骤2所提取特征中针对遥感影像测试数据的优化特征,之后将所选优化特征组合后用于分类。
语义模型是来自于自然语言处理中的数据处理模型,用来表达复杂结构及丰富语义。基于语义模型的图像场景分类工作,一般通过分析图像中是否包含潜语义来完成。本实施例采用LDA(Latent Dirichlet Allocation,潜在狄利克雷分布)模型,该模型将潜语义混合权重视为k维参数的潜在随机变量。
由LDA模型可得:
根据式(1)计算边缘概率p(D|α,β):
式(1)~(2)中:D表示语料库;d表示文档序号;M表示语料库D中文档总数; N表示文档长度;Nd表示第d个文档的长度;w为词汇分布统计,wn为第n个词汇,wdn为第d个文档中第n个词汇;θ为潜语义分布概率,θd表示第d个文档中潜语义的分布;z表示潜语义,zn为第n个潜语义,zdn为第d个文档中第n个潜语义;α、β分别为超参数;p(θ,z,w|α,β)表示在α、β条件下θ、z、w的联合概率;p(θ|α)表示α条件下潜语义的分布;p(θd|α)表示α条件下第d个文档中潜语义的分布;p(zn|θ)表示潜语义zn发生概率;p(zdn|θd)为基于第d个文档中潜语义分布的潜语义zn发生概率;p(wn|zn,β)表示zn、β条件下词汇wn发生的概率;p(wdn|zdn,β)表示第d个文档在zn、β条件下词汇wn发生的概率。
估计超参数α、β时,可采用变分推理(variational inference)或马尔科夫链蒙特卡罗采样法(Markov Chain Monte Carlo,MCMC)等方法。
文献[4]中所提出的增广LDA模型(aLDA),利用贪婪算法完成对特征的优化选择。其核心思想为:交叉验证阶段,每次从特征集中选出使分类正确率最大的一种特征,即最优特征,将该最优特征与其他特征进行组合,计算组合后特征的分类正确率,直到分类正确率不再上升为止。本发明方法则利用LDA模型来完成特征的优化选择。
在分类阶段,文献[4]利用aLDA模型自身的参数由最大后验原则得出类别标号,即:
式(3)中:λc=logπc,πc表示第C个类别所对应的参数π;C为真实类别标号,服从以π为参数的多项分布,这里π是多项分布的参数;C*为估计的场景类别标号;L(αc,η)为模型参数估计中变分推理的最大化下界,αc为LDA模型中第C个类别对应的超参数α,η为函数下界的参数。
特征组合时,若有m种特征可供选择,则对应有m个视觉词汇表,词汇表大小记为|Di|=Vi.,词汇表大小即文档长度,Vi表示第i种特征量化后对应视觉词汇的数量,Di为第i种特征量化后对应视觉词汇构成的视觉词汇表长度。第i种特征所对应的视觉词汇可表示为Ni为第i种特征对应的视觉词汇数。由于各种 特征独立进行聚类运算,将不同特征的视觉词汇组合,表示为:
其中N1、N2、…Nm的取值人为设定。
文献[4]中,需要基于式(3),利用LDA模型自身参数,不断进行迭代计算直至分类准确率λc不再发生变化,计算时间较长。同时,由于直接使用模型自身参数完成分类,在交叉验证及最后的测试阶段均须针对每一类样本单独训练,以获得各类别所对应的参数值。如此便会使得该阶段的计算时间随着样本类别数的增大而线性增加。
鉴于上述问题,本发明在交叉验证阶段将LDA模型与正则化逻辑回归分类器(Logistic Regression Classifier)结合,交叉验证阶段只需基于所有类别样本对LDA模型进行一次训练即可完成对特征的自动优化选择。即将LDA模型中潜语义向量输入正则化逻辑回归分类器用以取代式(3),从而直接获取交叉验证样本所对应的类别标号。如此一来,在交叉验证阶段便不再需要进行大量迭代运算。同时,引入正则化逻辑回归分类器后,所有样本对语义模型进行一次训练即可,不需要再根据样本种类而逐一进行迭代计算模型参数,从而可有效提高计算效率。
特征优化选择阶段,基于交叉验证样本中场景单元数据,进行如下步骤:
(1)对特征集中各种特征分别进行:将特征量化为视觉词汇,视觉词汇串联成该种特征的视觉词汇表Di,Di表示第i种特征的视觉词汇表;将各视觉词汇表Di输入LDA模型,得到各种特征对应的潜语义分布概率向量θi。这里的特征集指交叉验证样本的多种特征构成的集合。
特征量化方式具有多样性,例如可采用k均值法或稀疏编码法。本实例利用k均值(k-means)对特征集中各种特征分别进行聚类,各种特征对应的聚类中心串联构成该种特征对应的视觉词汇表Di。
(2)根据交叉验证样本的各种特征对应的θi及定义类别标号,采用正则化逻辑回归分类器分别进行交叉验证,根据交叉验证结果计算采用各种特征进行分类的分类准确率,将分类准确率最高的特征记为最优特征,采用最优特征的分类准确率初始化r。
本子步骤中,交叉验证针对各种特征分别进行:采用交叉验证样本当前种特征对应 的θi和定义类别标号训练正则化逻辑回归分类器,采用已训练的正则化逻辑回归分类器预测交叉验证样本的类别标号,所预测的类别标号记为预测类别标号,比较交叉验证样本的定义类别标号和预测类别标号,获得当前种特征的分类准确率。
(3)将其它一种特征与最优特征串联组合,记为组合特征,采用其它一种特征对应的视觉词汇表扩充最优特征的视觉词汇表,得新视觉词汇表D'。所述的其它一种特征指特征集中除最优特征外的任一特征;
(4)将新视觉词汇表D'输入已训练的LDA模型,得当前组合特征对应的潜语义分布概率向量θ'。
(5)将θ'和交叉验证样本的定义类别标号输入正则化逻辑回归分类器进行交叉验证,根据输出的交叉验证样本预测类别标号获得当前组合特征的分类准确率rnew;
(6)判断rnew和r的大小,若rnew>r,将rnew值赋给r,将当前组合特征记为最优特征,重复步骤(3);反之,停止特征优化选择,当前组合特征即优化特征。
步骤4,基于优化特征进行遥感影像测试数据分类。
将训练样本和交叉验证样本的优化特征中各种特征依次首尾连接,作为训练样本词汇表输入LDA模型,获得潜语义概率分布向量θcom;将潜语义分布概率向量θcom输入分类器,同时,还输入训练样本和交叉验证样本的定义类别标号,用来对分类器进行训练。采用已训练的分类器对遥感影像测试数据的场景单元进行分类,其中被分为植被类的场景单元构成植被区域。
文献[6]中指出在样本有限及特征维度较高时使用正则化逻辑回归分类器,分类效果要略优于线性SVM分类器,而且在速度上具有明显优势。因此,本发明选用Liblinear工具包中现有的正则化逻辑回归分类器。
逻辑回归是一个学习f:X→Y方程或者P(Y|X)的方法,这里Y是离散取值,X=<X1,X2,...,Xn>是任意一个向量其中每个变量离散或者连续取值。经过学习的逻辑回归分类器,是一组权值w0,w1,...,wm。当测试样本集中的测试数据来到时,这一组权值按照与测试数据线性加权的方式,求出一个z值,求解z的过程即为通过机器学习的方式,学习出相应的线性曲面来拟合训练数据样本:
z=w0+w1·X1+w2·X2+...+wm·Xm (5)
其中,X1,X2,...,Xm是某样本数据的各个特征,维度为m,按照sigmoid函数的形式求出:
可以看到,σ(z)的取值范围在[0,1]之间(代表某种类别的可能性),输入是整个实数域,曲线连续可导。在解决二分类问题的时候,可以设定一个阈值予以区分类别。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例所做各种的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。