一种基于光谱相似尺度算法的支持向量机水体自动提取方法与流程

文档序号:22086930发布日期:2020-09-01 20:10阅读:552来源:国知局
一种基于光谱相似尺度算法的支持向量机水体自动提取方法与流程

本发明主要涉及到水体信息提取技术领域,特指一种基于光谱相似尺度算法的支持向量机水体自动提取方法。



背景技术:

遥感具有不直接接触物体、不对物体产生破坏、可动态地进行大范围探测、实时性高、信息丰富等优点。随着水利遥感定量应用的深入,利用卫星遥感影像提取水体面积、几何形态、水质状况和水体生态环境等信息已在水资源调查、水资源宏观监测、环境保护、自然灾害预报、土地分类等领域得到了应用。

水体信息提取已经成为遥感研究的重要分支之一,是构建各种水文模型、进行不同场景水文模拟等相关研究的前提。基于像元光谱和目视解译的水体信息提取方法在实际中应用广泛。随着提取方法的不断改进,通过加入一些规则、构建一些参数已实现了水体信息的自动分类提取。

目前单波段阈值法、多波段谱间关系法、水体指数法等水体判别方法以及根据形状信息来进行水体识别和分类的方法相继得到了应用。单波段法原理简单,主要利用水体和其他地物在近红外或中红外波段上光谱特征的差异来提取水体信息,阈值选取的准则直接决定了水体信息提取的准确性。在地物类型丰富、波段灰度值接近的影像上,单波段法具有一定的局限性;多波段谱间关系法、比值法和差值法主要是利用地物在不同波段的光谱特征和光谱差异,通过构造光谱差异关系和水体信息提取模型将水体和其他地物最大化地区分开来。在地形复杂区域,用谱间关系法提取水体信息时,除阴影外,冰雪和冲洪积物等也对水体信息提取产生明显干扰,多波段谱间关系法分析过程复杂、对背景信息抑制较差.水体指数法是基于水体光谱特征分析,选取与水体识别密切相关的波段,通过构建水体指数模型来分析水体与光谱值之间的关系,并给定相应的阈值,实现对水体信息的提取。该指数可以最大程度地抑制植被信息,突出水体信息,但忽视了土壤、建筑和阴影的影响,可以有效地将水体与植被及山体阴影等信息区分开。然而,不同的背景信息对水体提取精确性的影响不同,水体指数不能很好地适合所有的现实状态。

总的来说,以上几种方法存在以下几方面缺点:对于中、高分辨率影像,单波段阈值法和多波段阈值法不适用于细小水体信息的提取,其原因是过渡区域像元光谱是由各地物光谱非线性混合而成;单一阈值无法准确划分混淆的地物。水体指数大部分是基于中红外和短波红外波段构建的,高分辨率卫星影像一般只包含可见光和近红外波段,对水体指数的构建有一定的局限性。

现有遥感专题信息提取方法的重要基础是传统统计学,前提是有足够多的样本,但在实际问题中,样本数往往是有限的,因此一些理论上很优秀的学习方法在实际中却表现得不尽人意。支持向量机(svm)就是在统计学习理论基础上发展起来的一种机器学习算法。它在解决小样本,非线性及高维模式识别中表现出许多特有的优势,开始成为克服“维数灾难”和“过学习”等传统困难的有力手段。svm的优越性能引起人们极大的研究兴趣,它被越来越多的图像处理研究者和工作者所应用。

但目标样本的正确选取,一直是影响svm在信息提取中成功应用的关键问题。



技术实现要素:

本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种原理简单、能够提高对光谱向量间相似性描述准确性、有利减少异物同谱现象影响的基于光谱相似尺度算法的支持向量机水体自动提取方法。

为解决上述技术问题,本发明采用以下技术方案:

一种基于光谱相似尺度算法的支持向量机水体自动提取方法,其步骤包括:

步骤s1:数据预处理;

步骤s2:训练样本的选取,计算光谱相似值,即ssv值;

步骤s3:模型选择;采取一对一的多类分类算法,选择rbf作为核函数,利用网格搜索和交叉验证方法来选取核参数和惩罚因子;

步骤s4:构造svm分类器模型;利用上一步选取的核函数和最佳参数对对选取的训练样本集进行训练,构造本次水体信息的svm分类器模型;

步骤s5:水体信息提取;对机器进行训练之后,用训练好的svm分类器模型对工作区整个环境卫星影像进行水体信息提取,输出提取结果。

作为本发明的进一步改进:所述步骤s2中,水体样本的选取以实测光谱作为水体信息提取的光谱,把实测光谱转换为遥感影像相应波长宽度的光谱。

作为本发明的进一步改进:所述步骤s2中,计算影像上每个像元光谱与水体光谱之间的光谱相似值。

作为本发明的进一步改进:通过设定一个ssv阈值,选择水体样本。

作为本发明的进一步改进:通过用matlab实现的光谱相似尺度代码,分别计算影像上每个像元光谱与参考光谱之间的ssv值。

作为本发明的进一步改进:所述步骤s2中,通过k-means进行非监督分类,参考globeland30-2010土地分类标准,将数据共分为总共分为10个类别。

作为本发明的进一步改进:所述步骤s1中,对图像进行包括几何校正,地理配准,裁减,掩膜,反射率转换预处理;其中反射率转换具体公式为:

l=gain×dn+bias………………………………(1)

其中:l是地物在大气顶部的辐射亮度,dn是像元灰度值,增益gain和偏移值bias从头文件中得到,ρ是地物反射率,ds为日地天文单位距离,e0为大气顶部的太阳辐照度,θ为成像时的太阳天顶角,从图像的头文件中读取;然后将反射率数据转换为svm支持的格式。

与现有技术相比,本发明的优点在于:

本发明的基于光谱相似尺度算法的支持向量机水体自动提取方法,原理简单,通过光谱相似尺度法来选取水体样本,进而训练支持向量机,提取水体信息。光谱相似尺度法是一种能同时度量光谱向量的大小和方向差异的新方法,克服了传统的度量方法只能度量大小或方向的缺点,提高了对光谱向量间相似性描述的准确性,有利于减少异物同谱现象的影响。

附图说明

图1是本发明方法的流程示意图。

图2是本发明在具体应用实例中水体实测光谱的示意图。

具体实施方式

以下将结合说明书附图和具体实施例对本发明做进一步详细说明。

为了便于对本发明的内容做出详细的说明,先将光谱相似尺度基本原理和支持向量机基本原理做一个简要的说明,但是并不局限于以下的解释,而应当结合本领域技术人员对上述原理的理解。

一、光谱相似尺度基本原理;

光谱相似尺度方法的理论基础是向量理论,其数学定义在基于向量同一性的定义(二个相同的向量有相同的大小和方向)和向量的大小与方向无关的假设。为了同时度量两个光谱间的大小和方向的差异,引入了光谱相似值(spectralsimilarityvalue,ssv),ssv的数学表达式为:

这里,de为广义的欧氏距离,主要度量光谱向量间的大小差异,由下式计算。

其中:n为光谱向量维数,x、y都是n维向量。

为1减去相关系数平方的差,主要度量光谱向量间的方向(形状)差异,由下式计算。

其中:r为相关系数,由下式计算。

其中:μx、μx分别为两光谱向量的均值,σx、σy分别为两光谱向量的标准偏差。

二、支持向量机基本原理;

svm主要包括线性支持向量机和非线性支持向量机。概括的讲,svm通过最优分类超平面,不但能将两类样本正确分开,而且能使两类的分类间隔最大,vc维最小,从而达到使真实风险最小。对非线性问题,能把样本非线性映射到高维核空间,在高维核空间创建具有低vc维的最优分类超平面。它通过综合考虑经验风险和置信范围的大小,根据结构风险最小化原则取其折衷,从而得到风险上界最小的分类函数。在线性可分的情况下,设线性可分样本集为(xi,yi)i=1,...,n,x∈rd,y∈{+1,-1}是类别标号。通过求解一个约束条件下的极值问题,然后转化成它的对偶问题,就会得到简化的不等式约束极值问题,最终得到最优分类函数:

其中sgn()为符号函数,为最优解,b*是分类的域值。

若训练集是线性不可分的,或事先不知道它是否线性可分,vapnik和cones引入了非负松弛变量ξi,i=1,2,...,n来允许错分样本的存在,并对错分样本进行惩罚。

而在实际分类问题中,分类问题往往是一个非线性的问题,理想的分类面应该是非线性的。对非线性问题,可以通过非线性变换,将非线性问题转化为某个高维空间中的线性问题,在变换后的高维空间中求其最优分类面。支持向量机理论通过引入核函数巧妙地解决了低维输入空间向高维特征空间映射的问题。对于满足mercer条件的核函数k(xi,xj),最优分类函数是:

常用的核函数主要有:多项式核函数,rbf径向基函数,sigmoid核函数等。

如图1和图2所示,本发明的基于光谱相似尺度算法的支持向量机水体自动提取方法,其步骤包括:

步骤s1:数据预处理;

对图像进行包括几何校正,地理配准,裁减,掩膜,反射率转换等预处理。其中反射率转换具体公式为:

l=gain×dn+bias………………………………(1)

其中:l是地物在大气顶部的辐射亮度,dn是像元灰度值,增益(gain)和偏移值(bias)从头文件中得到,ρ是地物反射率,ds为日地天文单位距离,e0为大气顶部的太阳辐照度,θ为成像时的太阳天顶角,从图像的头文件中读取。然后将反射率数据转换为svm支持的格式。

步骤s2:训练样本的选取,计算光谱相似值(ssv值)。水体样本的选取以实测光谱作为水体信息提取的光谱,把实测光谱转换为遥感影像相应波长宽度的光谱;计算影像上每个像元光谱与水体光谱之间的光谱相似值;通过设定一个适当的ssv阈值,选择水体样本,把水体样本控制在200个左右。由于svm对上述信息的提取还需要与其他未知类别来参与分类,通过k-means进行非监督分类,参考globeland30-2010土地分类标准,将数据共分为总共分为10个类别。在具体应用时,每类样本控制在200个左右;

步骤s3:模型选择;

采取一对一的多类分类算法,选择rbf作为核函数,利用网格搜索和交叉验证方法来选取核参数和惩罚因子。

步骤s4:构造svm分类器模型;

利用上一步选取的核函数和最佳参数对对选取的训练样本集进行训练,从而构造本次水体信息的svm分类器模型,这个过程就是机器学习过程。

步骤s5:水体信息提取;

对机器进行训练之后,就可用训练好的svm分类器模型对工作区整个环境卫星影像进行水体信息提取,输出提取结果。

在具体应用实例中,上述步骤s2具体包括:

步骤s201:水体样本的选取以实测光谱作为水体信息提取的光谱。

步骤s202:因为所用遥感数据为环境卫星ccd数据,所以要把实测光谱转换为环境卫星ccd波长宽度的光谱。

步骤s203:然后通过用matlab实现的光谱相似尺度代码,分别计算影像上每个像元光谱与参考光谱之间的ssv值,通过设定一个适当的ssv阈值,把水体样本控制在200个左右。

步骤s204:由于svm对上述信息的提取还需要与其他未知类别来参与分类,通过k-means进行非监督分类。如参考globeland30-2010土地分类标准,将数据共分为总共分为10个类别。每类样本控制在200个左右。

以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1