本发明涉及遥感数据的分析领域,具体涉及一种基于深度学习的遥感数据分析方法。
背景技术:
遥感数据源是通过主动或被动遥感器获取的一系列波长不同的地物光谱数据。所获取的地物光谱数据转换成数字式的数据后,就能用于地理信息系统。
大多数陆地资源卫星的扫描器是典型的光谱扫描器,是一种线性排列装置。扫描仪通过往复扫描(如landsat)或推进式扫描(如spot)方式获取地面数据。这些扫描仪被动地记录地球表面反射的太阳光谱,如多光谱扫描数据可以提取作物类型、分布与长势,地形,土壤、水面和河网信息。而红外扫描仪能记录地物所发射的热辐射数据,这些热辐射数据能用来监测火灾、火山与地热活动。热辐射遥感器或长波红外遥感器所获取的数据能用来绘制大洋温度以及研究海潮的变化规律。在陆地上,植物含水量的变化可由遥感数据得到的树冠温度的变化数据得出。遥感数据得到的温度分布图数据,通常用来监测城市、工业区、生产中心以及农业区的分布状况。
现有的遥感数据分析方法,如中国专利申请号201410851849.x公开的一种基于主动深度学习的遥感图像分类方法,包括步骤1:选取待分类的遥感图像数据;步骤2:利用预先配置的算法对遥感图像数据进行处理;步骤3:运用主动学习算法neqb从未标记样本u中选取选出最佳样本b;步骤4:将未标记样本u与最佳样本b做减法运算,得到新的未标记样本集u`,将标记样本l与最佳样本b做加法运算,得到新的标记样本集l`;步骤5:重新返回步骤2,继续循环以上过程,直到未标记样本集u`为空集或满足预先设置的终止学习指标,循环结束,输出相匹配的分类准确度和分类结果图。本发明的有益效果为:通过深度学习和主动学习,能够克服分别使用无监督学习与监督学习的缺点,有效的提高了数据的分类精度。
但是上述方法仍然存分类准确率较低以及成员模型数目对分类准确率影响较大等缺点。
技术实现要素:
本发明所要解决的技术问题是提供一种能够进一步提高分类准确率,降低成员模型数目对分类准确率影响的基于深度学习的遥感数据分析方法。
本发明解决其技术问题所采用的技术方案是:一种基于深度学习的遥感数据分析方法,包括以下步骤:
1)读取高光谱遥感数据的原始数据;进行数据预处理操作,以降低数据维度;构建基本深信度网络模型,提取高光谱遥感数据的特征向量和空间信息;
2)由步骤1)中提取的高光谱遥感数据的特征向量和空间信息,确定标记样本;并在标记样本中选出训练样本和测试样本;
3)利用遥感图像数据的所有训练样本进行无监督自编码深度网络学习;
4)然后利用预先设置的标记样本进行监督深度网络学习;
5)利用预先设置的未标记样本输入深度网络得到分类结果;
6)运用基于最小差异采样的主动学习图像分类方法从未标记样本中选择最佳样本;
所述基于最小差异采样的主动学习图像分类方法为:首先基于标注样本集的重采样结果构建决策委员会,然后利用投票概率较高的2个类别的概率值的差异来度量未标注样本集每个样本的投票不一致性,选择概率差异最小的样本交由人工专家标注;如此迭代更新分类器;
7)将未标记样本u与最佳样本做减法运算,得到新的未标记样本集u`,将标记样本l与最佳样本b做加法运算,得到新的标记样本集l`;
8)重新返回步骤3,继续循环以上过程,直到未标记样本集u`为空集或者满足预先设置的终止学习的指标,循环结束,输出相匹配的分类准确度和分类结果图;
9)进行分类结果精度评价。
进一步的,所述最小差异采样的主动学习图像分类方法包括步骤:
1)首先对标注样本集l进行bagging采用定义n个训练集;
2)基于bagging重采样技术得到的结构,构建一个具有n各成员模型的决策委员会;针对每个未标注的样本,通过公式(1)计算得到其投票不一致的度量结构;
其中,yi*是对未标注样本xi的预测结果,p(yi*=ω|xi)是对xi预测为类别ω的概率,yi是委员会对样本xi预测的类别集合,ω*是具有最高概率的类别;
3)根据以下公式选出最具信息含量的样本;
4)人工标注样本类别,将主动学习选择出来的样本进行标记,从未标记样本中删除,加入到训练样本中,更新训练样本,得到最终分类器。
本发明的有益效果是:本发明所述的一种基于深度学习的遥感数据分析方法具有以下优点:
本发明所述的一种基于深度学习的遥感数据分析方法由于采用基于最小差异采样的主动学习图像分类方法从未标记样本中选择最佳样本,从而在考虑不确定性采样的同时,能够有效的提高分类精度,能够有效的提高分类效率,并且能够主动要求用户对那些最有价值的数据进行标记;在获得相近准确率的情况下,主动样本选择相对于随机选择可以显著地减少所需要的样本数,有效的提高了对数据分类的效率。
附图说明
图1是本发明实施例中一种基于深度学习的遥感数据分析方法的流程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
如图1所示,种基于深度学习的遥感数据分析方法,包括以下步骤:
1)读取高光谱遥感数据的原始数据;进行数据预处理操作,以降低数据维度;构建基本深信度网络模型,提取高光谱遥感数据的特征向量和空间信息;
2)由步骤1)中提取的高光谱遥感数据的特征向量和空间信息,确定标记样本;并在标记样本中选出训练样本和测试样本;
3)利用遥感图像数据的所有训练样本进行无监督自编码深度网络学习;
4)然后利用预先设置的标记样本进行监督深度网络学习;
5)利用预先设置的未标记样本输入深度网络得到分类结果;
6)运用基于最小差异采样的主动学习图像分类方法从未标记样本中选择最佳样本;
所述基于最小差异采样的主动学习图像分类方法为:首先基于标注样本集的重采样结果构建决策委员会,然后利用投票概率较高的2个类别的概率值的差异来度量未标注样本集每个样本的投票不一致性,选择概率差异最小的样本交由人工专家标注;如此迭代更新分类器;
7)将未标记样本u与最佳样本做减法运算,得到新的未标记样本集u`,将标记样本l与最佳样本b做加法运算,得到新的标记样本集l`;
8)重新返回步骤3,继续循环以上过程,直到未标记样本集u`为空集或者满足预先设置的终止学习的指标,循环结束,输出相匹配的分类准确度和分类结果图;
9)进行分类结果精度评价。
具体的,所述最小差异采样的主动学习图像分类方法包括步骤:
1)首先对标注样本集l进行bagging采用定义n个训练集;
2)基于bagging重采样技术得到的结构,构建一个具有n各成员模型的决策委员会;针对每个未标注的样本,通过公式(1)计算得到其投票不一致的度量结构;
其中,yi*是对未标注样本xi的预测结果,p(yi*=ω|xi)是对xi预测为类别ω的概率,yi是委员会对样本xi预测的类别集合,ω*是具有最高概率的类别;
3)根据以下公式选出最具信息含量的样本;
4)人工标注样本类别,将主动学习选择出来的样本进行标记,从未标记样本中删除,加入到训练样本中,更新训练样本,得到最终分类器。
具体的,在步骤3)中利用遥感图像数据的所有训练样本进行无监督自编码深度网络学习;可以利用稀疏自编码算法和支持向量机svm算法对所有训练样本进行无监督自编码深度网络学习。
综上所述,本发明所述的一种基于深度学习的遥感数据分析方法由于采用基于最小差异采样的主动学习图像分类方法从未标记样本中选择最佳样本,从而在考虑不确定性采样的同时,能够有效的提高分类精度,能够有效的提高分类效率,并且能够主动要求用户对那些最有价值的数据进行标记;在获得相近准确率的情况下,主动样本选择相对于随机选择可以显著地减少所需要的样本数,有效的提高了对数据分类的效率。