基于深度学习的高分辨率遥感影像分类方法及系统

文档序号:30616055发布日期:2022-07-02 01:01阅读:242来源:国知局
基于深度学习的高分辨率遥感影像分类方法及系统

1.本发明涉及遥感影像分类技术领域,具体涉及一种基于深度学习的高分辨率遥感影像土地利用分类方法及系统。


背景技术:

2.土地利用分类是区分土地利用空间地域组成单元的过程。这种空间地域单元是土地利用的地域组合单位,表现人类对土地利用、改造的方式和成果,反映土地的利用形式和用途(功能)。土地利用分类是为完成土地资源调查或进行统一的科学土地管理,从土地利用现状出发,根据土地利用的地域分异规律、土地用途、土地利用方式等,将一个国家或地区的土地利用情况,按照一定的层次等级体系划分为若干个不同的土地利用类别。
3.目前基于高分辨率遥感影像的土地利用技术主要有最大似然法、二进制代码法和k-means算法等非监督分类方法以及利用支持向量机(svm)、决策树 (dt)、随机森林(rf)以及人工神经网络(ann)等算法的监督分类方法,但在实际应用中仍然较难获得令人满意的结果。因此,迫切需要一种新的高分辨率遥感影像土地利用分类方法。
4.随着遥感影像地物特征不断丰富,传统的目标检测方法难以满足其分类需求,而深度学习具有学习能力强、覆盖范围广、适应能力强、可移植性好,且算法应用灵活,可以用来完成目标分类、目标检测、语义分割、实例分割、姿态识别等多个任务,能把底层的特征和高层的特征进行融合,可进行细致检测,在图像学中取得了良好的效能。因此,采用深度学习进行高分辨率遥感影像土地利用分类是一条可行途径。
5.综上,现有图像分析技术直接应用到遥感影像分析上的效果欠佳;同时,单纯的利用遥感影像图像信息而忽略了土地利用类型复杂的内部组成结构和各类型之间的地理空间关联关系,无法明确地反映人类对土地自然属性的利用方式和目的意图。因此,该技术有必要改进。


技术实现要素:

6.本发明所要解决的技术问题是现有基于遥感影像的土地利用分类方法精度不高,效果不佳,因为传统遥感影像分类方法普遍依赖于人工判读,虽然具有较好的精度,但是要求操作人员具备丰富经验,且解译过程耗时耗力,无法满足当代自然资源管理和经济社会发展对卫星遥感影像的需求。本发明目的在于提供一种基于深度学习的高分辨率遥感影像分类方法及系统,提高数据在神经网络中训练效果,基于细粒度的分类关注样本特征,将局部特征与全局特征结合在一起,既关注整体的分类效果又对局部更精细的分类。本发明技术从像素级的尺度对遥感图像的土地利用分类问题进行研究,基于像素级的土地利用分类技术能够分析遥感影像自动化完成解译工作,提取不同时期土地利用类型等信息,为精准划定“三区三线”、动态监测土地利用变化以及国土空间用途管制等工作的开展提供了动态、精准的数据保障。
7.本发明通过下述技术方案实现:
8.一方面,本发明提供了一种基于深度学习的高分辨率遥感影像分类方法,该方法包括以下步骤:
9.s1:获取高分辨率遥感影像数据,进行降噪、几何校正以及图像增强等预处理;
10.s2:将预处理好的遥感影像图使用黑色像素填充影像的边缘,采用按掩膜提取的方式对图像进行不同尺寸的分割,并将分割后的影像批量降维到分辨率 1024
×
1024,同时结合兴趣点(point of interest,poi)所带有的属性信息制作土地利用类型训练集、验证集、测试集;
11.s3:使用labelme工具对土地利用类型训练集进行多边形标注,标注完成后输入类别标签以存储json格式的数据;
12.s4:构建深度学习实例分割模型,通过coco数据集进行预训练,再使用土地利用类型训练集训练;
13.s5:利用土地利用类型测试集在深度学习实例分割网络模型上进行随机测试,直至随机测试达到满意效果(精度85%以上),生成最终的;
14.s6:构建遥感影像的编码-解码模型,基于地理空间关系对输入数据按行列进行分割和编码,对深度学习实例分割模型的输出结果进行映射式解码,最终得到高分辨率遥感影像土地利用分类产品;
15.s7:将深度学习实例分割模型和编码-解码模型进行整合,生成最终的土地利用分类模型。
16.工作原理是:本发明创新地设计了一种基于深度学习的高分辨率遥感影像分类方法,采用mask r-cnn网络模型的训练,该模型算法应用灵活;在特征提取网络中构造分层连接,使用卷积神经网络提出的一种构建模块(即深度学习多尺度网络结构resnet101),以更细粒度表示小目标的多尺度特征,并增加每个网络层的感受野;同时,使用地理编码,把描述成文本地址的地理位置信息转换成地理坐标的方式,可对异构数据进行有效融合和集成。
17.进一步地,步骤s1中对获取的深圳高分辨率遥感影像原始图像进行预处理,包括:收集高分辨率遥感影像,对输入的原始数字图像选择工作范围,先进行降噪、图像增强等处理,然后选择gcp以及地面投影,匹配地面控制点与像元的位置,选择纠正函数和相关的参数,经过重采样步骤之后,最终输出纠正后的图像。
18.进一步地,步骤s2的具体步骤如下:
19.s21:将预处理好的遥感影像图使用黑色像素填充影像的边缘,使得遥感图像变为规则矩形,然后采用按掩膜提取的方式对图像进行不同尺寸的随机分割,分割尺度分别为30*30、20*20和10*10;
20.s22:将分割后的图像批量降维到分辨率1024
×
1024,并按照7:2:1的比例划分训练集、验证集与测试集。
21.进一步地,步骤s3的具体步骤如下:
22.采用人工标注的方式,为防止出现过拟合现象,采用两种标注方式:即土地利用类型斑块的边界标注和使用labelme工具对输入图像数据集进行多边形标注,对土地利用类型标注底图中具有代表性的人造地物进行土地利用类型斑块内部统一纹理的单独标注,得到精细的土地利用类型标注图。
23.进一步地,步骤s4的具体步骤如下:
24.s41:采用深度学习多尺度网络结构resnet101网络,对输入数据提取图像特征的高维表达,所述图像特征分成8组特征xi,i∈{1,2,3,4,5,6,7,8},每个子集的分辨率大小和原特征相同,resnet101网络对每一层的输入做一个reference(xi),学习形成残差函数,其表达式f如下:
25.f=w2σ(w1xi)
26.其中σ代表非线性函数relu,然后通过一个shortcut和第二个relu,获得输出y;
27.y=f(x,{wi})+xi28.当需要对输入输出维数进行变化时,如改变通道数目,可以在shortcut时对 xi做一个线性变换,如下式:
29.y=f(x,{wi})+wsxi30.s42:采用3种尺度的池化层来精炼特征的聚合能力,其中池化分别为10
×ꢀ
10,20
×
20,30
×
30,从这三个维度覆盖遥感影像的各个尺度特征,在每个尺度的后面一次使用3
×
3卷积进一步进行特征融合,通过双线程插值得到多尺度特征,使用roialign代替roipooling,相比较roipooling,roialign的反向传播需作修改,roialign的反向传播公式,如下所示:
[0031][0032]
其中,xi代表池化前特征图上的像素点;y
rj
代表池化后的第r个候选区域的第j个点;i
*
(r,j)代表点y
rj
像素值的来源(最大池化的时候选出的最大像素值所在点的坐标)。d(i,i
*
(r,j))表示两点之间的距离,δh和δw表示xi与x
i*(r,j)
横纵坐标的差值,这里作为双线性内插的系数乘在原始的梯度上。
[0033]
s43:获得特征地图之后,进行roialign,获取所需roi,然后进行mask预测分支、预测类别以及预测边界框,计算损失函数,利用全连接分类,边框, mask进行回归。
[0034]
进一步地,步骤s5的具体步骤如下:
[0035]
s51:利用测试集在s4步骤中训练好的深度学习实例分割网络模型上进行随机测试;
[0036]
s52:利用验证集调整模型,进而再测试,反复迭代;
[0037]
s53:当测试精度低于85%适当增加标签数量,当随机测试达到满意效果后(精度85%以上),最终完成深度学习实例分割网络模型的遥感影像土地利用分类模型构建。
[0038]
进一步地,步骤s6的具体步骤如下:
[0039]
s61:基于地理空间关系对待分类的遥感影像按行列进行分割,并进行地理编码,即把描述成文本的地理位置信息转换成地理坐标;
[0040]
s62:将编码结果输入深度学习实例分割网络模型进行土地利用分类;
[0041]
s63:对深度学习实例分割网络模型的输出结果进行映射式解码,将地址分词并用数据库搜索,将地址匹配,得到高分辨率遥感影像土地利用分类产品。
[0042]
另一方面,本发明还提供一种基于深度学习的高分辨率遥感影像土地利用分类系统,该系统支持所述的一种基于深度学习的高分辨率遥感影像土地利用分类方法,该系统包括:
[0043]
数据处理模块:获取高分辨率遥感影像数据,对其进行预处理,制作土地利用类型训练集、验证集、测试集;
[0044]
分类模型创建模块:构建深度学习实例分割网络模块,使用coco数据集进行预训练,使用土地利用类型测试集进行随机测试,直至随机测试达到满意效果 (精度85%以上),完成深度学习实例分割网络模型的构建;
[0045]
编码模型创建模块:以地理空间关系对待分类的遥感影像按行列进行分割和地理编码,并将编码结果输入到深度学习实例分割网络模型,进行土地利用分类;
[0046]
解码模型创建模块:对深度学习实例分割模型的输出结果进行映射式解码,将地址分词并用数据库搜索,将地址匹配,得到高分辨率遥感影像土地利用分类产品
[0047]
结果输出模块:用于自动拼接解码后的分幅图像,并输出土地利用分类后的图像。
[0048]
本发明系统为解决遥感影像在像素级的土地利用分类中存在的问题,使用 resnet101的结构并在预训练模型中引入fpn算法。该结构具有自下而上和自上而下的两条计算线,通过前向传播获得每一层的特征后,进而通过自上而下的特征融合来增强深层特征。同时,在解码阶段(分类识别模块)使用多尺度的池化来覆盖遥感图像的各个尺度,加入mask分割掩码网络,对特征进行加强和过滤,提升模型的精度。本发明与浅层学习算法相比,基于像素级分割的方法可以同时获得更好的目标检测与分割效果。
[0049]
进一步地,所述分类模型创建模块执行过程如下:
[0050]
采用深度学习多尺度网络结构resnet101网络,对预处理后的原始图像提取图像特征的高维表达,所述图像特征分成8组特征xi,i∈{1,2,3,4,5,6,7,8},每个子集的分辨率大小和原特征相同,resnet101网络对每一层的输入做一个 reference(xi),学习形成残差函数,其表达式f如下:
[0051]
f=w2σ(w1xi)
[0052]
其中σ代表非线性函数relu,然后通过一个shortcut和第二个relu,获得输出y;
[0053]
y=f(x,{wi})+xi[0054]
当需要对输入输出维数进行变化时,如改变通道数目,可以在shortcut时对 xi做一个线性变换,如下式:
[0055]
y=f(x,{wi})+wsxi[0056]
采用3种尺度的池化层来精炼特征的聚合能力,其中池化分别为10
×ꢀ
10,20
×
20,30
×
30,从这三个维度覆盖遥感影像的各个尺度特征,在每个尺度的后面一次使用3
×
3卷积进一步进行特征融合,通过双线程插值得到多尺度特征,使用roialign代替roipooling,相比较roipooling,roialign的反向传播需作修改,roialign的反向传播公式,如下所示:
[0057][0058]
其中,xi代表池化前特征图上的像素点;y
rj
代表池化后的第r个候选区域的第j个点;i
*
(r,j)代表点y
rj
像素值的来源(最大池化的时候选出的最大像素值所在点的坐标)。d(i,i
*
(r,j))表示两点之间的距离,δh和δw表示xi与x
i*(r,j)
横纵坐标的差值,这里作为双线性内插的系数乘在原始的梯度上。
[0059]
获得特征地图之后,进行roialign,获取所需roi,然后进行mask预测分支、预测类别以及预测边界框,计算损失函数,利用全连接分类,边框,mask 进行回归。
[0060]
本发明与现有技术相比,具有如下的优点和有益效果:
[0061]
1、本发明方法引入深度学习实例分割网络模型,提出使用resnet101的结构并在预训练模型中引入fpn该结构具有自下而上和自上而下的两条计算线,通过前向传播获得每一层的特征后,进而通过自上而下的特征融合来增强深层特征。
[0062]
2、本发明方法在解码阶段使用多尺度的池化来覆盖遥感图像的各个尺度,对特征进行加强学习和过滤,提升模型的精度,使用地理编码,把描述成文本地址的地理位置信息转换成地理坐标的方式,对异构数据进行有效融合和集成。
[0063]
3、本发明网络使用深度学习实例分割网络的结构,通过将深度学习实例分割网络模型与编码-解码模型进行串联整合,能够接收任意尺寸的原始影像,最后输出一张与原始影像相同大小且带有像素标注的分类图。
[0064]
4、本发明提高数据在神经网络中训练效果,基于细粒度的分类关注样本特征,将局部特征与全局特征结合在一起,既关注整体的分类效果又对局部更精细的分类。本发明技术从像素级的尺度对遥感图像的土地利用分类问题进行研究,像素级的土地利用分类技术能够分析遥感影像自动化完成解译工作,提取不同时期土地利用类型等信息,为精准划定“三区三线”、动态监测土地利用变化以及国土空间用途管制等工作的开展提供了动态、精准的数据保障。
附图说明
[0065]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0066]
图1为本发明的基于深度学习的高分辨率遥感影像土地利用分类方法流程示意图;
[0067]
图2为本发明深度学习实例分割网络模型结构示意图;
[0068]
图3为本发明编码方式示意图;
[0069]
图4为本发明不同分割尺度下高分辨率遥感影像土地利用分类结果图。
具体实施方式
[0070]
下面将结合本发明实施方式,本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。
[0071]
如图1所示,本发明一种基于深度学习的高分辨率遥感影像土地利用分类方法,该方法包括以下步骤:
[0072]
s1:获取深圳市的高分辨率遥感影像数据,进行降噪、几何校正以及图像增强等预处理;
[0073]
s2:将预处理后的深圳市高分辨率遥感影像图使用黑色像素填充影像的边缘,采用按掩膜提取的方式对图像进行不同尺寸的分割,并将分割后的影像批量降维到分辨率1024
×
1024,同时结合兴趣点(point of interest,poi)所带有的属性信息制作土地利用类型训练集、验证集、测试集;
[0074]
s3:使用labelme工具对训练集进行多边形标注,标注完成后输入类别标签以存储json格式的数据;
[0075]
s4:构建深度学习实例分割模型,通过coco数据集进行预训练,再使用土地利用类型训练集训练;
[0076]
s5:利用土地利用类型测试集在深度学习实例分割网络模型上进行随机测试,直至随机测试达到满意效果(精度85%以上),生成最终的;
[0077]
s6:构建遥感影像的编码-解码模型,基于地理空间关系对输入数据按行列进行分割和编码,对深度学习实例分割模型的输出结果进行映射式解码,最终得到高分辨率遥感影像土地利用分类产品。
[0078]
s7:将深度学习实例分割模型和编码-解码模型进行整合,生成最终的土地利用分类模型。
[0079]
本实施例中,步骤s1中对获取的深圳高分辨率遥感影像原始图像进行预处理,包括:收集高分辨率遥感影像,对输入的原始数字图像选择工作范围,先进行降噪、图像增强等处理,然后选择gcp以及地面投影,匹配地面控制点与像元的位置,选择纠正函数和相关的参数,经过重采样步骤之后,最终输出纠正后的图像;
[0080]
本实例中,步骤s2的具体步骤如下:
[0081]
s21:将预处理后的深圳市高分辨率遥感影像使用黑色像素填充影像的边缘,使得遥感图像变为规则矩形,然后采用按掩膜提取的方式对图像进行不同尺寸的随机分割,分割尺度分别为30*30、20*20和10*10;
[0082]
s22:将分割后的图像批量降维到分辨率1024
×
1024,并按照7:2:1的比例划分训练集、验证集与测试集。
[0083]
本实施例中,步骤s3的具体步骤如下:
[0084]
采用人工标注的方式,为防止出现过拟合现象,采用两种标注方式:即土地利用类型斑块的边界标注和土地利用类型斑块内部统一纹理的单独标注,得到精细的土地利用类型标注图。
[0085]
本实施例中,参阅图2,步骤s4的具体步骤如下:
[0086]
s41:采用深度学习多尺度网络结构resnet101网络,对输入数据提取图像特征的高维表达,所述图像特征分成8组特征xi,i∈{1,2,3,4,5,6,7,8},每个子集的分辨率大小和原特征相同,resnet101网络对每一层的输入做一个reference(xi),学习形成残差函数,其表达式f如下:
[0087]
f=w2σ(w1xi)
[0088]
其中σ代表非线性函数relu,然后通过一个shortcut和第二个relu,获得输出y;
[0089]
y=f(x,{wi})+xi[0090]
当需要对输入输出维数进行变化时,如改变通道数目,可以在shortcut时对 xi做一个线性变换,如下式:
[0091]
y=f(x,{(wi})+wsxi[0092]
s42:采用3种尺度的池化层来精炼特征的聚合能力,其中池化分别为10
×ꢀ
10,20
×
20,30
×
30,从这三个维度覆盖遥感影像的各个尺度特征,在每个尺度的后面一次使用3
×
3卷积进一步进行特征融合,通过双线程插值得到多尺度特征,使用roialign代替
roipooling,相比较roipooling,roialign的反向传播需作修改,roialign的反向传播公式,如下所示:
[0093][0094]
其中,xi代表池化前特征图上的像素点;y
rj
代表池化后的第r个候选区域的第j个点;i
*
(r,j)代表点y
rj
像素值的来源(最大池化的时候选出的最大像素值所在点的坐标)。d(i,i
*
(r,j))表示两点之间的距离,δh和δw表示xi与x
i*(r,j)
横纵坐标的差值,这里作为双线性内插的系数乘在原始的梯度上。
[0095]
s43:获得特征地图之后,进行roialign,获取所需roi,然后进行mask 预测分支、预测类别以及预测边界框,计算损失函数,利用全连接分类,边框, mask进行回归。
[0096]
本实施例中,步骤s5的具体步骤如下:
[0097]
s51:利用测试集在s4步骤中训练好的深度学习实例分割网络模型上进行随机测试;
[0098]
s52:利用验证集调整模型,进而再测试,反复迭代;
[0099]
s53:当测试精度低于85%适当增加标签数量,当随机测试达到满意效果后(精度85%以上),最终完成深度学习实例分割网络模型的遥感影像土地利用分类模型构建。
[0100]
进一步地,参阅图3,步骤s6的具体步骤如下:
[0101]
s61:基于地理空间关系对待分类的遥感影像按行列进行分割,并进行地理编码,即把描述成文本的地理位置信息转换成地理坐标;
[0102]
s62:将编码结果输入深度学习实例分割网络模型进行土地利用分类;
[0103]
s63:对深度学习实例分割网络模型的输出结果进行映射式解码,将地址分词并用数据库搜索,将地址匹配,得到高分辨率遥感影像土地利用分类产品。
[0104]
本实施例中,所述步骤s4中的使用过程中通过损失函数反向传播误差来优化神经网络模型参数,即将训练图像和标签一起输入深度神经网络中训练,通过损失函数反向传播误差来优化模型的参数,针对不同类别的像素数量不均衡提出了改进方法,但有时还需要将像素分为难学习和容易学习这两种样本。容易学习的样本模型可以很轻松地将其预测正确,模型只要将大量容易学习的样本分类正确,loss就可以减小很多,从而导致模型不怎么估计难学习的样本,使用focal loss 让模型更加关注难学习的样本。损失函数的公式为:
[0105][0106]
其中,表示分类损失,l
box
表示边界框回归损失,l
mask
是实例分割损失,将其应用于每个像素,然后将roi上所有像素的交叉熵的平均值作为l
mask

[0107]
l
cis
(p,u)=-logpu[0108]
其中p是在k+1个类别上每个roi的概率分布,u是相应的真实类别。通常,p是通过在完全连接层的k+1个输出上的softmax计算的。
[0109][0110]
对于每一个roi,mask分支定义一个维度为km×km
的矩阵来表示k个不同分类,进而
对于每个m
×
m的区域进行编码,每个mask均有k个分类。对预测mask分支中的每个像素点求sigmoid函数均值(平均二值交叉熵损失函数 l
mask
),该函数仅在第k个类别上有定义,其它的k-1个mask输出不参与计算。通过与阈值0.5的比较输出二进制掩码,从而避免了类之间的竞争,这种方式能有效提高实例分割的效果。
[0111][0112]
实施时:对遥感图像的土地利用分类问题进行研究,像素级的土地利用分类技术能够分析遥感影像自动化完成解译工作,提取不同时期土地利用类型等信息,为精准划定“三区三线”、动态监测土地利用变化以及国土空间用途管制等工作的开展提供了动态、精准的数据保障。
[0113]
工作原理是:基于现有基于遥感影像的土地利用分类方法精度不高,效果不佳,因为传统遥感影像分类方法普遍依赖于人工判读,虽然具有较好的精度,但是要求操作人员具备丰富经验,且解译过程耗时耗力,无法满足当代自然资源管理和经济社会发展对卫星遥感影像的需求。本发明创新地设计了一种基于深度学习的高分辨率遥感影像分类方法,采用mask r-cnn网络模型的训练,该模型算法应用灵活;在特征提取网络中构造分层连接,使用卷积神经网络提出的一种构建模块(即深度学习多尺度网络结构resnet101),以更细粒度表示小目标的多尺度特征,并增加每个网络层的感受野;同时,使用地理编码,把描述成文本地址的地理位置信息转换成地理坐标的方式,可对异构数据进行有效融合和集成。
[0114]
本发明方法引入深度学习实例分割网络模型,提出使用resnet101的结构并在预训练模型中引入fpn该结构具有自下而上和自上而下的两条计算线,通过前向传播获得每一层的特征后,进而通过自上而下的特征融合来增强深层特征。
[0115]
本发明方法在解码阶段使用多尺度的池化来覆盖遥感图像的各个尺度,对特征进行加强学习和过滤,提升模型的精度,使用地理编码,把描述成文本地址的地理位置信息转换成地理坐标的方式,对异构数据进行有效融合和集成。
[0116]
本发明网络使用深度学习实例分割网络的结构,通过将深度学习实例分割网络模型与编码-解码模型进行串联整合,能够接收任意尺寸的原始影像,最后输出一张与原始影像相同大小且带有像素标注的分类图。
[0117]
本发明提高数据在神经网络中训练效果,基于细粒度的分类关注样本特征,将局部特征与全局特征结合在一起,既关注整体的分类效果又对局部更精细的分类。本发明技术从像素级的尺度对遥感图像的土地利用分类问题进行研究,像素级的土地利用分类技术能够分析遥感影像自动化完成解译工作,提取不同时期土地利用类型等信息,为精准划定“三区三线”、动态监测土地利用变化以及国土空间用途管制等工作的开展提供了动态、精准的数据保障。
[0118]
如图1所示,本发明还提供一种基于深度学习的高分辨率遥感影像土地利用分类系统,该系统支持所述的一种基于深度学习的高分辨率遥感影像土地分类方法,该系统包括:数据处理模块:获取高分辨率遥感影像数据,对其进行预处理,制作土地利用类型训练集、验证集、测试集;
[0119]
分类模型创建模块:构建深度学习实例分割网络模块,使用coco数据集进行预训练,使用土地利用类型测试集进行随机测试,直至随机测试达到满意效果 (精度85%以上),完成深度学习实例分割网络模型的构建;
[0120]
编码模型创建模块:以地理空间关系对待分类的遥感影像按行列进行分割和地理编码,并将编码结果输入到深度学习实例分割网络模型,进行土地利用分类;
[0121]
解码模型创建模块:对深度学习实例分割模型的输出结果进行映射式解码,将地址分词并用数据库搜索,将地址匹配,得到高分辨率遥感影像土地利用分类产品;
[0122]
结果输出模块:用于自动拼接解码后的分幅图像,并输出土地利用分类后的图像。
[0123]
本实施例中,获取深圳市的高分辨率遥感影像,进行预处理包括:收集高分辨率遥感影像,对输入的原始数字图像选择工作范围,先进行降噪、图像增强等处理,然后选择gcp以及地面投影,匹配地面控制点与像元的位置,选择纠正函数和相关的参数,经过重采样步骤之后,最终输出纠正后的图像;
[0124]
本实施例中,所述分类模型创建模块执行过程如下:
[0125]
将输入数据使用黑色像素填充影像的边缘,使得遥感图像变为规则矩形,然后采用按掩膜提取的方式对图像进行不同尺寸的随机分割,分割尺度分别为 30*30、20*20和10*10;
[0126]
将分割后的图像批量降维到分辨率1024
×
1024,并按照7:2:1的比例划分训练集、验证集与测试集。
[0127]
采用人工标注的方式,为防止出现过拟合现象,采用两种标注方式:即土地利用类型斑块的边界标注和使用labelme工具对输入图像数据集进行多边形标注,对土地利用类型标注底图中具有代表性的人造地物进行土地利用类型斑块内部统一纹理的单独标注,得到精细的土地利用类型标注图。
[0128]
采用深度学习多尺度网络结构resnet101网络,对输入数据图像提取图像特征的高维表达,所述图像特征分成8组特征xi,i∈{1,2,3,4,5,6,7,8},每个子集的分辨率大小和原特征相同,resnet101网络对每一层的输入做一个reference(xi),学习形成残差函数,其表达式f如下:
[0129]
f=w2σ(w1xi)
[0130]
其中σ代表非线性函数relu,然后通过一个shortcut和第二个relu,获得输出y;
[0131]
y=f(x,{wi})+xi[0132]
当需要对输入输出维数进行变化时,如改变通道数目,可以在shortcut时对 xi做一个线性变换,如下式:
[0133]
y=f(x,{wi})+wsxi[0134]
采用3种尺度的池化层来精炼特征的聚合能力,其中池化分别为10
×ꢀ
10,20
×
20,30
×
30,从这三个维度覆盖遥感影像的各个尺度特征,在每个尺度的后面一次使用3
×
3卷积进一步进行特征融合,通过双线程插值得到多尺度特征,使用roialign代替roipooling,相比较roipooling,roialign的反向传播需作修改,roialign的反向传播公式,如下所示:
[0135][0136]
其中,xi代表池化前特征图上的像素点;y
rj
代表池化后的第r个候选区域的第j个
点;i
*
(r,j)代表点y
rj
像素值的来源(最大池化的时候选出的最大像素值所在点的坐标)。d(i,i
*
(r,j))表示两点之间的距离,δh和δw表示xi与x
i*(r,j)
横纵坐标的差值,这里作为双线性内插的系数乘在原始的梯度上。
[0137]
获得特征地图之后,进行roialign,获取所需roi,然后进行mask预测分支、预测类别以及预测边界框,计算损失函数,利用全连接分类,边框,mask进行回归。
[0138]
本实施例中,所述编码模型创建模块执行过程如下:随机抽取不同尺寸预处理好的高分辨率影像组成的测试数据集;在s4步骤中训练好的深度学习实例分割网络模型上进行随机测试;当随机测试达到满意效果后(精度85%以上)以地理空间关系对预处理后的遥感影像按行列进行分割并进行编码;
[0139]
本实施例中,所述解码模型创建模块执行过程如下:基于地理空间关系对输入数据按行列进行分割和地理编码,即把描述成文本的地理位置信息转换成地理坐标;
[0140]
将编码结果输入深度学习实例分割网络模型进行土地利用分类;
[0141]
对深度学习实例分割网络模型的输出结果进行映射式解码,将地址分词并用数据库搜索,将地址匹配,得到高分辨率遥感影像土地利用分类产品。
[0142]
本实施例中,所述步骤s4中的使用过程中通过损失函数反向传播误差来优化神经网络模型参数,即将即将训练图像和标签一起输入深度神经网络中训练,通过损失函数反向传播误差来优化模型的参数,针对不同类别的像素数量不均衡提出了改进方法,但有时还需要将像素分为难学习和容易学习这两种样本。容易学习的样本模型可以很轻松地将其预测正确,模型只要将大量容易学习的样本分类正确,loss就可以减小很多,从而导致模型不怎么估计难学习的样本,使用focalloss让模型更加关注难学习的样本。损失函数的公式为:
[0143][0144]
其中,表示分类损失,l
box
表示边界框回归损失,l
mask
是实例分割损失,将其应用于每个像素,然后将roi上所有像素的交叉熵的平均值作为l
mask

[0145]
l
cis
(p,u)=-logpu[0146]
其中p是在k+1个类别上每个roi的概率分布,u是相应的真实类别。通常,p是通过在完全连接层的k+1个输出上的softmax计算的。
[0147][0148]
对于每一个roi,mask分支定义一个维度为km×km
的矩阵来表示k个不同分类,进而对于每个m
×
m的区域进行编码,每个mask均有k个分类。对预测mask分支中的每个像素点求sigmoid函数均值(平均二值交叉熵损失函数l
mask
),该函数仅在第k个类别上有定义,其它的k-1个mask输出不参与计算。通过与阈值0.5的比较输出二进制掩码,从而避免了类之间的竞争,这种方式能有效提高实例分割的效果。
[0149]
[0150]
本发明系统为解决遥感影像在像素级的土地利用分类中存在的问题,提出在分类阶段(分类模型创建模块)使用resnet101的结构并在预训练模型中引入 fpn算法。该结构具有自下而上和自上而下的两条计算线,通过前向传播获得每一层的特征后,进而通过自上而下的特征融合来增强深层特征,使用多尺度的池化来覆盖遥感图像的各个尺度,加入mask分割掩码网络,对特征进行加强和过滤,提升模型的精度。同时,使用地理编码,把描述成文本地址的地理位置信息转换成地理坐标的方式,对异构数据进行有效融合和集成。本发明与浅层学习算法相比,基于像素级分割的方法可以同时获得更好的目标检测与分割效果。
[0151]
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1