一种基于空间信息语义分割模型的不透水面提取方法

文档序号:35285709发布日期:2023-09-01 06:18阅读:58来源:国知局
一种基于空间信息语义分割模型的不透水面提取方法

本发明属于自然科学,具体的说是一种基于空间信息语义分割模型的不透水面提取方法。


背景技术:

1、我们国家正在实施新型城镇化,建设人民城市。建设人民城市需要落实到城市空间布局的各个方面,需要充分考虑城市的密度、温度、精度、广度、绿度。城市不透水面就是一个很好的反映城市化进程的指标,其动态变化可以为城市环境监测、空间规划、城市土地利用分析等提供有效的数据。

2、传统的不透水面数据的获取方式主要有4种:从国土调查数据库获取、从规划资料获取、人工解译施工图以及地面勘察测绘。这些方法均存在不能实时获取最新数据,且自动化水平低,不能高效、准确提取信息的问题。而使用载有先进的多谱段遥感设备的卫星,使人们通过对各种现象的表面描述过渡到软件分析和计量探索,使得能够客观、动态地为城市环境系统的监测和管理提供有力的数据基础。

3、当前基于遥感图像进行不透水面提取还存在以下问题:(1)如果图像分辨率低于空间分辨率,则很难在图像中检测地物,除非地物具有独特的亮度或颜色或独特的边缘和纹理特征;(2)地物是多样且不断变化的,不同类型的地物相互交错,并表现出接近均匀的光谱特征。此外,相同类型的地物在不同场景中往往呈现出异构的情况,则对于光谱系数的提取存在光谱混淆的可能性;(3)不透水面提取模型精度受限于遥感影像的空间分辨率,而高分辨率遥感影像如亚米级遥感影像成本高昂,且较难获取,且较高精度的深度学习模型计算复杂、运算时间较长,对于计算机硬件性能要求较高;(4)基于语义分割模型进行不透水面提取常出现地物空洞、边界模糊、地物错分等现象,对于不透水面中的建筑物、道路的空间信息表达不充分,且易产生过拟合现象。因此,在中分辨率影像的基础上,研究对城市中的建筑物、道路等具备更精确的解译能力,能够提取较高精度的不透水面信息的模型具有重要意义。


技术实现思路

1、针对目前基于遥感影像提取不透水面存在地物混淆、边界模糊等问题,且语义分割模型计算复杂、运算量较大,本发明提供了一种基于空间信息语义分割模型的不透水面提取方法,考虑到地物的复杂性和遥感影像中场景的多元性,在ocr语义分割模型的基础上,引入clhrnet作为主干网络,构建多尺度多维度的全局上下文模型,结合shufflenet和坐标注意力机制构建改进的空间信息模块,达到增强地物空间信息的提取能力的同时运算量不需要大幅度提高的目标,通过dropblock规范卷积网络结构,改善模型过拟合问题,提升模型精度。

2、为了达到上述目的,本发明是通过以下技术方案实现的:

3、本发明是一种基于空间信息语义分割模型的不透水面提取方法,该不透水面提取方法包括如下步骤:

4、步骤1、获取遥感影像,对遥感影像进行预处理得到遥感影像数据集,对所述遥感影像数据集进行切割得到影像切片数据集,对所述影像切片数据集进行划分得到遥感影像切片数据集和地面真值标签数据集;

5、步骤2、构建ocr_clhrnet模型,包括clhrnet模型的搭建和ocr模型的优化,获取高分辨遥感影像,将所述高分辨遥感影像输入构建好的ocr_clhrnet模型进行训练,得到自训练的预训练模型,在ocr_clhrnet模型的基础上搭载自训练的预训练模型,输入所述影像切片数据集进行训练,得到最优模型即为不透水面预测模型;

6、步骤3、预测不透水面结果:将步骤1得到的得到遥感影像切片数据集和地面真值标签数据集输入到步骤2得到的所述不透水面预测模型,得到语义分割结果;

7、步骤4、将步骤3得到的语义分割结果进行重分类,得到不透水面结果,得到影像切片数据的不透水面分类结果;

8、步骤5、将步骤4得到的影像切片数据的不透水面分类结果按照步骤1对遥感影像数据集的影像进行切片的操作进行还原拼接,拼接后即得到区域的不透水面分布结果。

9、本发明的进一步改进在于:步骤2中构建ocr_clhrnet模型具体包括如下步骤:

10、步骤2-1、构建第一阶段空间卷积网络bottleneck:1×1卷积层获取特征,通过2个3×3卷积层,接着通过下采样层,最后通过channel shuffle层得到初步的第一个阶段的特征信息;

11、步骤2-2、在步骤2-1构建的空间卷积网络bottleneck基础上,重复堆叠bottleneck,修改通道个数为64,堆叠4个分支进行输出,输出结果为第一阶段的特征信息;

12、步骤2-3、构建空间信息模块basic block:构建两条分支,第一条分支的操作包括5×5深度卷积层、1×1卷积层和坐标注意力机制层,第二条分支的操作包括1×1卷积层、5×5深度卷积层和下采样层,将两个分支进行相加操作,输入channel shuffle,完成特征信息的融合;

13、步骤2-4、获取不同分辨率上的特征图:由步骤2-3构建的空间信息模块basicblock作为基础网络,搭建并行网络,重复堆叠空间信息模块basic block并改变特征大小,保留多尺度信息,在第二阶段输出8个分支,在第三阶段输出16个分支,在第四阶段输出64个分支,分支数量代表着特征图的解析度,即不同分辨率上的特征信息,获得一种实现多尺度信息融合、高低分辨率信息并行处理、空间信息敏感的语义分割网络结构,即clhrnet;

14、步骤2-5、为充分结合clhrnet和ocr模型的优势,将步骤2-4搭建的clhrnet作为主干网络,将第四阶段得到的特征信息输入ocr模型中,所述ocr模型的实现主要包括3个阶段:软对象区域、对象区域表示及最后的对象上下文特征表示,软对象区域的操作包括特征提取和多尺度的特征表示,即基于注意力机制se(spatial excitation)模块提取特征和基于多层金字塔池化aspp(atrous spatial pyramid pooling)模块进行多尺度的特征表示,对象区域表示的操作包括特征提取、边框定位、多尺度特征融合、多方向特征编码、上下文特征增强,对象上下文特征表示的操作包括对象特征提取、上下文特征编码、多尺度特征融合、对象分类和识别,当把对象上下文特征表示与网络最深层输入的特征表示拼接之后作为上下文信息增强的特征表示,基于增强后的特征表示预测每个像元的语义类别,即ocr模型计算一组对象区域的特征表达,根据对象区域的特征表达与像元的特征表示之间的相似度将这些对象区域特征表示传达到每一个像元,在对象上下文特征表示阶段引入dropblock,即一种结构化的dropout形式,随机地将特征相邻区域中的单元进行屏蔽处理;

15、步骤2-6、通过软对象区域的处理后,得到了类别区域特征,进入对象区域表示阶段,对区域进行边框定位以及特征提取;

16、步骤2-7、完成步骤2-6对象区域表示阶段的特征信息提取后,进入最后的对象上下文信息提取网络和预测网络部分,完成了ocr_clhrnet模型的搭建;

17、步骤2-8、为了加速模型训练和提高模型性能,进行预训练模型的训练:获取高分辨率遥感影像,按照第一部分的步骤制作输入模型的数据集,输入构建好的ocr_clhrnet模型进行训练,设置的预训练模型训练参数,训练完后即得到自训练的预训练模型;

18、步骤2-9、在步骤2-7的ocr_clhrnet模型中搭载步骤2-8得到的预训练模型,按照预测模型的参数配置进行训练,得到最优模型即为不透水面预测模型。

19、本发明的进一步改进在于:在所述步骤2-3中,构建坐标注意力机制层具体为:为了增强模型对于空间信息的感知能力,引入一种加强特征的空间关系的自注意力机制,即坐标注意力机制。首先,输入特征图层经过两个卷积层,分别得到坐标特征和特征通道,对坐标特征进行归一化处理,得到坐标特征图,将特征通道和坐标特征图相乘,得到加强空间信息的特征表示。将得到的特征通过卷积操作输出。

20、本发明的进一步改进在于:所述步骤2-6具体为:

21、步骤2-6-1、特征提取:采用fcn模型对文本区域进行分割,并获得各自的文本边框信息;

22、步骤2-6-2、边框定位:通过rpn模型对文本边框进行定位,并获得更加准确的文本边框信息;

23、步骤2-6-3、多尺度特征融合:采用金字塔池化的方式对文本特征进行分层、提取,使得网络在不同尺度上具有更好的表现力;

24、步骤2-6-4多方向特征编码:采用方向感知的roialign操作对步骤2-6-3提取的特征进行编码,从而获得不同方向的特征表示;

25、步骤2-6-5、上下文特征增强:采用dss模块对步骤2-6-4的局部特征和全局特征进行交互,增强文本区域的上下文特征。

26、本发明的进一步改进在于:所述步骤2-7具体包括如下步骤:

27、步骤2-7-1、采用基于深度残差网络的对象特征提取模块,对输入图像进行特征提取步骤2-7-2、采用基于se机制的上下文特征编码模块,对对象特征进行编码和增强;

28、步骤2-7-3、采用aspp模块对步骤2-7-2编码后的特征进行融合,以获取多尺度的特征表示;

29、步骤2-7-4、利用rpn模块对步骤2-7-3获取的特征表示进行滑动窗口搜索,以确定对象的位置和大小;

30、步骤2-7-5、采用基于循环神经网络的对象识别模块,对步骤2-7-4的对象进行分类和识别;

31、步骤2-7-6、采用非极大值抑制(nms)算法对候选框进行筛选,以获得最终的对象检测结果,ocr模型实现了对影像中对象的准确和鲁棒的检测和识别。

32、本发明的进一步改进在于:所述步骤1具体包括如下步骤:

33、步骤1-1、获取公开的中分辨率遥感影像,对初始的遥感影像进行大气校正、辐射定标、影像裁剪的预处理,得到预处理后的初始遥感影像数据集;

34、步骤1-2、将步骤1-1预处理后的初始遥感影像数据集进行规则切片处理,按照256×256的尺寸进行滑片裁剪,设置裁剪的重复率为0.1,得到影像切片数据集;

35、步骤1-3、将步骤1-2得到的影像切片数据集按照6:2:2的比例划分为训练集、验证集、测试集,将训练集与验证集数据通过人工目视解译方式利用labelme工具制作地面真值标签,标签共分背景、其他、植被、道路、房屋5类,得到了遥感影像切片数据集和地面真值标签数据集;

36、步骤1-4、为了充分验证模型的泛化性,对步骤1-2得到的影像切片数据集进行数据增强处理,具体进行了包括调整大小、图像裁剪、水平翻转、垂直翻转、高斯模糊、色彩和亮度扰动、归一化的操作,加强数据的多样性,提高模型的鲁棒性和泛化能力。

37、本发明的有益效果是:本发明提出了一种基于空间信息语义分割模型的不透水面提取方法,可以利用中分辨率影像达到较高精度的不透水面提取,模型训练速度较快,可以实现大规模、精细化的不透水面监测。

38、本发明提出的ocr_clhrnet模型,对空间信息具有较高的感知能力,在hrnet模型的基础上引入空间注意力机制提升了对于特征信息的提取能力,结合shufflenet使网络轻量化,在ocr模型的基础上引入dropblock规范卷积网络,有效降低了模型的过拟合问题。

39、该方法可以改善对于不透水面类地物边界信息、空间信息、特征信息的提取,提升模型训练的效率,提高模型提取不透水面的精度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1