本发明涉及遥感图像,尤其涉及一种大尺度遥感图像语义分割优化方法。
背景技术:
1、在遥感图像处理技术领域,大尺度光学遥感影像的典型场景精细分割是一项关键的基础技术。所述遥感图像的语义分割技术,是一种运用深度学习架构来提取高阶场景语义特征,对图像像素进行精准分类标记的方法。该技术通过深入挖掘并解析遥感图像内在的多维信息结构,实现对复杂遥感场景的深度理解,是遥感图像智能解译的核心技术。通过对大尺度遥感影像中的水域、道路和建筑物等典型地物进行高精度语义分割,可在地形图测绘、城市规划和灾害应急响应等方面产生重要的应用价值。近年来,基于深度卷积神经网络(deep convolutional neural network,dcnn)的遥感图像分割技术表现卓越,其能够自适应学习和抽取不同层次的特征信息,包括底层的物体细节特征以及高层的抽象语义特征。
2、然而,现行基于dcnn的大尺度遥感影像分割技术普遍面临一个核心挑战,即分割结果中存在的“棋盘状”失真效应。这种现象主要源于大规模遥感影像数据与现有处理器存储及计算资源之间的固有矛盾,以及dcnn卷积运算内在机制的局限性。具体来说,由于大型遥感图像无法整体适配到dcnn模型进行实时处理,故需要将其划分为多个子图像块进行分块输入,各子块经分割网络独立推理后再拼接回原始图像布局,由此产生的拼接界面往往表现出显著的过渡不连续性,形成类“西洋跳棋盘”式的纹理瑕疵。
3、深入探究其技术原理可知,dcnn语义分割网络中卷积层的结构设计及其特有的处理方式是导致上述问题的根本所在。在构建此类网络时,通常采用特征映射的“填充”策略以保持空间维度的一致性,即依据卷积核尺寸在原始图像边界添加一定数量的零值填充。尽管如此,“填充”操作却不可避免的在特征映射的边缘引入了非有效信息,降低了这部分边缘像素的预测可信度。随着网络层数加深,卷积过程中使得边缘效应逐步向内部扩展,导致特征映射的整体质量呈现出由边缘至中心递减的趋势,进一步引发了分割结果边缘区域与中心区域的识别准确率差距加大。
4、另外,针对大尺度遥感影像的传统分割方法在处理切割后的小图块时,缺乏有效的边缘信息整合措施,这容易造成分割结果的部分区域出现信息缺失或遗漏的问题。
技术实现思路
1、为解决上述现有技术中存在的技术问题,本发明的目的在于提供一种大尺度遥感图像语义分割优化方法,解决传统大尺度遥感影像分割方法分割结果存在部分区域信息错误或缺失的问题。
2、为实现上述发明目的,本发明提供一种大尺度遥感图像语义分割优化方法,包括以下步骤:
3、步骤s1、确定裁切图块尺寸、边缘距离和保留区尺寸;
4、步骤s2、定义分割结果矩阵,根据所述边缘距离将大尺度原始待分割图像划分为边缘区域和内部区域;
5、步骤s3、以所述保留区尺寸为基准定义窗口的尺寸,在所述内部区域按顺序滑动,完成保留区图块定位;
6、步骤s4、根据定位结果,将每个位置的保留区图块范围外扩,以外扩后的尺寸对所述保留区图块进行裁切获得裁切图块,并将所述裁切图块输入语义分割网络,得到图块推理结果;
7、步骤s5、对每个位置对应的所述图块推理结果进行边缘裁切,并将边缘裁切后的所述图块推理结果贴回所述分割结果矩阵的对应位置;
8、步骤s6、裁切所述分割结果矩阵的边缘,得到最终分割结果。
9、根据本发明的一个技术方案,在所述步骤s1中,具体包括:
10、步骤s11、定义所述裁切图块的尺寸为w×h,其中w表示所述裁切图块的宽度,h表示所述裁切图块的高度;
11、步骤s12、定义所述边缘距离n为所述保留区的边缘到所述裁切图块的边缘的距离;
12、步骤s13、根据所述裁切图块的尺寸和所述边缘距离,确定所述保留区的尺寸为(w-n)×(h-n)。
13、根据本发明的一个技术方案,所述裁切图块的宽度w与所述裁切图块的高度h相等。
14、根据本发明的一个技术方案,所述边缘距离n不少于20个像素。
15、根据本发明的一个技术方案,在所述步骤s2中,具体包括:
16、定义所述分割结果矩阵m用于保存对所述大尺度原始待分割图像的语义分割结果,所述分割结果矩阵m的尺寸与所述大尺度原始待分割图像的尺寸相等,所述内部区域为所述大尺度原始待分割图像去除所述边缘区域后的剩余中心区域;
17、设置所述大尺度原始待分割图像的尺寸为w×h,根据所述边缘距离n,所述内部区域的尺寸为(w-n)×(h-n)。
18、根据本发明的一个技术方案,在所述步骤s3中,具体包括:
19、以所述保留区的尺寸为基准定义所述窗口的尺寸,将所述窗口在所述内部区域内滑动,记录每个所述窗口覆盖的图块的范围和图块的坐标;
20、所述窗口的滑动以所述内部区域的左上角为起点,按顺序逐行、逐列、无重叠滑动。
21、根据本发明的一个技术方案,所述窗口的滑动还包括:
22、a)对于每个行方向滑动,当所述窗口滑动到所述大尺度原始待分割图像的最右端,若所述窗口完全覆盖所述内部区域,则不需要处理;若所述窗口覆盖部分所述内部区域,则将所述窗口左移,直到所述窗口完全覆盖所述内部区域为止;
23、b)对于每个列方向滑动,当所述窗口滑动到所述大尺度原始待分割图像的最下端,若所述窗口完全覆盖所述内部区域,则不需要处理;若所述窗口覆盖部分所述内部区域,则将所述窗口上移,直到所述窗口完全覆盖所述内部区域为止;
24、c)当所述窗口滑动到最右下角,若所述窗口完全覆盖所述内部区域,则不需要处理;若所述窗口覆盖部分所述内部区域,则将所述窗口同时左移和上移,直到所述窗口完全覆盖所述内部区域为止。
25、根据本发明的一个技术方案,在所述步骤s4中,具体包括:
26、步骤s41、设置外扩距离为边缘距离n,对所述保留区图块向四周进行范围外扩,经所述范围外扩后得到的所述裁切图块的尺寸为w×h;
27、步骤s42、将所述裁切图块输入所述语义分割网络进行端对端模式推理,输出的所述图块推理结果的尺寸不变,仍为w×h。
28、根据本发明的一个技术方案,在所述步骤s5中,具体包括:
29、根据边缘距离n对所述图块推理结果进行边缘裁切,裁切完成后的所述图块推理结果的尺寸为(w-n)×(h-n);
30、根据所述图块推理结果对应的在所述分割结果矩阵中的坐标,对所述图块推理结果贴回所述分割结果矩阵。
31、本发明与现有技术相比,具有如下有益效果:
32、本发明通过灵活配置裁切图块的尺寸等分割参数,可有效提高图块之间的过渡连续性,有效缓解甚至解决“西洋跳棋盘”现象;通过调整裁切图块和边缘尺寸等参数,可输出更加优化的语义分割结果。
33、本发明可最大化完成对原始图像分割,减少信息提取漏洞。本发明仅对大尺度待分割图像的少量周边像素进行剔除,并完成对所有剩余像素的语义分割,最大可能保持信息提取的完整性。