一种基于残差块和密集连接的水体分割方法

文档序号:34232661发布日期:2023-05-24 16:26阅读:99来源:国知局
一种基于残差块和密集连接的水体分割方法

本发明属于计算机图像分割领域,是基于残差块和密集连接的方法提取水体。


背景技术:

1、随着遥感技术的飞速发展,遥感图像的可用性迅速增长,人类已经进入了大数据遥感的时代,使得大规模的水体监测成为可能。为了进行及时的大规模水体监测,遥感图像的自动水体检测变得非常紧迫。众所周知,光学遥感图像中的水体区域通常具有多尺度特征,因为水体区域由不同类型的水体组成,例如薄区和宽区,并且这些水体类别中存在很大差异。因此,从遥感图像中准确检测水体仍然是一个具有挑战性的问题。虽然现有的研究表明合成孔径雷达图像具有监测水体的潜力,但使用光学遥感图像有效监测水体仍然非常重要,因为光学遥感图像比sar图像更容易收集。

2、现有的水体监测方法主要包括两个角度。传统方法主要基于手工制作的特征,如归一化差分水指数,基于波段分析的方法,灰度级共发生矩阵和支持向量机方法。如上所述,大多数传统的水体检测方法强烈依赖于遥感图像的光谱信息,很少关注上下文空间信息,普遍适用性较差。目前,比较主流的方法是基于深度学习的水体检测方法,这引起了越来越多的关注。计算机视觉领域的许多一般深层网络都方便用于水体检测,但它们没有充分考虑水体的特征。

3、近年来,由于有大量的标记或未标记数据可用,深度学习在计算机视觉领域越来越受欢迎,并已成功用于图像解释。long等人提出了第一个用于图像分割的端到端深度学习网络,称为全连接网络(fcn)。ronneberger o.et al.介绍了一种称为u-net的编码器-解码器架构,它使用跳过连接来提取多尺度信息。作为具有代表性的编码器-解码器架构,deeplab v3+将深度可分离卷积应用于空间金字塔池,并取得了出色的效果。最近,hr-net在许多官方数据集上使用时取得了优异的成绩。hr-net在许多领域显示最佳性能的原因是它从高分辨率表示中构建了多级表示并将其应用于其他框架。作为语义分割的一个流行分支,即时语义分割正在迅速发展,ddrnet包括一种新颖的上下文信息提取器,最近在道路场景中实现了最先进的性能。在遥感领域,图像场景分类、检索、分割和检测都取得了很大的突破。然而,在各种类别中,水体具有自己复杂的特征,包括总是混合阴影的详细信息和图像。

4、unet作为一个基础网络,尽管u-net取得了最先进的成果,但该网络也有一些局限性。首先,基本的u-net是一个拥有大约1900万个参数的庞大网络,为了很好地适应网络,我们需要大量的数据进行训练。使用大量数据会导致计算成本。其次,为了获得更高的精度,在网络中添加了更多的卷积层,卷积层序列导致学习不必要的信息。第三,作为一个巨大的网络,u-net有时会遇到梯度消失的问题,这给深度神经网络的训练带来了困难。

5、尽管有许多学者研究从遥感图像中提取水体,但同时获得海洋,湖泊,小池塘和狭窄溪流等水体物体的不同外观,大小,形状和比例仍然是一个挑战。

6、针对上述问题,通过考虑光学遥感影像中水体的各种特征,提出一种基于残差块与密集连接的新型深度语义分割网络。


技术实现思路

1、为了解决unet应用于水体提取上的问题,本文提出一种基于残差块与密集连接的新型深度语义分割网络。如图1所示,我们提出了一种基于u-net的编码器—解码器神经网络,用于水体提取的分割。resbcu-net网络利用残差块、批量归一化和双向卷积长短期记忆(bconvlstm)网络的功能来完成任务,残差块的网络结构图如图2所示,bconvlstm网路结构图如图3所示。在网络中,我们用残留块和批量规范化来增强编码路径,并通过在路径中使用bconvlstm网络来增强解码路径。如图1所示为本文的技术路线。

2、本发明采用的技术方案是一种基于残差块与密集连接的水体提取技术研究方法,该方法包括:

3、步骤1:通过resbcu-net的编码层获得不同尺度的特征图送至下一个编码层以及对应的解码层;

4、步骤2:通过resbcu-net的解码层还原至原图大小并实现水体的提取;

5、进一步,所述步骤1的具体方法为:

6、步骤1.1:resbcu-net的编码路径由残差块和具有九个卷积层的批量归一化层组成。在残差块部分引入了三个卷积块,而不是编码路径中两个卷积层的块,每个卷积块后跟一个批处理规范化层。然后,通过将第一个卷积层的输出添加到块中批处理归一化层的输出中,将每个块转换为残留块。

7、步骤1.2:路径由三个块组成,每个块包含三个卷积层,后跟一个批处理规范化层,批量归一化图层通过计算整个数据集的均值和标准差值来控制分布的变化,方法是将平均值调整为0并将方差调整为1;

8、步骤1.3:每个块中第一个卷积层的输出与批处理规范化层的输出一起添加,然后后面是最大池化层。同时,在最大池化层之前,每个块的输出被传递到与解码路径的相应输出进行串联,批处理层使用在每个块的末尾,就在最大池化层之前。在最大池化层之后,第三块卷积层瓶颈部分的网络开始,其中我们只使用两个卷积层,每个卷积层后跟一个激活函数relu;

9、所述步骤2的具体方法为:

10、步骤2.1:首先编码路径中相应块的特征在与解码路径的相应块的输出串联后传递到bconvlstm中,在每个块中,bconvlstm的输出被传递到两个卷积层中,在解码路径中,我们利用resbcu-net的卷积长短期记忆(convlstm)网络,我们使用卷积长短期记忆将特征处理为两个方向:向前和向后,称为bconvlstm以用于克服神经网络在训练中长期依赖的梯度消失问题;

11、步骤2.2:然后通过卷积核大小为1×1×k(k为64,128,256,512)的过滤器,生成不同尺度大小的特征图;

12、步骤2.3:在网络的瓶颈部分之后,使用带有2×2滤波器的向上采样卷积,然后是批量归一化层,然后是两个卷积层块;

13、步骤2.3:在解码路径的末尾,我们使用一个带有1×1滤波器的卷积层,后跟一个sigmoid函数作为激活函数,输出最后的水体分割结果;

14、与现有技术相比,本发明的有益效果是:

15、(1)连续的卷积层序列导致学习不同的特征,在某些情况下,它也可能导致学习冗余特征,添加更多层会导致更高的训练误差以及为了避免过度拟合并加速训练过程。在unet编码器部分,增加了残差块以及批归一化处理

16、(2)为了克服神经网络在训练中长期依赖的梯度消失问题,在unet解码器部分引入了卷积长短期记忆网络并使用它将特征处理为两个方向:向前和向后,称为bconvlstm。



技术特征:

1.一种基于残差块和密集连接的水体分割方法,其特征在于,包括以下步骤:

2.如权利要求1所述方法,其特征在于,步骤1中的步骤1.1,连续的卷积层序列导致学习不同的特征,在某些情况下,它也可能导致学习冗余特征,添加更多层会导致更高的训练误差,在unet编码层部分添加了残差块;为了避免过度拟合并加速训练过程,在unet编码层部分添加了批归一化处理。

3.如权利要求1所述方法,其特征在于,步骤2中的步骤2.1,为了克服神经网络在训练中长期依赖的梯度消失问题,在unet解码层部分添加了bconvlstm模块。


技术总结
本发明公开了一种基于残差块和密集连接的水体分割方法。遥感图像中的水体区域通常具有多尺度特征,因为水体区域由不同类型的水体组成。因此,从遥感图像中准确检测水体仍然是一个具有挑战性的问题。UNet取得了最先进的成果,但该网络也有一些局限性。本文针对连续的卷积层序列导致学习不同的特征,在某些情况下,它也可能导致学习冗余特征,添加更多层会导致更高的训练误差以及为了避免过度拟合并加速训练过程的问题。在UNet编码器部分,增加了残差块以及批归一化处理;为了克服神经网络在训练中长期依赖的梯度消失问题,在UNet解码器部分引入了卷积长短期记忆网络并使用它将特征处理为两个方向:向前和向后,称为BConvLSTM。以此来更好地实现水体分割。

技术研发人员:罗欣,赖广龄,常乐,冷庚,贾海涛,许文波
受保护的技术使用者:电子科技大学长三角研究院(湖州)
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1