本发明属于水体识别技术领域,特别是涉及一种基于深度密集神经网络的水体识别方法。
背景技术:
目前卫星遥感被大量应用于环境监测、气象预测、灾害预防等各个方面,其中水体识别是卫星遥感的一个重要应用。水体识别是水体污染检测的前提,其准确度直接影响后续的污染物含量和污染范围的计算,是卫星遥感和自动化环境监测应用的重要一环。
现有的深度学习方法如卷积神经网络进行语义分割从而提取出遥感影像中的水体部分。但是大规模卷积神经网络在带来识别准确率上升的同时,引入了更多的参数,使得网络调优变得更加困难,训练时长也随之增加。
工业上现有的算法大都基于resnet+fcn结构对图像做语义分割,然而语义分割任务本身要求对图像的预测精确到每一个像素点,这导致用于语义分割的神经网络参数数量往往数百倍于用于图像分类的神经网络,大大增加了训练时间。参数增加带来的不只是硬件设施的压力,更有反向传播时梯度消失和训练不收敛等问题,大大降低了语义分割准确率。对水体识别尤其是小型河流的水体无法实现高效精确的识别。
技术实现要素:
为了解决上述问题,本发明提出了一种基于深度密集神经网络的水体识别方法,能够在保证准确率的前提下有效减少用于水体识别的神经网络的参数,大大缩短训练时间,大大降低遥感实时环境监测任务的难度。
为达到上述目的,本发明采用的技术方案是:一种基于深度密集神经网络的水体识别方法,包括步骤:
s100,数据采集,下载卫星遥感影像数据,并对影像数据中的水体和非水体部分进行标注;
s200,建立密集型unet分割网络模型;
s300,使用标注后的训练集数据对密集型unet分割网络模型进行优化训练;
s400,将测试集数据输入优化后的网络模型,识别测试集影像中的水体区域。
进一步的是,建立所述密集型unet分割网络模型,包括步骤:
s201,设置跳跃连接的密集块;
s202,在密集块后设置网络的中间流,所述中间流包括多个扩张卷积块,所述扩张卷积块通过不同扩张卷积操作提取影像中不同级别的特征信息并进行融合处理;使网络训练更关注全局特征,对细小和狭长的河流一样能有很好的识别率;
s203,使用与网络中编码器相同数量的密集块进行特征解码,使用跳跃连接让一部分编码器的特征图连接到编码器对应的密集块进行上采样,将已编码的特征图恢复到原影像尺寸,避免下采样时丢失影像信息,保持网络参数少的特性;
s204,使用损失函数优化网络模型,利用反向传播,在每一个小批量梯度下降训练时更新卷积核权值。
进一步的是,设置所述跳跃连接的密集块,包括步骤:
所述密集块包括四个密集层,每个密集层的输出特征图通过跳跃连接到该密集块的最终输出:
xl=h([xl-1,xl-2,...,x0])
其中,xl为第lth层的输出,使得每一个浅层都与深层直接关联,从而使损失函数在反向传播时快速到达网络浅层,以避免网络过深带来的梯度消失问题。
进一步的是,所述扩张卷积块包括多个3x3卷积核的扩展卷积并列构成,将各个扩展卷积的输出进行融合。
进一步的是,所述损失函数采用dice损失函数:
进一步的是,在所述步骤s100中对影像数据中的水体和非水体部分进行标注后,得到训练集、验证集和测试集,并将所述训练集、验证集和测试集存储在云端服务器中;
在所述步骤s300中,利用所述训练集输入网络进行训练,调整参数,直到验证集在网络上的损失函数输出降到临界值;在测试集上测试网络,输入测试集得到预测输出,对比预测输出和测试集的标签得到混淆矩阵,经过计算得到准确率。
进一步的是,在所述验证集上使用miou指标验证网络泛化能力;当训练损失降低至预设标准并且验证miou达到预设标准时,返回并储存最佳网络模型。
采用本技术方案的有益效果:
本发明融合了残差网络和扩展卷积的优点,充分利用了每一层网络输出的特征图,并非一味地拓宽网络结构,利用具有残差的跳跃连接结构,使最终预测输出的特征图都间接地与前面所有网络层相连。
本发明提出的密集型深度网络结构,不仅充分利用浅层网络的输出,而且减少横向拓宽所需的网络参数数量,减轻梯度消失的问题,使得网络更易于训练和收敛。
附图说明
图1为本发明的一种基于深度密集神经网络的水体识别方法流程示意图;
图2为本发明实施例中扩张卷积块的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步阐述。
在本实施例中,参见图1所示,本发明提出了一种基于深度密集神经网络的水体识别方法,包括步骤:
s100,数据采集,下载卫星遥感影像数据,并对影像数据中的水体和非水体部分进行标注;
s200,建立密集型unet分割网络模型;
s300,使用标注后的训练集数据对密集型unet分割网络模型进行优化训练;
s400,将测试集数据输入优化后的网络模型,识别测试集影像中的水体区域。
作为上述实施例的优化方案,建立所述密集型unet分割网络模型,包括步骤:
s201,设置跳跃连接的密集块;
s202,在密集块后设置网络的中间流,所述中间流包括多个扩张卷积块,所述扩张卷积块通过不同扩张卷积操作提取影像中不同级别的特征信息并进行融合处理;使网络训练更关注全局特征,对细小和狭长的河流一样能有很好的识别率;
s203,使用与网络中编码器相同数量的密集块进行特征解码,使用跳跃连接让一部分编码器的特征图连接到编码器对应的密集块进行上采样,将已编码的特征图恢复到原影像尺寸,避免下采样时丢失影像信息,保持网络参数少的特性;
s204,使用损失函数优化网络模型,利用反向传播,在每一个小批量梯度下降训练时更新卷积核权值。
设置所述跳跃连接的密集块,包括步骤:
所述密集块包括四个密集层,每个密集层的输出特征图通过跳跃连接到该密集块的最终输出:
xl=h([xl-1,xl-2,...,x0])(1)
其中,xl为第lth层的输出,使得每一个浅层都与深层直接关联,从而使损失函数在反向传播时快速到达网络浅层,以避免网络过深带来的梯度消失问题。
如图2所示,所述扩张卷积块包括多个3x3卷积核的扩展卷积并列构成,将各个扩展卷积的输出进行融合。
所述损失函数采用dice损失函数:
作为上述实施例的优化方案,在所述步骤s100中对影像数据中的水体和非水体部分进行标注后,得到训练集、验证集和测试集,并将所述训练集、验证集和测试集存储在云端服务器中;
在所述步骤s300中,利用所述训练集输入网络进行训练,调整参数,直到验证集在网络上的损失函数输出降到临界值;在测试集上测试网络,输入测试集得到预测输出,对比预测输出和测试集的标签得到混淆矩阵,经过计算得到准确率。
在所述验证集上使用miou指标验证网络泛化能力;当训练损失降低至预设标准并且验证miou达到预设标准时,返回并储存最佳网络模型。
本发明的网络结构最终使用了高达192层的神经网络,最终参数个数却只有数百万,远远低于流行的网络模型动辄上千万上亿的参数量,并且在不同数据集上对比,其准确率都超越了基准的resnet5%~10%。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。