1.本发明属于遥感影像数据的信息提取领域,具体涉一种基于深度学习的高分辨率遥感影像不透水面提取技术方案。
背景技术:2.广义的不透水面(impervious surface,is)是指天然或人为源,可以隔离地表水渗透到土壤,进而改变洪水径流的流动、物质沉淀和污染剖面的任何物质。在遥感影像中,不透水面是指水不能快速渗入到地表以下的表面,这些表面通常是具有不透水性的人工质料硬质表面,如建筑物屋顶、停车场和道路等。不透水面是研究城市区扩张情况和衡量城市生态环境状况的重要指标。实时且准确的不透水面信息对于城市规划以及环境和资源管理非常重要,开展不透水面的相关研究对城市生态建设及监测城市动态等具有重要的意义。
3.不透水面遥感研究经过近十几年的发展已有了极大的进步,国内外针对不透水面信息反演的遥感创新技术与方法被相继提出,如光谱混合分析法、指数法、回归分析法等。但由于空间分辨率的限制以及不透水面地物高复杂度,导致不透水面提取精度受限。深度学习方法能充分利用计算机处理性能,具有强大的特征表达能力、自动化等的优势,在图像分类、语义分割和目标检测等领域取得了一系列突破性应用成果。因此,利用深度学习方法可以解决高分辨率遥感影像的数据量大且地物复杂等问题,对于城市不透水面提取的研究具有实际意义。
技术实现要素:4.本发明的目的是从高分辨率遥感影像上精确提取不透水面信息,提供一种基于深度学习的高分辨率遥感影像不透水面自动化提取方案。
5.为实现本发明目的,提供的技术方案如下:
6.一种基于深度学习的高分辨率遥感影像不透水面提取方法,其包括如下步骤:
7.s1:获取目标区域高分辨率遥感影像,对影像进行标注,得到不透水面标签图像;对高分辨率遥感影像以及对应不透水面标签图像进行数据预处理操作,最终得到不透水面样本数据集;
8.s2:构建用于高分辨率遥感影像特征提取的多尺度融合网络模型,所述多尺度融合网络模型以u
‑
net为骨干网络,并将特征金字塔引入u
‑
net网络中对上采样过程中不同尺度的特征进行融合,并基于融合特征对输入模型的高分辨率遥感影像进行逐像素地物类别预测,实现多尺度不透水面目标的检测;
9.s3:以所述不透水面样本数据集作为训练数据,通过最小化损失函数,利用神经网络优化器对多尺度融合网络模型参数进行迭代优化,使多尺度融合网络模型能够准确检测高分辨率遥感影像中的不透水面;
10.s4:将目标高分辨率遥感影像输入训练得到的多尺度融合网络模型中,提取影像融合特征并进行逐像素地物类别预测,得到地物类别为不透水面的区域。
11.基于上述技术方案,各步骤优选采用如下具体方式实现。其中各步骤的优选实现方式在没有冲突的情况下均可进行相应组合,不构成限制。
12.优选的,所述步骤s1中,按照s11~s12步骤构建不透水面数据集:
13.s11:对目标区域的高分辨率遥感影像中不透水面区域进行标注,生成不透水面标签图像;
14.s12:对高分辨率遥感影像以及对应不透水面标签图像利用固定尺寸的随机窗口进行图像块提取,将提取得到的高分辨率遥感影像图像块和不透水面标签图像块作为样本,通过样本筛选、数据增强和归一化操作后,构建为不透水面样本数据集。
15.优选的,所述不透水面样本数据集预先分为训练集和测试集,利用训练集对多尺度融合网络模型进行训练,并利用测试集验证其模型精度,满足精度要求后用于实际高分辨率遥感影像的不透水面提取。
16.进一步的,所述数据增强的操作包括多角度翻转、镜像映射、线性拉伸和添加噪声。
17.进一步的,所述随机窗口的尺寸为256
×
256像素。
18.优选的,所述步骤s2中,多尺度融合网络模型包括u
‑
net网络和特征金字塔网络,其中u
‑
net网络由左侧压缩通道和右侧扩张通道构成,左侧压缩通道对输入的高分辨率遥感影像逐层进行下采样,减小池化层空间维度,用以实现遥感影像特征提取,而右侧扩张通道逐层进行上采样,逐步恢复图像细节和空间维度,并利用跳跃结构与左侧压缩通道对应层级的特征图进行融合;其中特征金字塔网络作为骨干网络u
‑
net之外的子网络,能够获取右侧扩张通道在上采样过程中每一层级的特征图,并将各层级得到的特征图以双线性插值的方式进行尺寸恢复,再将恢复尺寸后的特征图以通道拼接的方式形成融合特征图;最终融合特征图输入softmax分类器中,对像素点属于每种地物类别的概率进行预测,得到高分辨率遥感影像中每个像素点对应各个地物类别的概率,从而确定不透水面类别所在区域。
19.进一步的,对所述通道拼接后的特征图使用1
×
1的卷积核调整特征通道数,再进行softmax分类。
20.优选的,所述损失函数由交叉熵损失函数和dice loss组成。
21.优选的,利用反向传播与优化算法对所述多尺度融合网络模型进行训练,训练过程中通过adam优化算法不断更新权值,使损失函数误差不断减小,直至模型趋于稳定。
22.优选的,所述s5中,目标高分辨率遥感影像采用边缘重叠的方式进行分块裁剪,然后将每个图像块输入训练得到的多尺度融合网络模型中得到输出的分类图块,再将所有分类图块通过忽略边缘策略按序拼接,得到完整影像的地物类别分类结果,即可从中提取出地物类别为不透水面的区域。
23.本发明与现有技术相比具有的有益效果:
24.(1)本发明利用现代人工智能方法优越的拟合与计算能力,将不透水面提取转化为深度学习网络模型构建与训练优化问题,为遥感不透水面提取提供一种新的基于数据驱动的思路。
25.(2)本发明充分考虑高分辨率遥感影像具有高空间分辨率的特点,利用深度学习的计算能力以及提取特征能力,基于u
‑
net模型并引入特征金字塔网络形成了改进的多尺度融合网络模型,该模型能够实现遥感影像多尺度特征融合,以适合高分辨率遥感影像不
透水面提取提取影像多尺度信息,改善了对小目标不透水面提取精度。
26.(3)本发明通过主动学习训练数据中目标的特征,依据输入的图像数据来对光谱和空间信息进行提取和分析应用,从而避免了特征选择过程中效率低、操作复杂等问题,能够实现不透水面自动化提取,最终获得较精确的不透水面信息。本发明在总体精度(overall accuracy,oa)、召回率(recall)、f1分数(f1
‑
score)、均交并比(mean intersection over union,miou)和kappa系数(kappa coefficient)精度评价中均有提升,且操作简单易行,提取效果优秀。本发明对遥感不透水面精确和自动化提取研究提供示范和借鉴。
附图说明
27.图1为基于深度学习的高分辨率遥感影像不透水面提取方法流程图;
28.图2为特征金字塔中特征图融合示意图。
29.图3为基于深度学习模型的预测结果与不透水面标签图像对比。
具体实施方式
30.下面结合附图和具体实施方式对本发明做进一步阐述和说明。
31.高分辨率遥感影像一般是指分辨率在米级和亚米级的遥感影像,城市土地利用情况的复杂性以及不透水面材料的多样性,导致直接从高分辨率遥感影像中提取不透水面具有一定的挑战性。针对从高分辨率遥感影像提取城市不透水面的需求,现有遥感不透水面提取研究中存在的精度较、效率和自动化程度方面的困境。本发明的构思是:综合利用人工智能方法的深度神经网络架构,将不透水面提取转化为深度学习网络模型构建与训练优化问题。以遥感影像及其不透水面标签图像作为基本输入单元,引入全局优化和类别空间关系信息作为约束,训练深度学习模型对不透水面精确提取。在该技术路线中,如何设计深度学习网络模型的模型结构以及如何训练该深度学习网络模型,使其能够准确地从复杂的遥感影像中提出出不透水面,是需要解决的主要问题。本发明中,基于u
‑
net模型结合特征金字塔网络,对不透水面提取网络进行设计,提出了改进的多尺度融合网络模型,实现遥感影像多尺度特征融合,以适合高分辨率遥感影像不透水面提取;同时本发明基于提出的多尺度融合网络模型,设计网络训练框架,对模型训练策略的选取以及对网络超参数的配置。
32.如图1所示,在本发明的一个较佳实施例中,提供了一种基于深度学习的高分辨率遥感影像不透水面提取方法流程图,其主要步骤包括四个步骤,分别为s1~s4:
33.s1:获取目标区域高分辨率遥感影像,对影像进行标注,得到不透水面标签图像;对高分辨率遥感影像以及对应不透水面标签图像进行数据预处理操作,最终得到不透水面样本数据集。
34.s2:构建用于高分辨率遥感影像特征提取的多尺度融合网络模型,所述多尺度融合网络模型以u
‑
net为骨干网络,并将特征金字塔引入u
‑
net网络中对上采样过程中不同尺度的特征进行融合,并基于融合特征对输入模型的高分辨率遥感影像进行逐像素地物类别预测,实现多尺度不透水面目标的检测。
35.s3:以所述不透水面样本数据集作为训练数据,通过最小化损失函数,利用神经网络优化器对多尺度融合网络模型参数进行迭代优化,使多尺度融合网络模型能够准确检测
高分辨率遥感影像中的不透水面。
36.s4:将目标高分辨率遥感影像输入训练得到的多尺度融合网络模型中,提取影像融合特征并进行逐像素地物类别预测,得到地物类别为不透水面的区域。
37.上述s1~s4步骤利用一个多尺度融合网络模型实现了高分辨率遥感影像不透水面的准确提取。下面对本实施例中上述s1~s4的具体实现方式以及其效果进行详细描述。
38.高分辨率遥感影像的尺寸较大,将高分辨率遥感影像直接输入到多尺度融合网络模型中,会由于其数据量过大而对计算机内存产生较大的压力,造成内存溢出。对于该问题,一般采样影像降采样或影像裁剪的方案来解决。然而影像降采样过程会使影像丢失空间细节特征,对最终提取精度造成一定影响。因此需要将影像裁剪成合适大小的图像块,再输入到网络中,进而可以针对少量的相邻像素点所包含的一些小而有意义的特征进行检测,例如不透水面的纹理特征及轮廓特征。
39.本实施例中可引入规则格网、滑动窗口和随机窗口样本选取方案。规则格网选取方案是按照固定大小的规则格网对图像进行切割。该方案可以保证所有区域都被完全遍历到,但获取的样本数量是固定的,并且在地物间特征学习上存在一定的局限性,会对模型训练结果造成影响。滑动窗口选取方案则是采用一个固定大小的窗口,以一定间隔和顺序对影像进行切割,基于滑动窗口的数据选取方案使网络虽然可以较充分地学习地物间特征,但是设定合适的矩阵窗口大小较为困难,矩阵过大易忽略较多信息,过小又易造成信息冗余。随机窗口选取方案是用固定大小的窗口随机裁剪出一系列样本,不限制数据选取的空间位置,灵活高效,并且能增强样本随机性,相对于规则格网选取,能获取到更多数量的训练样本。裁剪后的样本需要经过样本筛选,去除不合格样本,样本筛选可通过人工进行或机器辅助进行。
40.另外,在有限数据的情况下,数据增强通过提升现有训练数据的数量和质量,数据增强可以更好地训练网络,避免过拟合现象的发生。对于遥感影像而言,经过几何变换等数据增强操作能让模型更好地学习地物与地物之间的特征,因为传感器在不同角度拍摄时,遥感影像具有不同的影像特征,例如地物分布和形态等都不相同。遥感影像增强是对影像信息和质量进行改善,使影像特征更为明显,加强其不透水面识别效果。因此,本实施例中可引入几何变换、色彩空间增强、内核过滤器等图像增强方法。
41.另外,遥感影像数据的像元值通常在[0,255]区间,当数据分布范围较大时,深度学习模型寻求最优解的过程会很慢,甚至造成结果不收敛,因此需要进行数据归一化操作将数据分布控制在一定的范围内。数据归一化是模型训练前的一个重要预处理步骤,其作用是统一数据的量纲,将不同数量级的数据变换至同一数量级,弱化较大变量值对模型收敛的影响,有利于提高模型收敛速度和分类精度。
[0042]
目前常用的归一化方法有min
‑
max标准化和z
‑
score标准化。min
‑
max标准化也称为离差标准化,是将数据值映射到[0,1]之间,该方式适用于分布在有限范围内的数据,具体公式如下:
[0043][0044]
其中:x
max
为样本数据的最大值;x
max
为样本数据的最小值。
[0045]
z
‑
score标准化是利用原始数据的均值和标准差进行标准化,该方法适用于没有
明显边界的情况。经过z
‑
score标准化后的数据符合标准正态分布,即均值为0,标准差为1,公式如下:
[0046][0047]
其中:μ为数据的均值;σ为数据的标准差。
[0048]
合适的数据归一化方法对模型训练的有效性和准确性有很大影响,本实施例中,选择min
‑
max标准化对训练及验证影像进行归一化预处理,将每个通道的数据范围从区间[0,255]缩小至区间[0,1]。
[0049]
由此基于上述确定的做法,在本实施例的步骤s1中,针对获得的高分辨率遥感影像,可按照下列s11~s12步骤构建不透水面数据集:
[0050]
s11:对目标区域的整幅高分辨率遥感影像中不透水面区域进行标注,生成不透水面标签图像;
[0051]
s12:对高分辨率遥感影像以及对应不透水面标签图像利用固定尺寸256
×
256像素的随机窗口(随机定位,不限定窗口位置)进行图像块提取,将提取得到的高分辨率遥感影像图像块和不透水面标签图像块作为样本,通过样本筛选、数据增强(操作包括多角度翻转、镜像映射、线性拉伸和添加噪声)和min
‑
max归一化操作后,构建为不透水面样本数据集。
[0052]
考虑到模型训练的需要,上述不透水面样本数据集可以预先分为训练集和测试集,利用训练集对多尺度融合网络模型进行训练,并利用测试集验证其模型精度,满足精度要求后用于实际高分辨率遥感影像的不透水面提取。
[0053]
而本发明的多尺度融合网络模型实际包含了两部分,第一部分为u
‑
net网络,u
‑
net网络作为骨干网络使用,第二部分为特征金字塔网络,特征金字塔网络作为一个功能子网络,用于对骨干网络的部分输出特征进行额外的融合,提取浅层特征信息。
[0054]
其中u
‑
net网络本身属于现有技术,为了便于叙述,网络结构简单介绍如下:u
‑
net网络由左侧压缩通道和右侧扩张通道构成,两侧为对称关系,形态上接近u型。压缩通道对输入的高分辨率遥感影像逐层进行下采样,减小池化层空间维度,用以实现遥感影像特征提取,每个网络层级由不同类型和数量的卷积层、池化层构成,其中左侧压缩通道的输入影像大小为256
×
256,维度为3,分别经过4个卷积层和池化层后,得到大小为16
×
16,维度为1024的高维特征图。高维特征图进入右侧扩张通道逐层进行上采样,逐步恢复图像细节和空间维度,并利用跳跃结构与左侧压缩通道对应层级的特征图进行融合。而本发明中的特征金字塔网络作为骨干网络u
‑
net之外的子网络,是通过u
‑
net网络的右侧扩张通道与u
‑
net进行结合的。特征金字塔网络能够获取右侧扩张通道在上采样过程中每一层级的特征图,由于不同层级的特征图尺寸不同,因此其构成了一个特征金字塔。这样的网络结构设计,在一定程度上增强了低维特征,特征金字塔作为一个功能增强的子网络提取图像浅层信息并将其融入到骨干网络提取的特征图中,避免了特征信息不平衡的问题,从而获得更好的提取效果。
[0055]
另外,特征金字塔中的特征图由于尺寸大小不一致,因此需要进行尺寸恢复操作。目前大多数方法通常在获得特征金字塔后将其传递到对应上采样层,然后通过卷积操作逐渐恢复图像尺寸。但由于遥感影像中不透水面的形状和大小差异较大,重复的卷积操作会
使不透水面特征与背景地物特征混淆,不利于不透水面的精确提取。为解决该问题,本发明采用双线性插值的方式将特征金字塔的特征图恢复为原尺寸,而不是重复骨干网络中的解码过程。相比反卷积操作,该方式对原始特征保留更为完整,从而进一步避免信息丢失。如图2所示,不同层级的特征图先经过双线性插值的方式恢复为与输入图像相同的原尺寸,再将恢复尺寸后的特征图以通道拼接的方式进行融合,形成融合特征图,以融合特征图携带多维度信息进行后续的分类映射。需注意的是,通道拼接操作不改变尺寸但会增加通道数,因此融合特征图中通道数量需要使用1
×
1的卷积核调整特征通道数,才得到融合特征图。融合特征图输入softmax分类器中,对像素点属于每种地物类别的概率进行预测,得到高分辨率遥感影像中每个像素点对应各个地物类别的概率,从而确定不透水面类别所在区域。具体的地物类别可根据实际进行调整,因此softmax分类器可以是多分类器,也可以是二分类器。但由于本发明需要提取不透水面,因此sofimax分类时应当将一类类别标签设置为不透水面类别。
[0056]
对于多分类器而言,设影像分为c类,对于每一个样本影像中的像元i{i=1,2,...,n},n为像元总数,它的真实类别标签表达为该样本经过前向传播得到的c维输出特征向量记为侧则寻找模型参数最优解的过程可以转化缩小输出值和地面真实标签之间的差距的过程。对于多分类问题,通常使用softmax函数将特征向量中所有类别的线性预测值转换为概率值,则像元i属于第c类的预测概率的计算公式为:
[0057][0058]
本实施例中,若仅需要提取不透水面,则可以采用二分类器。对于二分类器而言,其最终输出的是一个2维的特征图,代表每个像素属于不透水面和不属于不透水面的二分类概率。利用argmax函数求出概率最大值所属的维度,即该像素类别标签。
[0059]
在本发明的训练过程中,损失函数以及神经网络优化器可根据实际进行调整优化。本实施例中,可优选采用交叉熵损失函数和dice loss组成总损失函数。利用反向传播与优化算法对多尺度融合网络模型进行训练,训练过程中通过adam优化算法不断更新权值,使总损失函数误差不断减小,直至模型趋于稳定。
[0060]
在模型预测过程中,为了防止内存溢出,通常将待分类影像裁剪为固定大小的图像块分别进行预测,然后再拼接成整张图像。然而由于卷积操作会将图像块的边界用0填充,因此这种预测方法会使得每个图像块边界像元的预测精度会低于中心像元的预测精度,拼接后得到的分类图像有明显的拼接痕迹。为了得到更高的预测结果,本发明可采取忽略边缘预测,采用滑动窗口的方式获取有一定重叠区域的图像块,滑动窗口水平方向以及垂直方向上都有重叠像素,这部分像素后续作为舍弃部分,而不重叠的中心部分需要保留。然后对每一张预测的图像块保留中间不重叠部分区域的分类结果,舍弃边缘不准确的结果,再依次拼接,这样能够避免明显的拼接痕迹,提升影像预测效果。
[0061]
因此,上述步骤s4的具体实现过程如下:目标高分辨率遥感影像采用边缘重叠的方式进行分块裁剪,然后将每个图像块输入训练得到的多尺度融合网络模型中得到输出的
分类图块,再将所有分类图块通过忽略边缘策略按序拼接,得到完整影像的地物类别分类结果,即可从中提取出地物类别为不透水面的区域。
[0062]
下面基于上述实施例方法,将其应用至具体的实例中对其效果进行展示。具体的过程如前所述,不再赘述,下面主要展示其具体参数设置和实现效果。
[0063]
实施例
[0064]
下面以杭州的高分辨率遥感影像为例,对本发明进行具体描述,其具体步骤如下:
[0065]
1)采用杭州市主城区google earth高分辨率卫星影像数据。选取杭州市主城区范围内,3幅大小为8320
×
8320像素的高分辨率遥感影像作为训练样本,1幅大小为8320
×
8320像素的影像作为测试样本。影像包含了植被、道路、建筑物、水体和裸地等多种复杂地物。
[0066]
按照前述的步骤s1,对选取的高分辨率遥感影像进行标注,地面真值将影像分为不透水面和透水面两大类,由此得到对应不透水面标签数据。采用固定大小为256
×
256像素的窗口随机裁剪出一系列样本,不限制数据选取的空间位置的随机窗口选取方案,对遥感影像及其对应标签数据进行切割,避免直接输入网络而对计算机内存产生较大的压力,造成内存溢出。通过对遥感影像和对应标签数据进行多角度翻转、镜像映射、线性拉伸和添加噪声来对裁剪得到的待训练样本进行数据增强操作,以增强影像的鲁棒性,降低数据的敏感性。为保证数据集中正负样本分布均匀,筛除数据集中不透水面像素占比过低的图像。最终得到不透水面数据集,按8∶2的比例随机分为训练集和验证集。
[0067]
2)按照前述的s2步骤对构建高分辨率遥感影像特征提取的多尺度融合网络模型,该多尺度融合网络模型以u
‑
net为骨干网络,并将特征金字塔引入u
‑
net网络中对上采样过程中不同尺度的特征进行融合,并基于融合特征对输入模型的高分辨率遥感影像进行逐像素地物类别预测,实现多尺度不透水面目标的检测,具体模型结构如前所述。除此之外,在本实例中还引入批归一化(batch normalization,bn)层。将batch normalization作为神经网络的一层,放在激活函数之前,通过批归一化处理,调整输入批数据的数据分布,增强模型的非线性表达能力并加速训练过程。同时在网络模型中,过融合上一层级的特征图来增强低维信息,这种融合方式会放大特征,产生过拟合现象。在深度学习网络的训练过程中,按概率p随机选择暂时丢弃一部分神经元,被丢弃的那些神经元可以暂时被认为不是网络结构的一部分,但权重被保留下来,因为有可能参与到后续的训练中。通过这种方式,提高网络的泛化能力,防止过拟合。因此在本实例中,引入dropout,使部分神经元失活,在一定程度上防止过拟合现象。本实例中在u
‑
net网络第四层卷积操作后添加舍弃率为0.5的dropout层,即在每次训练迭代中,以0.5的概率丢弃神经元。
[0068]
3)构建模型训练框架。训练框架中首先构造训练数据的模型输入,结合交叉熵损失函数和dice loss构建损失函数定义损失函数,来评估模型预测值与真实值之间的误差,再构造神经网络训练优化器对训练参数进行优化,当损失值达到一定阈值后,训练停止。下面对本实例训练框架具体描述如下:
[0069]
(1)损失函数
[0070]
结合交叉熵损失函数和dice loss构建损失函数,交叉熵用于评估当前训练的概率分布与真实分布的差异,dice loss对于样本类别不均衡的情况,能得到更优的训练效果。
[0071]
其中交叉熵损失函数为:
[0072][0073]
式中,x表示样本,y表示实际的标签,a表示预测的输出,n表示样本总数量。
[0074]
dice coefficient和dice loss分别定义为:
[0075][0076][0077]
式中|x∩y|是x和y之间的交集,|x|和|y|分别表示x和y的元素数量,分子乘2为了保证分母重复计算后取值范围在[0,1]之间。
[0078]
总损失函数为交叉熵损失函数和dice loss的加和。
[0079]
(2)激活函数(activation function)
[0080]
激活函数对增加神经网络模型非线性、提高模型表达能力具有至关重要的作用。激活函数负责将人工神经网络神经元上的输入映射到输出端,通过给神经网络引入非线性元素,使其完成非线性映射,用以更好地解决复杂问题。非线性激活函数在神经网络的发展中起到了举足轻重的作用。
[0081]
经典的u
‑
net网络使用线性整流函数(rectified linear unit,relu)作为其激活函数。relu函数因其计算简单且效率较高,收敛速度快而被广泛使用。但是,由于在输入小于0时,负的梯度被置零,这可能会抑制神经元,权值无法更新,从而导致模型无法学习到有效的特征。本实例中采用指数线性单元(exponential linear unit,elu)作为激活函数。elu函数在x>0时,呈线性,能缓解梯度消失,x<0时,具有软饱和的特性,提升了对输入变化的鲁棒性,加速网络收敛。
[0082]
假设某节点输出为x,则经过elu层后的输出f(x)如下式所示,即elu激活函数对x小于零的情况采用类似指数计算的方式进行输出:
[0083][0084]
elu激活函数可以使输出均值趋近0,从而提高网络收敛速度,有效缓解梯度消失的问题,且对噪声更具有鲁棒性。
[0085]
(3)优化器(optimizer)
[0086]
神经网络优化器是对梯度下降方法和梯度更新操作的具体实现,用来更新模型内部的神经网络参数变量,使其逼近或达到最优值,从而使损失函数结果最小。本实例中,利用自适应矩估计优化器(adam)训练网络参数。
[0087]
(4)优化算法
[0088]
本实例中可引入学习率衰减(learning rate decay)等梯度更新优化策略。模型训练过程中,先保持一个较高的学习率,帮助模型保证收敛速度,然后在训练迭代过程中,逐步地衰减学习率,使训练跳出局部最优值,在收敛到最优值附近时利用小的学习率防止
来回振荡,帮助模型收敛,有助于模型细化。本实例中使用步衰减(step decay),逐步衰减函数,对训练过程中的学习率进行动态降低。学习率每经过t1,t2,...,t
m
次迭代,将学习率降低为原来的β1,β2,
…
,β
m
倍,在经过一定数量的训练epoch后下降一定的百分比。
[0089]
(5)早停(early stopping)策略
[0090]
早停策略是网络训练中防止模型过拟合现象的正则化方法之一,旨在解决epoch数量需要手动设置的问题,从而使模型获得较好的泛化性能。早停策略且简单有效,在各种模型训练过程中被广泛使用。在模型训练过程中,存在继续训练会导致测试集上的准确率下降的情况,早停策略就可以使模型在训练集或验证集上的损失值不再减小的时候停止训练。本实例中利用早停模型训练策略来控制模型训练过程,当模型在验证集上的误差不再降低时,经过10个epoch后停止训练。
[0091]
(6)超参数设置
[0092]
超参数包括影像块大小patch_size、训练样本大小batch_size、学习率learning rate、训练轮数epoch等等。需要根据数据内容、体量、计算机硬件资源,综合考虑确定模型训练时的超参数设置。本实例中,对于超参数设置,影像块大小patch_size设置为256
×
256像素,训练样本大小batch_size设置为16,学习率learning rate初始为0.01,训练轮数epoch设置为100。
[0093]
4)按照前述的s3步骤,基于前述构建的损失函数,将训练集输入多尺度融合网络模型中,通过构造的神经网络优化器对多尺度融合网络模型参数变量进行优化,不断迭代训练。最终,模型在训练轮数为97时在早停策略下终止了训练,达到了最佳的损失值0.091。保存该最佳模型。
[0094]
为了验证最佳模型的预测效果,对测试集影像利用训练得到的模型进行特征提取,利用所提取的影像特征进行逐像素预测,实现不透水面提取。
[0095]
本发明的高分辨率遥感影像提取不透水面方法在总体精度(overall accuracy,oa)、召回率(recall)、f1分数(f1
‑
score)、均交并比(mean intersection over union,miou)和kappa系数(kappa coefficient)精度评价中均得到较好结果,如下表1所示。
[0096]
表1
[0097][0098]
为了直观展示不透水面提取效果,在本发明的深度学习高分辨率遥感影像不透水面提取方法下,获得了测试集样本上的不透水面提取结果。图3是部分测试结果,将具有代表性的不透水面提取图与真实地表不透水面图像进行对比分析,影像下垫面包含了建筑物、道路、植被和水体等不同地物。可以看出,在本发明的深度学习高分辨率遥感影像不透水面提取方法能清晰地将建筑物、道路和桥梁等在内的不透水面与水体、农田和植被等透水面区分,能够较好的区分裸地和不透水面,准确提取出不透水面信息。对于小目标的不透水面地表,本文方法也能够较为精确的提取。
[0099]
本发明方法总体精度为95.52%,召回率、f1分数和miou分别为0.9351、0.9378和0.8712,kappa系数为0.91,表明本发明的方法的各精度指标较为理想,可以应用于实际的高分辨率遥感影像的不透水面提取中,具有十分重要的实际应用价值。
[0100]
该模型在应用时,可按照前述s4的步骤,将目标高分辨率遥感影像按照忽略边缘预测方案进行分块后,输入训练得到的多尺度融合网络模型中,提取影像融合特征并进行逐像素地物类别预测,再重新进行忽略边缘拼接,得到地物类别为不透水面的区域。
[0101]
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。