一种残差网络多光谱图像地物分类方法与流程

文档序号：20876122发布日期：2020-05-26 16:33阅读：来源：国知局

技术特征：

1.一种残差网络多光谱图像地物分类方法，其特征在于，从数据集中读入多光谱图像；对数据进行归一化操作；对多光谱图像进行slic超像素，对图像中的边缘像素点使用自适应邻域选择策略进行取块建立数据集，建立训练集，验证集和测试集；构造基于全局通道交互注意力机制的残差网络的分类模型；用训练数据集对分类模型进行训练，同时使用验证集实时验证网络分类精度；最后利用训练好的分类模型对测试数据集分类。

2.根据权利要求1所述的残差网络多光谱图像地物分类方法，其特征在于，多光谱图像包括quickbird卫星数据、demimos-2卫星数据以及对应的只有部分区域的类标groundtruth图。

3.根据权利要求1所述的残差网络多光谱图像地物分类方法，其特征在于，归一化操作具体为，采用min-max标准化，对原始数据进行线性变化，使结果值映射到0到1之间。

4.根据权利要求1所述的残差网络多光谱图像地物分类方法，其特征在于，使用自适应邻域选择策略进行取块具体为：

s301、对多光谱图像使用slic超像素，得到超像素类标数据图；

s302、计算每个超像素标记数据图中每个超像素块的质心坐标；

s303、计算超像素类标数据图每一点的梯度，若某一个点水平梯度或竖直梯度为0，则该点为超像素图块边缘点并保存像素点坐标；

s304、计算超像素标记图中每个slic超像素图块质心与边缘像素点的距离；

s305、将边缘点像素坐标和当前超像素块质心坐标相连，以竖直方向为轴，得到角度α；

s306、根据计算的得到的距离，计算边缘像素点改变的距离，得到改变后的边缘像素点坐标。

5.根据权利要求4所述的残差网络多光谱图像地物分类方法，其特征在于，步骤s302中，超像素块质心坐标(xi,yi)为：

其中，(xk,yk)是超像素块中像素点坐标，n代表超像素块中像素点个数。

6.根据权利要求1所述的残差网络多光谱图像地物分类方法，其特征在于，建立训练集，测试集和验证集具体为：

s401、对每一幅多光谱影像进行边缘扩充操作，边缘填充的大小为滑窗操作所选窗口的边长的一半；

s402、在归一化后的图像中找到有对应类标的像素点，以像素点为中心截取邻域为120×120的区域，然后将区域逆时针旋转角度α，再以像素点为中心截取大小为32×32的邻域作为样本块，每个块的邻域都是为中心点的分类所服务；

s403、将四个数据集vancouverlevel1b、vancouverlevel1c、xi’ansuburbarea、xi’anurbanarea，分别进行训练样本，测试样本和验证样本的选取；

s404、采用等比采样的方式选取不同类别的训练样本，每类选取20％个样本作为训练集，10％为测试集，剩余70％为验证集。

7.根据权利要求1所述的残差网络多光谱图像地物分类方法，其特征在于，全局通道交互注意力机制的残差神经网络的分类模型包括三部分，共有十八个层的残差神经网络，第一部分是卷积层，第二部分是由8个残差元堆叠的中间层，每个残差元有两个卷积层，总共16个卷积层，第三部分是全连接层，将第17层的网络输出进行全局平均池化，再连接上一个输出为8的全连接层，然后使用sigmoid函数得到最后的分类结果。

8.根据权利要求7所述的残差网络多光谱图像地物分类方法，其特征在于，通道每层的参数如下：

初始输入为大小32*32的ms图块，第1层为卷积层，输入尺寸为32*32，输出尺寸为32*32，卷积核个数为16，卷积核大小为5*5，步长为1；第2至5层为2个残差元堆叠构成；输入尺寸为32*32，输出尺寸为16*16，卷积核个数为32，卷积核大小为3*3，步长1，第二个残差元步长为2，每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值；第6至9层为2个残差元堆叠构成；输入尺寸为16*16，输出尺寸为8*8，卷积核个数为64，卷积核大小为3*3，步长为1，第二个残差元步长为2，每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值；第10至13层为2个残差元堆叠构成；输入尺寸为8*8，输出尺寸为4*4，卷积核个数为128，卷积核大小为3*3，步长为1，第二个残差元步长为2，每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值；第14至17层为2个残差元堆叠构成；输入尺寸为4*4，输出尺寸为2*2，卷积核个数为256，卷积核大小为3*3，步长为1，第二个残差元步长为2，每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值，全局池化输出，输入为2*2*256，输出为256；第18层为全连接层，输入为256，输出为8；

残差元结构如下：

第一步是卷积层，卷积核大小为3*3，步长为1；第二步是使用relu的激活函数；第三步是卷积层，卷积核大小为3*3，步长为1或2；第四步是将第三步卷积层的输出与第一步的输入相加，当步长为2时，先将第一步输入进行zeropadding调整尺寸，再相加；第五步是使用relu的激活函数。

9.根据权利要求1所述的残差网络多光谱图像地物分类方法，其特征在于，使用验证集实时验证网络分类精度具体为：

用训练数据集对分类模型进行训练，通过输入训练数据集得到网络得分类结果后，与地面实况图上所对应的真实类标作对比，计算所得的损失函数并根据损失函数使用随机梯度下降法进行反向传播，优化分类模型的网络参数，每训练50代后利用验证数据集实时验证网络分类精度，最后得到训练好的分类模型。

10.根据权利要求1所述的残差网络多光谱图像地物分类方法，其特征在于，对测试数据集进行分类具体为：

将测试数据集的样本块作为训练好的分类模型输入，训练好的分类模型输出为测试数据集中每个像素点进行分类得到的分类类别。

技术总结
本发明公开了一种残差网络多光谱图像地物分类方法，从数据集中读入多光谱图像；对数据进行归一化操作；对多光谱图像进行SLIC超像素，对图像中的边缘像素点使用自适应邻域选择策略进行取块建立数据集，建立训练集，验证集和测试集；构造基于全局通道交互注意力机制的残差网络的分类模型；用训练数据集对分类模型进行训练，同时使用验证集实时验证网络分类精度；最后利用训练好的分类模型对测试数据集分类。本发明采用了全局通道交互注意力机制，在网络训练的过程中，不断地加强对分类有帮助的特征通道，抑制对分类无用的特征通道，这与普通的卷积神经网络相比鲁棒性更强，稳定性更高，大大提高了分类精度。

技术研发人员：马文萍;赵继樑;朱浩;武越;沈建超
受保护的技术使用者：西安电子科技大学
技术研发日：2020.01.04
技术公布日：2020.05.26

完整全部详细技术资料下载

当前第2页1 2