基于YOLOX的光学遥感影像地物检测方法

文档序号:34726366发布日期:2023-07-07 20:43阅读:60来源:国知局
基于YOLOX的光学遥感影像地物检测方法

本发明涉及遥感影像目标检测,尤其涉及一种基于yolox的光学遥感影像地物检测方法。


背景技术:

1、遥感影像中的地物要素分类,在地形图测绘、情报侦察、城市规划和灾害应急响应等方面都具有重要的应用价值。与传统的自然图像不同,遥感影像含有大量典型目标信息,遥感影像背景复杂,特征图上干扰信息的多,目标分布密集的情况进一步加大了遥感图像目标检测的难度。经典的深度学习目标检测算法在这种复杂条件下精度低、易漏检。

2、近年来,基于深度学习的方法广泛应用于遥感影像地物检测。2016年,josephredmon等人提出了yolo模型[redmon j,divvala s,girshick r,et al.you only lookonce:unified,real-time object detection[c]//proceedings of 2016ieeeconference on computer vision and pattern recognition.piscataway:ieee press,2016:779-788.],依靠yolo系列强大的特征提取能力涌现了大量的检测算法,在小目标、多尺度、多模态变化等具有挑战性的遥感检测场景,相较于原网络性能明显提升。然而以yolo系列网络为代表的检测算法仍有改进优化的空间:多尺度特征提取中,对高层特征图中的弱小特征的加强提取不足,目标细节化特征和语义化作用发挥不明显;复杂背景下无法对无效特征信息进行抑制,正样本信息挖掘利用不充分;密集目标检测中,重合目标预测精度不高,回归不准确,易丢漏错漏;密集目标检测器分类中,前景类和背景类之间样本不平衡造成分类性能差等问题都有待进一步优化。


技术实现思路

1、本发明针对以yolo系列网络为代表的检测算法目前存在的上述问题,提出一种基于yolox的光学遥感影像地物检测方法。

2、为了实现上述目的,本发明采用以下技术方案:

3、一种基于yolox的光学遥感影像地物检测方法,包括:

4、步骤1,对yolox进行改进;包括:首先,在主干网络特征图和采样层输出部分添加基于cbam混合域卷积块的注意力机制,得到基于cbma混合域卷积块注意力机制的特征提取模块,对高层特征图中的弱小特征进行加强提取;其次,在fpn特征金字塔提取网络中融合asff模块,通过扩大的感受野挖掘高级语义特征,来兼顾底层特征中的细粒度;最后,在yolohead检测模块中引入eiou损失和varifocalloss损失,改化预测框模糊误差,直接计算真实误差,抑制无用信息,聚焦正面特征信息;

5、步骤2,基于改进后的yolox进行光学遥感影像地物检测。

6、进一步地,所述基于cbam混合域卷积块的注意力机制用于首先逐通道提取全局特征,生成通道注意力特征图,并以此作为空间注意力的输入,最终生成混合域特征图。

7、进一步地,所述asff模块用于自适应地学习各尺度特征映射融合的空间权重,通过学习权重参数的方式将不同层的特征融合到一起。通过引入asff结构,实现每一层的权重参数与特征相乘再相加的融合方式,能过滤其它层的特征,只保留该阶层有用的信息,使得提取的特征更加层次化。

8、进一步地,所述在fpn特征金字塔提取网络中融合asff模块包括:

9、在fpn特征金字塔提取网络的panet特征提取模块中引入asff模块。

10、进一步地,所述在yolohead检测模块中引入eiou损失和varifocalloss损失包括:

11、将yolox的iou损失替换为eiou损失,基于交叉熵损失函数,设置varifocalloss损失函数。

12、与现有技术相比,本发明具有的有益效果:

13、①针对spp特征金字塔网络结构在不同尺度上的不一致性,在多尺度检测阶段引入了自适应空间特征融合asff。通过在空间上过滤掉冲突信息来抑制多尺度不一致性。

14、②在cspdarknet主干网络输出和fpn特征金字塔提取部分,设计了基于cbam混合域卷积块的注意力机制,使网络模型聚焦在感兴趣的局部信息中。

15、③改进损失函数。

16、(1)针对iou损失不能准确反映两个预测目标的距离远近、相交比这一缺陷,引入eiou损失,综合考虑了重叠面积,中心点距离、长宽边长真实差。

17、(2)基于交叉熵损失函数,设置了varifocalloss损失函数。优化了密集目标训练中前景类和背景类之间极度不平衡的问题,使检测模型更加聚焦于高质量正向特征信息。

18、综上,本发明首先设计了基于cbma混合域卷积块注意力机制的特征提取模块,更加关注特征图中正样本特征信息。其次,在特征提取模块panet加入了自适应空间特征融合(asff)网络,以解决多尺度目标检测问题。最后,通过引入eiou损失和varifocalloss损失,准确反映两个预测目标的真实距离误差,提升多目标检测性能。在dota数据集上进行实验,通过消融实验和对比实验验证了改进方法的最佳机制和有效性。在添加asff机制和cbam注意力机制的前提下,改进网络模型map精度达70.75%,较原始网络提升了9.08%,与主流目标检测算法的对比实验结果表明提出的方法的有效性。



技术特征:

1.一种基于yolox的光学遥感影像地物检测方法,其特征在于,包括:

2.根据权利要求1所述的基于yolox的光学遥感影像地物检测方法,其特征在于,所述基于cbam混合域卷积块的注意力机制用于首先逐通道提取全局特征,生成通道注意力特征图,并以此作为空间注意力的输入,最终生成混合域特征图。

3.根据权利要求1所述的基于yolox的光学遥感影像地物检测方法,其特征在于,所述asff模块用于自适应地学习各尺度特征映射融合的空间权重,通过学习权重参数的方式将不同层的特征融合到一起。

4.根据权利要求1所述的基于yolox的光学遥感影像地物检测方法,其特征在于,所述在fpn特征金字塔提取网络中融合asff模块包括:

5.根据权利要求1所述的基于yolox的光学遥感影像地物检测方法,其特征在于,所述在yolohead检测模块中引入eiou损失和varifocalloss损失包括:


技术总结
本发明公开一种基于YOLOX的光学遥感影像地物检测方法,首先设计了基于CBMA混合域卷积块注意力机制的特征提取模块,更加关注特征图中正样本特征信息。其次,在特征提取模块PANET加入了ASFF模块,以解决多尺度目标检测问题。最后,通过引入EIoU损失和VariFocalLoss损失,准确反映两个预测目标的真实距离误差,提升多目标检测性能。在DOTA数据集上进行实验,通过消融实验和对比实验验证了改进方法的最佳机制和有效性。在添加ASFF机制和CBAM注意力机制的前提下,改进网络模型mAP精度达70.75%,较原始网络提升了9.08%,与主流目标检测算法的对比实验结果表明提出的方法的有效性。

技术研发人员:芮杰,李美霖,刘智,杨松坤,金飞,王淑香,林雨准,左溪冰,马莉,朱艳
受保护的技术使用者:中国人民解放军战略支援部队信息工程大学
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1