本申请涉及遥感图像目标检测领域,特别是涉及一种遥感小目标检测方法及装置。
背景技术:
1、目前,常见的遥感小目标检测算法包括更快速的基于区域的卷积神经网络(faster region-based convolutional neural network,faster r-cnn)、yolo(you onlylook once)、单发多框检测器(single shot multibox detector,ssd)等。其中,faster r-cnn通过优化rpn或后续的分类网络来提高对小目标的检测能力;yolo系列算法通过改进网络结构、损失函数、数据增强等方面,提高了对小目标的检测能力;ssd通过预设的锚框提高了对小目标的检测性能。
2、近年来,在目标检测优化方面,为解决背景复杂性问题,注意力机制的引入也成为了研究热点,如lim等提出一种融合目标上下文信息的注意力机制,使网络聚焦于需要的部分从而降低背景信息的干扰,间接增强了所需要的小目标特征信息。此外,还有直接增强小目标特征的优化方法来解决目标多样性问题,主要有以下几类:设计生成对抗网络(generative adversarial network,gan),如bai等提出的sod-mtgan,rabbi等提出的增强型超分辨率生成对抗网络等,都是对gan方法的改进;对训练用数据集进行数据增强,如kisantal等提出的将小目标复制增多的方法,提高了网络对小目标的训练量;zoph等提出的强化学习的方法,先将质量好的数据进行筛选再训练,有效提高了检测性能;由于不同尺度的特征图有不同的特征信息,通过融合多尺度特征图也可以有效提升检测精度,有很多基于经典特征融合网络—特征金字塔网络的改进,如zeng等提出的空洞空间金字塔池化平衡特征金字塔网络,创新性地使用了跳跃连接,大幅提升了多尺度特征融合效果。这些方法在一定程度上解决了目标多样性、背景复杂性和干扰等问题,但都存在计算复杂、资源消耗大的问题。
3、对于特定的遥感小目标检测任务,融合目标上下文信息的注意力机制、增强型超分辨率生成对抗网络(enhanced super-resolution gans,esrgan)、数据增强、强化学习、空洞空间金字塔池化平衡特征金字塔网络在一定程度上解决了目标多样性、背景复杂性和干扰等问题。
4、但融合目标上下文信息的注意力机制随着上下文信息的增加,模型的复杂度和计算量也会显著增加,进而影响模型的训练和推理速度。
5、增强型超分辨率生成对抗网络通常包含较为复杂的网络结构,如生成器中的多级残差网络和判别器中的相对平均判别器等,这些结构使得模型在训练和推理过程中需要较高的计算资源。因此,在处理大规模图像数据集或需要实时响应的应用场景中,esrgan可能会受到计算复杂度的限制。
6、数据增强、强化学习在模型训练时会增加训练量,因此会增加计算的复杂度。
7、空洞空间金字塔池化平衡特征金字塔网络需要构建多个尺度的特征图,并进行多次特征融合和预测,这增加了模型的计算量和内存消耗。
8、可见,上述遥感小目标检测方法也都存在计算复杂和资源消耗大的问题。
技术实现思路
1、本申请的目的是提供一种遥感小目标检测方法及装置,以解决现有遥感小目标检测方法计算复杂和资源消耗大,检测性能差的问题。
2、为实现上述目的,本申请提供了如下方案。
3、第一方面,本申请提供了一种遥感小目标检测方法,包括以下步骤。
4、利用focal_wiou损失函数替换基线算法中的ciou损失函数,确定改进后的基线算法;所述focal_wiou损失函数包括focal损失函数以及wiou损失函数;所述focal损失函数用于引入调制因子,调整样本的权重;所述wiou损失函数用于度量目标框之间的相似度。
5、利用改进后的基线算法训练改进的yolov8模型;所述改进的yolov8模型包括主干网络、颈部网络以及检测头;所述颈部网络的第二个上下文感知跨层融合模块后增加gam模块;所述gam模块包括通道注意力子模块和空间注意力子模块;所述通道注意力子模块用于保留跨纬度信息;所述空间注意力子模块用于融合空间信息。
6、利用所述改进的yolov8模型检测遥感图像中的遥感小目标。
7、第二方面,本申请提供了一种遥感小目标检测装置,包括以下模块。
8、基线算法改进模块,用于利用focal_wiou损失函数替换基线算法中的ciou损失函数,确定改进后的基线算法;所述focal_wiou损失函数包括focal损失函数以及wiou损失函数;所述focal损失函数用于引入调制因子,调整样本的权重;所述wiou损失函数用于度量目标框之间的相似度。
9、训练模块,用于利用改进后的基线算法训练改进的yolov8模型;所述改进的yolov8模型包括主干网络、颈部网络以及检测头;所述颈部网络的第二个上下文感知跨层融合模块后增加gam模块;所述gam模块包括通道注意力子模块和空间注意力子模块;所述通道注意力子模块用于保留跨纬度信息;所述空间注意力子模块用于融合空间信息。
10、遥感小目标检测模块,用于利用所述改进的yolov8模型检测遥感图像中的遥感小目标。
11、根据本申请提供的具体实施例,本申请公开了以下技术效果:本申请利用焦点focal_权重交并比wiou损失函数替换基线算法中的ciou损失函数,并利用改进后的基线算法训练改进的yolov8模型,结合焦点和权重交并比两种损失函数,考虑了不同区域的重要性,并对不同区域分别给予不同的权重,解决训练过程中容易正确分类样本和难以正确分类样本不平衡问题,降低了数据增强、强化学习在模型训练时增加训练量的计算复杂度,并对目标框之间的相似度进行更准确地度量,进一步提高算法对目标位置和大小的检测精度及稳定性,从而提升被训练的改进的yolov8模型的精确度;此外,本申请还对yolov8模型进行了改进,改进的yolov8模型包括主干网络、颈部网络以及检测头;其中,颈部网络的第二个上下文感知跨层融合模块后增加全局注意力机制(global attention mechanism,gam)模块;gam模块包括通道注意力子模块和空间注意力子模块,从而在空间维度和通道维度形成双层注意力,放大跨纬度的作用,通过全局方式吸引和融合通道与空间的特征信息,使得在进行遥感小目标检测时,更关注于特征图的重点区域信息,本申请无需过多的上下文信息以及复杂的网络结构,也无需构建多个尺度的特征图,而是通过跨维度的gam模块,采用简单的网络结构就能够精准识别遥感小目标,降低了资源消耗,提升了遥感小目标的检测性能。
1.一种遥感小目标检测方法,其特征在于,所述遥感小目标检测方法包括:
2.根据权利要求1所述的遥感小目标检测方法,其特征在于,所述focal损失函数为:
3.根据权利要求1所述的遥感小目标检测方法,其特征在于,所述wiou损失函数为:
4.根据权利要求1所述的遥感小目标检测方法,其特征在于,在所述改进的yolov8模型的训练过程中,将特征图f1输入至所述通道注意力子模块,输出特征图f2,将所述特征图f2输入至所述空间注意力子模块,输出特征图f3;
5.根据权利要求4所述的遥感小目标检测方法,其特征在于,所述通道注意力子模块,具体包括:依次连接的permutation单元、双层mlp、reverse permutation单元以及第一sigmoid激活函数;
6.根据权利要求4所述的遥感小目标检测方法,其特征在于,所述空间注意力子模块,具体包括:依次连接的两个卷积层以及第二sigmoid激活函数;
7.一种遥感小目标检测装置,其特征在于,所述遥感小目标检测装置包括: