一种基于注意力机制和卷积神经网络的伪装目标检测方法

文档序号:34375494发布日期:2023-06-07 22:18阅读:58来源:国知局
一种基于注意力机制和卷积神经网络的伪装目标检测方法

本发明涉及一种基于注意力机制和卷积神经网络的伪装目标检测方法,属于伪装目标检测领域。


背景技术:

1、在自然界中许多生物都具有“伪装”的本领,变色龙能够根据周遭的环境来调整自身颜色以达到其“伪装”的目的;狮子将身体“伪装”在草丛之中而伺机等待猎物的靠近;蝴蝶躺在与自身颜色相近的树干上一动不动以躲过天敌的伤害。生物学家将这类伪装方式称为背景匹配,即动物为避免被识别,会尝试改变其自身颜色以“完美”地融入周围环境。因此相对于通用目标检测与显著性目标检测中目标和背景均有较为明显的差异性,且通常情况下通过人眼也能较容易地分辨出来,伪装目标检测中伪装目标与背景之间所存在的高度相似性,使得关于伪装目标的检测更具有挑战性。

2、伪装目标的边界与背景之间的分界相当模糊并且难以区分,不引入额外的先验信息很难精准地定位到伪装物体,文献“ camouflaged object segmentation withdistraction mining. in proceedings of ieee conference on computer vision andpattern recognition, june 2021”提出将pfnet去干扰的概念引入伪装物体分割任务,为干扰区域的发现和去除开发了一种新的挖掘策略,以帮助伪装物体的分割,但并未关注伪装物体边界信息,无法精确分割出伪装物体的完整边界;文献“camouflaged objectdetection. in cvpr, 2020.”提出sinet通过感受野模块(rfb)来增大感受野,促进伪装目标的分割,但rfb只能增强局部感受野,无法获取全局特征,增强全局感受野,无法获取全局上下文信息;专利号为cn113468996a的中国发明专利公开了一种基于边缘细化的伪装物体检测方法,其虽然考虑了边缘先验信息,但在边缘细化模块的注意力机制中只考虑了全局平均池化,导致丢失了大量可利用的不同频率信息。综上所述,现有伪装目标检测算法的能力有待提高。


技术实现思路

1、针对上述存在的问题,本发明提供了一种基于注意力机制和卷积神经网络的伪装目标检测方法,通过使用边缘提取模块有效提取边缘轮廓信息,在边缘强化模块引入的频率通道注意力组件fcanet,通过二维离散余弦变换dct提取不同频率分量信息进行组合,可以捕捉到多样的特征信息,并与提取的全局特征进行融合,增强边界表示,并在伪装目标检测网络模型中引入多尺度注意力机制以有效聚合多尺度特征,实现了全面感知伪装目标并细化其边界轮廓,提高了伪装目标的检测性能。

2、本发明为解决上述技术问题采用的技术方案如下:

3、一种基于注意力机制和卷积神经网络的伪装目标检测方法,具体包括以下步骤:

4、s1、将伪装目标的图像数据集划分为训练集和测试集;

5、s2、将训练集图像输入至预先构建好的伪装目标检测网络模型的主干网络提取含有伪装目标图像的多尺度特征,的分辨率分别为;

6、s3、将主干网络的特征提取层stage3、stage4、stage5输出的特征分别输入进位置感知循环卷积模块parcm输出全局特征;

7、s4、利用边缘提取模块提取伪装目标的边缘轮廓信息,进而得到边缘预测图,并通过伪装目标的边缘标签对进行边界监督;

8、s5、将步骤s3中获得的全局特征与步骤s4中获得的边缘轮廓信息进行有效融合后,继而进行多尺度特征融合得到多尺度聚合特征;

9、s6、将步骤s5得到的多尺度聚合特征进行处理获得伪装目标预测图,并通过伪装目标的二值标签图对其进行深度监督;

10、s7、以测试集图像作为训练完成的伪装目标检测网络模型的输入,获取最终的伪装目标检测结果。

11、进一步地,所述主干网络使用efficientnet系列中的efficientnet-b4模型提取含有伪装目标图像的多尺度特征。

12、进一步地,所述步骤s3中的位置感知循环卷积模块parcm包括位置感知循环卷积组件parc和通道注意力组件,其中所述位置感知循环卷积组件parc采用全局循环卷积gcc提取全局特征。

13、进一步地,步骤s4中利用边缘提取模块提取伪装目标的边缘轮廓信息,进而得到边缘预测图,并通过伪装目标的边缘标签对进行边界监督的具体内容包括:利用边缘提取模块eem将主干网络的特征提取层stage2输出的低层特征与特征提取层stage5输出的高级语义特征进行融合提取伪装目标的边缘轮廓信息,将边缘提取模块eem的输出通过归一化函数sigmoid得到二值图,将上采样四倍得到边缘预测图,通过伪装目标的边缘标签对进行边界监督,使用的边缘损失函数为。

14、进一步地,在位置感知循环卷积模块parcm中引入位置嵌入(positionembedding)策略。

15、进一步地,在位置感知循环卷积模块parcm所述通道注意力组件中通过前馈神经网络(ffn)引入非线性特性, 并在ffn后增加通道注意力机制se block,突出重点通道。

16、进一步地,在位置感知循环卷积模块parcm中引入残差连接。

17、进一步地,所述将步骤s3中获得的全局特征与步骤s4中获得的边缘轮廓信息进行有效融合后,继而进行多尺度特征融合得到多尺度聚合特征的具体内容包括:采用边缘强化模块erm将来自边缘提取模块eem的边缘轮廓信息与位置感知循环卷积模块parcm输出的全局特征进行融合得到特征;然后通过在多尺度融合模块msfm引入多尺度注意力机制msam进行多尺度特征融合,其中特征通过多尺度融合模块msfm进行多尺度特征融合得到特征,然后将特征和特征通过多尺度融合模块msfm进行特征融合得到多尺度聚合特征。对于伪装数据集,伪装对象的尺寸通常是变化的,所述多尺度注意力机制msam对不同尺度的伪装目标具有很强的适应性,可以实现多尺度特征的有效融合。

18、进一步地,在边缘强化模块erm中引入频率通道注意力组件fcanet,通过二维离散余弦变换dct提取不同频率分量信息进行组合,相较于单一的全局平均池化操作,可以捕捉到多样的特征信息,增强边缘细节。

19、进一步地,步骤s6中通过伪装目标的二值标签图对其进行深度监督所选取的结构化损失函数为加权二进制交叉损失和加权交并比损失;

20、进一步地,伪装目标检测模型的总损失函数的公式具体如下:

21、;

22、;

23、;

24、其中,表示结构化损失,表示边缘损失,和分别为结构化损失、边缘损失的权重因子;是预测出的伪装目标显著图,表示预测出的伪装目标边缘轮廓图;表示伪装目标显著性标签,表示伪装目标的边缘标签;为结构化损失中的加权二进制交叉损失,为结构化损失中的加权交并比损失,为使用dice系数求得的边缘损失。

25、与现有技术相比,本发明的技术方案具有以下的技术效果:

26、本发明引入额外的边缘先验信息并进行深度监督,在边缘强化模块中引入频率通道注意力组件fcanet,通过二维离散余弦变换dct提取不同频率分量信息进行组合,相较于单一的全局平均池化操作,可以捕捉到多样的特征信息,并与通过全局循环卷积gcc提取的全局特征进行融合,可以增强边界表示。

27、本发明中伪装目标检测网络模型的位置感知循环卷积模块通过引入全局循环卷积gcc能有效提取全局特征,获得全局感受野,弥补卷积神经网络局部性过强,全局性不足的问题,从而获得全局上下文信息;同时通过在位置感知循环卷积模块引入位置嵌入策略,向输出特征图中注入位置信息,保证输出特征对空间位置的敏感性,并引入通道注意力机制,对关键通道重点突出;并且本发明在伪装目标检测网络模型中引入多尺度注意力机制,能够进行多尺度上下文信息有效融合,从而提高了伪装目标检测性能。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1