一种目标检测方法、设备及介质与流程

文档序号:35415877发布日期:2023-09-10 02:36阅读:40来源:国知局
一种目标检测方法、设备及介质与流程

本发明涉及目标检测,尤其涉及一种目标检测方法、设备及介质。


背景技术:

1、计算机视觉目标检测是计算机视觉领域的一个重要研究方向,当前出现了很多目标检测算法,如faster r-cnn、yolo、ssd等,这些算法在大目标检测上取得了不错的效果,但在小目标检测上存在一定的问题,例如对小目标定位不准确,容易被忽略等。

2、针对这些问题,市面上提出了一些解决方案。其中,一些基于特征金字塔网络的方法通过构建特征金字塔来检测不同尺度的目标,从而提高了小目标的检测精度。另外,一些方法采用了注意力机制,如retinanet和fcos等,通过引入注意力机制来提高小目标的检测精度。但这些方法也存在一些问题,如基于特征金字塔网络的方法在处理大量小目标时存在一定的局限性,比如定位精度和计算效率方面存在缺陷。其次,基于注意力机制的方法在处理大量小目标时的效率较低,检测精度也有所欠缺。


技术实现思路

1、为了克服上述技术缺陷,本发明的目的在于提供一种目标检测方法、装置、介质及设备,用于保证大目标检测效果的基础上,提升对小目标的检测精确率。

2、本发明公开了一种目标检测方法,包括:

3、基于transformer网络建立目标检测模型并获取待处理图像,其中,所述目标检测模型包括特征提取层、多个堆叠的transformer块组成的注意力操作层以及检测层;其中,所述多个编码块堆叠组成的编码层包括多层次自注意力操作处理模块、多粒度自注意力操作处理模块和全局特征整合操作处理模块;

4、在所述目标检测模型中,通过所述多尺度特征提取层对所述待处理图像进行多尺度的特征提取,得到第一层特征图;

5、在所述多个编码块堆叠组成的编码层下,根据所述多层次自注意力操作处理模块对所述第一层特征图进行处理得到多层次自注意力操作特征图,根据所述多粒度自注意力操作处理模块对所述多层次自注意力操作特征图进行处理得到多粒度自注意力操作特征图,根据所述全局特征整合操作处理模块对所述多粒度自注意力操作特征图进行处理,得到第二层特征图;

6、通过所述检测层对所述第二层特征图进行目标检测输出目标检测结果。

7、优选地,所述多粒度自注意力操作处理模块包括多通道映射变换、多粒度自注意力处理、局部区域特征交互。

8、优选地,所述根据所述多层次自注意力操作处理模块对所述第一层特征图进行处理,包括:

9、在所述多个编码块堆叠组成的编码层下:

10、将所述第一层特征图输入线性输入层,并基于所述线性输入层下的第一权重矩阵进行处理得到线性输入层输出的特征图;

11、将所述线性输入层输出的特征图输入至自注意力层,在所述自注意力层下迭代处理后输出至线性输出层,基于所述线性输出层下的第二权重矩阵进行处理,得到所述线性输出层输出的特征图。

12、优选地,所述将从所述线性输入层输出的特征图输入至自注意力层,在所述自注意力层下迭代处理后输出至线性输出层,包括:

13、基于所述线性输入层输出的特征图的高度维度、宽度维度和通道维度上进行多头自注意力操作,将所述多头自注意力操作的输出输入至前向神经网络,进行迭代处理后输出至线性输出层。

14、优选地,所述多通道映射变换包括:

15、通过卷积模块进行多通道特征映射;其中,所述卷积模块中包括第一卷积层、第一批量归一化层和第一激活函数层。

16、优选地,所述多粒度自注意力处理包括:

17、通过多个自注意力子模块在不同的空间尺度上进行自注意力计算,并进行加权融合以捕捉不同粒度的特征。

18、优选地,通过所述局部区域特征交互处理对所述多层次自注意力操作特征图进行局部特征交互和整合,其中,所述局部区域特征交互处理包括第二卷积层、第二批量归一化层和第二激活函数层。

19、优选地,根据所述全局特征整合操作处理模块对所述多粒度自注意力操作特征图进行处理,包括:

20、对所述多粒度自注意力操作特征图进行平均池化或最大池化,以进行全局特征整合。

21、本发明还提供一种计算机设备,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述目标检测方法的步骤。

22、本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述目标检测方法的步骤。

23、采用了上述技术方案后,与现有技术相比,具有以下有益效果:

24、本实施方式提供的目标检测模型中的自注意力操作是基于多头注意力机制的,可以在不同的空间位置上并行地计算注意力权重,可以更好地捕捉不同粒度的特征信息。通过引入多层次、多粒度的自注意力操作,可以对输入特征图进行更加全局、多维度的建模,从而更好地处理密集小目标检测任务,提高检测精度和召回率,用于在保证大目标检测效果的基础上,提升对小目标的检测精确率。



技术特征:

1.一种目标检测方法,其特征在于,包括:

2.根据权利要求1所述的目标检测方法,其特征在于:

3.根据权利要求1或2所述的目标检测方法,其特征在于,所述根据所述多层次自注意力操作处理模块对所述第一层特征图进行处理,包括:

4.根据权利要求3所述的目标检测方法,其特征在于,所述将从所述线性输入层输出的特征图输入至自注意力层,在所述自注意力层下迭代处理后输出至线性输出层,包括:

5.根据权利要求2所述的目标检测方法,其特征在于,所述多通道映射变换包括:

6.根据权利要求2所述的目标检测方法,其特征在于,所述多粒度自注意力处理包括:通过多个自注意力子模块在不同的空间尺度上进行自注意力计算,并进行加权融合以捕捉不同粒度的特征。

7.根据权利要求2所述的目标检测方法,其特征在于:

8.根据权利要求1所述的目标检测方法,其特征在于,根据所述全局特征整合操作处理模块对所述多粒度自注意力操作特征图进行处理,包括:

9.一种计算机设备,其特征在于:所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1-8任一项所述的目标检测方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现上述权利要求1-8任一项所述目标检测方法的步骤。


技术总结
本发明提供了一种目标检测方法、设备及介质,涉及目标检测技术领域,包括:基于Transformer网络建立目标检测模型并输入待处理图像,其中,目标检测模型包括多尺度特征提取层、多个编码块堆叠组成的编码层以及检测层,通过多尺度特征提取层对待处理图像进行多尺度的特征提取,得到第一层特征图;在多个编码块堆叠组成的编码层下,根据多层次自注意力操作处理模块处理得到多层次自注意力操作特征图,根据多粒度自注意力操作处理模块处理得到多粒度自注意力操作特征图,根据全局特征整合操作处理模块处理得到第二层特征图;通过所述检测层对所述第二层特征图进行目标检测输出目标检测结果,用于保证大目标检测效果的基础上,提升对小目标的检测精确率。

技术研发人员:艾如飞,杨超,王红志,李才博,王迅
受保护的技术使用者:昭通亮风台信息科技有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1