本申请涉及计算机视觉,特别涉及一种基于金字塔集成和注意力加强的目标检测方法及装置。
背景技术:
1、随着计算机视觉领域的发展,目标检测方法已经被广泛用于口罩佩戴检测、姿态检测、机器人系统、医学图像检测以及自动驾驶等领域。
2、现有技术中,在特征提取网络后,不同层降维后的特征图通常采用直接融合的方式。
3、上述方式中,不同层降维后的特征图由于感受野不同,语义信息之间存在差异,直接进行融合会减弱多尺度特征的准确性,此外融合后的特征图感受野不足还会导致对小目标检测结果也不准确。
技术实现思路
1、本申请提供一种基于金字塔集成和注意力加强的目标检测方法及装置,以提高了对小目标和大目标检测的准确性,提高了目标检测结果的准确性。
2、第一方面,本申请实施例提供一种基于金字塔集成和注意力加强的目标检测方法,该方法包括:
3、获取当前场景的待检测图像;
4、根据所述待检测图像和目标检测模型,确定所述待检测图像中对应的目标检测结果;
5、其中,所述目标检测模型包括:特征提取网络、金字塔集成网络、fpn网络、注意力模块、检测模块;所述金字塔集成网络包括最大池化层和空洞卷积层;所述最大池化层与所述空洞卷积层并联运行。
6、可选地,所述根据所述待检测图像和目标检测模型,确定所述待检测图像中对应的目标检测结果,包括:
7、基于所述特征提取网络对所述待检测图像进行特征提取,获取深层特征图;
8、基于所述金字塔集成网络对所述深层特征图进行多尺度特征提取,获取上下文信息特征图;
9、基于所述fpn网络对所述深层特征图和所述上下文信息特征图进行特征融合,获取第一融合特征图、第二融合特征图、第三融合特征图,所述第一融合特征图、所述第二融合特征图、所述第三融合特征图的尺寸不同;
10、基于所述注意力模块对所述第一融合特征图、所述第二融合特征图、所述第三融合特征图进行特征关联,获取目标特征图;
11、将所述目标特征图输入检测网络,确定所述目标检测结果。
12、可选地,所述目标检测模型通过以下方式训练得到:
13、采集训练图像;
14、构建训练样本集,所述训练样本集中的每一训练样本包括所述训练图像;
15、利用所述训练样本集训练神经网络模型,得到输出结果;
16、确定所述输出结果与目标类别之间的误差;
17、如果所述误差不符合要求,则调整参数,重新训练调整之后的模型,得到目标检测模型。
18、可选地,所述特征提取网络包括efficientnet-b2网络,所述efficientnet-b2网络由mbconv卷积模块构成。
19、可选地,所述金字塔集成网络还包括se注意力机制;
20、所述基于所述金字塔集成网络对所述深层特征图进行多尺度特征提取,获取上下文信息特征图,包括:
21、通过所述最大池化层和所述空洞卷积层对所述深层特征图处理后,得到感受野特征图;
22、通过se注意力机制对所述感受野特征图和所述深层特征图处理后,得到所述上下文信息特征图。
23、可选地,所述注意力模块包括:通道注意力模块和空间注意力模块,所述通道注意力模块和所述空间注意力模块串联运行;
24、基于所述注意力模块对所述第一融合特征图、所述第二融合特征图、所述第三融合特征图进行特征关联,获取目标特征图,包括:
25、基于所述通道注意力模块对所述第一融合特征图、所述第二融合特征图、所述第三融合特征图进行处理,获取第四融合特征图、第五融合特征图、第六融合特征图;
26、基于交叉对齐模块对所述第四融合特征图、所述第五融合特征图、所述第六融合特征图统一分辨率后进行相加,获取第七融合特征图;
27、基于所述空间注意力模块对所述第七融合特征图进行处理,获取所述目标特征图。
28、可选地,所述基于所述空间注意力模块对所述第七融合特征图进行处理,获取所述目标特征图,包括:
29、通过非对称卷积对所述第七融合特征图处理后,得到所述目标特征图。
30、第二方面,本申请实施例提供一种基于金字塔集成和注意力加强的目标检测装置,包括:
31、获取模块,用于获取当前场景的待检测图像;
32、确定模块,用于根据所述待检测图像和目标检测模型,确定所述待检测图像中对应的目标检测结果;
33、其中,所述目标检测模型包括:特征提取网络、金字塔集成网络、fpn网络、注意力模块、检测模块;所述金字塔集成网络包括最大池化层和空洞卷积层;所述最大池化层与所述空洞卷积层并联运行。
34、第三方面,本申请实施例提供一种电子设备,包括:处理器、存储器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时使得所述电子设备实现如上第一方面所述的方法。
35、第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机指令,所述计算机指令在被处理器执行时用于实现如上第一方面所述的方法。
36、在上述方案中,目标检测模型中可以包括金字塔集成网络,金字塔集成网络中可以包括最大池化层和空洞卷积层,最大池化层与空洞卷积层并联运行,通过最大池化层可以获取局部特征,通过空洞卷积层可以增加感受野以获取全局特征,这样,可以分别对小目标和大目标进行检测,实现了提取不同尺度的特征,提高了感受野特征的多样性,进而提高了对小目标和大目标检测的准确性,提高了目标检测结果的准确性。
1.一种基于金字塔集成和注意力加强的目标检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述待检测图像和目标检测模型,确定所述待检测图像中对应的目标检测结果,包括:
3.根据权利要求1所述的方法,其特征在于,所述目标检测模型通过以下方式训练得到:
4.根据权利要求1所述的方法,其特征在于,所述特征提取网络包括efficientnet-b2网络,所述efficientnet-b2网络由mbconv卷积模块构成。
5.根据权利要求2所述的方法,其特征在于,所述金字塔集成网络还包括se注意力机制;
6.根据权利要求2所述的方法,其特征在于,所述注意力模块包括:通道注意力模块和空间注意力模块,所述通道注意力模块和所述空间注意力模块串联运行;
7.根据权利要求6所述的方法,其特征在于,所述基于所述空间注意力模块对所述第七融合特征图进行处理,获取所述目标特征图,包括:
8.一种基于金字塔集成和注意力加强的目标检测装置,其特征在于,包括:
9.一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时使得所述电子设备实现如权利要求1至7任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一所述的方法。