本发明涉及图像处理,尤其涉及一种基于yolov7模型的logo检测方法和装置。
背景技术:
1、随着深度学习技术的发展,logo检测开始采用卷积神经网络(cnn)等深度学习模型进行特征提取和目标检测。logo检测是一种基于计算机视觉技术的图像分析任务,旨在从给定的图像中识别和定位其中的标志。2014年,girshick等人提出的faster r-cnn算法首次将深度学习与目标检测结合,成为logo检测的重要里程碑。近年来,随着深度学习的快速发展,越来越多的研究者开始采用深度学习算法进行logo检测,包括ssd(single shotmultibox detector)和yolo(you only look once)等,极大地推动了logo检测技术的发展。
2、经检索,申请号cn109359207a的中国专利,公开了一种易于快速迭代更新的logo检测方法,其提出部分logo样本少的问题,并公开通过模型迭代的方式增加logo标注过程的准确率;
3、申请号cn116258891a的中国专利,公开了一种融合mobilenetv2的logo检测方法,其提出传统的yolo检测模型,在检测相邻群体或小目标群体时效果不理想,检测精度较低的问题。
4、在传统方法中logo检测方法通常需要人为设计和选择特征,这需要领域内的专业人才和大量时间来完成,因此具有一定的主观性和不确定性。另外,传统方法往往难以处理复杂的场景,例如旋转、遮挡、光照变化等,检测的准确率和鲁棒性有限。且传统方法往往需要大量的计算资源和较长的时间才能完成检测任务,不适合在实时应用场景中使用。另一个缺点是对于不同的logo样本需要单独训练和调整参数,难以实现通用性。当新的logo出现时,需要重新设计和选择特征并进行模型训练和参数调整,这需要相当大的努力和时间。由于传统方法缺乏泛化能力,无法适应新数据的变化,因此需要不断地更新和调整模型,这也导致了传统方法在logo检测领域的发展受到了一定的限制。
技术实现思路
1、本发明的目的是为了解决现有技术中存在的缺陷,而提出的一种基于yolov7模型的logo检测方法和装置。
2、为了实现上述目的,本发明采用了如下技术方案:
3、一种基于yolov7模型的logo检测方法,所述方法包括:
4、获取数据集;所述数据集中包括多个不同尺寸和分辨率的logo图像样本;所述logo图像样本通过标签进行标记;
5、构建logo检测模型;所述logo检测模型采用yolov7模型作为基础框架;所述logo检测模型的骨干网络包括第一特征提取模块和依次连接的三组第二特征提取模块;所述第二特征提取模块包括csmp模块和elan模块;
6、通过第一组的第二特征提取模块中的csmp模块对最大池化后的第一特征图进行基于通道注意力机制的特征提取,得到通道注意力特征图,对平均池化后的第一特征图进行基于空间注意力机制的特征提取,得到空间注意力特征图,拼接所述通道注意力特征图和所述空间注意力特征图,得到增强特征图,通过所述elan模块处理所述增强特征图,得到第二特征图;所述第一特征图通过所述第一特征提取模块对logo图像样本进行特征提取得到;
7、通过所述logo检测模型的头部网络对所述三组第二特征提取模块输出的第二特征图进行处理,得到所述logo图像样本的logo检测结果;
8、根据logo图像样本的标签和将logo图像样本输入到所述logo检测模型得到的预测结果对logo检测模型进行训练,得到训练好的logo检测模型;
9、将待检测logo图像输入所述训练好的logo检测模型,得到待检测logo图像的logo检测结果。
10、在其中一个实施例中,还包括:基于最大池化后的第一特征图的宽和高,分别对所述最大池化后的第一特征图进行全局最大池化和全局平均池化,得到两个池化后的特征图;将所述两个池化后的特征图分别输入至多层感知器,对所述多层感知器输出的两个特征图进行加和,并对加和后得到的特征图进行sigmoid激活,得到通道注意力特征图;所述多层感知器的第一层神经元个数为c/r,第二层神经元个数为c,其中,c为通道数,r为减少率。
11、在其中一个实施例中,还包括:基于平均池化后的第一特征图的通道数,分别对所述平均池化后的第一特征图进行全局最大池化和全局平均池化,得到两个池化后的特征图;将所述两个池化后的特征图进行通道拼接,得到拼接特征图,对所述拼接特征图进行卷积,采用sigmoid激活函数处理卷积后的拼接特征图,得到空间注意力特征图。
12、在其中一个实施例中,还包括:所述logo检测模型的头部网络包括特征融合模块和结果预测模块;所述特征融合模块包括改进的sppcspc模块、两个up模块、四个特征拼接层、四个sae模块和两个mp-2模块;所述结果预测模块包括三组rep(recursive featurepyramid,递归特征金字塔)模块和conv(convolution,卷积)模块;通过所述特征融合模块接收、融合所述三组第二特征提取模块输出的第二特征图,得到三组融合特征图;通过所述结果预测模块接收、处理三组所述融合特征结果,得到三组尺寸大小不相同的logo检测结果。
13、在其中一个实施例中,还包括:所述改进的sppcspc模块中的金字塔池化层包括多个相同卷积核的池化层;多个所述池化层通过级联的方式连接。
14、在其中一个实施例中,还包括:所述改进的sppcspc模块中与输入层连接的cbs模块以及与输出层连接的cbs模块的激活函数为frelu函数。
15、在其中一个实施例中,还包括:所述sae模块的输入为所述头部网络中特征拼接层输出的拼接特征图;通过所述sae模块分别对所述拼接特征图进行可变空洞卷积和普通卷积,得到第一融合特征图和第二融合特征图,对所述第二融合特征图依次进行可变空洞卷积和普通卷积,得到第三融合特征图,对所述第三融合特征图依次进行可变空洞卷积和普通卷积,得到第四融合特征图,根据所述第一融合特征图、第二融合特征图、第三融合特征图和第四融合特征图进行拼接后卷积,得到融合特征图。
16、一种基于yolov7模型的logo检测装置,所述装置包括:
17、数据集获取模块,用于获取数据集;所述数据集中包括多个不同尺寸和分辨率的logo图像样本;所述logo图像样本通过标签进行标记;
18、检测模型构建模块,用于构建logo检测模型;所述logo检测模型采用yolov7模型作为基础框架;所述logo检测模型的骨干网络包括第一特征提取模块和依次连接的三组第二特征提取模块;所述第二特征提取模块包括csmp模块和elan模块;
19、特征提取模块,用于通过第一组的第二特征提取模块中的csmp模块对最大池化后的第一特征图进行基于通道注意力机制的特征提取,得到通道注意力特征图,对平均池化后的第一特征图进行基于空间注意力机制的特征提取,得到空间注意力特征图,拼接所述通道注意力特征图和所述空间注意力特征图,得到增强特征图,通过所述elan模块处理所述增强特征图,得到第二特征图;所述第一特征图通过所述第一特征提取模块对logo图像样本进行特征提取得到;
20、结果输出模块,用于通过所述logo检测模型的头部网络对所述三组第二特征提取模块输出的第二特征图进行处理,得到所述logo图像样本的logo检测结果;
21、模型训练模块,用于根据logo图像样本的标签和将logo图像样本输入到所述logo检测模型得到的预测结果对logo检测模型进行训练,得到训练好的logo检测模型;
22、logo检测模块,用于将待检测logo图像输入所述训练好的logo检测模型,得到待检测logo图像的logo检测结果。
23、一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
24、获取数据集;所述数据集中包括多个不同尺寸和分辨率的logo图像样本;所述logo图像样本通过标签进行标记;
25、构建logo检测模型;所述logo检测模型采用yolov7模型作为基础框架;所述logo检测模型的骨干网络包括第一特征提取模块和依次连接的三组第二特征提取模块;所述第二特征提取模块包括csmp模块和elan模块;
26、通过第一组的第二特征提取模块中的csmp模块对最大池化后的第一特征图进行基于通道注意力机制的特征提取,得到通道注意力特征图,对平均池化后的第一特征图进行基于空间注意力机制的特征提取,得到空间注意力特征图,拼接所述通道注意力特征图和所述空间注意力特征图,得到增强特征图,通过所述elan模块处理所述增强特征图,得到第二特征图;所述第一特征图通过所述第一特征提取模块对logo图像样本进行特征提取得到;
27、通过所述logo检测模型的头部网络对所述三组第二特征提取模块输出的第二特征图进行处理,得到所述logo图像样本的logo检测结果;
28、根据logo图像样本的标签和将logo图像样本输入到所述logo检测模型得到的预测结果对logo检测模型进行训练,得到训练好的logo检测模型;
29、将待检测logo图像输入所述训练好的logo检测模型,得到待检测logo图像的logo检测结果。
30、一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
31、获取数据集;所述数据集中包括多个不同尺寸和分辨率的logo图像样本;所述logo图像样本通过标签进行标记;
32、构建logo检测模型;所述logo检测模型采用yolov7模型作为基础框架;所述logo检测模型的骨干网络包括第一特征提取模块和依次连接的三组第二特征提取模块;所述第二特征提取模块包括csmp模块和elan模块;
33、通过第一组的第二特征提取模块中的csmp模块对最大池化后的第一特征图进行基于通道注意力机制的特征提取,得到通道注意力特征图,对平均池化后的第一特征图进行基于空间注意力机制的特征提取,得到空间注意力特征图,拼接所述通道注意力特征图和所述空间注意力特征图,得到增强特征图,通过所述elan模块处理所述增强特征图,得到第二特征图;所述第一特征图通过所述第一特征提取模块对logo图像样本进行特征提取得到;
34、通过所述logo检测模型的头部网络对所述三组第二特征提取模块输出的第二特征图进行处理,得到所述logo图像样本的logo检测结果;
35、根据logo图像样本的标签和将logo图像样本输入到所述logo检测模型得到的预测结果对logo检测模型进行训练,得到训练好的logo检测模型;
36、将待检测logo图像输入所述训练好的logo检测模型,得到待检测logo图像的logo检测结果。
37、相比于现有技术,本发明的有益效果在于:
38、基于yolov7模型的logo检测方法和装置,基于yolov7模型构建logo检测模型,logo检测模型的骨干网络包括第一特征提取模块和依次连接的三组第二特征提取模块,通过第一组的第二特征提取模块中的csmp模块分别对第一特征图进行基于通道注意力机制和基于空间注意力机制的特征提取,能够提高关键特征信息的表达能力,减弱不相关或者重复的纹理干扰,从而更好地区分不同的logo图像,csmp模块输出通道注意力特征图和空间注意力特征图,拼接所述通道注意力特征图和所述空间注意力特征图,得到增强特征图,通过所述elan模块处理所述增强特征图,得到第二特征图,通过logo检测模型的头部网络对所述三组第二特征提取模块输出的第二特征图进行处理,得到所述logo图像样本的logo检测结果。本发明实施例,能够对不同的logo图像进行检测,并能够提高logo检测的精度。