一种基于主干网络优化的电动车头盔检测方法

文档序号:36960962发布日期:2024-02-07 13:05阅读:25来源:国知局
一种基于主干网络优化的电动车头盔检测方法

本发明涉及目标检测,更具体地说,涉及一种基于主干网络优化的电动车头盔检测方法。


背景技术:

1、随着深度学习技术在目标检测领域不断发展,利用卷积神经网络进行目标实时检测已经得到大量的应用。目标检测是通过对图像或者视频数据进行检测,找到目标的所属类别以及目标的位置区域,并且通过目标检测可以实现图像中多目标的同时检测。相较于传统的目标检测方法,基于深度学习的目标检测方法会提高检测的效率和精度,并且已在相关领域应用。

2、目前电动车已经成为居民的主要出行方式,而道路上日益增多的电动车也存在的较大的安全隐患。当前的道路交警仍然是依据目视来判断电动车的骑行人员是否佩戴头盔,此种判断方式严重浪费警力资源,同时与当前的互联网发展趋势不匹配。当路口出现大量的电动车时,目视是很难及时作出判断的。

3、为了节省警力资源,可以结合深度学习的目标检测技术,对电动车骑行人员的头盔佩戴情况进行实时的检测。目前应用到电动车头盔检测的神经网络主要有:徐栋等搭建的基于深度学习的电动车头盔佩戴检测系统,陈文阳等提出的基于yolov5的电动自行车安全头盔佩戴实时检测研究。这些检测方法虽然是应用到了电动车头盔检测领域,但是在识别准确率以及检测时间方面仍有进一步的提升空间,且上述方案在对复杂场景下的适应能力也有待提高。


技术实现思路

1、1.发明要解决的技术问题

2、为了克服上述现有技术存在的不足,本发明提供了一种基于主干网络优化的电动车头盔检测方法,本发明在识别电动车骑行人员是否配套头盔的同时,不仅提升了正常场景下的识别精度,还改善了电动车骑行人员密集以及存在相似目标场景下的检测性能。

3、2.技术方案

4、为达到上述目的,本发明提供的技术方案为:

5、本发明的一种基于主干网络优化的电动车头盔检测方法,其步骤为:

6、步骤一、采集电动车骑行人员的图像数据,并进行数据加强操作,构建目标检测模型的样本数据集;

7、步骤二、利用所得样本数据集对原始的ssd网络模型进行训练操作,并得到训练权重x1;

8、步骤三、对原始的ssd目标检测算法进行改进,具体包括:优化目标锚框,在原始的ssd主干网络中添加注意力机制,采用spp网络扩大ssd网络模型的感受野信息,获得改进后的ssd网络模型;

9、步骤四、对改进后的ssd网络模型进行训练,利用迁移学习的思想,将训练权重x1作为预训练权重,然后保存最佳的训练权重并加载到训练模型中;

10、步骤五、将采集的电动车骑行人员图像输入到训练完成的改进后ssd网络模型中,输出电动车骑行人员是否佩戴头盔的检测结果。

11、更进一步地,步骤一通过对采集的图像数据进行随机的缩放、随机的裁剪、随机改变图片的亮度以及随机翻转的方式获取新的图片数据,达到数据增强的目的。

12、更进一步地,步骤一对采集的图像数据进行随机缩放、随机裁剪过程中设置阈值,保障缩放、裁剪后的图片中标注框的占比大于80%。

13、更进一步地,所述优化目标锚框,为用k-means算法对目标真实框的宽高比进行聚类操作,通过不断的距离运算,直至聚类中心是当前数据集的最优数值,利用聚类后的值对模型中锚点框进行优化配置。

14、更进一步地,所述改进后的ssd网络模型,输入的图像会形成六个预测特征层,在第一个预测特征层和第二个预测特征层之间引入注意力机制,得到的新的特征矩阵作为第一个预测特征层的输出以及第二个预测特征层的输入;同时在第二个预测特征层和第三个预测特征层之间引入spp网络,spp网络的输出作为第二个预测特征层的输出以及第三个预测特征层的输入。

15、更进一步地,所述形成的六个预测特征层,特征矩阵大小分别是38×38×512、19×19×1024、10×10×512、5×5×256、3×3×256以及1×1×256。

16、更进一步地,所述注意力机制,同时关注输入特征图的通道和空间两个维度,处理后得到的新特征图具备通道和空间维度的注意力权重,以增强各个特征在通道和空间的联系。

17、更进一步地,所述注意力机制,在通道注意力中,首先对输入的特征进行avgpool操作以及maxpool操作,分别产生大小为1×1×c的通道权重矩阵,然后经过同一个mlp进行学习,得到通道的注意力权重,之后再经过sigmoid函数进行归一操作;权重再通过乘法添加到原始的特征图上,得到经过通道注意力机制的特征结果,从而完成通道注意力操作。

18、更进一步地,所述注意力机制,在空间注意力中,除了需要对输入的特征进行avgpool操作以及maxpool操作之外,还需要经过7×7的卷积以及relu激活函数来降低特征图的维度,然后再经过一次卷积后恢复到原来的维度,最后经过sigmoid激活函数标准化处理后得到空间的注意力权重,权重再通过乘法添加到通道注意力机制的特征结果上,从而得到经过空间注意力机制的特征结果。

19、更进一步地,步骤三中,对第二个预测特征层的输出通道数进行降维操作,将通道数由1024降低到512,然后再作为spp网络的输入,输入到spp网络中的特征图会经过三次卷积操作,然后再加上原始的特征形成四个分支,通过将四个分支进行拼接,将特征维度扩大四倍;再对spp网络的输出进行降维操作,通道数降低到1024后,再作为第二个预测特征层的输出以及第三个预测特征层的输入。

20、3.有益效果

21、采用本发明提供的技术方案,与已有的公知技术相比,具有如下显著效果:

22、本发明针对ssd算法中目前存在的浅层特征图可能感受野太小缺乏目标的语义信息以及深层特征图可能感受野太大缺乏目标的问题,在ssd网络中加入了注意力机制,同时关注通道和空间两个维度,处理后得到的新特征图将具备通道和空间维度的注意力权重,如此可以增强各个特征在通道和空间的联系;同时本发明借助spp网络结构来扩大预测特征层部分的感受野,改进后的ssd目标检测算法提高了电动车骑行人员密集以及存在相似目标场景下的目标检测性能。



技术特征:

1.一种基于主干网络优化的电动车头盔检测方法,其特征在于,其步骤为:

2.根据权利要求1所述的一种基于主干网络优化的电动车头盔检测方法,其特征在于:步骤一通过对采集的图像数据进行随机的缩放、随机的裁剪、随机改变图片的亮度以及随机翻转的方式获取新的图片数据,达到数据增强的目的。

3.根据权利要求2所述的一种基于主干网络优化的电动车头盔检测方法,其特征在于:步骤一对采集的图像数据进行随机缩放、随机裁剪过程中设置阈值,保障缩放、裁剪后的图片中标注框的占比大于80%。

4.根据权利要求1-3任一项所述的一种基于主干网络优化的电动车头盔检测方法,其特征在于:所述优化目标锚框,为用k-means算法对目标真实框的宽高比进行聚类操作,通过不断的距离运算,直至聚类中心是当前数据集的最优数值,利用聚类后的值对模型中锚点框进行优化配置。

5.根据权利要求4所述的一种基于主干网络优化的电动车头盔检测方法,其特征在于:所述改进后的ssd网络模型,输入的图像会形成六个预测特征层,在第一个预测特征层和第二个预测特征层之间引入注意力机制,得到的新的特征矩阵作为第一个预测特征层的输出以及第二个预测特征层的输入;同时在第二个预测特征层和第三个预测特征层之间引入spp网络,spp网络的输出作为第二个预测特征层的输出以及第三个预测特征层的输入。

6.根据权利要求5所述的一种基于主干网络优化的电动车头盔检测方法,其特征在于:所述形成的六个预测特征层,特征矩阵大小分别是38×38×512、19×19×1024、10×10×512、5×5×256、3×3×256以及1×1×256。

7.根据权利要求6所述的一种基于主干网络优化的电动车头盔检测方法,其特征在于:所述注意力机制,同时关注输入特征图的通道和空间两个维度,处理后得到的新特征图具备通道和空间维度的注意力权重,以增强各个特征在通道和空间的联系。

8.根据权利要求7所述的一种基于主干网络优化的电动车头盔检测方法,其特征在于:所述注意力机制,在通道注意力中,首先对输入的特征进行avgpool操作以及maxpool操作,分别产生大小为1×1×c的通道权重矩阵,然后经过同一个mlp进行学习,得到通道的注意力权重,之后再经过sigmoid函数进行归一操作;权重再通过乘法添加到原始的特征图上,得到经过通道注意力机制的特征结果,从而完成通道注意力操作。

9.根据权利要求8所述的一种基于主干网络优化的电动车头盔检测方法,其特征在于:所述注意力机制,在空间注意力中,除了需要对输入的特征进行avgpool操作以及maxpool操作之外,还需要经过7×7的卷积以及relu激活函数来降低特征图的维度,然后再经过一次卷积后恢复到原来的维度,最后经过sigmoid激活函数标准化处理后得到空间的注意力权重,权重再通过乘法添加到通道注意力机制的特征结果上,从而得到经过空间注意力机制的特征结果。

10.根据权利要求9所述的一种基于主干网络优化的电动车头盔检测方法,其特征在于:步骤三中,对第二个预测特征层的输出通道数进行降维操作,将通道数由1024降低到512,然后再作为spp网络的输入,输入到spp网络中的特征图会经过三次卷积操作,然后再加上原始的特征形成四个分支,通过将四个分支进行拼接,将特征维度扩大四倍;再对spp网络的输出进行降维操作,通道数降低到1024后,再作为第二个预测特征层的输出以及第三个预测特征层的输入。


技术总结
本发明公开了一种基于主干网络优化的电动车头盔检测方法,属于目标检测技术领域,本发明采集电动车骑行人员的图像,对样本数据集进行扩容处理,并根据对应图像制作训练集和验证集;之后根据SSD网络构建深度学习网络模型,并针对SSD算法中目前存在的浅层特征图可能感受野太小缺乏目标的语义信息以及深层特征图可能感受野太大缺乏目标等问题进行优化,具体包括:优化目标锚框,在主干网络中添加注意力机制进行特征融合以及采用SPP网络加强扩大感受野。然后利用训练集对改进的SSD网络模型进行训练,保存mAP数值最优的网络模型。本发明不仅提升了正常场景下的识别精度,还改善了电动车骑行人员密集以及存在相似目标场景下的检测性能。

技术研发人员:陶陶,陈亚
受保护的技术使用者:安徽工业大学
技术研发日:
技术公布日:2024/2/6
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1