一种基于YOLOv5的自注意力机制的烟火检测方法与流程

文档序号：37076218发布日期：2024-02-20 21:30阅读：12来源：国知局

本发明涉及计算机视觉和深度学习领域，尤其涉及一种基于yolov5的自注意力机制的烟火检测方法。

背景技术：

1、火灾是威胁公共安全、危害人民生命财产的多发性危害，能否快速、有效地发现火情对于维护日常生活、生产秩序具有重大的意义。现有的深度学习目标图像检测算法主要是依靠多层堆叠层用以实现对图像特征的抽取，直接使用yolov5检测烟火图像进行实验，由于烟和火的区域并不规整且火灾事故发生的环境较为复杂，该算法存在漏检现象，检测效果的鲁棒性不强。针对烟火数据集较少的问题，本方法采用k折交叉验证的方法将数据集进行划分；烟火在节日庆典和活动中扮演着重要的角色，然而烟火也带来了一定的安全隐患，尤其是在城市密集区域。为了保障公众的安全和预防火灾事故，烟火的监测和控制显得尤为重要。近年来，烟火检测中的k折交叉验证被广泛应用于检测任务中，以提高烟火监测的准确性和效率。

2、目前，yolov5采用的是giou损失函数，但是当预测框和真实框完全重合的时候(预测框在真实框内部)，iou损失和giou的损失值都一样，最终还是无法区分预测框和真实框的位置关系，同时也导致边界框收敛很慢，检测的结果不准。

技术实现思路

1、为了解决以上技术问题，本发明提供了一种基于yolov5的自注意力机制的烟火检测方法，采用基于自注意力机制的烟火检测算法训练烟火检测模型，提高烟雾和火焰的检测的有效性，可以将模型部署到嵌入式设备中，进一步提高对现实生活中火灾判断的准确性。

2、本发明的技术方案是：

3、一种基于yolov5的自注意力机制的烟火检测方法，主要包括以下内容：

4、一、图像预处理：首先对输入的图像进行预处理，主要包含有数据增广策略，包括图像缩放、裁剪、灰度化、旋转等操作，通过该方式一方面可增加数据的多样，另一方面有利于增强模型的鲁棒性。

5、k折交叉验证：考虑到样本数量较少，划分后的数据集可能难以代表全体样本，易产生过拟合问题，本方法采用k折交叉验证的方法对数据集进行划分。k折交叉验证是一种常用的模型评估方法，尤其适用于样本有限的情况。它将样本数据划分为k个较小的子集，其中(k-1)个子集用作训练数据，剩余的一个子集用作验证数据。这样，每个子集都有机会作为验证集，从而使模型的评估结果更为准确可靠。

6、综上，k折交叉验证是一种有效的工具和方法。通过合理划分数据集，训练和验证模型，可以提高烟火检测系统的准确性和鲁棒性。

7、二、自注意力机制：在主干网络的最后一个c3模块引入cbam注意力机制，增强模型的特征表达，可更准确地提取烟雾和火焰的准确率。

8、自注意力机制cbam：注意力在人类感知中起着十分重要的作用，在人类视觉系统中，尽管一次性获取的场景量量巨大，但人类会选择性的进行处理，该处理方式使想要的场景部分变得更加突出，以便更好地捕捉视觉结构。cbam是通过通道注意力模块与空间注意力模块组合而成的。注意力机制的核心思想是通过给予不同输入的不同权重，使得模型能够更加关注重要的信息。在传统的神经网络中，所有输入的权重是相同的，这可能导致模型对于不重要的信息也进行了过多的处理，从而影响了模型的性能。而注意力机制通过学习得到每个输入的权重，使得模型能够更加灵活地处理不同的输入。

9、三、用siou损失函数替换giou损失函数，更快，更准确地获得更高质量的定位图像区域，生成边界框并预测类别，增强模型的泛化能力。

10、yolov5中的损失函数包括三部分：分类损失、边界损失和置信度损失。其中分类损失主要是用来计算锚框与对应的标定分类是否正确，边界损失用来计算预测框与标定框之间的误差、置信度损失用来计算网络的置信度。其中边界框损失是用giou损失来计算的。

11、yolov5中使用giou损失作为边界框损失函数，主要是用于解决边界框不重叠的问题，但是对于giou损失函数来说，当两个边界框相交的时候，在水平和垂直方向上的收敛速度都很慢。因此，本方法采用siou损失函数。

12、siou损失函数考虑到了所需回归之间的向量角度，引入角度损失因子来降低回归自由度，加快了收敛速度，而且重新定义了惩罚指标，提高了训练的速度和推理的准确性。

13、四、烟火检测：将特征图输入到改进后烟火检测模型中，使用烟火检测算法对特征图进行处理，得到检测结果，本方法为了对比改进后模型的结果，将主干网络替换为resnet，对比实验结果表明其表现更优。

14、本发明的有益效果是

15、1、本发明采用k折交叉验证的方法来避免过拟合。

16、2、通过在yolov5m的主干网络的最后一个c3模块引入了cbam注意力机制，增强了模型对烟火特征的捕捉能力。通过替换主干网络进一步验证了上述方法的有效性。

17、3、本发明将giou损失函数替换为siou损失函数，可以实现更快地收敛，生成边界框并预测类别。

18、4、未来可以将模型部署到嵌入式设备中，同时考虑把火灾视频图像检测数据与传统的传感器数据进行数据融合，进一步提高其对于现实生活中火灾时间的判断的准确度。

技术特征：

1.一种基于yolov5的自注意力机制的烟火检测方法，其特征在于，

2.根据权利要求1所述的算法，其特征在于，

3.根据权利要求2所述的方法，其特征在于，

4.根据权利要求3所述的方法，其特征在于，

5.根据权利要求4所述的方法，其特征在于，

6.根据权利要求2所述的方法，其特征在于，

7.根据权利要求6所述的方法，其特征在于，

8.根据权利要求6所述的方法，其特征在于，

技术总结
本发明提供一种基于YOLOv5的自注意力机制的烟火检测方法，属于计算机视觉和深度学习领域，本发明利用计算机视觉技术和深度学习算法，在视频流中准确检测出烟火。首先，在YOLOv5m的主干网络的最后一个C3模块引入了CBAM注意力机制，增强了模型对烟火特征的捕捉能力，提高了烟火检测的准确性和可靠性；其次，用SIOU损失函数替换GIOU损失函数，可以实现更快地收敛，生成边界框并预测类别。最后，采用K折交叉验证的方式来避免过拟合，本方法尝试将主干网络替换为Resnet网络并在自制烟火数据集上进行对比实验，结果表明，改进后的精度提升，表现更优。

技术研发人员：赵景娇
受保护的技术使用者：浪潮软件集团有限公司
技术研发日：
技术公布日：2024/2/19

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵景娇
技术所有人：浪潮软件集团有限公司
我是此专利的发明人

上一篇：整体式磁悬浮轨道梁的制作方法
上一篇：一种铜线丝网印刷的柔性线路板的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。