复杂环境下改进YOLOX的目标快速检测方法及应用

文档序号:36421682发布日期:2023-12-20 13:11阅读:42来源:国知局
复杂环境下改进

本发明涉及机器视觉技术和公共安全防疫领域,具体涉及复杂环境下改进yolox的目标快速检测方法及应用。


背景技术:

1、新型冠状病毒、甲型流感病毒以及呼吸道合胞病毒等传染性病毒,主要通过口腔喷出的飞沫及气溶胶作为媒介进行传播。在病毒传播过程中,佩戴口罩可以有效阻断病原体的传播,起到双向隔离的作用,因而在防疫工作中需要加强口罩佩戴检测的准确性和快速性。

2、口罩佩戴检测本质上属于目标检测技术范围,目标检测需要对图像中的对象进行分类、定位并识别位置和大小等信息,主要分为基于传统计算机视觉方法和深度学习方法。传统计算机视觉方法如尺度不变特征变换算法、方向梯度直方图算法及可变形零件模型算法等,对于特定场景下的目标检测效果良好,但针对复杂场景和小目标检测,速度慢且精度低。相较而言,基于深度学习的目标检测方法如深度卷积神经网络(cnn)算法、r-cnn算法、fast r-cnn算法等两阶段目标检测算法和yolo这种单阶段目标检测算法,可以构建深层神经网络模型,通过大规模数据集的训练自动学习特征信息,具备较强的泛化能力,并在一定程度提高了检测的准确性。整体而言,上述目标检测方法仍存在的不足之处包括:(1)检测精度低:在处理目标遮挡、尺度变化和光照变化等复杂场景下的目标检测问题时,仍存在检测精度低的问题,甚至造成误检和漏检;(2)部署困难:在实际应用中的算法部署需要大量计算资源和复杂设置,限制了目标检测方法在嵌入式系统、移动设备中的应用;(3)检测速度慢:在处理大规模图像或视频时出现检测速度较慢问题;(4)适应性不足:在基于图形处理器的高性能设备上表现优良的目标检测方法,往往在嵌入式平台等资源受限设备上存在适应性不足问题。

3、综上所述,本领域亟需发明一种复杂环境下适应性更强、轻量化且精确度更高的目标快速检测方法。


技术实现思路

1、为了提高目标检测方法的适应性、快速性和精确度,本发明的首要目的是提供复杂环境下改进yolox的目标快速检测方法。

2、本发明的第二个目的是提供上述复杂环境下改进yolox的目标快速检测方法的应用。

3、为实现上述目的,本技术所采取的技术方案是:

4、本发明提供复杂环境下改进yolox的目标快速检测方法,包括以下步骤:

5、步骤s1:改进yolox-tiny特征提取网络;在原yolox-tiny特征提取网络的不同尺度特征图中添加坐标注意力模块,用于提高有用特征权重,使其更加关注包含重要信息的目标区域,同时降低无效特征权重,抑制无关信息,从而提高小尺度目标的检测精度;

6、步骤s2:优化yolox-tiny特征融合网络;将轻量级gsconv卷积及跨级部分网络模块vov-gscsp进行级联构成一种轻量化的slim-neck结构,降低计算和网络结构的复杂性且能保持足够精度;

7、步骤s3:改进yolox网络的损失函数;采用变焦距算法将yolox原网络的损失函数改进成可变焦距损失函数,用于解决预测框内正负样本的不平衡问题。

8、进一步地,步骤s1所述改进yolox-tiny特征提取网络主要包括切块模块focus、卷积层+归一化层+激活函数的cbs模块、跨阶段局部csp网络结构、空间金字塔池化spp结构以及坐标注意力ca模块。

9、进一步地,首先利用切块模块focus初步提取图片后,图片尺寸大小为208×208×24,将输出图片两次输送到卷积层+归一化层+激活函数的cbs(conv2d+batchnormalization+silu)模块和跨阶段局部csp1_x模块顺序组合结构中对特征进行提取,此时将输出的一个分支送到坐标注意力ca模块来进一步提取输出图片特征,得到有效特征层p3尺寸大小为52×52×96,另一个分支送入卷积层+归一化层+激活函数的cbs模块+csp1_x模块顺序组合结构中提取图片特征,所得特征层的一个分支送到坐标注意力ca模块对图片进一步实施特征提取,得到有效特征层p4尺寸大小为26×26×192。

10、进一步地,其中另一个分支经过空间金字塔池化spp结构+跨阶段局部csp2_x模块+坐标注意力ca模块,提出图片特征后得到有效特征层p5尺寸大小为13×13×384,最终得到三个有效特征层p3、p4以及p5作为特征融合网络的输入。

11、进一步地,复杂环境下改进yolox的目标快速检测方法,其中,步骤s2所述优化yolox-tiny特征融合网络主要指轻量slim-neck特征融合网络,是由gsconv卷积结合vov-gscsp模块构成路径聚合网络panet的双向融合结构,从特征提取网络中得到的三个有效特征层p3、p4以及p5的尺寸大小分别为52×52×96、26×26×192以及13×13×384,按照特征金字塔网络原理即尺寸从小到大的顺序进行融合,再将p3、p4和p5有效特征层经过1×1卷积通道调整后,作为输入p3_in、p4_in、p5_in,对p5_in经过gsconv卷积网络得到结果p5_td,对其进行上采样后与输入p4_in进行堆叠融合获得结果p4_td,再经过vov-gscsp模块和gsconv卷积级联结构输出的结果进行上采样操作后,与p3_in进行堆叠融合获得p3_td,至此完成了一个自底向上的特征金字塔网络fpn结构输出三个特征网络层p3_td、p4_td、p5_td。

12、进一步地,之后在fpn网络层后面添加一个自上向下的(大尺寸向小尺寸融合)的路径聚合网络pan结构,即将特征层p3_td经过一个vov-gscsp模块得到输出特征层p2_out,再将p3_out经过一个gsconv卷积后进行2倍下采样操作后与p4_td进行堆叠融合后的结果送入一个vov-gscsp模块得到输出特征层p4_out,之后再将p4_out经过一个gsconv卷积后进行2倍下采样操作后与p5_td进行堆叠融合后的结果送入一个vov-gscsp模块得到输出特征层p5_out,至此从改进的特征提取网络中得到的三个有效特征层p3、p4、p5经过优化的特征融合网络后输出p3_out、p4_out、p5_out特征层,再送入特征预测层获取目标的类别、预测置信度及定位信息,输出预测结果。

13、进一步地,复杂环境下改进yolox的目标快速检测方法,其中,步骤s3所述改进yolox网络的损失函数是采用变焦距算法改进原有的置信度损失函数,改进后的可变焦距损失函数形式为:

14、

15、式中:ps为yolox网络的输出预测值,q为真实值,通过交叉实验可得到训练效果最佳参数γ和α,而且通过γ因子将负例缩小,来保留正例中有效的学习信号,有效解决正负样本不平衡的问题。

16、进一步地,本发明还提供了上述复杂环境下改进yolox的目标快速检测方法在口罩佩戴检测中的应用,包括以下步骤:

17、步骤s1:构建复杂环境下的口罩数据集并进行数据预处理;收集不同环境因素下的佩戴口罩以及未佩戴口罩的图片并从wider face开源数据集以及mafa数据集中选择适当图像作为补充,图片共计6680张,以此构建复杂环境下的口罩数据集,然后对数据集进行预处理,按8:1:1的比例划分为训练集、测试集以及验证集;

18、步骤s2:训练得到口罩佩戴识别模型;所述口罩佩戴识别模型是将口罩数据集中的训练集输入到改进yolox-tiny模型网络进行训练后得到;

19、步骤s3:完成口罩佩戴检测;将数据集中测试集图片输入到训练好的口罩佩戴识别模型中,输出预测图像,完成口罩佩戴检测。

20、与现有技术相比,本发明的有益效果在于:

21、1.本发明提供的方法能够捕捉到关键特征的空间分布和上下文信息,从而在目标遮挡、尺度和光照变化等复杂环境下取得更准确的目标检测结果,并且能够处理正负样本不平衡问题,更关注于难以分类样本,可准确捕捉目标与背景之间的边界信息,提高了目标检测精度。

22、2.本发明提供的方法优化了yolox网络架构和设计,实现轻量化并减少模型参数量,提高了目标检测速度。

23、3.本发明提供的方法易于部署到不同的平台和设备上,不仅为口罩佩戴检测的实际应用和推广提供便利,而且对电力巡检、边海防巡逻、人脸识别、车辆检测等其他目标检测任务具有普适性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1