基于双向特征融合金字塔SSD的铁矿石异物识别方法

文档序号:32944770发布日期:2023-01-14 10:17阅读:30来源:国知局
基于双向特征融合金字塔SSD的铁矿石异物识别方法
基于双向特征融合金字塔ssd的铁矿石异物识别方法
技术领域
1.本发明属于图像识别技术领域,具体涉及基于双向特征融合金字塔ssd的铁矿石异物识别方法。


背景技术:

2.快速准确的识别异物,在铁矿石运输过程中出现金属异物时进行预警,对矿石开采运输具有重要的作用。目前,基于深度学习的目标检测算法检测速度较快,且精度较高,广泛应用在异物识别任务中,根据是否存在候选框可分为一阶段和二阶段两个大类。其中二阶段的算法主要有:r-cnn、fast r-cnn、faster r-cnn。一阶段算法主要有:ssd、yolo系列以及其变体算法。faster r-cnn算法检测精度较高,但首先需要选出候选框,相较于一阶段算法检测速度慢;yolo算法直接把目标检测看作是一个回归问题,在网络里对整张图像直接做回归和分类,其检测速度快,但其对于小目标的识别精度不够,易产生漏检、错检;相较而言,ssd在不同尺度的特征层上生成anchor,然后将anchor做非极大值抑制(nms),能够在保证检测精度的基础上兼顾检测速度。目前,基于深度学习的目标检测算法广泛应用在多个领域中,文献《基于fast yolov3算法的煤矿胶带运输异物检测》(任国强,韩洪勇,李成江,等工矿自动化,2021.47(08):77-83.)提出基于fast yolov3算法的煤炭运输异物检测,增加反卷积并引入focal loss来提升小目标的检测能力以及检测精度;文献《煤矿带式输送机异物检测》(杜京义,陈瑞,郝乐,等,江苏,工矿自动化,2021,47(08):77-83)提出一种改进的yolov3算法实现皮带运输机的异物检测,利用darknet22-ds作为主干网络加入特征金字塔和多尺度特征融合提高网络的收敛速度和检测精度;文献《基于cbam-yolov5的煤矿输送带异物检测》(郝帅,张旭,马旭,等,北京,煤炭学报,2021:1-11.)提出基于cbam的yolov5模型的煤矿输送带异物检测,利用卷积注意力提升图像中异物的显著度优化损失函数,提升异物目标的检测精度。
3.但在现有技术中,还存在复杂背景下特征提取能力弱、利用浅层特征层检测小目标感受野较小、对小目标检测精度低的问题。


技术实现要素:

4.针对目标检测对实时性和精度的要求,本发明提出了基于双向特征融合金字塔ssd的铁矿石异物识别方法,利用双向特征融合金字塔模块对特征层进行不同尺度的特征融合,增强网络的表征能力;引入坐标注意力(coordinate attention)模块,增加对重要特征的关注度,提升检测精度;优化huber损失函数,在减小训练中损失的起伏的同时加快模型的收敛速度。提出的模型解决在复杂背景下特征提取能力弱、利用浅层特征层检测小目标感受野较小、对小目标检测精度低的问题。
5.为达到上述目的,本发明是按照以下技术方案实施的:
6.基于双向特征融合金字塔ssd的铁矿石异物识别方法,包括以下步骤:
7.s1,数据集划分
8.将数据集划分为训练集和验证集;本发明的数据集指的是相机拍摄的铁矿石中的异物数据图像集,以下简称数据集。
9.s2,搭建主干网络
10.在ssd算法的基础上,构建双向金字塔结构,实现对高低层特征的双向融合,增强网络的表征能力;融入轻量级坐标注意力模块,在卷积的过程中抓取关键特征,提高ssd网络的特征提取能力;优化huber损失函数,提升网络的收敛速度以及检测精度,提高网络的鲁棒性;最终得到基于双向特征融合金字塔的ssd算法;
11.s3,训练
12.将数据集输入步骤s2得到的基于双向特征融合金字塔的ssd算法中,通过主干网络提取关键特征;利用关键特征层进行目标的识别,得到目标的位置、置信度以及类别信息;通过非极大值抑制方法筛选出目标识别效果最好的作为输出;通过不断的训练,最终得到训练好的权重文件。
13.进一步的,还包括测试的步骤,挑选未进行训练的图像进行测试。然后,将数据输入测试网络。最终,利用训练好的权重文件进行测试,得到网络对目标的检测精度map(平均准确率)。
14.优选的,所述步骤s2具体为:
15.s2.1,双向特征融合金字塔结构设计
16.通过一个自下而上和一个自上而下的金字塔结构,将特征层中高分辨率浅层特征与深层特征进行融合;
17.s2.2,损失函数模型优化
18.利用huber损失作为其损失函数,将平方差损失进行改进,在平方差损失中加入3次方项,能够在残差、平方差损失转变时梯度有一个上升趋势的过渡,其能够减小训练中损失的起伏,同时加快模型的收敛速度,增加模型鲁棒性;
19.s2.3,轻量级坐标注意力模块的融合
20.在ssd网络中融合坐标注意力模块,使网络能够在关注重要通道的同时,保留特征层精确的位置信息。
21.优选的,所述步骤s2.1具体为:
22.先对输入的图像进行池化操作,进行池化操作后得到特征层conv7-2;然后,对conv7-2的特征图p
7-2
进行上采样,生成与conv6-2层特征图高和宽相同的特征图p'
7-2
,维度为10
×
10
×
256;为了特征图p'
7-2
与侧边融合后的维度保持不变,利用1
×
1卷积将conv6-2层的通道数调整为256,生成特征图p'
6-2
;通过concat特征融合的方式对特征图p'
6-2
和p'
7-2
进行拼接生成特征图p”6-2
,经过两次上采样与侧边融合过程后,在特征层conv4-3处能够得到自上而下金字塔的输出特征图p'
4-3
;再对特征层pool1、pool2、pool3利用1
×
1卷积改变通道数,双线性插值进行下采样,并采用add方式进行特征融合,能够在特征层conv4-3处得到包含丰富位置和细节信息的特征图p”4-3
,将特征图p
4-3
,p'
4-3
,p”4-3
进行对应元素求和得到最终的输出p”'
4-3

23.先对输入的图像进行池化操作,然后对池化后的特征层pool1、pool2、pool3进行自下而上的特征融合,从而得到浅层的位置、细节等信息;再对特征层conv7-2、conv6-2、fc7、conv4-3重复下采样和拼接融合,得到高层具有丰富语义的信息;最后将具有高分辨率
的浅层特征与具有丰富语义的深层特征进行特征融合,使特征层conv4-3层具有高层语义特征的同时,兼备丰富的位置和细节信息。最后,利用通过卷积得到的6个不同分辨率的特征层(conv4-3、fc7、conv6-2、conv7-2、conv8-2、conv9-2)进行识别。采用非极大值抑制方法,选取识别效果最好、置信度最高的特征层作为输出。最终能够得到图像中目标的类别,位置信息以及其置信度。
24.优选的,所述步骤s2.2具体为:
25.原huber损失如公式(1)所示:
[0026][0027]
其中,l
δ
表示损失,δ表示残差临界值,y表示实际值,f(x)表示预测值;
[0028]
首先,在原有平方差损失上加入3次方项,为保持改进前后平方差损失趋势基本保持一致,确定优化后的平方差损失如下所示:
[0029][0030]
其中,l
k2
表示改进后平方差损失,l
k1
表示改进后残差损失,a表示斜率,b为常数项;
[0031]
在残差损失转变为平方差损失临界点δ位置,需要保持其连续可导,从而得到残差损失的斜率a;
[0032]
l
k2
求导可得:
[0033][0034]
将(y-f(x))=δ代入l'
k2
可以得到l
k1
的斜率a;
[0035][0036]
由于残差损失转变为平方差损失连续,可得到l
k1
的常数项b;
[0037][0038]
最终可得到改进损失的表达式如下:
[0039][0040]
其中,l

表示改进后的损失函数;
[0041]
改进平方差损失函数的梯度表达式如下:
[0042][0043]
整体的梯度表达式为:
[0044][0045]
优选的,所述步骤s2.3具体为:
[0046]
利用基于双向特征金字塔模型的ssd网络对输入图像进行卷积得到对应的特征。然后在特征层conv4-3和fc7之间加入坐标注意力,将生成的特征分别编码,形成一个对方向和位置敏感的特征图,从而增强对目标特征的表征能力。使网络能够在关注重要通道的同时,保留特征层精确的位置信息,有利于提高模型的检测精度。
[0047]
利用两个1d的全局平均池化操作将特征层沿高度h和宽度w两个方向聚合为两个独立的方向感知特征图和高度为h的第c个通道输出如公式(9)所示:
[0048][0049]
同理,宽度为w的第c个通道输出如公式(10)所示:
[0050][0051]
分别对和进行1
×
1卷积变换f,并对两个变换结果进行concat通道拼接,然后采用relu激活函数增加其非线性,生成的中间特征f表示为:
[0052]
f=δ(f[zh,zw])(11)
[0053]
将中间特征图f沿着空间维度切分为两个单独的张量fh和fw,并利用1
×
1卷积将其变换到与输入同样的通道数,结果如公式(12)所示:
[0054][0055]
最后,对gh和gw进行拓展,作为权重得到最终的输出:
[0056][0057]
其中,gh和gw表示高和宽两个方向的权重;xc(i,j)表示输入特征;yc(i,j)表示坐
标注意力的输出。
[0058]
具体的,在网络中输入一张图像。然后,利用提出的基于双向特征融合金字塔ssd算法对图像进行特征的提取。通过特征提取能够得到具有关键特征的6个分辨率不同的特征层conv4-3、fc7、conv6-2、conv7-2、conv8-2、conv9-2。之后,对6个关键特征层进行分类和识别,分别能够得到6个目标检测结果。最后对6种检测结果通过非极大值抑制方法进行筛选,选择置信度最高的作为结果。
[0059]
本发明的有益效果是:本发明提出了一种双向特征融合金字塔(b-fpn)单次多框检测器(ssd)算法实现对铁矿石中异物的识别;针对ssd网络利用浅层特征层检测目标感受野较小、异物识别精度低的问题,提出了一种双向金字塔结构,实现了对高低层特征的双向融合,增强了网络的表征能力;针对ssd网络特征提取能力弱的问题,融入了轻量级坐标注意力模块,在关注重要通道特征的同时,还关注其空间特征,从而提高了ssd网络的特征提取能力;针对模型训练过程中损失出现较大起伏,影响检测精度并且增加训练时长的问题,改进huber损失函数,提升网络的收敛速度以及检测精度。本发明的方法,使得铁矿石异物识别精度能够达到98.26%,相较于原ssd算法提升了2.74%。
附图说明
[0060]
图1为本发明的双向特征融合金字塔网络构架图;
[0061]
图2为本发明的改进前后损失函数对比图;
[0062]
图3为本发明的改进前后梯度的对比图;
[0063]
图4为本发明的坐标注意力模块结构图;
[0064]
图5为本发明的双向特征融合金字塔ssd算法网络结构图;
[0065]
图6为本发明实施例的异物数据集;
[0066]
图7为本发明实施例的损失函数1与原损失实验结果对比图;
[0067]
图8为本发明实施例的损失函数2与原损失实验结果对比图;
[0068]
图9为本发明实施例的损失函数3与原损失实验结果对比图;
[0069]
图10为本发明实施例的损失函数4与原损失实验结果对比图;
[0070]
图11为本发明实施例的算法检测结果。
具体实施方式
[0071]
下面结合本发明实施例中的附图以及具体实施例对本发明进行清楚地描述,在此处的描述仅仅用来解释本发明,但并不作为对本发明的限定。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
[0072]
实施例
[0073]
基于双向特征融合金字塔ssd的铁矿石异物识别方法,包括以下步骤:
[0074]
s1,双向特征融合金字塔(bilateral-fpn)结构设计
[0075]
本实施例提出了一种双向特征融合的金字塔结构(bilateral-fpn,简称b-fpn);ssd算法利用浅层特征检测小目标,与高层特征没有关联性,并且在卷积过程中浅层特征容易丢失,存在特征提取不充分对小目标检测精度低的问题。现有利用自上而下特征金字塔
(fpn)进行特征融合的方法,能够提升网络特征提取能力,但其也有一定的局限性,没有考虑到全局特征,只能实现单方向高层特征的融合。因此,本实施例提出一种双向特征融合金字塔结构(bilateral-fpn),分别通过一个自下而上和一个自上而下的金字塔结构,将特征层中高分辨率浅层特征与深层特征进行融合,使特征能够在包含更多位置、细节信息的同时富含语义信息,提升检测精度。其网络结构如图1所示。
[0076]
图1为本发明的双向特征融合金字塔网络构架图。
[0077]
首先输入一张图像,然后对其进行池化操作得到特征层conv7-2。对conv7-2的特征图p
7-2
进行上采样,生成与conv6-2层特征图高和宽相同的特征图p'
7-2
,维度为10
×
10
×
256。为了特征图p'
7-2
与侧边融合后的维度保持不变,利用1
×
1卷积将conv6-2层的通道数调整为256,生成特征图p'
6-2
;通过concat特征融合的方式对特征图p'
6-2
和p'
7-2
进行拼接生成特征图p”6-2
,经过两次上采样与侧边融合过程后,在特征层conv4-3处能够得到自上而下金字塔的输出特征图p'
4-3
;再对特征层pool1、pool2、pool3利用1
×
1卷积改变通道数,双线性插值进行下采样,并采用add方式进行特征融合,能够在特征层conv4-3处得到包含丰富位置和细节信息的特征图p”4-3
,将特征图p
4-3
,p'
4-3
,p”4-3
进行对应元素求和得到最终的输出p”'
4-3
。双向特征融合金字塔结构能够增加ssd网络对于小目标的检测效果。
[0078]
本实施例先对输入的图像进行池化操作,然后对池化后的特征层pool1、pool2、pool3进行自下而上的特征融合,从而得到浅层的位置、细节等信息;再对特征层conv7-2、conv6-2、fc7、conv4-3重复下采样和拼接融合,得到高层具有丰富语义的信息;最后将具有高分辨率的浅层特征与具有丰富语义的深层特征进行特征融合,使特征层conv4-3层具有高层语义特征的同时,兼备丰富的位置和细节信息。最后,利用通过卷积得到的6个不同分辨率的特征层(conv4-3、fc7、conv6-2、conv7-2、conv8-2、conv9-2)进行识别。采用非极大值抑制方法,选取识别效果最好、置信度最高的特征层作为输出。最终能够得到图像中目标的类别,位置信息以及其置信度。
[0079]
s2,损失函数模型优化
[0080]
ssd网络中利用huber损失作为其损失函数,结合残差、平方差损失的优点,使其具有较好的鲁棒性。但是在临界点位置残差损失直接转变为平方差损失时没有经过过渡,导致在训练过程中损失会出现较大的起伏,影响检测精度的同时也会增加其训练的时长。损失函数的优化不仅需要考虑到其损失函数的趋势,还要考虑到优化损失函数后网络是否会产生梯度爆炸或者梯度消失的现象。本实施例通过将平方差损失进行改进,在平方差损失中加入了3次方项,能够在残差、平方差损失转变时梯度有一个上升趋势的过渡,实验证明,其能够减小训练中损失的起伏,同时加快模型的收敛速度,增加模型鲁棒性。原huber损失如公式(1)所示:
[0081][0082]
其中,l
δ
表示损失,δ表示残差临界值,y表示实际值,f(x)表示预测值。
[0083]
首先,在原有平方差损失上加入3次方项,为保持改进前后平方差损失趋势基本保持一致,确定优化后的平方差损失如下所示:
[0084][0085]
其中,l
k2
表示改进后平方差损失,l
k1
表示改进后残差损失,a表示斜率,b为常数项。
[0086]
在残差损失转变为平方差损失临界点δ位置,需要保持其连续可导,从而得到残差损失的斜率a。
[0087]
l
k2
求导可得:
[0088][0089]
将(y-f(x))=δ代入l'
k2
可以得到l
k1
的斜率a。
[0090][0091]
由于残差损失转变为平方差损失连续,可得到l
k1
的常数项b。
[0092][0093]
最终可得到改进损失的表达式如下:
[0094][0095]
其中,l

表示改进后的损失函数。
[0096]
如图2所示,为本发明改进前后损失函数对比图,可以看出在改进后损失函数的斜率增加,能够使训练模型收敛速度加快。
[0097]
改进平方差损失函数的梯度表达式如下:
[0098][0099]
整体的梯度表达式为:
[0100][0101]
如图3所示,为本发明的改进前后梯度的对比图,可以看出本实施例优化损失函数后,在由残差损失向平方差损失转变时增加了一个上升的过渡趋势,实验证明,其能够减小训练中损失的起伏,同时加快模型的收敛速度,增加模型鲁棒性。
[0102]
s3,轻量级坐标注意力模块的融合
[0103]
针对ssd网络特征提取能力弱的问题,本实施例在ssd网络中融合了坐标注意力模块。首先利用基于双向特征金字塔模型的ssd网络对输入图像进行卷积得到对应的特征。然后在特征层conv4-3和fc7之间加入坐标注意力,将生成的特征分别编码,形成一个对方向和位置敏感的特征图,从而增强对目标特征的表征能力。使网络能够在关注重要通道的同时,保留特征层精确的位置信息,有利于提高模型的检测精度。具体结构如图4所示。
[0104]
利用两个1d的全局平均池化将特征层沿高度h和宽度w两个方向聚合为两个独立的方向感知特征图和高度为h的第c个通道输出如公式(9)所示:
[0105][0106]
同理,宽度为w的第c个通道输出如公式(10)所示:
[0107][0108]
分别对和进行1
×
1卷积变换f,并对两个变换结果进行concat通道拼接,然后采用relu激活函数增加其非线性,生成的中间特征f表示为:
[0109]
f=δ(f[zh,zw])(11)
[0110]
将中间特征图f沿着空间维度切分为两个单独的张量fh和fw,并利用1
×
1卷积将其变换到与输入同样的通道数,结果如公式(12)所示:
[0111][0112]
最后,对gh和gw进行拓展,作为权重得到最终的输出:
[0113][0114]
其中,gh和gw表示高和宽两个方向的权重;xc(i,j)表示输入特征;yc(i,j)表示坐标注意力的输出。
[0115]
图5为本发明的双向特征融合金字塔ssd算法网络结构图。首先,在网络中输入一张图像。然后,利用提出的基于双向特征融合金字塔ssd算法对图像进行特征的提取。通过特征提取能够得到具有关键特征的6个分辨率不同的特征层conv4-3、fc7、conv6-2、conv7-2、conv8-2、conv9-2。之后,对6个关键特征层进行分类和识别,分别能够得到6个目标检测结果。最后对6种检测结果通过非极大值抑制方法进行筛选,选择置信度最高的作为结果。
[0116]
具体实施及应用
[0117]
1.1数据获取与预处理
[0118]
本实施例使用水星二代(mercury2)系列gige数字面阵相机进行异物数据集的拍摄,相机距传送带60cm,光源采用对射光源,共采集639张图像,其中存在异物的图片586张,无异物的图片53张,经过翻转、平移、镜像、高斯噪点,色彩变换对数据进行增强,共得到存在异物图像1337张,并采用labelimg将数据分为钢筋、桶(管)、柱状、角铁铁块、小型无规则异物5类进行标注,如图6所示,为本发明实施例的异物数据集。
[0119]
1.2实验平台与参数设置
[0120]
实验在windows10操作系统下基于tensorflow 1.15.0深度学习框架,keras版本为2.1.5,python3.6的环境下进行的训练与测试。所用计算机gpu配置为rtx2080ti,显存为11gb,cuda版为10.0.输入图片大小为300
×
300,初始学习率为0.0001,训练过程批次大小为16,每个批次1002张图像,训练集与验证集比例为9:1,模型动量因子为0.9,训练100个epoch,选择最优权重。
[0121]
1.3实验过程
[0122]
(1)数据集划分。在对数据进行训练之前,将数据集划分为训练集和验证集。在本实施例中训练集和验证集划分的比例为9:1;
[0123]
(2)搭建主干网络。本实施例在ssd算法的基础上,构建双向金字塔结构,实现了对高低层特征的双向融合,增强了网络的表征能力;融入了轻量级坐标注意力模块,在卷积的过程中抓取关键特征,从而提高了ssd网络的特征提取能力;优化huber损失函数,提升网络的收敛速度以及检测精度,提高网络的鲁棒性。
[0124]
(3)训练。首先,将数据集输入搭建的基于双向特征融合金字塔的ssd算法中,通过主干网络提取关键特征。然后,利用关键特征层(conv4-3、fc7、conv6-2、conv7-2、conv8-2、conv9-2)进行目标的识别,得到目标的位置、置信度以及类别信息。最后,通过非极大值抑制方法筛选出目标识别效果最好的做为输出。通过不断的训练,最终能够得到具有良好识别效果的权重文件。
[0125]
(4)测试。首先,挑选未进行训练的图像进行测试。然后,将数据输入测试网络。最终,利用训练好的权重文件进行测试,就能得到网络对目标的检测精度map(平均准确率)。
[0126]
1.4结果与分析
[0127]
1.4.1损失函数优化实验验证
[0128]
原网络损失具有较大的起伏,影响网络的训练效果,而且增加了训练时长;通过实验对损失函数进行优化,得到原始ssd网络与改进后4个损失函数训练与验证集损失对比图,左侧为训练集损失,右侧为验证集损失,结果如图7-图10所示。
[0129]
图7、图8、图9、图10分别为四种不同损失函数训练结果对比图,实线为改进后损失函数训练曲线,虚线为原损失函数训练曲线,检测精度为95.52%。可以从图中明显看出,图7中损失函数1在28个epoch时模型自动停止,验证集损失波动较大,从左侧训练集损失可以看出模型并没有收敛,效果较差;图8中损失函数2在67个epoch时模型收敛,但是其损失较大,检测精度为95.21%;图9中损失函数3在50个epoch时模型收敛,精度map为95.73%,效果有一定提升,但验证集损失在开始的阶段有起伏;图10中本实施例设计的损失函数在78个epoch后模型收敛,曲线平滑,map为98.26%,效果最好。损失函数优化后模型收敛速度加快,损失曲线更加的平滑,也是本实施例最终优化的损失,相较于原来的损失检测精度提高
2.74%。
[0130]
以上结果所对应的5个损失函数表达式及对应测试结果如表1所示:
[0131]
表1优化损失函数实验结果
[0132][0133]
1.4.2实验结果
[0134]
本实验使用异物数据集通过ssd、fast r-cnn、yolo系列几种主流的目标检测算法对异物进行检测,算法参数保持一致,结果如表2所示。
[0135]
表2本实施例算法与其他算法异物检测结果对比
[0136][0137][0138]
在本实验中,ssd、fast r-cnn以及yolo系列是目前经典的目标检测算法,yolov4-tiny和yolo-x是近两年目标检测方面的先进算法,表2为各个算法检测结果。在检测精度方面,改进算法的检测精度为98.26%,在几种算法里识别精度最高;在检测速度上,yolov4-tiny算法的速度最快,识别速度能够达到每秒187.42帧,但是其识别精度较低,map只有54.53%,不能达到识别的基本要求,而改进算法由于比原始ssd网络复杂,检测速度略微低,识别速度能够达到每秒74.4帧,基本能达到检测要求。总体而言,改进算法在检测精度和检测速度上都能达到较好的效果。
[0139]
1.5识别效果
[0140]
如图11所示,为本发明实施例的算法检测结果。图11是在钢筋、桶(管)、柱状、角铁铁块、小型无规则异物5类异物图像中随机挑选的图片利用本实施例提出的算法进行异物识别的效果图。从图中可以看出:本实施例算法不仅对大型异物的识别率较高,而且对于小型异物的识别率和置信度也比较高。
[0141]
本实施例提出的算法在异物数据集上的识别率和置信度较高,而且基本不存在错检和漏检现象。
[0142]
1.6消融实验
[0143]
为了证明算法中各个模块的有效性,本实施例进行消融实验,基于相同的实验环境,实验结果如表3所示:
[0144]
表3消融实验结果
[0145][0146][0147]
在表3中可以看到原ssd算法和分别加入b-fpn、融合坐标注意力、改进损失以及融合在一起后精度分别为95.52%、96.70%、97.31%、96.84%以及98.26%。在ssd网络中加入三种算法精度都有一定的提升,融合三种方法后精度最高。
[0148]
结论
[0149]
本实施例提出了一种双向特征融合金字塔(b-fpn)ssd算法,用于提升对目标检测的精度。针对传统ssd算法检测目标时,感受野较小、精度低的问题,构建一种双向特征融合金字塔结构实现对特征层进行不同尺度的特征融合,使其具有高层语义信息的同时,兼备丰富的位置和细节信息,增加了特征的表征能力。防止在卷积过程中重要特征的丢失,融合了轻量级卷积注意力模块,在关注特征层重要通道特征的同时,关注其空间特征,提高了网络的特征提取能力。最后为了提高模型的稳定性,改进huber损失函数,使网络在减小训练中损失起伏程度的同时,加快模型的收敛速度,增加模型鲁棒性,提升网络的检测精度。本实施例算法能够实现在保证检测速度的基础上,在异物检测精度上有明显的提升。
[0150]
以上所述仅为本发明的优选实施方式,但本发明的保护范围并不局限于上述实施例。应当指出,在本技术领域范围内,不脱离本发明技术思路的情况下,对本发明所做的简单润饰、改进、替代、简化和组合,都应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1