煤矸图像识别方法、装置、设备

文档序号:31605875发布日期:2022-09-21 10:38阅读:575来源:国知局
煤矸图像识别方法、装置、设备

1.本发明涉及图像处理技术领域,尤其涉及一种煤矸图像识别方法、装置、设备。


背景技术:

2.煤炭在开采和运输的过程中常伴有较多矸石和杂质。矸石燃烧时会产生大量有害气体,加重大气环境污染,因此需要有效地将矸石从煤中识别出来。传统的煤矸识别方法有人工法、机械湿选、破碎法和射线法,然而这些方法都存在着明显的缺点和局限性。
3.为了实现少人或无人化的绿色煤炭开采,同时提高煤矸识别的准确性,研究人员尝试将计算机视觉方法应用到煤矸识别中。yolo(you only look once)是redmon等人在2016年提出的一种端到端的目标检测方法。yolo是一个单阶段的目标检测算法,它将对象检测重新定义为一个回归问题,因而不需要复杂的管道,算法速度非常快,能够处理实时视频流。
4.yolo系列算法已经更新到yolov5s。虽然yolov5s方法性能较好,但检测模型较大,计算复杂,实时性仍有待提高。


技术实现要素:

5.本发明的目的在于解决上述现有技术存在的缺陷,提供一种检测精度基本无损,但速度更快,模型权重更小的煤矸图像识别方法、装置、设备。
6.一种煤矸图像识别方法,包括:
7.构建图像识别模型yolov5s_gc;
8.基于所述图像识别模型yolov5s_gc对待检测图像进行煤矸识别;
9.所述图像识别模型yolov5s_gc的构建包括:
10.利用ghostc3模块代替原yolov5s网络模型中的c3模块;所述ghostc3模块通过分阶段卷积减少模块的参数量和计算量。
11.进一步地,如上所述的煤矸图像识别方法,所述图像识别模型yolov5s_gc的构建还包括:
12.利用ghostconv模块代替原yolov5s网络模型中的cbs模块;所述ghostconv模块用于消除卷积过程中冗余的特征图。
13.进一步地,如上所述的煤矸图像识别方法,所述图像识别模型yolov5s_gc的构建还包括:
14.利用cbs_cbam模块代替原yolov5s网络模型中处于focus结构之后的cbs模块;所述cbs_cbam模块用于弥补模型损失的部分精度。
15.进一步地,如上所述的煤矸图像识别方法,所述ghostconv模块包括:
[0016]1×
1卷积单元,用于对特征图进行降维,得到第一特征图;
[0017]
逐通道卷积单元,用于对所述第一特征图进行逐通道卷积,得到第二特征图;
[0018]
拼接单元,用于将所述第一特征图和第二特征图进行通道拼接,以得到最终的输
出特征图。
[0019]
进一步地,如上所述的煤矸图像识别方法,所述ghostc3模块包括:第一cbs模块、第二cbs模块、第三cbs模块以及由若干ghostnet基本单元相连构成的ghostbottleneck模块;所述ghostnet基本单元包括所述ghostconv模块;
[0020]
所述ghostc3模块将输入特征图分成两部分,一部分作为第一cbs模块的输入,另一部分作为第二cbs模块的输入;所述第一cbs模块的输出作为ghostbottleneck模块的输入,ghostbottleneck模块的输出与第二cbs模块的输出拼接,将两者的拼接结果作为第三cbs模块的输入,第三cbs模块的输出为ghostc3模块的输出。
[0021]
进一步地,如上所述的煤矸图像识别方法,在卷积步长为1的情况下,所述ghostnet基本单元包括:两个所述ghostconv模块,该两个ghostconv模块相连。
[0022]
进一步地,如上所述的煤矸图像识别方法,在卷积步长为2的情况下,所述ghostnet基本单元包括:两个所述ghostconv模块、以及连接在所述两个ghostconv模块之间的步长为2的逐通道卷积单元。
[0023]
一种煤矸图像识别装置,包括:
[0024]
构建单元,用于构建图像识别模型yolov5s_gc;
[0025]
图像识别单元,基于所述图像识别模型yolov5s_gc对待检测图像进行煤矸识别;
[0026]
所述图像识别模型yolov5s_gc的构建包括:
[0027]
利用ghostc3模块代替原yolov5s网络模型中的c3模块;所述ghostc3模块通过分阶段卷积减少模块的参数量和计算量;
[0028]
利用ghostconv模块代替原yolov5s网络模型中的cbs模块;所述ghostconv模块用于消除卷积过程中冗余的特征图;
[0029]
利用cbs_cbam模块代替原yolov5s网络模型中处于focus结构之后的cbs模块;所述cbs_cbam模块用于弥补模型损失的部分精度。
[0030]
一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的煤矸图像识别方法。
[0031]
一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述煤矸图像识别方法。
[0032]
本发明提供一种煤矸图像识别方法、装置、设备。本发明提供的煤矸图像识别方法,通过ghostc3模块代替原yolov5s网络模型中的c3模块,由于ghostc3模块可以消除卷积过程中冗余的特征图,从而使得改进后的图像识别模型yolov5s_gc大大降低了模型参数量和计算量,实现模型压缩,从而实现了构建的图像识别模型yolov5s_gc具有轻量化的优势,提升了检测实时性,提高了煤矸图像识别的效率。
附图说明
[0033]
图1为现有技术中mosaic数据增强原理图;
[0034]
图2为现有技术中yolov5s的网络结构示意图;
[0035]
图3为focus模块的结构示意图;
[0036]
图4为c3模块的结构示意图;
[0037]
图5为残差模块res的结构示意图;
[0038]
图6为cbs模块的结构示意图;
[0039]
图7为focus结构进行切片操作的原理图;
[0040]
图8为本发明图像识别模型yolov5s_gc的结构示意图;
[0041]
图9为本发明ghostc3模块结构示意图;
[0042]
图10为ghostconv模块结构示意图;
[0043]
图11为ghostnet分阶段卷积计算原理图;
[0044]
图12为cbam注意力机制结构图;
[0045]
图13为通道注意力模块结构示意图;
[0046]
图14为空间注意力模块结构示意图;
[0047]
图15为卷积步长为1的ghostnet基本单元结构示意图;
[0048]
图16为卷积步长为2的ghostnet基本单元结构示意图;
[0049]
图17为图像识别模型yolov5s_gc的检测精度曲线图;
[0050]
图18为图像识别模型yolov5s的检测效果图;
[0051]
图19为图像识别模型yolov5s_gc的检测效果图;
[0052]
图20为本发明提供的煤矸图像识别装置;
[0053]
图21是本发明提供的电子设备的结构示意图。
具体实施方式
[0054]
为使本发明的目的、技术方案和优点更加清楚,下面对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0055]
yolov5s是一种高性能的目标检测方法,根据其网络深度的不同,yolov5方法有s、m、l、x四种不同的网络,其中yolov5s网络深度最小,模型的训练速度最快,因此本发明以yolov5s为基础。
[0056]
yolov5s方法在输入端对数据进行了mosaic数据增强,图1为现有技术中mosaic数据增强原理图,如图1所示,首先在送入网络的图像数据中随机挑选4张图片,然后在位置上进行随机剪裁,最终拼接成一张图片送入网络进行训练。这样做首先可以丰富数据集的背景,同时可以将4张图片一起送入网络进行学习,因此在模型训练时,图像批次不用设置为较大的参数,减少了硬件设备的负担。此外,随机剪裁时可能会产生许多尺寸较小的目标,一定程度上扩充了数据集,有助于提升模型对小目标的检测效果。
[0057]
图2为现有技术中yolov5s的网络结构示意图,如图2所示,yolov5s的网络结构主要由输入层、特征提取层、特征融合层和预测层构成。所述特征提取层包括:focus模块、cbs模块、c3模块;所述特征融合层包括:spp模块、c3模块、cbs模块。图3为focus模块的结构示意图,如图3所示,所述focus模块由若干slice模块经过拼接后再进行标准卷积操作得到。图4为c3模块的结构示意图,如图4所示,所述c3模块由3个cbs模块和多个残差模块构成。图5为残差模块res的结构示意图,如图5所示,所述残差模块res由两个cbs模块构成。图6为cbs模块的结构示意图,如图6所示,所述cbs模块由卷积层、bn层、silu激活函数构成。
[0058]
所述yolov5s网络结构在特征提取层,首先对输入的图片利用focus结构进行切片
操作,图7为focus结构进行切片操作的原理图,如图7所示,focus结构针对各个通道的特征图,每隔一个像素取一个值,这样就可以实现在没有信息丢失情况下对特征图的下采样,使输入特征图的大小变为原来的一半,但通道数扩充为原来的4倍。此外,yolov5s方法中的silu激活函数,凭借其平滑、非单调的特性,提高模型性能,silu激活函数和卷积层、bn层构成cbs模块。c3结构借鉴了cspnet,由3个cbs模块和多个残差模块构成,其将输入的特征图在通道上分成两部分,一部分通过复杂的残差结构后与另一部分进行拼接,有效地减少了模型的计算量,并加强了信息的融合。
[0059]
在特征融合层,yolov5s依然采用了fpn和pan结构,但与yolov4不同的是,其在此基础上加入了c3模块,确保模型提取到更有效的特征。
[0060]
yolov5s中的损失函数包含三部分,分别为边界框损失函数、置信度损失函数和分类损失函数,分别对应边界框的位置、边界框的可信度以及目标的类别。其中,置信度损失函数和分类损失函数用的是二元交叉熵,其计算按公式(1),p(y)是模型的预测值,y是真实值。
[0061]
loss=-[y
·
log(p(y))+(1-y)
·
log(1-p(y))]
ꢀꢀ
(1)
[0062]
本发明提供的方法使用ciou_loss作为边界框损失函数,计算如公式(2)和(3)所示,其中d1是预测框与真实框最小外接矩形对角线的长度,d2是两个框中心点的欧氏距离,v是一个影响因子,w
gt
和h
gt
分别是真实框的宽和高,w
p
和h
p
分别为预测框的宽和高。
[0063][0064][0065]
本发明提供的煤矸图像识别方法,包括:
[0066]
构建图像识别模型yolov5s_gc;
[0067]
基于所述图像识别模型yolov5s_gc对待检测图像进行煤矸识别;
[0068]
其中,所述图像识别模型yolov5s_gc的构建包括:
[0069]
利用ghostc3模块代替原yolov5s网络模型中的c3模块;所述ghostc3模块通过分阶段卷积减少模块的参数量和计算量。
[0070]
下面对图像识别模型yolov5s_gc的构建过程进行详细的说明:
[0071]
图8为本发明图像识别模型yolov5s_gc的结构示意图。如图8所示,本发明利用ghostc3模块代替原yolov5s网络模型中的c3模块;所述ghostc3模块通过分阶段卷积减少模块的参数量和计算量。
[0072]
图9为本发明ghostc3模块结构示意图。如图9所示,所述ghostc3模块包括:cbs模块和ghostbottleneck模块;所述ghostbottleneck模块由若干ghostnet基本单元相连构成;所述ghostnet基本单元包括ghostconv模块。
[0073]
具体地,所述ghostc3模块将输入特征图分成两部分,一部分作为第一cbs模块的输入,另一部分作为第二cbs模块的输入;所述第一cbs模块的输出作为ghostbottleneck模块的输入,ghostbottleneck模块的输出与第二cbs模块的输出拼接,并将两者的拼接结果作为第三cbs模块的输入,第三cbs模块的输出为ghostc3模块的输出。ghostbottleneck_x
中的x表示基本单元相连的数目。原始c3模块中的残差结构是由1
×
1和3
×
3的标准卷积构成,ghostnet的基本单元由分阶段卷积构成。
[0074]
本发明提供的煤矸图像识别方法,通过ghostc3模块代替原yolov5s网络模型中的c3模块,由于ghostc3模块可以消除卷积过程中冗余的特征图,从而使得改进后的图像识别模型yolov5s_gc大大降低了模型参数量和计算量,实现模型压缩,使得构建的图像识别模型yolov5s_gc具有轻量化的优势,从而提升了检测实时性,提高了煤矸图像识别的效率。
[0075]
进一步地,所述图像识别模型yolov5s_gc的构建还包括:利用ghostconv模块代替原yolov5s网络模型中的cbs模块;所述ghostconv模块用于消除卷积过程中冗余的特征图。
[0076]
图10为ghostconv模块结构示意图,如图10所示,所述ghostconv模块包括:1
×
1卷积单元,用于对特征图进行降维,得到第一特征图;逐通道卷积单元,用于对所述第一特征图进行逐通道卷积,得到第二特征图;拼接单元,用于将所述第一特征图和第二特征图进行通道拼接,以得到最终的输出特征图。该ghostconv模块首先利用标准卷积对输入特征进行降维,降维之后特征的通道数是输入特征通道数的一半。然后,再利用5
×
5的卷积核对降维之后的特征进行逐通道卷积。最后,将降维之后的特征与逐通道卷积之后的特征进行通道拼接,保证输出特征的通道数与输入特征的通道数相同。
[0077]
具体地,在标准卷积过程中,特征的冗余度较高,这就在一定程度上增加了模型的参数量和计算量。因此,从降低标准卷积过程中特征图的冗余度角度出发,本发明通过ghostnet实现模型轻量化。ghostnet针对标准卷积过程中特征图的冗余度问题,将卷积分成两部分,用较少的计算得到与标准卷积同样多的特征。图11为ghostnet分阶段卷积计算原理图,如图11所示,第一部分首先对输入特征图利用1
×
1标准卷积进行降维,降维后特征图的通道数是原来通道数的一半,以减少模型的计算量。第二部分利用φk对第一次卷积之后降维的特征图进行线性运算,这里的线性运算可以用逐通道卷积进行替代。最后,将降维之后的特征图与逐通道卷积之后的特征图进行通道拼接,以得到最终的输出特征。ghostnet利用分阶段卷积可以有效地消除卷积过程中冗余的特征图,并减少标准卷积的参数量和计算量,从而达到轻量化的目的。
[0078]
标准卷积层的运算可以表示为公式(4)所示。其中x代表输入的特征,w为卷积核的权重参数,b为偏置。设输入特征的通道数为m,高度和宽度分别为h和w。而y表示输出的通道数为n、高度和宽度分别为h'和w'的特征图。假设卷积核大小为k
×
k,通过分析可以计算出标准卷积的计算量为h'
×
w'
×m×n×k×
k。
[0079]
y=x
×
w+b
ꢀꢀ
(4)
[0080]
而ghostnet提出的分阶段卷积首先对输入特征进行少量的标准卷积实现通道降维,然后对降维后的特征进行逐通道卷积,并将卷积之后的特征与卷积之前的特征进行拼接,有效地减少了特征冗余。ghostnet的分阶段卷积运算可以表示为公式(5)。
[0081]
yi=φi(yi'),i∈[1,n/2]
ꢀꢀ
(5)
[0082]
其中y'代表首先对输入x进行标准卷积,得到n/2个特征图,这里n为偶数。由于这里使用的卷积核大小为1
×
1,因此,标准卷积的计算量为h'
×
w'
×
n/2
×
m。最后,ghostnet还要通过逐通道卷积再生成n/2个特征图,设卷积核大小同样为k
×
k,则逐通道卷积的计算量为h'
×
w'
×
n/2
×k×
k。最后,将第一次卷积之后的特征图与逐通道卷积后的特征图进行拼接。
[0083]
如公式(6)所示,用ghostnet分阶段卷积结构的计算量除以标准卷积的计算量,由于卷积核大小k一般取3或者5,而m的取值一般远大于k,显然该比值至少为1/18或1/50。就是说,ghostnet分阶段卷积的计算量远远小于标准卷积的计算量,从而达到了轻量化网络的目的。
[0084][0085]
本发明提供的煤矸图像识别方法,通过ghostconv模块代替原yolov5s网络模型中的cbs模块。由于ghostconv模块可以消除卷积过程中冗余的特征图,从而使得本发明构建的图像识别模型yolov5s_gc轻量化的优势更加突出,进一步提高煤矸图像识别的效率。
[0086]
进一步地,所述图像识别模型yolov5s_gc的构建还包括:利用cbs_cbam模块代替原yolov5s网络模型中处于focus结构之后的cbs模块;所述cbs_cbam模块用于弥补模型损失的部分精度。
[0087]
具体地,由于本发明改进的图像识别模型yolov5s_gc利用所述ghostconv模块代替了原yolov5s网络模型中的cbs模块、利用所述ghostc3模块代替了原yolov5s网络模型中的c3模块,从而实现了模型的轻量化。然而,该模型的轻量化会使模型在特征提取层中对特征图的运算产生影响,因此,本发明在特征提取层中,在focus结构之后引入卷积注意力机制(convolutional block attention module,cbam),利用cbs_cbam模块代替原yolov5s网络模型中处于focus结构之后的cbs模块,以对切片之后的特征图进行优化。与以往单纯的通道注意力机制和空间注意力机制不同,本发明在cbs模块中引入的卷积注意力机制是一种混合的注意力机制,它是空间注意力和通道注意力的集合。通道注意力机制只对通道信息进行了全局平均池化操作,通过全连接层得到每个通道特征图的权值。本发明在此基础上进行改进,引入cbam注意力机制,因为除通道信息外,空间信息对卷积网络的表征能力也有很大提升。图12为cbam注意力机制结构图,其中*表示相乘。如图12所示,cbam注意力机制包括通道注意力和空间注意力两种机制,并且它们是顺序整合在一起的。通道注意力模块根据通道的注意力权值,对输入特征图中的关键信息进行判定,并对输入特征进行通道加权。然后,空间注意力模块再次对特征图空间信息进行加权,以得到最终的输出特征,实现对特征的优化。cbam注意力机制处理过程如公式(7)、(8)所示,式中f为输入特征,mc(f)为通道注意力权重,ms(f')为空间注意力权重,*表示对应元素逐个相乘。
[0088]
f'=mc(f)*f
ꢀꢀꢀꢀꢀ
(7)
[0089]
f"=ms(f')*f'
ꢀꢀꢀꢀꢀ
(8)
[0090]
图13为通道注意力模块结构示意图,如图13所示,该模块首先将输入的特征图分别进行平均池化和最大池化,在宽度和高度上进行压缩,其尺寸由c
×h×
w变为c
×1×
1。然后,将以上得到的通道特征输入多层感知机(mlp)进行卷积操作,并将输出的两个特征进行相加,最后通过sigmoid函数得到输入特征的通道注意力权重。
[0091]
图14为空间注意力模块结构示意图,如图14所示,该模块将经过通道注意力加权后的新特征图f',分别在特征图的通道方向上进行平均池化和最大池化。然后,将得到的两个特征图进行相加,并将特征图送入卷积层进行卷积操作,最后同样通过sigmoid函数得到
输入特征的空间注意力权重。
[0092]
本发明提供的煤矸图像识别方法,通过利用ghostc3模块代替原yolov5s网络模型中的c3模块,利用ghostconv模块代替原yolov5s网络模型中的cbs模块,使得模型在卷积过程中的冗余特征图能够消除,从而使得构建的模型轻量化。而轻量化的图像识别模型yolov5s_gc能够使得煤矸图像在识别的过程中大大提高图像识别的效率。同时,通过cbs_cbam模块代替原yolov5s网络模型中处于focus结构之后的cbs模块,从而弥补了模型损失的部分精度,使得本发明提供的方法在提高图像识别效率的同时,还能保证识别精度基本不变。
[0093]
进一步地,所述ghostnet基本单元根据卷积步长的不同,包括两种基本单元。图15为卷积步长为1的ghostnet基本单元结构示意图,图16为卷积步长为2的ghostnet基本单元结构示意图,如图15、图16所示,当卷积步长为1时,ghostnet基本单元是由两个分阶段卷积ghostconv模块构成的残差结构。当卷积步长为2时,两个ghostconv模块之间通过一个步长为2的逐通道卷积进行连接。
[0094]
本发明提供的煤矸图像识别方法,通过采用ghostnet分阶段卷积模块ghostconv有效降低了标准卷积过程中特征图的冗余度,减少了标准卷积的计算量和参数量,并利用卷积步长为1的ghostnet基本单元结构、或者采用卷积步长为2的ghostnet基本单元结构替代原yolov5s网络模型c3模块中的残差结构,形成ghostc3模块,实现了模型的轻量化,而轻量化的图像识别模型yolov5s_gc则可以进一步提高图像识别的效率。
[0095]
实验例:
[0096]
本发明实验中使用的gpu设备操作系统版本为windows10专业版,gpu的型号是geforce rtx 2080ti,显存大小是11gb,内存大小是64gb。为了节省训练时间,模型在gpu设备上进行训练。
[0097]
实验过程中使用的煤和矸石样本均来自某煤矿,并通过搭建图像采集平台进行煤矸图像采集。首先,通过矩形框架模拟巷道结构,并在框架外蒙上黑布,模拟井下昏暗环境。除此之外,在框架顶部安装条形灯,以提供稳定光源,最后通过双目相机进行煤矸图像采集。
[0098]
采集的煤矸图像不能直接输入到目标检测方法进行识别。由于图像分类不同,在进行目标检测时,除了要输入图像的像素信息,还要包含图像中目标的位置及类别信息。因此,需要对采集到的多目标煤矸图像进行人工标注,本发明中用到的标注工具为labelimg。
[0099]
本发明利用平均准确度均值map来评价模型的检测精度,其计算公式如式(9)所示。式中t表示检测类别,p和r分别表示模型的精确度和召回率,定义分别如公式(10)、(11)所示,map为所有目标类别p-r曲线下面积的平均值。在两个公式中,tp表示正确检测到的目标的数量,fp表示错误检测的目标的数量,fn表示漏检的目标的数量。除此之外,本发明还统计了模型的多方面性能指标,以对模型进行综合评价。例如利用参数量衡量模型大小,利用浮点运算数衡量模型的计算复杂度,以及利用模型平均推理时间衡量其检测速度。
[0100]
[0101][0102][0103]
结果分析
[0104]
本发明实验过程中共使用了2500张多目标煤矸图像进行训练,其中训练集1900张,测试集600张。训练时设置的模型初始学习率为0.01,衰减系数为0.0005,每次训练中图像批次设置为16,训练次数设置为500次。图17为图像识别模型yolov5s_gc的检测精度曲线图,map@0.5:0.95表示在不同的iou阈值下,即iou从0.5到0.95,每次变化0.05,计算得出的平均map值。yolov5s_gc的map值为0.912。因此,轻量化后的模型并没有引起精度的明显下降。
[0105]
本发明随机挑选了3张图片在gpu设备上进行检测,并通过计算三张图片检测时间的均值,求得各模型的平均推理时间,根据检测结果汇总各模型性能指标,如表1所示:
[0106]
表1模型性能对比
[0107][0108]
由表1可得,本发明构建的yolov5s_gc模型参数量较yolov5s减少了44.46%,计算量降低了38%,模型大小为原来的56.9%,gpu平均推理时间最短,较原模型降低了11.5%,且模型的检测精度map值较yolov5s仅下降了0.4%。因此,训练好的yolov5s_gc模型适合部署在gpu设备上。本发明构建的图像识别模型yolov5s_gc实现了在保证原模型精度无明显降低的同时,有效降低了模型大小及复杂度,提高了检测实时性,使改进后的模型更适合于工业场景的应用。
[0109]
图18为图像识别模型yolov5s_gc的检测效果图,图19为图像识别模型yolov5s_gc的检测效果图。如图18、图19所示,每个检测框都有一个置信度分数,表示该框包含目标的可能性。由图中可以看出,轻量化后模型检测结果的置信度分数与原模型大致相同,改进后的模型在减少参数量的同时,保证了模型的检测效果。
[0110]
本发明针对利用目标检测方法构建煤矸识别模型计算复杂、实时性差等问题,提出了基于yolov5syolov5s_gc的轻量化煤矸图像识别方法,并在gpu设备上达到轻量化模型的目的。实验结果表明,yolov5s_gc模型的推理时间最短,因此,本发明改进后的煤矸识别模型更适合于实际生产的应用。
[0111]
下面对本发明提供的煤矸图像识别装置进行描述,下文描述的煤矸图像识别装置与上文描述的煤矸图像识别方法可相互对应参照。
[0112]
图20为本发明提供的煤矸图像识别装置,如图20所示,该装置包括:
[0113]
构建单元,用于构建图像识别模型yolov5s_gc;
[0114]
图像识别单元,基于所述图像识别模型yolov5s_gc对待检测图像进行的煤矸识别;
[0115]
所述图像识别模型yolov5s_gc的构建包括:
[0116]
利用ghostc3模块代替原yolov5s网络模型中的c3模块;所述ghostc3模块通过分
阶段卷积减少模块的参数量和计算量;
[0117]
利用ghostconv模块代替原yolov5s网络模型中的cbs模块;所述ghostconv模块用于消除卷积过程中冗余的特征图;
[0118]
利用cbs_cbam模块代替原yolov5s网络模型中处于focus结构之后的cbs模块;所述cbs_cbam模块用于弥补模型损失的部分精度。
[0119]
图21示例了一种电子设备的实体结构示意图,如图21所示,该电子设备可以包括:处理器(processor)2110、通信接口(communicationsinterface)2120、存储器(memory)2130和通信总线2140,其中,处理器2110,通信接口2120,存储器2130通过通信总线2140完成相互间的通信。处理器2110可以调用存储器2130中的逻辑指令,以执行煤矸图像识别方法,该方法包括:
[0120]
构建图像识别模型yolov5s_gc;
[0121]
基于所述图像识别模型yolov5s_gc对待检测图像进行煤矸识别;
[0122]
所述图像识别模型yolov5s_gc的构建包括:
[0123]
利用ghostc3模块代替原yolov5s网络模型中的c3模块;所述ghostc3模块通过分阶段卷积减少模块的参数量和计算量。
[0124]
此外,上述的存储器2130中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0125]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的煤矸图像识别方法,该方法包括:构建图像识别模型yolov5s_gc;
[0126]
构建图像识别模型yolov5s_gc;
[0127]
基于所述图像识别模型yolov5s_gc对待检测图像进行煤矸识别;
[0128]
所述图像识别模型yolov5s_gc的构建包括:
[0129]
利用ghostc3模块代替原yolov5s网络模型中的c3模块;所述ghostc3模块通过分阶段卷积减少模块的参数量和计算量。
[0130]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1