基于改进YOLOX-S网络的农作物病虫害识别方法与流程

文档序号:31536878发布日期:2022-09-16 22:47阅读:328来源:国知局
基于改进YOLOX-S网络的农作物病虫害识别方法与流程
基于改进yolox-s网络的农作物病虫害识别方法
技术领域
1.本发明涉及图像识别技术领域,具体为基于改进yolox-s网络的农作物病虫害识别方法。


背景技术:

2.随着我国农业飞速发展,对农作物的产量与质量的要求也不断提高。而农作物病虫害是影响农作物产量与质量的重要因素之一。过去使用人工识别的方法,即靠技术人员的肉眼对农作物病虫害进行识别。
3.近些年,随着智慧农业的概念被提出,农场被要求实现无人化、自动化、智能化农业管理,许多农场通过安装高清摄像头获取农作物图像,使用传统视觉学习方法分析所得图像识别农作物病虫害可以解决人工识别效率低等缺点,也符合智慧农业需求导向。
4.但是,技术人员知识和经验水平参差不齐,导致识别准确率较低、不确定性过高,而且只能应对小规种植,在大规模种植的情况下存在效率低、实时性差和人力物力花费较大等缺点,另外,传统视觉学习方法仍存在准确率较低、缺乏鲁棒性和自适应能力差等缺点。为此,我们提供了基于改进yolox-s网络的农作物病虫害识别方法,用以解决上述中的技术问题。


技术实现要素:

5.针对以上问题,本发明提供了基于改进yolox-s网络的农作物病虫害识别方法,该方法实质是在yolox-s网络的基础上提出一种农作物病虫害识别方法,使用已有农作物病虫害图像数据进行训练和识别,解决了现有的农作物病虫害识别方法准确率较低、缺乏鲁棒性和自适应能力差的问题。
6.为解决上述技术问题,本发明是通过以下技术方案实现的:
7.本发明为基于改进yolox-s网络的农作物病虫害识别方法,包括如下步骤:
8.s1、采集农作物病虫害图像数据后对图像进行标注,获得农作物病虫害类别及位置信息的xml文件;
9.s2、将采集到的农作物病虫害图像数据划分为训练集、验证集和测试集,并对所述训练集进行数据增强;
10.s3、改进激活函数和多尺度检测,并增加轻量级注意力模块,完成改进后的yolo-s网络模型的搭建;
11.s4、设置模型训练参数并进行模型训练,最终得到一个能够对图像中的农作物病虫害进行识别与定位的最优网络;
12.s5、通过获得的最优网络对任意输入的图像中的农作物病虫害进行自动识别与定位,输出病虫害类型和坐标。
13.作为本发明的一种优选技术方案,所述步骤s2中农作物病虫害图像数据的划分方法具体为:将数据集按照8:1:1的比例划分为训练集﹑验证集和测试集。
14.作为本发明的一种优选技术方案,所述步骤s2中的数据增强方式具体为:
15.s21、采用多种变换方式对采集到的图像进行变换,将图像的灰度级放大到指定的程度,使图像能够显示更多的细节,提高图像的对比度,所述变换方式包括伽马变换和对数变换;
16.s22、对图像进行数据扩充,所述数据扩充的方式包括翻转、平移、旋转、缩放、添加噪声以及分离单个r、g、b三个颜色通道。
17.作为本发明的一种优选技术方案,所述步骤s3中激活函数的改进方式为:将yolox-s网络的激活函数由silu改为采用了交叉算子思想的elish;
18.多尺度检测的改进方式为:将预测端的decoupled head增加一个尺度,由3个尺度增加到4个尺度;
19.轻量级注意力模块的增加方式为:在csplayer上添加轻量级注意力模块。
20.作为本发明的一种优选技术方案,所述步骤s5中对农作物病虫害进行自动识别与定位的预测效果通过精确率p、召回率r和均值平均精度map进行评价,具体按照下式定义:
[0021][0022][0023][0024]
其中,tp表示正确检测的正样本,fp表示错误检测的负样本,fn表示错误检测的正样本,n为样本类别数,i表示类别编号;
[0025]
平均精度ap由p-r曲线与坐标轴围成的面积所得,具体按照下式定义:
[0026][0027]
作为本发明的一种优选技术方案,先将训练集输入至训练模型进行训练,再将验证集输入至由训练模型输出得到的验证模型,由验证模型的评估结果来判断训练模型是否符合预期要求;若符合预期要求则保存该训练模型作为最优模型,并将测试集输入至最优模型进行预测得到类别标签和位置信息;若不符合预期要求则调整训练模型的参数,再由验证模型的评估结果进行判断,形成反馈迭代,直至符合预期要求。
[0028]
作为本发明的一种优选技术方案,所述激活函数的改进方式中,所述silu为yolo-s的原本激活函数,为sigmoid函数的改进版本,所述silu函数可表示为:
[0029]
y(x)=x/(1+e-x
)
[0030]
其中,x为神经元的输出。所述elish激活函数采用交叉算子的思想,用于改善信息流和避免梯度的消失,其正半部分与silu具有相同性质,负半部分为sigmoid与elu函数(e
x-1)的乘积,所述elish激活函数可表示为:
[0031][0032]
其中,x为神经元的输出。
[0033]
作为本发明的一种优选技术方案,所述多尺度检测的改进方式中,原本用于检测
的所述decoupled head主要分为80
×
80
×
56、40
×
40
×
512和20
×
20
×
1024这3个尺度,增加的一个尺度大小为10
×
10
×
2048,通过增加该尺度加大对深层次网络的利用,以提高病虫害的识别效果。
[0034]
作为本发明的一种优选技术方案,所述在csplayer上添加轻量级注意力模块,通过对残差边施加注意力,进而对每个通道权重做调整,以此来削弱残差操作带来的噪声对网络训练的影响。
[0035]
作为本发明的一种优选技术方案,所述轻量级注意力模块的施加方式具体包括:
[0036]
a、x1借助全局均值池化avgpool操作压缩高维特征,随后通过全连接层fc以及δ激活函数对特征做f
x2
压缩操作,注意力权重f
x1
按照下式定义:
[0037]fx1
=δ(fc(avgpool(x1)))
[0038]
b、通过全连接层fc以及σ激活函数做扩展得到f
x2
,并将最终抽取的注意力权重f
x2
施加到x2上,所述x2和f
x2
按照下式定义:
[0039]fx2
=σ(fc(f
x1
))
[0040][0041]
c、input在叠加的残差块上进行特征提取操作得到x3,最后x2与x3通过拼接操作汇聚在一起。
[0042]
本发明具有以下有益效果:
[0043]
1、本发明能够解决技术人员知识和经验水平参差不齐,导致识别准确率较低、不确定性过高的问题,能够满足大规模种植环境下的病虫害识别和定位,同时解决了传统视觉学习方法存在的准确率较低、缺乏鲁棒性和自适应能力差的缺点。
[0044]
2、本发明通过将yolox-s的激活函数由silu改为采用了交叉算子思想的elish,可以更好的改善信息流,避免梯度的消失。
[0045]
3、本发明通过将预测端的decoupledhead增加一个尺度,由3个尺度增加为4个尺度,以此来对病虫害图片的区域化的细节进行更好的处理,通过增加一个尺度来加大对深层次网络的利用,从而提高病虫害类别的识别效果。
[0046]
4、本发明通过在csplayer上添加轻量级注意力模块,通过对残差边施加注意力,进而对每个通道权重做调整,以此来削弱残差操作带来的噪声对网络训练的影响。
[0047]
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
[0048]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0049]
图1为基于改进yolox-s网络的农作物病虫害识别方法的流程图。
[0050]
图2为本发明中4个尺度的特征检测图。
[0051]
图3为本发明中轻量级注意力的施加流程图。
具体实施方式
[0052]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0053]
请参阅图1-3,本发明为基于改进yolox-s网络的农作物病虫害识别方法,包括如下步骤:
[0054]
s1、采集农作物病虫害图像数据后对图像进行标注,获得农作物病虫害类别及位置信息的xml文件;
[0055]
s2、将采集到的农作物病虫害图像数据划分为训练集、验证集和测试集,并对所述训练集进行数据增强;
[0056]
s3、改进激活函数和多尺度检测,并增加轻量级注意力模块,完成改进后的yolo-s网络模型的搭建;
[0057]
s4、设置模型训练参数并进行模型训练,最终得到一个能够对图像中的农作物病虫害进行识别与定位的最优网络;
[0058]
s5、通过获得的最优网络对任意输入的图像中的农作物病虫害进行自动识别与定位,输出病虫害类型和坐标。
[0059]
进一步地,所述步骤s2中农作物病虫害图像数据的划分方法具体为:将数据集按照8:1:1的比例划分为训练集﹑验证集和测试集。
[0060]
进一步地,所述步骤s2中的数据增强方式具体为:对采集到的图像进行伽马变换、对数变换等方式将图像的灰度级放大到指定的程度,使图像能够显示更多的细节,提高图像的对比度;以及对图像采用翻转、平移、旋转、缩放,分离单个r、g、b三个颜色通道以及添加噪声等方式进行数据扩充。
[0061]
进一步地,所述步骤s3中激活函数的改进方式为:对yolox-s改进的部分包括:a、将yolox-s的激活函数由silu改为采用了交叉算子思想的elish;b、将预测端的decoupledhead增加一个尺度,即由3个尺度增加为4个尺度;c、在csplayer上添加轻量级注意力模块。
[0062]
进一步地,所述步骤s5具体为:采用精确率(p)、召回率(r)、均值平均精度(map)对模型的预测效果进行评价,其计算公式如下所示:
[0063][0064][0065]
式中,tp表示正确检测的正样本,fp表示错误检测的负样本,fn表示错误检测的正样本。
[0066][0067]
式中,n为样本类别数,i表示类别编号,平均精度ap由p-r曲线与坐标轴围成的面积所得,计算公式如下:
[0068][0069]
进一步地,先将训练集输入至训练模型进行训练,再将验证集输入至由训练模型输出得到的验证模型,由验证模型的评估结果来判断训练模型是否符合预期要求;若符合预期要求则保存该训练模型作为最优模型,并将测试集输入至最优模型进行预测得到类别标签和位置信息;若不符合预期要求则调整训练模型的参数,再由验证模型的评估结果进行判断,形成反馈迭代,直至符合预期要求。
[0070]
进一步地,所述激活函数的改进方式中,改进a所述silu为yolo-s的原本激活函数,为sigmoid函数的改进版本,具有无上界、有下界、平滑且非单调的特点,非单调性可以与其他的激活函数很好的区分,所述silu函数可表示为:
[0071]
y(x)=x/(1+e-x
)
[0072]
其中,x为神经元的输出。改进a所述elish激活函数采用交叉算子的思想,可更好地改善信息流,避免梯度的消失,其正半部分与silu具有相同性质,负半部分为sigmoid与elu函数(e
x-1)的乘积,所述elish激活函数可表示为:
[0073][0074]
其中,x为神经元的输出。elish分段混合激活函数将silu、elu和sigmoid函数组合在一起,其可以同时继承3个激活函数中的优点,对于深度神经网络dnn有更好的分类效果。
[0075]
对于卷积块cbs(conv2d batch normalization silu)卷积标准化加激活函数中,将silu激活函数替换为elish激活函数后,卷积块cbs也变为卷积块cbe(conv2d batch normalization elish)。
[0076]
进一步地,改进b所述的原本用于检测的decoupled head主要分为80
×
80
×
56、40
×
40
×
512和20
×
20
×
1024这3个尺度,增加的一个尺度大小为10
×
10
×
2048,通过增加该尺度来加大对深层次网络的利用,以提高病虫害的识别效果。4个尺度的特征检测如图2所示。
[0077]
此时在spp模块经csp网络处理后,再利用卷积块cbe进行卷积标准化加激活函数经csp网络,通过增加上采样、下采样与新特征层进行融合,从而得到80
×
80
×
56、40
×
40
×
512、20
×
20
×
1024和10
×
10
×
2048这4个尺度。
[0078]
进一步地,改进c所述的在csplayer上添加轻量级注意力模块,通过对残差边施加注意力,进而对每个通道权重做调整,以此来削弱残差操作带来的噪声对网络训练的影响。其原理是通过特征融合和残差变换在强化通道信息的同时弱化噪声影响。模块主要包含三个分支,x1首先借助全局均值池化(avgpool)操作压缩高维特征,随后通过全连接层(fully connectedlayers,fc)以及δ(relu)激活函数对特征做f
x2
压缩操作,注意力权重f
x1
按照下式定义:
[0079]fx1
=δ(fc(avgpool(x1)))
[0080]
完成后再通过全连接层(fc)以及σ(sigmoid)激活函数做扩展得到f
x2
,并将最终抽取的注意力权重f
x2
施加到x2上,过程如下式定义:
[0081]fx2
=σ(fc(f
x1
))
[0082][0083]
另外input在叠加的残差块上进行特征提取操作得到x3,最后x2与x3通过拼接操作汇聚在一起,轻量级注意力施加流程如图3所示。
[0084]
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0085]
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1