一种果树病虫害图像识别方法

文档序号：30657680发布日期：2022-07-06 01:12阅读：360来源：国知局

1.本发明涉及农业种植技术领域，更具体地说，它涉及一种果树病虫害图像识别方法。

背景技术：

2.柑橘的病虫害可分为侵染性和非侵染性病害，以及虫害三种类型，尤以黄龙病、潜叶蛾、线虫病等对柑橘种植的影响最为巨大，严重时，其可导致整个柑橘片区的绝收。因此，对柑橘病虫害的快速、准确的识别诊断，为后期的治疗提供依据，成为了当前柑橘种植产业需要迫切解决的课题。目前，柑橘病虫害的识别诊断方法主要有目测诊断法和病理特性检测法两种。目测诊断法依靠种植户或者农业技术人员的现场目测并做出诊断，这极大地依赖于他们的专业技术水平与经验，主观的差异性，导致了柑橘病虫害目测诊断的准确率波动较大，稳定性不高。病理特性检测法是植物病虫害定量分析的一种方法，它通过使用生物、物理、化学等检测手段对病虫害样本的进行检测分析，并以此给出结论。此类方法对柑橘病虫害识别的准确率较高，但由于检测需要相关的检测设备和专业技术人员才能完成，因此检测时间长，难以大范围推广。

技术实现要素：

3.本发明要解决的技术问题是针对现有技术的上述不足，本发明的目的是提供一种可以提高准确率、缩短检测时间的果树病虫害图像识别方法。
4.本发明的技术方案是：一种果树病虫害图像识别方法，包括：
5.获取病虫害图像样本，并做好标记；
6.使用图像增强方法对所述病虫害图像样本进行增强处理得到增强数据集；
7.使用imagenet数据集对vgg19模型预训练得到预训练权重参数；
8.通过保留vgg19模型的前4个卷积层和池化层，并使用1个的批标准化卷积层和2个inception模块替换vgg19的第5卷积层，使用1个全局池化层替换vgg19模型的全连接层，最后使用一个1
×
4的softmax层构建得到vgg19-inc 模型；
9.使用所述增强数据集训练所述vgg19-inc模型；
10.将训练好的vgg19-inc模型应用于未知病虫害图像的分类预测，最终得到病虫害图像识别的结果。
11.作为进一步地改进，所述病虫害图像样本包括病虫害样本以及健康样本；在进行增强处理之前，通过滤波方法或均衡化方法对所述病虫害图像样本进行预处理。
12.进一步地，增强处理包括水平翻转、垂直翻转、随机水平平移、随机垂直平移中的任意一种；各所述病虫害图像样本进行增强处理后得到的数量不少于 1000。
13.进一步地，所述vgg19-inc模型包括：
14.预训练模块，用于根据vgg19的预训练权重参数提取图像的轮廓特征、纹理特征；
15.高维特征提取模块，用于通过inception模块的多特征融合特性，实现对病虫害
的高维特征融合；
16.特征矩阵降维和分类模块，用于实现减少计算参数和分类的作用。
17.进一步地，所述vgg19-inc模型在所述vgg19的骨干网络和inception模块之间加入所述批标准化卷积层，并在所述批标准化卷积层中使用swish激活函数代替relu激活函数。
18.进一步地，在所述vgg19-inc模型中，图像高维特征的提取由inception 模块实现，inception模块采用了1
×
1、3
×
3两种不同的卷积核进行堆叠，通过并行执行多个卷积运算，最后将各个卷积运算输出结果连接为一个高维的特征图。
19.进一步地，所述vgg19-inc模型使用全局池化层替换vgg19模型的全连接层，对整张特征图的所有值求平均，将卷积层的每个特征图的所有值融合为一个特征值，并使特征值的维度和最后分类数相同，形成与分类数相同数量的列向量，实现了对特征矩阵的降维。
20.进一步地，设特征图大小为m
×
n，第k张特征图的值用表示，经过全局平均池化操作后，该特征图对应的输出特征值为y
(k)
：
[0021][0022]
进一步地，对所述vgg19-inc模型进行不少于100轮次的训练，在训练过程中，使用随机梯度下降优化算法，随机梯度下降优化算法中的动量因子设置为0.8，学习率为0.0001，学习速率的衰减系数为1e-6，batch size设置为24。
[0023]
进一步地，所述vgg19-inc模型使用准确率accuracy、精确率prencision、召回率recall、f1得分f1 score来评价模型指标，如公式(2)、(3)、(4)、(5) 所示：
[0024]
accuracy＝(tp+tn)/(tp+tn+fp+fn)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0025]
prencision＝tp/(tp+fp)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0026]
recall＝tp/(tp+fn)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0027]
f1＝2*precision*recall/(precision+recall)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0028]
式中，tp：真实值为正且预测也为正的样本数量；fp：真实值为负但预测为正的样本数量；fn：真实值为正但预测为负的样本数量；tn：真实值为负且预测也为负的样本数量。
[0029]
有益效果
[0030]
本发明与现有技术相比，具有的优点为：
[0031]
本发明的vgg19-inc模型以vgg19网络模型为骨干网络并利用迁移学习实现预训练权重参数的共享；模型结构使用1个的批标准化卷积层和2个 inception模块替换vgg19的第5卷积层；使用1个全局池化层替换vgg19模型的全连接层，最后使用一个1
×
4的softmax层作为分类输出层。所提模型，不仅保留了vgg19对图像特征的有效提取，还利用inception模块增加了网络的深度与宽度，使模型获得了不同大小的感受野，实现了多尺度特征的融合；此外，全局池化层对全连接层的替换，使得参数减少率达到了70.56％，有效地提高了模型的训练速度与平均测试速度，降低参数负载。本方法能根据靠近神经网络顶层的专业化特征调整卷积模块，更具有灵活性，和针对性，分类效果更好，使得新模型
具有较高的识别精度，具备较强的泛化能力。
附图说明
[0032]
图1为本发明的流程图；
[0033]
图2为vgg19模型测试分类混淆矩阵；
[0034]
图3为resnet50模型测试分类混淆矩阵；
[0035]
图4为inceptionv3模型测试分类混淆矩阵；
[0036]
图5为densenet201模型测试分类混淆矩阵；
[0037]
图6为vgg19-inc模型测试分类混淆矩阵。
具体实施方式
[0038]
下面结合附图中的具体实施例对本发明做进一步的说明。
[0039]
vgg19是由牛津大学和谷歌公司的研究人员开发的一种经典卷积神经网络。它采用级联网络结构，由16个卷积层和3全连接层组成；每个卷积层使用3
×
3 卷积核，在卷积层之间有共5个最大池化层；网络的最后一层是softmax分类器。由于vgg19模型使用固定的3
×
3卷积核，使得其感受野固定，容易忽略某些细微特征，继而造成对细粒度特征提取的不足。因此，在利用该模型对相似度较高的柑橘黄龙病早期、线虫病害图像、健康叶片进行识别分类时，识别率较低。此外，vgg19模型使用了3个全连接层，参数量达到了143mb，使得其对计算资源的需求较大，模型训练慢，不利于部署在移动端。
[0040]
参阅图1-6，一种果树病虫害图像识别方法，其特征在于，包括：
[0041]
获取病虫害图像样本，并做好标记；
[0042]
使用图像增强方法对病虫害图像样本进行增强处理得到增强数据集；
[0043]
使用imagenet数据集对vgg19模型预训练得到预训练权重参数；
[0044]
通过保留vgg19模型的前4个卷积层和池化层，并使用1个的批标准化卷积层和2个inception模块替换vgg19的第5卷积层，使用1个全局池化层替换vgg19模型的全连接层，最后使用一个1
×
4的softmax层构建得到vgg19-inc 模型，vgg19-inc模型为泛化能力更强和识别精度高的病虫害图像识别模型；
[0045]
使用增强数据集训练vgg19-inc模型；
[0046]
将训练好的vgg19-inc模型应用于未知病虫害图像的分类预测，最终得到病虫害图像识别的结果。
[0047]
在本实施例中，病虫害图像样本包括病虫害样本以及健康样本，如桃子斑点病、柑橘黄龙病、番茄黄曲叶病、南瓜白粉病、苹果健康叶片图像；在进行增强处理之前，通过滤波方法或均衡化方法对病虫害图像样本进行预处理。
[0048]
增强处理包括水平翻转、垂直翻转、随机水平平移、随机垂直平移中的任意一种；各病虫害图像样本进行增强处理后得到的数量不少于1000。
[0049]
vgg19-inc模型包括：
[0050]
预训练模块，用于根据vgg19的预训练权重参数提取图像的轮廓特征、纹理特征；
[0051]
高维特征提取模块，用于通过inception模块的多特征融合特性，实现对病虫害的高维特征融合；
[0052]
特征矩阵降维和分类模块，用于实现减少计算参数和分类的作用。
[0053]
vgg19-inc模型在vgg19的骨干网络和inception模块之间加入批标准化卷积层，并在批标准化卷积层中使用swish激活函数代替relu激活函数，可以加快模型的收敛速度，提高模型识别精度，减小过拟合。
[0054]
在vgg19-inc模型中，图像高维特征的提取由inception模块实现， inception模块采用了1
×
1、3
×
3两种不同的卷积核进行堆叠，通过并行执行多个卷积运算，最后将各个卷积运算输出结果连接为一个高维的特征图。可以获得更好的图像表征，与vgg19采用的3
×
3相卷积层比，inception模块增加了网络的深度与宽度，提高了网络对尺度的适应性，因此获得了不同大小的感受野。
[0055]
vgg19-inc模型使用全局池化层替换vgg19模型的全连接层，对整张特征图的所有值求平均，将卷积层的每个特征图(大小为m
×
n)的所有值融合为一个特征值，并使特征值的维度和最后分类数相同，形成与分类数相同数量的列向量，如本次分类数为4，则形成4个列向量，实现了对特征矩阵的降维，在保证分类效果的同时，减少了计算参数量。
[0056]
设特征图大小为m
×
n，第k张特征图的值用表示，经过全局平均池化操作后，该特征图对应的输出特征值为y
(k)
：
[0057][0058]
对vgg19-inc模型进行不少于100轮次的训练，在训练过程中，增强数据集按8:2的比例划分训练集和测试集，使用随机梯度下降优化算法，随机梯度下降优化算法中的动量因子设置为0.8，学习率为0.0001，学习速率的衰减系数为1e-6，batch size设置为24。
[0059]
vgg19-inc模型使用准确率accuracy、精确率prencision、召回率recall、 f1得分f1 score来评价模型指标，如公式(2)、(3)、(4)、(5)所示：
[0060]
accuracy＝(tp+tn)/(tp+tn+fp+fn)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0061]
prencision＝tp/(tp+fp)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0062]
recall＝tp/(tp+fn)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0063]
f1＝2*precision*recall/(precision+recall)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0064]
式中，tp：真实值为正且预测也为正的样本数量；fp：真实值为负但预测为正的样本数量；fn：真实值为正但预测为负的样本数量；tn：真实值为负且预测也为负的样本数量。
[0065]
在本实施例中，在plantvillage公共数据集提供了16种类植物共27类病害叶片和11类健康叶片的图像。由于该数据集分布不平衡，本研究通过使用数据增强的方法，使得每种类型图片数量均为1000张，总共34200张图片，并按 8:2的比例划分训练集和测试集。实验验证时，选取其中的桃子斑点病、柑橘黄龙病、番茄黄曲叶病、南瓜白粉病、苹果健康叶片图像等5种类型各1000张的图像作为训练与测试数据。
[0066]
在plantvillage数据集数据充足条件下，经过70轮次训练后，各模型的训练和验证准确率曲线震荡变小并趋于平缓，说明迁移学习的方法可加速各模型训练的过程。在经过100轮次的训练后，vgg19-inc模型的在训练集和验证集上，准确率分别为97.97％和94.03％，损失值分别为0.0179和0.188。
[0067]
使用vgg19-inc模型对桃子斑点病、柑橘黄龙病、番茄黄曲叶病、南瓜白粉病、苹果健康叶片图像5种类型图片各100张测试的评价结果如表 1所示。
[0068]
表1 vgg19-inc模型检测结果评价指标
[0069][0070]
由表1可知vgg19-inc模型对5种类型植物病虫害的图像识别的准确率的平均值为98.00％、精确率的平均值95.10％、召回率的平均值为 95.00％、f1得分平均值为95.00％。5种类型图像的评价指标都比较均匀，模型表现良好。
[0071]
本实施例中的柑橘(沙田柚)病虫害数据集来源于广西壮族自治区玉林市农业科学研究所，病虫害图像采集自广西玉林市容县千秋村沙田柚种植基地，包含了黄龙病、潜叶蛾、线虫、健康等3种柑橘常见病虫害和健康叶片样本。在光线充足条件下，使用尼康3100数码相机拍摄，像素大小为2992
×
2000。随机选取其中的500张作为实验数据集；按8:2 的比例划分为训练集与测试集，然后分别用1、2、3、4对应健康、黄龙病、潜叶蛾、线虫4种类别进行了标注。
[0072]
在柑橘病虫害数据集规模较小、病害图像较为相似的条件下，经过 100轮次训练，vgg19-inc模型取得较高的准确率和较低的损失值；在训练集和验证集上，准确率分别为99.05％和98.47％。在训练集上比vgg19、resnet50、inceptionv3、densenet201模型分别高22.26％、14.47％、5.18％和0.24％。在验集上分别高22.36％、7.92％、10.84％、0.55％。，同时 vgg19-inc模型损失函数值为0.0415，比其他模型分别低1.1085、0.2172、 0.3987、0.0654。
[0073]
表2 100轮次后各个模型性能及检测结果
[0074][0075]
此外，通过表2可以看出，在这5种模型中，vgg19模型的参数数量和权重占用空间最大，平均测试时间最长，平均准确率为77.91％。densenet201模型参数和权重占用空间最小，平均准确率为81.38％，平均测试时间为0.32/s，可以取得空间和平均准确率的平衡。vgg19-inc模型平均准确率最高，为95.25％，分类性能最好。这是由于vgg19-inc使用全局平均池化层代替了vgg19的全连接层，比vgg19模型中的1.42
×
108个权重参数减少到了4.18
×
107个，参数减少率达到了70.56％，有效地提高了模型的训练速度与平均测试速度，同时把模型的权重减小为163mb，有利于模型在移动端的部署。
[0076]
图2-图6为各模型的分类试验的混洗矩阵，为了测试模型的泛化能力，本研究把vgg19-inc模型与在训练集和验证集表现较好的densenet201模型作了对比，这两种模型的准确率、精确率、召回率、f1得分如表3所示。
[0077]
表3 vgg19-inc、densenet201模型检测结果评价指标
[0078][0079]
由图2-图6和表3可以看出densenet201模型精确率在45.10％～100％之间，平均值为75.18％；f1得分在56.64％～67.54％之间，平均值为63.21％；准确率在69.75～86.75％之间，平均值为81.38％；召回率在49.00％～97.00％之间，平均值为62.75％。各项评价指标分布不均匀，差值较大，平均值偏低。
[0080]
vgg19-inc模型的精确率在83.62％～95.34％之间，平均值为90.98％；f1得分在88.17％～93.65％之间，平均值为90.45％；准确率在94.50％～96.75％之间，平均值为95.25％；召回率在82.00％～97.00％之间，平均值为90.5％。各项评价指标分布均匀，平
均值均在90％以上，说明经过结构改进的模型优于densenet201 模型，并具备良好的分类性能。
[0081]
本文使用带有swish激活函数的bn层来提高模型的训练精度，经过100轮训练后使用swish激活函数的模型比使用relu激活函数的训练精度提高0.85％，验证精度提高0.55％，训练损失降低0.0196，如表4所示。
[0082]
表4以swish和relu为激活函数的模型精度和损失率
[0083][0084]
本发明利用改进型的vgg19-inc模型和多种深度卷积神经网络模型对柑橘病虫害图像进行分类识别试验，通过对比分析，得到如下结论：
[0085]
(1)深度卷积神经网络可以较好的自动提取柑橘病虫害特征，无需人工对柑橘病虫害图像特征进行分割，分类性能总体上良好。
[0086]
(2)迁移学习可以充分利用在大型数据集上学习的知识，加快模型的训练速度，节省训练时间，提高训练精度，解决由于数据集规模过小导致模型分类效果差的问题。
[0087]
(3)对于柑橘病害图像细粒度分类任务，通过对传统模型的调整和组合，设计的vgg19-inc模型平均准确率达95.25％，优于incept ion v3、 vgg19、resnet50、densenet201等模型。同时新模型减少了权重参数数量，使的权重空间占用变小，提高模型训练速度和减少了单幅图像平均检测时间，说明通过组合不同卷积神经网络模型可以进一步优化特征提取方法，提高特征提取能力和模型泛化能力，以应对不同场景的图像识别要求。
[0088]
以上仅是本发明的优选实施方式，应当指出对于本领域的技术人员来说，在不脱离本发明结构的前提下，还可以作出若干变形和改进，这些都不会影响本发明实施的效果和专利的实用性。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：闭吕庆黄平
技术所有人：玉林师范学院
我是此专利的发明人

上一篇：一种新型铝材液压锯床的制作方法
上一篇：一种线性压阻式触觉传感器及其制备方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。