基于深度学习的无人机影像麦穗识别方法

文档序号：26753849发布日期：2021-09-25 03:20阅读：363来源：国知局

1.本发明涉及智慧农业和信息化农业领域，具体是一种基于深度学习的无人机影像麦穗识别方法。

背景技术：

2.小麦是全球重要的粮食作物，全球年度产量约为7.3亿吨，是世界粮食安全的基础。利用遥感手段监测小麦生长过程并预测产量成为优化生产管理，保障产量的重要手段。其中，麦穗作为小麦籽粒生长的器官，与最终产量密切相关，监测及分析小麦麦穗是评估预测小麦产量的重要内容。区别于卫星遥感和地面遥感的成本限制及观测尺度的局限，无人机具有低空云下飞行能力和高效作业等优势，通过搭载可见光、多光谱和热红外等相机，能简单、迅速、大范围地获取田间高空间分辨率影像，成功地实现规模麦穗监测。
3.基于无人机影像的麦穗监测主要是采用对象检测的方法获取影像中麦穗的数量与几何形态。现有检测方法主要分为两类：基于具体特征的方法和基于抽象特征的方法。基于具体特征的方法通过人工选取颜色、几何和纹理等特征，并采用贝叶斯、支持向量机和随机森林方法对特征进行分类，实现小麦的识别。这种方法特征设计复杂、迁移性弱，手工设计繁琐，无法较好地适用于田间小麦分布密集和遮挡严重的场景。随着计算机计算能力的进步及大量标记图像可用性的提升，计算机视觉领域中基于卷积神经网络的深度学习得到显著的发展。基于抽象特征的方法通过广泛的抽象特征实现小麦的识别和分割。这些抽象特征由卷积神经网络提取，无需人工干预，其检测性能也超越了传统方法。但无人机影像中麦穗尺寸较小，分布密集，遮挡严重且个体的形态差异较大，加剧了模型识别难度。这些问题导致目前从无人机影像中检测小尺寸麦穗的精度不高，达不到预测、评估产量的目的。
4.例如，公开号为cn109740721a的中国专利文献公开了一种麦穗计数方法及装置。该专利拍摄获取麦田环境下的图像，通过样本标签图像和对应的标签训练图像识别模型；将测试图像输入至图像识别模型输出标签，如果标签为麦穗图像，则基于非极大抑制算法确定图像的麦穗数量。
5.该方案存在缺陷：
6.(1)该方案基于地面平台拍摄麦穗田间影像，相比基于无人机平台拍摄的影像，麦穗尺寸较大，缺少针对小尺寸麦穗的检测方法，不能发挥无人机监测麦穗的优势。
7.(2)该方案对单张中麦穗数量较少的麦穗田间影像适用性较好，而在分布密集场景下的麦穗识别能力有待进一步提升。

技术实现要素：

8.本发明的目的是解决现有的无人机影像麦穗尺寸小、分布密集和遮挡导致的检测精度差、效率低等问题，提出一个基于深度学习的无人机影像麦穗识别方法。
9.为解决上述无人机麦穗识别所面临的问题，本发明的技术方案如下：
10.一种基于深度学习的无人机影像麦穗识别方法，通过将无人机测试影像输入至麦
穗识别模型识别出麦穗信息，所述识别模型的构建包括：
11.s1、数据采集步骤；
12.s2、数据处理步骤；
13.s3、构建适用于无人机影像麦穗识别网络，对所述无人机影像数据进行训练，得到麦穗识别模型；s3构建多尺度网络特征架构，通过输出多尺度检测层提取麦穗特征，基于交并比计算网络中检测层的置信度损失权重，从而增强网络对小尺寸麦穗的检测能力，实现多尺度无人机影像的麦穗检测。
14.所述s1数据采集步骤具体为：无人机在7米、10米和15米的高度拍摄获取小麦成熟期的无人机影像数据。
15.所述s2数据处理中具体包括：
16.s2
‑
1、图像旋转；
17.s2
‑
2、图像翻转；
18.s2
‑
3、亮度平衡；
19.s2
‑
4、采用目标检测标记工具labelimg对无人机影像内的所有麦穗进行注释生成麦穗边界框，得到注释文件；
20.s2
‑
5、将无人机影像和相应的注释文件组成数据集；
21.s2
‑
6、将数据集随机分为训练集与测试集，测试集不参与识别网络训练。
22.所述s3识别网络构建具体包括：
23.s3
‑
1、基于bottleneckcsp、panet、focus和spp等模块，构建初始yolov5网络，通过添加新的微尺度检测层，提取麦穗多尺度特征，构建4种尺度的检测层，输入训练集并输出相应的多尺度特征图；
24.s3
‑
2、每个尺度的特征图生成数量固定、尺寸不一的锚框，将锚框映射至输入影像后进行分类及边框回归，得到麦穗预测框；
25.s3
‑
3、根据麦穗预测框和麦穗边界框构建含置信度损失权重λ的损失函数loss；
26.s3
‑
4、基于交并比计算所述损失函数loss中每个检测层的置信度损失权重λ；
27.s3
‑
5、构建多个输入不同分辨率影像的麦穗识别网络，设置相应的网络参数进行训练，直至loss收敛，获得多个识别模型；
28.s3
‑
6、融合每个识别模型的麦穗预测框，构造融合框作为最终识别结果。
29.所述s3
‑
2中，通过麦穗边界框和锚框的距离量度计算和聚类锚框尺寸；对每个检测层设置3种锚框尺寸类别，共计15个锚框；麦穗边界框和锚框的距离量度用以下公式定义：
30.d(truth,bbox)＝1
‑
iou
gb
(truth,bbox)
31.其中，truth代表麦穗边界框，bbox代表锚框，iou
gb
表示锚框和麦穗边界框的交并比。
32.所述s3
‑
3中，损失函数loss使用定位损失、分类损失和置信度损失计算麦穗识别网络的误差，计算公式如下：
33.loss＝error
corrd
+error
cls
+λerror
confi
34.式中，定位损失函数error
corrd
计算麦穗预测框的定位误差；置信度损失error
confi
计算麦穗预测框的位置误差；分类损失error
cls
计算检测麦穗预测框的类别误差，λ表示置
信度损失权重。
35.所述s3
‑
4中，统计每个检测层中与麦穗边界框交并比最大的麦穗预测框数量，从而计算得到该检测层的置信度损失权重λ：
[0036][0037]
式中，代表检测层中具有最大交并比iou
pt
的麦穗预测框数量与麦穗预测框总数量的比值；n为4，代表网络的检测层数目；α为设置的常数0.1。
[0038]
具体的，麦穗边界框和麦穗预测框的交并比iou
pt
计算公式为：
[0039][0040]
式中，predicted代表麦穗预测框，truth代表麦穗边界框。
[0041]
所述s3
‑
5中，将影像重采样为150
×
150、300
×
300、450
×
450和600
×
600四组分辨率影像，分别输入麦穗识别网络进行训练，得到相应的麦穗识别模型，并输出不同识别模型的麦穗检测结果；针对输入图像的分辨率设置相应的初始学习率和批处理值；采用随机梯度下降sgd方法优化训练过程中的学习率，权重衰减值设置为1e
‑
4，动量设置为0.9，不同影像分辨率的初始批处理值、学习率设置如下表：
[0042]
表1识别网络超参数设置
[0043][0044]
所述s3
‑
6中，融合每个识别模型的麦穗预测框并输出最终识别结果，包括以下步骤：
[0045]
i测试图像输入多个麦穗识别模型，每个模型检测并输出包含边框坐标及置信度的麦穗预测框；
[0046]
ii选择负责同一个麦穗边界框的所有预测麦穗框，将预测麦穗框的置信度c
i
作为权重，计算预测麦穗框顶点坐标(xa
i
,ya
i
)，(xb
i
,yb
i
)的加权平均值，得到融合框的顶点坐标(xa,ya)，(xb,yb)；计算所有预测麦穗框置信度c
i
的平均值作为融合框的置信度c；
[0047]
构建融合框并计算该融合框的坐标和置信度，计算公式为：
[0048][0049][0050][0051]
式中，(xa,ya),(xb,yb,c)分别为融合框的左上角顶点、右下角顶点坐标；(xa
i
,ya
i
),(xb
i
,yb
i
)为参与计算的预测麦穗框左上角顶点、右下角顶点坐标，c
i
为相应的置信度；n为参与计算的麦穗边界框数量；
[0052]
iii使用融合框作为使用识别方法检测麦穗的最终结果。
[0053]
本发明的有益效果
[0054]
现有的技术方案受田间环境、麦穗形态和遮挡的影响，对无人机影像中小尺寸麦穗的识别精度较低，且对麦穗密集分布场景的适用性较差。受此影响，无人机影像麦穗的识应用较少，难以拓展。而本发明提出的方案具有检测小尺寸密集麦穗影像的优点，很好解决了麦穗识别的技术困境，为无人机影像中小尺寸麦穗的识别应用提供技术参考。
[0055]
本技术首先通过数据处理，筛选高质量影像和增加训练样本，提高卷积神经网络的泛化能力；其次，通过添加微尺度检测层，采用k均值聚类设置先验锚框和基于交并比改进检测层置信度损失，增强了网络对小尺寸麦穗的特征提取能力，提高小尺寸麦穗的识别精度；最后，通过训练多分辨率影像并基于置信度权重融合不同麦穗识别模型的检测框，提高了麦穗处在遮挡条件下的识别精度。
附图说明
[0056]
图1为本技术的技术框图
[0057]
图2为图像处理实例示意图
[0058]
图3为图像增强实例示意图
[0059]
图4为网络构建步骤中检测网络结构图
[0060]
图5为基于置信度权重的检测框融合示意图
具体实施方式
[0061]
下面结合实施例对本发明作进一步说明，但本发明的保护范围不限于此：
[0062]
本发明构建了一种基于深度学习的无人机影像麦穗识别方法，技术方案如图1所示。主要包括数据采集、数据处理、无人机影像麦穗识别网络构建及训练、麦穗检测框生成及融合，具体步骤为：
[0063]
s1.数据采集
[0064]
s11、实施例中采用大疆经纬m210无人机搭载zenmuse x4s相机，分别于7米、10米和15米高度拍摄获取小麦成熟期的无人机影像数据集，影像分辨率为5472
×
3648像素。为减少数据处理时间、突出小麦特征和避免损失图像信息，图像被分割为150
×
150分辨率的图片(如图2中a部分)。
[0065]
s2.数据处理
[0066]
s21、由于机拍摄麦穗影像的过程中会受不稳定因素的影响，部分影像较为模糊，严重影响人工标注的精度(如图2中b部分)。本发明通过拉普拉斯变换去除模糊影像，增强数据的质量。
[0067]
s22、本发明选择图像旋转、图像翻转、亮度平衡作为数据增强方法(如图3)。通过数据增强后，然后将样本图像照8：2的比例分为训练集和测试集。图3中，(a)部分为原图，(b)部分进行了旋转90
°
操作，(c)部分进行了旋转180
°
操作，(d)部分进行了旋转270
°
操作，(e)部分进行了垂直翻转，(f)部分进行了水平翻转，(g)和(h)部分进行了亮度平衡。
[0068]
s23、本发明采用目标检测标记工具labelimg对无人机影像内的所有麦穗进行人工注释，生成麦穗边界框(如图2中c部分)，得到注释文件。
[0069]
s3.无人机影像麦穗识别网络构建及训练
[0070]
yolov5深度学习网络框架于2020年被提出并成功应用于多个领域的目标识别任务。本发明在初始yolov5结构的基础上进行创新，通过构建无人机影像麦穗识别网络，从而适合于具有分布密集、麦穗尺寸小等特征的无人机影像麦穗识别任务。这里优选地，所述无人机影像麦穗识别网络按如下步骤构建，然后训练得到无人机影像麦穗识别模型。
[0071]
s31、初始yolov5网络建立
[0072]
s32、本发明在初始yolov5网络基础上，结合csp瓶颈层模块和卷积模块，添加微尺度检测层以提取小尺寸麦穗特征。通过构建4种尺度的检测层，输入训练集并输出相应的多尺度特征图，生成尺度覆盖范围更广、更细致的检测网络结构(图4)，从而更加精确地检测小尺寸麦穗；
[0073]
s33、每个尺度的特征图都会生成数量固定、具有先验尺寸的锚框，将锚框映射至输入影像后进行分类及边框回归，得到麦穗预测框；本发明基于k均值聚类算法设置锚框尺寸，加快网络的检测精度和训练速度，具体设置步骤如下：
[0074]
使用k均值聚类算法，以人工标注的麦穗边界框和锚框的距离量度聚类锚框尺寸；对每个检测层设置5种锚框尺寸，共计20个锚框；麦穗边界框和锚框的距离量度用以下公式定义：
[0075]
d(truth,bbox)＝1
‑
iou
gb
(truth,bbox)
[0076]
其中，truth代表麦穗边界框，bbox代表锚框，iou
gb
表示锚框和麦穗边界框的交并比。
[0077]
s34、本发明使用定位损失、分类损失和置信度损失评价无人机影像麦穗识别网络的误差loss，并基于交并比改进检测层置信度损失error
confi
；
[0078]
其中，网络误差loss用以下公式表示：
[0079]
loss＝error
corrd
+error
cls
+λerror
confi
[0080]
式中，定位损失error
corrd
计算麦穗预测框的定位误差，包括边界框的坐标误差和宽高误差；置信度损失error
confi
计算麦穗预测框的位置误差；分类损失error
cls
计算检测麦穗预测框的类别误差，λ表示置信度损失权重。本发明提出基于交并比的检测层置信度损失权重。对于每个检测层，统计检测到的正样本数量和与麦穗真实框交并比最大的正样本数量，计算两者的比值得到检测层的置信度损失权重λ。损失函数loss中的置信度损失权重λ
通过下式获取：
[0081][0082]
式中，代表检测层中具有最大交并比iou
pt
的麦穗预测框数量与麦穗预测框总数量的比值；n为4，代表网络的检测层数目；α为设置的常数0.1。
[0083]
交并比计算公式如下所示：
[0084][0085]
式中，predicted代表麦穗预测框，truth代表麦穗边界框。
[0086]
s35、本发明将训练集影像重采样为150
×
150、300
×
300、450
×
450和600
×
600分辨率，分别输入麦穗识别网络进行训练，直至loss收敛，得到相应的麦穗识别模型。针对分辨率设置相应的初始学习率和批处理值；采用随机梯度下降sgd方法优化训练过程中的学习率，权重衰减值设置为1e
‑
4，动量设置为0.9，不同影像分辨率的初始批处理值、学习率设置如下表：
[0087]
表1识别网络超参数设置
[0088][0089]
s4.麦穗检测框生成及融合
[0090]
s41、本发明将麦穗测试影像输入至训练好的麦穗识别模型，每个模型输出麦穗的位置、类别和置信度，以图片和文本的形式可视化和存储每个网络的检测结果。
[0091]
s42、本发明使用麦穗检测框的置信度构造融合框作为识别的结果，其融合示意图如图5所示。选择负责同一个麦穗边界框的所有检测框，基于检测框的置信度权重构建融合框，作为麦穗识别的结果。
[0092]
其中，融合框的构建包括以下步骤：
[0093]
i测试图像输入多个麦穗识别模型，每个模型检测并输出包含边框坐标及置信度的麦穗预测框；
[0094]
ii选择负责同一个麦穗边界框的所有麦穗检测框，将麦穗检测框的置信度c
i
作为权重，计算麦穗检测框顶点坐标(xa
i
,ya
i
)，(xb
i
,yb
i
)的加权平均值，得到融合框的顶点坐标(xa,ya)，(xb,yb)；计算所有麦穗检测框置信度c
i
的平均值作为融合框的置信度c，计算
公式如下：
[0095][0096][0097][0098]
式中，(xa,ya),(xb,yb)分别为融合框的左上角顶点、右下角顶点坐标；c为融合框的置信度。(xa
i
,ya
i
),(xb
i
,yb
i
)为参与计算的麦穗检测框左上角顶点、右下角顶点坐标，c
i
为相应的置信度；n为参与计算的麦穗边界框数量；
[0099]
iii使用融合框作为使用识别方法检测麦穗的最终结果。
[0100]
本文中所描述的具体实施例仅仅是对本发明精神做举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张小虎;赵健清;张羽;严佳炜;邱小雷;姚霞;田永超;朱艳;曹卫星
技术所有人：南京农业大学
我是此专利的发明人

上一篇：航空飞机起落架异形构件多自由度抓取传送装置的制作方法
上一篇：双伺服控制的高速卧式开箱方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。