一种基于深度学习的蚊虫种类识别方法和系统

文档序号:29958731发布日期:2022-05-11 08:35阅读:436来源:国知局
一种基于深度学习的蚊虫种类识别方法和系统

1.本发明涉及一种基于深度学习的蚊虫种类识别方法、系统和介质,属于图像识别技术领域,特别涉及存在昆虫等小型生物的图像识别。


背景技术:

2.蚊虫隶属昆虫纲双翅目蚊科,其传播的疾病每年在全球造成上亿人感染以及近百万人死亡。因此,蚊虫被称为头号“动物杀手”,是最重要的医学昆虫类群之一。不同蚊虫种类的孳生地、栖性等生物学习性不同,所传播的疾病也有所不同。如按蚊是疟疾的主要传播媒介,库蚊是西尼罗病毒病、流行性乙型脑炎、淋巴丝虫病等疾病的主要传播媒介,伊蚊为登革热、寨卡病毒病、基孔肯雅热等疾病的主要传播媒介。由于目前大多数蚊媒病没有疫苗或特效药,监测控制媒介蚊虫依然是预防和控制蚊媒病流行的根本措施。蚊虫种类识别是进行有效防控的必要前提和基础,只有准确鉴别出蚊虫的种类,了解其孳生特点和行为习性,才能制定出正确的防控策略,采取针对性措施对其进行快速防控。
3.蚊虫的种类识别目前主要依托的是形态特征分类。蚊虫形态分类学历经上百年的发展,已形成了完整的技术体系,然而,形态学分类主要通过其外部特征进行鉴定,耗时费力,易受到遗传可变性和表型可塑性等因素的影响。而且分类学家往往需要几年的专业训练才能进行准确分类鉴定。即便是经验丰富的分类学家,在针对外部形态差异细微的蚊虫复合组时,也难以通过外部形态进行鉴定,以尖音库蚊复合组为例,需要解剖雄性外生殖器明确其阳茎侧板中叶形态特征才能对复合组内的亚种进行准确识别。加之雄蚊野外采集困难、标本制作耗时较长,致使传统的形态学分类方法已远远不能满足目前的蚊虫种类识别需求。
4.深度学习技术作为机器学习研究方向上的一个新的领域,目的在于用计算机建立出能够进行对人脑学习与分析问题的模拟与实现的神经网络,其功能可以使计算机能够自主学习模型的特征信息,并实现计算机对图像、文字、音频等的分析与学习,使之满足计算机对人脑认识问题的模拟的需要,并且在某些情况下,深度学习的识别精度会远远高于人类识别精度,因此,深度学习技术被大量广泛的应用到人工智能领域中。
5.使用深度学习技术对蚊虫种类进行识别,与以往的分类手段相比有很大的优势:(1)识别简便,只需一张清晰的成蚊图片;(2)快速准确,比原有人工识别快数倍以上;(3)全自动化,无需花长时间培养专业分类鉴定人员,可为缺乏相关知识背景的非专业人员提供一个高效自动化的蚊虫种类识别工具。现有技术中输入深度学习网络中的图像通常为自然环境中包括蚊虫的图像,此种图像中并不一定会包含所有种类的蚊虫,且同一自然环境中蚊虫很有可能是同一或相近种类的蚊虫,所有根据此种图像训练出的模型只能用于从昆虫中识别出蚊虫,而不能用于对蚊虫的准确分类。其使用的形态特征库精度不够、专业性不强、算法受到图像库制约等因素,无法作为蚊虫种类识别的专业工具,因此无法在医学昆虫专业领域应用。


技术实现要素:

6.针对上述问题,本发明的目的是提供一种基于深度学习的蚊虫种类识别方法、系统和介质,以解决当前深度学习模型存在识别效果的预测准确率低的问题,实现对蚊虫种类的快速识别。
7.为实现上述目的,本发明提出了以下技术方案:一种基于深度学习的蚊虫种类识别方法,包括:对不同种类的蚊虫进行拍摄,根据蚊虫种类将获得的图像分为若干类,并进行标记;将经过标记的不同种类图像分为训练集、验证集和测试集,将训练集中图像输入神经网络模型进行训练,经过训练获得最优神经网络模型;将验证集中图像输入最优神经网络模型中,并将最优神经网络模型的输出结果与人工标记的蚊虫种类进行对比,若二者相同则输出结果正确,若输出结果的正确率大于阈值则模型验证通过,否则重新对神经网络模型进行训练;将测试集中图像输入经过验证的最优神经网络模型中,对其输出的蚊虫种类和其位置进行统计,获得最优神经网络模型的最终正确率;将待测蚊虫图像输入经过测试的最优神经网络模型,获得蚊虫分类结果和其位置。
8.进一步,蚊虫种类包括:中华按蚊、埃及伊蚊、白蚊伊蚊、凶小库蚊、同属于尖音库蚊复合组的致倦库蚊、骚扰库蚊和淡色库蚊。
9.进一步,标记的方法为:将不同种类的图像设置成相同的大小,对不同种类的图像进行分别标记,得到其确定的位置信息与种类信息,并对不同种类的图像进行随机的图片旋转与翻转,增加噪声进行数据增强。
10.进一步,神经网络模型依次包括:四个卷积池化模块和四个全连接层,四个全连接层中第三个全连接层和第四个全连接层并联。
11.进一步,卷积池化模块依次包括:第一卷积层、第二卷积层和第一池化层。
12.进一步,神经网络模型输出蚊虫的种类信息、预测框位置和预测框大小,预测框位置和预测框大小通过下式获得:
13.x=σ(x1)+c
x
14.y=σ(y1)+cy15.w=w1·etw
16.h=h1·eth
17.其中,x为输出的预测框左上角横坐标;y为输出的预测框左上角纵坐标;w为输出的位置预测框宽度;h为输出的位置预测框高度;σ为sigmoid函数,x1和y1分别为预测框的横坐标和纵坐标的偏移值;(c
x
,cy)为特征图中网格单元的左上角坐标;tw和th分别为输出的预测框横坐标和纵坐标的尺度缩放信息;w1为预测的位置框宽度;h1为预测的位置框高度。
18.进一步,输出结果的正确率通过预测框与人工标记的真实框的交并比iou表征,其公式为:
[0019][0020]
其中,ao为预测框与真实框的交集;au为预测框与真实框的并集。
[0021]
进一步,模型验证通过的标准为:将最优卷积神经网络输出的位置信息与人工标记的蚊虫位置信息进行比较,若二者相同则输出结果正确,如果正确率高于第一阈值则认为此位置信息为有效位置信息;统计最优卷积神经网络中验证集中蚊虫种类信息的平均概
率和蚊虫对应的位置信息,将其与人工标记的结果进行比较,若正确率高于第二阈值则认为模型验证通过
[0022]
本发明还公开了一种基于深度学习的蚊虫种类识别系统,包括:图像获得模块,用于对不同类型的蚊虫进行拍摄,根据蚊虫种类将获得的图像分为若干类,并进行标记;模型训练模块,用于将经过标记的不同种类图像分为训练集、验证集和测试集,将训练集中图像输入神经网络模型进行训练,经过训练获得最优神经网络模型;模型验证模块,用于将验证集中图像输入最优神经网络模型中,并将最优神经网络模型的输出结果与人工标记的蚊虫种类进行对比,若二者相同则输出结果正确,若输出结果的正确率大于阈值则模型验证通过,否则重新对神经网络模型进行训练;模型测试模块,用于将测试集中图像输入经过验证的最优神经网络模型中,对其输出的蚊虫种类和其位置进行统计,获得最优神经网络模型的最终正确率;模型输出模块,用于将待测蚊虫图像输入经过测试的最优神经网络模型,获得蚊虫分类结果和其位置。
[0023]
本发明还公开了一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当由计算设备执行时,使得计算设备执行根据上述任一项的基于深度学习的蚊虫种类识别方法。
[0024]
本发明由于采取以上技术方案,其具有以下优点:
[0025]
1、现有技术中图像的获得是通过摄像机或摄像头等装置抓拍蚊虫经过的图像,这种方法的问题是每个图片中只有一两只蚊虫,且蚊虫的种类是随机的,也就是说很有可能大量图像都是同一种类的蚊虫,故很难用于蚊虫种类的识别,即使用于蚊虫种类识别,由于模型训练的数据比较少,精确度就会比较低。本发明中通过将不同种类的蚊虫分开饲养,并对其进行拍摄,保证了一张图像中存在较多的蚊虫,即用于模型训练的数据远远多于现有技术,这样训练出的模型精度会更加高。其次本发明中蚊虫种类是固定的,而不是随机的,保证了各种类别的蚊虫图像数据的完整性,从而能够更好的用于蚊虫种类的识别。
[0026]
2、本发明通过卷积神经网络,克服了现有蚊虫监测方法只能对蚊虫数量和密度进行监测的局限性问题,使得本发明能够对蚊虫类别进行精确识别,对蚊媒传染病监控有着重要的意义。
附图说明
[0027]
图1是本发明一实施例中基于深度学习的蚊虫种类识别方法的流程图;
[0028]
图2是本发明一实施例中神经网络模型的结构示意图。
具体实施方式
[0029]
为了使本领域技术人员更好的理解本发明的技术方向,通过具体实施例对本发明进行详细的描绘。然而应当理解,具体实施方式的提供仅为了更好地理解本发明,它们不应该理解成对本发明的限制。在本发明的描述中,需要理解的是,所用到的术语仅仅是用于描述的目的,而不能理解为指示或暗示相对重要性。
[0030]
为了解决现有技术中无法准确的对蚊虫种类进行识别的问题,本发明提出了一种基于深度学习的蚊虫种类识别方法、系统和介质,通过将不同种类的蚊虫分开饲养,并对其进行拍摄,保证了一张图像中存在较多的蚊虫,其次本发明中蚊虫种类是固定的,而不是随
机的,保证了各种类别的蚊虫图像数据的完整性,通过神经网络模型,克服了很难对蚊虫数量和密度进行准确计算的问题,使得本发明能够对蚊虫类别进行精确识别,对蚊媒传染病监控有着重要的意义。下面通过实施例对本发明的方案进行详细说明。
[0031]
实施例一
[0032]
图1是本发明一实施例中基于深度学习的蚊虫种类识别方法的流程图,如图1所示,该识别方法包括:
[0033]
s1对不同类型的蚊虫进行拍摄,根据蚊虫种类将获得的图像分为若干类,并进行标记。
[0034]
所有蚊虫来源于病原微生物与生物安全国家重点实验室株或野外采集株,蚊虫种类包括:中华按蚊、埃及伊蚊、白蚊伊蚊、凶小库蚊、同属于尖音库蚊复合组的致倦库蚊、骚扰库蚊和淡色库蚊。养殖环境条件为室温2621℃、相对湿度7525%、光照时间l:d=14:10,以8%蔗糖水饲养成蚊。
[0035]
经过拍摄,获得4200张不同种类蚊虫的图像,将图像根据蚊虫种类分为7类,每种600张,将不同种类的图像设置成相同的大小4464
×
2976
×
3,其单位为像素。对不同种类的图像进行分别标记,得到其确定的位置信息与种类信息,并对不同种类的图像进行随机的图片旋转与翻转,增加噪声进行数据增强。
[0036]
s2将经过标记的不同种类图像分为训练集、验证集和测试集,其中,每种图像中90%作为训练集,5%作为验证集,最后5%作为测试集。将训练集中图像输入神经网络模型进行训练,经过训练获得最优神经网络模型。
[0037]
图2是本发明一实施例中神经网络模型的结构示意图,如图2所示,神经网络模型依次包括:四个卷积池化模块,四个全连接层和一个softmax输出层,四个全连接层中第三个全连接层和第四个全连接层并联。卷积池化模块依次包括:第一卷积层、第二卷积层和第一池化层。即神经网络模型中各层依次为:第一卷积层,第二卷积层,第一池化层,第三卷积层,第四卷积层,第二池化层,第五卷积层,第六卷积层,第三池化层,第七卷积层,第八卷积层,第四池化层,第一全连接层,第二全连接层以及并联的第三全连接层和第四全连接层。
[0038]
第一卷积层至第八卷积层中卷积核个数分别为32、32、64、64、128、128、256和1024。其中,第一卷积层和第二卷积层中卷积核大小为4
×
4,步长为1;第三卷积层至第八卷积层中卷积核大小为2
×
2,步长为1;第一池化层至第四池化层中卷积核大小为2
×
2,步长为1。第一全连接层至第四全连接层中神经元个数依次为1024、160、14和14个。由第三全连接层输出最终得到所需识别蚊虫的种类信息,由第四全连接层中各神经元数值进行softmax运算得到所需识别蚊虫的种类概率信息。softmax的运算公式为:
[0039][0040]
其中:
[0041][0042]
使得所有的i满足故在计算种类概率过程中,可由下式计算得出:
[0043]
[0044]
神经网络模型的初始学习率为0.0001,最终学习率为0.1,更新神经网络模型权重300代,以得到最优神经网络模型及其权重。
[0045]
神经网络模型输出蚊虫的种类信息、预测框位置和预测框大小,预测框位置和预测框大小通过下式获得:
[0046]
x=σ(x1)+c
x
[0047]
y=σ(y1)+cy[0048]
w=w1·etw
[0049]
h=h1·eth
[0050]
其中,x为输出的预测框左上角横坐标;y为输出的预测框左上角纵坐标;w为输出的位置预测框宽度;h为输出的位置预测框高度;σ为sigmoid函数,x1和y1分别为预测框的横坐标和纵坐标的偏移值;(c
x
,cy)为特征图中网格单元的左上角坐标;tw和th分别为输出的预测框横坐标和纵坐标的尺度缩放信息;w1为预测的位置框宽度;h1为预测的位置框高度。
[0051]
将验证集中图像输入最优神经网络模型中,并将最优神经网络模型的输出结果与人工标记的蚊虫种类进行对比,若二者相同则输出结果正确,为有效信息。若二者不相同,则认为此种类信息为无效概率,在后续统计工作中记为0概率。若输出结果的正确率大于阈值则模型验证通过,否则重新对神经网络模型进行训练。其中,输出结果包括蚊虫的种类特征向量及其对应位置信息的特征向量,并以种类特征向量中概率最高的一类作为图像的种类信息。
[0052]
输出结果的正确率通过预测框与人工标记的真实框的交并比iou表征,其公式为:
[0053][0054]
其中,ao为预测框与真实框的交集;au为预测框与真实框的并集。
[0055]
模型验证通过的标准为:将最优卷积神经网络输出的位置信息与人工标记的蚊虫位置信息进行比较,若二者相同则输出结果正确,如果正确率高于第一阈值则认为此位置信息为有效位置信息;统计最优卷积神经网络中验证集中蚊虫种类信息的平均概率和蚊虫对应的位置信息,将其与人工标记的结果进行比较,若正确率高于第二阈值则认为模型验证通过。本实施例中第一阈值为90%,第二阈值为75%。
[0056]
s4将测试集中图像输入经过验证的最优神经网络模型中,对其输出的蚊虫种类和其位置进行统计,获得最优神经网络模型的最终正确率。
[0057]
s5将待测蚊虫图像输入经过测试的最优神经网络模型,获得蚊虫分类结果和其位置。根据输出种类信息的特征向量,使用概率最高的一项种类信息作为此蚊虫图片的种类信息;根据输出位置信息的特征向量,获得此蚊虫图片中的蚊虫位置坐标。
[0058]
实施例二
[0059]
基于相同的发明构思,本实施例公开了一种基于深度学习的蚊虫种类识别系统,包括:
[0060]
图像获得模块,用于对不同类型的蚊虫进行拍摄,根据蚊虫种类将获得的图像分为若干类,并进行标记;
[0061]
模型训练模块,用于将经过标记的不同种类图像分为训练集、验证集和测试集,将训练集中图像输入神经网络模型进行训练,经过训练获得最优神经网络模型;
[0062]
模型验证模块,用于将验证集中图像输入最优神经网络模型中,并将最优神经网络模型的输出结果与人工标记的蚊虫种类进行对比,若二者相同则输出结果正确,若输出结果的正确率大于阈值则模型验证通过,否则重新对神经网络模型进行训练;
[0063]
模型测试模块,用于将测试集中图像输入经过验证的最优神经网络模型中,对其输出的蚊虫种类和其位置进行统计,获得最优神经网络模型的最终正确率;
[0064]
模型输出模块,用于将待测蚊虫图像输入经过测试的最优神经网络模型,获得蚊虫分类结果和其位置。
[0065]
实施例三
[0066]
基于相同的发明构思,本实施例公开了一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当由计算设备执行时,使得计算设备执行根据上述任一项的基于深度学习的蚊虫种类识别方法。
[0067]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0068]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0069]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0070]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0071]
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。上述内容仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1