1.本公开涉及人工智能技术领域,尤其涉及深度学习领域,具体地,涉及一种深度学习模型的训练方法、烟火检测方法、装置、电子设备以及存储介质。
背景技术:2.深度学习,也称为深度结构化学习或分层学习,是基于人工神经网络的更广泛的机器学习方法族的一部分。深度学习架构,例如深度神经网络、深度信念网络、循环神经网络和卷积神经网络,已经被应用于包括计算机视觉、语音识别、自然语言处理、音频识别、社交网络过滤、机器翻译、生物信息学、药物设计、医学图像分析、材料检查和棋盘游戏程序在内的领域。为保证各领域内输出结果的准确性,相应的模型训练必不可少。
技术实现要素:3.本公开提供了一种深度学习模型的训练方法、烟火检测方法、装置、电子设备以及存储介质。
4.根据本公开的一方面,提供了一种深度学习模型的训练方法,包括:
5.确定用于表征深度学习模型的评估性能的评估值,其中,所述深度学习模型是利用第一样本图像集训练得到的;响应于检测到所述评估值未达到预定义范围,对所述第一样本图像集进行处理,得到第二样本图像集;以及利用所述第二样本图像集对所述深度学习模型进行训练。
6.根据本公开的另一方面,提供了一种烟火检测方法,包括:将待检测图像输入深度学习模型,得到检测结果;其中,所述深度学习模型是上述的训练方法训练得到的。
7.根据本公开的另一方面,提供了一种深度学习模型的训练装置,包括:确定模块,用于确定用于表征深度学习模型的评估性能的评估值,其中,所述深度学习模型是利用第一样本图像集训练得到的;处理模块,用于响应于检测到所述评估值未达到预定义范围,对所述第一样本图像集进行处理,得到第二样本图像集;以及训练模块,用于利用所述第二样本图像集对所述深度学习模型进行训练。
8.根据本公开的另一方面,提供了一种烟火检测装置,包括:获得模块,用于将待检测图像输入深度学习模型,得到检测结果;其中,所述深度学习模型是基于上述的训练装置训练得到的。
9.根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的深度学习模型的训练方法及烟火检测方法。
10.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开的深度学习模型的训练方法及烟火检测方法。
11.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开的深度学习模型的训练方法及烟火检测方法。
12.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
13.附图用于更好地理解本方案,不构成对本公开的限定。其中:
14.图1示意性示出了根据本公开实施例的可以应用深度学习模型的训练方法及装置、烟火检测方法及装置的示例性系统架构;
15.图2示意性示出了根据本公开实施例的深度学习模型的训练方法的流程图;
16.图3示意性示出了根据本公开实施例的训练深度学习模型的整体流程图;
17.图4示意性示出了根据本公开实施例的烟火检测方法的流程图;
18.图5示意性示出了根据本公开实施例的深度学习模型的训练装置的框图;
19.图6示意性示出了根据本公开实施例的烟火检测装置的框图;以及
20.图7示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。
具体实施方式
21.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
22.在本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
23.在本公开的技术方案中,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
24.火灾作为危害人们生命财产安全的一种多发性灾害,对其进行及时检测显得尤为重要。针对如住宅、加油站、公路、森林等火灾高发场景进行火灾检测时,可以应用paddlex(飞桨全流程开发工具)的目标检测技术,自动检测可检测区域内的烟雾和火灾,帮助相关人员及时应对,最大程度降低人员伤亡及财物损失。
25.烟火检测技术包括图像获取、图像预处理、图像组合、烟火目标检测、深度学习等步骤。实现烟火目标检测的方法包括:获取连续的多帧视频图像。根据每帧视频图像的颜色分布确定每帧视频图像中的待定烟火区域。根据连续的多帧视频图像的变化情况确定每帧视频图像中的像素运动区域。根据待定烟火区域和像素运动区域,确定每帧视频图像中的目标烟火区域。
26.发明人在实现本公开构思的过程中发现,在进行烟火检测的过程中,干扰样本多,容易造成误检。例如,生活中有很多物体和烟火非常接近,如云朵、红色的灯光等,很难区分,容易造成误检。此外,烟火检测的速率慢,火灾发展速度快,如果不能在火灾初起阶段进行判断,并进行人为干预,直至火灾中期才能输出检测结果,则失去了烟火检测的意义。
27.本公开提供了一种深度学习模型的训练方法、烟火检测方法、装置、电子设备以及存储介质。深度学习模型的训练方法包括:确定用于表征深度学习模型的评估性能的评估值,深度学习模型是利用第一样本图像集训练得到的;响应于检测到评估值未达到预定义范围,对第一样本图像集进行处理,得到第二样本图像集;以及利用第二样本图像集对深度学习模型进行训练。
28.图1示意性示出了根据本公开实施例的可以应用深度学习模型的训练方法及装置、烟火检测方法及装置的示例性系统架构。
29.需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。例如,在另一实施例中,可以应用深度学习模型的训练方法及装置、烟火检测方法及装置的示例性系统架构可以包括终端设备,但终端设备可以无需与服务器进行交互,即可实现本公开实施例提供的深度学习模型的训练方法及装置、烟火检测方法及装置。
30.如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
31.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如知识阅读类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
32.终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
33.服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的内容提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务(
″
virtual private server
″
,或简称
″
vps
″
)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
34.需要说明的是,本公开实施例所提供的深度学习模型的训练方法、烟火检测方法一般可以由终端设备101、102、或103执行。相应地,本公开实施例所提供的深度学习模型的训练装置、烟火检测装置也可以设置于终端设备101、102、或103中。
35.或者,本公开实施例所提供的深度学习模型的训练方法、烟火检测方法一般也可以由服务器105执行。相应地,本公开实施例所提供的深度学习模型的训练装置、烟火检测装置一般可以设置于服务器105中。本公开实施例所提供的深度学习模型的训练方法、烟火检测方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的深度学习模型的训练装置、烟火检测装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
36.例如,在需要对深度学习模型进行训练时,终端设备101、102、103可以获取第一样本图像集,然后将获取的第一样本图像集发送给服务器105,由服务器105确定用于表征深度学习模型的评估性能的评估值,深度学习模型是利用第一样本图像集训练得到的,响应于检测到评估值未达到预定义范围,对第一样本图像集进行处理,得到第二样本图像集,并利用第二样本图像集对深度学习模型进行训练。或者由能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群对深度学习模型的性能进行分析,并实现对深度学习模型进行训练。
37.例如,在需要进行烟火检测时,终端设备101、102、103可以获取待检测图像,然后将获取的待检测图像发送给服务器105,由服务器105将待检测图像输入深度学习模型,得到检测结果。或者由能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群对待检测图像进行分析,并实现得到检测结果。
38.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
39.图2示意性示出了根据本公开实施例的深度学习模型的训练方法的流程图。
40.如图2所示,该方法包括操作s210~s230。
41.在操作s210,确定用于表征深度学习模型的评估性能的评估值,深度学习模型是利用第一样本图像集训练得到的。
42.在操作s220,响应于检测到评估值未达到预定义范围,对第一样本图像集进行处理,得到第二样本图像集。
43.在操作s230,利用第二样本图像集对深度学习模型进行训练。
44.根据本公开的实施例,深度学习模型可以用于检测图像中的目标信息,目标信息可以包括烟雾信息和火灾信息等其中至少之一。在深度学习模型用于检测图像中的烟雾信息和火灾信息的情况下,模型的输出可以包括检测到的目标信息的类别,如烟雾类别、火灾类别等。模型的输出还可以包括检测到的烟雾信息在图像中的位置信息,以及检测到的火灾信息在图像中的位置信息等。位置信息可以包括检测到的目标信息在图像中所覆盖的某个像素点坐标或某些像素点坐标的集合。
45.根据本公开的实施例,第一样本图像集可以包括具有目标信息的图像。具有目标信息的图像可以包括利用图像采集装置对具有目标信息的场景进行采集得到的图像,也可以包括从具有目标信息的图像中将目标信息裁剪处理,对裁剪得到的目标信息进行扩大或缩小后粘贴到随机选择的背景图片中形成的图像。图像中的目标信息可以包括占据面积为任意大小的目标信息,如目标信息的占据面积可以小于图像面积的3%。在需要将深度学习模型训练为用于检测烟雾、火灾等信息的模型的情况下,目标信息可以包括烟雾信息和火灾信息。
46.根据本公开的实施例,对于第一样本图像集中的每个图像,可以配置标签信息,标签信息可以包括表征目标信息的类别的类别标签信息和表征目标信息在图像中的位置的位置标签信息等其中至少之一。例如,与具有烟雾信息的图像相关联的标签信息可以包括烟雾类别标签和烟雾位置标签,与具有火灾信息的图像相关联的标签信息可以包括火灾类别标签和火灾位置标签。与具有烟雾信息和火灾信息的图像相关联的标签信息可以包括烟雾类别标签、火灾类别标签、烟雾位置标签和火灾位置标签,与不具有烟雾信息和火灾信息
的图像相关联的标签信息可以包括空标签等。
47.根据本公开的实施例,评估值可以包括图像级别的召回率、图像级别的误检率、map(mean average precision,全类平均正确率)和iou(intersection over union,交并比)等其中至少之一,用于评估深度学习模型的性能。
48.根据本公开的实施例,深度学习模型可以包括基于单阶段的pp-yolo算法实现的目标检测模型,pp-yolo是一个有效且高效的目标检测模型。深度学习模型可以通过利用上述第一样本图像集、第二样本图像集等对pp-yolo模型训练得到。使用pp-yolo模型可以提高目标检测的实时性,使用目标检测模型可以有利于对在图像中占据面积较小的目标信息进行有效检测。
49.根据本公开的实施例,可以首先针对利用第一样本图像集训练得到的深度学习模型,计算用于评估模型当前性能的各类评估值。然后,在检测到多类评估值中的至少一个评估值未达到预定义范围的情况下,可以利用与第一样本图像集不同的第二样本图像集对深度学习模型进行进一步训练。对于进一步训练得到的深度学习模型,可以继续计算其评估值,并可在评估值未达到预定义范围的情况下,利用新的样本图像集继续对深度学习模型进行训练,直至训练得到的深度学习模型的评估值达到预定义范围,可以终止训练过程。
50.根据本公开的实施例,在评估值为召回率的情况下,评估值未达到预定义范围可以包括召回率小于第一预设值。在评估值为误检率的情况下,评估值未达到预定义范围可以包括误检率大于第二预设值。第一预设值和第二预设值可以自定义设定,两者的设定值可以不同。
51.需要说明的是,在对深度学习模型进行训练时,所有使用过的样本图像集均可以视为第一样本图像集,第二样本图像集可以表征对深度学习模型进行下一次训练时所使用的样本图像集。
52.通过本公开的上述实施例,可以在深度学习模型的评估值未达到预定义范围的情况下,对深度学习模型进行进一步训练,得到更优化的深度学习模型,在利用优化后的深度学习模型进行如烟火检测等目标检测时,可有效提高检测结果的准确率。
53.下面结合具体实施例,对图2所示的方法做进一步说明。
54.根据本公开的实施例,在评估值为召回率的情况下,确定用于表征深度学习模型的评估性能的评估值可以包括:利用深度学习模型对第一图像集中的每个图像进行检测,得到检测出目标信息的第一目标图像,第一图像集中包括具有目标信息的第一图像。根据第一目标图像的数目与第一图像的数目的比值,确定召回率。
55.根据本公开的实施例,第一图像集可以包括随机选择的多个具有目标信息的第一图像,第一图像集中也可以包括不具有目标信息的图像。在计算召回率时,可以仅根据具有目标信息的第一图像及其检测结果进行计算。
56.根据本公开的实施例,在利用深度学习模型对第一图像集中的每个图像进行目标检测时,只要在具有目标信息的第一图像上检测出目标,可以认为该第一图像被召回。通过计算所有被召回的第一图像在所有具有目标信息的第一图像中所占的比例,可以确定当前深度学习模型的图片级别的召回率。
57.根据本公开的实施例,在计算召回率时,也可以首先将具有目标信息的第一图像分为多个批次。然后,批量计算被召回的第一图像在具有目标信息的第一图像中所占的比
例,确定当前深度学习模型的图片级别的召回率。通过批量计算的方式确定召回率的方法可以包括:针对每个批次的第一图像,计算该批次中被召回的第一图像在该批次中所包括的第一图像中所占的比例,得到多个比例。在得到多个比例后,可以根据多个比例中数值最小的比例的值,确定召回率。也可以根据多个比例的平均值,确定召回率。还可以根据多个比例中出现频次最高的比例的值,确定召回率。在此不进行限定。
58.通过本公开的上述实施例,引入召回率作为评判深度学习模型性能的指标,可以正确反应深度学习模型的检测效果,便于高效训练更优化的深度学习模型,进一步提高利用深度学习模型进行目标检测时的准确率。
59.根据本公开的实施例,在评估值为误检率的情况下,确定用于表征深度学习模型的评估性能的评估值可以包括:利用深度学习模型对第二图像集中的每个图像进行检测,得到检测出目标信息的第二目标图像,第二图像集包括不具有目标信息的第二图像。根据第二目标图像的数目与第二图像的数目的比值,确定误检率。
60.根据本公开的实施例,第二图像集可以包括随机选择的多个布具有目标信息的第二图像,第二图像集中也可以包括具有目标信息的图像。在计算误检率时,可以仅根据不具有目标信息的第二图像及其检测结果进行计算。
61.根据本公开的实施例,在利用深度学习模型对第二图像集中的每个图像进行目标检测时,只要在不具有目标信息的第二图像上检测出目标,可以认为该第二图像被误检。通过计算所有被误检的第二图像在所有不具有目标信息的第二图像中所占的比例,可以确定当前深度学习模型的图片级别的误检率。
62.根据本公开的实施例,在计算误检率时,也可以首先将不具有目标信息的第二图像分为多个批次。然后,批量计算被误检的第二图像在不具有目标信息的第二图像中所占的比例,确定当前深度学习模型的图片级别的误检率。通过批量计算的方式确定误检率的方法可以包括:针对每个批次的第二图像,计算该批次中被误检的第二图像在该批次中所包括的第二图像中所占的比例,得到多个比例。在得到多个比例后,可以根据多个比例中数值最大的比例的值,确定误检率。也可以根据多个比例的平均值,确定误检率。还可以根据多个比例中出现频次最高的比例的值,确定误检率。在此不进行限定。
63.通过本公开的上述实施例,引入误检率作为评判深度学习模型性能的指标,可以正确反应深度学习模型的检测效果,便于高效训练更优化的深度学习模型,进一步提高利用深度学习模型进行目标检测时的准确率。
64.需要说明的是,是否检测出目标与检测框的个数无关,只要检测结果表征存在检测框,即可以认为检测出了目标。对于不存在检测框的检测结果,可以认为相应的图像没有被检测出目标。
65.根据本公开的实施例,对第一样本图像集进行处理,得到第二样本图像集的方法可以包括如下中的至少之一:对第一样本图像集进行数据增广处理,得到第二样本图像集。在第一样本图像集中增加与目标信息的相似度大于预设阈值的负样本图像,得到第二样本图像集。
66.根据本公开的实施例,用于进行数据增广处理的数据增广策略可以包括如下中的至少之一:mixup(一种简单且与数据无关的数据增广方式)、randomdistort(随机改变亮度)、randomexpand(随机填充)、randomcontrast(随机改变对比度)、randomcolor(随机改
变颜色)、randomcrop(随机裁剪)、randominterp(随机缩放)、randomflip(随机翻转)、resize(调整大小)、batchrandomresize(批量随机调整大小)、normalize(标准化)等,且可不限于此。
67.根据本公开的实施例,第二预设阈值可以自定义确定。负样本图像可以包括具有如下至少一种信息的图像:云信息、雪山信息、灯光信息和太阳信息,且可不限于此。
68.需要说明的是,上述处理方式仅是示例性实施例,但不限于此,还可以包括本领域已知的其他处理方法,如可以采集新的样本图像集作为第二样本图像集,只要能够实现第二样本图像集和第一样本图像集不同即可。
69.通过本公开的上述实施例,在确定深度学习模型的评估值未达到预定义范围的情况下,可以结合数据增广方法和负样本图像其中至少之一,确定用于进一步对深度学习模型进行训练的第二样本图像集,使得利用第二样本图像集对深度学习模型进行训练之后,可以有效提高深度学习模型的性能,尤其是可有效提高利用深度学习模型进行目标检测时的准确率。
70.根据本公开的实施例,深度学习模型中可以包括可变形卷积子模型。在对深度学习模型进行训练的同时,可以一并实现对可变形卷积子模型的训练。
71.根据本公开的实施例,可以在pp-yolo模型的基础上增加可变形卷积(dcn,deformable convolution network)子模型。可变形卷积子模型可以适应各种形状、尺寸的信息。尤其适用于烟雾、火灾等尺度变化比较大的场景中的目标检测。
72.根据本公开的实施例,还可以在深度学习模型中设置不同的backbone(骨干网络)。例如,可以选择resnet101作为骨干网络,可以得到高精度的深度学习模型。可以选择resnet50作为骨干网络,可以得到检测速度更快的深度学习模型等。resnet是一种残差网络。
73.根据本公开的实施例,深度学习模型是在预训练模型的基础上,利用第一样本图像集训练得到的。
74.根据本公开的实施例,预训练模型可以包括在coco公开数据集上训练的模型,也可以包括在于烟雾和火灾相关的数据集上训练的模型等。在得到预训练模型之后,可以再在烟雾和火灾数据集上进行训练,得到深度学习模型。应用迁移学习的方式得到深度学习模型,可以进一步提升模型的检测效果,达到高召回低误检的要求。
75.图3示意性示出了根据本公开实施例的训练深度学习模型的整体流程图。
76.如图3所示,该方法包括操作s310~s340。
77.在操作s310,针对训练得到的深度学习模型,确定用于表征该深度学习模型的评估性能的评估值。
78.在操作s320,评估值是否达到预定义范围?若是,则执行操作s330;若否,则执行操作s340和s310~s320。
79.在操作s330,结束训练过程。
80.在操作s340,更新用于训练深度学习模型的训练样本图像,利用新的训练样本图像训练深度学习模型。
81.需要说明的是,在评估值包括召回率、误检率等多个评估指标的情况下,只有多个评估指标的评估值均达到预定义范围,操作s320的判断结果才为是。否则,多个评估指标的
评估值中只要有一个未达到预定义范围,操作s320的判断结果均为否。
82.通过本公开的上述实施例,可以结合深度学习模型的评估值,对深度学习模型进行训练,有利于得到优化的深度学习模型,提高模型检测结果的准确率。
83.图4示意性示出了根据本公开实施例的烟火检测方法的流程图。
84.如图4所示,该方法包括操作s410。
85.在操作s410,将待检测图像输入深度学习模型,得到检测结果。
86.根据本公开的实施例,该深度学习模型可以是基于上述训练方法训练得到的模型。例如,可以首先获取烟雾和火灾数据集,训练深度学习目标检测模型,使得能够基于该模型获取任一图像中火灾和烟雾的位置及类别。在初步训练得到能够实现烟火检测的深度学习模型的情况下,可以结合图像级别的召回率和图像级别的误检率,对该初步训练得到的深度学习模型进行评估。在确定当前模型的召回率和误检率均未达到与其的情况下,可以结合新的样本图像集对深度学习模型进行进一步训练优化。
87.根据本公开的实施例,可以将训练得到或优化后的深度学习模型部署于客户端,如可以部署于jetson nx(一种体型小巧的人工智能边缘计算设备)中。部署之后用户可以输入实时采集到的视频、图片、文件夹等,深度学习模型可以对该些内容进行分析,判断内容中是否包含火灾信息或烟雾信息。如果包含,可以输出火灾或烟雾的位置及类别。
88.通过本公开的上述实施例,实现的烟火检测方法具有较高的检测速度,使得在烟雾和火灾检测场景,模型能够在火情发生的第一时间做出响应。此外,实现的烟火检测方法还具有较高的检测正确率,可以对生活中与烟火非常接近的物体信息和烟火进行区分,且能够保证较高的检测正确率。
89.图5示意性示出了根据本公开实施例的深度学习模型的训练装置的框图。
90.如图5所示,深度学习模型的训练装置500包括确定模块510、处理模块520和训练模块530。
91.确定模块510,用于确定用于表征深度学习模型的评估性能的评估值,深度学习模型是利用第一样本图像集训练得到的。
92.处理模块520,用于响应于检测到评估值未达到预定义范围,对第一样本图像集进行处理,得到第二样本图像集。
93.训练模块530,用于利用第二样本图像集对深度学习模型进行训练。
94.根据本公开的实施例,评估值包括召回率。确定模块包括第一检测单元和第一确定单元。
95.第一检测单元,用于利用深度学习模型对第一图像集中的每个图像进行检测,得到检测出目标信息的第一目标图像,第一图像集中包括具有目标信息的第一图像。
96.第一确定单元,用于根据第一目标图像的数目与第一图像的数目的比值,确定召回率。
97.根据本公开的实施例,评估值包括误检率。确定模块包括第二检测单元和第二确定单元。
98.第二检测单元,用于利用深度学习模型对第二图像集中的每个图像进行检测,得到检测出目标信息的第二目标图像,第二图像集包括不具有目标信息的第二图像。
99.第二确定单元,用于根据第二目标图像的数目与第二图像的数目的比值,确定误
检率。
100.根据本公开的实施例,处理模块包括如下中的至少之一:处理单元和增加单元。
101.处理单元,用于对第一样本图像集进行数据增广处理,得到第二样本图像集。
102.增加单元,用于在第一样本图像集中增加与目标信息的相似度大于预设阈值的负样本图像,得到第二样本图像集。
103.根据本公开的实施例,目标信息包括烟雾信息和火灾信息其中至少之一。
104.根据本公开的实施例,深度学习模型中包括可变形卷积子模型。
105.根据本公开的实施例,第二样本图像集包括具有如下至少一种信息的图像:云信息、雪山信息、灯光信息和太阳信息。
106.根据本公开的实施例,深度学习模型是在预训练模型的基础上,利用第一样本图像集训练得到的。
107.图6示意性示出了根据本公开实施例的烟火检测装置的框图。
108.如图6所示,烟火检测装置600包括获得模块610。
109.获得模块610,用于将待检测图像输入深度学习模型,得到检测结果。深度学习模型是基于上述训练装置训练得到的。
110.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
111.根据本公开的实施例,一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开的深度学习模型的训练方法及烟火检测方法。
112.根据本公开的实施例,一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开的深度学习模型的训练方法及烟火检测方法。
113.根据本公开的实施例,一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现本公开的深度学习模型的训练方法及烟火检测方法。
114.图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
115.如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(rom)702中的计算机程序或者从存储单元708加载到随机访问存储器(ram)703中的计算机程序,来执行各种适当的动作和处理。在ram 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
116.设备700中的多个部件连接至i/o接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如
因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
117.计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如深度学习模型的训练方法及烟火检测方法。例如,在一些实施例中,深度学习模型的训练方法及烟火检测方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由rom 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到ram 703并由计算单元701执行时,可以执行上文描述的深度学习模型的训练方法及烟火检测方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行深度学习模型的训练方法及烟火检测方法。
118.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
119.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
120.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
121.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
122.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
123.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以是分布式系统的服务器,或者是结合了区块链的服务器。
124.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
125.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。