本发明涉及计算机视觉,特别涉及一种针对人员检测的工业安全智能系统快速迁移方法。
背景技术:
1、现有技术中,随着智能制造的推广,人工智能在工业领域的应用逐步增强,进一步提高了工业设计、生产和管理的自动化,极大增强了工厂的人员安全监管能力。但是,由于现阶段人工智能仍较依赖于数据,经过一个场景的数据训练而得到的深度神经网络模型往往不能很好地作用在另一场景下,模型在应用于新的场景任务时,需要收集针对新场景的新数据进行迁移训练。数据是人工智能的底层逻辑中不可或缺的支撑要素,是ai算法的关键燃料,模型迁移的效果极大程度受到数据质量的影响,数据越多越精准,算法训练后获得的模型也就越智能、越好用。因此,数据在人工智能中扮演着非常重要的角色,数据的收集与模型的迁移训练往往也是工业安全智能系统部署的关键步骤,如何收集数据,怎么进行训练是实现智能系统迁移部署的一个十分重要且棘手的问题。
2、当前工业安全场景下,人员检测部署采集数据的方式和迁移方法主要有如下三种:
3、从公开数据集中获取数据,将模型从头进行训练后直接部署。公开数据集通常是由学术机构、政府机构或社区组织提供的,可以免费用于各种ai应用程序的训练和测试,使用它们可以节省数据收集和标记的成本,但由于数据常常与实际场景不贴近,通过这些数据训练得到的模型对于新场景往往不可靠,不适配于特定的工业场景。
4、从社交媒体、新闻网站、博客等互联网资源中爬取与目标场景相似的数据,将模型从头进行训练后直接部署。这种方式比起上一种要可靠一些,但仍难以满足特定场景的精确度要求,且数据中可能包含敏感信息,例如个人身份信息或商业机密,会带来一定的商业风险,另一方面爬取相似数据需要花费较多的人工筛选与标注时间,数据来源不稳定,往往成本高见效低。
5、通过现场摄像头收集数据,并通过人工标注获得数据后从头进行训练。这种方式虽然可以达到较高的精确度,但往往需要大量的数据。然而,许多工业场景下都有较强的保密性,现场数据难以获得,且人员位置异常本身就是被禁止的,这就导致现场数据往往极度缺乏负样本。
6、在实际应用中,上面所述的三种方式常常会混合使用,常用公开数据集进行模型的基础训练,提高模型的特征提取能力,同时从互联网搜索与目标场景较为相近的数据加入到训练中,使得模型训练特征空间更贴近目标。从而提高模型在目标场景的预期效果。由此训练出较为稳定成熟的模型后,再由目标场景现场采集较少量数据,将模型进行低学习率,低学习周期迁移训练,最终得到针对目标场景的模型。
7、虽然通过上述分阶段的训练方法可以得到适应特定场景的模型,且具备可用的精确度,但在实现其工业环境落地过程中,发现上述技术存在下列问题:第一、未解决工业场景保密性导致的数据难以获取的问题,模型最后一步的训练仍面临着缺乏数据的困难;第二、虽然模型迁移时需要人工处理标记的数据只剩下目标场景现场数据,人工成本降低了许多,但在需要多场景迁移的情况下,仍需耗费大量人工用于数据处理和标注;第三、模型训练的最后一步特征空间本质上只有现场采集的少量数据,容易出现过拟合问题。
技术实现思路
1、根据本发明实施例,提供了一种针对人员检测的工业安全智能系统快速迁移方法,包含如下步骤:
2、混合公开数据集和历史数据库,获得自然数据集;
3、训练自然数据集,获得基础模型;
4、获取新场景的现场数据;
5、部署自然数据集中的自然数据至现场数据上,生成人工数据;
6、按比例混合现场数据、人工数据和自然数据,获得应用数据;
7、基于基础模型训练应用数据,获得场景模型,完成迁移部署。
8、进一步,采用高初始学习率、长周期的方式训练自然数据集。
9、进一步,现场数据为至少一张现场照片。
10、进一步,部署自然数据集中的自然数据至现场数据上,生成人工数据包含如下步骤:
11、提取自然数据中的人物元素;
12、以现场数据为背景图像,将随机数量的人物元素以随机位置部署至背景图像中,生成人工数据。
13、进一步,提取自然数据中的人物元素包含如下步骤:
14、将自然数据以及自然数据的目标框坐标输入至分割网络中,分割获得人物目标元素,并生成对应的掩膜图片;
15、过滤人物目标元素,获得人物元素。
16、进一步,过滤人物目标元素包含如下步骤:
17、比较目标框尺寸与预定义的阈值,过滤掉尺寸过大、尺寸过小以及高宽比不适配的目标;
18、计算掩膜面积和目标框面积之比,过滤掉比值小于0.6的目标;
19、进行离散区域过滤,过滤掉连通域数量大于1的目标。
20、进一步,进行离散区域过滤,过滤掉连通域数量大于1的目标包含如下步骤:
21、将掩膜图片进行腐蚀处理,获得新掩膜图片;
22、应用遍历标记算法计算新掩膜图片的连通域数量,过滤掉连通域数量大于1的目标。
23、进一步,以现场数据为背景图像,对背景图像或人物元素进行数据增强,再将随机数量的人物元素以随机位置部署至现场数据中,生成人工数据。
24、进一步,基于基础模型以低初始学习率、短周期的方式训练应用数据,获得场景模型,完成迁移部署。
25、根据本发明实施例的针对人员检测的工业安全智能系统快速迁移方法,利用分割网络提取人物目标元素并加入到人工数据的生成中,实现高效生成有效数据,提高模型泛化能力;实现智能系统迁移的自动化,整个流程只需很少部分的人工干预,大大提高了迁移效率;解决了工业场景下数据保密性而导致的数据短缺问题,在难以获得训练数据的场景下也能实现智能检测系统的部署。
26、要理解的是,前面的一般描述和下面的详细描述两者都是示例性的,并 且意图在于提供要求保护的技术的进一步说明。
1.一种针对人员检测的工业安全智能系统快速迁移方法,其特征在于,包含如下步骤:
2.如权利要求1所述针对人员检测的工业安全智能系统快速迁移方法,其特征在于,采用高初始学习率、长周期的方式训练所述自然数据集。
3.如权利要求1所述针对人员检测的工业安全智能系统快速迁移方法,其特征在于,所述现场数据为至少一张现场照片。
4.如权利要求1所述针对人员检测的工业安全智能系统快速迁移方法,其特征在于,部署所述自然数据集中的自然数据至所述现场数据上,生成人工数据包含如下步骤:
5.如权利要求4所述针对人员检测的工业安全智能系统快速迁移方法,其特征在于,提取所述自然数据中的人物元素包含如下步骤:
6.如权利要求5所述针对人员检测的工业安全智能系统快速迁移方法,其特征在于,过滤所述人物目标元素包含如下步骤:
7.如权利要求6所述针对人员检测的工业安全智能系统快速迁移方法,其特征在于,进行离散区域过滤,过滤掉连通域数量大于1的目标包含如下步骤:
8.如权利要求4所述针对人员检测的工业安全智能系统快速迁移方法,其特征在于,以现场数据为背景图像,对所述背景图像或所述人物元素进行数据增强,再将随机数量的所述人物元素以随机位置部署至所述现场数据中,生成人工数据。
9.如权利要求1所述针对人员检测的工业安全智能系统快速迁移方法,其特征在于,基于所述基础模型以低初始学习率、短周期的方式训练所述应用数据,获得场景模型,完成迁移部署。