一种基于人机协同标注的MOM场景分型特征提取方法与流程

文档序号:38962284发布日期:2024-08-14 14:18阅读:11来源:国知局
一种基于人机协同标注的MOM场景分型特征提取方法与流程

本发明涉及制造运营管理mom领域,尤其涉及一种基于人机协同标注的mom场景分型特征提取方法。


背景技术:

1、mom指制造运营管理,是manufacturing operation management的缩写;指通过协调管理企业的人员、设备、物料和能源等资源,把原材料或零件转化为产品的活动。mom系统集成了生产计划、库存管理、生产调度、质量管理、设备维护、人员管理等功能,以实现生产效率和质量的提升。

2、随着制造业的发展,生产过程中产生的数据量不断增加。如何从这些数据中提取有用的特征成为提高生产效率和产品质量的关键。然而,mom中的各种场景特征往往具有显性化表达不强的问题。


技术实现思路

1、本发明的目的在于克服现有技术的不足,提供一种基于人机协同标注的mom场景分型特征提取方法。

2、本发明的目的是通过以下技术方案来实现的:

3、本发明的第一方面,提供一种基于人机协同标注的mom场景分型特征提取方法,包括以下步骤:

4、s101:收集mom场景文件,包括生产计划文件、生产调度文件和质量管理文件;形成分类的mom场景语料库;

5、s103:建立mom场景模型分型特征的schema定义:对s101的所述mom场景语料库进行预标注,形成基于多人自定义的标签和例子的mom场景模型概念体系;

6、s105:建立mom场景模型分型特征的标注标准定义:整合s103的schema定义过程中分型特征对应的例子,所述例子包括在语料库中按分型特征标注后能显著区分mom场景的标注结果的正例、在语料库中按分型特征标注后无法显著区分mom场景的标注结果的反例,形成案例式的人工标注学习指导手册;

7、s107:mom场景模型分型特征的标注训练:从mom场景语料库中随机抽取一定比例的文件,指定多名标注人员参照s105的人工标注学习指导手册的标准标准进行标注;

8、s109:mom场景模型分型特征的标注训练校验:在s107标注训练完成后,通过iaa评价标注一致性,满足评分要求则进入s111进行正式标注,否则返回步骤s107继续进行标注训练;

9、s111:mom场景模型分型特征的正式标注:再次从mom场景语料库中随机抽取一定比例的文件分配给每个标注人员,这部分为标注人员共同标注的内容;随机抽取分配完成后,将语料库中的剩余文件均分给每个标注人员;分配后标注人员进行正式标注,直到所有人员标注完毕;

10、s113:mom场景模型分型特征标注结果验收:针对共同标注的部分,同样采用iaa评价标注一致性;针对均分的非共同标注的部分,采用简单随机采样方法由人工进行检查;若验证通过则流程结束,否则进行内容修改后重新进行s113的验收。

11、进一步地,在步骤s101中,收集mom场景文件,包括生产计划文件、生产调度文件和质量管理文件,形成分类的mom场景语料库,具体包括:

12、建立数据目录,按照生产计划、生产调度和质量管理在内的环节将mom场景数据进行分类;

13、提供数据库接入、文件系统接入和手动上传在内的mom场景文件的收集方式,收集后挂载在相应数据目录;

14、在数据存储方面,针对结构化数据存储在关系型数据库,针对非结构化数据存储在分布式文件系统。

15、进一步地,所述方法还包括位于s101和s103之间的:

16、s102:mom场景文件预处理,对收集的场景相关文件进行预处理和标准化:根据文件名及类型筛选场景文件,去除重复、错误和异常文件,处理文件内容中的缺失值和异常值,形成处理后的mom场景语料库。

17、进一步地,所述方法还包括位于s102和s103之间的:

18、s102’:mom场景文件预处理校验:多名业务专家对mom场景语料库进行抽查校验,抽样的方式为简单随机抽样,在各数据目录下抽取该分类一定比例数量的场景文件进行浏览分析,评估当前语料库质量,若评估文件中满足预设条件则校验通过并进入步骤s104,否则返回步骤s102继续进行处理。

19、进一步地,在步骤s103中,所述分型特征即标注中使用的实体标签、关系标签;所述mom场景模型概念体系包括分型特征及其定义组成,具体包括主业务对象、场景描述、前置场景和物资编码。

20、进一步地,在步骤s109和s113中,所述iaa评价的方式为:

21、当前在多个标注人员间进行比较时,使用fleiss kappa,其计算公式如下:

22、

23、其中

24、其中

25、式中:k:类别数;样本量;m:评估者数

26、式中,k记作kappa系数,表示评价者间观察到的一致性比例、表示评价者间随机一致的比例;一般而言:k≤0.40:一致性较差;0.40<k≤0.60:中度一致;0.60<k≤0.80:较高度的一致性;k>0.80:极好的一致性。

27、进一步地,当采用iaa评价时,选择k>0.80作为标注一致性评价合格的标准。

28、进一步地,在步骤s111中,再次从mom场景语料库中随机抽取一定比例的文件分配给每个标注人员,这部分为标注人员共同标注的内容,包括:

29、采用分层随机抽样的方法,先将语料库按数据目录分成各种类型,然后根据各类型文件数量与语料库文件数量的比例确定从各类型中抽取样本的数量。

30、本发明的有益效果是:

31、在本发明的一示例性实施例中,提出了一种基于人机协同标注的mom场景分型特征提取方法,旨在对mom场景的分型特征进行提取。通过分型特征提取建立mom场景模型后,该mom场景模型能解决跨场景变更需求特征与代码特征关联难的问题,基于该场景模型去抽取软件代码特征,实现跨mom场景软件代码逻辑转换。



技术特征:

1.一种基于人机协同标注的mom场景分型特征提取方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于人机协同标注的mom场景分型特征提取方法,其特征在于:在步骤s101中,收集mom场景文件,包括生产计划文件、生产调度文件和质量管理文件,形成分类的mom场景语料库,具体包括:

3.根据权利要求1或2所述的一种基于人机协同标注的mom场景分型特征提取方法,其特征在于:所述方法还包括位于s101和s103之间的:

4.根据权利要求3所述的一种基于人机协同标注的mom场景分型特征提取方法,其特征在于:所述方法还包括位于s102和s103之间的:

5.根据权利要求1所述的一种基于人机协同标注的mom场景分型特征提取方法,其特征在于:在步骤s103中,所述分型特征即标注中使用的实体标签、关系标签;所述mom场景模型概念体系包括分型特征及其定义组成,具体包括主业务对象、场景描述、前置场景和物资编码。

6.根据权利要求1所述的一种基于人机协同标注的mom场景分型特征提取方法,其特征在于:在步骤s109和s113中,所述iaa评价的方式为:

7.根据权利要求6所述的一种基于人机协同标注的mom场景分型特征提取方法,其特征在于:当采用iaa评价时,选择k>0.80作为标注一致性评价合格的标准。

8.根据权利要求1所述的一种基于人机协同标注的mom场景分型特征提取方法,其特征在于:在步骤s111中,再次从mom场景语料库中随机抽取一定比例的文件分配给每个标注人员,这部分为标注人员共同标注的内容,包括:


技术总结
本发明公开了一种基于人机协同标注的MOM场景分型特征提取方法,包括:首先进行MOM场景文件收集、以形成分类的MOM场景语料库,之后建立MOM场景模型分型特征的Schema定义和标注标准定义,再然后进行MOM场景模型分型特征的标注训练和标注训练校验,在校验完成后进行MOM场景模型分型特征的正式标注和标注结果验收。在本发明中,提出了一种基于人机协同标注的MOM场景分型特征提取方法,旨在对MOM场景的分型特征进行提取,通过分型特征提取建立MOM场景模型后,该MOM场景模型能解决跨场景变更需求特征与代码特征关联难的问题,基于该场景模型去抽取软件代码特征,实现跨MOM场景软件代码逻辑转换。

技术研发人员:张云超,肖辉
受保护的技术使用者:成都淞幸科技有限责任公司
技术研发日:
技术公布日:2024/8/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1