本发明涉及信息识别,特别是涉及一种基于语义分析的核电厂隔离安措信息自动识别方法。
背景技术:
1、核电厂的工单管理和隔离管理已基本实现信息化和流程化,但随着核电数字化和智能化转型的快速发展以及精细化管理的强力驱动,各核电厂对工单管理和隔离管理提出了更高要求。目前国内外在核电厂隔离方面进行的研究主要包括基于已输入隔离信息的隔离措施优化和冲突调解,针对核电厂工单任务隔离安措要求描述中隔离信息甄别的工作仍主要依靠人工进行。
2、核电厂工单任务中隔离安措要求文本语料为非结构化或半结构化数据,隔离安措涉及系统、设备、设备状态和设备关联关系,且文本质量良莠不齐,准确识别出有效信息对人员工作经验要求较高,效率较低。针对核电厂工单任务中隔离安措要求文本语料的机器自动识别的相关研究尚无,无法从大量的核电厂工单任务中自动提取出有用的结构化隔离信息,对核电厂隔离安措要求的深度价值尚待挖掘。
技术实现思路
1、本发明的目的在于,提供一种基于语义分析的核电厂隔离安措信息自动识别方法,实现对核电厂工单任务隔离安措要求描述中的“是否需隔离”、“隔离边界设备”和“隔离边界设备对应隔离目标状态”等核电厂隔离安措信息的自动识别,以辅助相关专业人员掌握特定时间窗口内全机组的系统和设备的隔离情况。
2、为了实现上述目的,本发明提供如下技术方案:
3、一种基于语义分析的核电厂隔离安措信息自动识别方法,包括如下步骤:
4、步骤1、对核电厂隔离安措要求文本语料类别梳理;
5、步骤2、对核电厂隔离安措要求文本语料预处理;
6、步骤3、基于语义匹配自动识别核电厂隔离安措要求文本语料对应的核电厂工单任务是否需隔离;
7、步骤4、基于语义依存分析自动识别核电厂隔离安措要求文本语料对应的核电厂工单任务涉及的隔离边界设备;
8、步骤5、基于语义依存分析自动识别核电厂隔离安措要求文本语料对应的核电厂工单任务隔离边界设备对应的隔离目标状态;
9、步骤6、根据核电厂工单任务隔离安措自动识别结果,实现对特定时间窗口内全机组的系统和设备隔离情况的全面掌握。
10、进一步地,步骤1中,所述核电厂隔离安措要求文本语料为核电厂工单任务中“隔离安措要求”字段内容;核电厂隔离安措要求文本语料按照描述类别进行梳理。
11、进一步地,步骤2,对核电厂隔离安措要求文本语料预处理,包括如下步骤:
12、步骤2.1、对核电厂隔离安措要求文本语料的中文分词;
13、步骤2.2、对核电厂隔离安措要求文本语料中文分词结果的词性标注;
14、步骤2.3、对核电厂隔离安措要求文本语料中文分词结果的降噪处理;
15、步骤2.4、对核电厂隔离安措要求文本语料中文分词结果的消歧处理。
16、进一步地,步骤2.1,核电厂隔离安措要求文本语料中文分词,包括如下步骤:
17、在通用词库的基础上,借助机器学习和人工标注的方式对大量核电厂隔离安措要求文本语料进行新词识别,以补充完善并形成核电厂隔离安措专业词库;
18、基于核电厂隔离安措专业词库,通过条件随机场模型结合维特比算法,实现对核电厂隔离安措要求文本语料的中文分词。
19、进一步地,步骤2.2,对核电厂隔离安措要求文本语料分词结果的词性标注,包括如下步骤:
20、在中文分词结果的基础上,通过隐型马尔科夫模型自动标注分词结果的词性,所述词性包括名词、动词、形容词、副词、连词、方位词、数词、人名和名动词。
21、进一步地,步骤2.3,对核电厂隔离安措要求文本语料分词结果的降噪处理,包括如下步骤:
22、在中文分词结果的基础上,对其中存在的噪音进行清洗降噪处理;所述噪音包括连续标点符号和全角半角符号。
23、进一步地,步骤2.4,对核电厂隔离安措要求文本语料中文分词结果的消歧处理,包括如下步骤:
24、在中文分词结果的基础上,对其中的指示代词进行指代消歧处理。
25、进一步地,步骤3,基于语义匹配自动识别核电厂隔离安措要求文本语料对应的核电厂工单任务是否需隔离,包括如下步骤:
26、步骤3.1、对核电厂隔离安措要求文本语料进行“是否需隔离”的人工标注;
27、步骤3.2、将待处理核电厂隔离安措要求文本语料与已标注隔离安措要求文本语料进行语义匹配,自动识别出待处理核电厂隔离安措要求文本语料对应的核电厂工单任务是否需隔离;
28、步骤3.3、如果识别结果是待处理核电厂隔离安措要求文本语料对应的核电厂工单任务需隔离,则进行步骤4;
29、如果识别结果是待处理核电厂隔离安措要求文本语料对应的核电厂工单任务不需隔离,则跳过步骤4和步骤5,直接进行步骤6。
30、进一步地,步骤3.2,将待处理核电厂隔离安措要求文本语料与已标注隔离安措要求文本语料进行语义匹配,自动识别出隔离安措要求文本语料对应的工单任务是否需隔离,包括如下步骤:
31、根据步骤1的不同类型隔离安措要求文本语料特点和步骤2的核电厂隔离安措要求文本语料预处理结果,将待处理核电厂隔离安措要求文本语料与已标注隔离安措要求文本语料进行语义相似度匹配,筛选得到待处理核电厂隔离安措要求文本语料对应的核电厂工单任务是否需隔离的结果。
32、进一步地,步骤4,基于语义依存分析自动识别核电厂隔离安措要求文本语料对应的核电厂工单任务涉及的隔离边界设备,包括如下步骤:
33、步骤4.1、基于步骤2的核电厂隔离安措要求文本语料预处理结果,对经步骤3识别出的需隔离核电厂工单任务对应的待处理核电厂隔离安措要求文本语料进行语义依存图表示;
34、步骤4.2、定位步骤3识别出的需隔离核电厂工单任务对应的待处理核电厂隔离安措要求文本语料中,指向“隔离边界设备”的给定谓语动词;
35、步骤4.3、根据给定谓语动词在语义依存图中相依存的语义角色,自动识别出经步骤3识别出的需隔离核电厂工单任务涉及的隔离边界设备。
36、进一步地,步骤4.1中,核电厂隔离安措要求文本语料语义依存关系包括动宾关系、宾补关系、定中关系和介宾关系。
37、进一步地,步骤4.2中,核电厂隔离安措要求文本语料中,指向“隔离边界设备”的给定谓语动词包括但不限于:“联锁”、“隔离”和“关闭”。
38、进一步地,步骤4.3中,给定谓语动词“联锁”、“隔离”和“关闭”所依存的语义角色一般为相依存的宾语名词“设备名称”和“设备编码”宾语名词,组成动宾关系,从而自动识别出该给定谓语动词所联系的工单任务中涉及到的隔离边界设备。
39、进一步地,步骤5,基于语义依存分析自动识别核电厂隔离安措要求文本语料对应的核电厂工单任务隔离边界设备对应的隔离目标状态,包括如下步骤:
40、步骤5.1、基于步骤4识别出的需隔离核电厂工单任务涉及的隔离边界设备,定位步骤3识别出的需隔离核电厂工单任务对应的待处理核电厂隔离安措要求文本语料中,指向“隔离目标状态”的给定宾语名词;
41、步骤5.2、根据给定宾语名词在步骤4语义依存图中相依存的语义状态,自动识别出经步骤3识别出的需隔离核电厂工单任务隔离边界设备对应的隔离目标状态。
42、进一步地,步骤5.1中,核电厂隔离安措要求文本语料中,指向“隔离目标状态”的给定宾语名词为步骤4中识别出的隔离边界设备对应名称。
43、进一步地,步骤5.12中,给定宾语名词所依存的语义状态为相依存的宾语补足语,宾语补足语包括但不限于“停运”和“运行状态”,即为隔离边界设备对应的隔离目标状态。
44、进一步地,步骤6,根据核电厂工单任务隔离安措自动识别结果,实现对特定时间窗口内全机组的系统和设备隔离情况的全面掌握,包括如下步骤:
45、根据步骤3对核电厂隔离安措要求文本语料对应的核电厂工单任务是否需隔离的自动识别结果、步骤4对核电厂隔离安措要求文本语料对应的核电厂工单任务涉及的隔离边界设备的自动识别结果和步骤5对核电厂隔离安措要求文本语料对应的核电厂工单任务隔离边界设备对应的隔离目标状态的自动识别结果的整合,实现对特定时间窗口内全机组的系统、设备隔离情况的全面掌握。
46、本发明还提供一种基于语义分析的核电厂隔离安措信息自动识别装置,所述装置包括:
47、处理器;
48、用于存储处理器可执行指令的存储器;
49、其中,所述处理器被配置为执行上述方法。
50、本发明还提供一种非易失性计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。
51、本发明的有益技术效果:
52、本发明的基于语义分析的核电厂隔离安措信息自动识别方法,基于语义分析实现对核电厂隔离安措的自动识别,极大提高相关专业人员对核电厂工单任务隔离信息的识别效率,为提升隔离准备过程以及生产计划管理过程的智能化水平奠定基础,降低由于隔离信息识别不足导致的安全措施矛盾、临时spv限制和i0冲突等不确定性风险,降低停役维修造成的sscs不可用率,从而最大程度地保障核电机组系统和设备的安全性、可用性及可靠性。