一种运检工作票生成系统的制作方法

文档序号:22258856发布日期:2020-09-18 14:10阅读:102来源:国知局
一种运检工作票生成系统的制作方法
本发明涉及数据处理
技术领域
,尤其涉及一种运检工作票生成系统。
背景技术
:当前,电力系统中输、变、配电设备运维业务的开展主要依靠人工监视和经验分析,运检作业人员需要进行全面、系统的专业业务培训来掌握相关专业知识。运检人员对知识储备的差异性可能导致其发现、分析和处理设备潜在缺陷或故障精准度低等问题,因而有必要构建智能系统或模块用以辅助一线运检工作人员。目前,我国电力公司已拥有输、变、配电工程运维领域知识库来支撑运检人员进行巡视、检测、维修和管理工作,但绝大多数单据仍然需要巡检班组组长进行拆分、填写。例如在电力设备运检工作中,通常由电力公司的巡检人员撰写或形成工作任务单,形成对相关电力设备故障、缺陷状态的任务描述,然后由电力公司的巡检班组会根据工作任务单的内容以及班组内检修人员的职责分工,形成分配到人的工作票。由于专业知识的更新换代以及巡检人员撰写水平问题,造成检修人员不能很好的对接工作任务单,以至检修工作无法完成,效率低下。技术实现要素:本发明的目的在于提供一种运检工作票生成系统,以解决解决上述现有技术中由于专业知识的更新换代以及巡检人员撰写水平问题,造成检修人员不能很好的对接工作任务单,以至检修工作无法完成,效率低下的技术问题。为了实现上述目的,本发明采用如下技术方案:一种运检工作票生成系统,包括:工作任务单获取模块,用于获取包含多个检修信息的工作任务单;数据预处理模块,用于将工作任务单中的任务内容提取、标注、转换、分词,获得训练集;初始化参数获取模块,用于获取嵌入层的初始化参数;预测模块,用于将按字分词后的训练集处理、拼接、训练,得到新的向量表示,再得出预测结果;预测结果修正模块,用于将预测模块所得的预测结果进行修正;处理模块,用于对词典中所有的词处理,输出实体类型;匹配模块,用于将预测的实体类型输出结果与工作票的相关的知识图谱进行匹配,将匹配结点链接的工作票内容输出填槽;输出模块,用于将匹配模块相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票。优选的,工作任务单的任务信息中包含若干检修信息,每个检修信息中包含的信息为:任务内容、电站|线路、编制部门、编制人中的一项或多项。优选的,数据预处理模块将工作任务单中的任务内容按行提取到文本文件中,对该文件进行标注;将标注好的文本转换获得转换标注后的训练集;然后将转换标注后的训练集中的句子按字分词获得训练集。优选的,数据预处理模块标注的内容包括:工作地点描述、故障或任务;数据预处理模块将标注好的文本转换成bis标注体系或者bies标注体系。优选的,数据预处理模块用标注工具brat将工作任务单中的任务内容进行标注。优选的,初始化参数获取模块通过语料库训练字转换为向量模型,得到每个字的向量表示;初始化参数获取模块将语料库文本中每一条工作任务单任务内容用换行符分隔,字与字之间用空格分隔,然后将处理好的数据输入到字转换为向量模型中训练,获得每个字的向量表示作为嵌入层的初始化参数。优选的,预测模块将按字分词后的训练集输入到双向长短时记忆实体抽取模型中的嵌入层,得到每个字的字向量,拼接到一起构成句子的嵌入表示;预测模块将句子的嵌入表示输入到双向长短时记忆实体抽取模型中进行训练,得到新的向量表示,再输入至softmax函数中,得出预测结果。优选的,处理模块对词典中所有的词按照长度从长到短与文本数据进行对照匹配,匹配成功时标出实体类型,最后将标记出的标签与从crf输出的标签进行比对,若发生冲突,选取两种方法中长度较长的标签结果,输出实体类型:工作地点或工作任务。优选的,匹配模块将预测的实体类型输出结果中的工作任务或设备故障与工作票的相关的知识图谱进行匹配,工作任务或设备可能有一对一或者一对多对应具体工作内容,该工作内容在知识图谱中匹配具体实际操作的工作人员结点,与此同时将工作票中的其他属性信息匹配到知识图谱中的结点中,将结点链接的工作票内容输出填槽。优选的,输出模块将匹配模块中知识图谱匹配中的一个或多个任务以及其它属性值相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票。优选的,字转换为向量模型为word2vec模型。优选的,处理模块采用基于词典的纠正或补充方法,对词典中所有的词按照长度从长到短与预测结果进行对照匹配。优选的,所述词典为人工从工作任务单中的工作地点以及工作内容提取出来的词库,或者电网运检班组所掌握的对工作地点以及工作内容的文档。本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请通过获取包含多个检修信息的任务信息,所述检修信息中包含单次检修任务的工作地点和任务内容;针对每个所述检修信息的所述工作地点和所述任务内容,对所述工作地点和所述任务内容进行模式化处理得到训练集;将所述训练集输入预设的转换模型中将所述训练集中的字转化为初始向量,得到包含多个所述初始向量的初始向量集;将所述初始向量集输入实体标签确定模型中确定与所述初始向量集对应的实体标签,得到实体标签集;基于所述实体标签集生成工作票,实现工作票的智能生成,避免由于一线检修人员对业务领域知识获取难度大、知识掌握牢固程度低,造成检修人员不能很好的对接工作任务单的问题,提升了检修工作的精准和效率。附图说明图1为本发明一种运检工作票生成系统的结构框图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。在实际应用中,在电力设备运检工作中,通常由电力公司的巡检人员撰写或形成工作任务单,形成对相关电力设备故障、缺陷状态的任务描述。电力公司的巡检班组会根据工作任务单的内容以及班组内检修人员的职责分工,形成分配到人的工作票。我国电力公司已拥有输、变、配电工程运维领域知识库来支撑运检人员进行巡视、检测、维修和管理工作,但绝大多数单据仍然需要巡检班组组长进行拆分、填写。上述知识库内的数据内容尽管已经通过知识采编过程进行统一的结构化处理,但受到系统架构与检索技术的限制,对于电力运检单据的实际支撑效果不甚理想,难以支撑电力运维领域经验知识的积累、固化与传承需求。亟须开展现有电力运维领域知识库的升级改造与创新使用。本发明提出了一种面向电力运检工作任务单的一种运检工作票生成系统,实现工作票的智能生成,用以解决由于一线检修人员对业务领域知识获取难度大、知识掌握牢固程度低,进而引发的检修工作精准度低、时效性差等实际生产问题,推动大电网安全风险防控水平提升。工作任务单主要有任务内容、电站|线路、编制部门、编制人等属性信息,例如部分相对应的内容如下:葛北务本支4#、15#搭火、葛北务本支、输电运维班、王兆阳。其中,各个属性信息都是实体,单划线对应工作票中的工作地点描述,双划线对应工作票中的工作内容,双划线可通过知识图谱匹配其子任务、设备部件以及解决故障方案,即有一对多或者一对一的工作内容,点划线对应工作票中的工作地点,编制部门的编制人将工作内容具体分配给相应班组成员,各司其职完成任务。请参阅图1所示,本发明提供了一种运检工作票生成系统,包括:工作任务单获取模块,用于获取包含多个检修信息的工作任务单;数据预处理模块,用于将工作任务单中的任务内容提取、标注、转换、分词,获得训练集;初始化参数获取模块,用于获取嵌入层的初始化参数;预测模块,用于将按字分词后的训练集处理、拼接、训练,得到新的向量表示,再得出预测结果;预测结果修正模块,用于将预测模块所得的预测结果进行修正;处理模块,用于对词典中所有的词处理,输出实体类型;匹配模块,用于将预测的实体类型输出结果与工作票的相关的知识图谱进行匹配,将匹配结点链接的工作票内容输出填槽;输出模块,用于将匹配模块相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票。基于此,本发明一种运检工作票生成系统的工作过程,包括:步骤s101,工作任务单获取模块采集获取包含多个检修信息的工作任务单;在本发明实施例中,工作任务单的任务信息中可以包含多个检修信息,例如在电力检修领域中一次任务信息中可能包含有多个待检修任务,每个检修信息中也可以包含多项信息,例如:任务内容、电站|线路、编制部门、编制人等属性信息等等,而本发明实施例中优选地关注检修任务中的工作地点和任务内容。步骤s102,数据预处理模块将工作票中的任务内容按行提取到文本文件中,用标注工具(brat标注工具)对该文件进行标注,主要标注工作地点描述、故障或任务两项。将标注好的文本转换成bis标注体系(b:实体第一个字,i:实体其它位置的字,s:单个字的实体,o:其它非实体部分的字)或者bies标注(b:实体第一个字;i:实体中间位置的字;e:实体最后一个字;s:单个字的实体;o:其它非实体部分的字)。例如:“葛北务本支4#、15#搭火”的bies标注体系如下所示:葛北务本支4#15#搭火ooooob-dei-dei-dei-dee-deb-tae-ta其中,‘de’表示工作地点描述实体,‘ta’表示工作任务或故障实体。将转换标注体系后的训练集中的句子按字分词获得训练集。步骤s103,初始化参数获取模块通过语料库(现成的电力领域的语料库)训练多维的word2vec(字转换为向量)模型,得到每个字的向量表示,所述每个字的向量表示用于初始化双向长短时记忆实体抽取模型中嵌入层的参数。将语料库文本中每一条工作单任务内容用换行符分隔,字与字之间用空格分隔,然后将处理好的数据输入到word2vec模型中训练,获得每个字的向量表示,该向量作为双向长短时记忆实体抽取模型嵌入层的初始化参数。步骤s104,预测模块将按字分词后的训练集输入到双向长短时记忆实体抽取模型中的嵌入层,得到每个字的字向量,拼接到一起构成句子的嵌入表示。将句子的嵌入表示输入到双向长短时记忆实体抽取模型中进行训练,得到新的向量表示,再输入至softmax函数中,得出预测结果,该结果是每一个标签的预测概率值,例如对于“搭”,0.7(b-ta)、0.08(e-ta)、0.04(o)等。步骤s105,预测结果修正模块从长短时记忆网络模型中得到的预测结果准确率很低,需要对该结果进行修正,故将步骤s104所得的结果输入到crf模型中进行修正。例如对于文本“4#、15#搭火”,基于bi-lstm模型输出标签是b-de、i-de、i-de、o、e-de、b-ta、e-ta。很明显,i-de后面不可能接o,按照该路径crf会受到很大的惩罚,通过crf模型会得到b-de、i-de、i-de、i-de、e-de、b-ta、e-ta的最优路径,这样就对基于bi-lstm模型的预测结果进行了修正。步骤s106,为达到更高的准确率,处理模块采用基于词典的纠正或补充方法,对词典中所有的词按照长度从长到短与文本数据进行对照匹配,匹配成功时标出实体类型,最后将该方法标记出的标签与从crf输出的标签进行比对,若发生冲突,选取两种方法中长度较长的标签结果,输出实体类型,即工作地点或工作任务。步骤s107,匹配模块将预测的实体类型输出结果中的工作任务或设备故障与工作票的相关的知识图谱进行匹配,工作任务或设备可能有一对一或者一对多对应具体工作内容,该工作内容在知识图谱中匹配具体实际操作的工作人员结点,与此同时将工作票中的其他属性信息匹配到知识图谱中的结点中,将结点链接的工作票内容输出填槽。步骤s108,输出模块将步骤s107中知识图谱匹配中的一个或多个任务以及其它属性值相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票。在本发明的又一实施例中,还提供一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现实施例所述的运检工作票生成系统的工作过程。在本发明的又一实施例中,还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传输方法的程序,所述信息传输方法的程序被处理器执行时实现所述的运检工作票生成系统的方法步骤。在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如,固态硬盘(solidstatedisk,ssd))等。需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1