本发明涉及故障查询及上报,尤其涉及一种基于语义识别的故障问题解决系统及方法。
背景技术:
1、语义识别是一种自然语言处理技术,主要实现的是在计算机中模拟人类语言理解效果,它能够有效识别出每句话中所包含的意义,深入了解语句与句子中的内容,分析用户的真实意图。在故障查询系统及上报系统中,一般包含客户端、服务器端、技术维修端。客户端与服务器端通过网络连接,客户端可获取服务器端的故障信息,并对故障进行查询和上报。客户端还可以向服务器端提供反馈信息,以帮助服务器端改进故障处理流程。当客户端发现未知无法处理的故障时可以移交技术维修端定位并处理故障。传统上,当一个组织或企业的设备出现故障时,相关人员需要手动拨打电话或发送电子邮件来上报问题。这种方式不仅费时费力,还容易出错或遗漏信息。因此,为了提高工作效率和准确性,需要一种新型的故障查询上报工具。
2、在中国专利文献上公开的“故障处理方法、装置和故障处理装置”,其公开号为cn110855489a,提供一种故障处理方法、装置和故障处理装置,该方法包括:响应于计算机系统发生故障,向运维人员的终端发送报警信息;根据终端返回的数据查询请求,向终端发送获取的故障相关数据,数据查询请求根据报警信息确定;根据终端返回的故障处理请求和获取的故障相关数据,确定计算机系统的故障类型,故障处理请求根据故障相关数据确定;根据故障类型,对计算机系统的故障进行处理。由于在确定计算机系统的故障类型时仅仅只是确定异常事件序列中各异常事件对应的故障相关数据并根据各故障相关数据落入哪个故障类型的故障数值范围来判断该异常时间序列属于哪个故障类型,因此在进行故障类型匹配时准确率不高,导致故障问题解决效率较低。
技术实现思路
1、本发明旨在解决当前故障查询及上报过程费时费力,容易出错或遗漏信息导致故障解决工作的准确性和效率较低的问题。
2、以上技术问题是通过以下技术方案解决的:一种基于语义识别的故障问题解决方法,包括:
3、s1、构建动态更新的关系型故障数据库,生成故障信息表;
4、s2、对故障信息表进行实体信息抽取,建立实体关系;
5、s3、导入若干个实体关系,建立图形数据库;
6、s4、构建故障搜索引擎模块,进行故障匹配,根据匹配结果采取故障问题解决方案。
7、作为优选,动态更新的关系型故障数据库能够满足种类繁多的故障处理需求,由故障信息表中的故障知识信息,抽取建立合理准确的实体关系,处理实体关系获得结构化数据并导入图形数据库,完成故障知识数据库的搭建,构建故障搜索引擎模块,将用户反馈的故障与故障知识数据库中的故障类型进行故障匹配,根据匹配结果获取故障问题相应解决方案。基于语义识别快速清晰地查询定位到相似或相同问题,通过科学合理的匹配计算方式,获得准确度高、可靠性强的排障方式,一站式查询处理上报,高效便捷,极大提高用户端的排障效率。
8、作为优选,构建故障搜索引擎模块,进行故障匹配的步骤包括:
9、s401、加载sentence-bert模型,计算图形数据库中所有故障数据的句子表示;
10、s402、定义用户输入的新故障数据,计算新故障数据的句子表示;
11、s403、计算新故障数据和图形数据库中所有故障数据的相似度;
12、s404、根据权重找到最相似的故障数据,实现故障匹配。
13、作为优选,基础的bert模型在给定10000个句子时,要找出每个句子最相似的句子,那么每个句子就得需要与其他所有句子进行两两组合,才能得到与所有句子的相似度,即需要进行n*(n-1)/2次的推理计算。为了减少运算开销,引入构建孪生网络(即两个权重相同的网络模型),将初步判断相似的句子a和句子b分别输入到这两个bert模型,通过sentence encoder语句编码器进行特征提取和编码,将输入映射到新的空间得到特征向量u和v;最终通过u、v的拼接组合,经过下游网络来计算文本1和2的相似性。根据上述原理,将知识库里的故障数据根据产品名称和故障类型分类,将每对故障数据输入到两个权重完全相同的孪生bert模型,然后将通过sbert模型得到的数据语句中所有的字向量进行求平均值操作,最终将均值向量u和v作为句子a和句子b的句向量,可以用于后续语义相似度计算。当用户进行新的查询时,将用户的输入用pkuseg分词器进行分词,长文本进行二次分割便于后续计算匹配。使用前述预训练的sbert模型的encode函数计算得到当前查询的故障数据信息句向量,再根据欧几里德距离公式计算相似度,将结果进行转换,根据转换结果的大小判断匹配程度。最后,将用户输入的故障文本在知识库中进行查询分离和相似度匹配,根据程序设定找到最相似的前几条数据返回给用户,用户根据返回结果定位是否为相同故障,若无相同或相似故障结果,则可在界面上点击故障上报转人工处理,相关运维人员或者对应开发接到故障反馈单,定位问题,并把当前故障及对应解决方案维护在故障库中,便于下次使用,通过一系列的故障匹配操作,大大提高了故障匹配的准确度,解决了判定故障类型的过程中容易出错或遗漏信息导致故障解决工作的准确性和效率较低的问题。
14、作为优选,在步骤s3中,导入若干个实体关系后,基于实体的匹配算法进行实体匹配,若匹配成功,进行实体消歧和共指消解处理;若匹配不成功,创建新的实体关系类,最后将形成的实体关系的结构化数据导入图形数据库中完成图形数据库的建立。当批量导入故障知识时,新的类会被创建。同时代表该故障知识的实体也会被入到类中。新导入的实体和知识库原有实体之间进行实体消歧和共指消解处理,所述实体消歧即专门用于解决同名实体产生歧义问题的技术;所述共指消解即用于解决多个指称项对应于同一实体对象的问题。如果新类中的实体和其所有父类的某个实体匹配成功,这个已经存在的实体就会直接添加到这个新类中;如果没有匹配成功,就为这个新类创建一个这样的实体,故障知识的提取是基于实体的匹配算法,这是对故障描述进行语义分析和生成故障标签的基础,一些系统需要的故障知识可能不完整,可以从某个候选类中根据实体匹配算法提取到相应的实体,从而扩充原有类,完整准确的故障知识数据库保障了进行故障匹配的精确度,从而提高故障排查效率。
15、作为优选,在步骤s2中,故障信息表包括故障标题和其他字段信息,实体信息抽取是将故障标题设为数据库中的实体对象,其他字段信息设为对应实体对象的附加属性信息。故障信息表里包含很多字段:故障标题、故障编码、故障分类、产品名称、产品版本、故障描述、异常附件、解决方案、发布状态、排查过程等等。选择把故障标题做成一个实体,其他字段信息做成故障标题的信息节点能够简易快速建立实体对象,进而快速搭建故障知识库。
16、作为优选,在步骤s2中,实体关系包括实体关系类型和实体关系参数,建立实体关系是通过将故障信息表列转行,获得关系字段名。实体和实体之间存在着语义关系,当两个实体出现在同一个句子里时,上下文环境就决定了两个实体间的语义关系。完整的实体关系包括两方面:实体关系类型和实体关系参数,实体关系类型说明了实体之间的联系类型,实体关系参数也就是发生关系的实体。实体关系的建立有利于故障知识的迅速检索与匹配,根据实体间的某些重要联系,实现精准检索排障。
17、作为优选,在步骤s1中,构建关系型故障数据库通过判断故障知识是否为未知类型进行构建,若新增故障知识为未知类型,在数据库中创建新增故障知识的节点和属性;若新增故障知识为已知类型,并入已有的故障知识,允许编辑故障知识节点和属性。通过不断扩充未知类型的故障知识和补充已有的故障知识,为故障检索提供的庞大的故障知识数据库,为快速匹配故障并获取处理方案提供重要基础。
18、作为优选,在步骤s403中,相似度的计算采用欧几里德距离公式,并将结果进行转换,由转换结果大小判断故障匹配程度。欧几里德距离公式简单易用,适用范围广,采用欧几里德距离公式的计算结果能够较为良好表征相似度,由于直接用欧几里德距离公式的结果进行匹配程度的判断较为不便,因此将结果再经过归一化转换到区间(0,1]进行判断,转换结果表示为距离越小,相似度越大,故障知识越匹配。通过计算转化的方式得到的相似度可靠性高,判定故障匹配简易方便。
19、本发明还提供与上述方法相适配的一种基于语义识别的故障问题解决系统,包括:故障管理模块,基于关系型数据库建立,包含故障知识库,故障知识库包含若干个预存故障及解决方案和后续补充的故障及解决方案;
20、数据映射模块,与故障管理模块连接,从关系型数据库中提取数据,将提取数据作为映射故障知识库的输入;
21、故障搜索引擎模块,分别与数据映射模块、故障管理模块连接,分割输入的搜索语句检索目标结果。
22、作为优选,故障问题解决系统包括故障管理模块、数据映射模块和故障搜索引擎模块。故障管理模块和故障搜索引擎模块是系统的核心,它们依赖于动态知识库管理策略,其中包含了大量满足用户不同需求的功能模块。故障管理模块本质上是基于关系型数据库建立的,存储的数据包含一些内置的常用故障及解决方案和后续用户反馈的故障情况,故障知识库是动态更新的,允许编辑节点、属性、关系和标签,数据映射模块可以从关系型数据库存储的故障系统中提取成节点属性类数据,并将其作为输入,映射到图数据模型中,在故障搜索引擎模块中,java api作为底层查询和上层故障库管理层的中间层,具有灵活,可扩展的结构,完成故障匹配后获取故障处理方案,实现故障排查,解决了当前故障查询及上报过程费时费力的问题。
23、作为优选,故障知识库是动态更新的图形数据库,允许创建或编辑节点和属性,属性包括关系和标签。故障知识库知识库是动态更新的,第一次建立的时候,通过信息抽取,可以从原始故障上报中的详细信息中提取出类、实体、关系与属性等知识要素,在知识库中创建或编辑节点和属性,属性包括故障知识之间的关系和故障知识所属标签。动态更新的特性使得数据库可以随时到扩充,丰富的故障知识为故障匹配带来极大的便利,使得故障匹配成功率更高。
24、作为优选,图形知识库以图这种数据结构存储和查询数据,图的数据模型体现形式包括节点和关系,处理对象包括键值对。采用图数据库进行故障知识存储直观自然、能够高效地插入大量的数据,同时查询语言更简洁,更高效的关联查询性能。
25、本发明的有益效果是:一般故障的问题现象和解决方案属于人为录入的,根据每个人的语言习惯会形成不一样表达方式,导致搜索相似故障时无法获得搜索结果,进而转人工处理方式,费时费力,而本发明当系统出现故障时,运维人员无需四处联系相关人员上报问题并跟踪处理进度,降低沟通成本,将故障问题形成闭环,构建系统的知识图谱。本发明提供一种闭环的故障处理方案,从界面可配置多种自定义规则或内嵌针对性规则以供处理,具有故障处理高效快速、信息反馈及时、实用灵活便捷等优点。