本发明涉及数据处理技术领域,具体涉及一种多源数据的故障处理方法、装置、电子设备及存储介质。
背景技术:
随着业务系统的完善,业务系统从各个子系统采集多源数据,然而,传统的系统管理技术在系统运行时,用户或管理者无法根据多源数据获知系统的具体运行情况,而在系统出现故障或对系统进行维护时,并不能够及时、准确地确定系统的故障信息的类别,无法快速的确定出故障解决方案。
技术实现要素:
鉴于以上内容,有必要提出一种多源数据的故障处理方法、装置、电子设备及存储介质,在确定出目标故障解决方案时,采用目标故障解决方案自动对异常信息进行故障处理,无需发送给运维人员进行处理,提高了故障处理效率。
本发明的第一方面提供一种多源数据的故障处理方法,所述方法包括:
接收多个子系统上报的系统日志,解析所述系统日志获取故障日志,其中,所述故障日志中包含有故障子系统标识码;
识别所述故障日志,确定所述故障日志的第一故障类型;
按照所述第一故障类型的异常信息提取方式,提取所述故障日志中的异常信息;
将所述异常信息输入至预先训练好的故障分类模型中进行分类,得到所述异常信息对应的第二故障类型;
根据所述第二故障类型确定所述异常信息的目标故障解决方案;
根据所述目标故障解决方案对所述异常信息进行故障处理。
可选地,所述确定所述故障日志的第一故障类型包括:
识别所述故障日志中是否存在弹窗日志;
当所述故障日志中存在弹窗日志时,确定所述故障日志的第一故障类型为页面访问故障;
当所述故障日志中不存在弹窗日志时,确定所述故障日志的第一故障类型为业务系统执行故障。
可选地,所述识别所述故障日志中是否存在弹窗日志包括:
采用预设的正则模板匹配所述故障日志;
当在所述故障日志中匹配到弹窗标签时,确定所述故障日志中存在弹窗日志;
当在所述故障日志中未匹配到弹窗标签时,确定所述故障日志中不存在弹窗日志。
可选地,所述按照所述第一故障类型的异常信息提取方式提取所述故障日志中的异常信息包括:
当确定所述故障日志的第一故障类型为页面访问故障时,使用正则表达式提取所述故障日志中的页面访问的异常信息。
可选地,所述按照所述第一故障类型的异常信息提取方式,提取所述故障日志中的异常信息包括:
当确定所述故障日志的第一故障类型为业务系统执行故障时,获取所述故障日志中的坐标信息和故障子系统标识码;
按照所述故障日志的坐标信息,调用弹窗截图服务对显示故障日志的故障子系统的访问页面进行截图,得到故障图片;
将所述故障图片发送至所述故障子系统标识码对应的故障接口,所述故障接口对所述故障图片进行文字识别,并进行异常信息提取。
可选地,所述根据所述第二故障类型确定所述异常信息的目标故障解决方案包括:
获取所述第二故障类型的编码;
识别预设数据库中的故障解决方案编码中是否存在与所述第二故障类型的编码相匹配的目标编码;
当确定所述预设数据库中的故障解决方案编码中存在与所述第二故障类型的编码相匹配的目标编码时,获取所述目标编码对应的预设的目标语料库;
对预设的目标语料库中的所有文本进行第一预处理,将预处理后的文本输入至预先训练好的词嵌入模型中,得到多个第一句向量;
对所述异常信息进行分词处理,得到多个分词,将所述多个分词转换为多个词向量,合并所述多个词向量,得到第二句向量;
计算所述第二句向量与每个第一句向量之间的相似度,并从所述相似度中选取出相似度最大的第一句向量作为目标句向量;
从预设的标准答案数据库中确定出所述目标句向量对应的标准答案,并将所述标准答案确定为所述异常信息的目标故障解决方案。
可选地,所述方法还包括:
每隔预设时间段统计每个子系统的故障发生数;
按照预设的展示规则展示所有子系统的故障发生数。
本发明的第二方面提供一种多源数据的故障处理装置,所述装置包括:
接收模块,用于接收多个子系统上报的系统日志,解析所述系统日志获取故障日志,其中,所述故障日志中包含有故障子系统标识码;
识别模块,用于识别所述故障日志,确定所述故障日志的第一故障类型;
提取模块,用于按照所述第一故障类型的异常信息提取方式,提取所述故障日志中的异常信息;
分类模型,用于将所述异常信息输入至预先训练好的故障分类模型中进行分类,得到所述异常信息对应的第二故障类型;
确定模块,用于根据所述第二故障类型确定所述异常信息的目标故障解决方案;
故障处理模块,用于根据所述目标故障解决方案对所述异常信息进行故障处理。
本发明的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的多源数据的故障处理方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的多源数据的故障处理方法。
综上所述,本发明所述的多源数据的故障处理方法、装置、电子设备及存储介质,一方面,通过按照所述第一故障类型的异常信息提取方式提取所述故障日志中的异常信息,由于不同的第一故障类型对应的异常信息提取方式不同,当确定了所述故障日志的第一故障类型时,根据所述第一故障类型匹配出对应的异常信息提取方式,具有针对性,提高了异常信息的提取效率及准确率,进而提高故障处理效率及准确率;另一方面,根据所述第二故障类型确定所述异常信息的目标故障解决方案,通过根据第二故障类型确定异常信息是否为已经出现过的故障,当为已经出现过的故障,将计算得到的相似度最大的第一句向量对应的标准答案直接确定为所述异常信息的目标故障解决方案,提高了故障处理的效率;最后,根据所述目标故障解决方案对所述异常信息进行故障处理,在确定出目标故障解决方案时,采用所述目标故障解决方案自动对所述异常信息进行故障处理,无需发送给运维人员进行处理,提高了故障处理效率。
附图说明
图1是本发明实施例一提供的多源数据的故障处理方法的流程图。
图2是本发明实施例二提供的多源数据的故障处理装置的结构图。
图3是本发明实施例三提供的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
实施例一
图1是本发明实施例一提供的多源数据的故障处理方法的流程图。
在本实施例中,所述多源数据的故障处理方法可以应用于电子设备中,对于需要进行多源数据的故障处理的电子设备,可以直接在电子设备上集成本发明的方法所提供的多源数据的故障处理的功能,或者以软件开发工具包(softwaredevelopmentkit,sdk)的形式运行在电子设备中。
如图1所示,所述多源数据的故障处理方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
s11,接收多个子系统上报的系统日志,解析所述系统日志获取故障日志,其中,所述故障日志中包含有故障子系统标识码。
本实施例中,系统日志是指系统运行过程日志,当对系统进行故障分析时,接收所有子系统上报的系统运行过程日志,解析所述运行过程日志获取故障日志,其中,所述故障日志中包含有故障子系统标识码,具体地,所述故障子系统标识码用于唯一识别每个子系统。
s12,识别所述故障日志,确定所述故障日志的第一故障类型。
本实施例中,所述第一故障类型可以包括:页面访问故障和业务系统执行故障。
在一个可选的实施例中,所述确定所述故障日志的第一故障类型包括:
识别所述故障日志中是否存在弹窗日志;
当所述故障日志中存在弹窗日志时,确定所述故障日志的第一故障类型为页面访问故障;
当所述故障日志中不存在弹窗日志时,确定所述故障日志的第一故障类型为业务系统执行故障。
本实施例中,通过识别故障日志中是否存在弹窗日志,根据识别结果确定第一故障类型。
在其他一些可选的实施例中,当所述故障日志中存在弹窗日志时,故障日志的第一故障类型也可以为业务系统执行故障。
在一个可选的实施例中,所述识别所述故障日志中是否存在弹窗日志包括:
采用预设的正则模板匹配所述故障日志;
当在所述故障日志中匹配到弹窗标签时,确定所述故障日志中存在弹窗日志;
当在所述故障日志中未匹配到弹窗标签时,确定所述故障日志中不存在弹窗日志。
本实施例中,可以预先设置正则模板,通过预设的正则模板可以快速的匹配出所述故障日志中是否存在弹窗标签,当存在弹窗标签时,确定所述故障日志中存在弹窗日志。
s13,按照所述第一故障类型的异常信息提取方式,提取所述故障日志中的异常信息。
本实施例中,由于不同的第一故障类型对应的异常信息提取方式不同,当确定了所述故障日志的第一故障类型时,根据所述第一故障类型匹配出对应的异常信息提取方式,具有针对性,提高了异常信息的提取效率及准确率,进而提高故障处理效率及准确率。
在一个可选的实施例中,所述按照所述第一故障类型的异常信息提取方式提取所述故障日志中的异常信息包括:
当确定所述故障日志的第一故障类型为页面访问故障时,使用正则表达式提取所述故障日志中的页面访问的异常信息。
在一个可选的实施例中,所述按照所述第一故障类型的异常信息提取方式提取所述故障日志中的异常信息包括:
当确定所述故障日志的第一故障类型为业务系统执行故障时,获取所述故障日志中的坐标信息和故障子系统标识码;
按照所述故障日志的坐标信息,调用弹窗截图服务对显示故障日志的故障子系统的访问页面进行截图,得到故障图片;
将所述故障图片发送至所述故障子系统标识码对应的故障接口,所述故障接口对所述故障图片进行文字识别,并进行异常信息的提取。
本实施例中,在确定故障日志的第一故障类型为业务系统执行故障,调用弹窗截图服务截取故障图片,并将所述故障图片发送至所述故障子系统标识码对应的故障接口进行异常信息提取,具体地,可以采用ocr技术识别,检测图片中的文本信息。本实施例通过将故障图片发送至故障子系统标识码对应的故障接口进行故障图片识别,避免出现故障图片堆积的现象,提高了异常信息的提取效率和准确率。
s14,将所述异常信息输入至预先训练好的故障分类模型中进行分类,得到所述异常信息对应的第二故障类型。
本实施例中,当提取到异常信息时,需要对异常信息进行故障分类,确定异常信息的类别。
具体地,所述故障分类模型的训练过程包括:
获取多个故障类型及每个故障类型对应的异常信息作为样本数据集;
从所述样本数据集中按照预设的划分规则划分出训练集和验证集;
将所述训练集输入预设神经网络中进行训练,得到故障分类模型;
将所述验证集输入至所述故障分类模型中进行测试,并计算测试通过率;
若所述测试通过率大于或者等于预设通过率阈值,确定所述故障分类模型训练结束;若所述测试通过率小于预设通过率阈值,增加训练集的数量,重新进行故障分类模型的训练。
本实施例中,若存在m种故障类型,获取每个故障类型的异常信息作为样本数据集,并对故障类型进行统一编号为[1,m],本实施例可以按照70%和30%的比例将样本数据集划分为训练集和验证集,所述预设神经网络可以为birnn+attention深度学习框架,训练故障分类模型;由于采用attention机制,可以更好的表征文本,使训练出的故障分类模型具有更高的精度。
本实施例中,提取所述多个类别的异常信息输入至预先训练好的故障分类模型中,确定异常信息的类别,并且在后续的训练过程中,增加新的类别对应的异常信息作为新的数据,以增加所述数据集的数量,并基于新的数据集来重新训练故障分类模型,及不断的更新故障分类模型,从而不断的提高故障分类准确率。
s15,根据所述第二故障类型确定所述异常信息的目标故障解决方案。
本实施例中,所述目标故障解决方案是指用于解决异常信息的方案,若异常信息为已经出现过的故障,存在目标故障解决方案,若异常信息为从未出现过的新故障,不存在目标故障解决方案。本实施例可以根据所述第二故障类型确定所述异常信息是否为已经出现过的故障。
在一个可选的实施例中,所述根据所述第二故障类型确定所述异常信息的目标故障解决方案包括:
获取所述第二故障类型的编码;
识别预设数据库中的故障解决方案编码中是否存在与所述第二故障类型的编码相匹配的目标编码;
当确定所述预设数据库中的故障解决方案编码中存在与所述第二故障类型的编码相匹配的目标编码时,获取所述目标编码对应的预设的目标语料库;
对预设的目标语料库中的所有文本进行第一预处理,将预处理后的文本输入至预先训练好的词嵌入模型中,得到多个第一句向量;
对所述异常信息进行分词处理,得到多个分词,将所述多个分词转换为多个词向量,合并所述多个词向量,得到第二句向量;
计算所述第二句向量与每个第一句向量之间的相似度,并从所述相似度中选取出相似度最大的第一句向量作为目标句向量;
从预设的标准答案数据库中确定出所述目标句向量对应的标准答案,并将所述标准答案确定为所述异常信息的目标故障解决方案。
本实施例中,可以预先设置标准答案数据库,所述标准答案数据库中包含有多个句向量,及每个句向量对应的标准答案。
进一步地,所述对预设的目标语料库中的所有文本进行第一预处理,将预处理后的文本输入至预先训练好的词嵌入模型中,得到多个第一句向量包括:
对预设的目标语料库中的所有文本进行分词操作,得到词集合;
利用词向量映射模型将所述词集合映射为词向量集合;
将所述词向量集合表示为按词序排列的词向量矩阵;
基于所述词向量矩阵,计算每个词向量的上文向量及下文向量;
将每个词向量、所述词向量的上文向量以及所述词向量的下文向量进行拼接,得到包含上下文特征的第一文本向量;
将所述第一文本向量输入至预先训练好的词嵌入模型中,得到多个第一句向量。
本实施例中,可以根据文本的语序,对每个词的前一个词和后一个词分别进行特征向量的提取,其中,所述前一个词表示上文的词,所述后一个词表示下文的词,并与当前词合并,得到所述每个词的更新的词向量,所述更新的词向量表示包含了每个词的上下文特征,保存了准确的语义特征,将文本中的每个词以所述更新的词向量进行表示,从而可以得到文本的包含上下文特征的向量表示为第一文本向量。
进一步的,所述基于所述词向量矩阵,计算每个词向量的上文向量及下文向量包括:
将目标词向量的前一个词向量的上文向量与所述前一个词向量合并,得到所述目标词向量的上文向量;
将目标词向量的后一个词向量的下文向量与所述后一个词向量合并,得到所述目标词向量的下文向量。
本实施例中,所述上文向量是通过将所述目标词向量的前一个词向量的上文向量与所述前一个词向量合并得到的,所述下文向量是通过将目标词向量的后一个词向量的下文向量与所述后一个词向量合并得到的,通过将所述上文向量和所述下文向量进行拼接,得到包含上下文特征的第一文本向量,所述第一文本向量既能够保留文本的词序信息,也能够保存较远的词与词之间的联系信息,从而更加全面的对文本的语义进行了保留,提高了目标故障解决方案的准确率。
在一个可选的实施例中,所述计算所述第二句向量与每个第一句向量之间的相似度包括:
计算所述第二句向量与每个第一句向量之间的余弦相似度。
该可选的实施例中,所述余弦相似度用向量空间中两个向量的夹角的余弦值来衡量两个文本间的相似度。
余弦相似度的计算公式如下:
其中,(x1,x2,…,xn)为第二句向量,(y1,y2,…,yn)为第一句向量,cos(θ)为余弦相似度。
本实施例中,所述第二故障类型的编码用于识别所述第二故障类型是否为已经出现过的故障,将所述第二故障类型的编码与预设数据库中的故障解决方案编码进行匹配,根据匹配结果确定是否为已经出现过的故障,当确定所述预设数据库中的故障解决方案编码中存在与所述第二故障类型的编码相匹配的目标编码时,获取所述目标编码对应的预设的目标语料库,计算所述异常信息的第二句向量与所述目标语料库中的所有第一句向量之间的相似度,将计算得到的相似度最大的第一句向量对应的标准答案确定为所述异常信息的目标故障解决方案。
本实施例中,通过根据第二故障类型确定异常信息是否为已经出现过的故障,当为已经出现过的故障,将计算得到的相似度最大的第一句向量对应的标准答案直接确定为所述异常信息的目标故障解决方案,提高了故障处理的效率。
进一步地,所述方法还包括:
当确定所述预设数据库中的故障解决方案编码中不存在与所述第二故障类型的编码相匹配的目标编码时,确定所述异常信息不存在目标故障解决方案,将所述异常信息按照预设的发送方式发送至运维人员。
本实施例中,可以预先设置发送方式,例如,预设的发送方式可以为系统自动发送邮件或短信。当所述异常信息从未出现过时,不存在目标故障解决方案,将所述异常信息发送至运维人员,所述运维人员第一时间接收到异常信息,提高了故障处理的时效性。
s16,根据所述目标故障解决方案对所述异常信息进行故障处理。
本实施例中,在确定出目标故障解决方案时,采用所述目标故障解决方案自动对所述异常信息进行故障处理,无需发送给运维人员进行处理,提高了故障处理效率。
进一步地,所述方法还包括:
每隔预设时间段统计每个子系统的故障发生数;
按照预设的展示规则展示所有子系统的故障发生数。
具体地,所述预设的展示规则包括:将预设时间段内所有子系统的故障发生数占比按照圆饼图进行展示;或者,将预设时间段内所有子系统的故障发生数占比按照折线图进行展示;或者,将预设时间段内所有子系统的故障发生数按照降序或者升序排列展示。
本实施例中,通过按照预设的展示规则展示所有子系统的故障发生数,可以快速评估每个子系统的稳定性,辅助管理人员指派运维人员,提高了故障处理效率。
进一步地,所述方法还包括:
将每隔预设时间段统计的每个子系统的故障发生数与对应子系统的故障发生阈值进行比较,得到比较结果;
根据所述比较结果触发对应的预警。
示例性的,当预设时间段内每个子系统的故障发生数超过对应子系统的故障发生阈值的50%时,触发橙色预警;当预设时间段内每个子系统的故障发生数超过对应子系统的故障发生阈值的80%时,触发红色预警,通过触发不同方式的预警,及时提醒运维人员,提高故障处理效率。
综上所述,本实施例所述的多源数据的故障处理方法,一方面,通过按照所述第一故障类型的异常信息提取方式提取所述故障日志中的异常信息,由于不同的第一故障类型对应的异常信息提取方式不同,当确定了所述故障日志的第一故障类型时,根据所述第一故障类型匹配出对应的异常信息提取方式,具有针对性,提高了异常信息的提取效率及准确率,进而提高故障处理效率及准确率;另一方面,根据所述第二故障类型确定所述异常信息的目标故障解决方案,通过根据第二故障类型确定异常信息是否为已经出现过的故障,当为已经出现过的故障,将计算得到的相似度最大的第一句向量对应的标准答案直接确定为所述异常信息的目标故障解决方案,提高了故障处理的效率;最后,根据所述目标故障解决方案对所述异常信息进行故障处理,在确定出目标故障解决方案时,采用所述目标故障解决方案自动对所述异常信息进行故障处理,无需发送给运维人员进行处理,提高了故障处理效率。
实施例二
图2是本发明实施例二提供的多源数据的故障处理装置的结构图。
在一些实施例中,所述多源数据的故障处理装置20可以包括多个由程序代码段所组成的功能模块。所述多源数据的故障处理装置20中的各个程序段的程序代码可以存储于电子设备的存储器中,并由所述至少一个处理器所执行,以执行(详见图1描述)多源数据的故障处理的功能。
本实施例中,所述多源数据的故障处理装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:接收模块201、识别模块202、提取模块203、分类模块204、确定模块205、发送模块206及故障处理模块207。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
接收模块201,用于接收多个子系统上报的系统日志,解析所述系统日志获取故障日志,其中,所述故障日志中包含有故障子系统标识码。
本实施例中,系统日志是指系统运行过程日志,当对系统进行故障分析时,接收所有子系统上报的系统运行过程日志,解析所述运行过程日志获取故障日志,其中,所述故障日志中包含有故障子系统标识码,具体地,所述故障子系统标识码用于唯一识别每个子系统。
识别模块202,用于识别所述故障日志,确定所述故障日志的第一故障类型。
本实施例中,所述第一故障类型可以包括:页面访问故障和业务系统执行故障。
在一个可选的实施例中,所述识别模块202确定所述故障日志的第一故障类型包括:
识别所述故障日志中是否存在弹窗日志;
当所述故障日志中存在弹窗日志时,确定所述故障日志的第一故障类型为页面访问故障;
当所述故障日志中不存在弹窗日志时,确定所述故障日志的第一故障类型为业务系统执行故障。
本实施例中,通过识别故障日志中是否存在弹窗日志,根据识别结果确定第一故障类型。
在其他一些可选的实施例中,当所述故障日志中存在弹窗日志时,故障日志的第一故障类型也可以为业务系统执行故障。
在一个可选的实施例中,所述识别模块202识别所述故障日志中是否存在弹窗日志包括:
采用预设的正则模板匹配所述故障日志;
当在所述故障日志中匹配到弹窗标签时,确定所述故障日志中存在弹窗日志;
当在所述故障日志中未匹配到弹窗标签时,确定所述故障日志中不存在弹窗日志。
本实施例中,可以预先设置正则模板,通过预设的正则模板可以快速的匹配出所述故障日志中是否存在弹窗标签,当存在弹窗标签时,确定所述故障日志中存在弹窗日志。
提取模块203,用于按照所述第一故障类型的异常信息提取方式,提取所述故障日志中的异常信息。
本实施例中,由于不同的第一故障类型对应的异常信息提取方式不同,当确定了所述故障日志的第一故障类型时,根据所述第一故障类型匹配出对应的异常信息提取方式,具有针对性,提高了异常信息的提取效率及准确率,进而提高故障处理效率及准确率。
在一个可选的实施例中,所述提取模块203按照所述第一故障类型的异常信息提取方式提取所述故障日志中的异常信息包括:
当确定所述故障日志的第一故障类型为页面访问故障时,使用正则表达式提取所述故障日志中的页面访问的异常信息。
在一个可选的实施例中,所述提取模块203按照所述第一故障类型的异常信息提取方式提取所述故障日志中的异常信息包括:
当确定所述故障日志的第一故障类型为业务系统执行故障时,获取所述故障日志中的坐标信息和故障子系统标识码;
按照所述故障日志的坐标信息,调用弹窗截图服务对显示故障日志的故障子系统的访问页面进行截图,得到故障图片;
将所述故障图片发送至所述故障子系统标识码对应的故障接口,所述故障接口对所述故障图片进行文字识别,并进行异常信息的提取。
本实施例中,在确定故障日志的第一故障类型为业务系统执行故障,调用弹窗截图服务截取故障图片,并将所述故障图片发送至所述故障子系统标识码对应的故障接口进行异常信息提取,具体地,可以采用ocr技术识别,检测图片中的文本信息。本实施例通过将故障图片发送至故障子系统标识码对应的故障接口进行故障图片识别,避免出现故障图片堆积的现象,提高了异常信息的提取效率和准确率。
分类模块204,用于将所述异常信息输入至预先训练好的故障分类模型中进行分类,得到所述异常信息对应的第二故障类型。
本实施例中,当提取到异常信息时,需要对异常信息进行故障分类,确定异常信息的类别。
具体地,所述故障分类模型的训练过程包括:
获取多个故障类型及每个故障类型对应的异常信息作为样本数据集;
从所述样本数据集中按照预设的划分规则划分出训练集和验证集;
将所述训练集输入预设神经网络中进行训练,得到故障分类模型;
将所述验证集输入至所述故障分类模型中进行测试,并计算测试通过率;
若所述测试通过率大于或者等于预设通过率阈值,确定所述故障分类模型训练结束;若所述测试通过率小于预设通过率阈值,增加训练集的数量,重新进行故障分类模型的训练。
本实施例中,若存在m种故障类型,获取每个故障类型的异常信息作为样本数据集,并对故障类型进行统一编号为[1,m],本实施例可以按照70%和30%的比例将样本数据集划分为训练集和验证集,所述预设神经网络可以为birnn+attention深度学习框架,训练故障分类模型;由于采用attention机制,可以更好的表征文本,使训练出的故障分类模型具有更高的精度。
本实施例中,提取所述多个类别的异常信息输入至预先训练好的故障分类模型中,确定异常信息的类别,并且在后续的训练过程中,增加新的类别对应的异常信息作为新的数据,以增加所述数据集的数量,并基于新的数据集来重新训练故障分类模型,及不断的更新故障分类模型,从而不断的提高故障分类准确率。
确定模块205,用于根据所述第二故障类型确定所述异常信息的目标故障解决方案。
本实施例中,所述目标故障解决方案是指用于解决异常信息的方案,若异常信息为已经出现过的故障,存在目标故障解决方案,若异常信息为从未出现过的新故障,不存在目标故障解决方案。本实施例可以根据所述第二故障类型确定所述异常信息是否为已经出现过的故障。
在一个可选的实施例中,所述确定模块205根据所述第二故障类型确定所述异常信息的目标故障解决方案包括:
获取所述第二故障类型的编码;
识别预设数据库中的故障解决方案编码中是否存在与所述第二故障类型的编码相匹配的目标编码;
当确定所述预设数据库中的故障解决方案编码中存在与所述第二故障类型的编码相匹配的目标编码时,获取所述目标编码对应的预设的目标语料库;
对预设的目标语料库中的所有文本进行第一预处理,将预处理后的文本输入至预先训练好的词嵌入模型中,得到多个第一句向量;
对所述异常信息进行分词处理,得到多个分词,将所述多个分词转换为多个词向量,合并所述多个词向量,得到第二句向量;
计算所述第二句向量与每个第一句向量之间的相似度,并从所述相似度中选取出相似度最大的第一句向量作为目标句向量;
从预设的标准答案数据库中确定出所述目标句向量对应的标准答案,并将所述标准答案确定为所述异常信息的目标故障解决方案。
本实施例中,可以预先设置标准答案数据库,所述标准答案数据库中包含有多个句向量,及每个句向量对应的标准答案。
进一步地,所述对预设的目标语料库中的所有文本进行第一预处理,将预处理后的文本输入至预先训练好的词嵌入模型中,得到多个第一句向量包括:
对预设的目标语料库中的所有文本进行分词操作,得到词集合;
利用词向量映射模型将所述词集合映射为词向量集合;
将所述词向量集合表示为按词序排列的词向量矩阵;
基于所述词向量矩阵,计算每个词向量的上文向量及下文向量;
将每个词向量、所述词向量的上文向量以及所述词向量的下文向量进行拼接,得到包含上下文特征的第一文本向量;
将所述第一文本向量输入至预先训练好的词嵌入模型中,得到多个第一句向量。
本实施例中,可以根据文本的语序,对每个词的前一个词和后一个词分别进行特征向量的提取,其中,所述前一个词表示上文的词,所述后一个词表示下文的词,并与当前词合并,得到所述每个词的更新的词向量,所述更新的词向量表示包含了每个词的上下文特征,保存了准确的语义特征,将文本中的每个词以所述更新的词向量进行表示,从而可以得到文本的包含上下文特征的向量表示为第一文本向量。
进一步的,所述基于所述词向量矩阵,计算每个词向量的上文向量及下文向量包括:
将目标词向量的前一个词向量的上文向量与所述前一个词向量合并,得到所述目标词向量的上文向量;
将目标词向量的后一个词向量的下文向量与所述后一个词向量合并,得到所述目标词向量的下文向量。
本实施例中,所述上文向量是通过将所述目标词向量的前一个词向量的上文向量与所述前一个词向量合并得到的,所述下文向量是通过将目标词向量的后一个词向量的下文向量与所述后一个词向量合并得到的,通过将所述上文向量和所述下文向量进行拼接,得到包含上下文特征的第一文本向量,所述第一文本向量既能够保留文本的词序信息,也能够保存较远的词与词之间的联系信息,从而更加全面的对文本的语义进行了保留,提高了目标故障解决方案的准确率。
在一个可选的实施例中,所述计算所述第二句向量与每个第一句向量之间的相似度包括:
计算所述第二句向量与每个第一句向量之间的余弦相似度。
该可选的实施例中,所述余弦相似度用向量空间中两个向量的夹角的余弦值来衡量两个文本间的相似度。
余弦相似度的计算公式如下:
其中,(x1,x2,…,xn)为第二句向量,(y1,y2,…,yn)为第一句向量,cos(θ)为余弦相似度。
本实施例中,所述第二故障类型的编码用于识别所述第二故障类型是否为已经出现过的故障,将所述第二故障类型的编码与预设数据库中的故障解决方案编码进行匹配,根据匹配结果确定是否为已经出现过的故障,当确定所述预设数据库中的故障解决方案编码中存在与所述第二故障类型的编码相匹配的目标编码时,获取所述目标编码对应的预设的目标语料库,计算所述异常信息的第二句向量与所述目标语料库中的所有第一句向量之间的相似度,将计算得到的相似度最大的第一句向量对应的标准答案确定为所述异常信息的目标故障解决方案。
本实施例中,通过根据第二故障类型确定异常信息是否为已经出现过的故障,当为已经出现过的故障,将计算得到的相似度最大的第一句向量对应的标准答案直接确定为所述异常信息的目标故障解决方案,提高了故障处理的效率。
进一步地,发送模块206,用于当确定所述预设数据库中的故障解决方案编码中不存在与所述第二故障类型的编码相匹配的目标编码时,确定所述异常信息不存在目标故障解决方案,将所述异常信息按照预设的发送方式发送至运维人员。
本实施例中,可以预先设置发送方式,例如,预设的发送方式可以为系统自动发送邮件或短信。当所述异常信息从未出现过时,不存在目标故障解决方案,将所述异常信息发送至运维人员,所述运维人员第一时间接收到异常信息,提高了故障处理的时效性。
故障处理模块207,用于根据所述目标故障解决方案对所述异常信息进行故障处理。
本实施例中,在确定出目标故障解决方案时,采用所述目标故障解决方案自动对所述异常信息进行故障处理,无需发送给运维人员进行处理,提高了故障处理效率。
进一步地,每隔预设时间段统计每个子系统的故障发生数;按照预设的展示规则展示所有子系统的故障发生数。
具体地,所述预设的展示规则包括:将预设时间段内所有子系统的故障发生数占比按照圆饼图进行展示;或者,将预设时间段内所有子系统的故障发生数占比按照折线图进行展示;或者,将预设时间段内所有子系统的故障发生数按照降序或者升序排列展示。
本实施例中,通过按照预设的展示规则展示所有子系统的故障发生数,可以快速评估每个子系统的稳定性,辅助管理人员指派运维人员,提高了故障处理效率。
进一步地,将每隔预设时间段统计的每个子系统的故障发生数与对应子系统的故障发生阈值进行比较,得到比较结果;根据所述比较结果触发对应的预警。
示例性的,当预设时间段内每个子系统的故障发生数超过对应子系统的故障发生阈值的50%时,触发橙色预警;当预设时间段内每个子系统的故障发生数超过对应子系统的故障发生阈值的80%时,触发红色预警,通过触发不同方式的预警,及时提醒运维人员,提高故障处理效率。
综上所述,本实施例所述的多源数据的故障处理装置,一方面,通过按照所述第一故障类型的异常信息提取方式提取所述故障日志中的异常信息,由于不同的第一故障类型对应的异常信息提取方式不同,当确定了所述故障日志的第一故障类型时,根据所述第一故障类型匹配出对应的异常信息提取方式,具有针对性,提高了异常信息的提取效率及准确率,进而提高故障处理效率及准确率;另一方面,根据所述第二故障类型确定所述异常信息的目标故障解决方案,通过根据第二故障类型确定异常信息是否为已经出现过的故障,当为已经出现过的故障,将计算得到的相似度最大的第一句向量对应的标准答案直接确定为所述异常信息的目标故障解决方案,提高了故障处理的效率;最后,根据所述目标故障解决方案对所述异常信息进行故障处理,在确定出目标故障解决方案时,采用所述目标故障解决方案自动对所述异常信息进行故障处理,无需发送给运维人员进行处理,提高了故障处理效率。
实施例三
参阅图3所示,为本发明实施例三提供的电子设备的结构示意图。在本发明较佳实施例中,所述电子设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
本领域技术人员应该了解,图3示出的电子设备的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述电子设备3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述电子设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述电子设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述电子设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31用于存储程序代码和各种数据,例如安装在所述电子设备3中的多源数据的故障处理装置20,并在电子设备3的运行过程中实现高速、自动地完成程序或数据的存取。所述存储器31包括只读存储器(read-onlymemory,rom)、可编程只读存储器(programmableread-onlymemory,prom)、可擦除可编程只读存储器(erasableprogrammableread-onlymemory,eprom)、一次可编程只读存储器(one-timeprogrammableread-onlymemory,otprom)、电子擦除式可复写只读存储器(electrically-erasableprogrammableread-onlymemory,eeprom)、只读光盘(compactdiscread-onlymemory,cd-rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
在一些实施例中,所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(centralprocessingunit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少一个处理器32是所述电子设备3的控制核心(controlunit),利用各种接口和线路连接整个电子设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行电子设备3的各种功能和处理数据。
在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
尽管未示出,所述电子设备3还可以包括给各个部件供电的电源(比如电池),可选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
在进一步的实施例中,结合图2,所述至少一个处理器32可执行所述电子设备3的操作装置以及安装的各类应用程序(如所述的多源数据的故障处理装置20)、程序代码等,例如,上述的各个模块。
所述存储器31中存储有程序代码,且所述至少一个处理器32可调用所述存储器31中存储的程序代码以执行相关的功能。例如,图2中所述的各个模块是存储在所述存储器31中的程序代码,并由所述至少一个处理器32所执行,从而实现所述各个模块的功能以达到多源数据的故障处理的目的。
在本发明的一个实施例中,所述存储器31存储多个指令,所述多个指令被所述至少一个处理器32所执行以实现多源数据的故障处理的功能。
具体地,所述至少一个处理器32对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。本发明中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。