基于贝叶斯网络推理的IT应用故障诊断方法及相关组件与流程

文档序号:34162944发布日期:2023-05-14 22:17阅读:71来源:国知局
基于贝叶斯网络推理的IT应用故障诊断方法及相关组件与流程

本发明涉及故障诊断领域,特别涉及一种基于贝叶斯网络推理的it应用故障诊断方法及相关组件。


背景技术:

1、随着科技的进步,上线的软件系统变得越来越大型化和智能化,技术复杂程度不断提高,同时对软件运行的稳定性也提出了更高的要求。因此,各个it软件开发商采用了多种手段收集软件运行过程中的数据,如监控数据、日志数据、链路数据、告警数据等。这些软件运行过程中的数据对运维人员极为重要,尤其是在软件系统出现崩溃、宕机等问题时,软件系统故障发生前后的运行数据能够帮助运维人员快速的定位问题,有利于运维人员对故障的软件系统进行恢复。

2、但是目前的软件故障发生后,多采用人工方式进行故障定位、评估、恢复,在面对大型及复杂的软件系统时,故障定位需要考虑的因素非常多,问题定位难度呈现指数增加;同时,由于目前流行微服务架构的应用,一般各个微服务组件之间关系较为紧密,这也给运维人员提出了较高的要求,甚至还需要运维人员了解部分关联逻辑。因此单纯依靠人工来处理软件应用故障时存在定位慢、定位难的问题。


技术实现思路

1、有鉴于此,本发明的目的在于提供一种基于贝叶斯网络推理的it应用故障诊断方法,能够通过构建贝叶斯网络模型对软件应用故障数据进行诊断,提高了软件应用故障诊断的效率和准确率。其具体方案如下:

2、第一方面,本技术提供了一种基于贝叶斯网络推理的it应用故障诊断方法,包括:

3、基于专家经验构建初始贝叶斯网络诊断模型,并将所述初始贝叶斯网络诊断模型转化为道德图;

4、利用最大势算法和图示评审技术对所述道德图进行三角化,以得到三角化后道德图;

5、区分所述三角化后道德图的连接簇和分离点,并基于所述分离点对应的分离点质量和分离点成本以及所述连接簇构建连接树;其中,所述分离点质量为所述分离点包含的变量个数;所述分离点成本为所述分离点连接的两个所述连接簇中包含的变量个数;

6、对所述连接树进行量化得到量化后连接树,并将软件应用故障数据输入所述量化后连接树,通过边缘化确定所述量化后连接树中各节点的后验概率,以得到对应的联合概率分布;

7、利用重要性采样算法对新增证据进行重要性采样,并将得到的采样后证据输入所述量化后连接树,以对所述联合概率分布进行更新并得到相应的软件应用故障信息。

8、可选的,所述将所述初始贝叶斯网络诊断模型转化为道德图,包括:

9、通过增加无向边的方式将所述初始贝叶斯网络诊断模型中同一节点对应的父节点两两相连,并将所述初始贝叶斯网络诊断模型中的每条有向边均转换为无向边,以得到道德图。

10、可选的,所述利用最大势算法和图示评审技术对所述道德图进行三角化,以得到三角化后道德图,包括:

11、利用最大势算法对所述道德图中的所有节点进行排序,以得到对应的节点序列;

12、利用图示评审技术并按照所述节点序列对所述道德图中的超过三个节点的环进行消环操作,以得到三角化后道德图。

13、可选的,所述利用最大势算法对所述道德图中的所有节点进行排序,以得到对应的节点序列,包括:

14、分别计算当前道德图中每个节点对应的所有后继节点的势值之和,以得到每个节点对应的节点势值;

15、从各所述节点势值中选择出势值最小的目标节点势值,并确定出与所述目标节点势值对应的目标节点;

16、将所述目标节点加入排序序列,并将所述目标节点从当前道德图中删除,以得到删除后道德图;

17、将所述删除后道德图作为新的当前道德图,并重新跳转至所述分别计算当前道德图中每个节点对应的所有后继节点的势值之和的步骤,直至将所述道德图中的所有节点均加入所述排序序列,以得到对应的节点序列。

18、可选的,所述利用图示评审技术并按照所述节点序列对所述道德图中的超过三个节点的环进行消环操作,以得到三角化后道德图,包括:

19、选择所述节点序列中的第一个节点作为当前目标节点;

20、将当前目标节点确定为当前遍历基准点,利用广度优先搜索算法对当前遍历基准点对应的后继节点进行遍历,并记录已遍历后继节点和未遍历后继节点;

21、若存在所述未遍历后继节点,则将所述未遍历后继节点作为新的当前遍历基准点,并跳转至所述利用广度优先搜索算法对当前遍历基准点对应的后继节点进行遍历的步骤;

22、若存在所述已遍历后继节点,则通过在当前遍历基准点和所述已遍历后继节点之间增加无向边的方式消除对应的超过三个节点的环;

23、在针对当前目标节点的后继节点的遍历操作之后,选择所述节点序列中的下一个节点作为新的当前目标节点,并跳转至所述将当前目标节点确定为当前遍历基准点,利用广度优先搜索算法对当前遍历基准点对应的后继节点进行遍历的步骤,直至所述节点序列中的所有节点均被选择过,以得到三角化后道德图。

24、可选的,所述区分所述三角化后道德图的连接簇和分离点,并基于所述分离点对应的分离点质量和分离点成本以及所述连接簇构建连接树,包括:

25、区分所述三角化后道德图的连接簇,并基于各所述连接簇生成对应行数和列数的对称数组,在所述对称数组的上三角部分分别记录对应的两个所述连接簇之间的分离点,以得到记录后对称数组;

26、分别确定所述记录后对称数组中记录的各所述分离点对应的分离点质量,并从各所述分离点中筛选出分离点质量最大的初始分离点;

27、若所述初始分离点对应的分离点数量大于1,则分别确定各所述初始分离点对应的分离点成本,并从各所述初始分离点中筛选出分离点成本最小的目标分离点;

28、基于所述目标分离点以及与所述目标分离点相关的各所述连接簇构建连接树,确定所述连接树中是否包含所有的所述连接簇;

29、若否,则基于所述连接树中包含的所述连接簇构建对应的新连接簇,利用所有所述连接簇中不存在于所述连接树中的剩余连接簇以及所述新连接簇生成对应行数和列数的对称数组,并跳转至所述在所述对称数组的上三角部分分别记录对应的两个所述连接簇之间的分离点的步骤,直至所述连接树中包含所有的所述连接簇,以得到最终的连接树。

30、可选的,所述利用重要性采样算法对新增证据进行重要性采样,包括:

31、确定均匀采样分布,并利用随机数生成算法从所述均匀采样分布中随机选取若干样本;

32、确定目标样本在真实分布中出现的真实概率,并确定所述目标样本在所述均匀采样分布中出现的采样概率;所述目标样本为所述若干样本中的任意一个;

33、基于所述真实概率和所述采样概率确定所述目标样本对应的概率比值,并将所述概率比值作为所述目标样本对应的重要性权重;

34、利用所述若干样本分别对应的所述重要性权重对新增证据进行重要性采样,以得到采样后证据。

35、第二方面,本技术提供了一种基于贝叶斯网络推理的it应用故障诊断装置,包括:

36、模型道德化模块,用于基于专家经验构建初始贝叶斯网络诊断模型,并将所述初始贝叶斯网络诊断模型转化为道德图;

37、道德图三角化模块,用于利用最大势算法和图示评审技术对所述道德图进行三角化,以得到三角化后道德图;

38、连接树构建模块,用于区分所述三角化后道德图的连接簇和分离点,并基于所述分离点对应的分离点质量和分离点成本以及所述连接簇构建连接树;其中,所述分离点质量为所述分离点包含的变量个数;所述分离点成本为所述分离点连接的两个所述连接簇中包含的变量个数;

39、概率确定模块,用于对所述连接树进行量化得到量化后连接树,并将软件应用故障数据输入所述量化后连接树,通过边缘化确定所述量化后连接树中各节点的后验概率,以得到对应的联合概率分布;

40、重要性采样模块,用于利用重要性采样算法对新增证据进行重要性采样,并将得到的采样后证据输入所述量化后连接树,以对所述联合概率分布进行更新并得到相应的软件应用故障信息。

41、第三方面,本技术提供了一种电子设备,包括:

42、存储器,用于保存计算机程序;

43、处理器,用于执行所述计算机程序以实现前述的基于贝叶斯网络推理的it应用故障诊断方法。

44、第四方面,本技术提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现前述的基于贝叶斯网络推理的it应用故障诊断方法。

45、本技术中,基于专家经验构建初始贝叶斯网络诊断模型,并将所述初始贝叶斯网络诊断模型转化为道德图;利用最大势算法和图示评审技术对所述道德图进行三角化,以得到三角化后道德图;区分所述三角化后道德图的连接簇和分离点,并基于所述分离点对应的分离点质量和分离点成本以及所述连接簇构建连接树;其中,所述分离点质量为所述分离点包含的变量个数;所述分离点成本为所述分离点连接的两个所述连接簇中包含的变量个数;对所述连接树进行量化得到量化后连接树,并将软件应用故障数据输入所述量化后连接树,通过边缘化确定所述量化后连接树中各节点的后验概率,以得到对应的联合概率分布;利用重要性采样算法对新增证据进行重要性采样,并将得到的采样后证据输入所述量化后连接树,以对所述联合概率分布进行更新并得到相应的软件应用故障信息。由此可见,本技术通过利用最大势算法和图示评审技术对道德图进行三角化,充分发挥了最大势算法的排序优势,以及图示评审技术的消环能力,极大地提高了道德图三角化的准确性;另外,本技术通过采用重要性采样算法,将一些更具代表性的证据加入量化后连接树,提高了输入量化后连接树中的证据的有效性;除此之外,本技术通过构建基于贝叶斯网络的软件应用故障诊断模型,避免了使用人工方式进行故障诊断所带来的耗费大量人力和时间的问题,提高了软件应用故障诊断的效率和准确率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1