本申请涉及计算机,具体而言,涉及一种故障根因定位方法、装置、设备和存储介质。
背景技术:
1、随着工业领域的发展,工业系统涉及了庞大规模的软、硬件系统,并且各软、硬件系统的复杂性都较高,在运行中不免会发生各种各样的故障,而一旦发生故障,需要对发生故障的实体进行定位,基于故障定位的效率以及精确度,针对故障的定位。
2、然而,目前现有的故障根因分析方案往往仅通过关联关系推理,容易最终定位浅层原因而未发现根本原因,或者由于未考虑造成业务异常的多个维度间存在耦合关联关系,导致故障根因分析方案不完善,使得故障诊断的准确率过低,不能精准定位故障根因。
技术实现思路
1、为了解决上述问题,本申请实施例提供了一种故障根因定位方法、装置、设备和存储介质。
2、第一方面,本申请实施例提供了一种故障根因定位方法,所述方法包括:
3、基于各网络节点之间的因果关系创建因果导向图;
4、当检测到网络故障时,获取所述因果导向图中的初始故障节点以及与所述初始故障节点存在因果关系的其他网络节点之间的相关性和状态转移概率;
5、基于所述相关性和所述状态转移概率,确定目标故障节点。
6、优选的,所述基于各网络节点之间的因果关系建立因果导向图,包括:
7、基于同级网络节点之间的因果关系和上下级网络节点之间的因果关系建立因果导向图。
8、优选的,所述基于各网络节点之间的因果关系建立因果导向图,还包括:
9、获取集群内的多个网络节点的服务层性能指标;
10、针对每个所述网络节点,对所述服务层性能指标进行分类得到多类指标集合;
11、采用预先建立的因果分析模型对所述指标集合中的每个所述服务层性能指标之间的因果关系进行分析,构建每类所述指标集合对应的因果导向子图;
12、将多个因果导向子图进行合并,得到因果导向图。
13、优选的,所述当检测到网络故障时,获取所述因果导向图中的初始故障节点以及与所述初始故障节点存在因果关系的其他网络节点之间的相关性和状态转移概率,包括:
14、计算所述因果导向图中的相邻两个网络节点的皮尔森相关系数;
15、基于所述皮尔森相关系数确定所述初始故障节点以及与所述初始故障节点存在因果关系的其他网络节点之间的相关性。
16、优选的,所述当检测到网络故障时,获取所述因果导向图中的初始故障节点以及与所述初始故障节点存在因果关系的其他网络节点之间的相关性和状态转移概率,包括:
17、当检测到网络故障时,确定所述网络故障由所述初始故障节点进行随机游走的状态转移概率;所述状态转移概率包括前向游走概率、后向游走概率和原点停留概率。
18、优选的,所述基于所述相关性和所述状态转移概率,确定目标故障节点,包括:
19、基于初始故障节点以及与初始故障节点存在因果关系的其他网络节点之间的相关性,确定中间故障节点;
20、基于网络故障对应的状态转移概率对所述中间故障节点进行筛选,确定目标故障节点。
21、优选的,基于所述状态转移概率对所述中间故障节点中的网络节点进行筛选,将状态转移概率大于预设阈值的网络节点确定为目标故障节点。
22、第二方面,本申请实施例提供了一种故障根因定位装置,所述装置包括:
23、创建模块,用于基于各网络节点之间的因果关系创建因果导向图;
24、获取模块,用于当检测到网络故障时,获取所述因果导向图中的初始故障节点以及与所述初始故障节点存在因果关系的其他网络节点之间的相关性和状态转移概率;
25、确定模块,用于基于所述相关性和所述状态转移概率,确定目标故障节点。
26、第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面或第一方面的任意一种可能的实现方式提供的方法的步骤。
27、第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面或第一方面的任意一种可能的实现方式提供的方法。
28、本发明的有益效果为:通过创建因果导向图确定各网络节点之间的相关性和状态转移概率,从而可以准确定位包括初始故障节点在内的多个故障节点,解决了故障根因误判问题,提高了故障根因定位的准确性。
1.一种故障根因定位方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于各网络节点之间的因果关系创建因果导向图,包括:
3.根据权利要求1所述的方法,其特征在于,所述基于各网络节点之间的因果关系创建因果导向图,还包括:
4.根据权利要求1所述的方法,其特征在于,所述当检测到网络故障时,获取所述因果导向图中的初始故障节点以及与所述初始故障节点存在因果关系的其他网络节点之间的相关性和状态转移概率,包括:
5.根据权利要求1所述的方法,其特征在于,所述当检测到网络故障时,获取所述因果导向图中的初始故障节点以及与所述初始故障节点存在因果关系的其他网络节点之间的相关性和状态转移概率,包括:
6.根据权利要求1所述的方法,其特征在于,所述基于所述相关性和所述状态转移概率,确定目标故障节点,包括:
7. 根据权利要求6所述的方法,其特征在于, 还包括:
8.一种故障根因定位装置,其特征在于,所述装置包括:
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述方法的步骤。