故障根因定位方法、装置、电子设备和存储介质与流程

文档序号:32388164发布日期:2022-11-30 07:05阅读:53来源:国知局
故障根因定位方法、装置、电子设备和存储介质与流程

1.本技术涉及故障根因定位技术领域,尤其涉及一种故障根因定位方法、装置、电子设备和存储介质。


背景技术:

2.随着云计算时代的到来,越来越多的场合需要进行数据中心的建设,基于数据中心的应用系统的数量也飞速上升,各种应用系统出现复杂的调用和访问关系,使得系统的运行稳定性和可靠性出现问题。因此,对于级联应用系统的故障的识别与根因定位便成为了社会研究的一个方向。
3.当前,为保证级联系统的可靠性,现有技术需要依靠技术人员的专业知识,对级联系统中不同的应用系统进行逐一排查,通过信息汇总进行故障根因分析,才能确定故障根因所在。但是,这种方法耗费大量人力和时间,故障根因定位的效率较低,且准确性也无法保证。


技术实现要素:

4.本技术提供了一种故障根因定位方法、装置、电子设备和存储介质,以提高了故障识别的准确性和故障根因定位的效率。
5.根据本技术的一方面,提供了一种故障根因定位方法,所述方法包括:
6.获取当前应用系统所在级联应用系统中各应用系统的级联关系,构建级联关系图;
7.根据当前应用系统的评价指标数据,确定当前应用系统的健康评价值;
8.根据当前应用系统的健康评价值和级联关系图,对当前应用系统的父应用系统和子应用系统进行健康评价;
9.基于健康评价结果和当前应用系统的健康评价值,对级联应用系统的故障根因进行定位。
10.根据本技术的另一方面,提供了一种故障根因定位装置,包括:
11.级联图构建模块,用于获取当前应用系统所在级联应用系统中各应用系统的级联关系,构建级联关系图;
12.评价值确定模块,用于根据当前应用系统的评价指标数据,确定当前应用系统的健康评价值;
13.级联评价模块,用于根据当前应用系统的健康评价值和级联关系图,对当前应用系统的父应用系统和子应用系统进行健康评价;
14.故障根因定位模块,用于基于健康评价结果和当前应用系统的健康评价值,对级联应用系统的故障根因进行定位。
15.根据本技术的另一方面,提供了一种电子设备,所述电子设备包括:
16.至少一个处理器;以及
17.与所述至少一个处理器通信连接的存储器;其中,
18.所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本技术任一实施例所述的故障根因定位方法。
19.根据本技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本技术任一实施例所述的故障根因定位方法。
20.本技术实施例的技术方案,对当前应用系统以及其父应用系统和子应用系统进行健康评价,根据各应用系统的健康评价值对级联应用系统中存在的故障进行诊断与根因定位。不同的评价指标对应用系统进行健康评价可以提高健康评价的全面性和准确性,解决现有技术中发生故障时自身没有任何告警数据产生,从而无法进行故障根因定位的弊端。同时,通过对父应用系统和子应用系统的健康评价,综合对故障根源进行定位,提高了故障根因定位的准确性和效率。
21.应当理解,本部分所描述的内容并非旨在标识本技术的实施例的关键或重要特征,也不用于限制本技术的范围。本技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
22.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
23.图1是根据本技术实施例一提供的一种故障根因定位方法的流程图;
24.图2a是根据本技术实施例二提供的一种故障根因定位方法的流程图;
25.图2b是根据本技术实施例二提供的一种级联应用系统的示意图;
26.图3是根据本技术实施例三提供的一种故障根因定位装置的结构示意图;
27.图4是根据本技术实施例四提供的一种根因定位诊断系统的示意图;
28.图5是实现本技术实施例的故障根因定位方法的电子设备的结构示意图。
具体实施方式
29.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
30.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于
100之间的分值。同为业务指标数据下属的各项指标的评分可以通过加权和的方式从业务指标数据的角度为当前应用系统进行健康评价。同理,性能指标数据和告警数据也可以按照上述方式对当前应用系统进行健康评价。以此可以得到不同评价指标数据对应的评分,再通过加权和的方式计算最终的健康评价值。当然,进行加权和计算时所用的权重可以由相关技术人员根据大量试验或者人工经验得出,还可以根据预先训练的机器学习模型或大数据模型等对不同的评价指标数据进行分析,以根据不同评价指标数据对应用系统的影响而确定不同的权重,本技术实施例对此不作限定。
40.当然,也可以根据各评价指标数据与正常运行状态的指标的差异程度,从满分(例如100分)向下逐步扣分。例如,由于业务指标数据包括多项指标,根据不同指标与正常运行状态下的指标进行比对,若不能达到正常运行指标就从满分向下扣分,多个指标进行扣分的累计,扣除所有项后即可以得到业务指标数据对应的评分。例如,若当前应用系统的每分钟交易量较正常运行状态的每分钟交易量少30%,则扣除10分,同时响应时间较正常的100ms超出30ms,则扣除10分,此时业务指标数据对应的评分只有80分,若还有其他的指标则继续进行扣分(直至所有指标均参与了评分计算或者评分扣至0分)。同理,性能指标数据和告警数据也可以按照上述方式对当前应用系统进行健康评价。以此可以得到不同评价指标数据对应的评分,再通过加权和的方式计算最终的健康评价值。当然,进行加权和计算时所用的权重可以由相关技术人员根据大量试验或者人工经验得出,还可以根据预先训练的机器学习模型或大数据模型等对不同的评价指标数据进行分析,以根据不同评价指标数据对应用系统的影响而确定不同的权重,本技术实施例对此不作限定。
41.s130、根据当前应用系统的健康评价值和级联关系图,对当前应用系统的父应用系统和子应用系统进行健康评价。
42.其中,父应用系统可以是当前应用系统的上游系统,即父应用系统可以调用当前应用系统;同理,子应用系统可以是当前应用系统的下游系统,即当前应用系统可以调用子应用系统。需要说明的是,当前应用系统可以具备多个父应用系统,也可以同时具备多个子应用系统。
43.在前述步骤中确定了当前应用系统的健康评价值后可以对当前应用系统进行判断,是否需要进一步的对当前应用系统的父应用系统和子应用系统进行查看。例如当前应用系统的健康评价值反映出当前应用系统具备一些故障,但可能不是故障源头,因此需要对当前应用系统的父应用系统和子应用系统进行探查,并对各父应用系统和各子应用系统进行健康评价,以得到健康评价值。可以理解的是,对父应用系统和子应用系统进行健康评价的方法可以和对当前应用系统的健康评价值的计算方法相同。
44.s140、基于健康评价结果和当前应用系统的健康评价值,对级联应用系统的故障根因进行定位。
45.其中,健康评价结果即是对各父应用系统和各子应用系统的健康评价的结果,故障根因定位的方法可以采用现有技术中任意一种故障根因定位算法,本技术实施例对此不作限定。
46.在一种可选实施方式中,所述基于健康评价结果和当前应用系统的健康评价值,对级联应用系统的故障根因进行定位,可以包括:根据当前应用系统的健康评价值、父应用系统的健康评价值和子应用系统的健康评价值,确定级联应用系统的故障应用系统。
47.可以理解的是,健康评价结果可以包括各父应用系统的健康评价值和各子应用系统的健康评价值。因此,对前应用系统的健康评价值、各父应用系统的健康评价值和各子应用系统的健康评价值进行统计比对,选择健康评价值最低(即故障概率最高)的n个应用系统作为故障根源的定位,其中n可以由相关技术人员预先设定。
48.本技术实施例的技术方案,对当前应用系统以及其父应用系统和子应用系统进行健康评价,根据各应用系统的健康评价值对级联应用系统中存在的故障进行诊断与根因定位。不同的评价指标对应用系统进行健康评价可以提高健康评价的全面性和准确性,解决现有技术中发生故障时自身没有任何告警数据产生,从而无法进行故障根因定位的弊端。同时,通过对父应用系统和子应用系统的健康评价,综合对故障根源进行定位,提高了故障根因定位的准确性和故障识别的效率。
49.实施例二
50.图2a为本技术实施例二提供的一种故障根因定位方法的流程图,本实施例是在前述各实施例的基础上,对父应用系统和子应用系统的健康评价操作进行的进一步的细化。如图2a所示,该方法包括:
51.s210、获取当前应用系统所在级联应用系统中各应用系统的级联关系,构建级联关系图。
52.s220、根据当前应用系统的评价指标数据,确定当前应用系统的健康评价值。
53.s230、若当前应用系统的健康评价值符合预设健康阈值,则根据级联关系图,对父应用系统和子应用系统进行健康评价。
54.其中,预设健康阈值用于表征故障概率的可能性较低,可以是父应用系统和子应用系统进行探查的条件,若当前应用系统的健康评价值符合预设健康阈值,则说明当前应用系统是故障源头的概率较低,需要对上下游的应用系统进行进一步探查。因此根据级联关系图中的上下游关系,对当前应用系统的父应用系统和子应用系统进行健康评价。
55.在一种可选实施方式中,所述子应用系统包括浅层子应用系统和深层子应用系统;相应的,所述根据级联关系图,对子应用系统进行健康评价,可以包括:根据浅层子应用系统的评价指标数据,确定浅层子应用系统的健康评价值;若浅层子应用系统的健康评价值符合预设健康阈值,则对浅层子应用系统的深层子应用系统进行健康评价。
56.其中,浅层子应用系统和深层子应用系统是相对概念,由于级联关系图中的各应用系统存在上下游的调用关系,使得当前应用系统可能存在多层级的子应用系统。例如,一级子应用系统为直接被当前应用系统调用的至少一个应用系统,二级子应用系统为被一级子应用系统调用的至少一个应用系统。那么,浅层子应用系统可以是一级子应用系统,相应的,深层子应用系统可以是二级子应用系统。当浅层子应用系统是二级子应用系统时,深层子应用系统则是三级子应用系统,依此类推。
57.若对浅层子应用系统进行健康评价后,其健康评价值符合预设健康阈值(即该浅层子应用系统是故障源头的概率较低,需要进一步向下游系统探查),则对该浅层子应用系统的各个深层子应用系统进行健康评价。
58.进一步的,若浅层子应用系统的健康评价值大于预设健康阈值,则停止对浅层子应用系统的深层子应用系统进行健康评价。
59.可以理解的是,若浅层子应用系统的健康评价值非常高(即表明该浅层子应用系
统是故障根源的可能性非常小),则无需对该浅层子应用系统的下游系统继续探查。这样做可以节省探查和计算的资源,节省故障根因定位和根因定位的时间,缩小了子应用系统的探查范围,提高了故障根因定位和定位的效率。
60.在另一种可选实施方式中,所述父应用系统包括至少一个层级;相应的,所述对父应用系统进行健康评价,还可以包括:根据父应用系统的评价指标数据,确定至少一个层级的父应用系统的健康评价值。
61.可以理解是,与当前应用系统存在多个层级的子应用系统相似,当前应用系统可以存在多个层级的父应用系统,每个层级至少包括一个应用系统,由于上游系统调用下游系统,上游系统对下游系统的故障影响较小,对多个层级的父应用系统进行探查时需要进行全面的健康评价。
62.在一种可选实施方式中,所述方法还可以包括:若进行健康评价的父应用系统或子应用系统的系统评价量符合预设评价量,则控制停止对父应用系统进行健康评价;其中,评价量包括应用系统的数量和/或层级。
63.其中,评价量可以是对应用系统进行健康评价的系统数量或者层级数量。预设评价量可以是预先设定的系统数量和/或层级数量的极限,可以理解为探查停止的条件。以父应用系统为例(子应用系统同理),设定预设评价量为30个系统,向当前应用系统的父应用系统进行探查(确定各父应用系统的健康评分值),当探查达到30个应用系统时停止探查;还可以设定预设评价量为4个层级,当探查完当前应用系统的上游四层父应用系统时停止探查。当然,对于系统数量和层级数量可以融合使用,本技术实施例对此不作限定。
64.s240、基于健康评价结果和当前应用系统的健康评价值,对级联应用系统的故障根因进行定位。
65.在一种具体的实施方式中,如图2b所示,某应用系统b0具备一级父应用系统b1、b2和b3,以及二级父应用系统b11、b12、b21、b22、b31和b32;同时具备一级子应用系统b4、b5和b6,一级二级子应用系统b41、b42、b51、b52、b61和b62。这些应用系统构成了如图2b所示的级联关系图。需要说明的是,图2b仅示意了两级父应用系统和两级子应用系统,不可理解为对层级数量的限定。
66.在对图2b中的某应用系统b0(相当于当前应用系统)进行故障根因分析时,首先根据多种评价指标数据进行加权和,计算出该应用系统b0发生故障的概率(等价于前述健康评价分),然后根据级联关系图向上游系统探查出该应用系统b0的所有第一级父应用系统(如图中所示的b1、b2、b3),对每个第一级父应用系统采用同样的多种评价指标数据加权和方法,计算出其每个父应用系统的故障概率。在没有触发挖掘终止条件时,可以继续根据级联关系图再向上游探查出一级父应用系统的每个父应用系统,即第二级父应用系统(如图中所示的b11、b12、b21、b22、b31、b32),对每个第二级父应用系统采用同样的多种评价指标数据加权和方法,计算出故障概率。同样的,在没有触发终止条件(即达到预设评价量)时,会继续往上探查出第三级、第四级
……
父应用系统的故障概率,直到达到终止条件为止。同样的,对第一级子应用系统(如图中所示的系统b4、b5、b6)采用类似的多种评价指标数据加权和方法,计算出每个子应用系统的故障概率,在没有触发终止条件时,会继续对第二级、第三级、第四级
……
子应用系统进行故障概率计算,直到达到终止条件为止。
67.需要补充说明的是,级联应用系统并不仅限于图2b所示,还可以是其他多种不同
形式的级联关系图,例如是反映服务提供方和服务消费方的多应用关系的网状图,或者是直接级联、跨层级联的应用关系图等,或者是不区分上下级的多应用并列存在的集群式部署的应用关系图,或者是以集群形式部署网状图,级联到另一种集群形式部署的网状图等,本技术实施例对此不作限定。
68.本技术实施例的技术方案,通过对父应用系统和子应用系统的分层评价,对子应用系统针对性的探查和对父应用系统全面性的探查,使得故障根因定位和根因识别更加高效和准确。
69.实施例三
70.图3为本技术实施例三提供的一种故障根因定位装置的结构示意图。
71.如图3所示,该装置300包括:
72.级联图构建模块310,用于获取当前应用系统所在级联应用系统中各应用系统的级联关系,构建级联关系图;
73.评价值确定模块320,用于根据当前应用系统的评价指标数据,确定当前应用系统的健康评价值;
74.级联评价模块330,用于根据当前应用系统的健康评价值和级联关系图,对当前应用系统的父应用系统和子应用系统进行健康评价;
75.故障根因定位模块340,用于基于健康评价结果和当前应用系统的健康评价值,对级联应用系统的故障根因进行定位。
76.本技术实施例的技术方案,对当前应用系统以及其父应用系统和子应用系统进行健康评价,根据各应用系统的健康评价值对级联应用系统中存在的故障进行诊断与根因定位。不同的评价指标对应用系统进行健康评价可以提高健康评价的全面性和准确性,解决现有技术中发生故障时自身没有任何告警数据产生,从而无法进行故障根因定位的弊端。同时,通过对父应用系统和子应用系统的健康评价,综合对故障根源进行定位,提高了故障根因定位的准确性和效率。
77.在一种可选实施方式中,所述级联评价模块330可具体用于:
78.若当前应用系统的健康评价值符合预设健康阈值,则根据级联关系图,对父应用系统和子应用系统进行健康评价。
79.在一种可选实施方式中,所述子应用系统包括浅层子应用系统和深层子应用系统;相应的,所述级联评价模块330可以包括:
80.浅层评价单元,用于根据浅层子应用系统的评价指标数据,确定浅层子应用系统的健康评价值;
81.深层评价单元,用于若浅层子应用系统的健康评价值符合预设健康阈值,则对浅层子应用系统的深层子应用系统进行健康评价。
82.在一种可选实施方式中,所述父应用系统包括至少一个层级;相应的,所述级联评价模块330可以包括:
83.父系统评价单元,用于根据父应用系统的评价指标数据,确定至少一个层级的父应用系统的健康评价值。
84.在一种可选实施方式中,所述装置300可以包括:
85.若进行健康评价的父应用系统或子应用系统的系统评价量符合预设评价量,则控
制停止对级联应用系统进行健康评价;其中,评价量包括应用系统的数量和/或层级。
86.在一种可选实施方式中,所述故障根因定位模块340可以具体用于:
87.根据当前应用系统的健康评价值、父应用系统的健康评价值和子应用系统的健康评价值,确定级联应用系统的故障应用系统。
88.在一种可选实施方式中,所述评价指标数据包括业务指标数据、性能指标数据和告警数据;相应的,所述评价值确定模块320可以具体用于:
89.根据当前应用系统的业务指标数据、性能指标数据和告警数据中的至少一项,确定当前应用系统的健康评价值。
90.本技术实施例所提供的故障根因定位装置可执行本技术任意实施例所提供的故障根因定位方法,具备执行各故障根因定位方法相应的功能模块和有益效果。
91.实施例四
92.本技术实施例四是在前述各实施例基础上提供的一种故障根因定位系统的优选实施例,本技术实施例所述的故障根因定位系统可以应用于对级联应用系统进行故障根因诊断与定位的场景,且具备前述各实施例的方法与装置的功能和有益效果。该故障根因定位系统如图4所示,具体如下:
93.该故障根因定位系统包括以下多种不同功能模块(此处所述功能模块与前述实施例三中功能模块并不相同,仅用于在本实施例中进行阐述),如数据采集模块、数据存储模块、数据处理模块、故障定位模块、结果存储模块和界面展示模块。以上各模块的功能和数量并不是本技术的限制性因素,本领域技术人员应该知道,对该故障根因定位系统的某几个模块进行整合、删除、修改或者替换为其他模块,并不会影响本系统的整体功能发挥,故而也属于本技术保护的范围。
94.本技术所述采集的数据种类包括但不仅限于:某应用系统运行的业务黄金指标数据,支撑该业务系统的cmdb业务架构数据,该应用系统内部不同节点所依赖的多种调用关系数据,反映该业务系统中节点运行时硬件或软件状态的性能指标数据,基于该性能指标或业务黄金指标异常时所产生的告警数据等。
95.本技术公开的故障根因定位系统中所包括的数据采集模块,其主要功能是将多种不同维度的数据进行实时采集,确保数据从不同来源都归结到统一的数据存储模块中,其采集方法包括但不仅限于:从kafka数据源接入实时数据,以restful api的方式采集到的实时数据,对数据源轮询后得到的多种实时数据等。
96.故障根因定位系统中所包括的数据存储模块,其主要功能是将数据采集模块收集的多种不同维度的数据进行持久化存储,其主要保存载体有多种不同关系型数据库,例如mysql、oracle等数据库,也可以是多种不同非关系型数据库,例如mongodb、elasticsearch数据库、hdfs数据库、hbase和gbase等。数据存储模块主要考量的是存储系统中硬盘容量大小。示例性的,数据存储并不仅限于某一种数据库,可以是多种不同数据库的组合,比如,使用多种不同数据库联合存储然后再建立索引映射关系节点的存储方法,比如对于性能指标数据,通常数据量非常大,可以放置在es(elasticsearch,分布式搜索和分析引擎)中单独建立一个索引来存储,告警数据可以存储在多种关系型数据库中,比如mysql和oracle等数据库中,也可以存储在多种非关系型数据库中,比如mongodb,nosql数据库中,然后根据所存储的数据库类型,数据库地址,端口号等建立每一个节点的数据映射关系,构建出索引映
射关系节点。
97.故障根因定位系统中所包括的数据处理模块,其主要功能是对实时采集的数据进行快速地流式处理,也可以将保存的数据进行历史批量型处理,数据处理模块中所采用的技术框架包括但不仅限于,使用spark streaming、spark sql和spark mllib等来进行数据处理,也可以采用例如python、java、matlab、c++和c#等计算机语言所编写的数据处理模块,数据处理的内容包括但不仅限于:对数据进行归一化处理,将数据进行字段对齐,字段格式标准化处理,数据缺失值填充,数据分布类型转换,类别数据的数值化转换等。数据处理模块相当于缓冲层,其目的是确保采集到的数据进行统一标准化处理后,可以更好的输送到故障定位模块中,以减少故障定位模块的计算压力,加快故障根因定位的时间。
98.故障根因定位系统中所包括的故障定位模块,其主要功能是对数据处理模块得到的多维度数据进行综合分析,对级联应用系统中的每一级应用系统进行故障概率(等价于前述健康评价值)计算,最终定位出发生故障的应用系统,确定故障根源的应用系统。故障定位模块得到的根因结果可以进一步保存到结果存储模块。
99.故障根因定位系统中所包括的结果存储模块,其主要功能是对故障定位模块的中间计算结果和定位得到的故障根因结果等数据进行存储,由于某些中间结果是临时性存储,故而可以存储在例如kafka和rabbitmq等消息队列中,也可以存储在例如redis、mysql和mongodb等各种数据库中,也可以存储在例如elasticsearch、oracle等数据库中。结果存储模块由于部分数据是临时性存储,故而该模块还配置了定时清理机制,在某些预定的触发条件下,该模块会自动对该模块中的中间结果进行清理,确保临时结果在时效性上保持最新。此处所述预定的触发条件可以包括但不仅限于:数据保存时间超过一定预设值(例如1个月,10天,24小时等)时即开始清理,数据所占磁盘空间超过一定预设值(例如是1g,10g,或者100m等)时即开始进行清理,界面上配置的清理缓存按钮,当用户点击该按钮时,即进行的手动触发清理等。
100.故障根因定位系统中所包括的界面展示模块,其主要功能是将多种数据进行界面展示,提供交互界面与用户进行人机沟通,更具体的,界面展示模块可以展示原始的未经任何处理的多维度数据(不同的评价指标数据等),方便技术人员查看原始数据变化趋势,以及在根因定位算法准确性难以达到要求时,方便技术人员根据人工经验进行诊断与排查。同时,将本实施例所述的故障定位模块得到的最终结果会展示到界面上,方面技术人员查看定位结果,根据结果进行故障排查和修复等操作。另一方面,为了方便技术人员对内置算法进行调试,本界面展示模块还可以提供交互界面,方面技术人员对故障根因定位的算法模块进行不同参数的配置,并将该参数配置保存到后端配置文件中,用于算法下次提升的参数选择。
101.实施例五
102.图5示出了可以用来实施本技术的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本技术的实现。
103.如图5所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(rom)12、随机访问存储器(ram)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(rom)12中的计算机程序或者从存储单元18加载到随机访问存储器(ram)13中的计算机程序,来执行各种适当的动作和处理。在ram 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
104.电子设备10中的多个部件连接至i/o接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
105.处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如故障根因定位方法。
106.在一些实施例中,故障根因定位方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时,可以执行上文描述的故障根因定位方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行故障根因定位方法。
107.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
108.用于实施本技术的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
109.在本技术的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电
气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
110.为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
111.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
112.计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
113.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本技术中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本技术的技术方案所期望的结果,本文在此不进行限制。
114.上述具体实施方式,并不构成对本技术保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本技术的精神和原则之内所作的修改、等同替换和改进等,均应包含在本技术保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1