本公开涉及计算机,具体涉及服务器故障预测方法、装置、计算机设备及存储介质。
背景技术:
1、服务器在使用过程中出现各种故障后,会引起服务器宕机,给生产造成损失,因此维护部门需要快速定位故障部件,并进行修复,恢复服务器正常运行。
2、当前新的故障诊断依据的是服务器内部的部件运行周期来判定服务器出现故障的概率,因为服务器一般都是处于长时间运行过程中,其内部的部件可能会出现因长时间运转出现电子器件老化或磨损,进而存在服务器随时故障的风险。但是服务器内部部件的各项参数指标的变化,并不是随着使用时间增加而呈线性增长,仅通过时间线来判定服务器部件故障进而推出服务器出现故障,存在一定的误差。
3、因此,相关技术在判定服务器故障时,存在精准度较低的问题。
技术实现思路
1、有鉴于此,本公开提供了一种服务器故障预测方法、装置、计算机设备及存储介质,以解决相关技术在判定服务器故障时,存在精准度较低的问题。
2、第一方面,本公开提供了一种服务器故障预测方法,该方法包括:
3、获取影响目标服务器出现故障的多种部件类别、每种部件类别所对应的多种部件对象、每种部件对象对应的特征参数;
4、利用预设算法生成对于任一特征参数,其属于每种部件类别的概率确定方式;
5、根据预设条件对概率确定方式进行处理,得到目标部件类别,其中,预设条件为使得概率确定方式对应的条件概率数值最大;
6、根据目标部件类别确定目标服务器发生故障的概率值。
7、在本公开实施例中,针对服务器故障时的多种部件类别以及选取的每种部件类别对应的多种部件对象和部件对象对应的特征参数,生成任一特征参数属于每种部件类别的概率确定方式,进而得到出现故障时的目标部件类别,进而得到服务器发生故障的概率值,这样可以对不同厂商的各种型号的服务器故障预测,提高了故障预测准确性,有效的降低了数据丢失和服务器宕机的风险,解决了相关技术在判定服务器故障时,存在精准度较低的问题。
8、在一种可选的实施方式中,根据目标部件类别确定目标服务器发生故障的概率值,包括:
9、根据目标部件类别确定目标特征参数;
10、根据目标特征参数确定对应的目标部件对象;
11、根据目标部件对象确定目标部件对象发生故障的概率值;
12、将目标部件对象发生故障的概率值作为目标服务器发生故障的概率值。
13、在本公开实施例中,依据目标部件类别即可确定目标特征参数,再依据目标特征参数得到发生故障的目标部件对象,然后将目标部件对象发生故障的概率值作为目标服务器发生故障的概率值,这样以目标部件对象去反映目标服务器的故障发生情况,更能增加预测准确率。
14、在一种可选的实施方式中,根据预设条件对概率确定方式进行处理,得到目标部件类别,包括:
15、根据特征参数的总个数、部件类别的个数、部件类别为任一部件类别时对应的所有特征参数的个数以及平滑参数,得到任一部件类别对应的第一概率;
16、根据部件类别为任一部件类别时对应的所有特征参数的个数、特征参数的特征总维度、部件类别为任一部件类别时对应的任一特征参数的个数以及平滑参数,得到各个部件类别包含各个特征参数的第二概率;
17、将第一概率和第二概率生成的条件概率数值设置为最大,得到目标部件类别。
18、在本公开实施例中,利用特征参数的总个数、部件类别的个数、部件类别为任一部件类别时对应的所有特征参数的个数以及平滑参数,得到任一部件类别对应的第一概率,可以避免后验概率为0的情况发生,同时再基于部件类别为任一部件类别时对应的所有特征参数的个数、特征参数的特征总维度、部件类别为任一部件类别时对应的任一特征参数的个数以及平滑参数,得到各个部件类别包含各个特征参数的第二概率,通过将第一概率和第二概率生成的条件概率数值设置为最大,使得概率确定方式对应求解的服务器故障概率准确率最高,降低服务器宕机风险。
19、在一种可选的实施方式中,根据目标部件对象确定目标部件对象发生故障的概率值,包括:
20、获取目标部件对象对应的多个特征参数,得到特征参数总集合;
21、获取由各个特征参数生成的故障样本集合;
22、根据特征参数总集合和故障样本集合,得到目标部件对象发生故障的概率值。
23、在本公开实施例中,在确定好发生故障概率最高的目标部件对象之后,选取出该目标部件对象对应的特征参数总集合,然后利用由各个特征参数生成的故障样本集合与特征参数总集合相结合,即可得到目标部件对象发生故障的概率值,该概率值即是当前服务器发生故障的概率值,这样由部件反应出服务器的健康状况便捷度高且准确。
24、在一种可选的实施方式中,在根据目标部件类别确定目标服务器发生故障的概率值之后,方法还包括:
25、每间隔预设时间段采集目标服务器的特征参数,记录各个采集时间点和由特征参数得到的目标服务器发生故障的第一概率值;
26、获取由采集时间点和第一概率值生成的函数关系式;
27、获取故障预测时间段;
28、生成故障预测时间段内对应的目标服务器发生故障的第二概率值;
29、根据第二概率值和函数关系式,得到故障预测时间点;
30、根据第二概率值、函数关系式以及故障预测时间点,得到目标服务器距离发生故障的剩余时间段。
31、在本公开实施例中,采用一段时间范围内的特征参数,记录到对应的采集时间点和目标服务器发生故障的第一概率值,基于采集时间点和第一概率值预测服务器将要产生故障的时间点,进而得到目标服务器距离发生故障的剩余时间段,能够提前通知用户更换将要产生故障的部件。
32、在一种可选的实施方式中,生成故障预测时间段内对应的目标服务器发生故障的第二概率值,包括:
33、获取故障预测时间段内的最大概率值和最小概率值;
34、根据最大概率值和最小概率值,生成第二概率值。
35、在本公开实施例中,采用一段时间内的最大概率值和最小概率值作为推算参考对象,得到的第二概率值更加能够贴切实际部件运转情况。
36、在一种可选的实施方式中,根据第二概率值、函数关系式以及故障预测时间点,得到目标服务器距离发生故障的剩余时间段,包括:
37、在将第二概率值设置为预设数值时,根据函数关系式,得到目标服务器发生故障时的目标预测时间点;
38、根据目标预测时间点和故障预测时间点,得到目标服务器距离发生故障的剩余时间段。
39、在本公开实施例中,由第二概率值和预设数值之间的关系,得到目标服务器发生故障时的目标预测时间点,再根据目标预测时间点和故障预测时间点,得到目标服务器距离发生故障的剩余时间段,在确定好剩余时间段后,便于用户提前做好更换故障部件的准备。
40、第二方面,本公开提供了一种服务器故障预测装置,该装置包括:
41、第一获取模块,用于获取影响目标服务器出现故障的多种部件类别、每种部件类别所对应的多种部件对象、每种部件对象对应的特征参数;
42、第一生成模块,用于利用预设算法生成对于任一特征参数,其属于每种部件类别的概率确定方式;
43、第一得到模块,用于根据预设条件对概率确定方式进行处理,得到目标部件类别,其中,预设条件为使得概率确定方式对应的条件概率数值最大;
44、确定模块,用于根据目标部件类别确定目标服务器发生故障的概率值。
45、第三方面,本公开提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的方法。
46、第四方面,本公开提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的方法。