本发明涉及服务器,尤其涉及一种服务器故障定位方法、装置、设备及存储介质。
背景技术:
1、随着服务器应用的日益广泛,对服务器的稳定性和故障精准定位的要求在不断提高。在实际的运维场景中,在抓取故障信息时,可能存在无法抓取故障信息或抓取到的故障信息不全,进而导致故障定位的不准确,而故障定位不准确往往会导致运维团队耗费大量时间进行故障排查,这不仅增加了运维成本,还可能影响客户业务运行的连续性,给客户带来损失。
技术实现思路
1、本发明提供一种服务器故障定位方法、装置、设备及存储介质,用以解决现有技术中故障定位不准确的缺陷,实现提高故障信息抓取的准确率,进而提高故障定位的准确率。
2、本发明提供一种服务器故障定位方法,包括如下步骤:
3、若检测到当前的第一故障抓取模式达到切换条件,通过切换命令将当前的第一故障抓取模式切换为第二故障抓取模式;其中,所述第一故障抓取模式为基于bios的故障抓取模式,所述第二故障抓取模式为基于bmc的故障抓取模式;或者,所述第一故障抓取模式为基于bmc的故障抓取模式,所述第二故障抓取模式为基于bios的故障抓取模式当前的第一故障抓取模式当前的第一故障抓取模式第二故障抓取模式;
4、通过切换后的所述第二故障抓取模式抓取待检测服务器中的故障信息,并基于所述故障信息进行故障定位。
5、根据本发明提供的一种服务器故障定位方法,所述待检测服务器上设置有被操作系统或固件控制的gpio引脚;所述通过切换命令将当前的第一故障抓取模式切换为第二故障抓取模式,包括:
6、通过ipmi命令控制所述gpio引脚的电平状态,以实现将当前的第一故障抓取模式切换为第二故障抓取模式。
7、根据本发明提供的一种服务器故障定位方法,所述若检测到当前的第一故障抓取模式达到切换条件,通过切换命令将当前的第一故障抓取模式切换为第二故障抓取模式之前,所述方法还包括:
8、定义所述待检测服务器的丝印和资产信息,以使得在bios和bmc中所显示的所述丝印和所述资产信息相同;
9、定义故障抓取规则;其中,各个所述故障抓取模式的故障抓取规则相同。
10、根据本发明提供的一种服务器故障定位方法,所述若检测到当前的第一故障抓取模式达到切换条件,通过切换命令将当前的第一故障抓取模式切换为第二故障抓取模式当前的第一故障抓取模式当前的第一故障抓取模式第二故障抓取模式之前,所述方法还包括:
11、若识别到所述待检测服务器发生故障,检测是否进行运维操作;
12、若检测到未进行所述运维操作,检测通过当前的所述第一故障抓取模式是否抓取到故障信息;
13、若通过当前的所述第一故障抓取模式未抓取到所述故障信息,确定当前的所述第一故障抓取模式达到所述切换条件;
14、若检测到进行所述运维操作,通过当前的所述第一故障抓取模式抓取当前故障信息;
15、检测所述当前故障信息与当前的所述第一故障抓取模式在前一次抓取的所述故障信息是否相同;
16、若相同,确定当前的所述第一故障抓取模式达到切换条件。
17、根据本发明提供的一种服务器故障定位方法,所述基于所述故障信息进行故障定位,包括:
18、若存在切换前的所述第一故障抓取模式抓取的历史故障信息,基于所述故障信息和所述历史故障信息进行故障定位。
19、根据本发明提供的一种服务器故障定位方法,所述通过切换后的所述第一故障抓取模式抓取待检测服务器中的故障信息,并基于所述故障信息进行故障定位之后,所述方法还包括:
20、基于故障定位的结果生成故障日志;其中,所述故障日志中包括时间戳、故障位置丝印、设备类型、故障类型;
21、将所述故障日志传输至预设运维平台进行展示。
22、根据本发明提供的一种服务器故障定位方法,所述基于所述故障信息进行故障定位之前,所述方法还包括:
23、对故障定位过程中的敏感数据进行加密处理,并对可访问所述敏感数据的人员进行限制。
24、本发明还提供一种服务器故障定位装置,包括如下模块:
25、切换模块,配置为若检测到当前的第一故障抓取模式达到切换条件,通过切换命令将当前的第一故障抓取模式切换为第二故障抓取模式;其中,所述第一故障抓取模式为基于bios的故障抓取模式,所述第二故障抓取模式为基于bmc的故障抓取模式;或者,所述第一故障抓取模式为基于bmc的故障抓取模式,所述第二故障抓取模式为基于bios的故障抓取模式当前的第一故障抓取模式当前的第一故障抓取模式第二故障抓取模式;
26、第一抓取模块,配置为通过切换后的所述第二故障抓取模式抓取待检测服务器中的故障信息,并基于所述故障信息进行故障定位。
27、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述服务器故障定位方法。
28、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述服务器故障定位方法。
29、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述服务器故障定位方法。
30、本发明提供的服务器故障定位方法、装置、设备及存储介质,设置有基于bios或bmc的两种故障抓取模式,在检测到当前的第一故障抓取模式达到切换条件后,通过切换命令将当前的第一故障抓取模式切换为第二故障抓取模式,通过切换后的第二故障抓取模式来抓取待检测服务器中的故障信息,并基于故障信息进行故障定位,本发明通过切换不同的故障抓取模式来抓取故障信息,提高故障信息的抓取准确率,同时提高故障定位的准确率,避免对运维人员的运维使用造成影响。
1.一种服务器故障定位方法,其特征在于,包括:
2.根据权利要求1所述的服务器故障定位方法,其特征在于,所述待检测服务器上设置有被操作系统或固件控制的gpio引脚;所述通过切换命令将当前的第一故障抓取模式切换为第二故障抓取模式,包括:
3.根据权利要求1所述的服务器故障定位方法,其特征在于,所述若检测到当前的第一故障抓取模式达到切换条件,通过切换命令将当前的第一故障抓取模式切换为第二故障抓取模式之前,所述方法还包括:
4.根据权利要求1所述的服务器故障定位方法,其特征在于,所述若检测到当前的第一故障抓取模式达到切换条件,通过切换命令将当前的第一故障抓取模式切换为第二故障抓取模式当前的第一故障抓取模式当前的第一故障抓取模式第二故障抓取模式之前,所述方法还包括:
5.根据权利要求4所述的服务器故障定位方法,其特征在于,所述基于所述故障信息进行故障定位,包括:
6.根据权利要求1至5中任一项所述的服务器故障定位方法,其特征在于,所述通过切换后的所述第二故障抓取模式抓取待检测服务器中的故障信息,并基于所述故障信息进行故障定位之后,所述方法还包括:
7.根据权利要求1至5中任一项所述的服务器故障定位方法,其特征在于,所述基于所述故障信息进行故障定位之前,所述方法还包括:
8.一种服务器故障定位装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述服务器故障定位方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述服务器故障定位方法。