服务器报错信息的记录方法、装置、设备和存储介质与流程

文档序号:36906300发布日期:2024-02-02 21:36阅读:26来源:国知局
服务器报错信息的记录方法、装置、设备和存储介质与流程

本申请涉及计算机固件开发领域,特别是涉及一种服务器报错信息的记录方法、装置、设备和存储介质。


背景技术:

1、服务器中的基板管理芯片作为管理核心,监控着多个设备的状态并进行记录,比如cpu的错误信息都是发送给基板管理芯片进行记录,并且显示也依赖基板管理芯片。

2、目前,在基板管理芯片自身发生故障时,会导致无法记录日志也无法进行显示,此时,cpu如果也发生故障,基板管理芯片带外没有相关的cpu报错的日志记录,对于产生的cpu故障也就无法定位错误原因了。

3、因此,传统技术中,在基板管理芯片故障的情况才无法记录系统的故障信息,导致无法快速定位错误原因。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种服务器报错信息的记录方法、装置、设备和存储介质。

2、一种服务器报错信息的记录方法,方法应用于服务器的处理器,服务器还包括基板管理芯片,基板管理芯片与处理器连接,方法包括:

3、当检测到基板管理芯片为故障状态,且服务器出现报错时,将报错信息输出至预先设置的目标内存区域;

4、当基板管理芯片恢复正常运行时,从目标内存区域获取报错信息并输出至预先设置的共享内存,以便基板管理芯片从共享内存获取报错信息进行记录。

5、在其中一个实施例中,上述的处理器通过通用输出输出信号线与基板管理芯片连接,上述的通用输出输出信号线用于向处理器传递中断信号,当基板管理芯片为故障状态时,上述的中断信号的状态被置为有效状态,上述的方法还包括:

6、当检测到中断信号的状态为有效状态时,确定基板管理芯片为故障状态;和/或

7、向基板管理芯片发送智能平台管理接口命令,并接收基板管理芯片的返回值,当返回值异常时,确定基板管理芯片为故障状态。

8、在其中一个实施例中,上述的处理器包括基本输入输出系统以及操作系统,上述的向基板管理芯片发送智能平台管理接口命令,包括:

9、在服务器开机过程中,通过基本输入输出系统向基板管理芯片发送智能平台管理接口命令;

10、在服务器开机完成后,通过操作系统向基板管理芯片发送智能平台管理接口命令。

11、在其中一个实施例中,上述的当检测到基板管理芯片为故障状态,且服务器出现报错时,将报错信息输出至预先设置的目标内存区域,包括:

12、当检测到基板管理芯片为故障状态时,将预先创建的标志位的状态置为有效状态;

13、当基板管理芯片为故障状态,且服务器出现报错时,触发系统管理中断;

14、根据系统管理中断查询标志位的状态;

15、当查询到标志位的状态为有效状态时,将报错信息输出至预先设置的目标内存区域;

16、上述的方法还包括:

17、当查询到标志位的状态为有效状态时,停止与基板管理芯片通信;

18、当检测到基板管理芯片恢复正常运行时,恢复处理器与基板管理芯片的通信,并清除标志位;

19、将报错信息的输出路径切换至基板管理芯片。

20、在其中一个实施例中,上述的共享内存为基板管理芯片的动态随机存储内存,基板管理芯片包括h2b设备,方法还包括:

21、通过h2b设备将共享内存的存储空间映射到h2b设备的内存映射输入输出地址空间;

22、上述的从目标内存区域获取报错信息并输出至预先设置的共享内存,包括:

23、从目标内存区域获取报错信息,并通过内存映射输入输出地址空间将报错信息输出至共享内存。

24、在其中一个实施例中,上述的服务器还包括管理引擎,上述的方法还包括:

25、当查询到标志位的状态为有效状态时,向管理引擎发送进入恢复模式的命令,以便管理引擎停止与基板管理芯片通信。

26、在其中一个实施例中,上述的基板管理芯片中设置定时器,当基板管理芯片未在超时之前完成重置定时器数值时,触发超时中断,中断信号被置为有效状态。

27、一种服务器报错信息的记录装置,上述的方法应用于服务器的处理器,服务器还包括基板管理芯片,上述的基板管理芯片与处理器连接,上述的方法包括:

28、第一输出模块,用于当检测到基板管理芯片为故障状态,且服务器出现报错时,将报错信息输出至预先设置的目标内存区域;

29、第二输出模块,用于当基板管理芯片恢复正常运行时,从目标内存区域获取报错信息并输出至预先设置的共享内存,以便基板管理芯片从共享内存获取报错信息进行记录。

30、一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:

31、当检测到基板管理芯片为故障状态,且服务器出现报错时,将报错信息输出至预先设置的目标内存区域;

32、当基板管理芯片恢复正常运行时,从目标内存区域获取报错信息并输出至预先设置的共享内存,以便基板管理芯片从共享内存获取报错信息进行记录。

33、一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

34、当检测到基板管理芯片为故障状态,且服务器出现报错时,将报错信息输出至预先设置的目标内存区域;

35、当基板管理芯片恢复正常运行时,从目标内存区域获取报错信息并输出至预先设置的共享内存,以便基板管理芯片从共享内存获取报错信息进行记录。

36、上述服务器报错信息的记录方法、装置、设备和存储介质,通过处理器检测基板管理芯片的状态,当监测到基板管理芯片处于故障状态时,将服务器的报错信息的上报路径从原先的基板管理芯片切换至预留的目标内存区域,当基板管理芯片恢复正常状态时,将目标内存区域中的报错信息拷贝至共享内存,使得基板管理芯片可以从该共享内存获取故障器件遗漏的错误信息,使得bmc故障期间的错误信息也能被准确记录,以便及时定位服务器的故障原因。



技术特征:

1.一种服务器报错信息的记录方法,其特征在于,所述方法应用于服务器的处理器,所述服务器还包括基板管理芯片,所述基板管理芯片与所述处理器连接,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述处理器通过通用输出输出信号线与所述基板管理芯片连接,所述通用输出输出信号线用于向所述处理器传递中断信号,当所述基板管理芯片为故障状态时,所述中断信号的状态被置为有效状态,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述处理器包括基本输入输出系统以及操作系统,所述向所述基板管理芯片发送智能平台管理接口命令,包括:

4.根据权利要求3所述的方法,其特征在于,所述当检测到所述基板管理芯片为故障状态,且所述服务器出现报错时,将报错信息输出至预先设置的目标内存区域,包括:

5.根据权利要求1所述的方法,其特征在于,所述共享内存为所述基板管理芯片的动态随机存储内存,所述基板管理芯片包括h2b设备,所述方法还包括:

6.根据权利要求4所述的方法,其特征在于,所述服务器还包括管理引擎,所述方法还包括:

7.根据权利要求2所述的方法,其特征在于,所述基板管理芯片中设置定时器,当所述基板管理芯片未在超时之前完成重置所述定时器数值时,触发超时中断,所述中断信号被置为有效状态。

8.一种服务器报错信息的记录装置,其特征在于,所述方法应用于服务器的处理器,所述服务器还包括基板管理芯片,所述基板管理芯片与所述处理器连接,所述方法包括:

9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。


技术总结
本申请涉及一种服务器报错信息的记录方法、装置、设备和存储介质。方法包括:当检测到基板管理芯片为故障状态,且服务器出现报错时,将报错信息输出至预先设置的目标内存区域;当基板管理芯片恢复正常运行时,从目标内存区域获取报错信息并输出至预先设置的共享内存,以便基板管理芯片从共享内存获取报错信息进行记录。采用本方法能够在BMC故障时,服务器系统的错误信息也能记录到BMC的错误日志中,以及时定位服务器的错误原因。

技术研发人员:仇广东,陈鹏,芦飞,孙秀强
受保护的技术使用者:苏州元脑智能科技有限公司
技术研发日:
技术公布日:2024/2/1
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1