一种多分区多节点服务器的报错收集方法与流程

文档序号:25856938发布日期:2021-07-13 16:10阅读:来源:国知局

技术特征:

1.一种多分区多节点服务器的报错收集方法,其特征在于,包括:

获取多路服务器的计算节点的分区情况,并根据分区情况获取主计算节点,从而判断主bmc及其管辖的节点;

cpu将报错信息发送给本节点的cpld;

cpld将所述报错信息存储到内部的寄存器,并发送信号给主bmc;

主bmc收集所管辖节点的cpld内部寄存器信息,并定位报错信息的来源节点及cpu。

2.根据权利要求1所述的多分区多节点服务器的报错收集方法,其特征在于,所述方法还包括:

将报错信息存储在主bmc的系统日志中。

3.根据权利要求1所述的多分区多节点服务器的报错收集方法,其特征在于,所述获取多路服务器的计算节点的分区情况,包括:

根据管理板上跳帽的mode信号判断计算节点的分区情况;

所述多路服务器为八路服务器,所述计算节点的分区情况包括:单分区、双分区、四分区。

4.根据权利要求1所述的多分区多节点服务器的报错收集方法,其特征在于,所述方法还包括:

获取主板上的ms信号,根据ms信号获取计算节点的主从关系。

5.根据权利要求3所述的多分区多节点服务器的报错收集方法,其特征在于,所述并根据分区情况获取主计算节点,从而判断主bmc及其管辖的节点,包括:

所述单分区设置一个主计算节点,所述一个主计算节点的bmc管辖除主计算节点的另外三个计算节点的报错信息;

所述双分区设置两个主计算节点,所述两个主计算节点的bmc分别管辖一个计算节点的报错信息;

所述四分区内的所有计算节点均为主计算节点,各自bmc管辖各自节点上的报错信息。

6.根据权利要求1所述的多分区多节点服务器的报错收集方法,其特征在于,

所述cpu报错信息包括:过热触发下电告警信号,运行错误信号、处理器过热信号以及内存过热信号。


技术总结
本发明提供一种多分区多节点服务器的报错收集方法,包括:获取多路服务器的计算节点的分区情况,并根据分区情况获取主计算节点,从而判断主BMC及其管辖的节点;CPU将报错信息发送给本节点的CPLD;CPLD将所述报错信息存储到内部的寄存器,并发送信号给主BMC;主BMC收集所管辖节点的CPLD内部寄存器信息,并定位报错信息的来源节点及CPU。本发明针对于多节点的服务器,通过主板上的CPLD寄存器暂存本节点的所有异常信息,利用BMC读取CPLD内的寄存器状态,来判断具体异常信息来自的具体位置。

技术研发人员:张莉
受保护的技术使用者:山东英信计算机技术有限公司
技术研发日:2021.04.14
技术公布日:2021.07.13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1