1.一种多分区多节点服务器的报错收集方法,其特征在于,包括:
获取多路服务器的计算节点的分区情况,并根据分区情况获取主计算节点,从而判断主bmc及其管辖的节点;
cpu将报错信息发送给本节点的cpld;
cpld将所述报错信息存储到内部的寄存器,并发送信号给主bmc;
主bmc收集所管辖节点的cpld内部寄存器信息,并定位报错信息的来源节点及cpu。
2.根据权利要求1所述的多分区多节点服务器的报错收集方法,其特征在于,所述方法还包括:
将报错信息存储在主bmc的系统日志中。
3.根据权利要求1所述的多分区多节点服务器的报错收集方法,其特征在于,所述获取多路服务器的计算节点的分区情况,包括:
根据管理板上跳帽的mode信号判断计算节点的分区情况;
所述多路服务器为八路服务器,所述计算节点的分区情况包括:单分区、双分区、四分区。
4.根据权利要求1所述的多分区多节点服务器的报错收集方法,其特征在于,所述方法还包括:
获取主板上的ms信号,根据ms信号获取计算节点的主从关系。
5.根据权利要求3所述的多分区多节点服务器的报错收集方法,其特征在于,所述并根据分区情况获取主计算节点,从而判断主bmc及其管辖的节点,包括:
所述单分区设置一个主计算节点,所述一个主计算节点的bmc管辖除主计算节点的另外三个计算节点的报错信息;
所述双分区设置两个主计算节点,所述两个主计算节点的bmc分别管辖一个计算节点的报错信息;
所述四分区内的所有计算节点均为主计算节点,各自bmc管辖各自节点上的报错信息。
6.根据权利要求1所述的多分区多节点服务器的报错收集方法,其特征在于,
所述cpu报错信息包括:过热触发下电告警信号,运行错误信号、处理器过热信号以及内存过热信号。