具有机箱管理功能的机架式服务器系统的制作方法
【技术领域】
[0001]本发明涉及计算机系统领域,具体地,涉及一种具有机箱管理功能的机架式服务器系统。
【背景技术】
[0002]服务器是一种具有高稳定性的计算机系统,其主要作用是作为网络信息系统基础设施的服务节点,以储存和处理网络上的数据和信息。服务器具有比一股个人计算机更高的处理能力、稳定性、可靠性、安全性、可扩展性及可管理性,因此如何提高服务器的处理能力及其稳定性,使得服务器可以提供更稳定可靠、高效便利的信息使用服务环境,成为提高服务器性能最重要的因素之一。
[0003]服务器一股大量部署于数据中心的设备机房内。在机房内部,由于空间限制,往往希望能达到最大的空间利用率和计算资源利用率。如在多节点系统(一个机箱内有多个服务器节点的系统,即多个服务器节点物理上存在于同一个机箱内)中,对每个服务器节点都有管理的需求,所以往往在每个服务器节点上都采用BMC对其进行管理,然后通过一个主控制器即机箱管理模块(Chasis Management Module,CMM)再对BMC的数据进行汇总分析以得出合理的管理控制指令。
[0004]目前的服务器内一股都设有符合智能平台管理接口(IntelligentPlatformManagement Interf ace,简称IPMI)标准的各类接口。IPMI标准以基板管理控制器(Baseboard Management Controller,简称BMC)为服务器监控管理实现的芯片载体和各类监控服务的代理,通过数个标准接口(如智能平台管理总线(IPMB)接口 IIC、串行/调制解调器(Serial/Modem)接口、局域网(LAN)接口等),与服务器内需要被监控的器件(如中央处理器、电源、风扇背板等)所设的感测器连接,用以收集来自各个感测器的感测值(如温度、电压、风扇转速等)。当BMC根据上述感测值判断出服务器中被监控的器件有严重的异常事件发生时,会及时产生告警信息并向机箱管理模块CMM上报问题,同时请求管理员执行纠正动作。管理员根据预先设定好的管理策略下达正确的控制指令,经由CMM通过IPMI协议传输至需要进行异常处理器件的BMC中,控制该器件执行相应的处理动作,从而使服务器能够继续对外提供服务而不至于因无法服务而产生严重的后果。
[0005]如图1所示,目前常见的机箱管理技术主要是利用分布式管理架构,每个服务器节点即单板12上都设有一个管理处理器121(即前述BMC),管理处理器121负责收集被管器件122的状态信息,并发送管理命令。管理处理器121进一步向上级管理单元即主控板11的管理处理器111(即前述CMM)上报状态和问题,由管理处理器111按照预先设定好的管理策略对被管理器件进行管理。
[0006]在这种架构中,系统需要专门为CMM保留一个机箱内的安装区域来容纳它。而在一些对系统物理尺寸有要求的应用环境中,往往很难再有多余的空间来容纳一个这样的模块,因此希望设计一种既具有机箱管理功能,同时又不增加系统物理尺寸或占用多余系统空间的机箱管理方式。
【发明内容】
[0007]针对现有技术中存在的上述不足,本发明的目的是提供一种新型机架管理系统及方法,具体为一种具有机箱管理功能的机架式服务器系统。该系统不需要增加额外的机箱管理模块(CMM),仍可以提供与CMM相同的系统管理功能。
[0008]为实现上述目的,本发明是通过以下技术方案实现的。
[0009]一种具有机箱管理功能的机架式服务器系统,包括多个服务器节点以及系统背板,所述服务器节点与所述系统背板相连;所述服务器节点输出管理信息至所述系统背板,所述系统背板用于确定所述服务器节点的主从位置;被确定为主节点的服务器节点作为管理节点承担机箱管理功能,其余服务器节点则关闭机箱管理功能。
[0010]优选地,每一个所述服务器节点均设有自身的BMC(基板管理控制器),所述BMC设有位置判别模块,所述BMC用于产生管理信息;每一个所述服务器节点分别通过单独的数据通道将管理信息发送至所述系统背板;所述位置判别模块用于接收所述系统背板确定的主从位置。
[0011 ]优选地,所述管理信息包括如下任一项或任多项:
[0012]-温度;
[0013]-电压;
[0014]-电流;
[0015]-功耗;
[0016]-配置信息。
[0017]优选地,所述系统背板设有管理信息交换控制器和位置判定模块,其中:
[0018]所述管理信息交换控制器设有预设的逻辑模块,通过所述逻辑模块配置第一个服务器节点为默认的管理节点;所述管理节点将管理信息通过单独的数据通道发送至所述管理信息交换控制器;
[0019]所述位置判定模块包括三个并联的电阻,通过三个电阻之间的上拉或下拉关系,形成二进制数,并通过二进制数表示位置引脚,所述位置引脚用于确定所述服务器节点的主从位置。
[0020]优选地,所述位置判定模块与服务器节点的位置判别模块相对应;所述位置判别模块具有针对位置引脚的判断功能,通过读取位置引脚,判断自身当前所处主从位置。
[0021]优选地,所述位置判别模块读取到的位置引脚为000时,说明其对应的服务器节点当前位置为主节点位置,承担机箱管理功能;所述位置判别模块读取到的位置引脚为001时,则说明其对应的服务器节点当前位置为从节点位置,关闭机箱管理功能。
[0022]优选地,所述系统背板设有插槽,所述服务器节点通过连接器连接于插槽处。
[0023]优选地,所述具有机箱管理功能的机架式服务器系统还包括如下任一个或任多个部件:
[0024]-机箱,所述服务器节点和系统背板均设置于机箱内;
[0025]-电源模块,所述电源模块分别与所述服务器节点和系统背板相连;
[0026]-风扇模块,所述风扇模块为至少一个,并与所述系统背板相连。
[0027]与现有技术相比,本发明具体如下有益效果:
[0028]1、本发明可以实现机架式服务器系统机箱内的自主管理,而不需要额外的管理模块参与,即机箱内无需配备专门的管理模块即可实现系统管理;
[0029]2、本发明使机箱管理具有主从冗余功能;
[0030]3、多个服务器节点,一主多从,当其中承担管理任务的主服务器节点失效时,从服务器节点主动承担起机箱管理任务;
[0031]4、服务器节点自身不区分主从,由其安装位置进行区分,结构简单,使用方便。
【附图说明】
[0032]通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0033]图1为现有技术中机箱管理系统结构示意图;
[0034]图2为本发明结构不意图;
[0035]图3为本发明背板上地址信息的识别示意图;
[0036]图4为BMC启用机箱管理功能的判别流程图。
[0037]图中:101为其余服务器节点,102为系统背板,103为风扇模块,104为电源模块,105为其余服务器节点的管理信息,106为管理信息交换控制器,107为其余服务器节点的BMC,111为第一个服务器节点,115为第一个服务器节点对应的数据通道,117为第一个服务器节点的BMC,210为位置判定模块。
【具体实施方式】
[0038]下面对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
[0039]实施例
[0040]本实施例提供了一种具有机箱管理功能的机架式服务器系统,包括多个服务器节点以及系统背板,所述服务器节点与所述系统背板相连;所述服务器节点输出管理信息至所述系统背板,所述系统背板用于确定所述服务器节点的主从位置;被确定为主节点的服务器节点作为管理节点承担机箱管理功能,其余服务器节点则关闭机箱管理功能。
[0041]进一步地,每一个所述服务器节点均设有自身的BMC(基板管理控制器),所述BMC设有位置判别模块,所述BMC用于产生管理信息;每一个所述服务器节点分别通过单独的数据通道将管理信息发送至所述系统背板;所述位置判别模块用于接收所述系统背板确定的主从位置。
[0042]进一步地,所述管理信息包括如下任一项或任多项:
[0043]-温度;
[0044]-电压;
[0045]-电流;
[0046]-功耗;
[0047]-配置信息。
[0048]进一步地,所述系统背板设有管理信息交换控制器和位置判定模块,其中:
[0049]所述管理信息