服务器风扇控制系统及其控制方法与流程

文档序号:16670191发布日期:2019-01-18 23:31阅读:244来源:国知局
服务器风扇控制系统及其控制方法与流程

本发明是有关于一种服务器风扇控制系统及其控制方法,特别是指具有若干个节点的服务器风扇控制系统及其控制方法。



背景技术:

在需要不间断地进行运算的现今社会中,由组件故障、人为过失或系统当机引起的服务器故障可能会导致服务中断,并提高企业营运的成本。因此,不中断的可用性是降低成本及管理时间的重要目标,在服务器的设计上,高可用性(ha;highavailability)也逐渐成为趋势,而高可用性的设计,便是针对软硬件所可能产生的错误发生时,服务器被设计为仍能维持正常运作的方式,使用ha的好处是可避免长时间之硬件维修或系统重设。一般在多节点服务器(multi-nodeserver)中,如图1所示之服务器风扇控制系统10,各个节点1-1到1-n(node)都各自设置有用于散热的风扇3-1到3-n,且各风扇由其节点上的基板管理控制器(baseboardmanagementcontroller;bmc)直接输出脉冲宽度调变信号(pulsewidthmodulation;pwm)来控制,基板管理控制器2-1控制风扇3-1,而基板管理控制器2-n控制风扇3-n。一旦节点上的风扇模块故障,则必须将整个节点更换,相当耗费成本,并不符合ha的设计原则。另一方面,若是节点上的基板管理控制器发生错误,也会使其节点上的风扇模块停止运作,连带地使整个服务器有散热不足而过热的风险。

传统上,为了改善这样的问题,在一些多节点服务器的设计中,如图2所示之服务器风扇控制系统20,风扇3皆独立设置于节点1-1到1-n外,微处理器4比对基板管理控制器2-1到2-n的输出脉冲宽度调变信号,并以风扇转速需求最大者的信号来控制服务器的风扇3。然而,这样的设计方式,却无法因应各个节点上的系统状态来提供适当的风扇转速,降低了整体散热的效能,此外,当其中一节点上的基板管理控制器故障而无法输出脉冲宽度调变信号时,微处理器4便无法因应调整所需要的风扇转速,不符合ha的设计原则。为了实现多节点服务器的高可用性(ha)并同时改善传统多节点服务器散热的问题,目前多节点服务器的领域仍需要一种能够改善基板管理控制器故障时的散热效果,且能提供各个节点最佳散热效率的风扇控制系统。



技术实现要素:

本发明所要解决的技术问题是提供一服务器风扇控制系统及其控制方法,其能够改善基板管理控制器故障时的散热效果且能提供各个节点最佳散热效率。

为解决上述技术问题,本发明提供一种服务器风扇控制系统,其包括设置于第一节点的第一风扇控制器、第一风扇、第一基板管理控制器、以及设置于第二节点第二风扇控制器、第二风扇、第二基板管理控制器。第一基板管理控制器具有第一端口以及第二端口,分别连接至第一风扇控制器以及第二风扇控制器。第二基板管理控制器具有第三端口连接至第二风扇控制器。当第二基板管理控制器的运作正常时,第一基板管理控制器产生第一控制信号经由第一端口来控制第一风扇控制器以驱动第一风扇,而第二基板管理控制器产生第二控制信号经由第三端口来控制第二风扇控制器以驱动第二风扇。当第二基板管理控制器的运作异常时,第一基板管理控制器产生第一控制信号经由第一端口来控制第一风扇控制器以驱动第一风扇,并产生第二控制信号经由第二端口来控制第二风扇控制器以驱动第二风扇。

优选地,第一基板管理控制器与上述第二基板管理控制器通信连接。当第二基板管理控制器运作正常时,第二基板管理控制器传送心跳信号至第一基板管理控制器,而第一基板管理控制器更根据心跳信号判断第二基板管理控制器是否运作异常。当第一基板管理控制器没有接收到心跳信号时,第一基板管理控制器判断第二基板管理控制器运作异常,并产生第一控制信号经由上述第一端口来控制第一风扇控制器,以及产生第二控制信号经由上述第二端口来控制第二风扇控制器。

优选地,当第一基板管理控制器没有接收到心跳信号时,第一基板管理控制器更传送重设信号至第二基板管理控制器,第二基板管理控制器根据重设信号重新启动。此外,当第一基板管理控制器传送重设信号后,更根据心跳信号判断第二基板管理控制器是否已正常运作。当第一基板管理控制器接收到心跳信号时,第一基板管理控制器判断第二基板管理控制器已正常运作,并停止产生第二控制信号。

优选地,当第一、第二基板管理控制器的运作正常时,第一基板管理控制器根据第一节点之第一系统状态产生第一控制信号,而第二基板管理控制器根据第二节点之第二系统状态产生第二控制信号。第一基板管理控制器与第二基板管理控制器通信连接,第二基板管理控制器更传送第二节点之第二系统状态至第一基板管理控制器。此外,当第二基板管理控制器的运作异常时,第一基板管理控制器根据第一节点之第一状态产生第一控制信号,且根据第二节点之第二系统状态产生第二控制信号。

优选地,第二基板管理控制器更具有第四端口用以连接至第一风扇控制器。当第一基板管理控制器的运作异常时,第二基板管理控制器产生第一控制信号经由第四端口来控制第一风扇控制器,并产生第二控制信号经由上述第三端口来控制第二风扇控制器。

为解决上述技术问题,本发明还提供一种服务器风扇控制方法,其适用于具有第一节点以及第二节点之服务器风扇控制系统。第一节点包括第一基板管理控制器、第一风扇控制器以及第一风扇,而第二节点包括第二基板管理控制器、第二风扇控制器以及第二风扇。第一风扇控制器根据第一控制信号驱动第一风扇,而第二风扇控制器根据第二控制信号驱动第二风扇,第一基板管理控制器透过第一端口连接至第一风扇控制器,第一基板管理控制器透过第二端口连接至第二风扇控制器,且第二基板管理控制器透过第三端口连接至第二风扇控制器。其控制方法包括:当上述第一基板管理控制器判断上述第二基板管理控制器的运作正常时,透过上述第一基板管理控制器产生上述第一控制信号并经由上述第一端口来控制上述第一风扇控制器,且透过上述第二基板管理控制器产生上述第二控制信号并经由上述第三端口来控制上述第二风扇控制器;以及当上述第一基板管理控制器判断上述第二基板管理控制器的运作异常时,透过上述第一基板管理控制器产生上述第一控制信号并经由上述第一端口来控制上述第一风扇控制器,且透过上述第一基板管理控制器产生上述第二控制信号并经由上述第二端口来控制上述第二风扇控制器。

优选地,该服务器风扇控制方法更包括:当上述第一基板管理控制器判断上述第二基板管理控制器的运作异常时,透过上述第一基板管理控制器传送一重设信号至上述第二基板管理控制器;以及当上述第一基板管理控制器判断上述第二基板管理控制器已正常运作,上述第一基板管理控制器停止产生上述第二控制信号。

相较于现有技术,一旦多节点服务器中的任一节点内的基板管理控制器发生故障,透过本发明的服务器风扇控制系统,其他节点内的基板管理控制器随即能够接管该故障节点的风扇控制,能避免系统过热而当机、硬盘过热所造成数据损坏的风险,尤其改善了故障发生时的散热,降低了故障排除前系统过热的损害风险,实现了多节点服务器系统内基板管理控制器对风扇控制的高可用性。此外,透过本发明,各个节点的风扇仍能够依据各自节点上的系统状态而相应地控制,而提供更佳散热效率。再者,在本发明一些实施例中,基板管理控制器透过集成电路总线与各风扇控制器通信连接,使得基板管理控制器能够在其他基板管理控制器故障发生时,及时的接管该故障节点上的风扇控制器与风扇,而不须经过复杂的通讯认证。

【附图说明】

本发明之其他的特征及功效,将于参照图式的实施方式中清楚地呈现,其中:

图1系显示传统服务器风扇控制系统之一实施例之示意图。

图2系显示传统服务器风扇控制系统之另一实施例之示意图。

图3系显示根据本发明一实施例所述的服务器风扇控制系统之示意图。

图4系显示根据本发明图3实施例之服务器风扇控制系统之运作流程图。

【具体实施方式】

以下所述以特定方式表达显示于图标中之实施例或例子。但应了解该实施例或例子并非用以限制。任何本发明实施例的替换以及修改,以及本发明原则之任何进一步应用,对于本发明领域具有通常技术者能参考本发明说明书内容而完成。

图3系显示根据本发明一实施例所述的服务器风扇控制系统100之示意图。如图3所示,服务器风扇控制系统100包括节点110-1、110-2以及背板120。节点110-1包括基板管理控制器112-1、风扇控制器114-1以及至少一风扇116-1。相似地,节点110-2包括基板管理控制器112-2、风扇控制器114-2以及至少一风扇116-2。基板管理控制器112-1设置于节点110-1中,主要用于节点110-1上的组件的监控,并且具有端口p1及p2分别通信连接至风扇控制器114-1、114-2。相似地,基板管理控制器112-2设置于节点110-2中,主要用于节点110-2上的组件的监控,并且具有端口p3及p4分别通信连接至风扇控制器114-1、114-2。由于基板管理控制器112-1透过不同端口p1及p2(例如,集成电路总线(i2cbus))与风扇控制器114-1、114-2通信连接,因此,基板管理控制器112-1可提供不同的控制信号分别至风扇控制器114-1、114-2,相似地,基板管理控制器112-2亦可提供不同的控制信号分别至风扇控制器114-1、114-2。此外,风扇控制器114-1设置于节点110-1中,用以提供驱动信号(例如,脉冲宽度调变信号(pulsewidthmodulation;pwm))来驱动风扇116-1,而风扇控制器114-2设置于节点110-2中,用以提供驱动信号来驱动风扇116-2。

在本发明一些实施例中,节点110-1的基板管理控制器112-1与节点110-2的基板管理控制器112-2透过背板通信连接,举例来说,基板管理控制器之间可利用以太物理层传输单元(ethernetphysicallayertransceiver;phy)经由序列千兆位媒体独立接口(serialgigabitmediaindependentinterface;gsmii)交换信息。此外,基板管理控制器112-1与基板管理控制器112-2可互相分享并判别彼此的系统状态(例如,节点运作状态、节点温度信息等)、指示重新启动(例如,传送重设信号)以及判别彼此运作正常与否(例如,心跳信号)等。在本发明一些实施例中,当基板管理控制器112-1以及112-2通电且正常运作时,会互相提供心跳信号给彼此,因此,一旦基板管理控制器112-1没有接收到基板管理控制器112-2所提供的心跳信号,则可判断基板管理控制器112-2发生异常,反之亦同。另一方面,藉由互相取得系统状态,基板管理控制器112-1、112-2可根据各自节点的系统状态分别产生控制信号至风扇控制器114-1、114-2。

在一些实施例中,当基板管理控制器112-1与基板管理控制器112-2皆正常运作时,基板管理控制器112-1会根据节点110-1的系统状态产生控制信号并透过端口p1传送至风扇控制器114-1,风扇控制器114-1则根据所接收到的控制信号产生对应的驱动信号来驱动风扇116-1。举例来说,若基板管理控制器112-1判断节点110-1的系统状态(例如,节点温度高于默认值)需要较快的风扇转速时,基板管理控制器112-1则传送相应的控制信号至风扇控制器114-1,以通知风扇控制器114-1驱动风扇116-1以较高的转速转动。此外,由于基板管理控制器112-2正常运作,基板管理控制器112-1并不需要控制风扇控制器114-2,因此基板管理控制器112-1在端口p2上不产生控制信号。相似地,基板管理控制器112-2会根据节点110-2的系统状态产生控制信号并透过端口p3传送至风扇控制器114-2,风扇控制器114-2则根据所接收到的控制信号产生对应的驱动信号来驱动风扇116-2。此外,由于基板管理控制器112-1正常运作,基板管理控制器112-2并不需要控制风扇控制器114-1,因此基板管理控制器112-2在端口p4上不产生控制信号。应了解到,风扇转速高低的调整方法可根据使用者的需求设计,风扇可相应于系统状态而有不同的转速,相对应地,系统状态亦可根据用户的需求而包括有不同的系统参数(例如,节点中各组件的温度、节点运作的负荷量、工作排程等),由于本发明的重点并非在于风扇转速的调整,在此不多加赘述,任何风扇转速高低的选择方式皆应包括在本发明之中。

在本发明的一些实施例中,当基板管理控制器112-1与基板管理控制器112-2仅其中之一者正常运作,而另一者发生异常时,正常运作的基板管理控制器则可暂时接管另一节点上的风扇控制,以避免节点过热而造成损坏,此即为符合ha的设计原则。。详细来说,若基板管理控制器112-1判断基板管理控制器112-2发生异常时,基板管理控制器112-1可传送重设信号至基板管理控制器112-2,以通知基板管理控制器112-2重新启动,另一方面,基板管理控制器112-1透过端口p2传送控制信号至风扇控制器114-2以继续驱动风扇116-2,藉此,在基板管理控制器112-2发生异常以及其重新启动的期间,风扇116-2仍能持续的运作而确保节点110-2上或其周遭的电子组件(例如,设置于服务器前侧的硬盘)散热效果。同时,基板管理控制器112-1也透过端口p1持续传送控制信号至风扇控制器114-1,风扇控制器114-1则根据所接收到的控制信号产生对应的驱动信号来驱动风扇116-1。

在本发明的一些实施例中,由于基板管理控制器112-1与基板管理控制器112-2持续性且周期性地取得彼此最新的系统状态,当基板管理控制器112-1暂时接管基板管理控制器112-2的风扇控制时,基板管理控制器112-1更可根据基板管理控制器112-2在异常发生之前所提供的系统状态(即,节点110-2的系统状态)透过端口p2传送控制信号至风扇控制器114-2,风扇控制器114-2则根据所接收到的控制信号产生对应的驱动信号来驱动风扇116-2。在一些实施例中,节点110-1与节点110-2为相互备援的系统架构下,当基板管理控制器112-2正常运作而基板管理控制器112-1发生异常时,基板管理控制器112-2可同于上述基板管理控制器112-1的运作方式,透过端口p4暂时接管节点110-1的风扇控制,于此不再重复赘述。

以下更以图4并配合图3来说明本发明的服务器风扇控制系统100中基板管理控制器112-1之运作流程。在步骤s202中,基板管理控制器112-1判断基板管理控制器112-2是否仍正常运作,若基板管理控制器112-2仍正常运作则继续步骤s204,反之,若基板管理控制器112-2发生异常则继续步骤s206。举例来说,基板管理控制器112-1持续性或周期性地判断是否有接收到基板管理控制器112-2所传送的心跳信号,若没有接收到,则判断基板管理控制器112-2发生异常,则继续步骤s206。反之,若有接收到,则判断基板管理控制器112-2仍正常运作,则继续步骤s204。

在步骤s204中,基板管理控制器112-1透过端口p1传送控制信号至风扇控制器114-1,风扇控制器114-1则根据端口p1上的控制信号产生驱动信号来驱动风扇116-1。同时,由于基板管理控制器112-2仍正常运作,基板管理控制器112-2也会透过端口p3传送控制信号至风扇控制器114-2,风扇控制器114-2则根据其端口p3上的控制信号产生驱动信号来驱动风扇116-2。换句话说,在步骤s204中,节点110-1上的风扇控制器114-1与风扇116-1仍由基板管理控制器112-1所控制,而节点110-2上的风扇控制器114-2与风扇116-2仍由基板管理控制器112-2所控制。

另外,在步骤s206中,基板管理控制器112-1传送重设信号至基板管理控制器112-2,藉此将基板管理控制器112-2重新启动。接着,于步骤s208中,基板管理控制器112-1透过端口p2传送控制信号至风扇控制器114-2,风扇控制器114-2则根据基板管理控制器112-1于端口p2上的控制信号产生驱动信号来驱动风扇116-2。同时,基板管理控制器112-1也持续透过端口p1传送控制信号至风扇控制器114-1,风扇控制器114-1则持续根据基板管理控制器112-1于端口p1上的控制信号产生驱动信号来驱动风扇116-1。换句话说,在步骤s208中,节点110-1上的风扇控制器114-1与风扇116-1以及节点110-2上的风扇控制器114-2与风扇116-2皆由基板管理控制器112-1所控制。

接着,在步骤s210中,基板管理控制器112-1判断基板管理控制器112-2是否已重新启动完成且恢复正常运作,若基板管理控制器112-2已可正常运作,则继续步骤s212。反之,则回到步骤s208,基板管理控制器112-1持续地控制风扇控制器114-1及114-2。举例来说,基板管理控制器112-1持续性或周期性地判断是否有接收到基板管理控制器112-2所传送的心跳信号,若有接收到,则判断基板管理控制器112-2已重新启动完成且恢复正常运作。

若基板管理控制器112-2已重新启动完成且恢复正常运作后,在步骤s212中,基板管理控制器112-1则停止于端口p2上产生控制信号,并回到步骤s204。换句话说,节点110-2上的风扇控制器114-2与风扇116-2回复由基板管理控制器112-2所控制。在一些实施例中,基板管理控制器112-1在步骤s212中更传送回复信号至基板管理控制器112-2以通知基板管理控制器112-2继续控制风扇控制器114-2。

应注意到,在相互备援的架构下时,服务器风扇控制系统100中基板管理控制器112-2之运作流程亦同于以上基板管理控制器112-1的运作方式,于此不再赘述。综上所述,一旦多节点服务器中的任一节点内的基板管理控制器发生故障,透过本发明的服务器风扇控制系统,其他节点内的基板管理控制器随即能够接管该故障节点的风扇控制,能避免系统过热而当机、硬盘过热所造成数据损坏的风险,尤其改善了故障发生时的散热,降低了故障排除前系统过热的损害风险,实现了多节点服务器系统内基板管理控制器对风扇控制的高可用性。此外,透过本发明,各个节点的风扇仍能够依据各自节点上的系统状态而相应地控制,而提供更佳散热效率。再者,在本发明一些实施例中,基板管理控制器透过集成电路总线与各风扇控制器通信连接,使得基板管理控制器能够在其他基板管理控制器故障发生时,及时的接管该故障节点上的风扇控制器与风扇,而不须经过复杂的通讯认证。

本发明之方法,或特定型态或其部份,可以以程序代码的型态存在。程序代码可以包含于实体媒体,如软盘、光盘片、硬盘、或是任何其他机器可读取(如计算机可读取)储存媒体,亦或不限于外在形式之计算机程序产品,其中,当程序代码被机器,如计算机加载且执行时,此机器变成用以参与本发明之装置。程序代码也可以透过一些传送媒体,如电线或电缆、光纤、或是任何传输型态进行传送,其中,当程序代码被机器,如计算机接收、加载且执行时,此机器变成用以参与本发明之装置。当在一般用途处理单元实作时,程序代码结合处理单元提供一操作类似于应用特定逻辑电路之独特装置。

本发明虽已叙述较佳之实施例如上,但应了解上述所揭露并非用以限制本发明实施例。相反地,其涵盖多种变化以及相似的配置(熟知此技术者可明显得知)。此外,应根据后附的权利要求书作最广义的解读以包含所有上述的变化以及相似的配置。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1