动态管理电力供应的方法和系统与流程

文档序号:19130635发布日期:2019-11-15 20:51阅读:174来源:国知局

本发明涉及一种在服务器机架系统中管理电力供应的方法、系统与计算机可读介质。



背景技术:

在服务器机架系统中,服务器与其他元件运作时所需要的电力是由电力供应单元所提供。当机架中服务器(例如,节点)的数目增加时,驱动服务器所需的电力也会增加。当服务器所需要的电力增加,便需要更多个电力供应单元来提供服务器所需要的电力。通常,机架会设置有足够的电力供应单元来满足机架中服务器所需要的尖峰电力。有些时候,机架系统中会包含超过最小必要数目的额外电力供应单元,藉此处理电力供应单元的故障(例如,提供冗余的电力供应单元)。通过提供过量的电力容量(例如,超过机架系统的最小需求),即使有一个电力供应单元故障了,机架中的服务器依然可以运作。然而,当在机架中运行了例如为六个电力供应单元,但只需要其中四个,这样会浪费能量而且会不必要地造成额外电力供应单元的损耗。



技术实现要素:

在一些实作中,机架管理控制器可以动态地管理服务器机架系统中的电力供应单元。例如,机架管理控制器可以基于服务器机架系统所需要的电力来决定有多少个电力供应单元需要被开启。机架管理控制器可以设置电力管理控制器来开启预定数目的电力供应单元。机架管理控制器可以从服务器机架中的电力供应单元接收状态信号。当有电力供应单元故障时,机架管理控制器可以基于这些状态信号来检测到此故障。机架管理控制器可以动态地设置电力管理控制器以通过开启保留的电力供应单元来替换故障的电力供应单元。

如果没有足够的电力供应单元来提供机架中服务器所需要的电力,机架管理控制器可以使服务器中的处理器运行在较低的频率,使得机架系统中服务器的电力需求会减少至剩下的电力供应单元所能供应的程度。机架管理控制器可以通知系统管理装置来提示系统管理者以替换故障的电力供应单元。

具体的实作可以提供至少以下的优点:服务器机架系统可以设置有足够的电力供应单元以应付电力供应单元的故障,并且可以减少备份电力供应单元所关联的能量使用。备份电力供应单元可以被关闭,等到需要的时候再开启,藉此可以减少备份电力供应单元的损耗。

本文实作的细节会在以下的图示和说明中阐述。从这些图示与说明中,其他的特征、观点与潜在的特征会更明显,且可形成权利要求书。

附图说明

在以下图中相似的符号是指相似的元件。

图1是用于动态电力供应管理的范例性系统的方块图。

图2是一个范例性系统的方块图,此系统是用以基于电力供应单元状态信息来动态地管理电力供应单元。

图3是描述范例性电力供应状态的方块图。

图4是范例性程序的流程图,此程序是用以动态地管理福气机架系统中的电力供应单元。

图5是实作图1~4特征与程序的范例性系统架构的方块图。

【符号说明】

100:系统

102:服务器机架

104:交换器

106、108、110、112:服务器

107、109、111、113:基板管理控制器

120:电力供应架

122、124、126、118、130:电力供应单元

140:电力管理控制器

150:机架管理控制器

160:网络

170:管理者装置

200:系统

ps1、ps1_present、ps1_ok1、ps1_ok2、ps2、ps3、ps4、ps5:信号

202:控制总线

300、310、320:电力供应状态

400:程序

402、404、406、408、410、412、414、416、418、420、422、424、426:步骤

500:架构

502:处理器

504:输入装置

506:显示器

508:网络接口

510:计算机可读介质

512:总线

514:操作系统

516:网络通信

518:图形处理系统

520:应用程序

522:服务控制器

具体实施方式

图1是用于动态电力供应管理的范例性系统100的方块图。系统100可包括服务器机架102。服务器机架102可包括机架顶部的交换器104,用以路由/转发服务器106、108、110、112与其他各种客户端装置(未绘示)之间的通信。每个服务器106、108、110、112可以是被管理的服务器装置,分别包括了基板管理控制器(baseboardmanagementcontroller,bmc)107、109、111、113。例如,基板管理控制器是用来提供服务器频外(outofband)管理/行政(administration)与其他计算装置的处理器。基板管理控制器可以和中央处理器和/或计算装置上的操作系统独立地运作。

服务器机架102可包括电力供应架120。例如,电力供应架120可包括多个端口、连接器等,用来将每个电力供应单元122、124、126、128、130连接至服务器机架102。电力供应单元122、124、126、128、130可以直接从外部的电源(例如墙上的电源插座、市电、发电机等)接收电力,并且将此外部的电力供应至服务器机架102内部的元件(例如服务器、控制器、网络接口卡等)。

服务器机架102可以包括电力管理控制器(powermanagementcontroller,pmc)140,用以管理电力供应单元122、124、126、128、130。例如,电力管理控制器140可以是一个处理器(例如电路、微处理器等),用来控制电力供应单元122、124、126、128、130。电力管理控制器140可以从每一个电力供应单元122、124、126、128和/或130接收状态信号,藉此判断每一个电力供应单元的状况(例如运作状态、故障状态、输出状态等)。电力管理控制器140可以开启或关闭每一个电力供应单元122、124、126、128、130。例如,电力管理控制器140可以从机架管理控制器(rackmanagementcontroller,rmc)150接收电力供应单元设定信息,其指出要开启哪些电力供应单元,和/或要关闭哪些电力供应单元。电力管理控制器140接下来可以基于接收到的电力供应单元设定信息来开启或关闭电力供应单元。或者,电力管理控制器140可以决定要打开哪些电力供应单元。

服务器机架102可包括机架管理控制器150。例如,机架管理控制器150可以是一个处理器,用来管理服务器机架102中的计算元件(例如服务器、交换器、风扇等)。机架管理控制器150可设置有操作系统和/或其他的计算机可读取指令,其用来执行以下描述的动态电力供应管理。机架管理控制器150可以测定出服务器机架102的电力需求。例如,机架管理控制器150可以通过网络160(例如局域网络、广域网络、互联网等)从管理者装置170(例如笔记型计算机、平板计算机、智能手机等)取得机架设定信息,此机架设定信息指出机架和/或机架中服务器的电力需求。机架管理控制器150可通过监控服务器机架102中每个服务器的电力使用来动态地决定服务器机架102的电力需求。例如,每一个基板管理控制器107、109、111和/或113可用来监控对应服务器106、108、110和/或112的电力使用。机架管理控制器150可以向每一个基板管理控制器107、109、111和/或113要求电力使用指标。机架管理控制器150可以从每一个基板管理控制器107、109、111和/或113接收此电力使用指标,并且计算(例如估计)服务器机架102的电力使用需求(亦称为最小功率总量)来操作服务器机架102。机架管理控制器150可测定耦接至服务器机架系统102的电力供应单元的总数目(例如为5个),接下来计算出一个最小临界数目,此最小临界数目的电力供应单元能供应上述的最小功率总量。机架管理控制器150可基于此最小临界数目决定电力供应单元设定,并将此电力供应单元设定传送至电力管理控制器140,电力管理控制器140基于此电力供应单元设定来决定开启哪些电力供应单元。

在一些实作中,机架管理控制器150可以基于服务器机架102的电力使用需求来决定有多少个电力供应单元需要被开启。例如,每一个电力供应单元122、124、126、128和/或130可以用来供应某总量的功率(例如300瓦、500瓦等)。如上所述,机架管理控制器150可以测出服务器机架102的功率消耗。例如,可计算出服务器机架102的功率消耗(例如为平均值、最大值、峰值等)为800瓦。如果每一个电力供应单元122、124、126、128和/或130是额定在500瓦,则需要两个电力供应单元来驱动服务器机架102。为了对电力供应单元的故障提供保护,可设定有n+1个电力供应单元在运作。例如,n可以是能满足服务器机架102电力需求的电力供应单元的最小数目。提供一个额外的电力供应单元可以减缓一个电力供应单元的故障。如此一来,机架管理控制器150可以判定为了服务器机架102,需要开启3个电力供应单元。

一旦机架管理控制器150判定出需要2+1的设定来供应电力给服务器机架102,机架管理控制器150可传送电力供应单元设定信息(例如包括一些辨识符号,指出要开启哪些电力供应单元)给电力管理控制器140,以指出应该开启哪些电力供应单元。电力管理控制器140接下来可以根据从机架管理控制器150接收到的设定信息来开启所指定的电力供应单元。或者,电力管理控制器140可以决定要开启哪些电力供应单元。例如,如果机架管理控制器150指定应该开启电力供应单元122、124、126,则电力管理控制器140可以开启电力供应单元122、124、126,并且让电力供应单元128与电力供应单元130处于低功率或关闭的状态。如此一来,可以开启必要的电力供应单元(例如2个)来提供电力给服务器机架,并且提供电力供应单元(例如1个)来减轻故障的状态,同时其余的电力供应单元可以关闭。

图2是一个范例性系统200的方块图,此系统是用以基于电力供应单元状态信息来动态地管理电力供应单元。系统200可对应至上述的系统100。例如,系统200描述了服务器机架102中各个元件的互动与操作。在一个具体的例子中,机架管理控制器150可以从电力供应单元122、124、126、128和/或130接收状态信号,并且基于这些状态信号调整在电力管理控制器140中电力供应单元的设定。

在一些实作中,系统200可包括电力供应架120。电力供应架120可以是服务器机架102中的一个元件,用来放置电力供应单元122、124、126、128和/或130。一旦电力供应单元(例如,电力供应单元122)接上(例如插入或是耦接至)电力供应架120,电力供应单元可传送信号(例如信号ps1)给电力管理控制器140以通知电力管理控制器140此电力供应单元的状态。例如,电力供应单元122可传送信号ps1至电力管理控制器140。信号ps1可包括一现在信号(例如信号ps1_present),此现在信号指出电力供应单元122已耦接至电力供应架120。信号ps1可包括第一良好信号(例如,信号ps1_ok1),其指示了电力供应单元122中第一元件或操作的状态。例如,此第一良好信号可指示电力供应单元122正从外部的电源接收足够的电力。信号ps1可包括第二良好信号(例如,信号ps1_ok2),其指示了电力供应单元122第二元件或操作的状态。例如,第二良好信号可指示电力供应单元122正产生或输出足够的电力给系统200(例如服务器机架102)。以上描述了从电力供应单元122传送信号给电力管理控制器140,但每个电力供应单元(例如电力供应单元124、126、128、130)也可以传送类似的信号给电力管理控制器140。例如,电力供应单元126可以传送现在信号(例如信号ps3_present)与良好信号(例如信号ps3_ok1和信号ps3_ok2)给电力管理控制器140,藉此以电力供应单元122类似的方式来指示电力供应单元126的状态。

在一些实作中,电力管理控制器140可基于从电力供应单元接收到的状态信号来传送开启或关闭信号给每个电力供应单元。例如,如果电力管理控制器140从电力供应单元128接收到了现在信号,则电力管理控制器140可传送开启信号给电力供应单元128以开启电力供应单元128。在开启以后,电力供应单元128可以传送第一良好信号与第二良好信号给电力管理控制器140,藉此指示电力供应单元128是正常的在运作中。例如,第一良好信号与第二良好信号可传送一个数值(或电压),其指示电力供应单元128的状态为良好。如果电力供应单元128传送给电力管理控制器140的第一良好信号与第二良好信号指示电力供应单元128并没有正常的运作(例如第一良好信号和/或第二良好信号的数值指示有故障),则电力管理控制器140可传送信号至电力供应单元128以关闭电力供应单元128,避免损坏电力供应单元128或是损坏系统200(例如服务器机架102)。例如,电力管理控制器140可以存储每一个电力供应单元的状态(例如是否良好、故障),使得电力管理控制器140之后不会尝试开启故障的电力供应单元。

在一些实作中,电力管理控制器140可以检测到一个电力供应单元已经被替换。例如,当耦接至电力供应架120时,电力供应单元128可以传送现在信号给电力管理控制器140。当电力管理控制器140监控电力供应单元128的状态(例如良好或故障)时,电力管理控制器140可以监控现在信号。当电力管理控制器140检测到再也没有从电力供应单元128接收到现在信号,电力管理控制器140可判定电力供应单元128已经和电力供应架120断开连接。当新的电力供应单元128耦接至电力供应架120时,电力管理控制器140可判定故障的电力供应单元128已经被替换,接下来会开启新的电力供应单元128,并且监控现在信号、第一良好信号与第二良好信号以判断新电力供应单元128的状态。

在一些实作中,电力管理控制器140可以根据从机架管理控制器150接收到的设定数据来开启电力供应单元。例如,机架管理控制器150可从耦接至电力供应架120的电力供应单元接收到状态信号。这些状态信号可以相同于,如上所述的,电力供应单元(例如,电力供应单元122、124、126、128和/或130)所产生并传送给电力管理控制器140的状态信号。例如,每一个电力供应单元可产生现在信号、第一良好信号与第二良好信号,并将这些信号传送给机架管理控制器150。机架管理控制器150可接收这些信号,判断每个电力供应单元的状态并且动态地调整系统200中电力供应单元的设定。例如,如上所述,如果机架管理控制器150判定需要2+1的电力供应单元设定来驱动服务器机架120,则机架管理控制器150可通过控制总线202传送电力供应单元设定数据给电力管理控制器140,指示应该开启电力供应单元122、124、126。响应于接收到电力供应单元设定数据,电力管理控制器140可传送开启信号至电力供应单元122、124、126并且如果需要的话传送关闭信号至电力供应单元128与120。

在一些实作中,机架管理控制器150可动态地调整系统200中的电力供应单元设定。例如,机架管理控制器150可以检测电力供应单元122的故障,并且传送更新后的设定数据给电力管理控制器140。例如,如果机架管理控制器150接收到了第一良好信号ps1_ok1和/或第二良好信号ps1_ok2,其指示电力供应单元122已故障,则机架管理控制器150可传送电力供应单元设定数据给电力管理控制器140,指示应该开启电力供应单元124、126、128,应该关闭电力供应单元130,而电力供应单元122已故障。如此一来,机架管理控制器150可维持2+1的电力供应单元设定以驱动系统200。在一些实作中,当电力供应单元(例如电力供应单元122)已故障,机架管理控制器150可传送一警报给管理者装置170,藉此通知系统管理者有一个电力供应单元已故障并且需要替换。例如,机架管理控制器150可以周期地传送警报给管理者装置170,直到故障的电力供应单元已被替换。

在一些实作中,机架管理控制器150可以动态地调整系统200中的电力供应单元设定,特别是在多个电力供应单元都故障的情况。例如,机架管理控制器150可检测电力供应单元122与电力供应单元124的故障。可理解的是,机架管理控制器可检测任何一个或所有电力供应单元的故障,并不限于先前的例子。例如,如果机架管理控制器150接收到第一良好信号ps1_ok1和/或第二良好信号ps1_ok2,其指示电力供应单元122和电力供应单元124已故障,则机架管理控制器150可以传送电力供应单元设定数据给电力管理控制器140,指示应该开启电力供应单元126、电力供应单元128与电力供应单元130,并且电力供应单元122和电力供应单元124已故障。如此一来,机架管理控制器150可以维持2+1的电力供应单元设定以驱动系统200。在一些实作中,当电力供应单元(例如电力供应单元122和电力供应单元124)已故障,机架管理控制器150可传送警报给管理者装置170以通知系统管理者电力供应单元以故障且需要替换。例如,机架管理控制器150可周期地传送警报给管理者装置170,直到故障的电力供应单元已被替换。

在一些实作中,机架管理控制器150可基于检测系统200电力使用的增加而动态地调整系统200中的电力供应单元设定。例如,机架管理控制器150可以检测系统200(例如服务器机架102)中额外的服务器或元件。机架管理控制器150可以判断出额外的服务器和/或元件需要更多的电力。基于系统200增加的电力需求,机架管理控制器150可以判断需要3+1的电力供应单元设定来驱动系统200并且提供以减缓故障的意外。基于此判断,机架管理控制器150可以将电力供应单元设定数据传送给电力管理控制器140,指示需要开启电力供应单元124、126、128、130,并且因为电力供应单元122先前已经故障了,所以电力供应单元122应该维持在关闭且故障的状态。响应于从机架管理控制器150接收到电力供应单元设定数据,电力管理控制器140可开启电力供应单元124、126、128、130。

在一些实作中,当检测到有电力供应单元故障时,机架管理控制器150可以传送紧急警报给管理者装置170。继续上面的例子,如果机架管理控制器150已经设定电力管理控制器140为3+1的设定,并且电力供应单元122已故障且还没有被替换,这表示系统200正使用所有四个良好的电力供应单元,系统200已没有保留可用的电力供应单元。如果机架管理控制器150检测到电力供应单元124已故障(例如信号ps2指出故障),则机架管理控制器150可传送紧急警报给管理者装置170,指出系统200已经没有能力再减缓电力供应单元的故障。例如,由于系统200需要最少3个电力供应单元来运作,并且系统只有3个可运作的电力供应单元留下来(例如电力供应单元126、128、130),因此系统200已没有额外(例如+1)电力供应单元可以开启来减缓其他电力供应单元的故障。因此,一个额外的故障(例如可运作的电力供应单元减少至2个)会造成系统200效能的降低,这是因为系统200需要3个电力供应单元来运作在全效能的状态。

在一些实作中,机架管理控制器150可以基于检测到电力供应单元的故障来动态地调整系统200的电力使用。继续上述的例子,当只有3个电力供应单元在运作中并且系统200需要3个电力供应单元来运作在全效能的状态时,如果机架管理控制器150检测到电力供应单元126已故障,则机架管理控制器150可传送电力供应单元设定数据至机架管理控制器150,指示系统200使用3+1的设定,电力供应单元128、130在运作中,并且电力供应单元122、124、126已故障。响应于检测到的故障,机架管理控制器150可判断出没有足够的电力供应单元来驱动系统200(例如,需要3个电力供应单元,但只有2个电力供应单元在运作中)。响应于检测到没有足够可用的电力供应单元来驱动系统200,机架管理控制器150可以指挥服务器机架102中的服务器减少他们的功率消耗。或者,服务器机架102中的各种元件也可以指挥服务器减少他们的功率消耗。例如,机架管理控制器150可以传送指令给基板管理控制器107、109、111、113来降低服务器机架102中每个服务器106、108、110、112中央处理器的操作频率,如此可以将每个服务器的功率消耗减少到一个程度,使得可以由剩余2个电力供应单元(例如电力供应单元128和电力供应单元130)来供应此程度的功率消耗。

在一些实作中,电力管理控制器140可以传送一个电力供应警报给系统200。例如,响应于检测到电力供应单元的故障使得电力供应单元的数目已经减少到小于电力供应单元能驱动系统200的最小临界数目,电力管理控制器140可以传送一个警告给系统200,指示系统200应该减少它的功率消耗至可以由剩余2个电力供应单元128、130供应的程度。例如,电力管理控制器140可以传送警告给机架管理控制器150,并且机架管理控制器150可以传送指令给服务器机架102中服务器的基板管理控制器,藉此使服务器减少它们的功率消耗。或者,电力管理控制器140可以传送警告给每个服务器以减少它们的功率消耗。

如此一来,系统200可以动态地管理系统200的电力供应单元以适应系统200中各种的电力需求与电力供应情况。

在一些实作中,每个状态信号可以传送在不同的电路、导电线路或电线。如此一来,图2的方块图可以描绘出用来将电力供应架120连接至电力管理控制器140与机架管理控制器150的电路。例如,电力供应架可包括用来传送信号ps1_present、ps1_ok1、ps1_ok2的输出引脚。机架管理控制器150和电力管理控制器140可包括用来接收信号ps1_present、ps1_ok1、ps1_ok2的输入引脚。这些输出引脚与输入引脚可以连接至电路或电路基板上的线路,使得可以将这些信号从电力供应单元传送至机架管理控制器150与电力管理控制器140。

图3是绘范例性电力供应状态300、310、320的方块图。例如,电力供应状态300绘示了3+1的电力供应单元设定。在电力供应状态300中,电力供应单元122、124、126提供能驱动服务器机架120的最小电力需求,并且电力供应单元128提了额外的(例如+1)的电力供应单元,用于减缓电力供应单元的故障。因此,电力供应单元122、124、126、128的其中之一可以故障,并且其他3个依然可以提供足够的电力来使服务器机架102运作在全效能的状态。在电力供应状态300中,电力供应单元130被关闭,藉此减少电力供应单元130的损耗和能量使用。

在电力供应状态310中,电力供应单元122、124、126、130会被开启以维持3+1的设定。电力供应单元128已故障并且被关闭。例如,机架管理控制器150可以检测到电力供应单元128的故障,并且已经传送了指令给电力管理控制器140以关闭电力供应单元128和开启电力供应单元130。

在电力供应状态320中,电力供应单元122、124被开启。电力供应单元126、128、130已故障且已被关闭。由于服务器机架102使用3+1的设定(例如,最少需要3个电力供应单元来提供服务器机架102的电力需求)且只有2个电力供应单元的状况是良好,因此机架管理控制器150可传送指令给服务器机架102中的每个服务器(例如每个服务器的基板管理控制器),藉此将每个服务器的功率消耗降低至一个程度,使得剩余的2个电力供应单元(例如电力供应单元122、124)可以驱动服务器机架102。例如,如果电力供应单元122、124可以提供共1000瓦的功率输出,则机架管理控制器150可以传送指令,以将服务器机架102中四个服务器的功率消耗都减少至低于250瓦。例如,每个基板管理控制器可以调整对应服务器中中央处理器的设定(例如操作频率设定),使得中央处理器消耗少于200瓦的功率。如果服务器的中央处理器不能运作在减少之后的功率,则基板管理控制器可关闭服务器以避免对服务器或电力供应单元造成损害。

图4是绘示用以动态管理服务器机架系统中的电力供应单元的范例性程序400的流程图。在步骤402,系统控制器可以测定服务器机架系统的电力需求。例如,机架管理控制器150可以测定服务器机架102的电力需求。机架管理控制器150可以和服务器机架102中每个服务器的基板管理控制器通信,藉此测定每个服务器的设定与电力需求。例如,经验上基板管理控制器可以监控不同时间的电力使用,藉此判断出上述的电力需求。身为管理者的用户可以先判断出电力需求,而基板管理控制器可以被预先设定为此电力需求。例如,机架管理控制器150可以被设定为用于机架设定的电力需求。例如,机架管理控制器150可以判断服务器机架102需要1000瓦来驱动服务器机架102中的服务器。

在步骤404,系统控制器可以根据服务器机架系统的电力需求来开启电力供应单元给服务器机架系统。例如,机架管理控制器150可以向服务器机架102中电力供应架耦接的每个电力供应单元要求电力输出信息。机架管理控制器150可以判断出服务器机架102设置有6个电力供应单元,并且每个电力供应单元能够供应400瓦给服务器机架102中的服务器。机架管理控制器150可以判断出上述6个电力供应单元的其中3个需要被开启以提供服务器机架102所需要的1000瓦(例如3x400=1200瓦)。因此,服务器机架102需要最少(例如临界数目)3个电力供应单元来产生必要的电力以驱动服务器机架于满载的状态。基于上述判断出的电力供应单元的最小数目,机架管理控制器150可以设定服务器机架102运作在3+1的设定。例如,机架管理控制器150可以传送电力供应单元设定数据至电力管理控制器140,指示需要开启4个电力供应单元(例如,最少三个电力供应单元加上用于减缓故障的一个电力供应单元)。电力管理控制器140接下来可以传送开启信号给上述的电力供应单元设定数据中所指定的四个电力供应单元。

在步骤406,系统控制器可以从电力供应单元接收状态信号。例如,机架管理控制器150与电力管理控制器140可以从服务器机架102的电力供应架耦接的每一个电力供应单元接收到状态信号。如上所述,每个电力供应单元可以传送现在信号、第一良好信号与第二良好信号至机架管理控制器150和/或电力管理控制器140。

在步骤408,系统控制器可检测电力供应单元的故障。例如,当机架管理控制器150接收到指示电力供应单元并没有正常运作的第一良好信号和/或第二良好信号时,机架管理控制器150可以判断出已开启的电力供应单元的其中之一已故障。

在步骤410,系统控制器可以传送警报给管理者装置。例如,机架管理控制器150可以传送警报给管理者装置170,以通知身为管理者的用户有电力供应单元已故障且需要替换。

在步骤412,系统控制器可以判断是否有额外的电力供应单元可以开启。例如,当服务器机架102的电源架设置有6个电力供应单元且机架管理控制器150指定使用3+1的设定,机架管理控制器150可以判断仍然有两个关闭的电力供应单元保留在服务器机架102中。因此,在此例子中,机架管理控制器150可以判断有另一个电力供应单元可以开启以替换故障的电力供应单元。

在步骤414,系统控制器可开启其中一个保留的电力供应单元。例如,如上所述,由于机架管理控制器150判断出还保留有可用的电力供应单元,因此机架管理控制器150可以传送设定数据给电力管理控制器140,使得电力管理控制器140会开启其中一个保留的电力供应单元。如此一来,在步骤414结束时,会有四个运作中且开启的电力供应单元(例如3+1),保留有一个关闭的电力供应单元,并且有一个故障的电力供应单元。

在步骤414之后,程序400可回到步骤406,其中系统控制器从运作中的电力供应单元接收到状态信号。例如,机架管理控制器150可以通过监控从每个电力供应单元接收到的信号来监控已开启的电力供应单元的状况。

若在步骤412中,系统控制器判断已经没有保留可用且关闭的电力供应单元,则系统控制器可判断是否有可用且状况良好的电力供应单元可以产生足够的电力来驱动服务器机架102。例如,如果机架管理控制器150在先前已判断最少需要3个电力供应单元来驱动服务器机架102并且还有3个可运作且状况良好的电力供应单元,则机架管理控制器可判断有足够的电力来驱动服务器机架102。

在步骤418中,系统控制器可传送紧急警报至管理者装置。例如,机架管理控制器150可判断有足够可操作的电力供应单元(例如3个)以驱动服务器机架102,但是没有电力供应单元(例如没有1个)来减缓另一个电力供应单元的故障。机架管理控制器150可传送紧急警报至管理者装置以通知身为管理者的用户有另一个电力供应单元已故障,并且再一个电力供应单元的故障会造成服务器机架系统降低其效能。此紧急警报可以周期地传送,藉此提醒身为管理者的用户该去替换故障的电力供应单元了。

在步骤418之后,程序400可回到步骤406,其中系统控制器可以从运作中的电力供应单元接收状态信号。例如,机架管理控制器150可以通过监控从每个电力供应单元(步骤406)接收到的信号来监控电力供应单元的状况,并且检测电力供应单元的故障(步骤408)。

如果在步骤416中,系统控制器判断剩余况状良好且运作中的电力供应单元不能提供足够的电力给服务器机架102,则在步骤420中系统控制器可传送警告讯息给服务器机架系统。例如,如果机架管理控制器150判断需要3个电力供应单元来驱动服务器机架102,并且在一个电力供应单元故障以后只剩下2个状况良好且运作中的电力供应单元,则在步骤420机架管理控制器150可以传送警告讯息给服务器机架102。例如,此警告讯息可以是传送给服务器机架系统的指令,用来减少服务器的中央处理器的功率,藉此减少功率的消耗。例如,机架管理控制器150可以传送指令给服务器机架102中每个服务器对应的基板管理控制器,使得基板管理控制器去减少对应服务器的功率消耗。

在步骤422中,系统控制器可以减少中央处理器消耗的功率。例如,当基板管理控制器接收到从机架管理控制器150在步骤420发出的指令时,基板管理控制器可以让每个服务器的中央处理器减少其频率,藉此减少每个服务器消耗的功率总量。

在步骤424中,系统控制器可判断是否要关闭服务器机架系统。例如,如果服务器机架102中的服务器仍然可以运作在降低后的功率,则程序400会回到步骤406。然而,如果由剩余电力供应单元供应的功率小于一个关键的功率水准,则在步骤426中,机架管理控制器150可判断应该降低服务器机架102的功率并且可以关闭电力供应单元。例如,机架管理控制器150可传送电力供应单元设定数据至电力管理控制器140,指示没有电力供应单元应该被开启。在接收到此电力供应单元设定数据以后,电力管理控制器140可以传送关闭信号至所有的电力供应单元,藉此关闭所有的电力供应单元。

[范例性系统架构]

图5是实作图1~4特征与程序的范例性系统架构500的方块图。架构500可以实作为任意的电子装置,其可以执行由编译后的指令所衍生的软件应用程序,此电子装置可包括但不限于个人计算机、服务器、智能手机、媒体播放器、电子平板计算机、游戏机、电子邮件装置等。在一些实作中,架构500可包括一或多个处理器502、一或多个输入装置504、一或多个显示装置506,一或多个网络接口508和一或多个计算机可读介质510。这些元件中的每一个元件都可以通过总线512彼此耦接。

显示装置506可以使用任何已知的显示技术,包括但不限于液晶显示器(liquidcrystaldisplay,lcd)或发光二极管(lightemittingdiode,led)技术。处理器502可以使用任何已知的处理器技术,包括但不限于图形处理器与多内核处理器。输入装置504可以使用任何已知的输入装置技术,包括但不限于键盘(包括虚拟键盘)、鼠标、轨迹球、以及触控板或显示器。总线512可以使用任何已知的内部或外部总线技术,包括但不限于工业标准结构(industrystandardarchitecture,isa)、扩展工业标准结构(extendedindustrystandardarchitecture,eisa)外围元件互联(peripheralcomponentinterconnect,pci)、快捷外围元件互联(pciexpress,pcie)、新总线(nubus)、通用串行总线(universalserialbus,usb)、串行先进技术附件(serialadvancedtechnologyattachment,serialata)或火线。

计算机可读介质510可以是参与提供指令给处理器502来执行的任意介质,包括但不限于非易失性存储介质(例如光盘,磁盘,快闪存储器等)或易失性介质(例如同步动态随机存取存储器、只读存储器等)。计算机可读介质(例如存储装置、介质与存储器)可例如包括包含位串或相似物的缆线或无线信号。然而,当提到非暂态计算机可读取存储介质时,是明确地排除了如能量、载波、电磁波与信号本身的介质。

计算机可读介质510可包括各种指令来实作操作系统514(例如maclinux)。此操作系统514可以是多用户、多重处理、多重任务、多重线程(执行绪)、及时等。此操作系统514执行基本的任务,包括但不限于:辨认从输入装置504而来的输入;传送输出至显示装置506;追踪计算机可读介质510上的文件与目录;控制周边装置(例如硬盘驱动器、打印机等),这些周边装置可以直接地或通过输入/输出控制器来控制;并且管理总线512上的传输。网络通信指令516可以建构并维持网络的连线(例如实作通信协议的软件,此通信协议例如为tcp/ip、http、ethernet等)。

图形处理系统518可包括提供图形与图像处理能力的指令。应用程序520可以是使用或实作图1~图4中所描述程序的应用程序。这些程序也可以实作在操作系统514中。

服务器控制器522可以是一个控制器,此控制器与处理器502和/或操作系统514是独立地运作。在一些实作中,服务器控制器522可以在处理器502被启动且操作系统514被载入至处理器502前先被启动且运作。例如,服务器控制器522可通过专用的网络接口或其他输入装置,用于计算装置的预操作系统(pre-os)管理。例如,系统控制器522可以是基板管理控制器,其会监控装置的传感器(例如感测电压、温度、风扇等)、用于故障分析的记录事件、提供led引导诊断,进行电源管理,和/或通过智能平台管理接口(intelligentplatformmanagementinterface,ipmi)、键盘、视频和鼠标(keyboard,video,mouse,kvm)重定向、局域网络上串行(serialoverlan,sol)和/或其他接口来提供远端管理能力。服务器控制器522可以实作上述图1~图4所描述的程序。例如,服务器控制器522可用来管理耦接至服务器机架102的电力供应单元。

所描述的特征可以有利地实现在可在可编程系统上执行的一个或多个计算机程序中,该可编程系统包括至少一个可编程处理器,其耦接到数据存储系统以从其接收数据和指令以及向其发送数据和指令;至少一个输入装置;以及至少一个输出装置。计算机程序是可以在计算机中直接或间接使用以执行特定动作或产生特定结果的指令集。计算机程序可以以任何程序语言(例如objective-c,java)形式来撰写,包括编译语言或汇编语言,并且其可以以任何形式进行部署,包括作为单机程序或作为模块、元件、子程序、或适合于在计算环境中使用的其他单元。

作为例子,用于执行指令程序的适合的处理器包括通用处理器和专用处理器,以及任何类型的计算机的单处理器或多处理器之一。通常,处理器会从只读存储器或随机存取存储器或二者接收指令和数据。计算机的必要元件是用于执行指令的处理器以及用于存储指令和数据的一个或多个存储器。通常,计算机还会包括一个或多个用于存储数据文件的海量存储设备或者可操作地与其耦合以进行通信;这种设备包括磁盘,诸如内部硬盘或可拆盘;磁光盘;以及光盘。适合于有形地具体化计算机程序指令和数据的存储设备包括所有形式的非易失性存储器,作为示例,其包括半导体存储器元件,诸如epr0m、eeprom以及快闪存储器装置;磁盘,诸如内部硬盘和可拆盘;磁光盘;以及cd-rom盘和dvd-rom盘。处理器和存储器可以由专用集成电路(application-specificintegratedcircuits,asic)来补充或并入其中。

为了提供与用户的互动,这些特征可以实现在计算机上,该计算机具有用于向用户显示讯息的显示设备(例如阴极射线管或液晶显示器),以及用户可以用来向计算机提供输入的键盘和指向设备(例如鼠标或轨迹球)。

这些特征可以实现在计算机系统中,其包括后端元件,例如数据服务器;或者其包括中间件元件,例如应用服务器或互联网服务器;或者其包括前端元件,诸如具有图形用户接口或互联网浏览器的客户端计算机,或者是其任意组合。系统的元件可以通过任何形式或数字数据通信(例如通信网络)而连接。通信网络的示例包括,例如lan、wan以及组成互联网的计算机和网络。

计算机系统可包括客户端和服务器。客户端和服务器通常相互远离,并且典型地通过网络(例如前述网络)进行互动。客户端与服务器的关系由于运行在各自计算机上并且相互具有客户端-服务器关系的计算机程序而产生。

在此实施例中的一或多个特征或步骤可以用应用程序接口(applicationprograminterface,api)来实作。应用程序接口可以定义在呼叫应用程序与其他软件程序代码(例如操作系统、程序函数库、函数)之间的一或多个参数,其提供了服务,此服务提供数据或执行一个操作或计算。

在程序代码中应用程序接口可以实做为一或多个呼叫,通过参数列或其他数据结构,并基于在应用程序接口规格文件中定义的呼叫规范来传送或接收一或多个参数。参数可以是常数、关键字、数据结构、物件、物件类别、变量、数据类型、指标、阵列、列表、或其他呼叫。应用程序接口的呼叫与参数可以用任何的程序语言来实作。此程序语言可以定义字汇与呼叫规范,使得程序设计者可存取支持此应用程序接口的函数。

在一些实作中,应用程序接口向应用程序回报执行此应用程序的装置的能力,例如输入能力、输出能力、处理能力、电力能力、通信能力等。

以上公开了数个实作方式。然而,可理解的是也可以做出各种的修改。例如,在上述的流程中也可以提供其他步骤或是删除一些步骤,或者在上述的系统中可以加入或移除一些元件。据此,其他的实作方式也会在后附的权利要求书中。

虽然各种例子与其他信息已被用来解释权利要求书中的观点,但本领域技术人员当可使用这些例子来完成各式各样的实作,在这些例子中特定的特征或安排都不应用来限制权利要求书要求保护的范围。更进一步来说,虽然一些标的已经用特定的语言来解释为特定的结构性特征即/或方法步骤,但可理解的是权利要求书中定义的标的并不限于所描述的特征或动作。例如,这些功能可以分散在不同的元件或由不同的元件来执行,这些元件可以不同于上述的元件。相反的是,这些特征与步骤是被解释为权利要求书中系统与方法的元件的例子。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1