专利名称:整机柜服务器集中管理方法和装置的制作方法
技术领域:
本发明涉及数据通信技术,特别涉及整机柜服务器集中管理方法和装置。
背景技术:
目前,随着互联网数据中心(IDC=Internet Data Center)的发展,IDC中的服务器数量也随之增长,从之前的几百台,快速增长到现如今的几千台、甚至几万台,并且,服务器中需要管理的内容也随之增加,以往几个IT人员就可以维护的工作,现在需要几十、几百个IT人员才能完成。尽管IDC中服务器数量、以及服务器中需要管理的内容都有所增加,但是,IT人员管理服务器的手段和方法长期以来却没有得到发展和升级,仍然是IT人员通过管理控制平台一对一地对每台服务器进行直接操作和监控。比如,在IDC中放置了 1000台服务器, 如此,IT人员需要对这1000台服务器节点分别进行管理。这增加IT人员的工作量,且容易出现人为差错。
发明内容
本发明提供了整机柜服务器集中管理方法和装置,避免由IT人员对单个服务器进行监控和操作带来的缺陷。本发明提供的技术方案包括一种整机柜服务器集中管理方法,该方法中,将互联网数据中心IDC中的服务器划分至至少一个机柜中,每一机柜包含多个服务器;针对一个以上机柜,在IDC中增加一个用于管理该机柜的集中管理装置,该方法包括所述集中管理装置根据管理控制平台针对该集中管理装置所管理的机柜设定的管理策略,对其管理的机柜中的服务器进行智能控制;所述集中管理装置接收管理控制平台针对该集中管理装置所管理的机柜中至少一个服务器下发的控制命令,并根据该控制命令对服务器执行相应的控制操作;所述集中管理装置采集其所管理的机柜中每一服务器的状态信息,并从每一服务器的状态信息中分析出需要上报至管理控制平台的信息,将分析出的信息上报至管理控制平台,由所述管理控制平台根据所述集中管理装置上报的每一服务器的信息重新设置针对该服务器的控制命令,并下发至所述集中管理装置。一种整机柜服务器集中管理装置,所述集中管理装置应用于将互联网数据中心 IDC中的服务器划分至至少一个机柜的应用场景中,每一机柜包含多个服务器,所述集中管理装置用于管理至少一个机柜,其与管理控制平台、以及所管理的机柜中各个服务器相连, 所述集中管理装置包括第一控制单元,用于根据管理控制平台针对所述集中管理装置所管理的机柜设定的管理策略,对其管理的机柜中的服务器进行智能控制;第二控制单元,用于接收管理控制平台针对所述集中管理装置所管理的机柜中至少一个服务器下发的控制命令,并根据该控制命令对服务器执行相应的控制操作;信息处理单元,用于采集所述集中管理装置所管理的机柜中每一服务器的状态信息,并从每一服务器的状态信息中分析出需要上报至管理控制平台的信息,将分析出的信息上报至管理控制平台,由所述管理控制平台根据所述集中管理装置上报的每一服务器的信息重新设置针对该服务器的控制命令,并下发至所述集中管理装置。由以上技术方案可以看出,本发明中,不再需要IT人员面对每一台服务器进行管理,而是由集中管理装置针对每台机柜进行管理和控制,这避免由IT人员对单个服务器进行监控和操作带来的缺陷;进一步地,本发明中,集中管理装置采集整机柜中各个服务器的状态信息,并分析各个服务器的状态信息,为管理控制平台设定后续的控制命令提供依据,以及本发明中,集中管理装置将分析出的整机柜中各个服务器的信息实时自动上报到管理控制平台,不需要人工申请和操作,避免由于人工操作而带来人为差错。
图1为本发明实施例提供的网络结构图;图2为本发明实施例提供的流程图;图3为本发明实施例提供的集中管理装置结构图。
具体实施例方式为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。本发明提供了整机柜服务器集中管理方法,在该方法中,需要将IDC中的服务器划分至至少一个机柜中,其中,每一机柜包含多个服务器。本发明中,可设置一个机柜中最多包含40台服务器,而通常,一个IDC中包含上百、甚至上千台服务器,基于此,本发明就需要最大以40为单位将将IDC中的服务器划分为多个机柜。优选地,本发明中,在执行上述划分服务器至机柜时,可基于具有相同业务类型的服务器处于同一机柜的原则来将服务器划分至机柜。当然,这只是本发明的一个举例,本发明还可采用其他原则来划分服务器,本发明不再一一具体限定。另外,为了实现本发明,需要针对至少一个机柜,在IDC中增加一个用于管理该机柜的集中管理装置,具体如图1所示。图1示出了针对一个机柜,在IDC中增加一个用于管理该机柜的集中管理装置的示例。优选地,作为本发明的一种扩展,也可针对两个、甚至多个机柜配置一个集中管理装置,这相比于针对一个机柜配置一个集中管理装置,能够节省系统资源。在图1中,集中管理装置通过以太网口与网络交换机相连,而网络交换机与所有机柜中的服务器相连,同时,网络交换机还与管理控制平台相连。各个机柜中的服务器与集中管理装置之间,以及管理控制平台和集中管理装置之间都预先约定好进行通信的网络协议比如智能型平台管理接口(IPMI Jntelligent Platform Management Interface)协议或者简单网络管理协议(SNMP =Simple Network Management Protocol)。另外,本发明中的集中管理装置可以是一台单独的服务器或PC机,其仅仅实现管理功能,对性能要求不高,可以使用成本相对低廉的嵌入式处理器,如Intel Atom平台,不但功耗很低,而且基于X86平台,软件开发和移植都比较简单方便。还有,本发明中,集中管理装置安装有操作系统,如Linux,Windows等,并在操作系统上面运行有智能管理软件,该智能管理软件实现了服务器信息的采集,分析,统计,上报,以及对服务器的智能或人工控制。下面基于图1所示的结构,下面对本发明提供的方法进行描述参见图2,图2为本发明实施例提供的方法流程图。如图2所示,该流程可包括以下步骤步骤201,集中管理装置根据管理控制平台针对该集中管理装置所管理的机柜设定的管理策略,对其管理的机柜中的服务器进行智能控制。本步骤201中,管理控制平台针对集中管理装置所管理的机柜设定管理策略是根据实际需求、以及该机柜中各个服务器的性能执行的,本发明并不具体限定。本步骤201中,集中管理装置只是根据管理控制平台预先设定的管理策略管理机柜,其在管理过程中不需要管理控制平台的干预。以管理策略为整个机柜的最大功耗为 7000W为例,则集中管理装置实时检测其管理的每一机柜中所有服务器的总功耗,一旦任何时候超过最大功耗7000W,集中管理装置就会通过一系列手段来自动控制整机柜的功耗,以使整机柜中所有服务器的总功耗不会超过这个最大功耗7000W。通过步骤201,能够实现了集中管理装置智能管理机柜的目的。步骤202,集中管理装置接收管理控制平台针对该集中管理装置所管理的机柜中至少一个服务器下发的控制命令,并根据该控制命令对服务器执行相应的控制操作。其中,上述针对服务器的控制命令,可由IT人员通过安装在管理控制平台上的客户端软件预先设置;之后,基于如图1所示的集中管理装置、管理控制平台分别与网络交换机相连的结构,则管理控制平台利用约定好的网络协议将针对服务器的控制命令下达给网络交换机,由网络交换机按照与集中管理装置之间约定好的网络协议将接收的服务器的控制命令发送给集中管理装置。需要说明的是,本步骤202中,管理控制平台可针对该集中管理装置所管理的机柜中的每一个服务器下发控制命令,也可统一针对该集中管理装置所管理的机柜中的多个服务器比如2个、3个、甚至该集中管理装置所管理的机柜中的所有服务器下发控制命令。 以控制命令为整机柜中所有服务器关机命令为例,这样的控制命令没有必要对每一服务器一一下达,可统一针对整机柜中所有服务器下发,而针对服务器单独具有的控制命令,则需要单独针对该服务器下发控制命令,具体实现时完全可以从实际情况和节省系统资源的目的出发,本发明不再一一限定。优选地,本发明中,该控制命令至少包括以下一种或任意几种的组合(1)、机柜中服务器的功耗控制策略;(2)、机柜中服务器的风扇转速控制策略;(3)、机柜中服务器的故障处理方法或策略;(4)、机柜中服务器固定资产编号的分配和更新。当集中管理装置接收到服务器的控制命令后,利用约定好的协议通过网络交换机传送给该服务器,当服务器接收到对自身的控制命令后,通过内部的基板管理控制器(BMC Baseboard Management Controller)芯片对自身进行管理和控制。对应于上述控制命令,则本发明中对服务器执行的控制操作至少包括以下一种或任意几种的组合(1)、按照功耗控制策略对服务器进行功耗调控,确保服务器的功耗始终低于设定值;(2)、按照风扇转速控制策略调节风扇转速;(3)、对服务器进行开、关机控制;(4)、对服务器内部的部分芯片的工作状态进行设置;(5)、对服务器内部软件进行加载和升级。步骤203,所述集中管理装置采集其所管理的机柜中每一服务器的状态信息,并从每一服务器的状态信息中分析出需要上报至管理控制平台的信息,将分析出的信息上报至管理控制平台,由所述管理控制平台根据所述集中管理装置上报的每一服务器的信息重新设置针对该服务器的控制命令,并下发至所述集中管理装置。标准的服务器都能对外提供管理网口比如以太网口,基于此,本步骤203中,集中管理装置采集各个机柜中每一服务器的状态信息包括所述集中管理装置所管理的机柜中的每一服务器通过自身的BMC芯片获取自身的状态信息,并按照与集中管理装置约定好的网络协议将获取的状态信息通过管理网口对外输出至所述集中管理装置。基于图1所示的结构,所述集中管理装置所管理的各个机柜中的每一服务器将获取的自身状态信息先通过管理网口发送给网络交换机,由网络交换机按照与集中管理装置之间约定好的网络协议将接收的每一服务器的状态信息发送给集中管理装置。如此,即可实现集中管理装置采集各个机柜中每一服务器的工作状态信息的操作。其中,所述服务器的状态信息至少包括以下一种或任意几种的组合(1)、服务器供电电源的输入电压,电流和功耗;(2)、服务器供电电源的输出电压,电流和功耗;(3)、服务器供电电源的各种报警状态,包过流报警,过压报警,过温报警,电源风扇故障报警;(4)、服务器风扇组件的工作状态;(5)、服务器风扇组件的异常和故障状态;(6)、服务器内部各关键芯片的温度数据,以及温度过热报警;(7)、服务器内部各关键芯片的电压数据,以及电压过高或过低的报警;(8)、服务器内部各关键芯片的工作状态信息,以及故障报警;(9)、服务器工作日志。对应于上述的服务器状态信息,则本步骤203中,从每一服务器的状态信息中分析出需要上报至管理控制平台的信息至少包括以下一种或任意几种的组合(1)、服务器各组件的工作状态;其中,所述服务器的各组件至少包括风扇组件、 电源模块,CPU,内存和各关键芯片;(2)、服务器的实时功耗,以及整机柜的实时功耗;(3)、服务器的工作日志信息;
(4)、服务器各组件的故障和报警信息;(5)、服务器的序列号和固定资产编号。需要说明的是,本步骤203中,基于图1所示的结构,集中管理装置可根据事先约定好的网络协议(如SNMP)并通过网络交换机将分析出的每一服务器需要上报至管理控制平台的信息上报至管理控制平台。当管理控制平台安装好指定的客户端软件就可以显示集中管理装置上报的每一服务器的信息。为便于IT人员查看,本发明中,管理控制平台安装的客户端软件建议使用图形化界面的形式友好的显示集中管理装置上报的每一服务器的信息给IT人员,以便IT人员直观查看所述集中管理装置上报的每一服务器的信息,并重新设置针对该服务器的控制命令,下发至所述集中管理装置。至此,完成图2所示的流程。从图2所示的流程可以看出,本发明中,所述集中管理装置实时采集其所管理的机柜中每一服务器的状态信息,并实时上报每一服务器需要上报至管理控制平台的信息至管理控制平台,不需要人工申请和操作。需要说明的是,本发明中,集中管理装置可以是集成在其管理的机柜中除服务器之外的其它设备中,也可集成到网络交换机中,或者集成到其管理的机柜中的某台服务器上,本发明并不具体限定。这种集中管理装置集成做法的好处是物理上减少了单独的集中管理装置,可以有效的降低硬件成本,同时由于集中管理装置的集成,可以使空余的机柜放置更多的服务器,提高了机柜的服务器上架密度,并在一定程度上减少布线和降低能耗。另外,由于本发明是以机柜为单位进行服务器管理的,工作量不大,占用的CPU资源很少,因此,网路交换机与所有机柜中服务器相连,可以由网络交换机自己内部的CPU协助完成;也可以在网络交换机的主控板上额外增加一个单独的CPU,本发明并不具体限定。至此,完成本发明的方法描述,下面对本发明提供的集中管理装置进行描述参见图3,图3为本发明实施例提供的集中管理装置结构图。所述集中管理装置应用于将IDC中的服务器划分至至少一个机柜的应用场景中,每一机柜包含多个服务器, 所述集中管理装置用于管理至少一个机柜,图3示出了集中管理装置仅管理1个机柜的示例。优选地,作为本发明的一种扩展,集中管理装置也可管理两个、甚至多个机柜,这相比于一个集中管理装置管理一个机柜能够节省系统资源。其中,所述集中管理装置与管理控制平台、以及所管理的机柜中各个服务器相连,如图3所示,所述集中管理装置包括第一控制单元,用于根据管理控制平台针对所述集中管理装置所管理的机柜设定的管理策略,对其管理的机柜中的服务器进行智能控制;第二控制单元,用于接收管理控制平台针对所述集中管理装置所管理的机柜中至少一个服务器下发的控制命令,并根据该控制命令对服务器执行相应的控制操作;信息处理单元,用于采集所述集中管理装置所管理的机柜中每一服务器的状态信息,并从每一服务器的状态信息中分析出需要上报至管理控制平台的信息,将分析出的信息上报至管理控制平台,由所述管理控制平台根据所述集中管理装置上报的每一服务器的信息重新设置针对该服务器的控制命令,并下发至所述集中管理装置。其中,所述信息处理单元接收所述集中管理装置所管理的机柜中每一服务器通过 BMC芯片获取的该服务器的状态信息,其中,每一服务器按照与集中管理装置约定好的网络协议将获取的状态信息通过管理网口对外输出至所述信息处理单元。
优选地,所述服务器的状态信息至少包括以下一种或任意几种的组合(1)、服务器供电电源的输入电压,电流和功耗;(2)、服务器供电电源的输出电压,电流和功耗;(3)、服务器供电电源的各种报警状态,包过流报警,过压报警,过温报警,电源风扇故障报警;(4)、服务器风扇组件的工作状态;(5)、服务器风扇组件的异常和故障状态;(6)、服务器内部各关键芯片的温度数据,以及温度过热报警;(7)、服务器内部各关键芯片的电压数据,以及电压过高或过低的报警;(8)、服务器内部各关键芯片的工作状态信息,以及故障报警;(9)、服务器工作日志。所述从每一服务器的状态信息中分析出需要上报至管理控制平台的信息至少包括以下一种或任意几种的组合(1)、服务器各组件的工作状态;(2)、服务器的实时功耗,以及整机柜的实时功耗;(3)、服务器的工作日志信息;(4)、服务器各组件的故障和报警信息;(5)、服务器的序列号和固定资产编号;其中,所述服务器的各组件至少包括风扇组件、电源模块,CPU,内存和各关键芯片。所述控制命令至少包括以下一种或任意几种的组合(1)、机柜中服务器的功耗控制策略;(2)、机柜中服务器的风扇转速控制策略;(3)、机柜中服务器的故障处理方法或策略;(4)、机柜中服务器固定资产编号的分配和更新。至此,完成本发明提供的装置结构图。由以上技术方案可以看出,采用本发明,能够具有以下优点1),不再需要IT人员面对每一台服务器,而只需要对每台机柜进行管理,极大的降低IT人员维护和管理服务器的工作量。2),本发明中,集中管理装置具有一定的智能化,其根据管理控制平台先设定的管理策略、以及管理控制平台下发的控制命令对服务器进行自主管理和监控,减少了人工干预的情况,并极大的降低了人为出错的可能。3)集中管理装置采集整机柜中各个服务器的状态信息,并分析各个服务器的状态信息如对服务器的功耗进行长时间的监测,得出服务器的功率曲线图,以及实际消耗的最大功率值和最小功率值,为管理控制平台设定后续的控制命令提供依据;4),集中管理装置将整机柜中各个服务器的信息是实时自动上报到管理控制平台的,不需要人工申请和操作。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
权利要求
1.一种整机柜服务器集中管理方法,其特征在于,将互联网数据中心IDC中的服务器划分至至少一个机柜中,每一机柜包含多个服务器;针对一个以上的机柜,在IDC中增加一个用于管理该机柜的集中管理装置,该方法包括所述集中管理装置根据管理控制平台针对该集中管理装置所管理的机柜设定的管理策略,对其管理的机柜中的服务器进行智能控制;所述集中管理装置接收管理控制平台针对该集中管理装置所管理的机柜中至少一个服务器下发的控制命令,并根据该控制命令对服务器执行相应的控制操作;所述集中管理装置采集其所管理的机柜中每一服务器的状态信息,并从每一服务器的状态信息中分析出需要上报至管理控制平台的信息,将分析出的信息上报至管理控制平台,由所述管理控制平台根据所述集中管理装置上报的每一服务器的信息重新设置针对该服务器的控制命令,并下发至所述集中管理装置。
2.根据权利要求1所述的方法,其特征在于,所述集中管理装置采集其所管理的机柜中每一服务器的工作状态信息包括所述集中管理装置所管理的机柜中的每一服务器通过自身的基板管理控制器BMC芯片获取自身的状态信息,并按照与集中管理装置约定好的网络协议将获取的状态信息通过管理网口对外输出至所述集中管理装置。
3.根据权利要求1所述的方法,其特征在于,所述服务器的状态信息至少包括以下一种或任意几种的组合(1)、服务器供电电源的输入电压,电流和功耗;(2)、服务器供电电源的输出电压,电流和功耗;(3)、服务器供电电源的各种报警状态,包过流报警,过压报警,过温报警,电源风扇故障报警;(4)、服务器风扇组件的工作状态;(5)、服务器风扇组件的异常和故障状态;(6)、服务器内部各关键芯片的温度数据,以及温度过热报警;(7)、服务器内部各关键芯片的电压数据,以及电压过高或过低的报警;(8)、服务器内部各关键芯片的工作状态信息,以及故障报警;(9)、服务器工作日志。
4.根据权利要求1或3所述的方法,其特征在于,所述从每一服务器的状态信息中分析出需要上报至管理控制平台的信息至少包括以下一种或任意几种的组合(1)、服务器各组件的工作状态;(2)、服务器的实时功耗,以及整机柜的实时功耗;(3)、服务器的工作日志信息;(4)、服务器各组件的故障和报警信息;(5)、服务器的序列号和固定资产编号;其中,所述服务器的各组件至少包括风扇组件、电源模块,CPU,内存和各关键芯片。
5.根据权利要求1所述的方法,其特征在于,所述控制命令至少包括以下一种或任意几种的组合(1)、机柜中服务器的功耗控制策略;(2)、机柜中服务器的风扇转速控制策略;(3)、机柜中服务器的故障处理方法或策略;(4)、机柜中服务器固定资产编号的分配和更新。
6.一种整机柜服务器集中管理装置,其特征在于,所述集中管理装置应用于将互联网数据中心IDC中的服务器划分至至少一个机柜的应用场景中,每一机柜包含多个服务器, 所述集中管理装置用于管理一个以上机柜,其与管理控制平台、以及所管理的机柜中各个服务器相连,所述集中管理装置包括第一控制单元,用于根据管理控制平台针对所述集中管理装置所管理的机柜设定的管理策略,对其管理的机柜中的服务器进行智能控制;第二控制单元,用于接收管理控制平台针对所述集中管理装置所管理的机柜中至少一个服务器下发的控制命令,并根据该控制命令对服务器执行相应的控制操作;信息处理单元,用于采集所述集中管理装置所管理的机柜中每一服务器的状态信息, 并从每一服务器的状态信息中分析出需要上报至管理控制平台的信息,将分析出的信息上报至管理控制平台,由所述管理控制平台根据所述集中管理装置上报的每一服务器的信息重新设置针对该服务器的控制命令,并下发至所述集中管理装置。
7.根据权利要求6所述的装置,其特征在于,所述信息处理单元接收所述集中管理装置所管理的机柜中每一服务器通过BMC芯片获取的该服务器的状态信息,其中,每一服务器按照与集中管理装置约定好的网络协议将获取的状态信息通过管理网口对外输出至所述信息处理单元。
8.根据权利要求6所述的装置,其特征在于,所述服务器的状态信息至少包括以下一种或任意几种的组合(1)、服务器供电电源的输入电压,电流和功耗;(2)、服务器供电电源的输出电压,电流和功耗;(3)、服务器供电电源的各种报警状态,包过流报警,过压报警,过温报警,电源风扇故障报警;(4)、服务器风扇组件的工作状态;(5)、服务器风扇组件的异常和故障状态;(6)、服务器内部各关键芯片的温度数据,以及温度过热报警;(7)、服务器内部各关键芯片的电压数据,以及电压过高或过低的报警;(8)、服务器内部各关键芯片的工作状态信息,以及故障报警;(9)、服务器工作日志。
9.根据权利要求6或8所述的装置,其特征在于,所述从每一服务器的状态信息中分析出需要上报至管理控制平台的信息至少包括以下一种或任意几种的组合(1)、服务器各组件的工作状态;(2)、服务器的实时功耗,以及整机柜的实时功耗;(3)、服务器的工作日志信息;(4)、服务器各组件的故障和报警信息;(5)、服务器的序列号和固定资产编号;其中,所述服务器的各组件至少包括风扇组件、电源模块,CPU,内存和各关键芯片。
10.根据权利要求6所述的装置,其特征在于,所述控制命令至少包括以下一种或任意几种的组合(1)、机柜中服务器的功耗控制策略;(2)、机柜中服务器的风扇转速控制策略;(3)、机柜中服务器的故障处理方法或策略;(4)、机柜中服务器固定资产编号的分配和更新。
全文摘要
本发明提供了整机柜服务器集中管理方法和装置。该方法中,将IDC中的服务器划分至至少一个机柜,在IDC中增加用于管理一个以上机柜的集中管理装置,该方法包括集中管理装置根据管理控制平台设定的管理策略,对其管理的机柜中的服务器进行智能控制;集中管理装置接收管理控制平台针对其管理的机柜中至少一个服务器下发的控制命令,根据控制命令对服务器执行控制操作;集中管理装置采集所管理的机柜中每一服务器的状态信息,从每一服务器的状态信息中分析出需要上报至管理控制平台的信息,将分析出的信息上报至管理控制平台,由管理控制平台根据集中管理装置上报的每一服务器的信息重新设置针对该服务器的控制命令,并下发至集中管理装置。
文档编号G06F11/30GK102495785SQ201110437440
公开日2012年6月13日 申请日期2011年12月23日 优先权日2011年12月23日
发明者唐斌 申请人:创新科存储技术(深圳)有限公司, 创新科存储技术有限公司