本申请设计服务器技术领域,尤其涉及一种服务器电源模块监控方法、装置、服务器和存储介质。
背景技术:
近些年来,随着大数据、云计算、人工智能的发展,互联网业务量出现爆炸式增长,伴随着存储和计算的数据量增加,服务器的运行压力越来越大,这对整个服务器的稳定性要求也逐渐变高,服务器的工作离不开电源,由此可见,稳定、健康的电源模块对服务器而言至关重要。
目前服务器的电源模块内置黑盒(blackbox),该黑盒通过日志记录方式记录电源故障时的数据,一方面黑盒日志记录的数据仅仅是故障发生后的数据,即存储电源正常信号(powergood,以下简称pg信号)变为低电平以后的数据,这种方式存在延迟,容易导致故障数据记录不全,并且受电源模块内部空间的限制,其存储的数据量较少。另一方面,在后续的电源模块故障分析时需要专业的技术人员将电源模块从服务器上拆卸下来,拆卸过程加大了服务器硬件损坏的风险,并且后续通过特定的软件获取黑盒日志以了解电源模块故障原因的时效性较差。
技术实现要素:
有鉴于此,有必要针对以上技术问题提供一种服务器电源模块监控方法、装置、服务器和存储介质。
根据本发明的一方面,提供了一种服务器电源模块监控方法,所述方法包括:
通过设置在服务器主板上且包括滚动存储区和固定存储区的电可擦除可编程存储器采集电源模块的实时运行数据;
将所述实时运行数据与存储在所述电可擦除可编程存储器中的预设阈值进行比较;
响应于所述实时运行数据未超出所述预设阈值,则将所述实时运行数据存储至所述滚动存储区;
响应于所述实时运行数据超出所述预设阈值,则将所述实时运行数据存储至所述固定存储区。
在其中一个实施例中,所述方法还包括:
将所述固定存储区的数据发送至服务器系统;
服务器系统接收并显示所述固定存储区的数据。
在其中一个实施例中,所述响应于所述实时运行数据超出所述预设阈值,则将所述实时运行数据存储至所述固定存储区的步骤包括:
利用所述电可擦除可编程存储器采集电源模块的pg信号;
响应于所述实时运行数据超出所述预设阈值,且所述pg信号为高电平,则将所述实时运行数据存储至第一固定存储区;
响应于所述实时运行数据超出所述预设阈值,且所述pg信号为低电平,则将所述实时运行数据存储至所述第二固定存储区。
在其中一个实施例中,所述实时运行数据包括输入电压、输入电流、输入功率、输出电压、输出电流、输出功率中的至少一种。
在其中一个实施例中,所述电源模块和所述电可擦除可编程存储器均为多个,且多个电源模块与多个电可擦除可编程存储器一一对应;每一电源模块和每一电可擦除可编程存储器通过独立的通信链路连接。
在其中一个实施例中,所述固定存储区大于所述滚动存储区。
根据本发明的又一方面,提供了一种服务器电源模块监控装置,所述装置包括;
采集单元,用于通过设置在服务器主板上且包括滚动存储区和固定存储区的电可擦除可编程存储器采集电源模块的实时运行数据;
比较单元,用于将所述实时运行数据与存储在所述电可擦除可编程存储器中的预设阈值进行比较;
滚动存储单元,用于响应于所述实时运行数据未超出所述预设阈值,则将所述实时运行数据存储至所述滚动存储区;
固定存储单元,用于响应于所述实时运行数据超出所述预设阈值,则将所述实时运行数据存储至所述固定存储区。
在其中一个实施例中,所述装置还包括:
数据发送单元,用于将所述固定存储区的数据发送至服务器系统;
显示单元,用于显示所述服务器系统接收的所述固定存储区的数据。
根据本发明的另一方面,提供了一种服务器,所述服务器包括:电源模块以及设置在服务器主板上的电可擦除可编程存储器,所述电可擦除可编程存储器储有计算机指令,所述指令被执行时实现以上所述的方法以在所述电源模为服务器供电时对所述电源模块进行监控。
根据本发明的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时执行前述的服务器电源模块监控方法,
上述服务器电源模块监控方法、装置、服务器和存储介质,通过服务器主板上的电可擦除可编程存储器采集电源模块的实时运行数据,使得电可擦除可编程存储器不再受电源模块的空间限制,并将未超过预设阈值的实时运行数据存储到滚动存储区,以及将超过预设阈值的实时运行数据存储到固定存储区,从而实现了完整、实时记录电源模块的运行状态。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明一个实施例中服务器电源模块监控方法的流程示意图;
图2为本发明又一个实施例中电源模块与服务器连接的拓扑结构示意图;
图3为本发明一个实施例中另一服务器电源模块监控方法的流程示意图;
图4为本发明一个实施例中步骤400的子流程示意图;
图5为本发明另一个实施例中服务器电源模块监控装置的结构示意图图;
图6为本发明再一个实施例中服务器电源模块监控装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
在一个实施例中,请参照图1所示,本发明提供了一种服务器电源模块监控方法,具体的该方法包括以下步骤:
s100,通过设置在服务器主板上且包括滚动存储区和固定存储区的电可擦除可编程存储器采集电源模块的实时运行数据。
其中,电可擦除可编程存储器通过通信链路与服务器主板连接;滚动存储区是指存入该区域的数据循环擦除写入,循环擦除写入是指当该区域存满时,采用后存储的数据将覆盖该区域中最先存储的数据;固定存储是指存入固定存储区的数据在该区域存满后不能被覆盖,即具有设定好的固定的存储位置;实时运行数据时指电源模块的寄存器中的信息。滚动存储区和固定存储区的大小可以相同也可以不同,本实施例不对其进行限定。
s200,将实时运行数据与存储在电可擦除可编程存储器中的预设阈值进行比较。
其中,预设阈值是指实时运行数据的预先设置的上限值和下限值构成的临界区域,该上限值和下限值均为用户预先设置的;将实时运行数据和预设阈值比较是指判断实时运行数据是否落在该临界区域内,或者超出上限值、下限值。
s300,响应于实时运行数据未超出预设阈值,则将实时运行数据存储至滚动存储区。
s400,响应于实时运行数据超出预设阈值,则将实时运行数据存储至固定存储区。
上述服务器电源模块监控方法,利用服务器主板上的电可擦除可编程存储器采集电源模块的实时运行数据,使得电可擦除可编程存储器不再受电源模块的空间限制,并将未超过预设阈值的实时运行数据存储到滚动存储区,以及将超过预设阈值的实时运行数据存储到固定存储区,从而实现了完整、实时记录电源模块的运行状态。
在另一实施例中,图2示出了电源模块与服务器连接的拓扑结构示意图,为了便于理解本发明的技术方案,具体的以多个电源模块(powersupplyunit,以下简称psu)为服务器供电的情形举例说明,电源模块和电可擦除可编程存储器(以下简称eeprom)均为多个,且多个电源模块与多个电可擦除可编程存储器一一对应,每一电源模块和每一电可擦除可编程存储器通过独立的通信链路连接。进一步的,请参照图3所示,在前述步骤的基础上本发明提供的服务器电源模块监控方法还包括以下步骤:
s510,将固定存储区的数据发送至服务器系统。
s520,服务器系统接收并显示固定存储区的数据。
举例来说,当某个psu的实时运行数据存在异常时(即实时运行数据超出预设阈值),由于该异常的数据已被存储到固定存储区,服务器系统能够根据发送数据的eeprom地址确定对应的psu异常,显示该固定存储区的数据能够方便维护人员及时查看和后续检修,无需拆卸电源模块后再检修,为运维人员简化了操作步骤,节省了时间,
需要特别说明的是,通常步骤510和步骤520在固定存储区中已存入数据以后时才进行的,而在实际执行的过程中电源模块的监控过程即步骤100-400是一个循环的过程,因此也可以通过设置间隔时间的方式执行步骤510和步骤520。
在另一个实施例中,请参照图4所示,为了进一步优化本发明的技术方案,上述步骤400具体还包括以下子步骤:
s410,利用电可擦除可编程存储器采集电源模块的pg信号。
s420,响应于实时运行数据超出预设阈值,且pg信号为高电平,则将实时运行数据存储至第一固定存储区。
s430,响应于实时运行数据超出预设阈值,且pg信号为低电平,则将实时运行数据存储至第二固定存储区。
请再次参照图2所示,图中eeprom中分三个区域,分别是1区域、2区域和3区域;其中2区域为滚动存储区,1区域为第一固定存储区,3区域即为第二固定存储区,在实际运行pg信号会存在延迟,如设置输出电压12.8v为参考值,假设此时输出电压实际为12.9v,此中情形也属于电源模块异常的一种,虽然不会影响服务器的正常供电,此种情形的异常对于电源模块的监控也是非常重要的。
电源模块正常工作时,psu的实时运行数据参数通过通信链路存储到主板eeprom的2区域中,实时滚动,电源模块出现异常,但pg信号高电平时,将异常信息(即此时电源模块的实时运行数据)存储到主板eeprom的1区域中,并根据每个eeprom的地址判断异常电源模块的位置,将异常发送给系统,由系统发出警告通知维护人员进行处理。psu的实时运行数据继续通过通信链路存储到主板eeprom的2区域中,实时滚动。电源模块出现异常且pg信号低电平时,将故障信息(即此时电源模块的实时运行数据)存储到主板eeprom的3区域中,并根据每个eeprom的地址判断异常电源模块的位置,将异常发送给系统,由系统发出严重警告通知维护人员进行处理。若电源模块的实时运行数据恢复正常,故障时的日志存(即电源模块的实时运行数据)存储到主板eeprom的3区域中,恢复正常后电源模块的实时运行数据继续通过通信链路存储到主板eeprom的2区域中,实时滚动。
较佳的,固定存储区可设置成大于滚动存储区,以方便记录更多的异常数据。固定存储区中第一固定存储区的和第二固定存储区的大小可以相同也可以不同,在具体实施过程中可参考电源模块实际运行时两种运行数据异常情形的多少分配大小,例如pg信号为高电平,但时实运行数据仍然超出了预设阈值的情形较多,此时可将第一固定存储区设置的相对更大。
上述方法能够将pg信号由正常变为异常前的异常数据也进行固定存储,保证了数据的完整性,并且对两种情形下异常的实时运行数据分区域存储,方便维护人员后续区分故障的类型。
在又一个实施例中,较佳的,实时运行数据包括输入电压、输入电流、输入功率、输出电压、输出电流、输出功率中的至少一种。可以理解的是对于不同类型的时实运行数据其预设阈值均是不同的,以上每个类型数据的预设阈值均可由用户根据实际的需求进行设定。
具体的,由于实时运行数据可以是以上列举的多种类型的组合或者某一种类型数据,当为组合类型的数据时,步骤200中的比较是指将每一种类型的数据与对应的预设阈值进行比较,此时只要有一个类型的实时运行数据超出了预设阈值都会进行将数据写入固定存储区;假设当前psu采集的是输入电压和输出电压,若只有输入电压超出了预设阈值,此时也会将psu采集的输入电压和输出电压存储至固定存储区。
应该理解的是,虽然图1-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在又一个实施例中,请参照图5所示,提供了一种服务器电源模块监控装置60,具体的该装置包括:
采集单元61,用于通过设置在服务器主板上且包括滚动存储区和固定存储区的电可擦除可编程存储器采集电源模块的实时运行数据;
比较单元62,用于将实时运行数据与存储在电可擦除可编程存储器中的预设阈值进行比较;
滚动存储单元63,用于响应于实时运行数据未超出预设阈值,则将实时运行数据存储至滚动存储区;
固定存储单元64,用于响应于实时运行数据超出预设阈值,则将实时运行数据存储至固定存储区。
在有一个实施例中,请参照图6所示,在前述装置实施例的基础上,该装置还包括:
数据发送单元65,用于将固定存储区的数据发送至服务器系统;
显示单元66,用于显示服务器系统接收的固定存储区的数据。
需要说明的是,关于服务器电源模块监控装置的具体限定可以参见上文中对于服务器电源模块监控方法的限定,在此不再赘述。上述装置中的各个单元可全部或部分通过软件、硬件及其组合来实现。上述各单元可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个单元对应的操作。
根据本发明的另一方面,提供了一种服务器,所述服务器包括:电源模块及设置在服务器主板上的电可擦除可编程存储器,服务器采用以上所述的服务器电源模块监控方法在电源模为服务器供电时对电源模块进行监控。
根据本发明的又一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以上所述的服务器电源模块监控方法。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
结合这里的公开所描述的各种示例性逻辑块、模块和电路可以利用被设计成用于执行这里功能的下列部件来实现或执行:通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器,但是可替换地,处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合,例如,dsp和微处理器的组合、多个微处理器、一个或多个微处理器结合dsp和/或任何其它这种配置。
结合这里的公开所描述的方法或算法的步骤可以直接包含在硬件中、由处理器执行的软件模块中或这两者的组合中。软件模块可以驻留在ram存储器、快闪存储器、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、可移动盘、cd-rom、或本领域已知的任何其它形式的存储介质中。示例性的存储介质被耦合到处理器,使得处理器能够从该存储介质中读取信息或向该存储介质写入信息。在一个替换方案中,存储介质可以与处理器集成在一起。处理器和存储介质可以驻留在asic中。asic可以驻留在用户终端中。在一个替换方案中,处理器和存储介质可以作为分立组件驻留在用户终端中。
在一个或多个示例性设计中,功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括ram、rom、eeprom、cd-rom或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(dsl)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、dsl或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(cd)、激光盘、光盘、数字多功能盘(dvd)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。