电源故障处理方法、电源模块、监控管理模块及服务器的制造方法
【专利摘要】本发明公开了一种电源故障处理方法,用于服务器,包括:检测电源是否发生故障;若是,则设置故障告警信息,并按照第一预定程序对所述故障告警信息进行处理;当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息;该方法能够确保监控管理模块能够获取全面、完整的电源故障信息,提高服务器电源管理的可靠性和稳定性;本发明还公开了一种电源模块、监控管理模块及服务器。
【专利说明】
电源故障处理方法、电源模块、监控管理模块及服务器
技术领域
[0001]本发明涉及服务器技术领域,特别涉及一种电源故障处理方法、电源模块、监控管理模块及服务器。
【背景技术】
[0002]随着用户对计算机的计算需求的提高,用户对单台计算机的稳定性和可靠性的要求越来越高。服务器电源模块是服务器长期稳定运行最重要的模块,服务器电源模块的状态异常不能及时发现可能导致服务器因供电异常而出现宕机。服务器电源模块发生故障之后,在极短的时间之内故障恢复。该故障信息如果不能被监控管理模块监控和处理,可以会因为电源模块的异常导致服务器不能正常稳定的运行。目前在服务器的电源模块对该故障处理机制尚不明确,如果电源模块按照传统服务器的工作模式进行工作,很难满足高可靠性和高稳定性服务器管理的要求。因此,如何提高服务器的可靠性和稳定性,是本领域技术人员需要解决的技术问题。
【发明内容】
[0003]本发明的目的是提供一种电源故障处理方法,该方法能够确保监控管理模块能够获取全面、完整的电源故障信息,提高服务器电源管理的可靠性和稳定性;本发明的另一目的是提供一种电源模块、监控管理模块及服务器。
[0004]为解决上述技术问题,本发明提供一种电源故障处理方法,用于服务器,包括:
[0005]检测电源是否发生故障;
[0006]若是,则设置故障告警信息,并按照第一预定程序对所述故障告警信息进行处理;
[0007]当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警?目息O
[0008]其中,所述设置故障告警信息,包括:
[0009]将所述故障对应的故障告警状态字设置为I。
[0010]本发明还提供一种电源模块,包括:
[0011 ]检测单元,用于检测电源是否发生故障;
[0012]设置单元,用于若是,则设置故障告警信息;
[0013]第一处理单元,用于按照第一预定程序对所述故障告警信息进行处理;
[0014]清除单元,用于当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息。
[0015]其中,所述设置单元为将所述故障对应的故障告警状态字设置为I的单元。
[0016]本发明还提供一种电源故障处理方法,用于服务器,包括:
[0017]读取电源模块的故障告警信息;
[0018]判断所述故障告警信息对应的电源故障是否恢复;
[0019]若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;
[0020]若否,则按照第二预定程序对所述故障告警信息进行处理;当对应的电源故障恢复时,向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息。
[0021]其中,所述使得所述电源模块清除所述故障告警信息之后,还包括:
[0022]确认所述故障告警信息是否清除;
[0023]若否,则进行报警。
[0024]本发明还提供一种监控管理模块,包括:
[0025]读取单元,用于读取电源模块的故障告警信息;
[0026]判断单元,用于判断所述故障告警信息对应的电源故障是否恢复;
[0027]清除指令发送单元,用于若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;
[0028]第二处理单元,用于按照第二预定程序对所述故障告警信息进行处理。
[0029]其中,还包括:
[0030]确认单元,用于确认所述故障告警信息是否清除;
[0031 ]报警单元,用于若否,则进行报警。
[0032]本发明还提供一种服务器,包括:电源模块和监控管理模块;其中,
[0033]所述电源模块包括:
[0034]检测单元,用于检测电源是否发生故障;
[0035]设置单元,用于若是,则设置故障告警信息;
[0036]第一处理单元,用于按照第一预定程序对所述故障告警信息进行处理;
[0037]清除单元,用于当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息;
[0038]所述监控管理模块包括:
[0039]读取单元,用于读取电源模块的故障告警信息;
[0040]判断单元,用于判断所述故障告警信息对应的电源故障是否恢复;
[0041]清除指令发送单元,用于若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;
[0042]第二处理单元,用于按照第二预定程序对所述故障告警信息进行处理。
[0043]其中,所述电源模块与所述监控管理模块通过I2C总线连接。
[0044]本发明所提供的电源故障处理方法,用于服务器,包括:检测电源是否发生故障;若是,则设置故障告警信息,并按照第一预定程序对所述故障告警信息进行处理;当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息;
[0045]该方法通过对检测到的电源故障设置告警信息,且该故障告警信息不是在该故障解决后自行消除,而必须是在监控管理模块确认记录该故障告警信息且故障解决后通过监控管理模块发送的故障告警信息清除指令后,才可以清除该故障告警信息;防止出现监控管理模块不能获取短时间内的电源故障信息,进而不能准确评估电源模块健康状态,降低电源模块的稳定性;因此该方法能够确保监控管理模块能够获取全面、完整的电源故障信息,提高服务器电源管理的可靠性和稳定性;本发明还提供一种电源模块、监控管理模块及服务器。
【附图说明】
[0046]为了更清除地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0047]图1为本发明实施例所提供的电源故障处理方法的流程图;
[0048]图2为本发明实施例所提供的电源模块的结构框图;
[0049]图3为本发明实施例所提供的另一电源故障处理方法的流程图;
[0050]图4为本发明实施例所提供的监控管理模块的结构框图;
[0051 ]图5为本发明实施例所提供的服务器的结构框图。
【具体实施方式】
[0052]本发明的核心是提供一种电源故障处理方法,该方法能够确保监控管理模块能够获取全面、完整的电源故障信息,提高服务器电源管理的可靠性和稳定性。
[0053]为使本发明实施例的目的、技术方案和优点更加清除,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清除、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0054]请参考图1,图1为本发明实施例所提供的电源故障处理方法的流程图;该方法用于服务器可以包括:
[0055]S100、检测电源是否发生故障;
[0056]其中,这里的故障通常可以通过检测电源的在位信息、健康状态信息和输入输出电压、电流功耗信息来获取,将获取的信息与对应信息的正常状态进行对比,可以判断电源是否出现故障。
[0057]S110、若是,则设置故障告警信息,并按照第一预定程序对所述故障告警信息进行处理;
[0058]S120、当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息。
[0059]其中,当电源模块存在故障时,设置对应的故障告警信息,使得监测管理模块能够获知电源故障,并且按照该故障对应的处理程序进行故障处理;设置的方式可以是通过状态字进行设置,也可以是通过标识进行设置;可选的,所述设置故障告警信息,包括:
[0060]将所述故障对应的故障告警状态字设置为I。
[0061]该故障告警信息可以被监控管理模块读取。
[0062]这里故障处理的结果无论是清除故障还是未清除故障都不能够清除该故障告警信息;该故障告警信息的清除只能够在接收到监控管理模块发送的故障告警信息清除指令才可以清除。这样做的目的是防止电源故障在极短的时间内被消除后,导致监测管理模块不能获取该故障信息,不能够对电源状态做出准确的分析,可能会导致电源大故障的出现。即故障告警信息被清除的条件是:电源模块故障告警信息已经恢复状态,且监控管理模块发送故障清除命令,否则,电源模块故障告警信息不能被清除。
[0063]基于上述技术方案,本发明实施例提供的电源故障处理方法,能够防止出现监控管理模块不能获取短时间内的电源故障信息,进而不能准确评估电源模块健康状态,降低电源模块的稳定性;该方法能够确保监控管理模块能够获取全面、完整的电源故障信息,提高服务器电源管理的可靠性和稳定性。
[0064]下面对本发明实施例提供的电源模块进行介绍,下文描述的电源模块、与上文描述的电源故障处理方法可相互对应参照。
[0065]请参考图2,图2为本发明实施例所提供的电源模块的结构框图;该电源模块可以包括:
[0066]检测单元110,用于检测电源是否发生故障;
[0067]设置单元120,用于若是,则设置故障告警信息;
[0068]第一处理单元130,用于按照第一预定程序对所述故障告警信息进行处理;
[0069]清除单元140,用于当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息。
[0070]可选的,所述设置单元120为将所述故障对应的故障告警状态字设置为I的单元。
[0071]请参考图3,图3为本发明实施例所提供的另一电源故障处理方法的流程图;该方法可以包括:
[0072]S200、读取电源模块的故障告警信息;
[0073]S210、判断所述故障告警信息对应的电源故障是否恢复;
[0074]S220、若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;
[0075]S230、若否,则按照第二预定程序对所述故障告警信息进行处理;当对应的电源故障恢复时,向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息。
[0076]其中,监测管理模块读取到该故障告警信息后,首先判断该故障是否还存在,若是,则按照正常处理电源故障的流程对该故障进行处理,并在故障消除后,发送故障告警信息清除指令。若不存在,则记录该故障告警信息并发送故障告警信息清除指令。这样可以保证监测管理模块能够获取电源的全部故障信息,使得技术人员能够对电源的状态进行准确、可靠的评估,保证服务器的稳定性和可靠性。
[0077]基于上述技术方案,本发明实施例提供的电源故障处理方法,能够防止出现监控管理模块不能获取短时间内的电源故障信息,进而不能准确评估电源模块健康状态,降低电源模块的稳定性;该方法能够确保监控管理模块能够获取全面、完整的电源故障信息,提高服务器电源管理的可靠性和稳定性。
[0078]基于上述技术方案,所述使得所述电源模块清除所述故障告警信息之后,还包括:
[0079]确认所述故障告警信息是否清除;
[0080]若否,则进行报警。
[0081]其中,该步骤可以防止出现故障信息清除错误,及时进行系统的维护,提高故障告警信息的准确性和可靠性。
[0082]下面对本发明实施例提供的监控管理模块及服务器进行介绍,下文描述的监控管理模块及服务器与上文描述的电源故障处理方法可相互对应参照。
[0083]请参考图4,图4为本发明实施例所提供的监控管理模块的结构框图;该模块可以包括:
[0084]读取单元210,用于读取电源模块的故障告警信息;
[0085]判断单元220,用于判断所述故障告警信息对应的电源故障是否恢复;
[0086]清除指令发送单元230,用于若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;
[0087]第二处理单元240,用于按照第二预定程序对所述故障告警信息进行处理。
[0088]基于上述技术方案,该监测管理模块还包括:
[0089]确认单元,用于确认所述故障告警信息是否清除;
[0090]报警单元,用于若否,则进行报警。
[0091]请参考图5,图5为本发明实施例所提供的服务器的结构框图,该服务器可以包括:电源模块100和监控管理模块200;其中,
[0092]所述电源模块100包括:
[0093]检测单元,用于检测电源是否发生故障;
[0094]设置单元,用于若是,则设置故障告警信息;
[0095]第一处理单元,用于按照第一预定程序对所述故障告警信息进行处理;
[0096]清除单元,用于当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息;
[0097]所述监控管理模块200包括:
[0098]读取单元,用于读取电源模块的故障告警信息;
[0099]判断单元,用于判断所述故障告警信息对应的电源故障是否恢复;
[0100]清除指令发送单元,用于若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;
[0101]第二处理单元,用于按照第二预定程序对所述故障告警信息进行处理。
[0102]可选的,所述电源模块与所述监控管理模块通过I2C总线连接。
[0103]电源模块是服务器长期稳定运行最重要的模块,服务器电源模块的状态异常若不能及时发现可能导致服务器因供电异常而出现宕机。该服务器电源模块检测到发生电源故障之后,按照正常的逻辑设置电源模块的故障告警信息。电源模块故障告警信息被清除的条件是:电源模块故障告警信息已经恢复正常状态,且服务器监控管理模块发送故障告警清除命令,否则,电源模块故障告警信息不能被清除。服务器监控管理模块监测所正常检测电源的在位信息、健康状态和输入输出电压电流功耗信息,如果检测到电源模块故障信息,监控管理模块正常处理该故障信息,同时发送故障清除命令,清除电源模块故障告警信息。通过电源故障处理机制,可以确保在服务器电源模块发生故障之后,在极短的时间之内故障恢复,仍然可以被服务器监控管理模块获取故障的信息。具体故障处理需要如下步骤:
[0104]1、服务器的电源模块检测到发生故障之后,按照正常的逻辑设置电源模块的故障告警信息。该故障告警信息可以正常被监控管理模块读取到电源模块的故障信息。
[0105]2、定义电源模块的故障告警信息被清除的条件。电源模块告警信息已经恢复状态,且服务器监控管理模块发送故障告警信息清除命令,否则,电源模块告警信息不能被清除。
[0106]3、定义服务器监控管理模块处理逻辑。如果检测到电源模块故障信息,监控管理模块正常处理该故障信息,同时发送故障清除命令,清除电源模块故障告警信息。
[0107]基于上述技术方案,本发明实施例提供的服务器,能够防止出现监控管理模块不能获取短时间内的电源故障信息,进而不能准确评估电源模块健康状态,降低电源模块的稳定性;该方法能够确保监控管理模块能够获取全面、完整的电源故障信息,提高服务器电源管理的可靠性和稳定性。
[0108]说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0109]专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清除地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0110]结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(R0M)、电可编程R0M、电可擦除可编程R0M、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
[0111]以上对本发明所提供的电源故障处理方法、电源模块、监控管理模块及服务器进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
【主权项】
1.一种电源故障处理方法,用于服务器,其特征在于,包括: 检测电源是否发生故障; 若是,则设置故障告警信息,并按照第一预定程序对所述故障告警信息进行处理; 当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息。2.如权利要求1所述的电源故障处理方法,其特征在于,所述设置故障告警信息,包括: 将所述故障对应的故障告警状态字设置为I。3.一种电源模块,其特征在于,包括: 检测单元,用于检测电源是否发生故障; 设置单元,用于若是,则设置故障告警信息; 第一处理单元,用于按照第一预定程序对所述故障告警信息进行处理; 清除单元,用于当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息。4.如权利要求3所述的电源模块,其特征在于,所述设置单元为将所述故障对应的故障告警状态字设置为I的单元。5.一种电源故障处理方法,用于服务器,其特征在于,包括: 读取电源模块的故障告警信息; 判断所述故障告警信息对应的电源故障是否恢复; 若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息; 若否,则按照第二预定程序对所述故障告警信息进行处理;当对应的电源故障恢复时,向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息。6.如权利要求5所述的电源故障处理方法,其特征在于,所述使得所述电源模块清除所述故障告警信息之后,还包括: 确认所述故障告警信息是否清除; 若否,则进行报警。7.一种监控管理模块,其特征在于,包括: 读取单元,用于读取电源模块的故障告警信息; 判断单元,用于判断所述故障告警信息对应的电源故障是否恢复; 清除指令发送单元,用于若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息; 第二处理单元,用于按照第二预定程序对所述故障告警信息进行处理。8.如权利要求7所述的监控管理模块,其特征在于,还包括: 确认单元,用于确认所述故障告警信息是否清除; 报警单元,用于若否,则进行报警。9.一种服务器,其特征在于,包括:电源模块和监控管理模块;其中, 所述电源模块包括: 检测单元,用于检测电源是否发生故障; 设置单元,用于若是,则设置故障告警信息; 第一处理单元,用于按照第一预定程序对所述故障告警信息进行处理; 清除单元,用于当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息; 所述监控管理模块包括: 读取单元,用于读取电源模块的故障告警信息; 判断单元,用于判断所述故障告警信息对应的电源故障是否恢复; 清除指令发送单元,用于若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息; 第二处理单元,用于按照第二预定程序对所述故障告警信息进行处理。10.如权利要求9所述的服务器,其特征在于,所述电源模块与所述监控管理模块通过12C总线连接。
【文档编号】G06F11/30GK105955864SQ201610266427
【公开日】2016年9月21日
【申请日】2016年4月26日
【发明人】李冠广, 黄家明, 乔英良
【申请人】浪潮(北京)电子信息产业有限公司