服务器中部件监控装置的制作方法

文档序号:6444561阅读:124来源:国知局
专利名称:服务器中部件监控装置的制作方法
技术领域
本发明大体上涉及服务器领域,更具体地来说,涉及服务器中部件的监控装置和方法。
背景技术
服务器是一种工业产品,为保证服务器散热良好、连续可靠工作,一般都会在服务器机箱内设置多个风扇组;风扇组产生的噪音比普通PC或工作站要大的多,如果风扇安装不当或风扇工作周期过长,叶片周期性地承受出口不均勻气流的脉动力作用,产生疲劳损害;叶片本身及叶片上压力的不均勻分布都会使风扇振动加大,严重时振动会传递到硬盘上,对硬盘造成损坏,使服务器数据丢失,造成很大的损失。现有技术中提供了一种服务器风扇转速远程监控报警方法,该集群服务器设置风扇管理服务器,利用服务器自身系统的风扇管理软件对服务器CPU的工作温度和风扇转速进行自动监控和调整,当风扇出现故障导致CPU工作温度过高时,服务器系统风扇管理软件自动将CPU的高温信息或风扇的故障信息通过网络传输给风扇管理服务器,维修人员根据报警信息及时对出现故障的服务器进行检修;监控步骤如下(1)检测CPU的温度和风扇的转速;(2) CPU的温度是否高于报警温度;风扇转速是否低于报警转速;如果是,则发出报警信息;(3)如果不是,根据CPU的温度调整风扇转速,降低噪音指数;(4)调整完毕,服务器风扇管理软件系统进入休眠状态。上述技术方案能够在一定程度上远程监控服务器风扇转速,并进行报警。然而,上述技术方案监控参数为风扇的转速和CPU温度并不能直接反应风扇对机箱所产生的振动,并且在该监控方法中,并没有监测风扇振动参数,振动如果过大还是会对硬盘造成一定的损害,因此传统的通过BMC来监测风扇转速和CPU的温度并不能避免风扇失效等原因对系统带来的损害。

发明内容
针对现有技术中不能在风扇振动较大时,进行及时报警,无法避免对硬盘损害的缺陷,本发明提出了能够解决上述缺陷的服务器中部件监控装置和方法。根据本发明的一方面,提供了一种服务器中部件的监控方法,包括采集模块感测服务器中部件并将具有感测到的振动参数的感测信息传送给处理模块;处理模块将振动参数与振动阈值比较,并将具有比较结果的结果信息传送给指示模块;以及指示模块根据比较结果,指示关于部件的诊断信息。优选地,采集模块周期性地对部件进行感测。优选地,将采集模块设置在服务器的机架上邻近部件的位置处,并且采集模块为振动传感器。优选地,部件为风扇或硬盘。优选地,指示模块根据比较结果对部件进行诊断和操控包括当振动参数大于振动阈值时,指示模块发出告警信息,以指示对风扇进行检修;或者当振动参数大于振动阈值时,指示模块发出告警信息,以指示硬盘处于易受损状态并指示对风扇进行检修。优选地,处理模块通过通信模块与指示模块进行信息交互,并从指示模块获取振动阈值。优选地,指示模块与通信模块通过有线网络或无线网络进行信息交互。优选地,该监控方法还包括处理模块将结果信息传送给指示模块,其中,结果信息还具有振动参数;指示模块将振动参数存储在其数据库中。优选地,该监控方法还包括当振动参数大于振动阈值之后一预定时间段内,硬盘损坏,则指示模块将振动参数作为新振动阈值传送给处理模块。优选地,振动参数和振动阈值均选自由部件的振动幅值、振动频率、振动峰峰值以及单位时间内振动能量所构成的组。根据本发明的另一方面,提供了一种服务器中部件的监控装置,包括采集模块, 用于感测服务器中部件并将具有感测到的振动参数的感测信息进行传送;处理模块,用于从采集模块接收感测信息,将振动参数与振动阈值比较,并将具有比较结果的结果信息进行传送;以及指示模块,用于从处理模块接收结果信息,并根据比较结果指示关于部件的诊断信息。优选地,采集模块包括振动信号感测子模块,用于周期性地感测服务器中部件, 并生成含有振动参数的电信号;放大子模块,用于将电信号放大;调整及过滤子模块,用于将所放大的电信号进行调整以及滤波;以及传送子模块,用于将调整及滤波后的电信号作为感测信息传送。优选地,采集模块设置在服务器的机架上邻近部件的位置处,并且采集模块为振动传感器。优选地,部件为风扇或硬盘。优选地,指示模块被配置为当振动参数大于振动阈值时,发出告警信息,以指示对风扇进行检修;或者当振动参数大于振动阈值时,发出告警信息,以指示硬盘处于易受损状态并指示对风扇进行检修。优选地,该监控装置还包括通信模块,用于建立处理模块与指示模块进行信息交互,其中,指示模块与通信模块通过有线网络或无线网络进行信息交互。优选地,指示模块还被配置为从处理模块接收振动参数,并将振动参数存储在其数据库中。优选地,指示模块还被配置为,在振动参数大于振动阈值之后一预定时间段内硬盘损坏的情况下,将振动参数作为新振动阈值传送给处理模块。优选地,该监控装置,还包括供电模块,用于分别向采集模块、处理模块、指示模块以及通信模块供电。优选地,振动参数和振动阈值均选自由部件的振动幅值、振动频率、振动峰峰值以及单位时间内振动能量所构成的组。利用本发明的服务器中部件监控装置和方法,可以在服务器运行期间实时监控风扇振动,避免了由于风扇振动过大对硬盘甚至服务器的损害,为硬盘提供了更好的工作环境,从而保证了硬盘数据的稳定性和完整性,进一步确保服务器系统的安全稳定运行。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说书、权利要求书、以及附图中所特别指出的结构来实现和获得。
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。在附图中

图1为根据本发明的一个实施例的服务器中部件的监控装置的总体结构图;图2为根据本发明的一个实施例的服务器中部件的监控方法的总体流程图;图3为根据本发明的另一个实施例的服务器中部件的监控装置的总体结构图;图4为根据本发明的另一个实施例的服务器中部件的监控装置中的采集模块的结构图;以及图5为根据本发明的又一个实施例的服务器中部件的监控方法的流程图。
具体实施例方式以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。图1为根据本发明的一个实施例的服务器中部件的监控装置的总体结构图。该监控装置100包括采集模块102,用于感测服务器中部件并将具有感测到的振动参数的感测信息进行传送。处理模块104,用于从采集模块102接收感测信息,将振动参数与振动阈值比较,并将具有比较结果的结果信息进行传送。指示模块106,用于从处理模块104接收结果信息,并根据比较结果指示关于部件的诊断信息。图2为根据本发明的另一个实施例的服务器中部件的监控方法的流程图。在步骤 S200中,采集模块首先感测服务器中部件并将具有感测到的振动参数的感测信息传送给处理模块。该服务器中的部件运行时,会有很多参数能够指示该部件的运行状态。在本实施例中,感测服务器中部件的振动参数,通过振动参数可以判断运动部件的运行状态是否正常。 所以将该感测到的振动参数传送给处理模块104。在步骤S202中,处理模块将振动参数与振动阈值比较,并将具有比较结果的结果信息传送给指示模块。即,当该处理模块104接收到感测信息以后,将振动参数与预存在该处理模块中的阈值进行比较,当振动参数小于阈值时,表明该部件运行安全平稳,但是当振动参数大于等于阈值时,说明该部件运行异常。然后处理模块104将比较结果继续传送至指示模块106。以及在步骤204中,指示模块根据比较结果,指示关于部件的诊断信息。指示模块106从处理模块104接收到进行比较以后的结果信息,并且根据该比较结果,指示该部件运行状态的诊断信息,如果该部件运行异常时,则进行报警,从而通知维修人员进行及时处理。下面将详细描述根据本发明的另一个实施例的监控装置的总体结构图。图3为根据本发明的另一个实施例的服务器中部件的监控装置的总体结构图。该监控装置300包括采集模块302,为用于感测服务器中部件并将具有感测到的振动参数
5的感测信息进行传送,例如,感测服务器中的风扇或硬盘的振动信号并将感测到的风扇或硬盘的振动信号进行传送,其中,振动参数选自由风扇或硬盘的振动幅值、振动频率、振动峰峰值以及单位时间内振动能量所构成的组,其中,振动幅度是振动的最大偏移量;振动频率为振动物体在单位时间内振动的次数;峰峰值(peak-to-peak)是指波形图中最大的正值和最小的负值之间的差;振动能量是系统由于振动而具有的能量,与振幅的平方成正比, 即,同一振动系统振幅越大,振动能量就越大。采集模块302设置在服务器的机架上邻近部件的位置处,例如,采集模块可以为振动传感器。下文中,将对采集模块进行更详细地描述。图4根据本发明的另一个实施例的服务器中部件的监控装置中采集模块的具体结构图。采集模块302进一步包括振动信号感测子模块402,用于周期性地感测服务器中部件,并生成含有振动参数的电信号;该振动信号感测子模块402可以为数字量传感器或者模拟量传感器。例如,数字量传感器可以选用TI公司的ADXL001等,该数字量传感器可以直接输出数字量的电信号;也可以选用模拟量传感器,模拟量传感器采集模拟量信号,通过A/D转换芯片将该模拟量转换为数字量的电信号。采集模块302还包括放大子模块404, 用于将电信号放大,由于振动信号较弱,所以需要将其电信号放大后进行进一步处理。采集模块302还包括调整及过滤子模块406,用于将所放大的电信号进行调整以及滤波,放大后的电信号中具有很多噪声等干扰信号,所以放大后的电信号不能直接传送至处理模块,需要进行调整及滤波,从而可以去除噪声等干扰信号。采集模块302还包括传送子模块408, 用于将调整及滤波后的电信号作为感测信息传送。接下来,该监控装置300还包括处理模块304,用于从采集模块302接收感测信息,将振动参数与振动阈值比较,并将具有比较结果的结果信息进行传送。例如,处理模块 304可以选用处理器MCU,为了保证对采集的振动信号的处理,可以选用ARM+DSP双核方案, 其中,ARM主要负责数据采集和数据通信,DSP负责对数据进行处理。其中,振动阈值选自由风扇或硬盘的振动幅值、振动频率、振动峰峰值以及单位时间内振动能量所构成的组。该振动阈值可以由用户预先设置在处理模块中,此外,还可以从指示模块306接收新参数来更新该振动阈值。该监控装置300还包括指示模块306,用于从处理模块304接收结果信息,并根据比较结果指示关于部件的诊断信息。将该指示模块306配置为当振动参数大于振动阈值时,指示模块306发出告警信息,以指示对风扇进行检修;或者当振动参数大于振动阈值时,指示模块306发出告警信息,以指示硬盘处于易受损状态并指示对风扇进行检修。指示模块306从处理模块304接收到振动参数以后,将所接收到的振动参数存储在其数据库中, 其中,在振动参数大于振动阈值之后一预定时间段内硬盘损坏的情况下,将振动参数作为新振动阈值传送给处理模块304,因此,赋予该监控装置自动更新机制,从而不但能够及时进行报警,而且能够更准确地预测风扇或硬盘故障。该监控装置300还包括通信模块308,用于建立处理模块304与指示模块306之间的信息交互,其中,指示模块306与通信模块308通过有线网络或无线网络进行信息交互。例如,通信模块308发送数据的方式有I2C总线或TCP/IP协议。因此,该监控装置300 可以进行离线本地监控和在线远程监控,并且可以在有线网络不方便的情况下,可以通过无线网络进行监控。此外,该监控装置300还包括供电模块310,用于分别向采集模块302、处理模块304、指示模块306以及通信模块308供电。根据本发明的另一实施例的监控装置300通过采集风扇或硬盘的振动信号,不仅可以对风扇或硬盘故障进行监控、预测、以及报警,而且该监控装置具有自动更新判断阈值的自更新功能,从而进一步完善该监控装置。以为服务器系统的稳定运行创造良好的工作环境,来保证服务器系统的运行安全。下文中,将进一步描述根据本发明的又一个实施例的监控方法。图5为根据本发明的又一个实施例的服务器中部件的监控方法的流程图。在步骤 S500中,采集模块感测服务器中部件并将具有感测到的振动参数的感测信息传送给处理模块。例如,服务器中的部件可以为风扇或硬盘,采集模块可以为振动传感器。采集模块被设置在服务器的机架上邻近风扇或硬盘的的位置处,该采集模块周期性地对风扇或硬盘进行感测。该采集模块中的振动信号感测子模块感测服务器中的风扇或硬盘,放大子模块将感测到的包括风扇或硬盘的振动幅值、振动频率、振动峰峰值以及单位时间内振动能量的振动参数的感测信息进行放大,调整和过滤子模块将该放大后的感测信息进行调整和滤波, 以及通过传送子模块将调整和滤波以后的感测信息传送给处理模块。在步骤S502中,处理模块将振动参数与振动阈值比较,并且将具有比较结果和振动参数的结果信息传送给指示模块。处理模块从采集模块的传送子模块接收到经处理的具有振动参数的感测信息以后,将该振动参数与振动阈值进行比较,然后,将具有比较结果和振动参数的结果信息一起传送给指示模块。其中,振动阈值选自由部件的振动幅值、振动频率、振动峰峰值以及单位时间内振动能量所构成的组;处理模块通过通信模块与指示模块进行数据交互,并且从指示模块获取振动阈值。在步骤504中,指示模块根据比较结果,指示关于部件的诊断信息并将具有振动参数的结果信息存储在其数据库中。指示模块根据比较结果对服务器中的部件(例如,风扇或硬盘)进行诊断和操控包括当振动参数大于振动阈值时,指示模块发出告警信息,以指示对风扇进行检修;或者当振动参数大于振动阈值时,指示模块发出告警信息,以指示硬盘处于易受损状态并指示对风扇进行检修。指示模块除了根据比较结果对服务器中的部件进行诊断和操控以外,还将振动参数存储在指示模块的数据库中。最后,在步骤506中,振动参数大于振动阈值之后一预定时间段内,硬盘损坏,则指示模块将该振动参数作为新振动阈值传送给处理模块。也就是说,在振动参数大于振动阈值之后,如果硬盘在预先确定的时间段内确损坏了,则指示模块将该振动参数作为新振动阈值传送给处理模块。如果硬盘在预先确定的时间段内没有损坏,则保留原有的振动阈值不变。例如,当振动幅值的阈值为0. 01mm,振动频率的阈值为80Hz,当振动参数中的振动幅值大于0. Olmm时或者振动频率大于80Hz时,如果硬盘在45天内损坏或者风扇在70天内损坏,则将该振动幅值或者该振动频率作为新振动阈值传送给处理模块,反之,如果硬盘在45天内没有损坏并且风扇在70天内没有损坏,则振动幅值的阈值和振动频率的阈值保持不变。这样就可以根据实际情况对阈值进行更新,以更加准确地对服务器的监控。利用根据本发明的又一个实施例的监控装置,可以通过具有振动参数的振动信息,来判断风扇和硬盘的运行趋势,进行故障预警等,克服了现有技术仅依靠风扇转速和 CPU温度来进行故障诊断时,不能将风扇安装不当或风扇工作周期长所导致的较大振动及时进行诊断报警的缺陷。可以及时对这些故障进行诊断,及时报警,从而为服务器的安全稳定运行提供了良好的工作环境。该服务器中部件的诊断装置也可应用于其他计算机、其他服务器系统、或者通过风扇散热的器件和系统中。通过利用本发明的服务器中部件的监控装置和方法可以获得以下技术效果(1) 该服务器中部件的监控装置和方法将振动参数作为特征参数,可以更全面地监控风扇运行状态,对于风扇振动较大、易造成损坏的情况可以进行有效的在线监控或离线监控,从而避免了由于风扇振动过大对硬盘甚至服务器的损害,为硬盘提供了更好的工作环境,从而保证了硬盘数据的稳定性和完整性,进一步确保服务器系统的安全稳定运行;( 该服务器中的部件的监控装置和方法通过通信模块进行处理模块和指示模块之间的有线或无线信息交互,所以可以进行现场监控和诊断或者进行远程监控和故障诊断,可以多个服务器系统单独监控或者集中监控,有利于合理利用资源;C3)该服务器中的部件的监控装置和方法具有自学习功能,可以在故障诊断过程中,自动更新数据振动阈值,使该监控装置和方法更加完善。以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、 等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种服务器中部件的监控装置,包括采集模块,用于感测所述服务器中所述部件并将具有感测到的振动参数的感测信息进行传送;处理模块,用于从所述采集模块接收所述感测信息,将所述振动参数与振动阈值比较, 并将具有所述比较结果的结果信息进行传送;以及所述指示模块,用于从所述处理模块接收所述结果信息,并根据所述比较结果指示关于所述部件的诊断信息。
2.根据权利要求1所述的监控装置,其特征在于,所述采集模块包括振动信号感测子模块,用于周期性地感测所述服务器中所述部件,并生成含有所述振动参数的电信号;放大子模块,用于将所述电信号放大;调整及过滤子模块,用于将所放大的电信号进行调整以及滤波;以及传送子模块,用于将调整及滤波后的电信号作为感测信息传送。
3.根据权利要求2所述的监控装置,其特征在于,所述采集模块设置在所述服务器的机架上邻近所述部件的位置处,并且所述采集模块为振动传感器。
4.根据权利要求1所述的监控装置,其特征在于,所述部件为风扇或硬盘。
5.根据权利要求4所述的监控装置,其特征在于,所述指示模块被配置为当所述振动参数大于所述振动阈值时,发出告警信息,以指示对所述风扇进行检修;或者当所述振动参数大于所述振动阈值时,发出告警信息,以指示所述硬盘处于易受损状态并指示对风扇进行检修。
6.根据权利要求1所述的监控装置,还包括通信模块,用于建立所述处理模块与所述指示模块进行信息交互, 其中,所述指示模块与所述通信模块通过有线网络或无线网络进行信息交互。
7.根据权利要求4所述的监控装置,其特征在于,所述指示模块还被配置为从所述处理模块接收所述振动参数,并将所述振动参数存储在其数据库中。
8.根据权利要求7所述的监控装置,其特征在于,所述指示模块还被配置为,在所述振动参数大于所述振动阈值之后一预定时间段内所述硬盘损坏的情况下,将所述振动参数作为新振动阈值传送给所述处理模块。
9.根据权利要求6所述的监控装置,还包括供电模块,用于分别向所述采集模块、所述处理模块、所述指示模块以及所述通信模块{共 ο
10.根据上述权利要求中任一项所述的监控装置,其特征在于,所述振动参数和所述振动阈值均选自由所述部件的振动幅值、振动频率、振动峰峰值以及单位时间内振动能量所构成的组。
全文摘要
本发明提供了一种服务器中部件的监控装置,包括采集模块,用于感测所述服务器中所述部件并将具有感测到的振动参数的感测信息进行传送;处理模块,用于从所述采集模块接收所述感测信息,将所述振动参数与振动阈值比较,并将具有所述比较结果的结果信息进行传送;以及所述指示模块,用于从所述处理模块接收所述结果信息,并根据所述比较结果指示关于所述部件的诊断信息。利用本发明的服务器中部件监控装置,可以在服务器运行期间实时监控风扇振动,避免了由于风扇振动过大对硬盘甚至服务器的损害,为硬盘提供了更好的工作环境,从而保证了硬盘数据的稳定性和完整性,进一步确保服务器系统的安全稳定运行。
文档编号G06F11/32GK102411531SQ20111045605
公开日2012年4月11日 申请日期2011年12月31日 优先权日2011年12月31日
发明者王卫钢, 赵振伟, 陈进 申请人:曙光信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1