专利名称:一种计算机健康监控管理系统及方法
技术领域:
本发明涉及硬件设备监控领域,尤其涉及一种计算机健康监控管理系统及方法。
背景技术:
计算机硬件设备是计算机技术得以应用的载体,是用户的物质财富。经常出现的 情况是计算机硬件设备已经发生故障、已经损坏或者无法正常工作时,用户才得知计算机 出现了问题,结果是用户往往需要为获得信息与处理问题的滞后性付出惨重的代价。
随着计算机技术与智能技术的发展,特别是基于纯硬件形式的带外管理形式的出 现,为保障计算机硬件系统的安全稳定运行提供了新的契机。 但是,发明人在研究本发明的过程中发现,现有的带外管理至少存在如下局限
(1)监控对象有限,仅注重较少的诸如温度、电压、风扇转速等硬件监控项,对用户 实际使用有着显著影响的磁盘阵列监控、内存状态等却未涉及; (2)仅能获取一些简单的硬件信息,对异常的分析处理能力十分有限,严重影响了 嵌入式系统发挥带外监控的能力。
发明内容
本发明所要解决的技术问题是需要提供一种计算机健康监控管理系统及方法,以 扩大计算机健康监控范围。 为了解决上述技术问题,本发明提供了一种计算机健康监控管理系统,包括采集 模块、分析模块以及通讯模块,其中 所述通讯模块,用于接收用户设置的监控策略以及用户发送的搜集指令,并用于 向用户反馈所述分析模块获得的分析结果; 所述采集模块,与计算机硬件对象连接,根据所述搜集指令获取所述硬件对象当 前的工作参数; 所述分析模块,用于根据所述监控策略对所述工作参数进行分析,获得所述分析结果。 优选地,所述采集模块用于通过局部总线,与南北桥芯片和传感器芯片中至少其 一,与所述硬件对象连接。 优选地,所述分析模块用于根据所述监控策略中的告警条件,对符合所述告警条 件的所述工作参数,产生告警信息包含在所述分析结果中。 优选地,与所述采集模块连接的所述硬件对象,包括电源、系统温度传感器、风扇 转速传感器、内存、CPU、硬盘以及磁盘阵列中的一种或几种。 为了解决上述技术问题,本发明还提供了一种计算机健康监控管理方法,包括 接收用户设置的监控策略以及发送的搜集指令; 根据所述搜集指令,获取计算机硬件对象当前的工作参数; 根据所述监控策略对所述工作参数进行分析,获得分析结果;
向用户反馈所述分析结果。 优选地,所述搜集指令包含所述硬件对象的标识。 优选地,通过局部总线与南北桥芯片和传感器芯片中至少其一,与所述硬件对象 连接后,根据所述搜集指令获取所述工作参数。 优选地,所述硬件对象,包括电源、系统温度传感器、风扇转速传感器、内存、CPU、 硬盘以及磁盘阵列中的一种或几种。 优选地,所述工作参数,包括电源电压,系统温度,风扇转速,内存利用率,CPU的数
量、温度及利用率,硬盘数量及硬盘工作状态以及磁盘阵列工作状态中的一种或几种。 本发明技术方案的至少一个实施例,至少解决了现有技术中带外管理技术监控对
象有限的技术缺陷,扩展了监控范围,且注重对硬件健康状况进行分析。本发明技术方案的
至少另一个实施例,至少解决了现有的带外管理技术对计算机硬件设备异常分析能力有限
的技术缺陷。 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利 要求书以及附图中所特别指出的结构来实现和获得。
图1为本发明系统实施例的组成示意图;
图2为本发明方法实施例的流程示意图;
图3为本发明方法应用实例的流程示意图。
具体实施例方式以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用
技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。 需要说明的是,如果不冲突,本发明实施例以及实施例中的各个特征可以相互结
合,均在本发明的保护范围之内。另外,在附图的流程图示出的步骤可以在诸如一组计算机
可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况
下,可以以不同于此处的顺序执行所示出或描述的步骤。 本发明技术方案的核心思想是,在电子设备的主板上植入嵌入式电路,将该嵌入 式电路通过南北桥芯片和/或传感器芯片等与其它需要监控的硬件对象直接和/或间接连 接,搜集并整理分析对硬件对象进行监控获得的监控数据,根据该监控数据完成对电子设 备的健康监控管理。本发明技术方案不依赖于电子设备的操作系统,并且可通过通信端口 与远程处理设备进行交互,实现对电子设备的远程健康监控管理。 图1为本发明计算机健康监控管理系统实施例的组成示意图,本系统实施例在应 用时以嵌入式电路的形式具体实现。如图l所示,本发明的系统实施例主要包括采集模块 110、分析模块120以及通讯模块130,其中 采集模块110,根据计算机主板的结构,通过局部总线(如fC或SMBus)与南北桥 芯片和传感器芯片中至少其一,与计算机硬件对象连接,根据通讯模块130接收的搜集指 令,获取计算机硬件对象当前的工作参数,该搜集指令中包含有硬件对象的标识;
4
分析模块120,与该采集模块IIO相连,用于根据通讯模块130接收的监控策略对 采集模块110获取的硬件对象当前的工作参数进行健康分析,获得分析结果;该监控策略 中包含有告警条件,对于符合监控策略中告警条件的工作参数,则产生告警信息并包含在 该分析结果中,发送给通讯模块130 ; 通讯模块130,分别与该采集模块110及分析模块120相连,用于接收用户通过本 地或远端设备设置的监控策略,并接收用户通过本地或远端设备发送的搜集指令,其中该 搜集指令包含有所要监控的硬件对象的标识;接收分析模块120发送的分析结果,并将其 中的告警信息或者整个分析结果反馈给本地或远端设备,或者用户通过本地或远端设备指 定的其他设备。 上述的硬件对象比如包括电源、系统温度传感器、风扇转速传感器、内存、CPU、硬 盘以及磁盘阵列(RAID)等中的一种或一种以上的组合; 上述采集模块110获取的计算机硬件对象当前的工作参数,比如对于电源则为电 源电压,对于系统温度传感器则为系统温度,对于风扇转速传感器则为风扇转速,对于内存 则为内存利用率,对于CPU则为CPU的数量,温度及利用率,对于硬盘则为硬盘数量及硬盘 工作状态(硬盘工作与否),对于磁盘阵列则为磁盘阵列工作状态(硬盘阵列工作与否) 等. 上述的监控策略主要分为两大类,一类是阈值类型,一类是状态类型;比如对于电 源、系统温度传感器、风扇转速传感器、内存、CPU等的工作参数对应于阈值类型,硬盘以及 磁盘阵列的工作参数对应于状态类型。更具体的,以CPU温度为例说明阈值类型,以磁盘阵 列工作状态为例说明状态类型;预设CPU的正常工作温度范围为大于0度小于等于60度, 危险工作范围为大于60度小于等于90度,损坏工作范围为大于90度;磁盘阵列的工作状 态集合为{正常、掉盘但仍能正常工作,不能正常工作}。 在计算机加电状态下,无论操作系统是否启动,获取BIOS数据并从中解析出所加 载的存储介质是否发生变化,包括新存储介质的植入以及存储介质的丢失等,比如从BIOS 系统引导介质的优先级中,可以获得所加载的硬盘信息,通过这个硬盘信息可以获得存储 介质的数量等是否发生了变化。 图2为本发明计算机健康监控管理方法实施例的流程示意图,结合图1所示的系 统实施例,图2所示的方法实施例主要包括如下步骤 步骤S210,接收用户通过本地或远端设备设置的监控策略,以及通过本地或远端
设备发送的搜集指令;其中该搜集指令包含有所要监控的硬件对象的标识; 步骤S220,根据该搜集指令,获取计算机硬件对象当前的工作参数;该搜集指
令中包含有硬件对象的标识;其中执行该搜集指令的执行单元通过局部总线(如I忙或
SMBus)与南北桥芯片和传感器芯片中至少其一,与计算机硬件对象连接; 步骤S230,根据该监控策略对该工作参数进行健康分析,获得分析结果;该监控
策略中包含有告警条件,对于符合监控策略中告警条件的工作参数,则产生告警信息并包
含在该分析结果; 步骤S240,将分析结果中的告警信息或者整个分析结果反馈给用户,比如反馈给 本地或远端设备,或者用户通过本地或远端设备指定的其他设备。 其中,硬件对象,包括电源、系统温度传感器、风扇转速传感器、内存、CPU、硬盘以
5及磁盘阵列中的一种或几种。相应的,其中的工作参数,包括电源电压,系统温度,风扇转 速,内存利用率,CPU的数量、温度及利用率,硬盘数量及硬盘工作状态以及磁盘阵列工作状 态中的一种或几种。 图3为本发明方法应用实例的流程示意图,其中的硬件对象为硬盘。结合图1所 示的系统实施例和图2所示的方法实施例,图3所示的应用实例主要包括如下步骤
步骤S310,用户通过远端设备配置分析结果接收地址(IP和端口 ),启动硬盘监控 项,并记录此时的硬盘信息; 步骤S320,以较短周期对硬盘信息进行扫描获得扫描数据即硬盘的工作参数;
步骤S330,根据扫描数据判断硬盘是否丢失,是则转步骤S340,否则转步骤S320 ;
步骤S340,产生硬盘丢失告警信息并根据步骤S310中用户配置的分析结果接收 地址发送告警信息,以向用户告警。 上述步骤S320、步骤S330以及步骤S340中,用户都可以通过远方设备查看硬盘的 当前工作状态。 本发明技术方案不依赖计算机所安装的具体的操作系统,直接在主板上植入硬件 电路对计算机硬件系统进行监控,并对监控结果进行分析整理,通过通信端口与本地或外 部设备进行通信,必要时发出硬件告警信息。本发明技术方案与目前已经存在的带外监控 的技术方案相比实现了内存监控、CPU监控、硬盘工作状态监控、磁盘阵列监控等,如本发明 技术方案中的存储介质监控技术,在非开机状态(即计算机加电状态下,无论操作系统是 否启动)下,当新的存储介质植入或已经存储介质丢失时,可以迅速发出告警信息。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的 计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不 同于此处的顺序执行所示出或描述的步骤。另外,本领域的技术人员应该明白,上述的本发 明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上, 或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代 码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成 各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这 样,本发明不限制于任何特定的硬件和软件结合。 虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采 用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本 发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化, 但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
权利要求
一种计算机健康监控管理系统,其特征在于,包括采集模块、分析模块以及通讯模块,其中所述通讯模块,用于接收用户设置的监控策略以及用户发送的搜集指令,并用于向用户反馈所述分析模块获得的分析结果;所述采集模块,与计算机硬件对象连接,根据所述搜集指令获取所述硬件对象当前的工作参数;所述分析模块,用于根据所述监控策略对所述工作参数进行分析,获得所述分析结果。
2. 根据权利要求1所述的系统,其特征在于所述采集模块用于通过局部总线,与南北桥芯片和传感器芯片中至少其一,与所述硬件对象连接。
3. 根据权利要求1所述的系统,其特征在于所述分析模块用于根据所述监控策略中的告警条件,对符合所述告警条件的所述工作参数,产生告警信息包含在所述分析结果中。
4. 根据权利要求1所述的系统,其特征在于与所述采集模块连接的所述硬件对象,包括电源、系统温度传感器、风扇转速传感器、内存、CPU、硬盘以及磁盘阵列中的一种或几种。
5. —种计算机健康监控管理方法,其特征在于,包括接收用户设置的监控策略以及发送的搜集指令;根据所述搜集指令,获取计算机硬件对象当前的工作参数;根据所述监控策略对所述工作参数进行分析,获得分析结果;向用户反馈所述分析结果。
6. 根据权利要求5所述的方法,其特征在于所述搜集指令包含所述硬件对象的标识。
7. 根据权利要求5所述的方法,其特征在于通过局部总线与南北桥芯片和传感器芯片中至少其一,与所述硬件对象连接后,根据所述搜集指令获取所述工作参数。
8. 根据权利要求5所述的方法,其特征在于所述硬件对象,包括电源、系统温度传感器、风扇转速传感器、内存、CPU、硬盘以及磁盘阵列中的一种或几种。
9. 根据权利要求8所述的方法,其特征在于所述工作参数,包括电源电压,系统温度,风扇转速,内存利用率,CPU的数量、温度及利用率,硬盘数量及硬盘工作状态以及磁盘阵列工作状态中的一种或几种。
全文摘要
本发明公开了一种计算机健康监控管理系统及方法,扩大了计算机健康监控范围,其中该系统主要包括通讯模块,用于接收用户设置的监控策略以及用户发送的搜集指令,并用于向用户反馈分析模块获得的分析结果;采集模块,与计算机硬件对象连接,根据搜集指令获取硬件对象当前的工作参数;分析模块,用于根据监控策略对工作参数进行分析,获得分析结果。本发明技术方案解决了现有技术中带外管理技术监控对象有限的技术缺陷,扩展了监控范围。
文档编号G06F11/30GK101794251SQ201010034348
公开日2010年8月4日 申请日期2010年1月18日 优先权日2010年1月18日
发明者朱锦雷, 王洪亮 申请人:浪潮(北京)电子信息产业有限公司