一种云计算的实时综合监控方法
【专利摘要】本发明涉及一种云计算的实时综合监控方法,该方法用以对复数个待监测设备进行监控,根据设备类型的不同,可优先采用监控采集策略配置文件按照调度优先级对设备进行监控,并获取一组状态数据,根据该组状态数据可获得设备中各类运行指标,从而实现对多类设备实时综合监控的目的。
【专利说明】一种云计算的实时综合监控方法
【技术领域】
[0001]本发明涉及监控【技术领域】,尤其涉及一种云计算的实时综合监控方法。
【背景技术】
[0002]近几年,各种类型的云服务如电子邮件、网络硬盘、在线交易等越来越多的出现在人们的视野,其采用的分布式计算和虚拟化技术带给用户的便利和低廉价格是其它技术无所能及的,然而相应的安全性问题也随之进入了用户的视角,如2008年亚马逊公司
S3(Simple Storage Service,简单存储服务)服务断网6小时,2009年Google Gmail云计算平台故障,微软的Azure云计算平台彻底崩溃等等,这些云安全问题给用户、企业、甚至国家带来巨大的损失,随着云计算应用的深入,云安全和云计算环境实时综合监控问题的重要性也在不断上升,其在一定程度上阻碍了云计算发展的进程,因而引起更多人的关注。目前的实时综合监控系统普遍支持单一的通信协议,监测指标单一,且主要侧重于告警联动处理,无法对复杂环境进行实时综合监控。
【发明内容】
[0003]针对现有的综合监控系统存在的上述问题,现提供一种旨在实现综合监控的云计算的实时综合监控方法。
[0004]具体技术方案如下:
[0005]一种云计算的实时综合监控方法,用以实时对云计算系统中复数个待监测设备进行监控,复数个所述待监测设备包括多个类型,每个类型对应一相应的特征值,每一特征值对应一监控采集策略配置文件,每种监控采集策略配置文件对应一告警通知策略,每一所述告警通知策略对应一组阈值,所述方法包括下列步骤:
[0006]SI.根据待监测设备的端口采用一预设发现策略对一预设网段进行扫描,获取所有活动设备的发现列表及所述发现列表中的所述活动设备的设备类型;
[0007]S2.根据与所述设备类型对应的特征值采用与所述特征值对应的所述监控采集策略配置文件对所有所述活动设备进行监测,并获取每个所述活动设备的一组状态数据;
[0008]S3.分别采用与所述监控采集策略配置文件对应的告警通知策略判断所有所述活动设备的所述状态数据是否超出相应的所述阈值,若否,则结束;
[0009]S4.将告警通知发送至告警地址。
[0010]优选的,所述S2中所述状态数据包括:所述活动设备的控制器使用率,和/或所述活动设备的内存使用率,和/或所述活动设备的硬盘使用率,和/或活动设备的程序使用率。
[0011]优选的,所述活动设备的控制器使用率对应的阈值为:90%。
[0012]优选的,所述活动设备的内存使用率对应的阈值为:90%。
[0013]优选的,所述活动设备的硬盘使用率对应的阈值为:80%。
[0014]优选的,所述S2中所述监控采集策略配置文件根据所述待监测设备的类型以及相应的特征值生成监控图表。
[0015]优选的,所述S4中采用发送邮件的方式,将所述告警通知发送至所述告警地址。
[0016]优选的,所述S4中,所述监控策略标签根据所述待监测设备的类型以及相应的特征值和告警通知生成监控图表。
[0017]优选的,所述发现策略采用SNMP协议。
[0018]优选的,每一所述监控采集策略配置文件对应一调度优先级,在所述S2中,根据所述监控采集策略配置文件对应的所述调度优先级依次对所有所述活动设备进行监测,以实时获取状态数据。
[0019]上述技术方案的有益效果:
[0020]根据设备类型的不同,可采用不同的监控采集策略配置文件对设备进行监控,并获取一组状态数据,根据该组状态数据可获得设备中各类运行指标,从而实现对多类设备综合监控的目的。
【专利附图】
【附图说明】
[0021]图I为本发明所述云计算的实时综合监控方法的一种实时例的方法流程图。
【具体实施方式】
[0022]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0023]需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
[0024]下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
[0025]如图I所示,一种云计算的实时综合监控方法,用以实时对云计算系统中复数个待监测设备进行监控,复数个待监测设备涉及多个类型,每个类型对应一相应的特征值,每一特征值对应一监控采集策略配置文件,每种监控采集策略配置文件对应一告警通知策略,每一告警通知策略对应一组阈值,方法包括下列步骤:
[0026]SI.根据待监测设备的端口采用一预设发现策略对一预设网段进行扫描,获取所有活动设备的发现列表及发现列表中的所有活动设备的设备类型;
[0027]S2.根据与设备类型对应的特征值采用与特征值对应的监控采集策略配置文件对所有活动设备进行监测,并获取每个活动设备的一组状态数据;
[0028]S3.分别采用与监控采集策略配置文件对应的告警通知策略判断所有活动设备的状态数据是否超出相应的阈值,若否,则结束;
[0029]S4.将告警通知发送至告警地址。
[0030]进一步地,每一监控采集策略配置文件对应一调度优先级,监控采集配置文件中同一采集指标对应多种途径的情况,多个采集任务并行时,在S2中可根据监控采集策略配置文件对应的调度优先级依次对所有活动设备进行监测,以实时获取状态数据。
[0031]在本实施例中发现策略采取定向协议发现云环境下的物理资源设备;即已知物理设备和虚拟资源的监控管理协议,然后采用匹配的协议去嗅探发现,发现的结果为IP地址和对应IP设备的协议支持的类型,对发现列表中的设备应用根据设备识别库识别设备类型。
[0032]发现策略可设置不同设备发现协议类型、发现协议凭证和发现协议端口号,主要有:SNMP、SYSLOG、IPMI、AGENT、API、PING、TRAP和Libvirt ;监控采集策略配置文件可屏蔽设备的监控差异,可预设有多个监控采集策略配置文件,每个监控采集策略配置文件对应一类设备,根据设备的不同,设置相应监控指标、指标的监控采集协议参数,以及采集数据展示图表的长宽、图表格式等参数;根据设备的不同预设不同的设备特征值、设备类型、以及设备类型对应的监控采集配置等信息;告警通知策略包括设备采集结果的告警阈值、告警通知类型、通知参数和告警通知内容等信息;告警通知策略内容针对每类设备会有不同,同类设备可以使用同一种告警通知策略,同时支持特定设备做告警策略微调。
[0033]可采用基于Web Service的后台管理界面直观展现物理资源和虚拟资源使用情况,包括设备的资源状态显示,运行曲线图,运行时间,当前运行状况显示,告警信息显示,日志数据检索等功能。可采用基于Web Service的用户服务接口将监控数据展现给上层应用,为计费、服务等级协议(Service-Level Agreement,简称SLA)管理等提供数据支撑;可采用虚拟资源监控接口以展示虚拟资源运行状态,运行时间,资源分配情况等;可采用资源分配情况监控接口以展示物理资源运行状况;也可采用日志下载接口等。
[0034]在实施例中,针对发现策略得到的发现列表,采集设备的特征值,选择相应的监控采集配置文件生成综合监控图表信息,同时根据告警通知策略分析并发送告警;该方法能够根据发现结果、设备特征、各设备的监控采集策略及设备的告警策略自动生成基于云计算平台的综合监控信息和告警通知。可通过修改监控采集策略和告警通知策略以自动适应多种物理资源和虚拟资源的综合监控。
[0035]本实施例可对云计算平台中的软硬件基础产品的资源及运行环境进行监控,包括虚拟计算资源的使用监控、用户行为监控、计算环境安全监控,对云计算环境的动态运行情况、资源分配状况及系统安全、进行监控及管理。
[0036]在优选的实施例中,在S2中状态数据包括:活动设备的控制器使用率,和/或活动设备的内存使用率,和/或活动设备的硬盘使用率,和/或活动设备的程序使用率。
[0037]在本实施例中监控采集策略可根据监控设备目标,按照设备的特征值,选择相应的监控采集策略文件,并优先匹配监控采集策略支持的采集方式。
[0038]S2中一组状态数据可对系统资源的使用情况进行监控,其中包括CPU使用情况、CUP分配情况、内存使用情况、内存分配情况、存储使用情况、存储分配情况、网络负载、资源运行状态和运行时间等内容进行监控;还可以对用户行为进行监控,包括对虚拟资源的启动、停止和迁移等操作进行监控。
[0039]在优选的实施例中,活动设备的控制器使用率对应的阈值为:90%。
[0040]在优选的实施例中,活动设备的内存使用率对应的阈值为:90%。
[0041]在优选的实施例中,活动设备的硬盘使用率对应的阈值为:80%。
[0042]在优选的实施例中,在S2中监控采集策略配置文件根据待监测设备的类型以及相应的特征值生成监控图表。
[0043]在本实施例中监控采集策略根据设备所属的设备类型,在设备采集模板库中选择对应的模板作用于设备;设备应用监控采集策略文件后,会优先利用发现过程中已经匹配的协议去采集监控数据;并且会对监控采集数据使用已经配置的告警通知策略进行分析,并按照预先规定的图表模板将数据可视化。
[0044]在优选的实施例中,S4中采用发送邮件的方式,将告警通知发送至告警地址。
[0045]在本实施例中可针对各种设备的采集结果以及设备类型将相应的告警通知发送至告警地址。通过定时的监控云计算平台中的软硬件基础产品的系统负载,获取系统CPU、内存、硬盘和存储的使用情况,根据告警配置策略,设置相对安全的阈值,当超出阈值则发送告警邮件或短信通知相关运维人员。可以自动调节阈值进行告警设置,可采用邮件或短信的告警方式,或将告警信息高亮显示等。
[0046]在优选的实施例中,S4中,监控策略标签根据待监测设备的类型以及相应的特征值和告警通知生成监控图表。
[0047]在本实施例中能够根据发现结果、设备特征值、设备的监控采集策略及设备的告警策略自动生成基于云计算平台的综合监控信息和告警通知。
[0048]在优选的实施例中,发现策略采用SNMP协议。
[0049]在本实施例中设备的特征值主要是以SNMP协议采集到的SysDescr和Sysoid为主要参考。
[0050]于一种较优的实施方式中,对于发现策略isoft_test,使用SNMPV2,共享(community)为 public,对象标识(Object identifier,简称 0ID)为 SysOid. O ;iprange 为192. 168. 30. 1-255 ;监控采集策略配置文件为SNMP_WIND0WS_C0LLECT. xml文件,文件内容包括控制器(CPU)、内存(MEMORY)、硬盘(DISK)、DISKI0、程序(PROCESS)等指标对应的采集协议和凭证等参数;设备的特征值Sysoid为· I. 3. 6. I. 4. I. 311. I. I. 3. I. I对应设备的监控采集模板为SNMP_WIND0WS_C0LLECT. xml,设备类型为WIN7 ;
[0051]当WIN7操作系统对应的CPU、MEMORY、DISK、DISKI0、PROCESS等采集指标的阈值,CPU使用率:90% ,MEMORY使用率:90%,DISK使用率:80%,DISKIO使用率5M/S时,超过阈值就告警,告警通知方式为发送邮件,发送目的为liequan. cheii-soft. com. cn, SMTPServer 为 smtp. sinanet. com, P0P3Server:pop3. sinanet. com, Password:XXXX0
[0052]从而实现对多种物理资源和虚拟资源综合监控信息展示和告警通知。可以查看到192. 168. 30. 66的安装有win7操作系统的设备,当CPU超过90%后,liequan. cheii-soft.com. cn会收到一封关于CPU超过阈值90%的邮件。
[0053]以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
【权利要求】
1.一种云计算的实时综合监控方法,其特征在于,用以实时对云计算系统中复数个待监测设备进行监控,复数个所述待监测设备包括多个类型,每个类型对应一相应的特征值,每一特征值对应一监控采集策略配置文件,每种监控采集策略配置文件对应一告警通知策略,每一所述告警通知策略对应一组阈值,所述方法包括下列步骤: 51.根据待监测设备的端口采用一预设发现策略对一预设网段进行扫描,获取所有活动设备的发现列表及所述发现列表中的所述活动设备的设备类型; 52.根据与所述设备类型对应的特征值采用与所述特征值对应的所述监控采集策略配置文件对所有所述活动设备进行监测,并获取每个所述活动设备的一组状态数据; 53.分别采用与所述监控采集策略配置文件对应的告警通知策略判断所有所述活动设备的所述状态数据是否超出相应的所述阈值,若否,则结束; 54.将告警通知发送至告警地址。
2.如权利要求1所述云计算的实时综合监控方法,其特征在于,所述S2中所述状态数据包括:所述活动设备的控制器使用率,和/或所述活动设备的内存使用率,和/或所述活动设备的硬盘使用率,和/或活动设备的程序使用率。
3.如权利要求2所述云计算的实时综合监控方法,其特征在于,所述活动设备的控制器使用率对应的阈值为:90%。
4.如权利要求2所述云计算的实时综合监控方法,其特征在于,所述活动设备的内存使用率对应的阈值为:90%。
5.如权利要求2所述云计算的实时综合监控方法,其特征在于,所述活动设备的硬盘使用率对应的阈值为:80%。
6.如权利要求1所述云计算的实时综合监控方法,其特征在于,所述S2中所述监控采集策略配置文件根据所述待监测设备的类型以及相应的特征值生成监控图表。
7.如权利要求1所述云计算的实时综合监控方法,其特征在于,所述S4中采用发送邮件的方式,将所述告警通知发送至所述告警地址。
8.如权利要求1所述云计算的实时综合监控方法,其特征在于,所述S4中,所述监控策略标签根据所述待监测设备的类型以及相应的特征值和告警通知生成监控图表。
9.如权利要求1所述云计算的实时综合监控方法,其特征在于,所述发现策略采用SNMP协议。
10.如权利要求1所述云计算的实时综合监控方法,其特征在于,每一所述监控采集策略配置文件对应一调度优先级,在所述S2中,根据所述监控采集策略配置文件对应的所述调度优先级依次对所有所述活动设备进行监测,以实时获取状态数据。
【文档编号】G06F11/30GK104331354SQ201410668410
【公开日】2015年2月4日 申请日期:2014年11月20日 优先权日:2014年11月20日
【发明者】江水, 车烈权, 王琴 申请人:普华基础软件股份有限公司