一种体验式业务监控系统与方法
【专利摘要】本发明是一种实现业务监控的系统,是利用自动化技术模拟人操作业务系统的体验式监控业务性能指标的方法。所述系统包括部署在能够直接访问目标业务系统的机器上,实现自主调度并通过脚本监控业务系统运行状态和性能的采集代理;从各个采集代理接收监控数据并进行实时处理的数据采集处理;显示被监控业务系统的监控指标数据、告警事件、业务系统之间拓扑关系等。所述方法包括通过脚本自动化操作业务系统的体验式监控业务性能指标的方法;业务系统监控指标动态展示的方法;适合各种复杂网络环境的监控数据集中上报方法。本发明能够有效解决目前监控系统因为只局限于离散基础设施环节而无法向运维人员真实反映业务是否正常的问题。
【专利说明】一种体验式业务监控系统与方法
【技术领域】
[0001] 本发明涉及一种实现业务监控的系统,以及利用自动化技术模拟人操作业务系统 的体验式监控业务性能指标的方法。
【背景技术】
[0002] 随着IT技术发展、市场竞争压力的不断增加,金融和企业的业务越来越依赖于IT 系统,越来越要求IT系统能够稳定、可靠、高效地运行。为此,金融和企业一般会部署监控 系统,希望在第一时间发现故障、解决故障,通过一些关键性能数据趋势分析,前瞻性地预 见系统存在的业务访问性能瓶颈。但实际效果并不理想,究其原因在于,当前IT监控系统 基本上都在基础设施监控层面,单一地监控网络、主机、数据库、中间件运行的故障以及性 能,部分监控运行在基础设施之上的单个应用系统运行是否正常,不能监控由多个应用系 统构成的整个业务操作流程的性能,而后者才是IT系统用户直接感受到的。
【发明内容】
[0003] 本发明提供一种体验式业务监控系统及方法,在业务系统访问端部署采集代理, 通过脚本自动模拟人操作的方式,采集业务系统访问性能和可用性,再加上基础设施的监 控数据,形成完整的业务监控视图。
[0004] 本发明提供的体验式业务监控系统至少包括如下部件:
[0005] (1)采集代理模块。采集代理模块部署在能够直接访问目标业务系统的机器上,自 主调度,在无需对现有业务系统做任何修改的前提下,通过脚本、API接口、日志文件、数据 库等方式监控业务系统运行状态和性能。采集代理能够和各种脚本环境对接。可以模拟人 操作方式自动进行业务系统访问性能和可用性的测试,能够从最终用户感知的角度真实反 映当前业务系统的访问性能和可用性。
[0006] (2)采集代理网关模块。在多网段环境中,负责采集代理与其他后台模块之间的数 据转发。
[0007] (3)数据采集处理模块。从各个采集代理模块接收性能和状态监控数据和告警事 件,保存到运维数据库中。根据设置的阀值策略,产生性能和状态告警事件。根据设置的告 警处理动作策略,对告警事件进行压制和屏蔽处理、故障根源分析和告警内容丰富,通过屏 幕、短信、邮件、声音、电话等方式通知运维人员。
[0008] (4)采集任务集中管理模块。向各个采集代理模块集中设置目标采集资源、采集参 数、采集调度计划,监控各个采集代理模块是否正常运行。
[0009] (5)监控控制台模块。显示被监控业务系统的监控指标数据、告警事件、业务系统 之间拓扑关系,配置监控资源、监控采集策略。
[0010] 本发明提供了一种业务监控方法:
[0011] (1)对于C / S、B / S结构的业务系统,采集代理模块利用脚本自动化技术,通过 真实访问业务系统,检测业务系统能否正常使用以及业务系统的访问性能。
[0012] (2)为了支持各种脚本环境,采集代理与脚本环境之间采用基于文件的统一数据 交换格式。
[0013] (3)为了支持复杂网络环境下的部署,采集代理和数据采集处理模块之间采用Web Service进行监控数据的上传。采集代理和采集任务集中管理模块之间也采用Web Service 进行采集配置数据的下载。这两种情况,采集代理均为Web Service的客户端,而数据采集 处理模块和采集任务集中管理模块为Web Service的服务端。
[0014] (4)采用XML定义业务系统监控指标的展示方式和布局,基于该XML自动生成相应 业务系统详细指标监控界面。
【专利附图】
【附图说明】
[0015] 图1系统结构示意图 [0016] 图2采集代理结构示意图
[0017] 图3监控数据采集流程图
[0018] 图4采集参数设置流程图
[0019] 图5名值界面显示效果图
[0020] 图6表格界面显示效果图
[0021] 图7柱状图界面显示效果图
[0022] 图8仪表盘界面显示效果图
[0023] 图9饼图界面显示效果图
[0024] 图10趋势图界面显示效果图
[0025] 图11业务系统显示效果图
【具体实施方式】
[0026] 1、参见图1,为本发明实施例系统结构示意图。
[0027] 1. 1采集代理
[0028] 采集代理(图1中11、12、13、21、22、23.....nl、n2、n3)部署在被监控资源所在的 主机设备上,或者部署在能够访问业务系统的主机设备上,实现监控数据的采集。
[0029] 采集代理模块自主实现采集调度,包括采集频率控制和工作时间控制。
[0030] 1.2采集代理网关
[0031] 在跨网段网络环境中,采集代理网关(图1中61、62)实现采集代理模块和数据采 集处理模块、采集任务集中管理模块之间HTTP协议数据转发。
[0032] 1. 3数据采集处理模块
[0033] 数据采集处理模块(图1中3)实现监控数据的处理。数据采集处理模块提供Web Service接口,接收从采集代理发送的监控数据;提供SNMP Trap、Syslog协议接口,接收从 第三方监控系统发送的告警事件数据。
[0034] 数据采集处理模块在接收到性能数据后,在内存中更新一份快照的同时根据设置 保存到历史数据库中,并根据定义的阀值条件产生性能阀值事件。
[0035] 数据采集处理模块采用动作链方式处理阀值事件及采集代理和第三方监控系统 直接发送的告警事件。对事件的动作处理包括屏蔽、压制、告警内容丰富、根源分析、告警升 级、告警通知、告警转发。
[0036] 数据采集处理模块通过Web Service心跳接口监控各个采集代理的在线状态。
[0037] 1. 4采集任务集中管理模块
[0038] 采集任务集中管理模块(图1中4)将用户通过监控控制台设置的采集策略转发 到各个采集代理中。采集策略包括目标采集资源、各种采集参数值、采集调度时间和工作时 间。
[0039] 采集任务集中管理模块将用户通过监控控制台设置的采集控制命令转发给各个 采集代理,在采集代理中启动和停止某一类或某几类监控指标的采集。
[0040] L 5监控控制台
[0041] 监控控制台(图1中5)采用Web2. 0技术实现监控信息展示和配置。监控信息展 示包括业务拓扑图、监控资源详细指标监控视图、告警控制台、关键业务指标趋势图、报表 等。配置主要包括监控资源配置、监控指标配置、采集策略配置。
[0042] 为了适应业务系统对监控内部的不确定性,本发明实施例提供XML动态生成业务 系统详细指标监控视图和采集参数配置界面的机制。
[0043] 采用本发明实施例提供的体验式业务监控系统具有以下有益效果:
[0044] 能够从使用者角度真正反映业务系统的可用性,结合基础设施监控信息,给IT运 维部门展示出完整的运行状况视图。
[0045] 2、参见图2,为本发明实施例采集代理系统结构示意图。
[0046] 采集调度与管理(图2101)负责与数据采集处理模块和采集任务集中管理模块进 行数据通信。接受采集任务集中管理模块发送的采集任务和策略,调度相应采集器进行数 据采集,并将采集结果返回给数据采集处理模块。
[0047] 采集代理内部有很多采集器(图2102),这些采集器根据需要由采集调度与管理 模块动态加载、启动。采集器实现对目标监控资源的数据采集。
[0048] 对于网络、主机、数据库、中间件等能够通过SNMP、丽I、JMX、JDBC等标准接口或 者协议采集的,采集代理内置相应的采集器。如,Windows采集器通过WMI协议,专门负责 WindOWS主机的监控数据采集。
[0049] 对于业务系统监控,采集代理通过脚本方式实现业务系统访问体验式监控。采集 代理采用文件接口方式与各种脚本环境交互,支持包括DOS批处理、VBS、AutoIT、Shell、 Per 1、Python在内的各种脚本环境。采集代理与脚本环境之间的接口文件至少包括如下三 个:
[0050] (1)表示脚本执行完成的标志文件。采集代理通过判断该文件是否存在来判断某 次采集请求是否完成,该文件可以没有任何内容。
[0051] (2)脚本执行结果文件。该文件返回脚本执行是否有异常,以及详细的执行结果描 述信息,如可以返回Shell命令的原始输出信息。
[0052] (3)监控数据文件,包括指标数据文件和告警事件文件。按指定格式返回监控指标 值,或者直接返回告警事件(如对日志监控时,可以直接将异常日志转化为告警事件,避免 到后台再做转换,提高效率)。下面是两种监控数据文件的一种格式。
[0053] 指标数据文件格式:
[0054]
【权利要求】
1. 一种体验式业务监控系统,其特征在于: 采集代理模块部署在能够直接访问目标业务系统的机器上,自主调度采集,在无需对 现有业务系统做任何修改的前提下,通过脚本、API接口、日志文件、数据库等方式监控业务 系统运行状态和性能。
2. 根据权利要求1所述的业务监控系统,其特征在于: 采集代理内部有很多采集器,包括基于标准协议和接口实现的基础设施监控采集器, 和基于脚本实现的业务监控采集器,它们根据需要动态加载、启动。
3. 根据权利要求2所述的业务监控系统,其特征在于: 所述系统还包括数据采集处理模块集中接收采集代理上传的监控数据。为了适应各种 复杂网络环境,采集代理与数据采集处理之间采用Web Service接口,并且是由采集代理主 动上报给数据采集处理模块。在需要的场合,采集代理与数据采集处理模块之间可以增加 采集代理网关做数据转发。
4. 根据权利要求3所述的业务监控系统,其特征在于: 所述系统还包括采集任务集中管理模块,用于集中设置采集代理的各种采集参数。为 了适应各种复杂网络环境采集代理与采集任务集中管理模块之间采用Web Service接口, 并且是利用每次采集代理向采集任务集中管理模块发送心跳的链路回传给采集参数。在需 要的场合,采集代理与采集任务集中管理模块之间可以增加采集代理网关做数据转发。
5. 根据权利要求4所述的业务监控系统,其特征在于: 采集代理能够和各种脚本环境对接。可以模拟人操作方式自动进行业务系统访问性 能和可用性的测试,能够从最终用户感知的角度真实反映当前业务系统的访问性能和可用 性。
6. 根据权利要求1、2所述的业务监控系统,其采用的监控方法特征在于: 采集代理采用文件接口方式与各种脚本环境交互,支持包括DOS批处理、VBS、AutoIT、 Shel 1、Per 1、Python在内的各种脚本环境。采集代理与脚本环境之间的接口文件至少包括: 表示脚本执行完成的标志文件、脚本执行结果文件、监控数据文件。
7. 根据权利6所述的监控方法,其特征在于: 多脚本环境的支持,并且对于所述系统来说是透明的。 基于Windows标准控件的客户端的C/S业务系统,采用支持Windows消息机制的脚本 环境如AutoIT,实现对C/S图形界面的操作和数据访问。 Linux和Unix下字符客户端的C/S业务系统,采用Telnet/ssh客户端环境,实现对字 符界面的操作和数据访问。 B/S业务系统,采用支持Windows COM技术的脚本环境如VBS、AutoIT,在Windows IE 浏览器环境下实现对B/S图形界面的操作和数据访问。
8. 根据权利7所述的监控方法,其特征在于: 为了适应业务系统的不确定性,所述系统提供基于XML配置动态展示业务系统监控数 据的方法。根据每类业务系统定义的XML文件,所述系统会自动按约定方式实时显示监控 数据。
【文档编号】G06F9/44GK104243185SQ201310222410
【公开日】2014年12月24日 申请日期:2013年6月6日 优先权日:2013年6月6日
【发明者】方宇炜 申请人:神州数码系统集成服务有限公司