专利名称:一种用于监控业务服务器的方法和装置的制作方法
技术领域:
本发明涉及监控领域,尤其涉及一种用于监控业务服务器的方法和装置。
背景技术:
随着企业规模的不断壮大,越来越多的企业着手在更多的区域发展公司业务,因此企业的网络也就出现了跨区域分布的情况。这就需要设计的监控系统能够支持对跨区域网络的统一监控。然而传统的监控系统只专注于如何对设备做很好的监控和展现而没有对跨区域监控做很好的设计或者没有一个成形的架构。这就导致对于传统监控系统来言,要支持对跨区域的统一监控需要花费很大的力气来实现,并且即使跨区域的统一监控建立成功,需根据每个区域的变化情况逐一采取对应的监控指令进行维护,后期的维护成本也很闻。
发明内容
本发明实施例提供一种用于监控业务服务器的方法和装置,使得监控系统对跨区域的支持变得简单,同时也通过预测的方式自动发送监控指令,降低了监控系统的维护成本。为达到上述目的,采用如下技术方案一种用于监控业务服务器的方法,包括在预定的时间间隔时,各区域对应的数据采集组件向所位于的业务服务器上的数据汇总组件发送业务监控数据,由所述数据汇总组件将所接收的业务监控数据生成监控信息;所述业务监控数据以预定格式指示各区域中的业务数据和监控点名称;业务服务器将所生成的监控信息发送到监控服务器;所述监控服务器存储所接收的监控信息,并按照统计时间间隔基于所存储的监控信息分级统计,生成汇总数据进行展现。优选的,所述由所述数据汇总组件将所接收的业务监控数据生成监控信息,包括所述数据汇总组件对接收的业务监控数据进行分析;在不存在与所述业务监控数据相对应的心跳信息数据的情况下,生成心跳信息数据;在区域中不存在与所述业务监控数据相对应的监控点数据的情况下,生成监控点数据;在区域中存在与所述业务监控数据相对应的监控点数据的情况下,更新监控点数据;当达到预定时间间隔时,基于所述心跳信息数据和所述监控点数据生成所述监控信息。优选的,所生成的监控信息包括监控点信息、调用次数信息、响应次数和响应时间信息中的至少一个。优选的,所述生成汇总数据后,将汇总数据发送至业务服务器中的控制组件,控制组件对汇总数据进行分析预测,调用对应的监控指令发送至数据汇总组件,进而对各区域对应的数据采集组件进行控制。优选的,所述控制组件对汇总数据进行分析预测时,将汇总数据在基于历史记录中的监控数据和监控指令的建立的预测模型中进行匹配,得到汇总数据对应的监控指令。本发明还公开了一种用于监控业务服务器的装置,包括采集模块,用于在预定的时间间隔时,各区域对应的数据采集组件向所位于的业务服务器上的数据汇总组件发送业务监控数据,由所述数据汇总组件将所接收的业务监控数据生成监控信息;所述业务监控数据以预定格式指示各区域中的业务数据和监控点名称;通信模块,用于使业务服务器将所生成的监控信息发送到监控服务器; 展现模块,用于所述监控服务器存储所接收的监控信息,并按照统计时间间隔基于所存储的监控信息分级统计,生成汇总数据进行展现。优选的,所述采集模块配置为对接收的业务监控数据进行分析;在不存在与所述业务监控数据相对应的心跳信息数据的情况下,生成心跳信息数据;在区域中不存在与所述业务监控数据相对应的监控点数据的情况下,生成监控点数据;在区域中存在与所述业务监控数据相对应的监控点数据的情况下,更新监控点数据;所述采集模块进一步配置为当达到预定时间间隔时,基于所述心跳信息数据和所述监控点数据生成所述监控信息。优选的,所生成的监控信息包括监控点信息、调用次数信息、响应次数和响应时间信息中的至少一个。优选的,所述装置还包括,预测模块,用于将汇总数据发送至业务服务器中的控制组件,控制组件对汇总数据进行分析预测,调用对应的监控指令发送至数据汇总组件,进而对各区域对应的数据采集组件进行控制。优选的,所述预测模块对汇总数据进行分析预测时,将汇总数据在基于历史记录中的监控数据和监控指令的建立的预测模型中进行匹配,得到汇总数据对应的监控指令。本发明实施例提供的一种用于监控业务服务器的方法和装置,将监控系统的各采集模组分别部署在各区域中统一进行数据采集,并根据分级统计、汇总之后的监控数据进行分析统计,并通过对汇总数据自动预测对应的监控指令,从而再次对各采集模组的监控策略进行调整,形成自适应的监控体系。
图I为本发明提供的一种用于监控业务服务器的方法的步骤流程图;图2为本发明提供的一种用于监控业务服务器的装置的结构模块图。
具体实施例方式下面结合附图对本发明实施例一种用于监控业务服务器的方法及装置进行详细描述。随着计算机的广泛应用,企业中需要对许多业务系统进行监控。然而,现在的监控系统仅限于对硬件系统的监控。在现实中,需要对业务处理功能或方法进行监控。现在的分布式部署,不能保证每个业务都独占一台服务器,当一个业务系统被部署到多个系统上时,难免会受其它业务系统影响。在一些情况下,服务器可能需要监控数以百计的业务系统,而一个业务系统可能有数十个业务处理功能或方法。对于如此之多的监控内容,需要一个好的内容界定方法来区分不同的业务系统、业务功能、硬件系统等的监控信息;并为监控数据的采集、存储、实时分析、报告、报警的逻辑精简提供数据基础。本发明公开了一种用于监控业务服务器的方法,如图I所示,包括
步骤101 :在预定的时间间隔时,各区域对应的mysql数据采集组件向所位于的业务服务器上的数据汇总组件发送业务监控数据以及采集组件自身的一些性能数据,由mysql服务器的所述数据汇总组件将所接收的业务监控数据和采集组件自身数据生成监控信息;所述业务监控数据以预定格式指示各区域中的业务数据和监控点名称;所述由所述数据汇总组件将所接收的业务监控数据生成监控信息,包括如下步骤步骤a :数据汇总组件对接收的业务监控数据进行分析;业务服务器上的数据汇总组件接收到各区域上传的业务监控数据后,对业务监控数据按对应的数据类型进行统计,并结合设定的阈值将统计结果拟合为性能曲线,从而分析各数据指标的变化情况。如某区域数据采集组件上传的响应时间发生范围过大,超过设定的阈值,则该区域对应的链路故障的概率偏高,数据汇总组件触发对应的事件对该区域进行提示。步骤b :在不存在与所述业务监控数据相对应的心跳信息数据的情况下,生成心跳信息数据;实际情况中,如果不存在对应的心跳信息数据,则说明心跳信息数据由于某种原因没有发送,但该区域数据采集组件对应的线程依然正常存在,则生成心跳信息数据。步骤c :在区域中不存在与所述业务监控数据相对应的监控点数据的情况下,生成监控点数据;每个区域对应的数据采集组件对应的监控点数据一旦没有生成,则生成监控点数据,并保存在区域对应的子数据库中。步骤d :在区域中存在与所述业务监控数据相对应的监控点数据的情况下,更新监控点数据;同理,每个区域对应的数据采集组件对应的监控点数据已经生成时,则该监控点数据记录的为上一时刻的区域状态,因此更新对应的监控点数据,并保存在区域对应的子数据库中。步骤e :当达到预定时间间隔时,基于所述心跳信息数据和所述监控点数据生成所述监控信息。
当各区域中的数据采集组件无法连接至业务服务器时,数据采集组件可将监控信息保存在各区域的子数据库中,当连接恢复正常后再把监控数据发送到业务服务器。优选的,所生成的监控信息包括监控点信息、调用次数信息、响应次数和响应时间信息中的至少一个。步骤102 :业务服务器将所生成的监控信息发送到监控服务器;业务服务器采用同步的方式将监控信息发送到监控服务器,也可采用异步的方式,在设定的既定时间段内将监控信息发送到监控服务器。步骤103 :监控服务器存储所接收的监控信息,并基于监控信息进行业务处理,mysql服务器按照统计时间间隔基于所存储的监控信息分级统计,生成汇总数据进行展现。mysql服务器具体分级统计的汇总过程如下
I.监控服务器启动时,按不同的汇总粒度定时汇总任务,汇总粒度包括30分钟汇总,I小时汇总,6小时汇总,I天汇总。2.每个粒度的汇总任务从存储的历史监控数据中获取该汇总任务需要的监控数据,然后通过预定义的汇总算法进行监控数据的汇总。3.汇总的算法包括了对一段时间内的数据求平均值,最大值,最小值等算法。4.监控服务器对各个汇总任务汇总后的汇总数据进行存储,并提供给展现模块进行展现。基于分级的思想进行监控信息的分级统计,可使用户按不同的时段查看监控数据,从而判断各区域对应的工作状态,满足了用户的不同需要。本实施例中,基于监控信息进行业务处理时,监控设定的预警阈值,一旦汇总数据达到了预警阈值,则触发邮件、短信等告警通知。具体过程如下I.监控服务器启动用于进行告警计算的告警模块。2.用户通过展现平台将监控信息的预警阈值发送到监控服务器的告警模块。预警阈值包括(I).用来界定监控信息是否超过该预警阈值的计算符号,如大于、小于、包含等符号;(2).预警阈值的计算符号所需要的操作数。3.告警模块用接收到监控信息和设定的预警阈值进行此对得出是否违反了预警阈值的结论。4.如果监控信息超过了设定的预警阈值,则触发邮件、短信等事件通知用户。步骤104 mysql服务器将汇总数据发送至业务服务器中的控制组件,控制组件对汇总数据进行分析预测,调用对应的监控指令发送至mysql服务器的数据汇总组件,进而对各区域对应的数据采集组件进行控制。所述控制组件对汇总数据进行分析预测时,包括对mysql采集组件自身性能情况的分析预测和监控数据走势的分析预测。将汇总数据在基于历史记录中的监控数据和监控指令的建立的预测模型中进行匹配,得到汇总数据对应的监控指令。对mysql采集组件性能的分析预测是通过分析mysql采集组件的性能数据来预测组件未来一段时间是否会出现性能问题,并通过汇总组件对各区域的数据采集组件进行控制,具体过程如下
I.接收到汇总的采集组件自身的性能数据形成原始监控数据,原始监控数据中包括采集组件监控的资源数量,CPU消耗情况,内存占用消耗情况,进程内线程使用情况等信息;2.将原始监控数据进行训练,将于通过对监控资源的数量线程使用情况和造成的CPU、内存消耗情况来推算出监控资源的数量、线程情况与CPU、内存消耗的此例,从而得到监控资源对应的预测模型;3.当监控资源的数量增加时,根据预测模型预测采集组件增加的CPU、内存消耗情况;4.如果预测到采集组件的CPU、内存消耗情况超过了采集组件当前分配的CPU、内存。通过汇总组件发送的监控指令来调整采集组件的CPU、内存分配情况。预测模型建立时,需要连续稳定运行一段时间,这样可根据积累的原始监控数据进行计算或训练。所述预测模型中,监控资源的数量、使用的线程数分别对应计算出的消耗负载(CPU、内存)的平衡值。当监控资源的数量增加或使用的线程数变化的时候,根据预测模型中存储出的平衡值,动态调整消耗的负载(分配的CPU、内存);或者根据当前的消耗负载(cpu、内存的实际消耗值)计算出的平衡值,来动态调整使用的线程数和/或监控资源的数量。对数据走势的分析预测是基于采集到的历史数据的分析总结出数据的规律以及走势,预测数据可能到某个时间点会超过设定的告警阈值,并将预测结果发送告警通知以便用户可以及时处理,防患于未然。具体分析过程如下I.接收到汇总的监控信息,通过对历史时段范围内的监控信息进行统计,得到原始监控数据,对原始监控数据进行分析,得到预测模型,根据预测模型分析推断出监控信息对应的增长速率。下面以按周为周期的预测模型如下
时间第一周_______第二周___
__筒一周二周三周四周五周六周日周一周二周三 ...
0-1 点 X11 X120 X130 X140 X150 X160 X170X210X220X230_ O
8-9 点 X11 X128 X138 X148 X158 X168 X178X218X228X238__8______
23-24 点 X1123 X122 X132 X142 X152 X162 X172X212X222X232___3__3_ 3 3 3 3333其中,Xl 10代表,第一个I代表是第一周,第二个I代表周一,第三个数O代表是O点的数据,则XllO代表第一周周一 O点的汇总数据。X210代表,第二周周一 O点的汇总数据,依次类推,则X2323代表第2周周三23点的汇总数据。当系统获取到了各个小时的原始监控数据,则可对原始监控数据进行多个角度的分析和预测,得到预测模型在某一实施例中,按照每周的相同时段的数据进行分析,获取每周一 8点的原始监控数据进行比较,按照线性回归预测方法进行预测,在系统运行平稳并且业务相对固定的情况下,则可此较准确的预测到下周一同一时间点的数据是什么,同理,可准确预测下个月同一天的数据情况。2.根据预测模型对当前采集到的原始监控数据按照一定的预测算法进行预测,可较准确推断出下一个时间点监控信息的值,以及何时监控信息的值将超过设定的阈值;结合具体业务情况选对需要分析的原始监控数据,有些业务是每月的最后几天会很忙,有的业务是每周的周一会集中处理,结合这些业务特点,选取对应的数据源进行分 析,可预估到下一次业务集中处理时,预测模型即可推测出准确的监控信息。3.在临近所述时间点时,如果预测到的监控数据大于设定的阈值,则通过邮件、短信等方式触发对应的事件,将预测结果发送给用户,提前通知用户做好相应的处理和准备。如果某项业务是每周一上午8点集中处理,已经连续两周的周一 8点,监控数据显示系统负载稳步增长,通过预测模型进行线性回归预测,下周一负载将创新高,则需要提前通知管理员,或者升级系统,或者增加负载,提前预防下周一的负载高峰。同时,如果负载连续增长,则从另外一个方面反映系统的负载出现问题或者系统容量不足,或者业务系统出现负载方面的问题,为提前诊断及预防提供了依据。同样,对于业务月度某一天集中处理的业务亦然。本发明还公开了一种用于监控业务服务器的装置,如图2所示,包括采集模块201,用于在预定的时间间隔时,各区域对应的mysql数据采集组件向所位于的业务服务器上的数据汇总组件发送业务监控数据,由mysql服务器的所述数据汇总组件将所接收的业务监控数据生成监控信息;所述业务监控数据以预定格式指示各区域中的业务数据和监控点名称;通信模块202,用于使业务服务器将所生成的监控信息发送到监控服务器;展现模块203,用于所述监控服务器存储所接收的监控信息,并由mysql服务器按照统计时间间隔基于所存储的监控信息分级统计,生成汇总数据进行展现。优选的,所述采集模块配置为对接收的业务监控数据进行分析;在不存在与所述业务监控数据相对应的心跳信息数据的情况下,生成心跳信息数据;在区域中不存在与所述业务监控数据相对应的监控点数据的情况下,生成监控点数据;在区域中存在与所述业务监控数据相对应的监控点数据的情况下,更新监控点数据;所述采集模块进一步配置为当达到预定时间间隔时,基于所述心跳信息数据和所述监控点数据生成所述监控信息。优选的,所生成的监控信息包括监控点信息、调用次数信息、响应次数和响应时间信息中的至少一个。优选的,所述装置还包括,预测模块204,用于将汇总数据发送至业务服务器中的控制组件,控制组件对汇总数据进行分析预测,调用对应的监控指令发送至数据汇总组件,进而对各区域对应的数据采集组件进行控制。优选的,所述预测模块对汇总数据进行分析预测时,将汇总数据在基于历史记录中的监控数据和监控指令的建立的预测模型中进行匹配,得到汇总数据对应的监控指令。本发明实施例提供的一种用于监控业务服务器的方法和装置,将监控系统的各采集模组分别部署在各区域中统一进行数据采集,并根据分级统计、汇总之后的监控数据进行分析统计,并通过对汇总数据自动预测对应的监控指令,从而再次对各采集模组的监控策略进行调整,形成自适应的监控体系。以上所述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵 盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
权利要求
1.一种用于监控业务服务器的方法,其特征在于,包括 在预定的时间间隔时,各区域对应的数据采集组件向所位于的业务服务器上的数据汇总组件发送业务监控数据,由所述数据汇总组件将所接收的业务监控数据生成监控信息;所述业务监控数据以预定格式指示各区域中的业务数据和监控点名称; 业务服务器将所生成的监控信息发送到监控服务器; 所述监控服务器存储所接收的监控信息,并按照统计时间间隔基于所存储的监控信息分级统计,生成汇总数据进行展现。
2.根据权利要求I所述的方法,其特征在于所述由所述数据汇总组件将所接收的业务监控数据生成监控信息,包括 所述数据汇总组件对接收的业务监控数据进行分析; 在不存在与所述业务监控数据相对应的心跳信息数据的情况下,生成心跳信息数据; 在区域中不存在与所述业务监控数据相对应的监控点数据的情况下,生成监控点数据; 在区域中存在与所述业务监控数据相对应的监控点数据的情况下,更新监控点数据; 当达到预定时间间隔时,基于所述心跳信息数据和所述监控点数据生成所述监控信息。
3.根据权利要求I所述的方法,其特征在于所生成的监控信息包括监控点信息、调用次数信息、响应次数和响应时间信息中的至少一个。
4.根据权利要求I所述的方法,其特征在于所述生成汇总数据后,将汇总数据发送至业务服务器中的控制组件,控制组件对汇总数据进行分析预测,调用对应的监控指令发送至数据汇总组件,进而对各区域对应的数据采集组件进行控制。
5.根据权利要求4所述的方法,其特征在于所述控制组件对汇总数据进行分析预测时,将汇总数据在基于历史记录中的监控数据和监控指令的建立的预测模型中进行匹配,得到汇总数据对应的监控指令。
6.一种用于监控业务服务器的装置,其特征在于,包括 采集模块,用于在预定的时间间隔时,各区域对应的数据采集组件向所位于的业务服务器上的数据汇总组件发送业务监控数据,由所述数据汇总组件将所接收的业务监控数据生成监控信息;所述业务监控数据以预定格式指示各区域中的业务数据和监控点名称; 通信模块,用于使业务服务器将所生成的监控信息发送到监控服务器; 展现模块,用于所述监控服务器存储所接收的监控信息,并按照统计时间间隔基于所存储的监控信息分级统计,生成汇总数据进行展现。
7.根据权利要求6所述的装置,其特征在于所述采集模块配置为对接收的业务监控数据进行分析; 在不存在与所述业务监控数据相对应的心跳信息数据的情况下,生成心跳信息数据; 在区域中不存在与所述业务监控数据相对应的监控点数据的情况下,生成监控点数据; 在区域中存在与所述业务监控数据相对应的监控点数据的情况下,更新监控点数据;所述采集模块进一步配置为当达到预定时间间隔时,基于所述心跳信息数据和所述监控点数据生成所述监控信息。
8.根据权利要求6所述的装置,其特征在于所生成的监控信息包括监控点信息、调用次数信息、响应次数和响应时间信息中的至少一个。
9.根据权利要求6所述的装置,其特征在于所述装置还包括,预测模块,用于将汇总数据发送至业务服务器中的控制组件,控制组件对汇总数据进行分析预测,调用对应的监控指令发送至数据汇总组件,进而对各区域对应的数据采集组件进行控制。
10.根据权利要求9所述的装置,其特征在于所述预测模块对汇总数据进行分析预测时,将汇总数据在基于历史记录中的监控数据和监控指令的建立的预测模型中进行匹配,得到汇总数据对应的监控指令。
全文摘要
本发明实施例公开了一种用于监控业务服务器的方法和装置,属于监控领域。方法包括各区域对应的数据采集组件向所位于的业务服务器上的数据汇总组件发送业务监控数据,由所述数据汇总组件将所接收的业务监控数据生成监控信息;业务服务器将所生成的监控信息发送到监控服务器;所述监控服务器存储所接收的监控信息,并按照统计时间间隔基于所存储的监控信息分级统计,生成汇总数据进行展现。本发明将监控系统的各采集模组分别部署在各区域中统一进行数据采集,并根据分级统计、汇总之后的监控数据进行分析统计,并通过对汇总数据自动预测对应的监控指令,从而再次对各采集模组的监控策略进行调整,形成自适应的监控体系。
文档编号H04L12/26GK102882745SQ20121037126
公开日2013年1月16日 申请日期2012年9月29日 优先权日2012年9月29日
发明者何宇 申请人:摩卡软件(天津)有限公司