本申请属于计算机,具体涉及一种监控报警方法和装置。
背景技术:
1、在企业saas(software-as-a-service,软件即服务)平台的生产运营中,首要职责便是对外保证高并发、高性能、高可用性的业务能力,但往往一家成熟的saas平台架构是十分复杂的,带来的运维工作也是十分复杂、庞大的,假如saas平台突发故障导致无法对外提供正常的业务服务,除了经济上的损失之外,更多的损失是对saas平台以及对企业信誉的损失。因此,对于包括但不限于saas平台系统的统计监控预警是必不可少的,统计数据既可以作为业务上的数据抓手,又可以为线上运营提供报警能力,同时预警系统可以尽早感知生产问题,分析问题,解决问题。
2、目前,市场上的saas平台的监控预警系统可以实现简单的业务系统报警,但需要计算的数据量比较大,因而工作复杂且容易出错。
3、申请内容
4、本申请实施例的目的是提供一种监控报警方法和装置,以解决现有监控预警系统的计算数据量较大的缺陷。
5、为了解决上述技术问题,本申请是这样实现的:
6、第一方面,提供了一种监控报警方法,包括以下步骤:
7、通过消息队列收集各个业务服务上报的业务数据,并根据所述业务数据计算单位时间内的统计元数据;
8、基于所述统计元数据,实时统计多个单位时间维度内的多个监控指标的统计结果,所述多个监控指标包括请求总数、请求失败总数、失败平均响应时长和成功平均响应时长;
9、根据所述统计结果,确定是否发送报警通知。
10、第二方面,提供了一种监控报警装置,包括:
11、计算模块,用于通过消息队列收集各个业务服务上报的业务数据,并根据所述业务数据计算单位时间内的统计元数据;
12、统计模块,用于基于所述统计元数据,实时统计多个单位时间维度内的多个监控指标的统计结果,所述多个监控指标包括请求总数、请求失败总数、失败平均响应时长和成功平均响应时长;
13、确定模块,用于根据所述统计结果,确定是否发送报警通知。
14、本申请实施例根据实时统计出地多个单位时间维度内的多个监控指标的统计结果确定是否发送报警通知,能够减少监控系统的计算数据量,避免系统误报的发生,提升统计监控预警服务的可信度。
技术实现思路
1.一种监控报警方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述多个单位时间维度包括第一窗口时间和第二窗口时间,且所述第一窗口时间小于所述第二窗口时间,所述第一窗口时间和所述第二窗口时间具有相同的窗口右边界和不同的窗口左边界;
3.根据权利要求2所述的方法,其特征在于,所述根据所述统计结果,确定是否发送报警通知,具体包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述统计结果,确定是否发送报警通知,具体包括:
5.根据权利要求1所述的方法,其特征在于,还包括:
6.一种监控报警装置,其特征在于,包括:
7.根据权利要求6所述的装置,其特征在于,所述多个单位时间维度包括第一窗口时间和第二窗口时间,且所述第一窗口时间小于所述第二窗口时间,所述第一窗口时间和所述第二窗口时间具有相同的窗口右边界和不同的窗口左边界;
8.根据权利要求7所述的装置,其特征在于,
9.根据权利要求6所述的装置,其特征在于,
10.根据权利要求6所述的装置,其特征在于,还包括: