系统监控方法、装置、设备及存储介质与流程

文档序号:24550870发布日期:2021-04-06 12:03阅读:57来源:国知局
系统监控方法、装置、设备及存储介质与流程

本申请涉及金融科技(fintech)的系统监控技术,尤其涉及一种系统监控方法、装置、设备及存储介质。



背景技术:

随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技转变,系统监控技术也不例外,但由于金融行业的安全性、实时性要求,也对系统监控技术提出更高的要求。

当前在金融行业中,分布式系统的应用越来越广泛。例如随着金融行业中数据的爆发式增长,传统存储系统由于磁盘空间不足、处理能力有限等已经不能满足当前数据存储的要求,分布式存储系统的应用在一定程度上解决了传统存储系统的存储瓶颈。现有系统监控方式主要是技术人员根据历史经验设定告警值,然后将实时监控到的系统的运维指标数据与上述设定的告警值进行对比,当某个指标数据不符合设定的告警值时,判定出现异常。

然而,上述告警值是基于技术人员的历史经验设定的,由于技术人员的一些主观因素,容易导致上述告警值的设定有偏差,从而使得基于上述告警值的系统监控准确性较低。而且,在需要监控的系统的运维指标数据数量较多时,上述人工设定告警值的方式要花费技术人员较多时间,使得系统监控的周期延长,系统监控效率降低。



技术实现要素:

为解决现有技术中存在的问题,本申请提供一种系统监控方法、装置、设备及存储介质。

第一方面,本申请实施例提供一种系统监控方法,所述方法包括:

获取待监控系统的实时运维指标数据;

根据所述待监控系统的历史运维指标数据的指标类别,确定目标告警规则,其中,所述历史运维指标数据是在获取所述实时运维指标数据之前第一预设时间段内所述待监控系统的运维指标数据;

根据所述目标告警规则,判断所述实时运维指标数据是否存在异常;

若所述实时运维指标数据存在异常,则进行异常告警。

在一种可能的实现方式中,在所述根据所述待监控系统的历史运维指标数据的指标类别,确定目标告警规则之前,还包括:

对所述历史运维指标数据进行时序分解,获得所述历史运维指标数据的趋势分量、周期分量和稳定分量;

计算所述历史运维指标数据与所述趋势分量的第一相似度,所述历史运维指标数据与所述周期分量的第二相似度,以及所述历史运维指标数据与所述稳定分量的第三相似度;

根据所述第一相似度、所述第二相似度和所述第三相似度,确定所述历史运维指标数据的指标类别。

在一种可能的实现方式中,所述对所述历史运维指标数据进行时序分解,获得所述历史运维指标数据的趋势分量、周期分量和稳定分量,包括:

对所述历史运维指标数据进行去趋势化处理,获得去趋势化序列,并对所述去趋势化序列中的每个子序列进行局部加权回归处理,得到临时周期序列;

对所述临时周期序列进行低通滤波处理,获得低频时间序列,并根据所述低频时间序列,对所述临时周期序列进行去趋势化处理,获得所述周期分量;

根据所述周期分量,对所述历史运维指标数据进行去周期化处理,并对去周期化处理后的历史运维指标数据,进行局部加权回归处理,得到所述趋势分量;

根据所述历史运维指标数据、所述周期分量和所述趋势分量,获得所述稳定分量。

在一种可能的实现方式中,在所述根据所述历史运维指标数据、所述周期分量和所述趋势分量,获得所述稳定分量之前,还包括:

判断所述周期分量和所述趋势分量是否收敛;

所述根据所述历史运维指标数据、所述周期分量和所述趋势分量,获得所述稳定分量,包括:

若所述周期分量和所述趋势分量收敛,则执行所述根据所述历史运维指标数据、所述周期分量和所述趋势分量,获得所述稳定分量的步骤。

在一种可能的实现方式中,在所述根据所述历史运维指标数据、所述周期分量和所述趋势分量,获得所述稳定分量之后,还包括:

根据所述稳定分量,确定目标稳健权重;

所述对所述去趋势化序列中的每个子序列进行局部加权回归处理,包括:

根据所述目标稳健权重,对所述去趋势化序列中的每个子序列进行局部加权回归处理;

所述对去周期化处理后的历史运维指标数据进行局部加权回归处理,包括:

根据所述目标稳健权重,对去周期化处理后的历史运维指标数据进行局部加权回归处理。

在一种可能的实现方式中,所述计算所述历史运维指标数据与所述趋势分量的第一相似度,包括:

根据所述历史运维指标数据与所述趋势分量,构建第一待处理矩阵;

搜索所述第一待处理矩阵中第一个矩阵点到最后一个矩阵点的所有规整路径;

在所述所有规整路径中,获得规整代价最小的路径;

根据所述规整代价最小的路径,确定所述历史运维指标数据与所述趋势分量的所述第一相似度。

在一种可能的实现方式中,所述根据所述第一相似度、所述第二相似度和所述第三相似度,确定所述历史运维指标数据的指标类别,包括:

将所述第一相似度、所述第二相似度和所述第三相似度进行比较;

若比较所述第一相似度为最大值,则确定所述历史运维指标数据的指标类别为趋势类别;

若比较所述第二相似度为最大值,则确定所述历史运维指标数据的指标类别为周期类别;

若比较所述第三相似度为最大值,则确定所述历史运维指标数据的指标类别为稳定类别。

在一种可能的实现方式中,所述根据所述待监控系统的历史运维指标数据的指标类别,确定目标告警规则,包括:

获取预存的运维指标数据的指标类别与告警规则的对应关系;

根据所述对应关系,确定所述历史运维指标数据的指标类别对应的所述目标告警规则。

在一种可能的实现方式中,所述获取预存的运维指标数据的指标类别与告警规则的对应关系,包括:

对于稳定类别的运维指标数据,获得历史稳定类别的运维指标数据的稳定分量以及标准差,其中,所述历史稳定类别的运维指标数据是在获取所述稳定类别的运维指标数据之前获取的;

根据所述稳定分量和所述标准差,获得所述稳定类别的运维指标数据对应的告警规则。

在一种可能的实现方式中,所述获取预存的运维指标数据的指标类别与告警规则的对应关系,包括:

对于周期类别的运维指标数据,以第二预设时间段为一周期,将所述周期类别的运维指标数据与历史周期类别的运维指标数据进行对比,确定数据增长率,其中,所述历史周期类别的运维指标数据是在获取所述周期类别的运维指标数据之前的周期获取的;

根据预设长短期记忆网络(longshort-termmemory,lstm)和所述历史周期类别的运维指标数据的均方误差,确定所述周期类别的运维指标数据的预测值;

根据所述数据增长率和所述预测值,获得所述周期类别的运维指标数据对应的告警规则。

在一种可能的实现方式中,所述获取预存的运维指标数据的指标类别与告警规则的对应关系,包括:

对于趋势类别的运维指标数据,将所述趋势类别的运维指标数据与历史趋势类别的运维指标数据进行对比,确定环比增长率,其中,所述历史趋势类别的运维指标数据是在获取所述趋势类别的运维指标数据之前获取的;

根据所述历史趋势类别的运维指标数据,确定二叉搜索树,并根据所述二叉搜索树确定所述趋势类别的运维指标数据的各路径长度;

根据所述环比增长率和所述各路径长度,获得所述趋势类别的运维指标数据对应的告警规则。

在一种可能的实现方式中,在所述进行异常告警之前,还包括:

将所述实时运维指标数据中存在异常的数据发送至预设终端,所述存在异常的数据用于指示所述预设终端对所述存在异常的数据进行审核;

所述进行异常告警,包括:

若接收到所述预设终端发送的审核通过信息,则进行异常告警。

第二方面,本申请实施例提供一种系统监控装置,所述装置包括:

获取模块,用于获取待监控系统的实时运维指标数据;

确定模块,用于根据所述待监控系统的历史运维指标数据的指标类别,确定目标告警规则,其中,所述历史运维指标数据是在获取所述实时运维指标数据之前第一预设时间段内所述待监控系统的运维指标数据;

判断模块,用于根据所述目标告警规则,判断所述实时运维指标数据是否存在异常;

告警模块,用于若所述实时运维指标数据存在异常,则进行异常告警。

在一种可能的实现方式中,所述确定模块,还用于:

对所述历史运维指标数据进行时序分解,获得所述历史运维指标数据的趋势分量、周期分量和稳定分量;

计算所述历史运维指标数据与所述趋势分量的第一相似度,所述历史运维指标数据与所述周期分量的第二相似度,以及所述历史运维指标数据与所述稳定分量的第三相似度;

根据所述第一相似度、所述第二相似度和所述第三相似度,确定所述历史运维指标数据的指标类别。

在一种可能的实现方式中,所述确定模块,具体用于:

对所述历史运维指标数据进行去趋势化处理,获得去趋势化序列,并对所述去趋势化序列中的每个子序列进行局部加权回归处理,得到临时周期序列;

对所述临时周期序列进行低通滤波处理,获得低频时间序列,并根据所述低频时间序列,对所述临时周期序列进行去趋势化处理,获得所述周期分量;

根据所述周期分量,对所述历史运维指标数据进行去周期化处理,并对去周期化处理后的历史运维指标数据,进行局部加权回归处理,得到所述趋势分量;

根据所述历史运维指标数据、所述周期分量和所述趋势分量,获得所述稳定分量。

在一种可能的实现方式中,所述确定模块,具体用于:

判断所述周期分量和所述趋势分量是否收敛;

若所述周期分量和所述趋势分量收敛,则执行所述根据所述历史运维指标数据、所述周期分量和所述趋势分量,获得所述稳定分量的步骤。

在一种可能的实现方式中,所述确定模块,还用于:

根据所述稳定分量,确定目标稳健权重;

根据所述目标稳健权重,对所述去趋势化序列中的每个子序列进行局部加权回归处理,并根据所述目标稳健权重,对去周期化处理后的历史运维指标数据进行局部加权回归处理。

在一种可能的实现方式中,所述确定模块,具体用于:

根据所述历史运维指标数据与所述趋势分量,构建第一待处理矩阵;

搜索所述第一待处理矩阵中第一个矩阵点到最后一个矩阵点的所有规整路径;

在所述所有规整路径中,获得规整代价最小的路径;

根据所述规整代价最小的路径,确定所述历史运维指标数据与所述趋势分量的所述第一相似度。

在一种可能的实现方式中,所述确定模块,具体用于:

将所述第一相似度、所述第二相似度和所述第三相似度进行比较;

若比较所述第一相似度为最大值,则确定所述历史运维指标数据的指标类别为趋势类别;

若比较所述第二相似度为最大值,则确定所述历史运维指标数据的指标类别为周期类别;

若比较所述第三相似度为最大值,则确定所述历史运维指标数据的指标类别为稳定类别。

在一种可能的实现方式中,所述确定模块,具体用于:

获取预存的运维指标数据的指标类别与告警规则的对应关系;

根据所述对应关系,确定所述历史运维指标数据的指标类别对应的目标告警规则。

在一种可能的实现方式中,所述确定模块,具体用于:

对于稳定类别的运维指标数据,获得所述稳定类别的运维指标数据的稳定分量以及标准差;

根据所述稳定分量和所述标准差,获得所述稳定类别的运维指标数据对应的告警规则。

在一种可能的实现方式中,所述确定模块,具体用于:

对于周期类别的运维指标数据,以第二预设时间段为一周期,将所述周期类别的运维指标数据与历史周期类别的运维指标数据进行对比,确定数据增长率,其中,所述历史周期类别的运维指标数据是在获取所述周期类别的运维指标数据之前的周期获取的;

根据预设lstm和所述历史周期类别的运维指标数据的均方误差,确定所述周期类别的运维指标数据的预测值;

根据所述数据增长率和所述预测值,获得所述周期类别的运维指标数据对应的告警规则。

在一种可能的实现方式中,所述确定模块,具体用于:

对于趋势类别的运维指标数据,将所述趋势类别的运维指标数据与历史趋势类别的运维指标数据进行对比,确定环比增长率,其中,所述历史趋势类别的运维指标数据是在获取所述趋势类别的运维指标数据之前获取的;

根据所述历史趋势类别的运维指标数据,确定二叉搜索树,并根据所述二叉搜索树确定所述趋势类别的运维指标数据的各路径长度;

根据所述环比增长率和所述各路径长度,获得所述趋势类别的运维指标数据对应的告警规则。

在一种可能的实现方式中,所述告警模块,具体用于:

将所述实时运维指标数据中存在异常的数据发送至预设终端,所述存在异常的数据用于指示所述预设终端对所述存在异常的数据进行审核;

若接收到所述预设终端发送的审核通过信息,则进行异常告警。

第三方面,本申请实施例提供一种系统监控设备,包括:

处理器;

存储器;以及

计算机程序;

其中,所述计算机程序被存储在所述存储器中,并且被配置为由所述处理器执行,所述计算机程序包括用于执行如第一方面所述的方法的指令。

第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序使得服务器执行第一方面所述的方法。

第五方面,本申请实施例提供一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行第一方面所述的方法。

本申请实施例提供的系统监控方法、装置、设备及存储介质,该方法通过获取待监控系统的实时运维指标数据,并根据待监控系统的历史运维指标数据的指标类别,确定目标告警规则,这里,无需技术人员根据历史经验设定告警值,而是根据系统的历史运维指标数据的指标类别确定告警规则,其中,历史运维指标数据是在获取上述实时运维指标数据之前第一预设时间段内系统的运维指标数据,从而,使得上述目标告警规则与系统的运维指标数据相符合,进而,根据上述目标告警规则,判断上述实时运维指标数据是否存在异常,如果存在异常,则进行异常告警,提高了系统监控准确性。而且,在需要监控的系统的运维指标数据数量较多时,本申请实施例能够根据系统的历史运维指标数据的指标类别快速确定告警规则,缩短系统监控的周期,提高系统监控效率,适合应用。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种系统监控系统架构示意图;

图2为本申请实施例提供的一种系统监控方法的流程示意图;

图3为本申请实施例提供的一种对历史运维指标数据进行时序分解的流程示意图;

图4a为本申请实施例提供的一运维指标数据与其周期分量、趋势分量和稳定分量的示意图;

图4b为本申请实施例提供的一运维指标数据与其周期分量、趋势分量和稳定分量的示意图;

图5为本申请实施例提供的另一种系统监控方法的流程示意图;

图6为本申请实施例提供的一种系统监控装置的结构示意图;

图7示出了本申请系统监控设备的一种可能的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”及“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

当前在金融行业中,分布式系统的应用越来越广泛。例如随着金融行业中数据的爆发式增长,传统存储系统由于磁盘空间不足、处理能力有限等已经不能满足当前数据存储的要求,分布式存储系统的应用在一定程度上解决了传统存储系统的存储瓶颈。现有系统监控方式主要是技术人员根据历史经验设定告警值,然后将实时监控到的系统的运维指标数据与上述设定的告警值进行对比,当某个指标数据不符合设定的告警值时,判定出现异常。

然而,上述告警值是基于技术人员的历史经验设定的,由于技术人员的一些主观因素,容易导致上述告警值的设定有偏差。例如对于同一系统的运维指标数据,技术人员a根据历史经验设定告警值为告警值1,技术人员b根据历史经验设定告警值为告警值2,告警值1与告警值2不同。这样不同的技术人员设定的告警值不同,在将实时监控到的系统的运维指标数据与上述设定的告警值进行对比时,可能有时判断某个指标数据不符合设定的告警值,有时判断上述指标数据符合设定的告警值,从而使得基于上述告警值的系统监控准确性较低。

而且,在需要监控的系统的运维指标数据数量较多时,上述人工设定告警值的方式要花费技术人员较多时间,使得系统监控的周期延长,系统监控效率降低。另外,由于要设定的告警值较多,上述人工设定的方式可能会漏掉设定某些告警值,从而,出现监控遗漏,导致宕机的黑天鹅现象频繁发生,并且在系统出现故障时也难易确定系统哪些运维指标数据存在异常,进而,无法确定故障原因。

因此,本申请实施例提出一种系统监控方法,根据待监控系统的历史运维指标数据的指标类别,确定目标告警规则,其中,无需技术人员根据历史经验设定告警值,而是根据系统的历史运维指标数据的指标类别确定告警规则,使得上述目标告警规则与系统的运维指标数据相符合,进而,根据该目标告警规则,判断待监控系统的实时运维指标数据是否存在异常,如果存在异常,则进行异常告警,提高了系统监控准确性。而且,在需要监控的系统的运维指标数据数量较多时,本申请实施例能够根据系统的历史运维指标数据的指标类别快速确定告警规则,缩短系统监控的周期,提高系统监控效率,适合应用。

本申请实施例提供的系统监控方法可应用多种情景的系统监控中,示例性的,以分布式存储系统的系统监控为例。这里,分布式存储系统一般由负载均衡器(loadbalance,lb)、数据库(database,db)、集群管理节点(configurationservercluster)与多个应用节点(applicationnodes,api)构成。其中,数据库用于存储业务数据,而该分布式存储系统中的多个应用节点之间为无差别对等的节点,这些应用节点并不用以存储业务数据,非常容易扩展以承载更多的业务流量。并且,负载均衡器设置于多个应用节点的前端入口数,用于均匀分发访问请求,从而,使得各应用节点可以无差别的处理请求。其中,访问请求包括:针对数据库的查询请求与针对数据的更新请求中的至少一种。

可选地,图1为本申请实施例提供的一种系统监控系统架构示意图。在图1中,以对上述分布式存储系统的系统监控为例,上述架构包括系统监控设备。

这里,上述分布式存储系统包括:负载均衡器、数据库、集群管理节点、第一应用节点与第二应用节点。其中,图1中的省略号表示该分布式存储系统中还可以具备其他一个或多个应用节点。如图1所示,负载均衡器可以通过网络与外部的客户端进行通信以及数据交互。例如,负载均衡器可通过网络接收客户端发送的数据查询请求,并将该数据查询请求发送给第一应用节点进行处理。数据库在该分布式存储系统中作为持久化的数据库,用于存储所有数据。由此,所有数据更新请求、数据加载请求最终都会在数据库中完成。

而集群管理节点在该分布式存储系统中作为配置中心,接收来自应用节点的配置下发请求,并记录数据库的状态,从而,在应用节点检测到集群管理节点记录的状态为被更新状态时,去数据库请求加载被更新的数据至自身的内置存储空间。其中,集群管理节点可以表征的数据库的状态可以包括但不限于:被更新状态,该状态说明数据库中的数据发生更新。

第一应用节点与第二应用节点为无状态节点,二者在该分布式存储系统中无差别对等,其中,无差别对等是指由负载均衡器将来自分布式系统外部的针对数据库的一个或多个访问请求发送至任一应用节点进行处理,其中,负载均衡器根据各应用节点的负载情况将访问请求的发送至负载较低的应用节点,任一应用节点均可对数据库进行访问,并将访问结果发送至客户端。该分布式存储系统中的应用节点负责接收客户端发送的更新请求,并且负责将更新请求携带的数据发送至数据库,以修改数据库,如果发送成功,则将此次同步至集群管理节点。

可以理解的是,本申请实施例示意的结构并不构成对系统监控架构的具体限定。在本申请另一些可行的实施方式中,上述架构可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置,具体可根据实际应用场景确定,在此不做限制。图1所示的部件可以以硬件,软件,或软件与硬件的组合实现。

在具体实现过程中,系统监控设备获取上述分布式存储系统的实时运维指标数据,该运维指标数据可以包括上述分布式存储系统本身负载(例如中央处理器(centralprocessingunit,cpu)使用率和内存使用率等)、交易成功率、业务量等。系统监控设备根据上述分布式存储系统的历史运维指标数据的指标类别,确定目标告警规则,其中,无需技术人员根据历史经验设定告警值,而是根据系统的历史运维指标数据的指标类别确定告警规则,使得上述目标告警规则与系统的运维指标数据相符合,进而,根据该目标告警规则,判断上述分布式存储系统的实时运维指标数据是否存在异常,如果存在异常,则进行异常告警,提高了系统监控准确性。而且,在需要监控的系统的运维指标数据数量较多时,本申请实施例能够根据系统的历史运维指标数据的指标类别快速确定告警规则,缩短系统监控的周期,提高系统监控效率,适合应用。

另外,本申请实施例描述的系统架构以及业务场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着系统架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。

下面以几个实施例为例对本申请的技术方案进行描述,对于相同或相似的概念或过程可能在某些实施例不再赘述。

图2为本申请实施例提供的一种系统监控方法的流程示意图,本申请实施例提供了一种系统监控方法,该方法可以应用于系统监控的处理,且该方法可以由任意执行系统监控方法的装置来执行,该装置可以通过软件和/或硬件实现。如图2所示,在图1所示系统架构的基础上,本申请实施例提供的系统监控方法包括如下步骤:

s201:获取待监控系统的实时运维指标数据。

这里,上述待监控系统可以根据实际情况确定,例如上述图1中的分布式存储系统。

在本申请实施例中,以执行主体为上述图1中的系统监控设备为例,该系统监控设备获取上述待监控系统的实时运维指标数据。该运维指标数据可以包括上述待监控系统本身负载(例如cpu使用率和内存使用率等)、交易成功率、业务量等。

s202:根据上述待监控系统的历史运维指标数据的指标类别,确定目标告警规则。

其中,上述历史运维指标数据是在获取上述实时运维指标数据之前第一预设时间段内上述待监控系统的运维指标数据。上述历史运维指标数据为时序数据。

这里,上述第一预设时间段可以根据实际情况确定,例如上述历史运维指标数据是在获取上述实时运维指标数据之前一周内上述待监控系统的运维指标数据,本申请实施例对此不做特别限制。

示例性的,上述系统监控设备可以获取预存的运维指标数据的指标类别与告警规则的对应关系,进而,根据该对应关系,确定上述历史运维指标数据的指标类别对应的上述目标告警规则。

这里,上述对应关系可以根据实际情况确定,例如对于稳定类别的运维指标数据,上述系统监控设备可以获得历史稳定类别的运维指标数据的稳定分量以及标准差,该历史稳定类别的运维指标数据是在获取上述稳定类别的运维指标数据之前获取的。进而,根据该稳定分量和标准差,获得上述稳定类别的运维指标数据对应的告警规则。

其中,上述稳定类别的运维指标数据可以理解为运维指标数据与其稳定分量的最相似的一类运维指标数据。

这里,上述系统监控设备可以对每一运维指标数据进行时序分解,获得该运维指标数据的趋势分量、周期分量和稳定分量,进而,计算该运维指标数据与上述每一分量,即趋势分量、周期分量或稳定分量的相似度,并根据计算的相似度确定上述运维指标数据的类别。如果上述运维指标数据与其稳定分量最相似,即上述运维指标数据与其稳定分量的相似值最大,上述运维指标数据的类别为稳定类别。同理,如果上述运维指标数据与其周期分量最相似,即上述运维指标数据与其周期分量的相似值最大,上述运维指标数据的类别为周期类别。如果上述运维指标数据与其趋势分量最相似,即上述运维指标数据与其趋势分量的相似值最大,上述运维指标数据的类别为趋势类别。

其中,上述稳定分量具有波动幅度不大的特点,上述周期分量具有明显波动周期的特点,上述趋势分量具有变化趋势较平缓的特点。

对于稳定类别的运维指标数据,指标数据波动幅度不大,上述系统监控设备可以采用恒定阈值设定法,例如标准的统计学方法如3-sigma策略,获得上述稳定类别的运维指标数据对应的告警规则。示例性的,上述系统监控设备可以获得历史稳定类别的运维指标数据的稳定分量以及标准差,以该稳定分量为指标数据均值μ,该标准差为σ,确定数据范围(μ3σ,μ+3σ),进而认定在3-sigma范围(μ-3σ,μ+3σ)内的为正常数据,其余判定为异常值,获得上述稳定类别的运维指标数据对应的告警规则。

另外,对于周期类别的运维指标数据,上述系统监控设备可以设定以第二预设时间段为一周期,进而,将上述周期类别的运维指标数据与历史周期类别的运维指标数据进行对比,确定数据增长率,其中,上述历史周期类别的运维指标数据是在获取上述周期类别的运维指标数据之前的周期获取的。然后,根据预设lstm和上述历史周期类别的运维指标数据的均方误差,确定上述周期类别的运维指标数据的预测值,从而,根据上述数据增长率和上述预测值,获得上述周期类别的运维指标数据对应的告警规则。

这里,对于周期类别的运维指标数据,指标数据具有明显波动周期。上述系统监控设备可以采用基于时序预测的动态阈值设定法,例如同比算法结合lstm,获得上述周期类别的运维指标数据对应的告警规则。示例性的,以第二预设时间段为一周期,例如以天为周期单位,将上述周期类别的运维指标数据与历史周期类别的运维指标数据进行对比,计算数据增长率y%。然后结合lstm,这里可以以常用神经网络python库keras构建lstm模型,对上述历史周期类别的运维指标数据归一化,以其均方误差为损失函数,设定迭代次数为100进行模型训练,最后得上述周期类别的运维指标数据的预测值r,确定数据范围(r-r*y%,r+r*y%)内的为正常数据,其余判定为异常值。

对于趋势类别的运维指标数据,上述系统监控设备可以将上述趋势类别的运维指标数据与历史趋势类别的运维指标数据进行对比,确定环比增长率,其中,上述历史趋势类别的运维指标数据是在获取上述趋势类别的运维指标数据之前获取的。然后,根据上述历史趋势类别的运维指标数据,确定二叉搜索树,并根据该二叉搜索树确定上述趋势类别的运维指标数据的各路径长度,进而,根据上述环比增长率和各路径长度,获得上述趋势类别的运维指标数据对应的告警规则。

这里,对于趋势类别的指标数据,指标数据具有变化趋势较平缓的特点。上述系统监控设备可以采用环比算法和孤立森林异常检测算法,获得上述趋势类别的运维指标数据对应的告警规则。示例性的,上述系统监控设备利用环比算法,计算上述趋势类别的运维指标数据与历史趋势类别的运维指标数据的环比增长率,设定环比增长率异常阈值。结合孤立森林异常检测算法,首先以历史趋势类别的运维指标数据为训练样本,从训练数据中随机选取样本创建二叉搜索树(itree),迭代重复构建二叉树森林(iforest);然后完成上述趋势类别的运维指标数据异常性的预测,对二叉搜索树进行中序遍历,记录上述趋势类别的运维指标数据在每课itree中的路径长度,即从根结点到叶子结点的路径长h(x);最后运用统计学的方法计算上述趋势类别的运维指标数据各路径长的期望值e(h(x))和方差s(h(x)),判断e(h(x))→0,s(h(x))→1为异常值。

在本申请实施例中,上述系统监控设备根据待监控系统的历史运维指标数据的指标类别确定告警规则。其中,历史运维指标数据是在获取上述实时运维指标数据之前第一预设时间段内系统的运维指标数据,即历史运维指标数据可以体现上述系统的运维指标数据的特点。因此,上述系统监控设备根据上述历史运维指标数据的指标类别确定告警规则,使得上述目标告警规则与系统的运维指标数据相符合,进而,根据上述目标告警规则,判断上述实时运维指标数据是否存在异常,如果,则进行异常告警,提高了系统监控准确性。

s203:根据上述目标告警规则,判断上述实时运维指标数据是否存在异常。

示例性的,如果上述实时运维指标数据为稳定类别的运维指标数据,上述系统监控设备可以认定上述实时运维指标数据在3-sigma范围(μ-3σ,μ+3σ)内的为正常数据,其余判定为异常值。

同理,如果上述实时运维指标数据为周期类别的运维指标数据,上述系统监控设备可以认定上述实时运维指标数据在(r-r*y%,r+r*y%)内的为正常数据,其余判定为异常值。

如果上述实时运维指标数据为趋势类别的运维指标数据,上述系统监控设备可以认定上述实时运维指标数据的期望值e(h(x))→0,方差s(h(x))→1为异常值。

s204:若上述实时运维指标数据存在异常,则进行异常告警。

这里,为了降低异常告警的误报率,本申请实施例在进行异常告警之前,设置审核环节。

示例性的,在上述进行异常告警之前,上述系统监控设备可以将上述实时运维指标数据中存在异常的数据发送至预设终端。该预设终端对上述存在异常的数据进行审核,在审核上述存在异常的数据确实存在异常后,发送审核通过信息至上述系统监控设备。上述系统监控设备在接收该审核通过信息后,进行异常告警,从而,降低异常告警的误报率。

本申请实施例,上述系统监控设备通过获取待监控系统的实时运维指标数据,并根据待监控系统的历史运维指标数据的指标类别,确定目标告警规则,这里,无需技术人员根据历史经验设定告警值,而是根据系统的历史运维指标数据的指标类别确定告警规则,其中,历史运维指标数据是在获取上述实时运维指标数据之前第一预设时间段内系统的运维指标数据,从而,使得上述目标告警规则与系统的运维指标数据相符合,进而,根据上述目标告警规则,判断上述实时运维指标数据是否存在异常,如果存在异常,则进行异常告警,提高了系统监控准确性。而且,在需要监控的系统的运维指标数据数量较多时,上述系统监控设备能够根据系统的历史运维指标数据的指标类别快速确定告警规则,缩短系统监控的周期,提高系统监控效率,适合应用。

其中,在上述图2所示实施例中,在上述根据所述待监控系统的历史运维指标数据的指标类别,确定目标告警规则之前,上述系统监控设备可以对上述历史运维指标数据进行时序分解,获得其趋势分量、周期分量和稳定分量,进而,计算历史运维指标数据分别与该趋势分量、周期分量和稳定分量的相似度,根据计算的相似度确定上述历史运维指标数据的指标类别。

这里,上述系统监控设备在对上述历史运维指标数据进行时序分解时,可以对上述历史运维指标数据进行去趋势化(detrending)处理,获得去趋势化序列,并对该去趋势化序列中的每个子序列进行局部加权回归处理,得到临时周期序列。进而,对上述临时周期序列进行低通滤波处理,获得低频时间序列,并根据该低频时间序列,对上述临时周期序列进行去趋势化处理,获得上述周期分量。然后,根据上述周期分量,对上述历史运维指标数据进行去周期化处理,并对去周期化处理后的历史运维指标数据,进行局部加权回归处理,得到上述趋势分量。最后,根据上述历史运维指标数据、周期分量和趋势分量,获得上述稳定分量。

示例性的,如图3所示,图3为本申请实施例提出的一种对历史运维指标数据进行时序分解的流程示意图。这里,上述系统监控设备通过对上述历史运维指标数据具体分析,可知上述历史运维指标数据为时序数据,且可近似为三大类,分别是具有明显波动周期的周期分量、变化趋势较平缓的趋势分量以及数据波动幅度不大的稳定分量。因此,上述系统监控设备考虑上述历史运维指标数据的时序分解,分解为趋势分量、周期分量和稳定分量,即yv=tv+sv+rv(v=1,...,n)。

图3所示,该方法包括:

s301:对上述历史运维指标数据yv进行去趋势化处理,获得去趋势化序列这里,初始化n(p)值为60。其中,n(p)为周期项周期观察点的数量,对于采集粒度为分钟的运维指标数据,原始序列长度为1440,则以小时为周期项观察的周期单位。

s302:对上述去趋势化序列中的每个子序列进行局部加权回归处理,即进行周期子序列平滑,对去趋势化的子序列应用邻近权重q=n(s)的局部加权回归平滑,得到临时周期序列其中,n(s)为周期项的平滑参数,决定了构成周期项数据的变化快慢,一般设定为默认值7。

s303:对上述临时周期序列进行低通滤波处理,即进行平滑周期子序列低通滤波,对临时周期序列应用低通滤波,分别进行长度为n(p)、n(p)和3的滑动平移,并应用q=n(l)的局部加权回归平滑,得低频时间序列其中,n(l)为低通滤波的平滑参数,设定为大于或等于n(p)的最小奇数,从而防止趋势分量和季节分量之间的竞争。

s304:根据上述低频时间序列,对上述临时周期序列进行去趋势化处理,即进行平滑周期子序列去趋势化,计算得周期分量减去低频时间序列,防止低频成分影响进入周期分量。

s305:根据上述周期分量,对上述历史运维指标数据进行去周期化处理,得到去周期化处理后的历史运维指标数据这里忽略原始序列缺少值。

s306:对去周期化处理后的历史运维指标数据,进行局部加权回归处理,即进行趋势平滑,去周期化处理后的历史运维指标数据应用q=n(t)的局部加权回归平滑,得到稳定长期的趋势分量其中,n(t)为趋势项的平滑参数,n(t)值越大,趋势分量越趋向平滑,一般n(t)设定为1.5n(p)-2n(p)中的最小奇数,从而保证迭代的稳健性,减小异常值的影响。

s307:根据上述历史运维指标数据、周期分量和趋势分量,获得上述稳定分量。这里,上述因此rv=yv-tv-sv。

这里,上述系统监控设备还判断上述周期分量和趋势分量是否收敛,如果上述周期分量和趋势分量收敛,则根据上述历史运维指标数据、周期分量和趋势分量,获得上述稳定分量,否则,重新执行上述s301。

其中,上述周期分量和趋势分量收敛可以理解为上述周期分量和趋势分量与上一次获得周期分量和趋势分量相同或基本相同。即上述系统监控设备在执行上述步骤s301-s306获得的上述周期分量和趋势分量,与上一次执行上述步骤s301-s306获得的上述周期分量和趋势分量相同或基本相同。这样,上述系统监控设备不仅能够获得较准确的周期分量和趋势分量,而且基于收敛的周期分量和趋势分量,获得上述稳定分量,使得获得的稳定分量更准确,进而,提高后续基于上述周期分量、趋势分量和稳定分量的处理结果的准确性。

这里,本申请通过步骤s301-s307获得上述历史运维指标数据的趋势分量、周期分量和稳定分量,进而,计算上述历史运维指标数据与其趋势分量、周期分量和稳定分量的相似度,基于计算的相似度,确定上述历史运维指标数据的指标类别,根据该指标类别,确定目标告警规则,并根据上述目标告警规则,判断上述实时运维指标数据是否存在异常,如果存在异常,则进行异常告警。其中,无需技术人员根据历史经验设定告警值,而是根据系统的历史运维指标数据的指标类别确定告警规则,从而,使得上述目标告警规则与系统的运维指标数据相符合,提高了后续系统监控准确性,而且,能够快速确定告警规则,缩短系统监控的周期,提高系统监控效率,适合应用。

另外,为了避免运维指标数据中的异常值导致较大的稳定分量rv,在上述根据上述历史运维指标数据、周期分量和趋势分量,获得上述稳定分量之后,上述系统监控设备还可以根据上述稳定分量,确定目标稳健权重,从而,在上述对上述去趋势化序列中的每个子序列进行局部加权回归处理,以及上述对去周期化处理后的历史运维指标数据进行局部加权回归处理时,考虑上述目标稳健权重。

示例性的,在上述获得上述稳定分量之后,上述系统监控设备还考虑调整邻近权重q,令h=6median(|rv|),得v时刻的目标稳健权重ρv为:

在上述步骤s302与步骤s306的局部加权回归中将邻近权重q与稳健权重ρv相乘,以避免离群点对回归的影响。其中,b函数为bisquare函数,数学表达式如下:

这里,为了更好的理解运维指标数据与其周期分量、趋势分量和稳定分量之间的关系,图4a示出一运维指标数据与其周期分量、趋势分量和稳定分量的示意图,图4b示出另一运维指标数据与其周期分量、趋势分量和稳定分量的示意图。其中,两个图中的横坐标表示时间,纵坐标表示大小。

从图4a和4b可知,运维指标数据与其周期分量、趋势分量和稳定分量的相似度各不相同,为了进一步确定运维指标数据与其周期分量、趋势分量和稳定分量的相似度,从而,基于确定的相似度确定运维指标数据的指标类别,上述系统监控设备可以计算运维指标数据与其趋势分量的第一相似度,运维指标数据与其周期分量的第二相似度,以及运维指标数据与其稳定分量的第三相似度。

这里,以上述系统监控设备计算运维指标数据与其趋势分量的第一相似度为例,上述系统监控设备可以根据运维指标数据与其趋势分量,构建第一待处理矩阵,然后搜索该第一待处理矩阵中第一个矩阵点到最后一个矩阵点的所有规整路径,从而,在所有规整路径中,获得规整代价最小的路径,并根据上述规整代价最小的路径,确定运维指标数据与其趋势分量的第一相似度。

示例性的,假如运维指标数据与其趋势分量表示为时间序列q={q1,q2,...qn},c={c1,c2,...cm},长度分别为n与m,上述系统监控设备计算运维指标数据与其趋势分量的第一相似度的过程包括:

(1)构建大小为n×m的第一待处理矩阵d,矩阵元素dij=dist(qi,cj),其中dist为距离计算函数,这里可以采用欧式距离。

(2)可以采用动态规划搜索方法,在矩阵d中搜索从第一个矩阵点d1到最后一个矩阵点dnm的所有规整路径(warpingpath)。用w来表示各条规整路径,路径通过的所有矩阵点序列标号依次为{(1,1),(1,2),(i,j),......,......,(n,m)}。w的第k个元素定义为wk=(i,j)k,其反映了序列q和c映射,得w=w1,w2,....,wk(max(m,n)≤k<m+n+1)。

其中,在路径搜索过程中,需满足以下约束条件:

①边界条件:w1=(1,1),wk=(n,m),对于时间序列,应保证各部分要素的先后顺序不发生改变,搜索得出的路径需从矩阵的左下角出发,在右上角结束。

②连续性:若wk-1=(a1,b1),对于搜索路径的下一矩阵点wk=(a2,b2),需满足(a2-a1)≤1和(b2-b1)≤1,保证路径w中的每个点只能与相邻的点进行匹配。

③单调性:若wk-1=(a1,b1),对于搜索路径的下一矩阵点wk=(a2,b2),需满足(a2-a1)≥0和(b2-b1)≥0,保证路径w中的每个点随时间单调移动。

对于路径已存在的矩阵点(i,j),根据上述单调性及连续性可知其搜索路径中通过的下一个矩阵点只能为下列三种情况之一:(i+1,j)、(i+1,j+1)、(i,j+1)。

(3)在上述所有规整路径中,获得规整代价最小的路径。例如通过公式

求得规整代价最小的路径,其中分母中的k主要是用来对不同的长度的规整路径做补偿。

(4)根据上述规整代价最小的路径,确定上述运维指标数据与其趋势分量的第一相似度。示例性的,对矩阵d中从d11到dnm的规整代价最小的路径计算累积距离γ,即得出dtw(q,c)的最优解,可作为序列q和c的相似度。

其中,累积距离γ(i,j)为点qi和cj的欧式距离(dist(qi,cj))与可到达该点的最小累积距离之和。由上述对于路径已存在的矩阵点(i,j),其搜索路径中通过的下一个矩阵点只能为下列三种情况之一:(i+1,j)、(i+1,j+1)、(i,j+1)可得累积距离γ(i,j)具体计算公式为:

γ(i,j)=dist(qi,cj)+min{γ(i-1,j),γ(i-1,j-1),γ(i,j-1)}

同理,类似上述计算运维指标数据与其趋势分量的第一相似度的过程,上述系统监控设备计算运维指标数据与其周期分量的第二相似度,可以包括:根据运维指标数据与其周期分量,构建第二待处理矩阵,然后搜索该第二待处理矩阵中第一个矩阵点到最后一个矩阵点的所有规整路径,从而,在所有规整路径中,获得规整代价最小的路径,并根据上述规整代价最小的路径,确定运维指标数据与其周期分量的第二相似度。

上述系统监控设备计算运维指标数据与其稳定分量的第三相似度,可以包括:根据运维指标数据与其周期分量,构建第三待处理矩阵,然后搜索该第三待处理矩阵中第一个矩阵点到最后一个矩阵点的所有规整路径,从而,在所有规整路径中,获得规整代价最小的路径,并根据上述规整代价最小的路径,确定运维指标数据与其稳定分量的第三相似度。

在上述计算运维指标数据与其趋势分量的第一相似度,运维指标数据与其周期分量的第二相似度,以及运维指标数据与其稳定分量的第三相似度后,上述系统监控设备可以确定运维指标数据的指标类别。

示例性的,上述系统监控设备可以将上述第一相似度、第二相似度和第三相似度进行比较。如果比较第一相似度为最大值,则确定运维指标数据的指标类别为趋势类别。如果比较第二相似度为最大值,则确定运维指标数据的指标类别为周期类别。如果比较第三相似度为最大值,则确定运维指标数据的指标类别为稳定类别。例如,如图4a所示,运维指标数据与其趋势分量的相似度为最大值,其指标类别为趋势类别。如图4b所示,运维指标数据与其周期分量的相似度为最大值,其指标类别为周期指标类别。

可选地,在图1所示系统监控设备基础上,上述系统监控设备中可以包括离线模块和实时模块。示例性的,如图5所示,上述实时模块可以用于获取待监控系统的实时运维指标数据。上述离线模块可以用于根据上述待监控系统的历史运维指标数据的指标类别,确定目标告警规则。其中,上述离线模块可以对上述历史运维指标数据进行时序分解,获得上述历史运维指标数据的趋势分量、周期分量和稳定分量,进而,计算上述历史运维指标数据与趋势分量的第一相似度,上述历史运维指标数据与周期分量的第二相似度,以及上述历史运维指标数据与稳定分量的第三相似度,从而,根据上述第一相似度、第二相似度和第三相似度,确定上述历史运维指标数据的指标类别。

这里,上述离线模块对所述历史运维指标数据进行时序分解,获得上述历史运维指标数据的趋势分量、周期分量和稳定分量,计算上述历史运维指标数据与趋势分量、周期分量和稳定分量的相似度,以及基于计算的相似度,确定上述历史运维指标数据的指标类别的具体过程参照上述描述,在此不再赘述。

另外,上述离线模块可以获取预存的运维指标数据的指标类别与告警规则的对应关系,从而,根据该对应关系,确定上述历史运维指标数据的指标类别对应的目标告警规则。其中,对于趋势类别的运维指标数据对应的告警规则,对于周期类别的运维指标数据对应的告警规则,还有对于稳定类别的运维指标数据对应的告警规则的具体描述参照上述,在此不再赘述。

上述实时模块还可以将上述实时运维指标数据中存在异常的数据发送至预设终端,预设终端对上述存在异常的数据进行审核,在审核上述存在异常的数据确实存在异常后,发送审核通过信息至上述实时模块。上述实时模块在接收该审核通过信息后,进行异常告警。

本申请实施例,上述实时模块获取待监控系统的实时运维指标数据,上述离线模块根据待监控系统的历史运维指标数据的指标类别,确定目标告警规则,这里,无需技术人员根据历史经验设定告警值,而是根据系统的历史运维指标数据的指标类别确定告警规则,其中,历史运维指标数据是在获取上述实时运维指标数据之前第一预设时间段内系统的运维指标数据,从而,使得上述目标告警规则与系统的运维指标数据相符合,进而,上述实时模块根据上述目标告警规则,判断上述实时运维指标数据是否存在异常,如果存在异常,则进行异常告警,提高了系统监控准确性。而且,在需要监控的系统的运维指标数据数量较多时,能够根据系统的历史运维指标数据的指标类别快速确定告警规则,缩短系统监控的周期,提高系统监控效率,适合应用。

对应于上文实施例的系统监控方法,图6为本申请实施例提供的系统监控装置的结构示意图。为了便于说明,仅示出了与本申请实施例相关的部分。图6为本申请实施例提供的一种系统监控装置的结构示意图,该系统监控装置60包括:获取模块601、确定模块602、判断模块603以及告警模块604。这里的系统监控装置可以是上述系统监控设备本身,或者是实现系统监控设备的功能的芯片或者集成电路。这里需要说明的是,获取模块、确定模块、判断模块以及告警模块的划分只是一种逻辑功能的划分,物理上两者可以是集成的,也可以是独立的。

其中,获取模块601,用于获取待监控系统的实时运维指标数据。

确定模块602,用于根据所述待监控系统的历史运维指标数据的指标类别,确定目标告警规则,其中,所述历史运维指标数据是在获取所述实时运维指标数据之前第一预设时间段内所述待监控系统的运维指标数据。

判断模块603,用于根据所述目标告警规则,判断所述实时运维指标数据是否存在异常。

告警模块604,用于若所述实时运维指标数据存在异常,则进行异常告警。

在一种可能的实现方式中,所述确定模块602,还用于:

对所述历史运维指标数据进行时序分解,获得所述历史运维指标数据的趋势分量、周期分量和稳定分量;

计算所述历史运维指标数据与所述趋势分量的第一相似度,所述历史运维指标数据与所述周期分量的第二相似度,以及所述历史运维指标数据与所述稳定分量的第三相似度;

根据所述第一相似度、所述第二相似度和所述第三相似度,确定所述历史运维指标数据的指标类别。

在一种可能的实现方式中,所述确定模块602,具体用于:

对所述历史运维指标数据进行去趋势化处理,获得去趋势化序列,并对所述去趋势化序列中的每个子序列进行局部加权回归处理,得到临时周期序列;

对所述临时周期序列进行低通滤波处理,获得低频时间序列,并根据所述低频时间序列,对所述临时周期序列进行去趋势化处理,获得所述周期分量;

根据所述周期分量,对所述历史运维指标数据进行去周期化处理,并对去周期化处理后的历史运维指标数据,进行局部加权回归处理,得到所述趋势分量;

根据所述历史运维指标数据、所述周期分量和所述趋势分量,获得所述稳定分量。

在一种可能的实现方式中,所述确定模块602,具体用于:

判断所述周期分量和所述趋势分量是否收敛;

若所述周期分量和所述趋势分量收敛,则执行所述根据所述历史运维指标数据、所述周期分量和所述趋势分量,获得所述稳定分量的步骤。

在一种可能的实现方式中,所述确定模块602,还用于:

根据所述稳定分量,确定目标稳健权重;

根据所述目标稳健权重,对所述去趋势化序列中的每个子序列进行局部加权回归处理,并根据所述目标稳健权重,对去周期化处理后的历史运维指标数据进行局部加权回归处理。

在一种可能的实现方式中,所述确定模块602,具体用于:

根据所述历史运维指标数据与所述趋势分量,构建第一待处理矩阵;

搜索所述第一待处理矩阵中第一个矩阵点到最后一个矩阵点的所有规整路径;

在所述所有规整路径中,获得规整代价最小的路径;

根据所述规整代价最小的路径,确定所述历史运维指标数据与所述趋势分量的所述第一相似度。

在一种可能的实现方式中,所述确定模块602,具体用于:

将所述第一相似度、所述第二相似度和所述第三相似度进行比较;

若比较所述第一相似度为最大值,则确定所述历史运维指标数据的指标类别为趋势类别;

若比较所述第二相似度为最大值,则确定所述历史运维指标数据的指标类别为周期类别;

若比较所述第三相似度为最大值,则确定所述历史运维指标数据的指标类别为稳定类别。

在一种可能的实现方式中,所述确定模块602,具体用于:

获取预存的运维指标数据的指标类别与告警规则的对应关系;

根据所述对应关系,确定所述历史运维指标数据的指标类别对应的目标告警规则。

在一种可能的实现方式中,所述确定模块602,具体用于:

对于稳定类别的运维指标数据,获得所述稳定类别的运维指标数据的稳定分量以及标准差;

根据所述稳定分量和所述标准差,获得所述稳定类别的运维指标数据对应的告警规则。

在一种可能的实现方式中,所述确定模块602,具体用于:

对于周期类别的运维指标数据,以第二预设时间段为一周期,将所述周期类别的运维指标数据与历史周期类别的运维指标数据进行对比,确定数据增长率,其中,所述历史周期类别的运维指标数据是在获取所述周期类别的运维指标数据之前的周期获取的;

根据预设lstm和所述历史周期类别的运维指标数据的均方误差,确定所述周期类别的运维指标数据的预测值;

根据所述数据增长率和所述预测值,获得所述周期类别的运维指标数据对应的告警规则。

在一种可能的实现方式中,所述确定模块602,具体用于:

对于趋势类别的运维指标数据,将所述趋势类别的运维指标数据与历史趋势类别的运维指标数据进行对比,确定环比增长率,其中,所述历史趋势类别的运维指标数据是在获取所述趋势类别的运维指标数据之前获取的;

根据所述历史趋势类别的运维指标数据,确定二叉搜索树,并根据所述二叉搜索树确定所述趋势类别的运维指标数据的各路径长度;

根据所述环比增长率和所述各路径长度,获得所述趋势类别的运维指标数据对应的告警规则。

在一种可能的实现方式中,所述告警模块604,具体用于:

将所述实时运维指标数据中存在异常的数据发送至预设终端,所述存在异常的数据用于指示所述预设终端对所述存在异常的数据进行审核;

若接收到所述预设终端发送的审核通过信息,则进行异常告警。

本申请实施例提供的装置,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,本申请实施例此处不再赘述。

可选地,图7示意性地提供本申请所述系统监控设备的一种可能的基本硬件架构。

参见图7,系统监控设备700包括至少一个处理器701以及通信接口703。进一步可选的,还可以包括存储器702和总线704。

其中,系统监控设备700可以是上述处理装置,本申请对此不作特别限制。系统监控设备700中,处理器701的数量可以是一个或多个,图7仅示意了其中一个处理器701。可选地,处理器701,可以是cpu、图形处理器(graphicsprocessingunit,gpu)或者数字信号处理(digitalsignalprocess,dsp)。如果系统监控设备700具有多个处理器701,多个处理器701的类型可以不同,或者可以相同。可选地,系统监控设备700的多个处理器701还可以集成为多核处理器。

存储器702存储计算机指令和数据;存储器702可以存储实现本申请提供的上述系统监控方法所需的计算机指令和数据,例如,存储器702存储用于实现上述系统监控方法的步骤的指令。存储器702可以是以下存储介质的任一种或任一种组合:非易失性存储器(例如只读存储器(rom)、固态硬盘(ssd)、硬盘(hdd)、光盘),易失性存储器。

通信接口703可以为所述至少一个处理器提供信息输入/输出。也可以包括以下器件的任一种或任一种组合:网络接口(例如以太网接口)、无线网卡等具有网络接入功能的器件。

可选的,通信接口703还可以用于系统监控设备700与其它计算设备或者终端进行数据通信。

进一步可选的,图7用一条粗线表示总线704。总线704可以将处理器701与存储器702和通信接口703连接。这样,通过总线704,处理器701可以访问存储器702,还可以利用通信接口703与其它计算设备或者终端进行数据交互。

在本申请中,系统监控设备700执行存储器702中的计算机指令,使得系统监控设备700实现本申请提供的上述系统监控方法,或者使得系统监控设备700部署上述的系统监控装置。

从逻辑功能划分来看,示例性的,如图7所示,存储器702中可以包括获取模块601、确定模块602、判断模块603以及告警模块604。这里的包括仅仅涉及存储器中所存储的指令被执行时可以分别实现获取模块、确定模块、判断模块以及告警模块的功能,而不限定是物理上的结构。

另外,上述的系统监控设备除了可以像上述图7通过软件实现外,也可以作为硬件模块,或者作为电路单元,通过硬件实现。

本申请提供一种计算机可读存储介质,所述计算机程序产品包括计算机指令,所述计算机指令指示计算设备执行本申请提供的上述系统监控方法。

本申请提供一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行本申请提供的上述系统监控方法。

本申请提供一种芯片,包括至少一个处理器和通信接口,所述通信接口为所述至少一个处理器提供信息输入和/或输出。进一步,所述芯片还可以包含至少一个存储器,所述存储器用于存储计算机指令。所述至少一个处理器用于调用并运行该计算机指令,以执行本申请提供的上述系统监控方法。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1