智能告警分析方法、装置、设备及存储介质与流程

文档序号:27976736发布日期:2021-12-15 00:50阅读:90来源:国知局
智能告警分析方法、装置、设备及存储介质与流程

1.本发明涉及人工智能领域,尤其涉及一种智能告警分析方法、装置、设备及存储介质。


背景技术:

2.随着大数据、区块链、云计算的高速发展,利用大数据算法可以推动许多行业的发展,但是在推动行业发展的同时就会面临技术不成熟带来的一系列应用故障,程序故障,网络故障问题,这就使得在网络结构中会产生大量的告警信息,需要对这些告警信息进行分析,得到故障根源信息,根据故障根源信息定位故障所在。
3.然而目前排除故障的方法依旧依赖于经验和人工排除来解决故障,并且因实际的业务系统会因版本变更、业务调整、节假日等特殊情况导致实际情况与历史趋势偏差很大导致告警误判,造成运维人员不必要的工作负担。此外,在大量的告警中,如何将关联性告警进行收敛,对告警进行智能根因分析也是一项挑战,如何快速、准确的找到并解决应用故障,程序故障,网络故障问题急需解决。


技术实现要素:

4.本发明的主要目的在于解决告警分析时效率较低的技术问题。
5.本发明第一方面提供了一种智能告警分析方法,包括:获取历史时序监控数据,并通过预设的比例系数对所述历史时序监控数据进行数据划分,得到模型构建数据集及区间预测数据集;基于蜂群算法,将所述模型构建数据集输入预置的自回归积分滑动平均模型进行模型训练,得到对应的时间序列预测模型;将所述区间预测数据集及预设数据动态权重输入所述时间序列预测模型进行告警区间预测,确定对应的告警预测区间序列;获取实时时序监控数据,并根据置信区间算法对所述实时时序监控数据进行分布区间计算,得到对应的数据分布区间序列,并通过所述告警预测区间序列对所述数据分布区间序列进行告警判断,若满足预设告警触发条件,则确定对应的告警信息;对所述告警信息进行特征提取处理,得到所述告警信息对应的告警特征信息;通过预置根因告警规则库及所述告警特征信息对所述告警信息进行根因分析,得到根因告警信息。
6.可选的,在本发明第一方面的第一种实现方式中,所述基于蜂群算法,将所述模型构建数据集输入预置的自回归积分滑动平均模型进行模型训练,得到对应的时间序列预测模型包括:将所述模型构建数据输入预置的自回归积分滑动平均模型,并对所述模型构建数据集进行基于时间单位的扫描,确定所述模型构建数据集中时序监控数据在每一时间单位的最大值和最小值,并生成对应的最大值序列和最小值序列;通过所述蜂群算法、所述最大值序列及所述最小值序列对所述预置的自回归积分滑动平均模型进行训练迭代,得到对应的时间序列预测模型。
7.可选的,在本发明第一方面的第二种实现方式中,所述将所述区间预测数据集及预设数据动态权重输入所述时间序列预测模型进行告警区间预测,确定对应的告警预测区
间序列包括:将所述区间预测数据集及预设数据动态权重输入所述时间序列预测模型进行最值序列预测,确定对应的最大值预测序列和最小值预测序列;通过所述区间预测数据集的初始告警阈值、所述最大值预测序列及所述最小值预测序列进行告警区间分析,确定对应的预测告警区间序列,所述预测告警区间序列包括告警上限序列和告警下限序列。
8.可选的,在本发明第一方面的第三种实现方式中,所述通过所述区间预测数据集的初始告警阈值、所述最大值预测序列及所述最小值预测序列进行告警区间分析,确定对应的预测告警区间序列包括:对所述最大值预测序列和所述最小值预测序列进行变换调整,得到对应的目标最大值预测序列和目标最小值预测序列;通过所述初始告警阈值、所述目标最大值预测序列及所述目标最小值预测序列进行告警区间计算,得到对应的预测告警区间序列。
9.可选的,在本发明第一方面的第四种实现方式中,在所述对所述告警信息进行特征提取处理,得到所述告警信息对应的告警特征信息之后,在所述通过预置根因告警规则库及所述告警特征信息对所述告警信息进行根因分析,得到根因告警信息之前,还包括:获取多个历史告警信息,并分别对所述多个历史告警信息进行编码处理,生成多个告警信息编码向量;分别将所述多个告警信息编码向量输入预置根故障分析模型进行根因分析,得到多个根故障信息;根据所述多个历史告警信息与所述多个根故障信息,生成根因告警规则库。
10.可选的,在本发明第一方面的第五种实现方式中,所述获取多个历史告警信息,并分别对所述多个历史告警信息进行编码处理,生成多个告警信息编码向量包括:读取所述多个历史告警信息并对所述多个历史告警信息进行属性提取,得到多个属性信息数据;将所述多个属性信息数据进行数据清洗,得到多个标准属性信息数据;将所述多个标准属性信息数据进行数据聚合,得到多个数据标量值;将所述多个数据标量值进行独热编码向量转换,生成多个告警信息编码向量。
11.可选的,在本发明第一方面的第六种实现方式中,所述分别将所述多个告警信息编码向量输入预置根故障分析模型进行根因分析,得到多个根故障信息包括:将所述多个告警信息编码向量输入预置根故障分析模型进行数据分析,得到多个数值化数据;通过所述多个数值化数据对所述多个历史告警信息进行关联度判断,得到多个特征数据;调用预置根因分析函数对所述多个特征数据进行根因分析,得到多个根故障信息。
12.本发明第二方面提供了一种智能告警分析装置,包括:数据获取模块,用于获取历史时序监控数据,并通过预设的比例系数对所述历史时序监控数据进行数据划分,得到模型构建数据集及区间预测数据集;模型构建模块,用于基于蜂群算法,将所述模型构建数据集输入预置的自回归积分滑动平均模型进行模型训练,得到对应的时间序列预测模型;区间预测模块,用于将所述区间预测数据集及预设数据动态权重输入所述时间序列预测模型进行告警区间预测,确定对应的告警预测区间序列;区间计算模块,用于获取实时时序监控数据,并根据置信区间算法对所述实时时序监控数据进行分布区间计算,得到对应的数据分布区间序列,并通过所述告警预测区间序列对所述数据分布区间序列进行告警判断,若满足预设告警触发条件,则确定对应的告警信息;特征提取模块,用于对所述告警信息进行特征提取处理,得到所述告警信息对应的告警特征信息;第一分析模块,用于通过预置根因告警规则库及所述告警特征信息对所述告警信息进行根因分析,得到根因告警信息。
13.可选的,在本发明第二方面的第一种实现方式中,所述模型构建模块具体用于:将所述模型构建数据输入预置的自回归积分滑动平均模型,并对所述模型构建数据集进行基于时间单位的扫描,确定所述模型构建数据集中时序监控数据在每一时间单位的最大值和最小值,并生成对应的最大值序列和最小值序列;通过所述蜂群算法、所述最大值序列及所述最小值序列对所述预置的自回归积分滑动平均模型进行训练迭代,得到对应的时间序列预测模型。
14.可选的,在本发明第二方面的第二种实现方式中,所述区间预测模块还包括:预测单元,用于将所述区间预测数据集及预设数据动态权重输入所述时间序列预测模型进行最值序列预测,确定对应的最大值预测序列和最小值预测序列;分析单元,用于通过所述区间预测数据集的初始告警阈值、所述最大值预测序列及所述最小值预测序列进行告警区间分析,确定对应的预测告警区间序列,所述预测告警区间序列包括告警上限序列和告警下限序列。
15.可选的,在本发明第二方面的第三种实现方式中,所述分析单元具体用于:对所述最大值预测序列和所述最小值预测序列进行变换调整,得到对应的目标最大值预测序列和目标最小值预测序列;通过所述初始告警阈值、所述目标最大值预测序列及所述目标最小值预测序列进行告警区间计算,得到对应的预测告警区间序列。
16.可选的,在本发明第二方面的第四种实现方式中,所述智能告警分析装置还包括:编码处理模块,用于获取多个历史告警信息,并分别对所述多个历史告警信息进行编码处理,生成多个告警信息编码向量;第二分析模块,用于分别将所述多个告警信息编码向量输入预置根故障分析模型进行根因分析,得到多个根故障信息;规则生成模块,用于根据所述多个历史告警信息与所述多个根故障信息,生成根因告警规则库。
17.可选的,在本发明第二方面的第五种实现方式中,所述编码处理模块具体用于:读取所述多个历史告警信息并对所述多个历史告警信息进行属性提取,得到多个属性信息数据;将所述多个属性信息数据进行数据清洗,得到多个标准属性信息数据;将所述多个标准属性信息数据进行数据聚合,得到多个数据标量值;将所述多个数据标量值进行独热编码向量转换,生成多个告警信息编码向量。
18.可选的,在本发明第二方面的第六种实现方式中,所述第二分析模块具体用于:将所述多个告警信息编码向量输入预置根故障分析模型进行数据分析,得到多个数值化数据;通过所述多个数值化数据对所述多个历史告警信息进行关联度判断,得到多个特征数据;调用预置根因分析函数对所述多个特征数据进行根因分析,得到多个根故障信息。
19.本发明第三方面提供了一种智能告警分析设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述智能告警分析设备执行上述的智能告警分析方法。
20.本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的智能告警分析方法。
21.本发明提供的技术方案中,获取历史时序监控数据,并通过预设的比例系数对所述历史时序监控数据进行数据划分,得到模型构建数据集及区间预测数据集;基于蜂群算法,将所述模型构建数据集输入预置的自回归积分滑动平均模型进行模型训练,得到对应的时间序列预测模型;将所述区间预测数据集及预设数据动态权重输入所述时间序列预测
模型进行告警区间预测,确定对应的告警预测区间序列;获取实时时序监控数据,并根据置信区间算法对所述实时时序监控数据进行分布区间计算,得到对应的数据分布区间序列,并通过所述告警预测区间序列对所述数据分布区间序列进行告警判断,若满足预设告警触发条件,则确定对应的告警信息;对所述告警信息进行特征提取处理,得到所述告警信息对应的告警特征信息;通过预置根因告警规则库及所述告警特征信息对所述告警信息进行根因分析,得到根因告警信息。本发明实施例中,服务器将该区间预测数据集输入时间序列预测模型进行告警区间预测,确定相应的预测告警区间序列,本发明实施例中,采用动态数据权重的方式与现有的静态阈值告警功能相比,弥补了静态阈值场景能力、配置门槛和维护成本上的不足,通过对所述告警信息依次进行数据属性的提取,数据清洗,数据聚合和数据转换为独热向量编码操作,对告警信息进行过滤、筛选、匹配、分类等操作得到根源或衍生告警信息,通过对告警信息的特征提取处理可以过滤掉原始告警信息中的冗杂信息只留下根源和衍生告警信息,得到该告警信息对应的告警特征信息,可以提升告警分析过程的效率。
附图说明
22.图1为本发明实施例中智能告警分析方法的一个实施例示意图;
23.图2为本发明实施例中智能告警分析方法的另一个实施例示意图;
24.图3为本发明实施例中智能告警分析装置的一个实施例示意图;
25.图4为本发明实施例中智能告警分析装置的另一个实施例示意图;
26.图5为本发明实施例中智能告警分析设备的一个实施例示意图。
具体实施方式
27.本发明实施例提供了一种智能告警分析方法、装置、设备及存储介质。本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
28.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
29.为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中智能告警分析方法的一个实施例包括:
30.101、获取历史时序监控数据,并通过预设的比例系数对历史时序监控数据进行数据划分,得到模型构建数据集及区间预测数据集;
31.可以理解的是,本发明的执行主体可以为智能告警分析装置,还可以是服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
32.需要说明的是,该比例系数是用于将历史时序监控数据按照7:3的比例划分为模型构建数据集和区间预测数据集,具体的,服务器获取在过去m个时间单位下存储粒度为分钟或小时的时序监控数据,其中,m为正整数,时间单位可根据实际情况设定为日、周、月或者季度,本发明实施例以周为时间单位进行说明,服务器在获取历史时序监控数据后按照预设的比例系数对历史时序数据进行数据划分,得到模型构建数据集及区间预测数据集,该模型构建数据集主要用于模型训练及测试验证,区间预测数据集主要用于后续对告警区间序列的预测,需要强调的是,为进一步保证上述历史时序监控数据的私密和安全性,上述历史时序监控数据还可以存储于一区块链的节点中。
33.102、基于蜂群算法,将模型构建数据集输入预置的自回归积分滑动平均模型进行模型训练,得到对应的时间序列预测模型;
34.需要说明的是,该蜂群算法用于初始化蜂群种群及其参数,确定问题搜索范围,并在搜索范围内随机产生初始解,进而计算并评估每个初始解的适应度,最终设定循环终止条件,启动训练数据进行循环,在完成循环后,得到最终训练好的时间序列预测模型。本发明实施例中,该模型构建数据集是指学习样本数据集,通过蜂群算法匹配一些参数来建立分类器,将模型构建数据集输入预置的自回归积分滑动平均模型并通过建立一种分类的方式来训练模型,服务器对模型构建数据集进行基于时间单位的扫描,确定对应的最大值序列和最小值序列,进而基于蜂群算法,并通过该最大值序列及最小值序列构建时间序列预测模型。
35.103、将区间预测数据集及预设数据动态权重输入时间序列预测模型进行告警区间预测,确定对应的告警预测区间序列;
36.需要说明的是,该预设数据动态权重是指在各种监控和运维场景中的时间序列对应的权重,服务器将该区间预测数据集输入时间序列预测模型进行告警区间预测,确定相应的预测告警区间序列。
37.104、获取实时时序监控数据,并根据置信区间算法对实时时序监控数据进行分布区间计算,得到对应的数据分布区间序列,并通过告警预测区间序列对数据分布区间序列进行告警判断,若满足预设告警触发条件,则确定对应的告警信息;
38.需要说明的是,该置信区间算法是指通过对数据进行标准差及算术平均值的计算,进而确定置信区间的方法,具体的,服务器对该实时时序监控数据进行标准差计算,该标准差为方差的算术平方根,反映组内个体间的离散程度。假设有一组数x,x,x,......xn(皆为实数),其平均值(算术平均值)为μ,则标准公式为:
[0039][0040]
其中,n代表有n个时序监控数据,且n为正整数,通过对该时序监控数据进行标准差计算,并统计该时序监控数据的平均值、标准差,并计算95%概率的置信区间,将该置信
区间作为该数据分布区间序列,并将该数据分布区间序列与该预测告警区间序列进行对比,若该数据分布区间序列在该预测告警区间序列内,则不触发告警条件,若该预测告警区间序列不完全包含该数据分布区间序列,则触发告警条件,并确定对应的告警信息。
[0041]
105、对告警信息进行特征提取处理,得到告警信息对应的告警特征信息;
[0042]
具体的,服务器对告警信息中的关键信息进行分析处理,通过对告警信息依次进行数据属性的提取,数据清洗,数据聚合和数据转换为独热向量编码操作,对告警信息进行过滤、筛选、匹配、分类等操作得到根源或衍生告警信息,通过对告警信息的预处理可以过滤掉原始告警信息中的冗杂信息只留下根源和衍生告警信息,得到该告警信息对应的告警特征信息。
[0043]
106、通过预置根因告警规则库及告警特征信息对告警信息进行根因分析,得到根因告警信息。
[0044]
具体的,服务器通过获取多个历史告警信息,并分别对各历史告警信息进行预处理,预处理包括特征属性提取、数据清洗、数据聚合,将告警信息经过预处理可以有效提取出告警信息中的特征信息,并将特征信息转换为模型可以识别的向量,可以有效的对告警信息进行过滤、筛选、匹配、分类等操作得到根源或衍生告警信息,服务器通过对该告警信息进行根因分析,确定与告警特征信息相对应的根因告警信息并输出。
[0045]
本发明实施例中,服务器将该区间预测数据集输入时间序列预测模型进行告警区间预测,确定相应的预测告警区间序列,本发明实施例中,采用动态数据权重的方式与现有的静态阈值告警功能相比,弥补了静态阈值场景能力、配置门槛和维护成本上的不足,通过对告警信息依次进行数据属性的提取,数据清洗,数据聚合和数据转换为独热向量编码操作,对告警信息进行过滤、筛选、匹配、分类等操作得到根源或衍生告警信息,通过对告警信息的预处理可以过滤掉原始告警信息中的冗杂信息只留下根源和衍生告警信息,得到该告警信息对应的告警特征信息,可以提升告警分析过程的效率。
[0046]
请参阅图2,本发明实施例中智能告警分析方法的另一个实施例包括:
[0047]
201、获取历史时序监控数据,并通过预设的比例系数对历史时序监控数据进行数据划分,得到模型构建数据集及区间预测数据集;
[0048]
具体的,在本实施例中,步骤201的具体实施方式与上述步骤101类似,此处不再赘述。
[0049]
202、基于蜂群算法,将模型构建数据集输入预置的自回归积分滑动平均模型进行模型训练,得到对应的时间序列预测模型;
[0050]
具体的,服务器将模型构建数据输入预置的自回归积分滑动平均模型,并对模型构建数据集进行基于时间单位的扫描,确定模型构建数据集中时序监控数据在每一时间单位的最大值和最小值,并生成对应的最大值序列和最小值序列;服务器通过蜂群算法、最大值序列及最小值序列对预置的自回归积分滑动平均模型进行训练迭代,得到对应的时间序列预测模型。
[0051]
其中,服务器对该最大值序列和该最小值序列进行平稳性判别,根据判别结果,对最大值序列和最小值序列采用自回归积分滑动平均模型(autoregressive integrated moving average model,arima)进行建模分析,服务器对该最大值序列和该最小值序列的arima模型进行参数估计与优化,以确定模型中未知参数的值,对最大值序列和最小值序列
的arima模型进行参数估计是指服务器采用最大值序列和最小值序列的自相关函数图和偏相关函数图对最大值序列和最小值序列的arima模型进行参数估计,服务器进而对参数估计和优化后的最大值序列和最小值序列的arima模型的标准化残差进行白噪声检验和正态分布检验,当标准化残差为正态分布的白噪声序列时,得到对应的时间序列预测模型。
[0052]
203、将区间预测数据集及预设数据动态权重输入时间序列预测模型进行告警区间预测,确定对应的告警预测区间序列;
[0053]
具体的,服务器将区间预测数据集及预设数据动态权重输入时间序列预测模型进行最值序列预测,确定对应的最大值预测序列和最小值预测序列;服务器通过区间预测数据集的初始告警阈值、最大值预测序列及最小值预测序列进行告警区间分析,确定对应的预测告警区间序列,预测告警区间序列包括告警上限序列和告警下限序列。
[0054]
需要说明的是,服务器将该区间预测数据集及该预设动态数据权重输入该时间序列模型预测监控指标在未来q个时间单位的变化情况,得到最大值预测序列s1={y|n=t+1,t+2,

,t+q}和最小值预测序列s2={x|n=t+1,t+2,

,t+q},并根据该最大值预测序列及该最小值预测序列确定相应的预测告警区间序列。
[0055]
可选的,通过区间预测数据集的初始告警阈值、最大值预测序列及最小值预测序列进行告警区间分析,确定对应的预测告警区间序列可以包括:服务器对最大值预测序列和最小值预测序列进行变换调整,得到对应的目标最大值预测序列和目标最小值预测序列;服务器通过初始告警阈值、目标最大值预测序列及目标最小值预测序列进行告警区间计算,得到对应的预测告警区间序列。
[0056]
需要说明的是,该变换调整的方式包括线性变换或利用置信区间的上下限值,本发明实施例中,服务器对该最大值最大值预测序列和最小值预测序列进行线性变换处理,得到变换后的序列s3和s4,具体如下:s3={y’=0.5[(y+x)+α(y

x)]|n=t+1,t+2,

,t+q,α>0},s4={x’=0.5[(y+x)

α(y

x)]|n=t+1,t+2,

,t+q,α>0},其中α为变换因子,α小于1表示需对监控指标的边界进行严格控制,α大于1表示可对监控指标的边界进行宽松控制,该初始告警阈值是指通过区间预测数据集确定的相应的告警阈值,最后服务器根据目标最大、小值预测序列及该初始告警阈值确定对应的预测告警区间序列。
[0057]
204、获取实时时序监控数据,并根据置信区间算法对实时时序监控数据进行分布区间计算,得到对应的数据分布区间序列,并通过告警预测区间序列对数据分布区间序列进行告警判断,若满足预设告警触发条件,则确定对应的告警信息;
[0058]
具体的,在本实施例中,步骤204的具体实施方式与上述步骤104类似,此处不再赘述。
[0059]
205、对告警信息进行特征提取处理,得到告警信息对应的告警特征信息;
[0060]
具体的,在本实施例中,步骤205的具体实施方式与上述步骤105类似,此处不再赘述。
[0061]
206、获取多个历史告警信息,并分别对多个历史告警信息进行编码处理,生成多个告警信息编码向量;
[0062]
具体的,服务器读取多个历史告警信息并对多个历史告警信息进行属性提取,得到多个属性信息数据;服务器将多个属性信息数据进行数据清洗,得到多个标准属性信息数据;服务器将多个标准属性信息数据进行数据聚合,得到多个数据标量值;服务器将多个
数据标量值进行独热编码向量转换,生成多个告警信息编码向量。
[0063]
其中,服务器获取多个历史告警信息,将多个历史告警信息进行第属性提取,主要包括通过数据提取、数据清洗和数据聚合将各种不同类型的数据转换成算法可以输入的数据类型。首先通过提取历史告警信息的多种数据源属性,得到历史告警信息的属性信息数据,再将属性信息数据进行数据清洗,得到标准属性信息数据,标准属性信息数据进行数据聚合,得到数据标量值。本实施例中,通过提取多个历史告警信息的日志文本属性,网络信息传输数据,数据库相关的调用读取信息,服务器资源使用信息等数据源属性文本类型,将具有关联性的特征数据进行分类得到该多个历史告警信息对应的多个告警信息编码向量。
[0064]
207、分别将多个告警信息编码向量输入预置根故障分析模型进行根因分析,得到多个根故障信息;
[0065]
具体的,服务器将多个告警信息编码向量输入预置根故障分析模型进行数据分析,得到多个数值化数据;服务器通过多个数值化数据对多个历史告警信息进行关联度判断,得到多个特征数据;服务器调用预置根因分析函数对多个特征数据进行根因分析,得到多个根故障信息。
[0066]
其中,服务器将该多个告警信息编码向量输入预置根故障分析模型进行处理,得到数值化告警信息数据,将数值化告警信息数据与其他各个数值化告警信息数据进行识别,判断各个告警信息直接的关联度大小,得到告警信息的特征数据。服务器对异常时刻的根因进行分析,得到该多个历史告警信息对应的根故障信息。根因分析函数将冗杂的告警信息筛选,得到根源故障信息和衍生故障信息,进而得到该多个历史告警数据对应的多个根故障信息。
[0067]
208、根据多个历史告警信息与多个根故障信息,生成根因告警规则库;
[0068]
具体的,服务器将多个历史告警数据进行预处理,并将预处理得到的告警信息编码向量输入预置根故障分析模型,该根故障分析模型通过算法对告警信息溯源,建立根源告警信息和衍生告警信息直接的联系,执行算法的训练结果用作根因分析,或做新数据预测分析。服务器将该多个历史告警信息与该各根故障信息进行匹配,按照告警信息与产生告警信息的根故障信息进行一一对应,得到该多个历史告警信息对应的多个根故障信息,服务器将该多个历史告警信息得到的根故障信息生成为一个规则,即将告警信号与根故障信息生成一个一一对应的规则,将该多个告警信息与之相匹配的故障故障生成的所有规则组合到一起,生成一个规则库,即为根因告警规则库。
[0069]
209、通过预置根因告警规则库及告警特征信息对告警信息进行根因分析,得到根因告警信息。
[0070]
具体的,在本实施例中,步骤209的具体实施方式与上述步骤106类似,此处不再赘述。
[0071]
本发明实施例中,服务器通过提取多个历史告警信息的日志文本属性,网络信息传输数据,数据库相关的调用读取信息,服务器资源使用信息等数据源属性文本类型,将具有关联性的特征数据进行分类得到该多个历史告警信息对应的多个告警信息编码向量,可以提升告警分析的准确度,本实施例中,该根故障分析模型通过算法对告警信息溯源,服务器建立根源告警信息和衍生告警信息直接的联系,执行算法的训练结果用作根因分析,或做新数据预测分析。该预置根故障分析模型基于蒙特卡洛算法模型构建,以确定性的超均
匀分布代替蒙特卡洛算法中的随机数序列,对于某些特定问题计算速度比普通的蒙特卡洛算法高几百倍,可以同时提升对告警信息的根故障原因的匹配准确度及分析效率。
[0072]
请参阅图3,本发明实施例中智能告警分析装置的一个实施例包括:
[0073]
数据获取模块301,用于获取历史时序监控数据,并通过预设的比例系数对所述历史时序监控数据进行数据划分,得到模型构建数据集及区间预测数据集;
[0074]
模型构建模块302,用于基于蜂群算法,将所述模型构建数据集输入预置的自回归积分滑动平均模型进行模型训练,得到对应的时间序列预测模型;
[0075]
区间预测模块303,用于将所述区间预测数据集及预设数据动态权重输入所述时间序列预测模型进行告警区间预测,确定对应的告警预测区间序列;
[0076]
区间计算模块304,用于获取实时时序监控数据,并根据置信区间算法对所述实时时序监控数据进行分布区间计算,得到对应的数据分布区间序列,并通过所述告警预测区间序列对所述数据分布区间序列进行告警判断,若满足预设告警触发条件,则确定对应的告警信息;
[0077]
特征提取模块305,用于对所述告警信息进行特征提取处理,得到所述告警信息对应的告警特征信息;
[0078]
第一分析模块306,用于通过预置根因告警规则库及所述告警特征信息对所述告警信息进行根因分析,得到根因告警信息。
[0079]
请参阅图4,本发明实施例中智能告警分析装置的另一个实施例包括:
[0080]
数据获取模块301,用于获取历史时序监控数据,并通过预设的比例系数对所述历史时序监控数据进行数据划分,得到模型构建数据集及区间预测数据集;
[0081]
模型构建模块302,用于基于蜂群算法,将所述模型构建数据集输入预置的自回归积分滑动平均模型进行模型训练,得到对应的时间序列预测模型;
[0082]
区间预测模块303,用于将所述区间预测数据集及预设数据动态权重输入所述时间序列预测模型进行告警区间预测,确定对应的告警预测区间序列;
[0083]
区间计算模块304,用于获取实时时序监控数据,并根据置信区间算法对所述实时时序监控数据进行分布区间计算,得到对应的数据分布区间序列,并通过所述告警预测区间序列对所述数据分布区间序列进行告警判断,若满足预设告警触发条件,则确定对应的告警信息;
[0084]
特征提取模块305,用于对所述告警信息进行特征提取处理,得到所述告警信息对应的告警特征信息;
[0085]
第一分析模块306,用于通过预置根因告警规则库及所述告警特征信息对所述告警信息进行根因分析,得到根因告警信息。
[0086]
可选的,所述模型构建模块302具体用于:将所述模型构建数据输入预置的自回归积分滑动平均模型,并对所述模型构建数据集进行基于时间单位的扫描,确定所述模型构建数据集中时序监控数据在每一时间单位的最大值和最小值,并生成对应的最大值序列和最小值序列;通过所述蜂群算法、所述最大值序列及所述最小值序列对所述预置的自回归积分滑动平均模型进行训练迭代,得到对应的时间序列预测模型。
[0087]
可选的,所述区间预测模块303还包括:
[0088]
预测单元3031,用于将所述区间预测数据集及预设数据动态权重输入所述时间序
列预测模型进行最值序列预测,确定对应的最大值预测序列和最小值预测序列;
[0089]
分析单元3032,用于通过所述区间预测数据集的初始告警阈值、所述最大值预测序列及所述最小值预测序列进行告警区间分析,确定对应的预测告警区间序列,所述预测告警区间序列包括告警上限序列和告警下限序列。
[0090]
可选的,所述分析单元3032具体用于:对所述最大值预测序列和所述最小值预测序列进行变换调整,得到对应的目标最大值预测序列和目标最小值预测序列;通过所述初始告警阈值、所述目标最大值预测序列及所述目标最小值预测序列进行告警区间计算,得到对应的预测告警区间序列。
[0091]
可选的,所述智能告警分析装置还包括:
[0092]
编码处理模块307,用于获取多个历史告警信息,并分别对所述多个历史告警信息进行编码处理,生成多个告警信息编码向量;
[0093]
第二分析模块308,用于分别将所述多个告警信息编码向量输入预置根故障分析模型进行根因分析,得到多个根故障信息;
[0094]
规则生成模块309,用于根据所述多个历史告警信息与所述多个根故障信息,生成根因告警规则库。
[0095]
可选的,所述编码处理模块307具体用于:读取所述多个历史告警信息并对所述多个历史告警信息进行属性提取,得到多个属性信息数据;将所述多个属性信息数据进行数据清洗,得到多个标准属性信息数据;将所述多个标准属性信息数据进行数据聚合,得到多个数据标量值;将所述多个数据标量值进行独热编码向量转换,生成多个告警信息编码向量。
[0096]
可选的,所述第二分析模块308具体用于:将所述多个告警信息编码向量输入预置根故障分析模型进行数据分析,得到多个数值化数据;通过所述多个数值化数据对所述多个历史告警信息进行关联度判断,得到多个特征数据;调用预置根因分析函数对所述多个特征数据进行根因分析,得到多个根故障信息。
[0097]
图5是本发明实施例提供的一种智能告警分析设备的结构示意图,该智能告警分析设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,cpu)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对智能告警分析设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在智能告警分析设备500上执行存储介质530中的一系列指令操作。
[0098]
智能告警分析设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如windows serve,mac os,uni,linu,freebsd等等。本领域技术人员可以理解,图5示出的智能告警分析设备结构并不构成对智能告警分析设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0099]
本发明还提供一种智能告警分析设备,所述智能告警分析设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上
述各实施例中的所述智能告警分析方法的步骤。
[0100]
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述智能告警分析方法的步骤。
[0101]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read

only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0102]
本发明所指区块链是分布式数据存储,点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块,区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1