故障定界与定位的方法、设备和存储装置与流程

文档序号:33095486发布日期:2023-01-31 23:52阅读:28来源:国知局
故障定界与定位的方法、设备和存储装置与流程

1.本发明涉及通信网络运维技术领域,特别涉及一种故障定界与定位的方法、设备和存储装置。


背景技术:

2.随着网络云化、智能化的技术演进趋势,从传统标准化向个性化、定制化的网络运维转型,业务空前纷出,客户要求高、个性化需求高,业务需求多样,对网络问题容忍度低。然而网络维护与隐患防控方面仍存在一定问题,需进一步思考提高基于感知的隐患主动发现防控能力,做到源于感知,保障感知。
3.日常运维中,隐患都基于人工上报、线下闭环,这就导致隐患上报来源众多、上报不及时、上报格式不统一、内容五花八门、隐患处理考核难,只能依靠管理人员逐条排查,缺少故障关联规则自动发现。
4.传统的监控机制效率低下,人工分析成本高,而且耗时高。为了提升维护效率与规则质量,积极推进监控去人工化,实现自动化智能分析,本发明提出了一种故障定界与定位的方法、设备和存储装置。


技术实现要素:

5.本发明为了弥补现有技术的缺陷,提供了一种简单高效的故障定界与定位的方法、设备和存储装置。
6.本发明是通过如下技术方案实现的:
7.一种故障定界与定位的方法,其特征在于:采用基于自动学习的因果挖掘算法进行故障关联规则自动发现,基于历史数据进行规则自动评估,评估合格的规则实现自动部署生效,全面提升故障定界与定位的智能化水平;
8.将强化学习应用到打分法的因果发现算法中,通过基于自注意力机制的encoder-decoder神经网络模型探索数据之间的关系,结合因果结构的条件,并使用策略梯度的强化学习算法对神经网络参数进行训练,最终得到因果图结构。
9.包括以下步骤:
10.步骤s1、模型设计
11.创建基于自注意力机制的encoder-decoder神经网络模型,用于挖掘出告警之间的因果关联,利用因果关系图自动挖掘海量告警中隐藏的关联信息,以丰富网络故障管理平台的关联规则库;
12.步骤s2、选择基于强化学习的因果挖掘cdwrl(causal discovery with reinforcement learning)算法作为核心算法;
13.步骤s3、数据预处理
14.采用fink流数据处理的方式将海量告警数据和资源数据输入到redis分析池中,并基于资源关系获取网元以及关联设备作为构建关系图的基础;然后选择一组关系,结合
历史告警数据,找出组合内所有的告警类型,使用告警标题标识告警类型;
15.按照告警发生的时间,根据时间窗(如30分钟)将告警数据处理成按时间片分割的数据,每条数据之间是独立的;
16.步骤s4、构建有向无环图dga
17.设计一个以原始数据矩阵为输入,以图的邻接矩阵为输出的基于神经网络的图生成器;采用抽样的思想从n条数据中抽取m个样本,用于图生成,得到一个m*d的矩阵;然后开始构图,矩阵的每一列是图的一个节点,通过建立两两节点之间的关系,最能得到一个d*d的邻接矩阵,也就是初始的有向无环图dag;
18.步骤s5、有向无环图dga迭代优化
19.控制打分函数的下限和上限,并不断调整参数,对结果进行无环性约束,基于打分的方式,通过训练图的迭代,实现有向无环图dga的结构迭代优化;
20.步骤s6、构建打分函数和无环性约束
21.设计图结构打分函数,对图结构进行评分,基于打分的方式以及图的无环性约束进行训练,得到bic得分最高的有向无环图dga结构;
22.有向无环图dga的bic打分公式为:
[0023][0024]
其中,θ为自定义参数,为参数θ的最大似然估计量,d
θ
为参数θ的维数,p为范畴假设,m为底数;
[0025]
具有二元邻接矩阵a的有向无环图dga的无环性约束公式如下:
[0026]
h(a):=trace(ea)-d=0
[0027]
其中,ea为矩阵a的指数,用幂级数展开,即e+a+a
2/2!
+a
3/3!
+...;
[0028]
步骤s7、构建评分函数
[0029]
基于打分函数和无环性约束构建评分函数,通过梯度下降过程的迭代,最终得到优化后的有向无环图dga结构;
[0030]
评分函数为:
[0031][0032]
其中,s(g)为向无环图dga的得分,dags为bic得分最高的有向无环图dga图结构的集合,i()为指示函数,当输入为true时,输出为1,输入为false时,输出为0,用于计数;λ1与λ2为两个不小于0的惩罚参数,λ1与λ2越大,对有向无环图dga的无环性约束就越强;
[0033]
自定义调整参数λ1与λ2,使平分reward最大化,即可得到优化后的有向无环图dga结构;
[0034]
步骤s8、可视化展示
[0035]
利用可视化工具将最终得到的向无环图dga的邻接矩阵绘制出来进行展示,图中的节点代表告警类型。
[0036]
所述步骤s3中,数据预处理时,先统一数据格式,并丢弃垃圾数据,根据时间排序,然后按照每隔n个时间段(例如5分钟)统计一个向量,并合并到数据中,将最终得到的数据保存为npy矩阵。
[0037]
所述步骤s4中,生成初始的有向无环图dag时先加密,将m*d矩阵每一列作为一个
向量,用enci,i=1,2,...,d表示编码器的输出,尺寸为de;
[0038]
解密时,加码器通过两个编码器输出enci和encj之间的关系:
[0039]gij
(w1,w2,u)=u
t
tanh(w1enci+w2encj)
[0040]
其中,w1、w2和u均为训练参数,且w1,w2∈r
dh
×
de
,u∈r
dh
×1;
[0041]
tanh为双曲正切函数,其所有数值均落在[-1,1]内。
[0042]
所述步骤s4中,m*d矩阵将每个条目g
ij
传递到logistic sigmoid functionσ()函数,生成d*d邻接矩阵。
[0043]
所述步骤s5中,采用critic(criteria importance though intercrieria correlation,客观权重赋权法)神经网络实现对有向无环图dga的结构迭代优化。
[0044]
一种设备,其特征在于:包括存储器和处理器;所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现上述的方法步骤。
[0045]
一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法步骤。
[0046]
本发明的有益效果是:该故障定界与定位的方法、设备和存储装置,提升了关联规则挖掘准确率和故障定位能力,通过建立机器自学习提升了故障命中率,通过实时日志分析和监控提升了故障和投诉监控预防能力以及处理效率,进而节省了运维时长,提高了工作效率,为系统自动化运维提供了助力。
附图说明
[0047]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0048]
附图1为本发明向无环图dga迭代优化方法示意图。
具体实施方式
[0049]
为了使本技术领域的人员更好的理解本发明中的技术方案,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚,完整的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0050]
该故障定界与定位的方法,采用基于自动学习的因果挖掘算法进行故障关联规则自动发现,基于历史数据进行规则自动评估,评估合格的规则实现自动部署生效,全面提升故障定界与定位的智能化水平;
[0051]
将强化学习应用到打分法的因果发现算法中,通过基于自注意力机制的encoder-decoder神经网络模型探索数据之间的关系,结合因果结构的条件,并使用策略梯度的强化学习算法对神经网络参数进行训练,最终得到因果图结构。
[0052]
在学术界常用的一些数据模型中,该方法在中等规模的图上的表现优于其他方法,包括传统的因果发现算法和近期的基于梯度的算法。同时该方法非常灵活,可以和任意的打分函数结合使用。
[0053]
该故障定界与定位的方法,包括以下步骤:
[0054]
步骤s1、模型设计
[0055]
在的网络故障管理中,关联规则是指给出不同告警信息之间的关联性;
[0056]
在30分钟时间窗口内,若告警a发生必然会导致告警b发生,则说明告警a与告警b存在关联关系,则进行关联派单处理,关联规则形式为:a-b,其中告警a为主告警标题,告警b为次告警标题;
[0057]
将关联规则与因果关系模型相结合,采用因果挖掘算法研究有关类型级别因果关系的假设。在告警数据中有大量的告警类型,因此创建基于自注意力机制的encoder-decoder神经网络模型,用于挖掘出告警之间的因果关联,利用因果关系图自动挖掘海量告警中隐藏的关联信息,以丰富网络故障管理平台的关联规则库。
[0058]
步骤s2、选择基于强化学习的因果挖掘cdwrl(causal discovery with reinforcement learning)算法作为核心算法;
[0059]
根据2021iclr(深度学习)最新报告显示,该算法准确度和效率更高。同时,根据实验数据集和测试验证结构反馈,该算法十分符合告警关联的特征。
[0060]
步骤s3、数据预处理
[0061]
采用fink流数据处理的方式将海量告警数据和资源数据输入到redis分析池中,并基于资源关系获取网元以及关联设备作为构建关系图的基础;然后选择一组关系,结合历史告警数据,找出组合内所有的告警类型,使用告警标题标识告警类型;
[0062]
按照告警发生的时间,根据时间窗(如30分钟)将告警数据处理成按时间片分割的数据,每条数据之间是独立的。
[0063]
所述步骤s3中,数据预处理时,先统一数据格式,并丢弃垃圾数据,根据时间排序,然后按照每隔n个时间段(例如5分钟)统计一个向量,并合并到数据中,将最终得到的数据保存为npy矩阵。
[0064]
步骤s4、构建有向无环图dga
[0065]
设计一个以原始数据矩阵为输入,以图的邻接矩阵为输出的基于神经网络的图生成器;因为数据量比较大,不能把每个时间片的数据都考虑进来,因此需要采用抽样的思想从n条数据中抽取m个样本,用于图生成,得到一个m*d的矩阵;然后开始构图,矩阵的每一列是图的一个节点,通过建立两两节点之间的关系,最能得到一个d*d的邻接矩阵,也就是初始的有向无环图dag;
[0066]
所述步骤s4中,生成初始的有向无环图dag时先加密,将m*d矩阵每一列作为一个向量,用enci,i=1,2,...,d表示编码器的输出,尺寸为de;
[0067]
解密时,加码器通过两个编码器输出enci和encj之间的关系:
[0068]gij
(w1,w2,u)=u
t
tanh(w1enci+w2encj)
[0069]
其中,w1、w2和u均为训练参数,且w1,w2∈r
dh
×
de
,u∈r
dh
×1;
[0070]
tanh为双曲正切函数,其所有数值均落在[-1,1]内。
[0071]
所述步骤s4中,m*d矩阵将每个条目g
ij
传递到logistic sigmoid functionσ()函数,生成d*d邻接矩阵。
[0072]
步骤s5、有向无环图dga迭代优化
[0073]
控制打分函数的下限和上限,并不断调整参数,对结果进行无环性约束,基于打分
的方式,通过训练图的迭代,实现有向无环图dga的结构迭代优化;
[0074]
实际上可以用线性函数、kernel等等方法做函数近似。
[0075]
actor(玩家):为了玩转这个游戏得到尽量高的reward(奖励),需要实现一个函数:输入state(状态),输出action(动作),即上面的第2步。可以用神经网络来近似这个函数,剩下的任务就是如何训练神经网络,让它的表现更好(即得更高的reward),这个网络就被称为actor。
[0076]
critic(评委):为了训练actorr,需要知道actor的表现,根据表现来决定对神经网络参数的调整。这就要用到强化学习中的“q-value”,但q-value也是一个未知的函数;因而采用critic(criteria importance though intercrieria correlation,客观权重赋权法)神经网络实现对actor-critic的训练,进而实现有向无环图dga的结构迭代优化。
[0077]
actor看到游戏目前的state,做出一个action。
[0078]
critic根据state和action两者,对actor的表现打一个分数。
[0079]
actor依据critic(评委)的打分,调整自己的策略(actor神经网络参数),进行优化,以获取更高的reward。
[0080]
critic根据系统给出的reward(相当于ground truth)和其他评委的打分(critic target)来调整自己的打分策略(critic神经网络参数)。
[0081]
最初,actor随机表演,critic随机打分。但是由于reward的存在,critic评分越来越准,actor表现越来越好。
[0082]
步骤s6、构建打分函数和无环性约束
[0083]
设计图结构打分函数,对图结构进行评分,基于打分的方式以及图的无环性约束进行训练,得到bic得分最高的有向无环图dga结构;
[0084]
有向无环图dga的bic打分公式为:
[0085][0086]
其中,θ为自定义参数,为参数θ的最大似然估计量,d
θ
为参数θ的维数,p为范畴假设,m为底数;
[0087]
具有二元邻接矩阵a的有向无环图dga的无环性约束公式如下:
[0088]
h(a):=trace(ea)-d=0
[0089]
其中,ea为矩阵a的指数,用幂级数展开,即e+a+a
2/2!
+a
3/3!
+...;
[0090]
步骤s7、构建评分函数
[0091]
基于打分函数和无环性约束构建评分函数,通过梯度下降过程的迭代,最终得到优化后的有向无环图dga结构;
[0092]
评分函数为:
[0093][0094]
其中,s(g)为向无环图dga的得分,dags为bic得分最高的有向无环图dga图结构的集合,i()为指示函数,当输入为true时,输出为1,输入为false时,输出为0,用于计数;λ1与λ2为两个不小于0的惩罚参数,λ1与λ2越大,对有向无环图dga的无环性约束就越强;
[0095]
自定义调整参数λ1与λ2,使平分reward最大化,即可得到优化后的有向无环图dga结构;
[0096]
步骤s8、可视化展示
[0097]
如附图1所述,利用可视化工具将最终得到的有向无环图dga的邻接矩阵绘制出来进行展示,图中的节点代表告警类型。
[0098]
该设备包括存储器和处理器;所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现上述的方法步骤。
[0099]
该可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法步骤。
[0100]
与现有技术相比,该故障定界与定位的方法、设备和存储装置,具有以下特点:
[0101]
以上所述的实施例,只是本发明具体实施方式的一种,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1