本公开的实施例涉及但不限于通信,具体地说,涉及一种基于图神经网络的云网跨域告警聚类方法和装置。
背景技术:
1、近年来,随着网络虚拟化的快速发展,云网环境中的网元种类越来越复杂,规模也越来越庞大。业务资源平台与通信网络可能会发生异常事件,即云网平台的故障。当出现故障并引发告警时,与云网平台关联的网元以及业务过程都会发出相关的告警信息。如果多个故障同时引发告警信息,那么多个告警信息会叠加到一起,导致故障识别十分困难。目前,云网告警的监控和管理主要依靠人工完成,运营维护成本高昂,处理过程十分耗时。在发生大量故障告警时,不能满足告警处理的时效性要求。另外,故障事件的数量会随着告警消息流的到达而增加,需要实现对流式告警消息的增量处理。
2、告警聚类旨在将疑似同一故障引发的系列告警分成同一个故障簇,可以为运维人员快速定位故障根因、及时恢复服务正常提供支撑。在相关技术中,主要基于网元拓扑信息和时间信息对告警信息聚类。然而,相关技术的增量式聚类方法需要人工设定时间、拓扑等关联特征的权重,影响了聚类有效性,并且多数聚类算法采用硬时间窗划分告警数据,导致类簇划分效果差。此外,在相关技术中,告警聚类结果无法指导其他告警关联分析任务。
3、因此,如何权衡各种信息的影响,提高告警聚类结果的准确性成为亟待解决的问题。
技术实现思路
1、为了至少部分解决现有技术中存在的问题,提供一种基于图神经网络的云网跨域告警聚类方法和装置。
2、第一方面,根据本公开的一个实施例,提供一种基于图神经网络的云网跨域告警聚类方法,包括:
3、获取告警数据,其中所述告警数据构成告警消息块;
4、按时间序列获取连续的告警消息块;
5、判断是否进入模型训练阶段,若是,则响应于进入所述模型训练阶段,新建告警消息关系图并生成加权多关系图,或者维护告警消息关系图并更新加权多关系图;
6、基于所述多关系图,通过加权多关系图神经网络算法margnn来训练告警消息节点的嵌入向量学习模型;
7、输出所述告警消息节点的嵌入向量;以及
8、基于所述嵌入向量,对所述告警消息进行聚类,以获得故障事件类簇。
9、在一个可选实施例中,所述方法还包括:判断是否进入模型训练阶段,若否,则进入告警消息聚类阶段,并且响应于进入所述告警消息聚类阶段,扩充告警消息关系图并更新加权多关系图。
10、在一个可选实施例中,所述判断是否进入模型训练阶段的步骤包括:当获取到第一个告警消息块时,则判断进入所述模型训练阶段;或者设置维护周期,当获取的连续告警消息块经过所述维护周期时,则判断进入所述模型训练阶段。
11、在一个可选实施例中,所述新建告警消息关系图并生成加权多关系图的步骤包括:以告警消息为节点构建初始异构信息网络;以及建立元路径模型,以生成所述加权多关系图。
12、在一个可选实施例中,所述维护告警消息关系图并更新加权多关系图的步骤包括:从所述加权多关系图中删除过时的告警消息节点;获取新告警消息块;以及基于所述新告警消息块中的告警消息节点、所述新告警消息块中的告警消息节点与现有告警消息节点之间的边以及所述新告警消息块中的相应告警消息节点之间的边,更新所述加权多关系图。
13、在一个可选实施例中,所述基于所述多关系图,通过加权多关系图神经网络算法margnn来训练告警消息节点的嵌入向量学习模型的步骤包括:选择不同关系的邻居;聚合多关系感知的邻居信息;以及基于对比学习机制更新模型参数。
14、在一个可选实施例中,所述聚合多关系感知的邻居信息的步骤包括:聚合多关系感知的邻居信息的步骤包括:使用关系内聚合器聚合多关系感知的邻居信息;和/或使用关系间聚合器聚合多关系感知的邻居信息。
15、在一个可选实施例中,所述扩充告警消息关系图的步骤包括:获取新告警消息块;以及基于所述新告警消息块中的告警消息节点、所述新告警消息块中的告警消息节点与现有告警消息节点之间的边以及所述新告警消息块中的相应告警消息节点之间的边,更新所述加权多关系图。
16、在一个可选实施例中,输出所述告警消息节点的嵌入向量的步骤包括:基于训练好的所述嵌入向量学习模型,预测所述告警消息节点的嵌入向量。
17、第二方面,根据本公开的一个实施例,提供一种基于图神经网络的云网跨域告警聚类装置,所述装置包括:
18、获取模块,被配置成获取告警数据,其中所述告警数据构成告警消息块,并且按时间序列获取连续的告警消息块;
19、判断模块,被配置成判断是否进入模型训练阶段,若是,则响应于进入所述模型训练阶段,新建告警消息关系图并生成加权多关系图,或者维护告警消息关系图并更新加权多关系图;
20、训练模块,被配置成基于所述多关系图,通过加权多关系图神经网络算法margnn来训练告警消息节点的嵌入向量学习模型;
21、输出模块,被配置成输出所述告警消息节点的嵌入向量;以及
22、聚类模块,被配置成基于所述嵌入向量,对所述告警消息进行聚类,以获得故障事件类簇。
23、第三方面,根据本公开的一个实施例,提供一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器能够实现上述任一个实施例所述的基于图神经网络的云网跨域告警聚类方法。
24、根据本发明实施例提供的基于图神经网络的云网跨域告警聚类方法和装置,可以应用于云网资源池、通信网络和业务等跨域告警聚类分析场景,并且克服硬时间窗的限制,从而有效实现多关联关系加权融合的增量式告警聚类,提高聚类的时效性和结果准确性,形成历史告警知识沉淀。
1.一种基于图神经网络的云网跨域告警聚类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其中,所述方法还包括:
3.根据权利要求1所述的方法,其中,所述判断是否进入模型训练阶段的步骤包括:
4.根据权利要求1所述的方法,其中,所述新建告警消息关系图并生成加权多关系图的步骤包括:
5.根据权利要求5所述的方法,其中,所述维护告警消息关系图并更新加权多关系图的步骤包括:
6.根据权利要求1所述的方法,其中,所述基于所述多关系图,通过加权多关系图神经网络算法margnn来训练告警消息节点的嵌入向量学习模型的步骤包括:
7.根据权利要求6所述的方法,其中,所述聚合多关系感知的邻居信息的步骤包括:
8.根据权利要求2所述的方法,其中,所述扩充告警消息关系图的步骤包括:
9.根据权利要求1或2所述的方法,其中,输出所述告警消息节点的嵌入向量的步骤包括:
10.一种基于图神经网络的云网跨域告警聚类装置,其特征在于,所述装置包括:
11.一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器能够实现根据权利要求1-9中任一项所述的基于图神经网络的云网跨域告警聚类方法。