基于频繁路径的告警相关性数据挖掘方法和装置的制造方法
【技术领域】
[0001] 本发明涉及告警领域,尤其涉及基于频繁路径的告警相关性数据挖掘方法和装 置。
【背景技术】
[0002] 现代电信网络管理的主要任务是对网络进行实时监控,确保电信网络高效、可靠、 经济和安全的运行。随着电信技术迅猛发展,电信网络每天可能有上百万次的告警量,而在 送海量告警当中蕴含了大量信息,如告警时间,级别,设备,区域的分布情况,每个告警生命 周期的分布情况,W及告警与告警间的内在关系,如何从海量告警数据中快速查找电信网 络中的告警相关性信息,帮助网络管理人员处理网络故障,是一个亟待解决的问题。
【发明内容】
[0003] 本发明的主要目的在于提供一种基于频繁路径的告警相关性数据挖掘方法和装 置,旨在解决从海量告警数据中快速查找电信网络中的告警相关性信息的问题。
[0004] 为实现上述目的,本发明提供基于频繁路径的告警相关性数据挖掘方法,包括W 下步骤:
[0005] 获取设定范围的告警数据,提取告警码、站点ID和设备ID ;
[0006] 根据提取的所述告警码、所述站点ID和所述设备ID,生成矩阵,获取告警发生频 度、告警间距离和连接强度;
[0007] 根据所述告警发生频度和所述告警间距离,获取告警群体聚类集合;
[0008] 根据所述告警群体聚类集合和所述连接强度,挖掘出频繁路径。
[0009] 优选地,所述设定范围包括设定时间和设定设备,所述获取设定范围的告警数据, 提取告警码、站点ID和设备ID的步骤包括:
[0010] 获取设定时间和设定设备的告警数据,提取所述告警码、所述站点ID和所述设备 ID。
[0011] 优选地,所述矩阵包括事务矩阵和遍历矩阵,所述根据提取的所述告警码、所述站 点ID和所述设备ID,生成矩阵,获取告警发生频度、告警间距离和连接强度的步骤包括:
[0012] W所述告警码为行,所述设备ID或所述站点ID为列生成事务矩阵;W告警码为 行,告警码为列生成遍历矩阵。
[0013] 优选地,所述根据所述告警发生频度和所述告警间距离,获取告警群体聚类集合 的步骤包括:
[0014] 将所述告警发生频度和预设的频度阔值进行比较,筛选出大于或等于预设的频度 阔值的告警码;
[0015] 将所述告警间距离和预设的距离阔值进行比较,筛选出小于预设的距离阔值时的 告警码;
[0016] 对所述筛选出的告警码按照距离进行合并,获得告警群体聚类集合。
[0017] 优选地,所述根据所述告警群体聚类集合和所述连接强度,挖掘出频繁路径的步 骤包括:
[0018] 将所述告警群体聚类集合的所述连接强度和预设的连接强度阔值进行比较,筛选 出大于或等于预设的连接强度阔值的告警码,对筛选后的相关联的告警码进行路径合并, 得出频繁路径。
[0019] 为了解决上述的技术问题,本发明进一步提供一种基于频繁路径的告警相关性数 据挖掘装置,所述基于频繁路径的告警相关性数据挖掘装置包括:
[0020] 提取模块,用于获取设定范围的告警数据,提取告警码、站点ID和设备ID ;
[0021] 生成模块,用于根据提取的所述告警码、所述站点ID和所述设备ID,生成矩阵,获 取告警发生频度、告警间距离和连接强度;
[0022] 获取模块,用于根据所述告警发生频度和所述告警间距离,获取告警群体聚类集 合;
[0023] 挖掘模块,用于根据所述告警群体聚类集合和所述连接强度,挖掘出频繁路径。
[0024] 优选地,所述提取模块,还用于获取设定时间和设定设备的告警数据,提取所述告 警码、所述站点ID和所述设备ID。
[00巧]优选地,所述生成模块,还用于W所述告警码为行,所述设备ID或所述站点ID为 列生成事务矩阵;W所述告警码为行,所述告警码为列建立遍历矩阵。
[0026] 优选地,所述获取模块包括:
[0027] 频度比较单元,用于将所述告警发生频度和预设的频度阔值进行比较,筛选出大 于或等于预设的频度阔值的告警码;
[0028] 距离比较单元,用于将所述告警间距离和预设的距离阔值进行比较,筛选出小于 预设的距离阔值时的告警码;
[0029] 合并单元,用于对所述筛选出的告警码按照距离进行合并,获得告警群体聚类集 A 口 O
[0030] 优选地,所述挖掘模块,还用于将所述告警群体聚类集合的所述连接强度和预设 的连接强度阔值进行比较,筛选出大于或等于预设的连接强度阔值的告警码,对筛选后的 相关联的告警码进行路径合并,得出频繁路径。
[0031] 本发明提供的基于频繁路径的告警相关性数据挖掘方法,通过获取设定范围的告 警数据,提取告警码、站点ID和设备ID ;根据提取的所述告警码、所述站点ID和所述设备 ID,生成矩阵,获取告警发生频度、告警间距离和连接强度;根据所述告警发生频度和所述 告警间距离,获取告警群体聚类集合;根据所述告警群体聚类集合和所述连接强度,挖掘出 频繁路径。本发明结合电信告警特点和数据挖掘算法,有效整合告警码,告警位置,时间顺 序,发生次数的方式,提出了利用矩阵进行存储告警多个维度的信息,高效快速地挖掘出告 警间的关联关系,从而提升运维效率。
【附图说明】
[0032] 图1为本发明基于频繁路径的告警相关性数据挖掘方法第一实施例的流程示意 图;
[0033] 图2为本发明基于频繁路径的告警相关性数据挖掘方法第二实施例的流程示意 图;
[0034] 图3为图I中所述根据所述告警发生频度和所述告警间距离,获取告警群体聚类 集合的步骤的细化流程示意图;
[0035] 图4为本发明基于频繁路径的告警相关性数据挖掘方法第H实施例的流程示意 图;
[0036] 图5为本发明于频繁路径的告警相关性数据挖掘装置一实施例的功能模块示意 图;
[0037] 图6为图5中获取模块的功能模块示意图。
[0038] 本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
【具体实施方式】
[0039] 应当理解,此处所描述的具体实施例仅仅用W解释本发明,并不用于限定本发明。
[0040] 本发明提供一种基于频繁路径的告警相关性数据挖掘方法,参照图1,图1为本发 明基于频繁路径的告警相关性数据挖掘方法第一实施例的流程示意图,在第一实施例中, 本发明提供的基于频繁路径的告警相关性数据挖掘方法,包括W下步骤:
[0041] 步骤S100、获取设定范围的告警数据,提取告警码、站点ID和设备ID。
[0042] 基于频繁路径的告警相关性数据挖掘装置获取设定范围的告警数据,其中,设定 范围可W是设定的具体时间段,也可W是设定的具体某一类型的设备,从设定范围的告警 数据中提取相应的告警码、站点ID和设备ID等信息。
[0043] 步骤S200、根据提取的所述告警码、所述站点ID和所述设备ID,生成矩阵,获取告 警发生频度、告警间距离和连接强度。
[0044] 基于频繁路径的告警相关性数据挖掘装置根据提取的告警码、站点ID和设备ID, 生成相应的矩阵,其中,生成的矩阵包括事务矩阵和遍历矩阵,W告警码为行,设备ID或者 站点ID为列,得到W设备ID或者站点ID为基础的事务矩阵如下所示:
[0045]
[0046] 遍历矩阵W告警码为行,告警码为列,形成告警码-告警码矩阵,W告警码为基 础,元素 aij表示所有设备中,先发生告警,在时间窗口范围内顺序发生aj的次数