本发明涉及通信及计算机领域,尤其涉及一种基于加权距离的通信业务告警分析方法及系统。
背景技术:
现有技术中主要采用以下两种方法进行告警分析:
一、借助关联关系挖掘,找到告警之间的关联关系,从而判断主因告警。缺点是准确度依赖与告警数据库的规模,以及告警频项集的数量,且收集告警数据的周期较长。且当网络结构发生调整,告警关系也会发生变化,那么准确度也会下降。
二、通过业务通道上下位关系进行推断。缺点是业务上下位关系必须准确,必须有完整的业务通道信息。对于一些跨厂家、跨专业异构环境下的网络结构,其业务通道信息并不完整,发生这种情况就无法直接通过上下位关系判断主因告警。
由于第一种技术需要较长的周期收集告警数据,并且其准确度依赖历史告警数据的规模。当网络结构发生调整,告警准确度会下降需要重新挖掘关联关系。而第二种方式需要依赖业务通道数据库,对于数据不完整则无法判断主因告警。
技术实现要素:
本发明要解决的技术问题在于针对现有技术中准确度较低,且依赖程度高的缺陷,提供一种基于加权距离的通信业务告警分析方法及系统。
本发明解决其技术问题所采用的技术方案是:
本发明提供一种基于加权距离的通信业务告警分析方法,包括以下步骤:
S1、从业务数据库中收集相关的业务数据,计算业务数据的权值,并将业务数据向量化,计算任意两个向量的加权欧式距离;
S2、根据加权欧式距离,对业务数据进行均值聚类,得到业务聚类;用户手工调整业务聚类中的少量边缘数据,得到最终聚类;
S3、根据每个最终聚类中的业务数据,及其连接关系,拼接形成一个完整的业务通道,业务通道包括至少两个设备;
S4、设置集约周期和集约缓存,将业务通道中发生告警的设备放入集约缓存中,若时间上满足集约周期或集约缓存满,输出集约缓存内的所有告警;并对所有告警按照设备进行分组,定义设备分组中告警级别最高,且发生时间最前的告警为该设备分组上的最高级告警;
S5、若业务通道中本端的设备存在对端设备,比较对端设备上的最高级告警;
若本端告警级别高,则本端上的告警是主要影响告警,本端设备故障;
若对端告警级别高,则对端上的告警是主要影响告警,对端设备故障;
若两端告警级别相同,则两端设备的通道存在故障;
S6、若设备或通道发生故障,且也没有可用的业务的保护通道,则该业务中断。
进一步地,本发明的步骤S1中的业务数据包括:业务类型、业务名称、业务A/Z端、业务容量、业务用户和业务创建时间。
进一步地,本发明的步骤S1中计算业务数据的权值的方法具体为:
根据业务数据在数据库中出现的总量判断其权值,总量越大,该业务数据的权值越大,并根据其最大辨识度来分配权值;权值计算的公式为:
权值=信息总量×max(表中不同的值的数量/表中所有值的数量)
再对各个业务数据进行归一化处理,将单个权值比上所有权值,结果在(0,1)之间,权值的总和等于1。
进一步地,本发明的步骤S1中计算加权欧式距离的公式为:
其中,V1i和V2i表示向量中第i个值,只有两个业务数据的容量相同才会计算其距离,否则其距离无穷大,即无可比性。
进一步地,本发明的步骤S2中进行均值聚类的方法具体为:
采用K-means均值聚类的方法,根据业务数据中已知的数据个数设置聚类个数,根据中心点不断使用加权欧式距离将业务数据放入该聚类总,最终得到业务聚类。
本发明的一种基于加权距离的通信业务告警分析系统,包括业务通道建模模块和告警分析模块,其中:
业务通道建模模块,包括加权距离计算模块、通道聚类模块和通道拼接模块;
加权距离计算模块用于从业务数据库中收集相关的业务数据,计算业务数据的权值,并将业务数据向量化,计算任意两个向量的加权欧式距离;
通道聚类模块用于根据加权欧式距离,对业务数据进行均值聚类,得到业务聚类;用户手工调整业务聚类中的少量边缘数据,得到最终聚类;
通道拼接模块用于根据每个最终聚类中的业务数据,及其连接关系,拼接形成一个完整的业务通道,业务通道包括至少两个设备;
告警分析模块,包括告警集约模块、主原因判定模块和故障影响展开模块;
告警集约模块用于设置集约周期和集约缓存,将业务通道中发生告警的设备放入集约缓存中,若时间上满足集约周期或集约缓存满,输出集约缓存内的所有告警;并对所有告警按照设备进行分组,定义设备分组中告警级别最高,且发生时间最前的告警为该设备分组上的最高级告警;
主原因判定模块用于比较业务通道中存在的对端设备的最高级告警;
若本端告警级别高,则本端上的告警是主要影响告警,本端设备故障;
若对端告警级别高,则对端上的告警是主要影响告警,对端设备故障;
若两端告警级别相同,则两端设备的通道存在故障;
故障影响展开模块用于判断故障影响,若设备或通道发生故障,且也没有可用的业务的保护通道,则该业务中断。
本发明产生的有益效果是:本发明的基于加权距离的通信业务告警分析方法,通过基于加权距离比较不同厂家、不同专业异构环境下的网络结构中的业务通道信息,信息距离近的业务通道信息就可以构成一个完整的业务通道,然后再通过业务上下位关系进行推断,这样即可以不需要依赖告警数据库,又可以避免在通道信息不完整的情况下无法做推断,从而能够弥补现有技术的不足;该方法的预测精度高,并且不需要依赖历史告警数据的规模,能够在通道信息不完整的情况下进行告警分析。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例的系统模块框图;
图2是本发明实施例的业务通道建模流程图;
图3是本发明实施例的告警分析流程图;
图4是本发明实施例的设备关系拓扑图;
图中,A1-业务通道建模模块,A11-加权距离计算模块,A12-通道聚类模块,A13-通道拼接模块,A2-告警分析模块,A21-告警集约模块,A22-主原因判定模块,A23-故障影响展开模块。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明实施例的基于加权距离的通信业务告警分析方法,包括以下步骤:
S1、从业务数据库中收集相关的业务数据,计算业务数据的权值,并将业务数据向量化,计算任意两个向量的加权欧式距离;
S2、根据加权欧式距离,对业务数据进行均值聚类,得到业务聚类;用户手工调整业务聚类中的少量边缘数据,得到最终聚类;
S3、根据每个最终聚类中的业务数据,及其连接关系,拼接形成一个完整的业务通道,业务通道包括至少两个设备;
S4、设置集约周期和集约缓存,将业务通道中发生告警的设备放入集约缓存中,若时间上满足集约周期或集约缓存满,输出集约缓存内的所有告警;并对所有告警按照设备进行分组,定义设备分组中告警级别最高,且发生时间最前的告警为该设备分组上的最高级告警;
S5、若业务通道中本端的设备存在对端设备,比较对端设备上的最高级告警;
若本端告警级别高,则本端上的告警是主要影响告警,本端设备故障;
若对端告警级别高,则对端上的告警是主要影响告警,对端设备故障;
若两端告警级别相同,则两端设备的通道存在故障;
S6、若设备或通道发生故障,且也没有可用的业务的保护通道,则该业务中断。
步骤S1中的业务数据包括:业务类型、业务名称、业务A/Z端、业务容量、业务用户和业务创建时间。
步骤S1中计算业务数据的权值的方法具体为:
根据业务数据在数据库中出现的总量判断其权值,总量越大,该业务数据的权值越大,并根据其最大辨识度来分配权值;权值计算的公式为:
权值=信息总量×max(表中不同的值的数量/表中所有值的数量)
再对各个业务数据进行归一化处理,将单个权值比上所有权值,结果在(0,1)之间,权值的总和等于1。
步骤S1中计算加权欧式距离的公式为:
其中,V1i和V2i表示向量中第i个值,只有两个业务数据的容量相同才会计算其距离,否则其距离无穷大,即无可比性。
步骤S2中进行均值聚类的方法具体为:
采用K-means均值聚类的方法,根据业务数据中已知的数据个数设置聚类个数,根据中心点不断使用加权欧式距离将业务数据放入该聚类总,最终得到业务聚类。
如图2所示,在本发明的另一个具体实施例中,该方法包括以下步骤:
业务通道建模主要流程如下:
B1、收集业务数据,从一个或多个业务数据库中提取与业务数据相关信息。主要包括:业务类型、业务名称、业务A/Z端、业务容量、业务用户、业务创建时间。
B2、分配权值,根据步骤B1中收集的业务数据,并计算信息的权值,权值越大约重要。其权值次序是依据一个信息在其数据库中出现的总量,总量越大说明信息越重要;并依据其最大辨识度来分配权值。一个信息可能出现在多个表里,其在某个表中不同的值的数量比上其这张表的总量就是这个信息在该表中的辨识度,在多个表里辨识度最大的就是这个数据的辨识度。由公式1表示权值:
权值=信息总量×max(表中不同的值的数量/表中所有值的数量)公式1
再对业务类型、业务名称、业务A/Z端、业务容量、业务用户、业务创建时间这些信息的权值做归一化处理。其处理可以是单个权值比上其所有权值的和,最后必然是(0,1)之间数,且其权值总和等于1。
本实施例中计算后可得如下次序,业务名称>业务创建时间>业务A/Z端>业务容量>业务用户>业务类型。
B3、欧式距离计算,是计算B1中收集的业务基础数据<业务名称、业务创建时间、业务A/Z端、业务容量、业务用户、业务类型>向量化,任意两向量的加权欧式距离。由公式2表示:
其中,V1i和V2i表示向量中第i个值,只有两个业务数据的容量相同才会计算其距离,否则其距离无穷大,即无可比性。
B4、均值聚类,是根据基础数据中已知的数据个数设置聚类个数。然后根据中心点不断使用步骤B3中的距离将业务数据放入分类中。最终形成的分类,就是一个完整的业务,其中的数据就是组成这个完整业务的子数据。
B5、用户确认,是根据上述步骤B4中的聚类,由用户手工对少量边缘数据重新调整。
B6、输出业务通道模型,由于业务分类中的业务子数据是一条完整业务的分段,其存在次序。根据步骤B5中的最终聚类,根据子数据的连接关系形成一个完整的业务通道。最终输出通道模型。
如图3所示,告警分析流程如下:
C1、告警集约,设置一个集约周期和一个集约缓存,如果时间上满足周期或者缓存满,则将缓存内的所有告警传给步骤C2。
C2、设备最高级告警,根据步骤C1中的告警按设备分组,告警是设备发出的,那么告警就会包含设备的信息。通道至少由两端设备构成,通道出了问题,那么两端设备都会报告警。分组中获得告警级别最高,且发生时间最前的告警。然后用这个告警,去和该设备上已知的最高级的告警比较,找到告警发生时间最前且告警级别最高的告警,作为这个设备上的最高级告警,最高级告警可以存在零到多个。如果存在最高级告警则执行步骤C3。
C3、两端最高级告警比较,是指如果存在对端设备,将其与对端设备上的最高级告警比较。如果本端比对端告警级别高,则本端上的告警是主要影响告警;如果对端告警级别高,则对端上的告警是主要影响告警;如果两个级别相同,则两端设备的通道存在故障。
C4、通道影响判断,是根据步骤C3中找到的最高级告警,如果是设备的最高级,则通过此设备的通道均受影响,否则就是通过该通道的业务受影响。
C5、影响展开,是假设设备或通道收影响的情况下,其业务是否受影响,如果设备或通道发生故障,且也没有可用的业务的保护通道的情况下,则业务中断。
如图4所示,业务是两个终端设备的通信,其经过多个通道,通道至少由两个通信设备构成。
如图1所示,本发明实施例的基于加权距离的通信业务告警分析系统,包括业务通道建模模块A1和告警分析模块A2,其中:
业务通道建模模块A1,包括加权距离计算模块A11、通道聚类模块A12和通道拼接模块A13;
加权距离计算模块A11用于从业务数据库中收集相关的业务数据,计算业务数据的权值,并将业务数据向量化,计算任意两个向量的加权欧式距离;
通道聚类模块A12用于根据加权欧式距离,对业务数据进行均值聚类,得到业务聚类;用户手工调整业务聚类中的少量边缘数据,得到最终聚类;
通道拼接模块A13用于根据每个最终聚类中的业务数据,及其连接关系,拼接形成一个完整的业务通道,业务通道包括至少两个设备;
告警分析模块A2,包括告警集约模块A21、主原因判定模块A22和故障影响展开模块A23;
告警集约模块A21用于设置集约周期和集约缓存,将业务通道中发生告警的设备放入集约缓存中,若时间上满足集约周期或集约缓存满,输出集约缓存内的所有告警;并对所有告警按照设备进行分组,定义设备分组中告警级别最高,且发生时间最前的告警为该设备分组上的最高级告警;
主原因判定模块A22用于比较业务通道中存在的对端设备的最高级告警;
若本端告警级别高,则本端上的告警是主要影响告警,本端设备故障;
若对端告警级别高,则对端上的告警是主要影响告警,对端设备故障;
若两端告警级别相同,则两端设备的通道存在故障;
故障影响展开模块A23用于判断故障影响,若设备或通道发生故障,且也没有可用的业务的保护通道,则该业务中断。
在本发明的另一个具体实施例中,模块业务通道建模模块主要根据已知的通道信息,通过加权距离计算;再由根据距离采用K-means聚类,将相近的通道放在一个类中;最后通过通道拼接,将每个类中的通道信息根据邻接点的次序信息拼接成一个完整的通道。
其中告警分析模块,首先通过告警集约,收集某个时间段内的告警。然后,主原因判断根据告警的综合级别判断其对自身设备以及对端设备的影响,最终判断是否主因告警。最后,故障影响展开基于上述中的通道信息,完成主因告警分析并展开分析其影响的通道。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。