告警事务提取方法及系统的制作方法_3

文档序号:9453530阅读:来源:国知局
法和K-平均划分 算法为例,利用两种划分算法分别对告警时间序列I进行多次的时间段划分,获得具有不 同数量的时间段的划分结果,对于不同数量的时间段,分别计算相应的划分质量评价函数 (以下简称为评价函数),并绘制划分质量评价函数值随时间段数量变化的划分质量评价 曲线,在划分质量评价曲线的基础之上分析不同划分质量评价函数对时间段划分质量评价 的差异。
[0057] 对于基于双约束划分算法,其一种划分质量评价函数为
[0058]
(5)
[0059] 其中,
,k为告警时间序列划 分的时间段的数量,&为第j个时间段的中心时间点,€为第1个时间段的中心时间点。
[0060] 通常情况下,M值越大,说明时间段划分的结果越好。经数值模拟后,分别得到如 图8~图9所示的划分质量评价函数值随时间段数量变化的划分质量评价曲线图,其中图 8是利用公式(5)得到的划分质量评价曲线图,图9是利用本发明所提出的公式(4)得到 的划分质量评价曲线图。从图8的仿真结果可以看出:划分质量评价函数M随着划分的时 间段数量k值的增大呈增长趋势,在k= 3时M值并不是最大值,其原因在于,公式(5)所 示的划分质量评价函数考虑了每一个时间段与其他各时间段中心时间点之间的距离,这大 大增加了段间差异,而段内差异却随着k的增大而一直减小,因此M-直处于上升的趋势, 即表示时间段划分的数量越大,划分结果越好,这显然与图5所示的实际情况不符,也进一 步说明公式(5)所示的划分质量评价函数对告警时间序列的时间段划分并没有很好的适 应性。实际上,告警时间序列的划分可以抽象为一维数据的聚类,而公式(5)所示的划分质 量评价函数却更适合在二维及高维数据中使用。同样是基于双约束划分算法对时间段进行 不同时间段数量的划分,利用本发明所提出的划分质量评价函数,得到如图9所示的划分 质量评价曲线图,由图9可知,Q值随着k值的增大呈现先增大后减小的趋势,并且在k= 3 时达到最大,说明此时的划分结果最优,与告警时间序列I的实际情况相符合。同时由于本 发明所提供的划分质量评价函数中段间差异的计算减弱了其在Q中的增长速度,因而使得 Q在合理的划分时间段数量下取得最大值,从而很好地符合时间段划分的实际情况,对告警 时间序列的时间段划分具有较佳的适应性。
[0061] 在K-平均划分算法中,通常以距离代价函数F作为划分质量评价函数,并根据距 离代价最小准则求解最优划分下的时间段数量,即时间段数量k的最优选择为mink), k 距离代价函数F的具体计算方法为:
[0062] F = L+D (6)
[0063] 其中,
为段内距离,k为告警时间序列划 分的时间段的数量,&为第j个时间段的中心时间点,t。为告警时间序列中全部告警时间点 的中心时间点。
[0064] 经数值模拟后,分别得到如图10~图11所示的划分质量评价函数值随时间段数 量变化的划分质量评价曲线图,其中图10是利用公式(6)得到的划分质量评价曲线图,图 11是利用本发明所提出的公式(4)得到的划分质量评价曲线图。从图10的仿真结果可以 看出:F值随着划分的时间段数量k值的增大呈不稳定趋势,其在k= 3时F值并不是最小 值,即该划分质量评价函数在告警时间序列的时间段划分质量评价中,效果不是最优的。而 利用本发明所提出的划分质量评价函数,得到如图11所示的划分质量评价曲线图,由图11 可知,Q值随着k值的增大呈现先增大后减小的趋势,并且在k= 3时达到最大,说明此时 的划分结果最优,与告警时间序列A的实际情况相符,也说明本发明所提出的划分质量评 价函数对告警时间序列的时间段划分具有较佳的适应性。
[0065] 除分别利用基于双约束划分算法和K-平均划分算法对告警时间序列I进行时间 段划分,获得不同划分质量评价函数的数值模拟结果并以此说明本发明所提出的时间段划 分质量评价函数的优越性之外,本发明还分别对告警时间序列II和告警时间序列III也分 别进行了数值模拟,根据本发明所提出的划分质量评价函数,得到如图12~图13所示的划 分质量评价曲线图,其中,图12是基于上述两种划分算法对告警时间序列II的不同数量的 时间段划分结果的数值模拟,图13基于上述两种划分算法对告警时间序列III的不同数量 的时间段的划分结果的数值模拟。从仿真结果可以看出:Q值随着划分的时间段数量k值 的增大呈不稳定趋势而非递增趋势,其分别在图12中k = 4和图13中k=5时Q达到最 大值,即k=4和k=5分别是告警时间序列II和告警时间序列III的最优划分,这与告 警时间序列II和告警时间序列III的实际情况相符,也进一步说明本发明所提出的告警时 间序列的时间段划分质量评价方法具有一定的普适性。
[0066] 相应地,本发明还提出一种告警事务提取系统,在其中一个实施例中,参见图14, 告警事务提取系统包括划分单元1400、计算单元1410、判断单元1420和提取单元1430,下 面对各个单元分别予以说明:
[0067] 划分单元1400,用于将告警时间序列划分成若干个时间段;
[0068] 告警时间序列是网络中原始告警数据中发生告警的时间点的集合,即告警时间序 列是由告警时刻或者告警时间点组成的,例如告警时间序列V= {tj,i= 1,2, . . .,K,其 中,示第个i告警发生的时刻,在该告警时间序列中共有K个告警;划分单元1400对 告警时间序列进行所谓的划分,是指划分单元1400利用一定的算法根据告警时间序列的 分布特征将各个告警时刻聚类为若干个时间段。
[0069] 计算单元1410,用于根据各个相邻的所述时间段中心时间点确定告警时间序列的 段间差异,同时根据每一时间段内的各个时间点确定告警时间序列的段内差异;
[0070] 告警时间序列的段间差异表征的是划分单元1400将告警时间序列划分后得到的 各个时间段的孤立性,段内差异表征的是各个时间段的内聚性,计算单元1410在计算告警 时间序列的段间差异和段内差异时,实际可以采用多种计算方式,而作为一种优选的实施 方式,计算单元1410根据各个相邻的时间段中心时间点确定告警时间序列的段间差异,以 及根据每一时间段内的各个时间点确定告警时间序列的段内差异的计算方式,具体如下:
[0071] 作为一种具体的实施方式,计算单元1410确定的段间差异为各个相邻的时间段 中心时间点之间距离的平均值,参见公式(1)所示。本实施方式通过求取划分告警时间序 列后得到的各个时间段的中心时间点,对各个时间段的中心时间点求取平均值,并以该平 均值作为告警时间序列的段间差异,不仅能够表征时间段的孤立性,而且避免了时间距离 重复计算的问题,提高了告警时间序列的时间段划分质量评价的效率。
[0072] 作为一种具体的实施方式,计算单元1410确定的段内差异为各个时间段的平均 距离的平均值,每一时间段的所述平均距离为该时间段内各个时间点到该时间段的中心时 间点的平均距离,参见公式(3)所示。本实施方式首先求取每一时间段内的各个时间点即 告警时刻到该时间段的中心时间点的平均距离,该平均距离代表了该时间段内各个时间点 相对于中心时间点的分布聚拢程度,即平均距离越小,代表各个时间点越靠近中心时间点, 相对于中心时间点的分布越是聚拢的;其次,在求取平均距离的基础之上,由于每一时间段 均对应一个平均距离,因此为表征告警时间序列的时间段的内敛性,公式(3)对各个时间 段的平均距离求取平均值,以该平均值作为告警时间序列的段内差异,不仅能够表征时间 段的内敛性,而且同样避免了时间距离重复计算的问题,提高了告警时间序列的时间段划 分质量评价的效率。
[0073] 判断单元1420,用于根据段间差异和所述段内差异的比值确定所述告警时间序列 的最优划分。<
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1