间段的平均距离的平均值,每一时 间段的所述平均距离为该时间段内各个时间点到该时间段的中心时间点的平均距离。如果 用公式来表示段内差异参见公式(3)所示
[0043]
[0044] 其中,k为告警时间序列所划分的时间段的数量,队为第i个时间段内总的告警数 量,b为第i个时间段内第j个告警发生的时刻,g为第i个时间段的中心时间点,见公式 (2)。本实施方式首先求取每一时间段内的各个时间点即告警时刻到该时间段的中心时间 点的平均距离,该平均距离代表了该时间段内各个时间点相对于中心时间点的分布聚拢程 度,即平均距离越小,代表各个时间点越靠近中心时间点,相对于中心时间点的分布越是聚 拢的;其次,在求取平均距离的基础之上,由于每一时间段均对应一个平均距离,因此为表 征告警时间序列的时间段的内敛性,公式(3)对各个时间段的平均距离求取平均值,以该 平均值作为告警时间序列的段内差异,不仅能够表征时间段的内敛性,而且同样避免了时 间距离重复计算的问题,提高了告警时间序列的时间段划分质量评价的效率。
[0045] S120根据段间差异和段内差异的比值确定所述告警时间序列的最优划分。
[0046]由于理想的告警时间序列的时间段划分,应该是使各个时间段的中心时间点之间 的时间距离尽可能的大,即时间段的孤立性强,而每一时间段内各个时间点到该时间段的 中心时间点之间的时间距离尽可能的小,即时间段的内敛性强,上述理想的时间段划分能 够把发生告警的时间点全部集中于某几个时间段内,因此在对告警时间序列进行告警事务 的提取时,可仅对时间段进行告警事务的提取,而忽略未出现告警的空告警时间段,因此可 以极大地提尚对告警关联分析的效率,从而进一步提尚对定位网络故障的效率。故本实施 例中以告警时间序列的段间差异和段内差异的比值作为评价告警时间序列的时间段划分 质量的参数,例如,根据告警时间序列的段间差异IJt)和段内差异Cjt)构建划分质量评 价函数Q,如公式(4)所示,根据划分质量评价函数确定告警时间序列的最优划分,能够使 得对告警时间序列的时间段划分质量的评价结果更合理,同时由于该划分质量评价函数适 用于对不同划分算法的评价,因此增强了告警时间序列的时间段划分质量评价的适应性。
[0047]
[0048] S130利用滑动时间窗口法提取最优划分下每一时间段内的告警事务。
[0049] 在本实施例中,首先利用告警时间序列的段间差异和段内差异的比值确定最优划 分,即根据告警时间序列的段间差异和段内差异的比值的最大值确定对应的时间段的数 量,该时间段数量所对应的划分即为时间段的最优划分,继而在最优划分下,利用滑动时 间窗口法提取每一时间段内的告警事务,具体而言,时间窗口的窗口宽度w的取值范围为 A?,时间窗口的滑动步长的取值范围为彡AW,其中AW为时间段的宽 度,P_为时间段内不同告警情景之间的最大距离的最大值,Q_为时间段内不同告警情景 之间的最小距离的最小值;设定满足上述条件的时间窗口的窗口宽度和滑动步长后,根据 设定的窗口宽度和滑动步长提取每一时间段的告警事务,即依次向前滑动时间窗口,每次 滑动的时间长度为滑动步长的距离,且每滑动一次时间窗口,都将此时间窗口内的所有告 警事件看成一个告警事务,直到时间窗口遍历所有的时间段,既完成对告警时间序列的告 警事务的提取。本发明所提出的告警时间序列的告警事务提取方法,在提取告警事务之前, 首先对告警时间序列的时间段划分质量进行评价,以获取能够将发生告警的时间点全部集 中于某几个时间段内的最优划分结果,从而提高告警事务提取的效率,同时在最优划分下 利用滑动时间窗口对各个时间段分别提取告警事务,不仅能够将频繁发生的告警从告警时 间序列中提取出来,而且通过滑动步长的设置能够将全部的告警信息转化为告警事务,从 而为告警分析提供有力支持。
[0050] 下面将结合实例详细说明利用滑动时间窗口法提取最优划分下每一时间段内的 告警事务案的可行性。从原始告警数据中任意获取的一个告警时间序列V= {1,2, 3, 4, 6, 10, 11,12, 15, 17, 18, 19, 20, 23, 24, 25, 27, 38, 40, 41,42, 43, 44, 45, 46},参见图 2 所示, 该告警时间序列包含25个告警时间点,其中的A、B、C、D分别表示不同的告警事件;利用 基于双约束划分算法和K-平均划分算法对告警时间序列V分别进行时间段的划分,模拟 计算结果如图3所示,由图3所示的不同划分算法下划分质量评价曲线图可知,基于双约 束划分算法下在k= 3时的Q值为最大值,表明k= 3是最优划分获得的时间段数量; 根据k= 3时的基于双约束划分算法,将告警时间序列V划分成3个时间段,如图4所 示,分别为 {1,2, 3, 4, 6, 10, 11,12},T2= {15, 17, 18, 19, 20, 23, 24, 25, 27}和T3 = {38, 40, 41,42, 43, 44, 45, 46};确定最优划分获得的各个时间段之后,利用滑动时间窗口法 提取最优划分获得的每一时间段内的告警事务,例如,设定时间窗口的窗口宽度为6秒、滑 动步长为4秒时,以该时间窗口提取时间段1\= {1,2, 3, 4, 6, 10, 11,12}的告警事务,提取 的告警事务为ABC和AB;设定时间窗口的窗口宽度为5秒、滑动步长为2秒时,以该时间窗 口提取时间段T2= {15, 17, 18, 19, 20, 23, 24, 25, 27}的告警事务,提取的告警事务为ABCD、 ACD、AB和ABC,同样以该时间窗口提取时间段T3= {38, 40, 41,42, 43, 44, 45, 46}的告警事 务时,提取的告警事务为ABD和ABCD,告警事务的提取结果如表1所示。
[0051]
[0052]表1
[0053] 作为一种具体的实施方式,时间段的数量对应于段间差异和段内差异的比值,当 比值为最大值时,最大值对应的时间段的数量为最优划分获得的时间段的数量。利用划分 算法将告警时间序列划分成若干个时间段时,时间段的数量可以不同,而且时间段的数量 对时间段划分质量具有重要影响,通常情况下时间段的数量不同,时间段划分质量也不相 同,因此在本实施方式中,利用划分算法将告警时间序列划分成不同数量的时间段时,由于 每一次划分都对应于一个告警时间序列的段间差异和段内差异,因此实际上时间段的数量 与段间差异和段内差异的比值一一对应,当段间差异和段内差异的比值为最大值时,此时 最大值所对应的时间段的数量,就是最优划分获得的时间段的数量,即根据该最优划分对 告警时间序列进行划分所得到的各个时间段,相比于其他划分方式是较为理想的,此时,该 最优划分下的告警时间序列最利于提高告警事务的提取效率。
[0054] 为进一步阐述本发明所提出的告警事务提取方法,并检验本发明所提供的方法的 合理性以及正确性,下面将在MATLAB2011b数值仿真平台的基础之上,对本发明的技术方 案进行完整详细的举例说明。
[0055] 首先,为便于对本发明所提供的方法进行检验,分别取特征比较明显的三组告警 时间序列,分别记为告警时间序列I(图5)、告警时间序列II(图6)和告警时间序列III(图 7),图5~图7的纵坐标均为告警的属性,表示在某一时刻告警发生,将其属性设置为1。告 警时间序列I、告警时间序列II和告警时间序列III分别包括30个、40个、50个告警时间 点,由图5~图7可知,对于告警时间序列I、告警时间序列II和告警时间序列III而言,当 划分的时间段的数量分别为3、4和5时,得到的时间段划分结果是最优的划分结果,因为此 时各个时间段均得到了很好的聚类,也最符合实际情况。
[0056] 接下来,以两种常用的时间段划分算法一一基于双约束划分算