专利名称:一种告警风暴下的数据处理方法
技术领域:
本发明涉及移动通信网络发生告警风暴时网管系统的数据处理技术具体地说是一种告警风暴下的数据处理方法,。
背景技术:
在移动通信网络中,当管理网元发现影响正常业务的故障时,这些重要的故障信息会以告警的方式在第一时间通知管理人员并应该立即得到解决。告警风暴指管理网元在短时间内发送告警数据量超过正常范围,告警风暴会导致告警积压。在这种极端的情况下,网管系统会出现处理异常,不能使管理人员及时得到故障信息,失去有效监控网络的作用。
发明内容
本发明的目的是提供一种告警风暴下的数据处理方法。本发明的目的是按以下方式实现的,通过实时分析告警接口流量,判断告警风暴发生原因,及时切换处理流程,在处理引擎中增加压缩/频次关联,过滤掉重复或者无用信息,来加快处理速度提高工作效率,降低监控难度,具体步骤如下
告警流量实时分析
根据采集源建立不同的采集消息队列,每个采集消息队列建立实时流量分析,按每分钟统计收到的告警信息条数,当消息队列达到一定门限时,当网管系统不能及时处理时,则发生告警积压的现象,采集消息队列实时探测流量数据,设立正常处理门限和简单处理门限两级处理门限如果超过正常处理门限,则对告警只根据原始的告警正文做简单的分析,直接通过快速通道送到告警客户端;对直接通道发送的数据,应用层在单独窗口呈现,不能影响正常告警窗口 ;如果超过正常处理,并且超过简单处理门限,则系统不做任何处理直接丢弃掉;
告警压缩处理
告警压缩处理功能的目的是为了消除大量重复信息对值班人员的干扰,从中提炼出对用户真正有用的信息呈现给用户,当系统在限定时间内收到重复发送的同一告警时,系统会自动消除重复的告警,只保留最初一条告警,同时记录告警重复上报的次数以及上报的时间;
警重复上报故障发生在同一网元相同类型的一批告警,其发生时间和清除时间多为同时发生,同时清除,对于此类告警我们就需要对其进行压缩,减少监控干扰;
告警存储与压缩决定了告警信息如何在数据库中进行存储或更新,对于活动告警,则需要插入到活动告警表中,对于同一个故障导致反复上报活动告警的情况,用户设置告警压缩规则对告警进行压缩合并存储,系统将不再存储重复的告警,而是只在附加信息中记录告警上报的总次数,以及各条重复告警的告警号、告警发生时间、告警级别的信息;
对于确认告警则需要更新活动告警表中记录的确认信息,包括确认人、确认时间、确认标志;
对于清除告警则需要删除活动告警表中的记录,然后插入新记录到历史告警表中; 告警瞬断处理
某些告警发生后,接着在很短的时间内就会收到相应的清除告警,则系统视此告警为瞬断告警;
系统支持对瞬断告警进行延时上报功能,当且仅当某一告警在指定的时间门限内未被清除时,才将该告警发送到前台进行监控。如果在此设定时间内告警已被清除,则将不会被发送到监控前台;
告警延迟功能针对如下情况即在某一持续较短的时间内,网络出现偶发性故障,经过很短的时间后故障问题消失,这类故障的产生基本上没有什么规律可循,并且不会对系统运行产生不良影响。本发明的优异效果是告警延迟上报功能针对经常大量产生的瞬断、闪断告警,根据用户的条件设置进行短期迟滞,在告警产生后,不直接呈现给用户,而是延迟一段时间后再进行处理,这样对于真正的闪断、瞬断告警,在合理的延迟时间内就会收到清除告警从而不必向值班人员呈现这类告警信息,从而有效减少对值班人员带来的干扰。
图I是告警流量分析图。
具体实施例方式参照说明书附图对本发明的作以下详细地说明。本发明的方法是通过实时分析告警接口流量,判断告警风暴发生原因,及时切换处理流程,加快处理速度。另外,在处理引擎中增加压缩/频次等关联,过滤掉重复或者无用信息,提高工作效率,降低监控难度。告警流量实时分析
采集消息队列应该根据采集源建立不同的队列。每个采集消息队列都应该建立实时流量分析,按每分钟统计收到的告警信息条数。当消息队列达到一定门限时,网管系统不能及时处理,发生告警积压的现象。采集队列实时探测流量数据,设立两级处理门限正常处理门限和简单处理门限。如果超过正常处理门限,则对告警只根据原始的告警正文做简单的分析,直接通过快速通道送到告警客户端。对直接通道发送的数据,应用层在单独窗口呈现,不能影响正常告警窗口。如果超过正常处理,并且超过简单处理门限,则系统直接丢弃掉,不做任何处理。告警压缩处理
告警压缩处理功能的目的是为了消除大量重复信息对值班人员的干扰,从中提炼出对用户真正有用的信息呈现给用户。具体而言就是,当系统在限定时间内收到重复发送的同一告警时,系统会自动消除重复的告警,只保留最初一条告警,同时记录告警重复上报的次数以及上报的时间。此类故障发生在同一网元相同类型的一批告警,其发生时间和清除时间多为同时发生,同时清除。对于此类告警我们就需要对其进行压缩,减少监控干扰
告警存储与压缩决定了告警信息如何在数据库中进行存储或更新。对于活动告警则需要插入到活动告警表中。对于同一个故障导致反复上报活动告警的情况,用户可以设置告警压缩规则对告警进行压缩合并存储,系统将不再存储重复的告警,而是只在附加信息中记录告警上报的总次数,以及各条重复告警的告警号、告警发生时间、告警级别等信息。 对于确认告警则需要更新活动告警表中记录的确认信息,如确认人、确认时间、确认标志。对于清除告警则需要删除活动告警表中的记录,然后插入新记录到历史告警表中。告警瞬断处理
某些告警发生后,接着在很短的时间内就会收到相应的清除告警,则系统视此告警为
瞬断告警。系统支持对瞬断告警进行延时上报的功能,当且仅当某一告警在指定的时间门限内未被清除时才将该告警发送到前台进行监控。如果在此设定时间内告警已被清除,则将不会被发送到监控前台。告警延迟功能针对的是这样一种情况即在某一持续较短的时间内,网络出现偶发性故障,经过很短的时间后故障问题消失,这类故障的产生基本上没有什么规律可循,并且一般不会对系统运行产生不良影响。如果系统不对这类告警做任何处理而直接呈现给用户,则用户在处理时基本上不会有什么结果,或者当维护人员去处理时,发现故障已经消失,结果就是白白耗费人力。除说明书所述的技术特征外,均为本专业技术人员的已知技术。
权利要求
1.一种告警风暴下的数据处理方法,其特征在于通过实时分析告警接口流量,判断告警风暴发生原因,及时切换处理流程,在处理引擎中增加压缩/频次关联,过滤掉重复或者无用信息,来加快处理速度提高工作效率,降低监控难度,具体步骤如下 告警流量实时分析 根据采集源建立不同的采集消息队列,每个采集消息队列建立实时流量分析,按每分钟统计收到的告警信息条数,当消息队列达到一定门限时,当网管系统不能及时处理时,则发生告警积压的现象,采集消息队列实时探测流量数据,设立正常处理门限和简单处理门限两级处理门限如果超过正常处理门限,则对告警只根据原始的告警正文做简单的分析,直接通过快速通道送到告警客户端;对直接通道发送的数据,应用层在单独窗口呈现,不能影响正常告警窗口 ;如果超过正常处理,并且超过简单处理门限,则系统不做任何处理直接丢弃掉; 告警压缩处理 告警压缩处理功能的目的是为了消除大量重复信息对值班人员的干扰,从中提炼出对用户真正有用的信息呈现给用户,当系统在限定时间内收到重复发送的同一告警时,系统会自动消除重复的告警,只保留最初一条告警,同时记录告警重复上报的次数以及上报的时间; 警重复上报故障发生在同一网元相同类型的一批告警,其发生时间和清除时间多为同时发生,同时清除,对于此类告警我们就需要对其进行压缩,减少监控干扰; 告警存储与压缩决定了告警信息如何在数据库中进行存储或更新,对于活动告警,则需要插入到活动告警表中,对于同一个故障导致反复上报活动告警的情况,用户设置告警压缩规则对告警进行压缩合并存储,系统将不再存储重复的告警,而是只在附加信息中记录告警上报的总次数,以及各条重复告警的告警号、告警发生时间、告警级别的信息; 对于确认告警则需要更新活动告警表中记录的确认信息,包括确认人、确认时间、确认标志; 对于清除告警则需要删除活动告警表中的记录,然后插入新记录到历史告警表中; 告警瞬断处理 某些告警发生后,接着在很短的时间内就会收到相应的清除告警,则系统视此告警为瞬断告警; 系统支持对瞬断告警进行延时上报功能,当且仅当某一告警在指定的时间门限内未被清除时,才将该告警发送到前台进行监控,如果在此设定时间内告警已被清除,则将不会被发送到监控前台; 告警延迟功能针对如下情况即在某一持续较短的时间内,网络出现偶发性故障,经过很短的时间后故障问题消失,这类故障的产生基本上没有什么规律可循,并且不会对系统运行产生不良影响。
全文摘要
本发明提供一种告警风暴下的数据处理方法,该技术通过实时分析告警接口流程,判断告警风暴发生原因,及时切换处理流程,加快处理速度。另外,在处理引擎中增加压缩/频次等关联,过滤掉重复或者无用信息,提高工作效率,降低监控难度。
文档编号H04W24/04GK102625349SQ201210060790
公开日2012年8月1日 申请日期2012年3月9日 优先权日2012年3月9日
发明者韦义 申请人:浪潮通信信息系统有限公司