一种实现故障告警的方法及装置的制作方法

文档序号:7618033阅读:277来源:国知局
专利名称:一种实现故障告警的方法及装置的制作方法
技术领域
本发明涉及网络管理技术领域,尤其涉及一种实现故障告警的方法及装置。
背景技术
移动通信网络的管理领域,一般分为网元管理系统(Element ManagementSystem, EMS)和网络管理系统(Network Management System, NMS)两个层次。EMS 由设备厂商提供,NMS由运营商自己建设或者是通过第三方建设 维护。NMS通过EMS上报的告警对设备的运行情况进行监控。传统的网络维护中,WS的操作员通过EMS上报告警的告警级别来识别故障的危害性,从而判断处理的优先级别。随着现代电信业务营销和网络维护管理的精细化,运维人员越来越倾向于从故障对于运营业务的影响程度来评估故障的处理优先级别。传统的性能门限告警仅仅反映了网络质量,并没有完全和用户关注的有价值的营销业务进行对应,也没有和对其产生实际影响的物理告警关联。另外,在目前的网络管理系统中,业务和对其产生影响的故障并不存在一个明确的静态对应关系。例如,对于一个有备用电源的电源告警,其对业务没有影响,而对于一个无备用电源的轻微电源告警,对业务的影响比前者还要严重。对于匪S运维人员,如果要从业务影响程度来评估故障的处理优先级,则至少需要进行下面三个问题的思考目前系统受到影响的业务有哪些,影响的程度是多少,恢复这个业务所需要解决的故障是哪些。解决这些问题不仅需要匪S的操作员必须对告警影响的业务和相关配置属性有足够的了解,而且对于设备制造商特有的知识也要有深入的掌握;且即使在前两者具备的情况下,匪S操作员对于以上三个问题的推理判断过程也会降低处理故障的速度,因此,在这种情况下,NMS的操作员难以从恢复业务这个角度,快速安排相关故障的处理措施和优先级。

发明内容
本发明要解决的技术问题是提供一种实现故障告警的方法及装置,可以使网元管理系统根据运营业务的优先级对告警进行处理。为解决上述技术问题,本发明的一种实现故障告警的方法,包括网元管理系统在本系统中的运营业务发生异常时,将发生异常的运营业务的标识和对发生异常的运营业务产生影响的告警的标识通知给网络管理系统。进一步地,网元管理系统通过告警消息或通知消息将发生异常的运营业务的标识和对发生异常的运营业务产生影响的告警的标识通知给网络管理系统。进一步地,网元管理系统是在接收到网络管理系统发送的携带有运营业务的标识的查询请求,并确定查询请求中携带的标识指向的运营业务发生异常时,通过文件或消息将发生异常的运营业务的标识和对发生异常的运营业务产生影响的告警的标识通知给网络管理系统。
进一步地,网元管理系统还通过告警消息或通知消息将发生异常的运营业务的业务内容通知给网络管理系统,并将告警消息的类型标识为业务告警,将通知消息的类型标识为业务通知。进一步地,网元管理系统通过告警消息或通知消息中的告警内容(probableCause)字段携带发生异常的运营业务的标识;通过关联通知(correlatedNotifications)字段携带对发生异常的运营业务产生影响的告警的标识;通过相关对象属性名称(monitoredAttributes)字段和相关对象属性值(StateChangeDefinition)字段携带业务内容;通过告警类型(alarmType)字段标识告警消息的类型为业务告警;通过通知类型(notificationType)字段标识通知消息的类型为业务通知。进一步地,网元管理系统在接收到网元设备的告警后或者定时地判断本系统中的运营业务是否发生异常,在存在发生异常的运营业务时,执行将发生异常的运营业务的标 识和对发生异常的运营业务产生影响的告警的标识通知给网络管理系统。进一步地,网络管理系统在接收到网元管理系统通知的发生异常的运营业务的标识和对发生异常的运营业务产生影响的告警的标识后,根据本系统中的运营业务的优先级对发生异常的运营业务进行优先级排序,并按照优先级的先后顺序,根据对发生异常的运营业务产生影响的告警的标识对告警进行处理。进一步地,一种实现故障告警的装置,包括设置在网元管理系统中的业务信息生成单元,其中业务信息生成单元,用于在网元管理系统中的运营业务发生异常时,将发生异常的运营业务的标识和对发生异常的运营业务产生影响的告警的标识通知给网络管理系统。进一步地,业务信息生成单元通过告警消息或通知消息将发生异常的运营业务的标识和对发生异常的运营业务产生影响的告警的标识通知给网络管理系统;或者,在接收到网络管理系统发送的携带有运营业务的标识的查询请求,并确定查询请求中携带的标识指向的运营业务发生异常时,通过文件或消息将发生异常的运营业务的标识和对发生异常的运营业务产生影响的告警的标识通知给网络管理系统。进一步地,还包括设置在网络管理系统中的业务管理单元,其中业务管理单元,用于在接收到业务信息生成单元通知的发生异常的运营业务的标识和对发生异常的运营业务产生影响的告警的标识后,根据网络管理系统中的运营业务的优先级对发生异常的运营业务进行优先级排序,并按照优先级的先后顺序,根据对发生异常的运营业务产生影响的告警的标识对告警进行处理。综上所述,本发明通过上报发生异常的运营业务的标识和对异常的运营业务产生影响的告警的标识,使网络管理系统能够根据本系统中的运营业务的优先级对发生异常的运营业务进行优先级排序,从而根据运营业务的优先级对运营业务相关的告警进行处理,减少用户在处理故障过程中的推理判断时间,从而让用户快速的优先处理影响业务价值大的相关实际故障告警。


图I为本实施方式的实现故障告警的装置的结构图2为本实施方式中采用的告警消息的字段示意图;图3为本实施方式中采用的通知消息的字段示意图;图4为本实施方式的实现故障告警的方法的实施例I的流程图;图5为本实施方式的实现故障告警的方法的实施例2的流程图;图6为本实施方式的实现故障告警的方法的实施例3的流程图;图7为本实施方式的实现故障告警的方法的实施例4的流程图。
具体实施例方式本实施方式的实现故障告警的系统中包含网络管理系统(第一管理层)、网元管理系统(第二管理层)和网元设备(第三层)。网元管理系统和网元设备之间采用硬件相关的方式(私有方式)进行通信,网络管理系统和网元管理系统之间的信息交互采取如下三种方式或者三者相互组合的方式,从而让匪S获取到发生异常的运营业务的标识和关联告警的标识(I)网元管理系统通过新的告警消息的方式,将发生异常的运营业务的标识和对运营业务产生影响的告警的标识上报给网络管理系统,还可以再告警消息中携带业务内容,上述信息按照网络管理系统和网元管理系统协商的格式放置到告警消息的相应字段中。(2)网元管理系统通过通知消息将运营业务的标识和告警的标识上报到网络管理系统,其中,通知消息中还携带通知消息的主键(即,消息的唯一标识)和业务内容等,上述信息按照网络管理系统和网元管理系统协商的消息格式放置到消息的对应字段中。(3)网络管理系统发送一个或多个运营业务的识别给网元管理系统,网元管理系统在确定标识指向的运营业务发生异常时,向网络管理系统回复运营业务的标识、业务内容和告警的标识等,这是一种要求响应的方式。在以上三种方式中,由EMS上报到匪S中的告警信息中,至少包含以下两种信息(一 )运营业务的标识,是运营业务的唯一标识信息,表示网络管理统关注的运营业务的识别信息。运营业务是定义在WS和EMS上,用于运营商判别对客户的服务价值是否受损和受损程度的业务形式。当运营业务受到影响时,往往能直接判断出运营商对客户的服务价值的损失和受损程度。例如,可以将VIP用户服务质量和基站通话成功率等作为运营业务,运营业务的标识和含义的定义由EMS和WS共同定义,能共同识别。( 二)对发生异常的运营业务产生影响的告警的标识,匪S系统通过告警的标识能够关联到对应的告警,以便对运营业务紧急处理。网元管理系统在运营业务的业务质量低于网元管理系统定义的要求时,则网元管理系统认为运营业务发生异常,例如,对于运营业务“VIP用户通话”,如果受损的VIP用户数量达到网络管理系统定义的指定数值,则网元管理系统认为运营业务“VIP用户通话”发生异常。匪S与EMS之间的接口管理可采用以下方式网络管理系统可选择是否向网元管理系统下发业务过滤规则,如果下发,网元管理系统可以根据业务过滤规则来过滤上报的信息;如果无过滤规则,网元管理系统在发现运营业务异常时,获取影响运营业务的告警的标识,将运营业务的标识和告警的标识上报给匪S ;如果存在过滤规则,网元管理系统在发现运营业务异常时,根据网络管理系统下发的过滤规则对上报的信息进行过滤,将过滤后的运营业务的标识和告警的标识上报给网络管理系统,这样网络管理系统能选择过滤掉不关注和影响较小的运营业务。网络管理系统对于接收到的运营业务的标识和告警的标识,可以根据本系统中的运营业务的优先级对所述发生异常的运营业务进行优先级排序,并在界面中进行显示,同时按照发生异常的业务的优先级顺序,根据与运营业务相关的告警的标识,选出告警进行关联处理,从而使操作员可直接查看业务信息,进行优先级判断,同时根据告警的标识直接处理运营业务对应的设备告警。网元管理系统位于网络管理系统和网元设备中间,可以在网元设备上报告警或定时判断本系统中是否存在发生异常的运营业务,将发生异常的运营业务的标识和对该运营业务产生影响的告警的标识通知给网络管理系统,可以通过接口发送或者供网络管理系统查询。另外,网元管理系统也可以选择将发生异常的运营业务的标识和对运营业务产生影 响的告警的标识送到本系统的人机交互界面,供本系统的监控人员查阅。下面结合附图对技术方案的实施作进一步的详细描述图I为本实施方式实现故障告警的装置,包含在匪S中的业务管理单元11 ;EMS中的业务信息生成单元12、设备告警处理单元13和业务规则控制单元14 ;网元设备15 ;网元设备15和设备告警处理单元13之间的第一接口 17,设备告警处理13和业务信息生成单元12之间的第二接口 16,第一接口 17和第二接口 16为私有接口,不需要在电信管理接口上进行标准化;业务信息生成单元12和业务管理单元11之间的第三接口 19 ;业务规则控制单元14和业务管理单元11之间的第四接口 18;第三接口 19和第四接口 18为电信标准接口,需要对接口 18和19进行标准化。匪S通过第四接口 18下发业务过滤规则;业务信息生成单元通过接口 19上报信息,以下分别对上报的方式进行说明。图2是以一条新告警消息的方式向网络管理系统上报信息时,在现有告警消息结构中的字段内容定义,以及与原告警字段内容定义的对比。在图2中以3GPP无线标准中EMS和WS之间的告警消息为例进行说明,将发生异常的运营业务的标识放入到告警内容(probableCause)字段中,用以表示此业务的含义;增加一个新的“业务告警”类型,通过告警类型(alarmType)标识告警消息为业务告警,用于识别此告警消息是业务类告警;通过关联通知(correlatedNotifications)字段携带对所述发生异常的运营业务产生影响的告警的标识,便于匪S关联需要解决本业务的所有物理设备告警;相关对象属性名称(monitoredAttributes)字段和相关对象属性值(stateChangeDefinition)字段分别放入受影响的业务的各项业务名称和值,告警消息的其他字段内容定义和原告警字段内容定义一致。这种情况下,没有破坏原有告警字段定义的结构,可保持接口的兼容性。图3是以新的通知消息的方式上报信息到网络管理系统时,通知消息的字段定义,与告警消息的不同之处在于需要新增“业务通知”类型,在通知消息的通知类型(notificationType)字段中标识业务通知类型,如定义为notifyNewService,其他字段的含义在图中均已说明。实施例I :图4是本实施方式基于告警消息上报发生异常的运营业务的标识和对所述发生异常的运营业务产生影响的告警的标识的方法,核心思路是通过上报新告警消息的方式上报相关信息,包括步骤401 :业务管理单元下发业务过滤规则到业务规则控制单元;这个步骤是可选的,EMS会根据这个规则过滤上报的信息。步骤402 :网元设备向设备告警处理单元上报告警;步骤403 :设备告警处理单元将网元设备上报的告警转换为EMS内部告警,通知给业务信息生成单元;步骤404 :业务信息生成单元从业务规则控制单元获取业务过滤规则;在下面的步骤406中会根据此规则过滤上报的信息。步骤405 :业务信息生成单元判断本系统中是否存在发生异常的运营业务,决定是否生成告警消息;如果存在,则执行步骤406 ;如果不存在则流程结束;·EMS根据该EMS上的运营业务的特性,判断运营业务是否发生异常,由于不同EMS上的运营业务及判断标准均不相同,因此,本实施方式不对运营业务是否发生异常的标准进行限定。步骤406 :业务信息生成单元生成告警消息,在告警消息中至少加入发生异常的运营业务的标识和影响该运营业务的告警的标识,并且转化为匪S能够识别的格式,根据业务过滤规则对上报的信息进行过滤;步骤407 :业务信息生成单元通过告警接口上报告警消息到业务管理单元,告警消息的格式可以参见图2。图5是本实施方式基于定时的方式判断网元管理系统中是否存在异常运营业务的方式,与图4实施例的不同之处在于EMS是定时判断系统是否存在异常的运营业务,考虑到实施例I中针对告警连续判断并上报发生异常的业务EMS的负荷消耗大,本方式的核心思路是EMS定时检查是否存在异常的运营业务,并通过上报新告警消息的方式上报信息,包括步骤501 :业务管理单元下发业务过滤规则到业务规则控制单元;步骤502 :业务信息生成单元从业务规则控制单元获取业务过滤规则;步骤503 :业务信息生成单元定时判断本系统中是否存在发生异常的运营业务,决定是否生成告警消息;如果存在,则执行步骤504 ;如果不存在则流程结束;步骤504 :业务信息生成单元生成告警消息,在告警消息中至少加入发生异常的运营业务的标识和影响该运营业务的告警的标识,并且转化为匪S能够识别的格式,根据业务过滤规则对上报的信息进行过滤;步骤505 :业务信息生成单元通过告警接口上报告警消息到业务管理单元,告警消息的格式可以参见图2。图6是通过通知消息上报信息的流程,与上面实施例的不同之处在于EMS和匪S之间的消息接口不采用告警格式,而是采用一种独立的通知消息,包括步骤601 :匪S下发业务过滤规则到EMS业务规则控制单元中;步骤602 :网元设备向设备告警处理单元上报告警;步骤603 :设备告警处理单元将设备上报的告警转换为EMS内部告警,通知业务信息生成单元;
步骤604 :业务信息生成单元从业务规则控制单元获取业务过滤规则;步骤605 :业务信息生成单元判断本系统中是否存在发生异常的运营业务,决定是否生成通知消息;如果存在,则执行步骤706 ;如果不存在则流程结束;步骤606 :业务信息生成单元生成业务通知,在通知消息中至少加入发生异常的运营业务的标识和影响该运营业务的告警的标识,并且转化为匪S能够识别的格式,根据业务过滤规则对上报的信息进行过滤;步骤607 :业务信息生成单元通过通知接口上报通知消息到业务管理单元,通知消息的格式可以参见图3。图7是基于EMS响应的方式上报信息的流程,其核心思路是在WS发出查询请求时,EMS才反馈发生异常的运营业务的标识和影响该运营业务的告警的标识,包括
步骤701 :业务管理单元下发业务过滤规则到业务规则控制单元;步骤702 :业务管理单元向业务信息生成单元下发查询请求,查询请求中携带一个或多个运营业务的标识,查询EMS当前发生异常的运营业务;下发的查询请求中可以查询全部运营业务,也可以单独查一个或者多个运营业务。步骤703 :业务信息生成单元从业务规则控制单元获取业务过滤规则;步骤704 :业务信息生成单元判断是否存在发生异常的运营业务,如果存在,则对相应的运营业务的标识和告警的标识进行过滤;步骤705 :业务信息生成单元以匪S要求的格式将过滤后的运营业务的标识和告警的标识送往业务管理单元,要求的格式可以是文件或者是消息等。下面通过基于定时告警消息上报信息的方式,举例说明出现呼叫业务质量下降的情况下,业务告警上报的流程,包括步骤A :业务管理单元下发业务过滤规则到业务规则控制单元;步骤B :业务信息生成单元从业务规则控制单元获取业务过滤规则;步骤C :业务信息生成单元定时启动异常运营业务判决过程,通过性能数据的呼叫次数和呼叫接通次数计数器的计算结果,发现匪S定制的呼叫成功率下降到指定阈值下,启动告警消息生成过程;步骤D :业务信息生成单元的告警消息的格式按照图2的格式进行生成,EMS将运营业务的标识加入到probableCause字段中,alarmType改为“业务告警”,StateChangeDefinition放入“呼叫成功率的值”,monitoredAttributes放入“呼叫成功率”的名称;步骤E :业务信息生成单元查找相关告警,在网元I中发现“Iub 口 IP通道故障”、“CCP链路故障告警”和“接口板电源失效”,另外发现接口板无备用板,于是将这三条告警的标识加入到告警消息的correlatedNotifications字段中;步骤F :通过告警接口上报“呼叫率下降”告警消息到业务管理单元;步骤G :业务管理单元可以对“呼叫率下降”进行优先级排序,并在界面中进行显示,同时根据告警的标识,进行物理设备告警处理。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内 。
权利要求
1.一种实现故障告警的方法,包括 网元管理系统在本系统中的运营业务发生异常时,将发生异常的运营业务的标识和对所述发生异常的运营业务产生影响的告警的标识通知给网络管理系统。
2.如权利要求I所述的方法,其特征在于 所述网元管理系统通过告警消息或通知消息将发生异常的运营业务的标识和对所述发生异常的运营业务产生影响的告警的标识通知给网络管理系统。
3.如权利要求I所述的方法,其特征在于 所述网元管理系统是在接收到所述网络管理系统发送的携帯有运营业务的标识的查询请求,并确定所述查询请求中携帯的标识指向的运营业务发生异常时,通过文件或消息将发生异常的运营业务的标识和对所述发生异常的运营业务产生影响的告警的标识通知给网络管理系统。
4.如权利要求2所述的方法,其特征在于 所述网元管理系统还通过所述告警消息或通知消息将所述发生异常的运营业务的业务内容通知给所述网络管理系统,并将所述告警消息的类型标识为业务告警,将所述通知消息的类型标识为业务通知。
5.如权利要求4所述的方法,其特征在干 所述网元管理系统通过所述告警消息或通知消息中的告警内容(probableCause)字段携带所述发生异常的运营业务的标识;通过关联通知(correlatedNotifications)字段携帯对所述发生异常的运营业务产生影响的告警的标识;通过相关对象属性名称(monitoredAttributes)字段和相关对象属性值(stateChangeDefinition)字段携带所述业务内容;通过告警类型(alarmType)字段标识所述告警消息的类型为业务告警;通过通知类型(notificationType)字段标识所述通知消息的类型为业务通知。
6.如权利要求I所述的方法,其特征在干 所述网元管理系统在接收到网元设备的告警后或者定时地判断本系统中的运营业务是否发生异常,在存在发生异常的运营业务时,执行所述将发生异常的运营业务的标识和对所述发生异常的运营业务产生影响的告警的标识通知给网络管理系统。
7.如权利要求I所述的方法,其特征在于 所述网络管理系统在接收到所述网元管理系统通知的发生异常的运营业务的标识和对所述发生异常的运营业务产生影响的告警的标识后,根据本系统中的运营业务的优先级对所述发生异常的运营业务进行优先级排序,并按照优先级的先后顺序,根据所述对发生异常的运营业务产生影响的告警的标识对告警进行处理。
8.一种实现故障告警的装置,包括设置在网元管理系统中的业务信息生成単元,其中 所述业务信息生成単元,用于在所述网元管理系统中的运营业务发生异常时,将发生异常的运营业务的标识和对所述发生异常的运营业务产生影响的告警的标识通知给网络管理系统。
9.如权利要求8所述的装置,其特征在于 所述业务信息生成単元通过告警消息或通知消息将发生异常的运营业务的标识和对所述发生异常的运营业务产生影响的告警的标识通知给网络管理系统;或者,在接收到所述网络管理系统发送的携帯有运营业务的标识的查询请求,并确定所述查询请求中携帯的标识指向的运营业务发生异常时,通过文件或消息将发生异常的运营业务的标识和对所述发生异常的运营业务产生影响的告警的标识通知给网络管理系统。
10.如权利要求9所述的装置,其特征在于,还包括设置在网络管理系统中的业务管理单元,其中 所述业务管理単元,用于在接收到所述业务信息生成単元通知的发生异常的运营业务的标识和对所述发生异常的运营业务产生影响的告警的标识后,根据所述网络管理系统中的运营业务的优先级对所述发生异常的运营业务进行优先级排序,并按照优先级的先后顺序,根据所述对发生异常的运营业务产生影响的告警的标识对告警进行处理。
全文摘要
本发明公开了一种实现故障告警的方法及装置,包括网元管理系统在本系统中的运营业务发生异常时,将发生异常的运营业务的标识和对发生异常的运营业务产生影响的告警的标识通知给网络管理系统。本发明通过上报发生异常的运营业务的标识和对异常的运营业务产生影响的告警的标识,使网络管理系统能够根据本系统中的运营业务的优先级对发生异常的运营业务进行优先级排序,从而根据运营业务的优先级对运营业务相关的告警进行处理,减少用户在处理故障过程中的推理判断时间,从而让用户快速的优先处理影响业务价值大的相关实际故障告警。
文档编号H04L12/24GK102694671SQ20111007110
公开日2012年9月26日 申请日期2011年3月23日 优先权日2011年3月23日
发明者杜永生 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1