专利名称:一种网元信令跟踪动态流量控制的方法及系统的制作方法
技术领域:
本发明涉及移动通信网中网元信令跟踪系统,尤其涉及一种移动通信网中 网元信令跟踪动态流量控制的方法及系统。
背景技术:
在移动通讯网元设备的故障定位中,信令跟踪是最有效的故障定位工具。 故障原因不明时,在不明显影响业务功能的条件下,跟踪过滤条件的范围会设 置得比较宽,尽可能多的网元信令消息会传送到网元的网管服务器,网管服务 器分析消息后转发到客户端,以分析定位故障。在进行信令跟踪时,网元设备 相当于一个分布式处理系统,通常会有数十块业务处理单板处理呼叫信令,在
信令跟踪处于激活状态的同时发送信令跟踪数据消息(Signaling Tracing Data Message, STDM)到网管服务器,而网元设备的网管服务器作为单机系统,网 管服务器对网元设备发送的STDM的接收处理能力远远小于网元设备向其发送 STDM的能力,如果不做流量控制,会导致网管服务器CPU负荷长期100%, 网管服务器和网元设备的网管带宽被STDM完全挤占,以至于网元设备的性能、 告警等重要基本功能消息无法上报,网管客户端的操作也无法响应等异常情况, 所以网元信令跟踪系统必须进行网管服务器信令跟踪数据消息的流量控制,保 证网管服务器其他基本功能的正常运行。
目前STDM流量控制的方式如图l所示,在网元设备侧或网管服务器侧实 时计算STDM的流量,设置一个最大的STDM流量门限值,如果STDM流量 超过该最大的STDM流量门限值,则网元设备的信令跟踪管理进程就会停止当 前的信令跟踪,或者网管服务器就会丢弃STDM。最大STDM流量门限值在网 元设备的配置管理系统中进行配置,该值是一个相对固定的值。然而,对网元信令跟踪设置一个合适的最大STDM流量门限值是比较困难的,为保证网管服 务器的正常运行,该值的缺省值设置一般都偏小,在实际使用信令跟踪功能过 程中很容易产生当前STDM流量超过最大STDM流量门限值的情况,在这种情 况产生时,信令跟踪会被自动被停止,无法继续进行信令跟踪。搡作人员需要 逐步增大门限值进行信令跟踪,重新激活信令跟踪,观察网管系统的当前运行 状态,当网管服务器CPU负荷持续保持高位(〉80%)时,可以认为当前流量已经 达到系统可承受的最大STDM流量门限。
目前的固定门限的STDM流量控制技术在使用中有几个缺陷
1、 使用不方便,最大STDM流量门限的固定值需要不断调整,同网管服 务器的处理能力相关,影响处理能力的因素包括服务器的硬件、网管系统处理 业务量、网络带宽等,只能凭经验估计。
2、 瞬间流量超最大STDM流量门限值就立即停止信令跟踪,没有抗瞬间 大流量冲击的能力。
3、 当最大STDM流量门限值超过网管服务器的实际处理能力时目前的处 理方式是在网管服务器创建STDM緩存区,当STDM緩冲区满时丟弃消息。然 而,对于信令跟踪功能模块基本要求是网元设备发送到网管系统的信令消息不 能丢弃,因此当最大STDM流量门限值超过网管服务器的实际处理能力时,目 前的处理方式不能满足信令跟踪功能模块的基本要求。
由于存在上述缺陷,使得目前的STDM的流量控制方式不能满足移动通讯 系统使用信令跟踪快速定位故障的要求。
发明内容
有鉴于此,本发明的主要目的之一在于提供一种网元信令跟踪动态流量控 制的方法,用来解决现有固定门限流量控制方式抗瞬时大流量沖击能力不佳、 最大流量门限值超过网管服务器的实际处理能力时丢弃信令消息等技术问题。 为达到上述目的,本发明的技术方案是这样实现的 一种网元信令跟踪动态流量控制的方法,包括如下步骤网元设备周期性地向网管服务器发送负荷状态查询消息;
网管服务器查询当前自身负荷状态,并向网元设备反馈负荷状态查询响应
消息,所述状态查询响应消息中包含服务器负荷状态指示;
网元设备根据服务器负荷状态指示判断网管服务器当前是否处于超负荷状 态,若是,则所述网元设备停止信令跟踪。
网元设备包括外围单板和系统控制管理板(Operation Main Processor, MP),本发明4巴单向固定值流量控制改为双向流量控制,由网元i殳备的OMP 上的信令跟踪管理进程定时周期性向网管服务器发送负荷状态查询消息,网管 服务器收到负荷状态查询消息后查询本服务器当前负荷状态并返回负荷状态査 询响应消息给信令跟踪管理进程,信令跟踪管理进程收到网管服务器反馈的负 荷状态查询响应消息后根据该消息中包含的服务器负荷状态指示进行判断,如 果没有超负荷,就不做任何处理,否则网元设备的信令跟踪管理进程就向网元 设备中的所有外围单板上的跟踪子系统进程发送"去激活跟踪消息",停止当前 的信令跟踪,这样就达到动态控制流量的效果。
进一 步地,本发明通过检测网管服务器上的信令跟踪数据消息緩冲区 (STDM Buffer,以下筒称STDM緩冲区)使用率来判断网管服务器的负荷状 态。通常,影响网管服务器对STDM处理能力的因素较多,不适合简单以某一 个因素作为判断的依据,如服务器CPU负荷是一个最重要的指标,但是还需要 结合客户端和服务器的网络带宽等其他因素才能更加准确的做出判断。不管有 多少相关因素,最终导致的结果都是STDM緩沖区中的消息数据无法及时被处 理。本发明建立一个专门的数据緩冲区来保存STDM,网管服务器收到网元设 备发送来的STDM后,直接将其插入STDM緩沖区;网管服务器上的信令跟踪 数据消息处理线程(STDM thread,以下简称STDM处理线程)从STDM緩冲 区中提取STDM进行处理。在上述的实现条件下分析有关STDM緩冲区的使用 率的变化可以分为以下几种情况
1、当STDM的流量小于或等于网管服务器的处理能力时,STDM緩冲区 中的消息可以立即-故处理,STDM緩冲区的使用率为0。2、 当STDM的流量瞬时大于网管服务器的处理能力时,STDM緩沖区中 会积压一定数量的STDM,在STDM的流量下降后,积压的STDM会不断被处 理,STDM緩冲区的使用率会很快重新降为0。
3、 当STDM的流量持续大于网管服务器的处理能力时,STDM緩冲区中 会持续积压STDM, STDM缓沖区的使用率也会持续上升,直到緩冲区满,消 息不得不被丢弃。
从上面的分析可以看出STDM緩冲区的使用率完全可以指示网管服务器对 STDM的处理能力,如果STDM緩冲区中有消息积压就说明当前STDM的流量 超过了网管服务器的处理能力。
进一步地,本发明为实现短时间抗大数据流量的技术目的,本发明不把 STDM緩冲区中的消息数量大于0作为STDM流量超负荷的指标,而是为STDM 緩沖区设置一个最大使用率门限,在STDM緩冲区的使用率大于设定的STDM 缓沖区最大使用率门限时才认为流量超负荷,需要停止当前信令跟踪以控制流 量。
由于OMP上的信令跟踪管理进程是定时向网管服务器查询负荷状态,为 了保证在网管服务器的STDM緩冲区满前通知网元设备停止信令跟踪,从而停 止发送STDM,本发明通过如下方式设定和计算STDM緩冲区最大使用率
STDM緩沖区最大使用率^(C-A^B)/C
其中,A代表网管服务器接收STDM的最大速率,B代表网元设备上的信 令跟踪管理进程定时查询网管服务器负荷状态的周期,C代表STDM緩冲区中 可容纳的最大STDM消息条数。
例如,STDM緩冲区中最多可保存20000条信令数据消息,网管服务器每 秒最多接收2000条消息,网元跟踪管理进程定时5秒查询网管服务器负荷状态, 那么,STDM緩沖区最大使用率=(20000-2000*5)/20000=50%。在这种条件下, 网管服务器收到负荷状态查询消息,如果STDM緩冲区使用率超过50%,就在 反馈的负荷状态查询响应消息中标识当前服务器状态为超负荷状态,这样网元 设备的信令跟踪管理进程就会通知外围单板停止当前激活的信令跟踪,网管服务器也就再不会收到后续新的STDM,随着STDM处理线程的不断处理,STDM 缓冲区的消息数量不断减少,直至为O。
本发明提供了 STDM緩冲区大小和STDM緩冲区最大使用率的设置功能, 用来调整STDM緩冲区的大小和STDM緩沖区的最大使用率,这样可以实现 最大化抗大数据流量冲击时间的调整,STDM緩冲区越大或緩冲区使用率越大, 抗大数据流量沖击时间越长。
进一步地,本发明为了避免当STDM大流量时,STDM处理线程占用大量 网管服务器CPU资源,其他业务功能线程由于没有CPU资源无法执行,从而 导致网管服务器功能异常的情况的出现,本发明将STDM接收和STDM处理分 为单独的两个线程执行,并且降低STDM处理线程的优先级。本发明在创建 STDM处理线程时设置其线程优先级比系统默认的线程优先级低一个级别,服 务器的其它线程优先级比它高。这样STDM处理线程只会在其他线程都能正常 执行,网管服务器CPU空闲时才会被操作系统调用,当STDM大流量时就不 会出现STDM处理线程占用网管服务器CPU资源,其他业务功能线程由于没 有CPU资源无法执行,从而导致网管服务器功能异常的情况。另外,如果网管 服务器上其他业务功能线程繁忙时CPU负荷高,STDM处理线程不会被执行, STDM緩沖区中的消息不被处理就会积压,使得STDM緩沖区的使用率超过最 大使用率门限,从而触发信令跟踪流量控制流程。
本发明另 一发明目的是提供一种网元信令跟踪动态流量控制的系统,如图 2所示,该系统包括网元设备和网管服务器。所述网元设备包括外围单板、OMP, 外围单板包含跟踪子系统;OMP包含信令跟踪管理进程。网管服务器包括以下
几个纟莫块
STDM缓冲区,用于緩冲STDM;
STDM接收线程,用于接收网元设备发送的STDM并将其传送到STDM緩 冲区,以及接收和处理网元设备发送的负荷状态查询消息;
STDM处理线程,用于/人STDM緩冲区中获耳又STDM并进行处理; 网元设备周期性向网管服务器发送负荷状态查询消息,STDM接收线程根据当前STDM緩沖区的使用率向网元设备反馈当前服务器负荷状态,当服务器
负荷状态为超负荷时,网元设备中的信令跟踪管理进程通知所有外围单板停止
信令跟踪,从而使外围单板中的跟踪子系统停止向网管服务器发送STI)M。
图1为现有STDM流量控制方法的系统结构示意图; 图2为本发明STDM流量控制方法的系统结构示意图; 图3为本发明STDM流量控制方法的信令时序流程图。
具体实施例方式
为使本发明的目的、技术方案和优点更加清楚明白,以下举实施例并参照 附图,对本发明进一步详细说明。
本发明STDM流量控制方法的信令时序流程图中如图3所示,以下分别对 激活跟踪、STDM上冲艮、STDM流量控制、去激活跟踪的处理流程进行说明
一、 激活跟踪时序流程
用户在网管客户端设置信令跟踪的过滤条件,确认激活信令跟踪,网管客 户端发送激活信令跟踪消息到网管服务器;网管服务器收到激活信令跟踪消息 后将其转发到OMP上的信令跟踪管理进程;信令跟踪管理进程收到后再将其 转发到对应的外围单板上的跟踪子系统;外围单板上的跟踪子系统设置跟踪激 活标志,保存跟踪过滤条件,返回激活成功应答;信令跟踪管理进程收到激活 成功应答后将其转发到网管服务器;网管服务器收到激活成功应答后再转发到 对应的激活信令跟踪的网管客户端。附图3中,激活信令跟踪的网管客户端可 以是多个,而一个网管客户端激活信令跟踪时是在网元设备上对多个外围单板 激活信令跟踪,只需要网管客户端收到一个外围单板上报的激活成功应答,就 可以认为本次信令跟踪激活成功,因为这样就可能收到激活成功的外围单板上 报的STDM。
二、 信令跟踪数据消息上报时序流程外围单板的信令处理进程在处理信令消息时查询跟踪系统本类型信令消息 是否被跟踪,如果被跟踪还要分析该信令消息是否匹配信令跟踪消息的过滤条 件,如果符合就向信令跟踪管理进程上报该信令跟踪数据消息;信令跟踪管理 进程收到上报的STDM后将其转发到网管服务器。当网管服务器收到转发的
STDM时,将其保存到STDM緩冲区中,由STDM处理线程/人STDM緩冲区 中逐个获取STDM并进行处理。由于一个STDM可以对应到多个网管客户端的 信令跟踪,所以STDM处理线程需要解析每个STDM,分析其对应的网管客户 端,并向对应的网管客户端转发;网管客户端收到STDM后对其进行解析,在 网管客户端的信令跟踪数据窗口显示用户可读的解析结果。 三、信令跟踪数据消息流量控制时序流程
OMP上的信令跟踪管理进程根据状态监视定时器的定时信号周期性地向 网管服务器发送查询网管服务器STDM流量的负荷状态查询消息,网管服务器 上的信令跟踪数据消息接收线程接收到负荷状态查询消息后检测网管服务器的 STDM緩沖区的使用率,向信令跟踪管理进程反馈负荷状态查询响应消息,负 荷状态查询响应消息中包含负荷状态指示,负荷状态指示可以为布尔型值,为 TRUE时表示网管服务器当前处于超负荷状态,为FALSE时表示网管服务器当 前处于正常运行状态。如果STDM緩冲区使用率大于设定的最大使用率,则负 荷状态就是超负荷状态,负荷状态指示为TRUE,否则负荷状态就是正常。网 元设备中的信令跟踪管理进程收到网管服务器返回的负荷状态查询响应消息后 冲艮据负荷状态指示进行判断,如果网管服务器处于超负荷状态,则向所有外围 单板上的跟踪子系统发送停止所有的信令跟踪的消息;外围单板上的跟踪子系 统收到停止跟踪的消息后清除激活跟踪标志和跟踪过滤条件,这样STDM就不 会再上报。网元设备中的信令跟踪管理进程向所有外围单板上的跟踪子系统发 送停止所有的信令跟踪的消息后还要向网管服务器发送跟踪通知消息,通知网 管系统由于流量超负荷,当前信令跟踪已经去激活;网管服务器收到跟踪通知 消息转发到网管客户端,网管客户端收到跟踪通知消息后解析该消息并在客户 端界面上显示,通知用户当前信令跟踪已经去激活,去激活的原因是流量超负荷。而STDM处理线程继续处理STDM緩沖区中的STDM,直到STDM緩冲 区中的消息全部处理完毕。
户端会设置所有信令跟踪任务状态为异常停止,对于异常停止任务再激活可以 有两种方式激活
一种是通过人工操作方式激活;另一种是通过在网管客户端上设置一个定 时执行任务,定时检查是否有异常停止的任务,若检测到有异常停止的任务, 则自动重激活。
上述两种方式信令跟踪任务再次激活后如果流量再次超负荷,那么通过流 量控制就会再次停止信令跟踪任务。所以对于异常停止任务的自动重激活通常 进行延时处理,以防止信令数据消息流量短时间不断振荡。
四、去激活跟踪时序流程
用户在激活跟踪的网管客户端去激活信令跟踪,网管客户端发送去激活信 令跟踪的消息到网管服务器;网管服务器收到去激活跟踪消息后转发到OMP 上信令跟踪管理进程;信令跟踪管理进程收到跟踪去激活消息后再转发到对应 的外围单板上的跟踪子系统;外围单板上的跟踪子系统收到去激活跟踪消息后 清除跟踪激活标志和跟踪过滤条件,返回去激活成功应答;信令跟踪管理进程 收到去激活成功应答消息后转发到网管服务器;网管服务器收到去激活成功应 答消息后转发到对应的去激活信令跟踪的网管客户端。网管客户端在发送完成 去激活消息后就停止接收处理信令跟踪数据消息,保证用户消息响应的及时性。
通过本发明所述方法,如果信令跟踪流量超过网管服务器处理能力,就会 导致STDM緩沖区消息积压超过门限触发流量控制,与现有技术相比能够准确 的控制网元STDM流量,充分发挥网管服务器的处理能力并能有一定的瞬时大 流量处理能力,操作维护人员也不需要再测试调整信令跟踪最大消息流量门限 值,如果更换了硬件性能更强的网管服务器,信令跟踪的最大流量门限也能自 动提高。
以上所述,仅为本发明的较佳实施例,并非用于限定本发明的保护范围。
权利要求
1、一种网元信令跟踪动态流量控制的方法,其特征在于,包括如下步骤网元设备周期性地向网管服务器发送负荷状态查询消息;网管服务器查询当前自身负荷状态,并向网元设备反馈负荷状态查询响应消息,所述负荷状态查询响应消息中包含负荷状态指示;网元设备根据负荷状态指示判断网管服务器当前是否处于超负荷状态,若是,则所述网元设备停止信令跟踪。
2、 根据权利要求1所述的方法,其特征在于,在信令跟踪激活状态下,信 令跟踪数据消息由所述网元设备发送给所述网管服务器,所述网管服务器通过 单独的信令跟踪数据消息接收线程接收所述信令跟踪数据消息,并将其存储于 信令跟踪数据消息緩冲区,由信令跟踪数据消息处理线程从所述信令跟踪数据 消息緩沖区获取所述信令跟踪数据消息并对其进行处理。
3、 根据权利要求2所述的方法,其特征在于,所述信令跟踪数据消息处理 线程在创建时其线程优先级设定为低于系统默认的线程优先级。
4、 根据权利要求2所述的方法,其特征在于,所述网管服务器通过如下方 式查询当前自身负荷状态计算当前信令跟踪数据消息緩沖区的使用率;判断当前信令跟踪数据消息緩沖区的使用率是否大于设定的信令跟踪数据 消息缓冲区的最大使用率,若是,则所述网管服务器当前处于超负荷状态;若 否,则所述网管服务器当前处于正常状态。
5、 根据权利要求4所述的方法,其特征在于,所述信令跟踪数据消息緩沖 区的最大使用率通过如下方式进行设定M= ( C-A*B ) /C其中,M代表信令跟踪数据消息緩冲区的最大使用率,A代表网管服务器 接收信令跟踪数据消息的最大速率,B代表网元设备查询网管服务器负荷状态 的查询周期,C代表信令跟踪数据消息緩冲区中可容纳的最大信令跟踪数据消息的条数。
6、 一种网元信令跟踪动态流量控制的系统,包括网元设备、网管服务器,其特征在于,所述网管服务器包括用于緩冲信令跟踪数据消息的信令跟踪数据消息緩冲区;所述网管服务器根据所述信令跟踪数据消息緩沖区的当前使用率 是否大于信令跟踪数据消息緩沖区的最大使用率来判断所述网管服务器当前是 否处于超负荷状态。
7、 根据权利要求6所述的系统,其特征在于,所述网管服务器还包括 信令跟踪数据消息接收线程,用千接收网元设备发送的信令跟踪数据消息; 信令跟踪数据消息处理线程,用于从所述信令跟踪数据消息緩冲区中获取信令跟踪数据消息并进行处理。
8、 根据权利要求7所述的系统,其特征在于,所述网元设备周期性地向所 述网管服务器发送负荷状态查询消息,所述信令跟踪数据消息接收线程接收到 所述负荷状态查询消息后,将所述网管服务器的当前负荷状态通过负荷状态查 询响应消息反馈给所述网元设备。
9、 根据权利要求8所述的系统,其特征在于,所述网元设备根据所述负荷 状态查询响应消息判断所述网管服务器当前是否处于超负荷状态,若是,则网 元设备停止信令跟踪。
10、 根据权利要求7所述的系统,其特征在于,所述信令跟踪数据消息处 理线程的线程优先级低于系统默认的线程优先级。
11、 根据权利要求6所述的系统,其特征在于,所述信令跟踪数据消息緩 冲区的最大使用率通过如下方式进行设定<formula>formula see original document page 3</formula>其中,M代表信令跟踪数据消息緩冲区的最大使用率,A代表网管服务器 接收信令跟踪数据消息的最大速率,B代表网元设备查询网管服务器负荷状态 的查询周期,C代表信令跟踪数据消息緩冲区中可容纳的最大信令跟踪数据消 息的条数。
全文摘要
本发明公开了一种移动通信网中网元信令跟踪动态流量控制的方法及系统,用来解决现有固定门限流量控制方式抗瞬时大流量冲击能力不佳、最大流量门限值超过网管服务器的实际处理能力时丢弃信令消息等技术问题。本发明把单向固定值流量控制改为双向流量控制,由网元设备定时向网管服务器发送查询负荷状态的消息,通过检测网管服务器上的信令跟踪数据消息缓冲区使用率来判断网管服务器的负荷状态,将信令跟踪数据消息的接收和处理分为单独的两个线程执行,并且降低处理线程的优先级。通过本发明可以实现网元信令跟踪的动态流量控制,提高抗瞬间大流量冲击的能力。
文档编号H04W24/00GK101448270SQ200810240770
公开日2009年6月3日 申请日期2008年12月23日 优先权日2008年12月23日
发明者吴道立 申请人:中兴通讯股份有限公司