伪线双归保护管理方法及通信设备与流程

文档序号:11589795阅读:703来源:国知局
伪线双归保护管理方法及通信设备与流程

本发明涉及通信领域,具体涉及一种伪线双归保护管理方法及通信设备。



背景技术:

在mpls(multiprotocollabelswitching)通信网络中,l2vpn(virtualprivatenetwork,虚拟专用网)提供基于多协议标签交换mpls网络的二层vpn服务,使运营商可以在统一的mpls网络上提供基于不同数据链路层的二层vpn,包括atm、fr、vlan、ethernet、ppp等。简单来说,mplsl2vpn是在mpls网络上透明传输用户二层数据。从用户的角度来看,mpls网络是一个二层交换网络,可以在不同节点间建立二层连接。

如果在两个pe(provideredge)之间只建立一条pw(pseudowire),则当该pw出现故障时,pe之间将无法通信。mplsl2vpn支持pw冗余保护功能:l2vpn-frr也称为pw-frr,pw-frr是基于pwe3封装的l2vpn业务的一种链路节点保护切换技术,其基本原理是用一条预先建立的pw来保护一条pw,即pw冗余(pwredundancy)。预先建立的pw称为备pw,被保护的pw称为主pw。l2vpnfrr的最终目的就是利用备pw绕过故障的链路或者节点,从而达到保护主路径的功能。如图1所示,pe1双归到pe2和pe3,pw12和pw13是冗余热备份关系,其主备属性是在网络规划时静态指定的,任意时刻只有一条pw可以进行实际的业务转发。设pw12为主pw,当主pw12发生故障时,通过链路故障检测技术,快速触发部署pe1节点伪线双归保护pw-frr快速切换。目前网络故障检测技术有bfd(bidirectionalforwardingdetection),mplsoam(operation,administrationandmaintenance)等机制,用于快速检测、监控网络中链路连通状况,对相邻转发引擎之间通道故障提供轻负荷、持续时间短的检测。从而实现mplsl2vpn主备链路快速切换,大大减少了链路故障的检测时间,并且主备pw的切换在数据平面完成,不需要通过控制平面下发切换状态,减少了主 备pw的切换时间。

pe这类通信设备通常采用多线卡﹑背板架构。在背板上有多个卡槽,线卡插接在这些卡槽里。线卡承载业务负责数据转发,背板提供系统数据总线和电源总线。线卡通过背板上的总线实现互联以及与主控板的通讯。如图2所示,主控板负责控制层面,线卡负责数据转发层面。链路故障检测模块是运行在线卡的转发层面中,当检测报文检测到链路失效时,固定检测周期(一般设置为3个周期,报文检测周期最小为10ms)内没有检测到对端发送的检测报文时,即认为链路失效,从而发起pw的切换,线卡的检测模块会同时通知控制面和转发面链路失效告警消息进行切换。通知业务转发模块切换是为了将pw快速由主切换到备,从而指导转发,保证业务数据的转发尽快恢复正常。通知控制板的业务切换管理模块是为了保持和转发面数据一致。这样就达到了快速切换的目的。但是,在实际设备运行的过程中很难保证控制面和转发面数据一致,例如,控制层面为了防止链路震荡等原因,主控板会对在短时间内接收到的告警通知和告警消息通知进行合并处理;具体过程为:当线卡上检测到告警通知并上报给主控板后,紧接着又检测到告警消除并上报告警消除通知给主控板,本申请中定义这种情况为误告警情况;主控板在接收到告警通知后还未对其进行处理之前,又接收到针对该告警的告警消除通知,则对其进行合并处理,也即将该告警通知和告警消除通知进行互抵,主控板侧不进行切换也不进行回切操作,同时也不向线卡发送任何消息。但是,针对这种情况,线卡在检测到告警后会立即由主伪线链路切换到备伪线链路,且现有的线卡回切并不响应告警消除消息,只响应主控板下发的回切通知,因此这种情况下主控板并不向线卡下发回切消息,就会导致主控板和线卡伪线保护状态不一致。



技术实现要素:

本发明要解决的主要技术问题是,提供一种伪线双归保护管理方法及通信设备,解决现有通信设备中因误告警导致主控板和线卡伪线保护状态不一致的 问题。

为解决上述技术问题,本发明提供一种伪线双归保护管理方法,应用于伪线双归保护通信设备,所述伪线双归保护通信设备包括主控板和线卡;所述方法包括:

所述线卡检测到当前处于工作状态的主伪线链路出现告警时,切换到备伪线链路;

所述线卡判断所述告警是否是误告警,如是,从备伪线链路切回主伪线链路。

在本发明的一种实施例中,所述线卡判断所述告警是否是误告警包括:

所述线卡切换到备伪线链路后开始计时,判断在预设时间阈值内是否检测到主伪线链路的告警消除消息,如是,则判定所述告警为误告警。

在本发明的一种实施例中,所述线卡切换到备伪线链路后,暂停将告警通知发送给所述主控板;

所述线卡在所述预设时间阈值内检测到所述告警消除消息后,取消将所述告警通知发给所述主控板。

在本发明的一种实施例中,所述线卡切换到备伪线链路后,发送告警通知给所述主控板;

所述线卡在所述预设时间阈值内检测到所述告警消除消息后,发送告警消除通知给所述主控板。

在本发明的一种实施例中,所述线卡判断所述告警不是误告警后,还包括:

发送告警通知给所述主控板;

判断所述主控板是否正常接收到所述告警通知,如否,向所述主控板重发所述告警通知。

为了解决上述问题,本发明还提供了一种伪线双归保护通信设备,包括主控板和与所述主控板通信连接的线卡;所述线卡用于检测到当前处于工作状态的主伪线链路出现告警时,切换到备伪线链路;以及用于在切换到备伪线链路后判断所述告警是否是误告警,如是,从备伪线链路切回主伪线链路。

在本发明的一种实施例中,所述线卡判断所述告警是否是误告警包括:

所述线卡切换到备伪线链路后开始计时,判断在预设时间阈值内是否检测到主伪线链路的告警消除消息,如是,则判定所述告警为误告警。

在本发明的一种实施例中,所述线卡还用于切换到备伪线链路后,暂停将告警通知发送给所述主控板;

以及在所述预设时间阈值内检测到所述告警消除消息后,取消将所述告警通知发给所述主控板。

在本发明的一种实施例中,所述线卡还用于切换到备伪线链路后,发送告警通知给所述主控板;以及在所述预设时间阈值内检测到所述告警消除消息后,发送告警消除通知给所述主控板。

在本发明的一种实施例中,所述线卡还用于判断所述告警不是误告警后,发送告警通知给所述主控板,并判断所述主控板是否正常接收到所述告警通知,如否,向所述主控板重发所述告警通知。

本发明的有益效果是:

本发明提供的伪线双归保护管理方法及通信设备,通信设备的线卡检测到当前处于工作状态的主伪线链路出现告警时,由主用伪线链路切换到备伪线链路;然后判断该告警是否是误告警,如判断出是误告警,则直接从备伪线链路切回主伪线链路;由于此时主控板侧不会进行切换操作,也不进行回切操作,因此可以与线卡侧的伪线保护状态一致。

附图说明

图1为伪线双归保护组组网示意图;

图2为现有伪线双归保护通信设备结构图;

图3为本发明实施例一提供的伪线双归保护管理方法流程示意图;

图4为本发明实施例一提供的另一伪线双归保护管理方法流程示意图;

图5为本发明实施例二提供的伪线双归保护通信设备结构示意图;

图6为本发明实施例二提供的另一伪线双归保护通信设备结构示意图;

图7为本发明实施例二提供的业务切换管理模块处理流程示意图;

图8为本发明实施例二提供的检测模块处理流程示意图;

图9为本发明实施例二提供的业务转发模块处理流程示意图;

图10为本发明实施例二提供的自动纠正模块处理流程示意图。

具体实施方式

下面通过具体实施方式结合附图对本发明作进一步详细说明。

实施例一:

本实施例提供的伪线双归保护管理方法主要应用于伪线双归保护通信设备,该伪线双归保护通信设备包括主控板和线卡;线卡具体可通过相应的卡槽与主控板通信连接;该方法请参见图3所示,包括:

步骤301:线卡检测到当前处于工作状态的主伪线链路出现告警时,切换到备伪线链路;

在该步骤中,检测到当前处于工作状态的主伪线链路出现告警后,或者线卡切换到备伪线链路后,可以先直接将相应的告警通知发送给主控板;也可以 先暂时向主控板发送告警通知,而是等后续判断该告警不是误告警后才向主控板发送告警通知;

该步骤中切换到备伪线链路则是主要指线卡的业务转发面在线卡检测到告警后立即由主伪线链路切换到备伪线链路,以尽可能保证业务数据的正常转发;

步骤302:线卡判断告警是否是误告警,如是,直接从备伪线链路切回主伪线链路。

该步骤中,线卡判断告警是否是误告警的方式可以根据具体应用场景灵活选择设置,下面以其中一种方式作为示例进行说明,具体包括:

线卡切换到备伪线链路后开始计时,判断在预设时间阈值(以下称为第二时间阈值)内是否检测到主伪线链路的告警消除消息,如是,则判定该告警为误告警。

本实施例中的该第二预设时间阈值的取值主要根据误告警检测到告警消息和告警消除消息的时间间隔而定,其具体可设置为毫秒级,例如500毫秒。

正如上述分析,当本实施例中的线卡切换到备伪线链路后,暂停将告警通知发送给主控板时,如果上述步骤302中线卡在第二预设时间阈值内检测到告警消除消息后,也即判定为误告警时,取消将告警通知发给主控板,对于告警消除通知也不发给主控板;也即此时对产生的告警通知以及对应的告警消除通知都不发给主控板,主控板不需要接收和处理(也即不会感知到)该告警通知和对应的告警消除通知,可提升资源利用率。

在本实施例中,线卡检测到告警并切换到备伪线链路后,直接发送告警通知给主控板时;此时上述步骤302中线卡在第二预设时间阈值内检测到告警消除消息后,也即判定为误告警时,需要立即发送告警消除通知给主控板;此时主控板在接收到告警通知后还未对其进行处理之前,又立即接收到针对该告警 的告警消除通知,因此对该告警通知和告警消除通知进行合并处理,主控板不进行切换也不进行回切操作,与线卡侧的伪线保护状态一致。

在实际网络应用中,除了上述误告警会导致主控板和线卡伪线保护状态不一致外,当板间通信异常导致告警丢失时也会出现该情况:在线卡上,检测模块检测告警通知上报主控板通信异常,线卡转发层面感知告警发生后立即进行主、备切换,但若发送给主控板的告警通知出现板间通信异常导致主控板未能收到告警通知时,主控层面就不会感知到该告警,因此主控层面并不会进行同步的主、备切换,也不会向线卡的业务转发模块发送线路切换通知,导致主控板和线卡的伪线保护状态不一致。

针对上述情况,本实施例在线卡向主控板发送告警通知时,还可包括判断所发送的告警通知是否被主控板正常接收,如没有,则向主控板重新发送,进而避免因板间传输异常导致主控板和线卡的伪线保护状态不一致。下面以在步骤301中线卡检测到当前处于工作状态的主伪线链路出现告警后,或者线卡切换到备伪线链路后,直接将相应的告警通知发送给主控板的情况为例进行说明。具体过程请参见图4所示,包括:

步骤401:线卡检测到当前处于工作状态的主伪线链路出现告警时,切换到备伪线链路,并向主控板发送告警通知;

该步骤中线卡具体可通过bfd、mplsoam等检测机制检测链路是否故障该步骤中线卡通过板间通信向主控板发送告警通知,以通知主控板的主控层面主伪线链路除了故障,需要切换到备伪线链路;

步骤402:线卡判断主控板是否正常接收到其发送的告警通知,在判断结果为没有时,重新向主控板发送告警通知。

该步骤中,判断主控板没有收到告警通知时,则表明主控板的控制层面未感知到该告警,其并不会作出由主伪线链路切换到备伪线链路的切换,进而会 导致通信设备的主控板和线卡伪线保护状态不一致的问题。因此此时线卡在判断出该结果后,重新向主控板发送告警通知,以尽可能让主控板能正常接收到该告警通知,并依此作出对应的切换;从而解决因板间通信异常导致主控板和线卡伪线保护状态不一致的问题。

上述步骤401中线卡判断主控板是否正常接收到告警通知的具体实现方式可以根据具体应用场景灵活选择。例如,线卡可在向主控板发送告警通知后,或在切换到备伪线链路后开始计时,在第一预设时间阈值内判断是否收到主控板根据告警通知反馈的线路切换通知,如接收到,表明主控板已正常接收到该告警通知,否则,表明主控板没有正常接收到该告警通知。本实施例中的第一预设时间阈值的取值主要取决于主控板从线卡接收告警通知并根据该告警通知反馈线路切换通知所需的处理时间决定。具体其可取秒级,例如1秒。

在上述步骤402中,当线卡在判断主控板未收到告警通知后,重新向主控板发送告警通知前,可能会存在检测到主伪线链路的告警消除消息,此时表明主伪线链路上的告警已经消除,可以进行回切了,因此此时线卡可以直接进行回切到主伪线链路,且此时由于主控板侧之前并未进行切换,其仍工作在主伪线链路,因此主控板侧并不需要进行回切操作,也不再需要根据之前的告警通知进行切换操作。因此此时线卡可以停止重新向主控板发送告警通知;且此时产生的告警消息通知也可不发给主控板,这样可以减少板间通信流量。因此,在上述步骤302中还可包括以下步骤:

线卡在判断主控板未收到告警通知后,重新向主控板发送告警通知前,判断是否检测到主伪线链路的告警消除消息,如是,则从备伪线链路切回主伪线链路,并停止重新向主控板发送告警通知;同时对于检测到的告警消除通知也不发给主控板。

实施例二:

本实施例提供了一种伪线双归保护通信设备,请参见图5所示,包括主控板2和线卡1;线卡1用于检测到当前处于工作状态的主伪线链路出现告警时,切换到备伪线链路;以及用于在切换到备伪线链路后判断该告警是否是误告警,如是,直接从备伪线链路切回主伪线链路。

线卡1具体可通过bfd、mplsoam等检测机制检测链路是否故障;该步骤中切换到备伪线链路则是主要指线卡1的业务转发面在线卡检测到告警后立即由主伪线链路切换到备伪线链路,以尽可能保证业务数据的正常转发;

本实施例中,线卡1检测到当前处于工作状态的主伪线链路出现告警后,或者线卡1切换到备伪线链路后,可以先直接将相应的告警通知发送给主控板2;也可以先暂时向主控板2发送告警通知,而是等后续判断该告警不是误告警后才向主控板2发送告警通知;

本实施例中,线卡1判断告警是否是误告警的方式可以根据具体应用场景灵活选择设置,下面以其中一种方式作为示例进行说明,具体包括:

线卡1切换到备伪线链路后开始计时,判断在预设时间阈值(以下称为第二时间阈值)内是否检测到主伪线链路的告警消除消息,如是,则判定该告警为误告警。本实施例中的该第二预设时间阈值的取值主要根据误告警检测到告警消息和告警消除消息的时间间隔而定,其具体可设置为毫秒级,例如300毫秒。

当本实施例中的线卡1切换到备伪线链路后,暂停将告警通知发送给主控板2时,如果后续线卡1在第二预设时间阈值内检测到告警消除消息后,也即判定为误告警时,取消将告警通知发给主控板2,对于告警消除通知也不发给主 控板2;也即此时对产生的告警通知以及对应的告警消除通知都不发给主控板2,主控板2不需要接收和处理(也即不会感知到)该告警通知和对应的告警消除通知,可提升资源利用率。

当本实施例中的线卡1检测到告警并切换到备伪线链路后,直接发送告警通知给主控板2时;此时线卡1在第二预设时间阈值内检测到告警消除消息后,也即判定为误告警时,需要立即发送告警消除通知给主控板2;此时主控板2在接收到告警通知后还未对其进行处理之前,又立即接收到针对该告警的告警消除通知,因此对该告警通知和告警消除通知进行合并处理,主控板2不进行切换也不进行回切操作,与线卡1侧的伪线保护状态一致。

在实际网络应用中,除了上述误告警会导致主控板2和线卡1伪线保护状态不一致外,当板间通信异常导致告警丢失时也会出现该情况。因此本实施例在线卡1向主控板2发送告警通知时(例如判断所述告警不是误告警后向主控板发送告警通知时,或者线卡切换后直接向主控板发送告警通知时),判断主控板2是否正常接收到该告警通知,如否,向主控板2重发告警通知。

线卡1判断主控板是否正常接收到告警通知包括:

线卡1向主控板2发送告警通知后,或切换到备伪线链路后开始计时,在第一预设时间阈值内判断是否收到主控板2根据告警通知反馈的线路切换通知,如否,判定主控板2未收到告警通知。本实施例中的第一预设时间阈值的取值主要取决于主控板2从线卡1接收告警通知并根据该告警通知反馈线路切换通知所需的处理时间决定。具体其可取秒级,例如1秒。

本实施例中,当线卡1在判断主控板2未收到告警通知后,重新向主控板2发送告警通知前,可能会存在检测到主伪线链路的告警消除消息,此时表明主伪线链路上的告警已经消除,可以进行回切了,因此此时线卡1可以直接进行 回切到主伪线链路,且此时由于主控板2侧之前并未进行切换,其仍工作在主伪线链路,因此主控板2侧并不需要进行回切操作,也不再需要根据之前的告警通知进行切换操作。因此此时线卡1可以停止重新向主控板2发送告警通知;且此时产生的告警消息通知也可不发给主控板2,这样可以减少板间通信流量。

具体的,请参见图6所示,线卡1包括检测模块11、业务转发模块12和自动纠正模块13,主控板2包括业务切换管理模块21,线卡1和主控板2之间通过板间通信模块3完成信息交互。各个模块的主要功能作用如下:

板间通信模块3:主要负责主控板2和线卡1之间进行板间消息通信。如线卡1的告警通知、告警消除通知等上送主控板2以及主控板2向线卡1下发切换和回切等通知处理。

主控上的业务切换管理模块21:主要负责处理线卡1上报的告警通知以及告警消除通知来进行aps决策pwfrr的切换和回切下发给各个线卡1。

线卡1上的检测模块11:主要负责检测伪线链路故障。例如设置检测报文具有检测周期t,当检测报文在3个检测周期t后没有检测到对端发送的检测报文时,即认为伪线链路失效,同时通知线卡1转发面和主控板2控制面进行伪线切换;以及用于检测伪线链路告警是否消除;

线卡1上的业务转发切换模块12:主要负责根据检测模块11下发的告警通知进行切换以及接收主控下发pwfrr的切换和回切消息,来进行控制业务数据转发。

线卡1上的自动纠正模块13:当线卡1检测模块11产生告警通知,业务转发模块12进行保护切换也即从主伪线链路切换到备伪线链路上后,开启定时器,在第二预设时间阈值内t2内(通常建议设置成亚秒级,例如500毫秒),检测模块11产生告警消除消息,也即误告警,通知业务转发模块12进行回切;以 及用于在业务转发模块12进行保护切换也即从主伪线链路切换到备伪线链路上后,开启定时器;正常情况下,主控板2的业务切换管理模块会下发线路切换通知给线卡1的业务转发模块12,如果在设定的第一时间阈值t1内(通常建议设置成秒级,例如1秒),主控板2还没有下发线路切换通知则可以认为主控板2未正常接收到该告警通知;,自动纠正模块13重新上报告警通知给主控板2。从而,保证控制板2和线卡1伪线保护工作状态一致。

下面结合以各模块的工作流程为例进行示例说明:

请参见图7所示,控制板2上的业务切换管理模块21处理流程包括:

步骤701:在配置伪线保护组的伪线双归保护通信设备pe1的工作pw上开启oam/bfd报文检测,伪线保护组正常工作在主pw1上;转步骤702;

步骤702:线卡1判断伪线保护组工作链路工作pw1是否有线卡1检测模块11上报oam/bfd检测告警,如果有,则确定工作pw1发生故障,此时转至步骤703;

步骤703:主控板2接收线卡1发送的告警通知,aps进行协议计算伪线保护组是否切换,如果是,转步骤704;

步骤704:主控板2伪线保护组切换到保护链路保护pw2上,同时下发线路切换通知给线卡1,转步骤705;

步骤705:线卡1判断伪线保护组工作链路工作pw1是否有线卡转发面检测模块上报oam/bfd检测告警是否消除,如果是,转步骤706;

步骤706:主控板2接收线卡1发送的告警消除通知,aps进行协议计算伪线保护组是否允许回切,如果是,转步骤707;

步骤707:主控板2伪线保护组回切到工作链路主pw1上,同时向线卡1下发回切通知,以通知转发面保护组回切到工作主pw1上,转回步骤702。

请参见图8所示,线卡1转发面上的检测模块11处理流程包括:

步骤801:在pe1设备的线卡1转发面工作pw1上运行oam/bfd报文检测,伪线保护组正常工作在主pw1上,转步骤802;

步骤802:线卡1转发面判断伪线保护组工作链路工作pw1是否有检测模块11产生oam/bfd检测告警,如果有,则确定工作pw1发生故障,此时转至步骤803;

步骤803:线卡1转发面检测模块11通知控制面和转发面主pw1上告警产生,线卡1转发面保护组接收到告警快速切换到备pw2上,之后,转步骤804;

步骤804:判断线卡1转发面伪线保护组工作链路工作pw1是否有上报oam/bfd检测告警消除,如果有,转步骤805;

步骤805:线卡1转发面检测模块11通知控制面主pw1上告警消除;控制面伪线保护组接收到告警消除消息决策回切到工作链路主pw1上,同时下发回切通知给线卡1转发面保护组回切到工作主pw1上,转步骤802。

请参见图9所示,线卡11转发面上的业务转发模块12处理流程包括:

步骤901:在pe1设备的线卡1转发面工作pw1上运行oam/bfd报文检测,伪线保护组正常工作在主pw1上,转步骤902;

步骤902:线卡1转发面判断伪线保护组工作链路工作pw1是否有检测模块11产生oam/bfd检测告警,如果有,则确定工作pw1发生故障,此时转至步骤903;

步骤903:线卡1转发面保护组接收到主pw1产生告警快速切换到备pw2上,之后,转步骤904;

步骤904:判断主控控制面伪线保护组是否有下发回切到主pw消息,如果有,转步骤905;

步骤905:线卡1转发面接收到控制面伪线保护组回切通知,则伪线双归保护组回切到工作主pw1上,转步骤902。

请参见图10所示,线卡11转发面上的自动纠正模块13处理流程包括:

步骤1001:在pe1设备的线卡1转发面工作pw1上运行oam/bfd报文检测,伪线保护组正常工作在主pw1上,转步骤1002;

步骤1002:线卡1转发面判断伪线保护组工作链路工作pw1是否有检测模块11产生oam/bfd检测告警,如果有,则确定工作pw1发生故障,此时转至步骤1003;

步骤1003:线卡1转发面保护组接收到主pw1产生告警快速切换到备pw2上后,自动纠正模块13开启定时纠正,转步骤1004;

步骤1004:判断线卡1转发面检测模块11是否在指定第二时间阈值t2内通知转发面主pw1上告警消除,如果是,转步骤1008,否则转步骤1005;

步骤1005:判断主控控制面伪线保护组是否在指定时间t1内下发转发面切换到备pw2消息,如果有,转步骤1006,否则转步骤1007;

步骤1006:线卡1转发面在第一时间阈值t1内接收到控制面伪线保护组切换消息,说明控制面接收到检测告警下发转发面切换。线卡1转发面和控制面伪线保护组工作状态保持一致,自动纠正模块13停止工作。

步骤1007:线卡1转发面在t1内没有接收到控制面伪线保护组切换消息,而且检测模块11没有通知主pw1上告警消除,说明控制面没有感知到告警产生的消息;则线卡1转发面自动纠正模块13进行重新上报控制面主控工作pw1上的链路检测告警消息。控制面如果接收到检测告警下发转发面伪线保护组切换到备伪线链路,则控制面和转发面工作状态保持一致,自动纠正模块停止工作。

步骤1008:线卡1转发面在第二时间阈值t2内紧接着又通知主pw1上告警 消除,说明出现了误告警,此时控制面合并了告警产生和消除的消息;线卡1转发面自动纠正模块13进行回切到主pw1上,和控制面伪线保护组工作状态保持一致,自动纠正模块13停止工作。

以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1