一种控制以太网链路连续性检测的方法

文档序号:7625174阅读:124来源:国知局
专利名称:一种控制以太网链路连续性检测的方法
技术领域
本发明涉及以太网,特别涉及以太网的检测维护技术,公开一种控制以太网链路连续性检测的方法。
背景技术
目前,以太网端到端的OAM(Operations、Administration and Maintenance操作、管理和维护)机制中,连续性检测(CC,Continuity Check)通常用于网络故障的自动发现,ITU-T(Institute of Electrical and Electronics Engineers,电信电子工程师协会)和IEEE(International Telecommunication Union,国际电信联盟)两个组都对此进行了研究。
以太网网络故障可能由链路失效、环路和软件配置错误等引发,连续性检测机制提供了一种既能检测硬件故障也能检测如内存耗尽、配置错误等软件故障的方法,连续性检测是指在两个执行检测的网元之间单向或双向周期性发送CCM(Continuity Check Message,连续性检测报文),接收方可以根据是否收到预期的连续性检测报文进行故障判断,如果发生故障则进行连续性检测丢失告警,以及时启动错误确认、定位、隔离和修复机制。
以太网中的一个SI(Service Instance,业务实例)可能经过多个网元,为保证SI链路的连续性,需要对承载该SI的链路进行连续性检测,一般将该SI的多个网元设置为一个MEG(Maintenance Entity Group,维护组),在MEG中的两个边缘网元之间的一系列MP(Maintenance Point,维护端点)构成一个ME(Maintenance Entity,维护实体),因此一个ME包括两个或以上的MP,一个MEG由1个和1个以上的ME组成,网络侧为每一个MEG配置全球唯一的MEG ID(ME Group Identifier,维护组标识符),该MEG ID携带在CCM中,被用于识别是否为本组的检测报文,其中,处于链路边缘的MP称为MEP(Maintenance End Point,维护终结端点),处于链路中间的MP称为MIP(Maintenance Intermediate Point,维护中间端点),端到端的连续性检测由链路边缘的两个MEP执行,发送CCM报文的称为源端MEP,接收CCM报文并进行故障判断的称为宿端MEP。
CCM报文的目的地址采用的是一种经过特殊定义的多播MAC地址,CCM报文中包括MEG ID和本端MEP的MEP ID(Maintenance End Point Identifier,维护终结端点标识符),MIP收到CCM报文时进行透传,宿端MEP根据是否收到预期的CCM报文进行连续性检测并进行故障判断和告警。具体处理包括以下步骤第一步、激活连续性检测当需要进行连续性检测时,用户维护操作人员向源端MEP下发连续性检测激活指示,当源端MEP收到执行连续性检测的激活指示后,立刻开始周期性发送CCM报文,宿端MEP接收到第一个CCM报文时,开始启动连续性检测机制。
第二步、执行连续性检测连续性检测机制被激活后,源端MEP开始周期性发送CCM报文,CCM报文的发送周期由用户维护操作人员进行配置或者默认缺省值,范围一般从0.01秒到665.35秒可选,源端MEP通过启动对应的计时器监控发送周期;宿端MEP接收CCM报文,该CCM报文中包含有MEG ID,宿端MEP根据MEG ID判断是否为本检测组的源端MEP发送的连续性检测报文,如果是则进行处理,否则丢弃或透传;在进行连续性检测过程中,由于产生CCM报文丢失的因素很多,为提高连续性检测丢失告警的准确度,通常允许宿端MEP可以在连续丢失2个或3个CCM报文后再进行告警,因此CCM报文中还包含有报文的有效生存时间TLV(Type Length Value,类型、长度、值)值,生存时间值可以设置为CCM发送周期的2.5~3.5倍,宿端MEP每次接收到一个CCM报文时,开始启动一个计时器监视报文中携带的相应生存时间是否超时,如果在超时前收到下一个CCM报文则重新开始监视,如果在生存时间超时时还没有收到则进行告警,直到故障消除后,宿端MEP再次接收到同一维护组的源端MEP发送的CCM报文时,消除告警;每一个MP都会检查CCM报文中的MEG ID是否同自己所配置的匹配,并且宿端MEP还要确认收到的CCM的MEP ID与自己的MEP ID不同。
第三步、去激活连续性检测当源端MEP收到操作维护人员停止连续性检测的去激活指示后,向宿端MEP发送最后一个CCM报文,该报文的生存时间值被置为0,用于指示退出检测;宿端MEP收到生存时间为0的检测报文时,停止连续性检测,包括立即丢弃这个报文、停止监视生存时间是否超时的定时器。
综上所述,在进行端到端的连续性检测时,宿端MEP每次收到一个CCM报文时,都会启动一个CCM有效性计时器,计时器的时间根据报文中携带的生存时间的TLV(Type Length Value)进行设置,如果当有效性计时器超时后,宿端MEP仍然没有接收到下一个CCM报文,则认为链路产生了故障,进行连续性检测丢失报警。
连续性检测机制在以太网的OAM中的功能是自动发现网络故障,在上述检测过程中,如果连续性检测机制激活之后,网络发生故障(断纤或配置错误等),此时宿端MEP向维护操作人员上报连续性检测丢失告警,如果用户在故障消除之前下发了去激活指示,则源端发送的最后一个生存时间设置为0的CCM报文无法到达宿端MEP,此时源端MEP已经停止发送CCM报文,而宿端无法停止告警,则即使网络故障恢复,宿端的连续性检测丢失告警也无法消除,从而产生误告警。

发明内容
本发明提供一种控制以太网链路连续性检测的方法,用以解决现有技术连续性检测过程中,如果去激活指示在网络故障时发出,则即使网络故障消除,连续性检测丢失告警无法及时消除的问题。
本发明所述一种控制以太网链路连续性检测的方法,包括如下步骤当所述链路的源端维护端点收到停止连续性检测的去激活指示时,开始周期性向所述链路的宿端维护端点发送携带退出检测信息的连续性检测报文;当所述宿端维护端点收到所述携带退出检测信息的连续性检测报文时,向所述源端维护端点返回退出响应报文并停止连续检测;当所述源端维护端点收到所述退出响应报文时,停止发送所述携带退出检测信息的连续性检测报文并退出连续性检测。
所述方法还包括如下步骤当所述源端维护端点收到执行连续性检测的激活指示时,开始周期性向所述宿端维护端点发送携带生存时间的连续性检测报文,所述生存时间大于检测报文的发送周期;当所述宿端维护端点每次接收到一个连续性检测报文时开始监视该报文中携带的生存时间,如果当所述生存时间到达时没有收到下一个报文则进行连续性检测丢失告警,并当再次接收到连续性检测报文时结束所述告警。
其中,所述退出检测信息通过将所述生存时间设置为0进行指示。
其中,所述生存时间为所述连续性检测报文发送周期的2.5倍至4.5倍。
其中,所述退出响应报文通过连续性检测报文扩展得到。
本发明的有益效果如下本发明所述方法在连续性检测机制的去激活步骤中,引入去激活指示的响应机制,使源端MEP在收到去激活指示时,周期性发送退出连续性检测报文,直到收到宿端MEP的响应报文,这样,即使去激活指示在链路故障时发出,也保证了宿端MEP在故障消除后能够收到源端MEP退出检测的指示,从而及时停止连续性检测失败告警,消除了因网络故障引发的连续性检测失败的误告警,提高了告警的准确性。


图1为现有技术中连续性检测机制激活流程图;图2为现有技术中连续性检测流程图;图3为本发明所述连续性检测去激活流程示意图;图4为现有CCM报文格式示意图;图5为根据现有CCM报文扩展的CCR报文格式示意图。
具体实施例方式
本发明对现有技术中连续性检测机制的改进在于去激活的步骤,当源端MEP接收到操作维护人员下发的去激活指示时,开始周期性向宿端MEP发送生存时间TLV被置为0的CCM报文,当宿端MEP收到生存时间TLV为0的CCM报文后,向源端MEP发出CCR(Continuity Check Reply,连续性检测响应报文)响应报文,源端MEP只有收到宿端MEP发送的CCR响应报文后,才停止发送生存时间TLV为0的CCM报文并进行后续处理,这样当故障链路恢复后,宿端MEP可以避免因无法收到TLV为0的CCM报文而产生的误告警。
下面结合附图详细说明本发明,本发明对去激活步骤进行了改进,没有改变原有的激活步骤和检测步骤,完整的技术方案为第一步、激活连续性检测连续性检测激活流程如图1所示,包括如下步骤S101、用户向源端MEP下发执行连续性检测的激活指示;用户操作维护人员预先设置维护组,并在维护组的每一个维护端点MP上设置如下信息维护组的MEG ID、初始报文生存时间、报文发送周期和本端MEP ID(或MIP ID)等,其中报文生存时间可以在检测过程中根据需要进行调整,并且网络侧还配置有缺省生存时间。当需要进行连续性检测时,用户维护操作人员向源端MEP下发连续性检测激活指示。
S102、源端MEP接收到激活指示后,开始周期性向宿端MEP发送CCM报文;当源端MEP收到执行连续性检测的激活指示后,便立刻开始周期性发送CCM报文;CCM报文中包括维护组的MEG ID、本端MEP ID和报文生存时间。
S103、宿端MEP接收到第一个CCM报文时,开始启动连续性检测机制;第二步、执行连续性检测如图2所示,检测流程具体包括如下步骤S201、连续性检测机制被激活后,源端MEP开始周期性发送CCM报文,CCM报文的发送周期由用户维护操作人员进行配置或者默认缺省值,范围一般从0.01秒到665.35秒可选,源端MEP通过启动对应的计时器监控发送周期;S202、宿端MEP接收CCM报文,该CCM报文中包含有MEG ID,宿端MEP根据MEG ID判断是否为本检测组的源端MEP发送的连续性检测报文,如果是则进行处理,否则丢弃或透传;为提高连续性检测丢失告警的可靠性,通常允许宿端MEP可以在连续丢失2个、3个或4个CCM报文后再进行告警,因此CCM报文中还包含有报文的有效生存时间值,生存时间值可以设置为CCM发送周期的2.5~4.5倍,宿端MEP每次接收到一个CCM报文时,开始启动一个计时器监视报文中携带的相应生存时间是否超时,如果在超时前收到下一个CCM报文则重新开始监视,如果在生存时间超时时还没有收到则进行告警,直到故障消除后,宿端MEP再次接收到同一维护组的源端MEP发送的CCM报文时,消除告警;每一个MP都会检查CCM报文中的MEG ID是否同自己所配置的匹配,并且宿端MEP还要确认收到的CCM的MEP ID与自己的MEP ID不同。
第三步、去激活连续性检测S301、操作维护人员向源端MEP下发停止连续性检测的去激活指示;S302、当源端MEP收到操作维护人员停止连续性检测的去激活指示后,开始周期性向宿端MEP发送包含退出信息的CCM报文,通常退出信息的设置方法是将该报文的生存时间值被置为0;S303、宿端MEP收到生存时间为0的检测报文时,向源端MEP返回CCR响应报文,并停止连续性检测;宿端MEP收到生存时间为0的检测报文时需要进行下述操作丢弃生存时间为0的检测报文这个报文;向源端MEP返回CCR报文;停止监视生存时间是否超时的定时器。
S304、源端MEP收到CCR响应报文后,停止发送生存时间为0的检测报文,至此,去激活连续性检测成功。
CCR响应报文为本发明新定义的报文,可以利用CCM检测报文进行扩展,下面详细描述如何进行扩展。
如图4所示,图3为现有CCM检测报文格式(CMF,Common MessageFormat)示意图,其中,第一行表示占用的字节数,第一列表示累计字节数,报文头占用第0到第22共计23个字节,其中第0、1字节空闲,从第2个字节开始,目的端MAC地址(Destination MAC address)和发送端MAC地址(Source MAC address)各占用6字节,对于CCM报文,目的端MAC地址为专门定义的多播MAC地址,发送端MAC地址为源端MEP的MAC地址,图示第13、14、15和16字节为封装一层802.1Q或802.1ad定义的Vlan标签(Tag)的情况,其中第13、14字节携带Vlan标签编码类型标识码,第15、16字节携带Vlan标签编码,其他协议格式的封装也是允许的,但是相关字段的位置需要自行计算。第17、18字节用于携带该报文为以太网OAM检测报文的标识码,第20字节的OpCode域携带的编码用于标识具体的OAM检测报文类型,现有OAM检测报文类型包括连续性检测报文、环回检测报文(LoopbackMessage)等,分别定义有不同的标识码。
从第23个字节开始为报文数据域,开始携带报文序列号、维护组的MEGID、源端MEP的MEP ID以及生存时间等信息。当源端收到去激活指示时,发送的CCM报文中的生存时间TLV被置为0。
扩展的CCR响应报文如图5所示,可以在OpCode域中定义CCR报文的编码,CCR报文为单播报文,报文目的地址为源端MEP的MAC地址,发送端地址为宿端MEP的MAC地址,其他格式和生存时间TLV被置为0的CCM报文相同。
当宿端MEP收到生存时间TLV被置为0的CCM报文时,停止连续性检测,并向源端MEP如图5所示的CCR报文,源端MEP验证收到的报文中OpCode域中携带的编码对应CCR报文类型编码时,停止发送生存时间TLV被置为0的CCM报文并停止连续性检测,至此完成连续性检测的去激活。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
权利要求
1.一种控制以太网链路连续性检测的方法,包括如下步骤当所述链路的源端维护端点收到停止连续性检测的去激活指示时,开始周期性向所述链路的宿端维护端点发送携带退出检测信息的连续性检测报文;当所述宿端维护端点收到所述携带退出检测信息的连续性检测报文时,向所述源端维护端点返回退出响应报文并停止连续性检测;当所述源端维护端点收到所述退出响应报文时,停止发送所述携带退出检测信息的连续性检测报文并退出连续性检测。
2.如权利要求1所述的方法,其特征在于,所述方法还包括如下步骤当所述源端维护端点收到执行连续性检测的激活指示时,开始周期性向所述宿端维护端点发送携带生存时间的连续性检测报文,所述生存时间大于检测报文的发送周期;当所述宿端维护端点每次接收到一个连续性检测报文时开始监视该报文中携带的生存时间,如果当所述生存时间到达时没有收到下一个报文则进行连续性检测丢失告警,并当再次接收到连续性检测报文时结束所述告警。
3.如权利要求1所述的方法,其特征在于,所述退出检测信息通过将所述生存时间设置为0进行指示。
4.如权利要求2所述的方法,其特征在于,所述生存时间为所述连续性检测报文发送周期的2.5倍至4.5倍。
5.如权利要求1所述的方法,其特征在于,所述退出响应报文通过连续性检测报文扩展得到。
全文摘要
本发明涉及以太网,特别涉及以太网的检测维护技术,公开一种控制以太网链路连续性检测的方法。所述方法包括如下步骤当所述链路的源端维护端点收到停止连续性检测的去激活指示时,开始周期性向所述链路的宿端维护端点发送携带退出检测信息的连续性检测报文;当所述宿端维护端点收到所述携带退出检测信息的连续性检测报文时,向所述源端维护端点返回退出响应报文并停止连续检测;当所述源端维护端点收到所述退出响应报文时,停止发送所述携带退出检测信息的连续性检测报文并退出检测。使用本发明所述方法解决了现有技术连续性检测过程中,如果去激活指示在网络故障时发出,则即使网络故障消除,连续性检测丢失告警无法及时消除的问题。
文档编号H04L29/02GK1953400SQ20051010906
公开日2007年4月25日 申请日期2005年10月17日 优先权日2005年10月17日
发明者闫志勇 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1