一种链路聚合控制协议的优雅重启方法

文档序号:7925632阅读:272来源:国知局
专利名称:一种链路聚合控制协议的优雅重启方法
技术领域
本发明属于数据通信领域,具体涉及一种在二层网络设备中链路聚合控制协议(LACP, Link Aggregation Control Protocol)的优雅重启(GR, Graceful Restart)方法。
背景技术
随着网络的发展,用户对于网络的可靠性提出了越来越高的要求,不间断转发(NSF, None Stop Forwarding)是一项重要的高可靠性(HA, High Availability)技术,保证在网络设备 的控制层面出现故障时,数据转发仍然正常执行,从而保护网络上关键业务不受影响。
不间断转发指在网络设备控制层面故障过程中,数据转发不间断地正常执行。通常情况 下,路由器故障后,其路由协议层面的邻居会检测到它们之间的邻居关系断掉,过一段时间 后再次建立,这个过程称为邻居关系震荡。
为了实现不间断转发,需要路由协议扩展支持GR功能,可以说GR是实现不间断转发的 重要组成部分。
图l是现有技术中接收状态机的流程图,包括以下步骤
步骤101:接收状态机接收到开始事件时,状态迁移到初始化状态,在该状态中进行状 态机参数的初始化,初始化的参数包括端口选项变量,端口删除标记,端口状态字段的超时 位,然后状态无条件迁移到端口 DISABLE状态;
步骤102:接收状态机接收到结束事件或者端口 D0WN事件,状态迁移到端口 DISABLE状 态,设置对端端口状态变量的同步位为FALSE;
步骤103:接收状态机在端口 DISABLE状态时,接收到端口删除事件,状态迁移到初始 化状态,本步骤执行的动作和步骤IOI中的动作一样;
步骤104:接收状态机在端口 DISABLE状态,接收到端口 UP和端口全双工消息时,状态 迁移到超时状态;本步骤中执行的动作如下
设置对端端口状态变量的同步位为FALSE;
设置对端端口状态变量的LACP超时字段为短超时;
启动接收状态机的接收定时器,定时器时间设置为短超时;
本地端口端口状态变量的超时字段设置为FALSE;
步骤105:接收状态机在端口 DISABLE状态时接收到了端口半双工事件,状态迁移到LACP DISABLE状态,本步骤中执行的动作如下 设置端口选择变量为FALSE; 用缺省值记录PDU变量; 设置对端端口状态变量的可聚合位为FALSE; 设置本地端口状态变量的超时位设置为FALSE;
步骤106:接收状态机在超时状态时,接收到了LACP PDU报文,状态迁移到当前状态,
本步骤中执行的动作如下 更新立即发送变量; 记录LACP报文;
启动接收定时器,超时时间由本端端口配置的超时时间决定; 设置本端端口状态变量的超时位为FALSE;
步骤107:接收状态机在超时状态时,接收到了接收定时器超时事件后,状态迁移到缺
省状态,本步骤中执行的动作如下-
用缺省值记录PDU;
设置本端端口状态变量的超时位为FASLE;
步骤108:接收状态机在缺省状态时,接收到了 LACP PDU报文事件后,状态迁移到当前
状态,本步骤执行的动作和歩骤106中的动作一样;
步骤109:接收状态机在当前状态时,接收到了接收定时器超时事件后,状态迁移到当 前超时状态,本步骤执行的动作和步骤104中的动作一样;
步骤110:接收状态机在当前状态时,接收到了 LACP PDU报文事件,状态迁移到当前超 时状态,本步骤执行的动作和步骤108中的动作一样。
从上述的步骤中可以看出,接收状态机存在以下问题和不足
在分布式设备中,如果交换机A进行了主备倒换,交换机B的端口设置了短超时,那么 在3秒钟内交换机B接收不到交换机A发送的LACP报文,交换机B的状态就会从当前状态迁 移到超时状态,这样交换机B就认为邻居交换机A失去了联系,进而导致转发平面变化,最 终导致转发平面数据的丢失。
随着交换机在网络中越来越多的应用,用户对交换机特别是核心交换机的可靠性也提出
了更高要求。但是,交换机跟路由器是有区别的,路由器是-台三层设备,它的功能主要是 完成选路,而三层交换机除了具有路由功能外,它也会进行高速的二层转发。LACP是交换机 设备中不可或缺的重要的二层协议,要想在核心交换机上做到NSF的高可靠性,二层转发的 保证是必不可少的。而现有技术都是基于三层协议的GR实现,尚未实现对于二层LACP协议 的GR功能。

发明内容
本发明的目的在于克服现有技术的不足,提供一种链路聚合控制协议的优雅重启(GR) 方法。该方法可使数据设备(如交换机设备等)中运行的LACP在控制层面出现故障时,数据 转发仍然能正常进行,可实现二层不间断转发,从而保障网络上关键业务不受影响。
为解决上述技术问题,本发明是通过以下技术方案实现的
一种链路聚合控制协议的优雅重启方法,在第一数据设备和第二数据设备的接收状态机 上各增加一个主备切换状态,
当第一数据设备发生主备切换时,发送带有切换信息的LACP PDU报文(即扩充后的LACP PDU报文)给第二数据设备;第二数据设备收到带有切换信息的LACP PDU报文后,接收状态 机从当前状态(current)迁移到主备切换状态(switchover),同时启动其切换定时器,设定 切换需要时间,开始计时。
在上述方案中,若第一数据设备在所述切换需要时间内向第二数据设备发送LACP PDU 报文,则第二数据设备接收到该报文时,其接收状态机的切换定时器复位,第二数据设备进 入正常工作流程;若第一数据设备在所述切换需要时间内未向第二数据设备发送LACP PDU报 文,则第二数据设备接收状态机的切换定时器超时,接收状态机的状态迁移到超时状态 (EXPIRED),第一数据设备和第二数据设备的邻居关系不再保持。
所述带有切换信息的LACP PDU报文的报文格式是在所述LACP PDU报文的报文格式基础 上增加了三个字段,分别是字段类型、字段长度和切换需要时间。
所述切换需要时间是30 200秒。
优选地,所述切换需要时间是60秒。
使用本发明的链路聚合控制协议的优雅重启方法具有以下有益效果 改进后的数据设备(如交换机设备)在进行主备切换时,不影响二层流量转发过程,提 高了数据设备(如交换机设备)的可靠性,增强了网络稳定性;在原来接收状态机基础上只增加一个主备切换状态和扩充LACP PDU报文,就能实现LACP的GR功能,具有实际应用意义。


图1是现有技术中接收状态机的流程图2是本发明中交换机设备间的通信示意图3是本发明中数据设备的接收状态机的流程图4是本发明中扩充后的LACP PDU报文的字段内容图。
具体实施例方式
为了更好地理解本发明,下面结合附图和具体实施例对本发明作进一步地描述。 本发明数据设备是在原有的基础上增加主备切换状态,并修改LACPPDU报文,在主备切 换状态(switchover)中增加了切换定时器动作。如现有两台可以进行主备切换的数据设备(如 交换机设备a和交换机设备b),如图2所示,交换机设备a与交换机设备b之间进行通信。 当交换机设备a发生主备切换时,就自动触发其报文发送机制,发送扩充后的LACP PDU报文 告之交换机设备b,说明其需要切换;当交换机设备b收到扩充的LACP PDU后,其接收状态 机从当前状态(current)迁移到主备切换状态(switchover),同时启动其切换定时器,开始计 时,切换需要时间默认为6 Q秒(可手工设置, 一般为30 200秒)。如果交换机设备b在6 0秒内收到交换机设备a的LACP PDU报文,那么交换机设备b的接收状态机由主备切换状态 迁移到当前状态(current),其切换定时器停止工作,计数清零;如果交换机设备b在6 O秒 内没有收到交换机设备a的LACP PDU报文,那么交换机设备b的接收状态机就由主备切换状 态(switchover)迁移到超时状态(Expired),其切换定时器停止工作且计数至零,链路聚合 GR过程失败,其具体状态迁移见图3。
请参阅图3,该图是本发明中数据设备的接收状态机的流程图,其包括如下步骤 步骤201 210和步骤101 110分别对应且内容相同,这里不再重复; 步骤211:接收状态机在当前状态中接收到系统中的切换事件时,状态迁移到切换中状 态,执行的动作是发送带有切换信息的LACP PDU报文;报文格式如图4所示,是在原有的 LACP PDU报文基础上增加三个字段,分别是TLV—type (字段类型),Length (字段长度)和 Time (切换需要时间),其中TLV—type=4, Length =4, Time=60 (表示默认的切换需要时间), 同时让设备的转发平面在切换需要时间内保持不变;
步骤212:接收状态机在当前状态接收到带有切换信息(其TLV—type为4)的LACP PDU 报文时,状态迁移到切换状态,启动切换定时器,超时时间设置为报文中的切换需要时间;
歩骤213:接收状态机在切换状态时接收到了LACPPDU报文,状态迁移到当前状态,首 先复位切换定时器,后续动作和步骤210—样;
步骤214:接收状态机在切换状态时,接收到了切换定时器超时事件,状态迁移到超时
状态,其动作和步骤209中的动作一样。
综上所述,本发明有效地实现了当控制层面出现故障时,数据的不间断转发。本发明实 现简单,只需要增加一个主备切换状态(switchover),因此对软件成本增加不大,避免了代 码的大规模修改和由此引入的潜在问题,有效地提高了交换机设备的可靠性,实现了LACP的 GR功能。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,应当指出,对于本领域的普 通技术人员来说,凡是本发明的精神和原则之内所作的任何修改、等同替换或改进等,均应 包含在本发明的保护范围之内。
权利要求
1.一种链路聚合控制协议的优雅重启方法,其特征在于,包括以下步骤第一数据设备和第二数据设备的接收状态机上各增加一个主备切换状态;第一数据设备发生主备切换,发送带有切换信息的LACP PDU报文给第二数据设备;第二数据设备收到带有切换信息的LACP PDU报文后,接收状态机从当前状态迁移到主备切换状态,同时启动切换定时器,设定切换需要时间,开始计时。
2. 根据权利要求1所述的链路聚合控制协议的优雅重启方法,其特征在于,还包括若第一数据设备在所述切换需要时间内向第二数据设备发送LACP PDU报文,则第二数据 设备接收到该报文时,其接收状态机的切换定时器复位,第二数据设备进入正常工作流程;若第一数据设备在所述切换需要时间内未向第二数据设备发送LACP PDU报文,则第二数 据设备接收状态机的切换定时器超时,接收状态机的状态迁移到超时状态,第一数据设备和 第二数据设备的邻居关系不再保持。
3. 根据权利要求l所述的链路聚合控制协议的优雅重启方法,其特征在于,所述带有切 换信息的LACP PDU报文的报文格式是在所述LACP PDU报文的报文格式基础上增加了三个字 段,分别是字段类型、字段长度和切换需要时间。
4. 根据权利要求3所述的链路聚合控制协议的优雅重启方法,其特征在于,所述切换需 要时间是30 200秒。
5. 根据权利要求4所述的链路聚合控制协议的优雅重启方法,其特征在于,所述切换需 要时间是60秒。
全文摘要
一种链路聚合控制协议的优雅重启方法,在第一数据设备和第二数据设备的接收状态机上各增加一个主备切换状态;当第一数据设备发生主备切换时,发送带有切换信息的LACP PDU报文(即扩充后的LACP PDU报文)给第二数据设备;第二数据设备收到带有切换信息的LACPPDU报文后,接收状态机从当前状态(current)迁移到主备切换状态(switchover),同时启动其切换定时器,设定切换需要时间,开始计时。使用本发明,改进后的数据设备(如交换机设备)在进行主备切换时,不影响二层流量转发过程,提高了数据设备(如交换机设备)的可靠性,增强了网络稳定性;在原来接收状态机基础上只增加一个主备切换状态和扩充LACPPDU报文,就能实现LACP的GR功能,具有实际应用意义。
文档编号H04L29/06GK101355515SQ20081021603
公开日2009年1月28日 申请日期2008年9月5日 优先权日2008年9月5日
发明者峥 杨, 毕小军, 锐 钱 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1