专利名称:在分组网络中实现单个服务的故障保护和恢复的方法和设备的制作方法
技术领域:
本发明一般涉及故障保护和恢复技术,尤其涉及在诸如会聚接入网络之类的分组网络中实现故障保护和恢复技术。
背景技术:
目前存在着一种在接入网络中进行业务融合的趋势。此类网络通常称为“会聚网络”。由于将业务合并在一个单独的接入平台上并且将独立的网络合并成一个单独的多业务网络,因此这种融合至少在某种程度上是通过承诺减少设备和操作费用而得以推动的。
目前,网络运营商必须维护多种接入“盒”(设备)来支持多种服务。例如,语音服务可以通过数字回路载波(DLC)部署,而数据服务则可以通过DSL接入复用器(DSLAM)部署。此外,承载业务量的网络可能截然不同。应该了解的是,设备和网络的整合可以节约费用。此外,通过从单个平台(在这里将其称为多服务接入节点(MSAN))提供所有服务,可以实现先前在经济或技术上不可行的增强服务。然而,所述融合也面临着一些障碍,其中一个障碍在于从历史上看数据网络不能为语音和视频之类的时间敏感的关键任务业务提供令人满意的服务质量(QoS)。
对任何QoS方案而言,提供可靠连接的能力都是一个关键因素。换句话说,在发生光纤截断或节点故障之类的网络故障时,网络必须提供弹性机制。对那些对时间敏感的服务而言,网络通常需要在几十毫秒内快速恢复受到影响的服务。此外,除了对时间敏感之外,还有一些服务对各种不同原因所造成的故障敏感(分组丢失敏感等等)。在这里,这种对故障敏感的服务通称为“故障敏感服务”。要部署融合平台,就必须能够提供对时间敏感的服务,例如主要语音服务,并且还要具有“运营商等级”的服务水平。同时,这些服务必须通过经济的方式提供,以使供应商能从中获利。
在面向分组的接入网络中,当前设备仅仅提供了少量可用保护机制。取而代之的是,接入数据设备通常依靠相邻的路由器、交换机或SONET分插复用器(ADM)来提供业务量保护。然而,这些方案在灵活性、有效性或经济性方面并不能始终满足要求。例如,在向网络核心提供的总数据业务量中,可能只有一小部分是需要保护的。在这种情况下,由于需要快速恢复的可能仅仅是一小部分数据,因此,保护来自MSAN的所有数据(例如,使用基于SONET单向路径交换环路(UPSR)的保护方案)并不是一种经济的方案。
此外,目前分组网络可用的故障检测和网络恢复方法通常不够快速。例如,以太网可以使用生成树协议(STP)或快速STP,以使路由绕开发生故障的路径,但是协议融合时间的上限可能会过高。而且这种生成树协议机制只能在端口或虚拟局域网(VLAN)的细粒度上操作,而VLAN上则可能只有一小部分数据是需要保护和恢复的。
由此需要那些能在会聚或单个服务流的级别上选择性保护并恢复数据的保护和恢复数据的方法和设备。并且需要那些能够足够快速地恢复受影响服务、以便满足对故障敏感的服务要求的保护和恢复数据的方法和设备。另外还需要那些能够在独立于分组传输协议或是物理传输拓扑的情况下在现有网络中保护和恢复数据的方法和设备。
发明内容
一般来说,在这里公开了一种用于在一个或多个分组网络中实现的单个服务流(per-service flow)保护和数据恢复的方法和设备。所公开的保护和恢复技术允许为业务量划分优先级并且防止会聚等级降至微流(micro-flow)等级。由此可以只为那些对故障敏感的服务提供保护。受保护的数据会在主要路径以及一个或多个备份数据路径上得到复制。在出现链路故障之后,受保护的数据可以快速有效地得到恢复,而不会出现明显的业务中断。
在入口节点,接收分组是根据分组报头部分中的信息而被分类的。所述分类基于一个或多个用于确定是否应该保护分组的规则。如果该分组分类确定应该保护接收分组,则在至少两条路径上传送接收分组。在出口节点,通过使用一个或多个规则并且基于分组报头部分中的信息而对接收分组再次分类。如果所述分组分类确定接收分组是受保护的,则期待接收分组的多个版本并且只传送接收分组的一个版本。
由此,本发明为语音和视频服务这类重要用户服务的传输提供极高可靠性,同时,如果存在重要性较低的服务,那么本发明还为因特网接入或文本消息传递这类重要性较低的服务的传输提供降低的网络保护等级。只有网络连接端点才需要执行本发明的保护和恢复技术。因此,本发明的保护和恢复技术可以在现有网络中得到实施,并且可以在独立于分组传输协议或物理传输拓扑的情况下为跨越多个异构网络的流提供保护。
通过参考下文中的详细描述和附图,可以更全面地理解本发明以及本发明的其他特征和优点。
图1描述的是本发明可以运作的示范性网络环境100;图2更详细地描述了图1的示范性用户环境;图3更详细地描述了多服务接入节点与图1路由器之间的示范性用户集线器的连接;图4是描述入口网络处理器执行的传输处理的示范性实施方式的流程图;图5是描述出口网络处理器执行的接收处理的示范性实施方式的流程图;图6是描述分别由图4和5的传送处理及接收处理调用的分组分类子程序的示范性实施方式的流程图;
图7描述的是依照本发明一个实施例的受保护分组调度和排队;图8描述的是依照本发明一个实施例的受保护分组故障的检测;图9是描述依照本发明一个具体实施例的受保护分组故障的检测的流程图;图10是结合本发明特征的示范性故障检测处理的流程图;以及图11描述的是在链路出现故障之后而在备份路径的源节点与目的地节点之间进行的业务量重新路由。
具体实施例方式
本发明提供的是用于在一个或多个分组网络中实现单个服务(per-service)流保护以及数据恢复的方法和设备。所公开的单个服务流保护和恢复技术允许为业务量划分优先级,并且使用相同的基本机制来避免会聚等级降至微流(micro-flow)等级。由此可以保护那些对故障敏感的服务,同时使用例如“尽力而为”的方法来处理重要性较低的服务。通常,本发明的单个服务流保护和恢复技术会在主要路径以及一个或多个备份数据路径上复制受保护数据。这样一来,在经由网络接入端的独立物理路径上仅仅对受保护数据进行了复制。如下文中进一步论述的那样,在出现链路故障之后,受保护数据可以得到快速有效地恢复并且服务仍旧保持连通。
本发明为语音和视频服务这类重要客户服务的传输提供了极高的可靠性,但却没有为因特网接入或文本消息传递这类重要性较低的服务的传输提供保护,亦或是仅仅为其提供了基于例如以太网通信的生成树协议并由底层网络提供的降低的网络保护等级。与需要保护所有数据的技术相反,这种基于服务来选择受保护业务量的处理可以有效地使用可用带宽。本发明的单个服务流保护和恢复技术能够足够快速地恢复受影响的服务,从而满足那些对故障敏感的业务的需要。并且由此可以用一种非常有效的方式来提供与SONET相类似的可靠性。
在一种示范性实施方式中,本发明的单个服务流保护和恢复技术是在第四层运行的。因此,只有网络连接的端点才需要实施本发明的保护和恢复技术。这样一来,本发明可以在现有网络中得到实施,并且可以为跨越多个异构网络的流提供保护。因此,依照本发明的另一个方面,本发明可以在独立于网际协议(IP)、以太网、异步传输模式(ATM)或多协议标签互换(MPLS)之类的分组传输协议或是环形或网状网络之类的物理传输拓扑的情况下保护并恢复现有网络中的数据。此外,本发明既能够独立运行,也可以与现有网络弹性机制结合运行,例如ATM专用网络到网络接口(PNNI)、MPLS快速重新路由或SONET双向线路交换环(BLSR)/单向线路交换环(UPSR)重新路由机制等等。因此,作为选择,只有极低或者根本没有恢复能力的现有系统可以用本发明来进行更新,从而逐步增加网络的弹性(“随发展而投资”)。例如,可以将受保护的线路卡添加到传统的DSLAM中。
图1描述的是本发明可以运作的示范性网络环境。如图1所示,在下文中结合图2论述的一个或多个用户,每个用户具有一个相应的用户集线器200-1~200-N,这些用户可以在网络100上进行通信。每一个用户都可以使用在下文中结合图2进一步论述的一个或多个用户设备210-11~210-1N以及210-N1~210-NN。通常,语音、视频和电报之类的所有用户服务都是通过家庭或商业集线器200集中的。并且合并数据是在单个宽带链路上被发送或接收的。
如图1所示,网络100可以包括一个或多个接入网络120、160。并且举例来说,接入网络120、160是作为环形或网状网络而被实现的。应该指出的是,本发明的单个服务流保护及恢复技术可以是在一个或多个接入网络120、160中独立提供的。指定的用户则借助了相应的多服务接入节点(MSAN)110、170来接入相关接入网络120、160。例如,多服务接入节点110、170可以用多个下一代宽带环路载波(BLC)中的任何一个载波来加以实现,其中包含了Calix C7系统。如下文进一步描述的那样,多服务接入节点110、170可以检测并辨别本发明所要保护的故障敏感服务。每一个接入网络120、160分别是借助路由器130、150并以一种已知方式连接到核心网络140的。在下文中将会结合图3来进一步描述多服务接入节点170与路由器150之间的示范性用户集线器200-N的连接。
核心网络140是一个会聚网络,它在会聚的无线或有线宽带网络上传送语音、视频和数据,其中所述网络可以包括公共交换电话网(PSTN)或因特网(或是它们的任何组合)。对单独的统一宽带网络而言,要想传递会聚服务,那么该网络必须能够支持指定的服务质量,并且能够可靠地传递那些重要信息。因此,依照本发明,接入网络120、160将会执行业务量管理技术,并且这些技术提供了检测、管理、优先化以及保护重要信息的能力。
如先前所示,本发明提供的是故障保护和恢复机制。在诸如网络环境100这样的网络环境中,其中有多种原因会导致出现物理断连现象,这些原因包括错误拔出电缆或板卡等技术人员错误、物理光纤或铜线链路中断以及节点或板卡内部的端口错误。
图2详细描述了图1的示范性用户环境。应该指出的是,用户例如可以是住宅或商业客户。如图2所示,用户可以使用与单个用户集线器200相连的一个或多个用户设备210-1~210-N。例如,用户可以使用便携式计算设备210-1、无线电话210-2、宽带电话210-3以及电子邮件或文本消息设备210-4。如先前所示,来自这些设备210-1~210-4的每一个的设备数据都是由集线器200会聚并且经由MSAN 170而在单个物理宽带连接上提供给接入网络160。
图3进一步详细描述了多服务接入节点170与路由器150之间的示范性用户集线器200的连接。通常,本发明是在受保护的流的两个端点上运作的。假设图3中的数据流的方向是从右至左(反方向数据流的运行方式相同,因此在这里只考虑一个方向的数据流)。来自用户集线器200并且借助MSAN170传播到路由器150的所有服务的组合数据流(例如语音、因特网接入、流式音频)都是用一条实线表示的,在这里将其称为主要路径360。如先前所示,本发明的单个服务流保护及恢复技术是在主要路径360以及一个或多个备份或次要数据路径370(在图3中用虚线表示)上复制数据的。
来自用户的数据传播到MSAN170,在该点将会识别并复制会聚流的一个子集,以及将其送出一个单独端口,其中所述子集是作为受保护的流提供的。这样则标记了经过网络的不同和不相交的受保护次要路径360、370的开端。在这里提供了总的会聚流中的一个流的子集作为受保护的流,其中所述受保护的流是用那些在虚线形式的次要路径370上传送并且对角线混列的分组描绘的。复制的受保护流是沿着物理路径370发送的,该路径在空间方面与传播总业务量的主要路径360存在差别。应该指出的是,一部分主要和次要路径可以专门用于传送复制的受保护业务量,同时剩余带宽可以传送“尽力而为”数据(在图3中是用网格混列表示的)。举例来说,如果总业务量的百分之十(10%)受到保护并且主要和次要路径的带宽相等,那么主要和次要路径分别可以承载10%的复制保护业务量以及90%的不受保护业务量,其中总带宽利用率是95%,相比之下,不能在服务流级别上区分两种业务量的技术的带宽利用率仅为50%,因为它们要为100%的业务量提供保护(例如SONET UPSR)。
如图3所示,MSAN 170和路由器150是受保护流的“端点”。MSAN 170以及路由器150各自包含了一个用于实现本发明的特征和功能的网络处理器340、310。MSAN 170包括多个物理层接口(PHY)330、350,以便分别对接接入网络160以及用户集线器200。路由器150包括用于对接接入网络160以及核心网络140的多个物理层接口(PHY)320。
在下文中将结合图4至图6来进一步论述适合进入和外出路径并且由网络处理器310、340执行的处理。通常,网络处理器310、340执行的是检测、管理、复制及保护功能。并且举例来说,在这里可以使用那些能从Allentown,PA的Agere Systems公司买到的Agere APP族处理器来实现网络处理器310、340。
例如,如以下结合图4进一步描述的那样,在用户边缘接入系统(MSAN 170),其中根据IP地址、UDP端口或RTP/TCP会话信息之类的第四层属性并且使用了分类技术来选择受保护的服务流。所述流会在两个不同的逻辑连接360、370上进行复制,作为选择,所述流还可以与相似服务会聚在一起,以便通过接入网络来进行传送。业务量管理将会确保那些对故障敏感的服务的优先级处于不对故障敏感的业务量之前。在这里假设网络具有能够建立完全或部分独立的主要和次要路径(取决于网络需求)的适当底层机制。例如在一个DSLAM中,在两条独立网络路径上传输数据(例如借助负载共享)的现有能力会受到杠杆作用影响而传送复制的数据,同时,剩余的各条路径可以用于传送那些不受保护的业务量。
同样,如以下结合图5进一步论述的那样,在服务边缘接入系统,其中使用了分类而在一组流中检测受保护的服务。此外,举例来说,通过使用第三和第四层信息,可以用业务量管理和警戒引擎来选择“优良的”服务,其中所述第三和第四层信息包括操作、管理和维护(OA&M)、分组计数、序列号以及时间戳。此后将会转发“优良的”流,同时还会丢弃复制分组。因此,在受保护的流的终止端,路由器150通常接受来自主要流360中的业务量并且丢弃来自次要流370的业务量。然而,如果出现网络故障,那么路由器可以发觉主要路径360发生中断并且快速切换到次要路径370。
应该指出的是,中间网络及其构成部分并不“知道”在该连接的各个终端170、150上运行的保护方案。因此,只要提供适应于独立的主要和次要路径360、370(例如MPLS标签切换路径或ATM虚电路)的网络,就可以在不必改变这些部件的情况下将网络端点升级成UA。因此,只要存在一种为主要和次要流提供端到端路径的方法,就可以将本发明的协议和传送不可知技术应用在多个异构网络上。
网络处理器340执行协议封装和转发之类的数据路径处理。控制处理器(未显示)则处理控制路径的相应功能。应该注意的是,网络处理器310、340可以与控制处理器相结合。如以下结合图4进一步论述的那样,网络处理器340在MSAN 170中提供了多种重要的数据路径功能。首先,网络处理器340还对输入用户数据进行分类,以便确定某个流是否是受保护。此处的分类意味着对唯一识别分组流(例如IP报头和UDP端口号)的比特进行检验,并且通常是对分组报头部分进行检查。一旦识别出受保护的流,那么网络处理器340必须为这个流分配一个恰当的优先级并且缓存这个流,从而将其调度给主要和次要路径360、370。所述优先化同样是非常重要的,因为它能为受保护的分组提供比不受保护的分组更高的优先级。
在到达停止流保护的相应网络部件150之前,受保护的流的主要和次要路径360、370是在两条不同的物理路径上以透明方式(也就是不了解中间设备)传送的。在这个点,网络处理器310必须再次使用分类来识别受保护的流。在正常工作状态下,网络处理器310只保持主要的流并丢失次要流。如果网络处理器310检测到主要的流360上出现的网络中断,则它立即切换到次要流370,这样一来,在网络管理机制(超出了本发明的范围)命令系统切回到主要流之前,通常是在向网络管理系统发出通知并且修复了故障之后,所述网络处理器将会保持在这些流上到达的所有数据并且丢弃在主要流上到达的任何复制数据。
在切换时,作为选择,接下来的步骤将会在同一个流上向远端接收机发出通知,由此它可以切换到次要路径上。从理论上讲,如果中断仅仅出现在一个方向上,那么它可以继续在其主要路径上运作。然而,大多数网络操作系统都希望有效的流“对”出现在经由网络的相同路径上。目前存在多种适合将中断告知远端的选项。例如,如果保护切换所凭借的判据取决于分组序列编号,则可以将序列号“塞入”错误值中,从而强迫进行切换。作为选择,如果保护切换只取决于分组是否出现在主要流中,则近端发射机可以在主要流上临时“阻塞”这个分组,从而强迫远端接收机执行切换。
以上这两种机制都使用了数据路径通知(通常这是最快的选项)。作为选择,通过将控制/管理平面消息传播到网络管理系统,可以向远端告知它必须切换其接收路径。应该注意的是,由于切换可能导致数据流受损(取决于所用算法),因此,实际上较为理想的是除非存在真正的故障,否则将不会执行切换。此外,网络运营商必须根据其具体需要来做出决定。并且网络处理器310、340的可编程特性能够轻易支持其中任何一种机制。
图4是描述入口网络处理器340执行的发射处理400的示范性实施方式的流程图。如图4所示,一旦分组到达,则在步骤410中发起发射处理400。在步骤420中,发射处理400调用分组分类子程序600(图6),以便确定是否应该保护接收分组。并且在步骤430中将会执行一个测试,以便确定分组分类子程序600是否决定保护接收分组。如果应该保护接收分组,那么在步骤440中,发射处理400会将接收分组复制给一个或多个受保护的路径(例如,通过设定标记来触发至多个位置的多播)。
然后,在步骤450中,多播或单播分组将会进行排队。随后,在步骤460中,发射处理400将会执行一个调度子程序,以便根据预先定义的优先级判据来选择下一个分组。之后,分组将在步骤470中传送到接入网络160。在下文中将结合图7来对受保护分组的调度和排队进行进一步描述。
图5是描述出口网络处理器310所执行的接收处理500的示范性实施方式的流程图。如图5所示,一旦分组到达,则在步骤510中发起接收处理500。在步骤520中,接收处理500调用分组分类子程序600(图6),以便确定接收分组是否受到保护。并且在步骤530中将会执行一个测试,以便确定分组分类子程序600是否判定接收分组受到保护。如果接收分组受到保护,那么在步骤540中,接收处理500将会执行一个故障检测过程,以便检测是否出现故障。例如,接收处理500可以通过估算分组报头中的时间戳和序列号来检测故障。在另一个变体中,接收处理500可以为主要和次要流中的各个流都保持一个分组计数,并且如果计数之间的差值超出预定阈值,则检测到一个故障。
在步骤550中,从接收分组中选出一个路径或分组。举例来说,如果在步骤540中检测到故障,则可以触发一个针对次要路径的切换。在另一个变体中,其中也可以在不同的流之中选择最早到达的分组。然后,在步骤560中将对选定分组进行排队。随后,在步骤570中,接收处理500实施一个调度子程序,以便根据预先定义的优先级判据来选择下一个分组。然后,分组将会在步骤580中传送到核心网络140。
图6是描述分别由图4和5中的发射处理400和接收处理500调用的分组分类子程序600的示范性实施方式的流程图。虽然图6描述了用于对输入分组进行分类并且确定是否应该保护输入分组的示范性技术,但是附加的分类技术同样是可以使用的,这一点对本领域普通技术人员来说是显而易见的。如图6所示,分组分类子程序600首先在步骤610中获取与分组相关联的分组分类信息,例如物理端口信息、以太网MAC地址、ATM虚电路标识符、协议标识符(例如用于封装协议)或端口号。在一个变体中,其中使用了套接字(端口号和源/目的地信息)来描述服务和用户,并且还确定是否应该对服务流进行保护。
此后,举例来说,在步骤620中,分组分类子程序600根据一种或多种技术来对分组进行分类,这些技术包括精确匹配、最长前缀匹配或范围检查。在一个示范性实施方式中,分类是以下列分组报头信息为基础的输入/输出物理接口号;以太网MAC源/目的地地址、IP源/目的地地址、协议标识符以及TCP/UDP端口号。在步骤630中将会判定是否应该保护分组,其结果则是在步骤640中发送到调用处理400、500。
图7描述的是依照本发明一个实施例所执行的受保护分组的调度和排队。如图7所示,在级710,输入分组由分组分类子程序600进行分类,以便确定本发明是否应该保护分组。如果分组不受保护,则仅仅将分组施加给实线所示的单播队列。如果分组受保护,那么如虚线所示,复用级720执行一个把受保护分组多播给至少两个不同的流的处理。由此可以将受保护的分组复制到若干对多播队列中。
图8描述的是依照本发明一个实施例执行的受保护分组的故障检测。如图8所示,在级810,接收处理500使用分组分类子程序600来对输入分组进行分类,以便确定分组是否受到本发明的保护。如果输入分组不受保护,则将其直接施加给实线所示的队列。如果分组受到保护,则在级820中将受保护分组的复制版本施加到与恰当的流相关联的队列中。选择和调度级830将会选择随后将会传送的各个分组的一个版本。如果在级840中检测到故障,则触发一个从主要路径切换到次要路径的切换。
图9是描述依照本发明一个具体实施例来为受保护的分组检测故障的流程图。如图9所示,在这里为两个分组流Q和PQ中的每一个流分别保持了一个心跳监视器(计数器)910、920。在每次接收到分组的时候,心跳监视器910、920都会递增相应计数器。比较器930则周期性或者连续地估算两个计数器之间的差值,只要在各个路径上接收分组,则设定一个有效流指示(例如一个标记)。一旦检测到故障,则消除有效流指示,以便提供一个关于所检测的故障的指示。
图10是描述结合了本发明的特征的示范性故障检测处理1000的流程图。如图10所示,一旦分组到达,则在步骤1010发起故障检测处理1000。在步骤1020,所接收的流的心跳计数器将会复位。用于相关替换(或复制)流的心跳计数器是在步骤1030中识别并在步骤1040中递增的。计数器之间的差值则是在步骤1050中估算的。
在步骤1060中将会执行一个测试,以便确定差值是否超出预先定义的阈值。如果在步骤1060中确定该差值超出了预先定义的阈值,则在步骤1070中发出一个故障通知。然而,如果在步骤1060中确定该差值并未超出预先定义的阈值,则程序控制终止。这样一来,用于流Q的计数器只能由关联于流Q的心跳监视器复位,并且只能由替换流PQ递增。其中所述故障检测处理1000做出假设,如果接收到分组,则路径仍旧有效。
网络的弹性和保护弹性指的是网络在发生故障的情况下仍能保持服务运行的能力。弹性网络是通过自动修复自身而从故障中恢复的。更准确地说,故障恢复是通过将业务量从出现故障的网络部件重新路由到另一个网络部件来实现的。重新路由服从若干个约束条件。最终用户希望重新路由的时间足够短,以便将链路故障所导致的服务中断时间缩短到不易察觉的程度,或者将其降低到最先限度。重新路由业务量所采用的新路径可以在检测到故障前或发生时计算出来。在前一种情况中,重新路由被称为是预先设计的。与没有预先设计重新路由的恢复机制相比,预先设计重新路由的机制减少了服务中断时间,但是有可能需要额外的硬件来提供网络冗余,此外还会消耗计算周期这样的重要资源来计算备份路径。此外,在这里还需要实现恢复速度与预先设计所招致的费用之间的平衡。
图11描述的是当链路C-D在点1130处发生故障时将源与目的地节点A和B在主要路径1120上的业务量重新路由到备份路径1110上的处理。重新路由可以用在电路交换和分组交换网络中。在网络链路发生故障的时候,正在使用故障链路的业务量必须改变它的路径,以便到达其目的地。业务量将会从主要路径1120重新路由到备份路径1110。主要路径1120和备份路径1110可以是完全不相交的,但也可以是部分合并的。
图11给出了一个实例,其中源节点A将业务量发送到目的地节点F,并且在主要路径上,链路C-D发生了故障。完整的重新路由技术包括以下七个步骤1)故障检测;2)故障通知;3)计算备份路径(在故障前后);4)将“正在进行的”业务量从主要路径切换到次要路径;5)链路修复检测;6)恢复通知;以及7)将“正在进行的”业务量从次要路径切换到主要路径。
步骤1~4涉及的是在链路发生故障之后将业务量从主要路径1120切换到备份路径1110的重新路由,而步骤5~7涉及的是在修复故障链路之后将业务量带回主要路径的重新路由。
首先,网络必须能够检测链路故障。链路故障检测可以由故障链路的端节点C和D使用专用硬件或软件来执行。其次,检测链路故障的节点必须将故障告知网络中的特定节点。实际将故障告知哪一个节点则取决于重新路由技术。第三,必须对备份路径进行计算。然而,在预先计划的重新路由方案中,这个步骤是在检测链路故障之前执行的。第四,一个名为路径切换节点的节点必须在备份路径而不是出现故障的主要路径上发送业务量。重新路由处理中的这个步骤称为切换。在链路故障之后,所述切换结束修复网络。
当在物理上修复了故障链路的时候,业务量可以重新路由到主要路径中,也可以仍旧在备份路径上发送。在后一种情况中,其中不再需要其他机制来将业务量重新路由到主要路径中,但却需要三个附加步骤来完成前一种情况中的重新路由。首先,必须有一种机制来检测链路修复。第二,必须将所述修复告知网络节点,第三,在所谓的反向切换步骤中,路径交换节点必须回到主要路径中发送业务量。
设想一下单播通信。当发送方与接收方之间的路径链路发生故障时,用户将会体验到服务中断,直到修复路径为止。中断长度则是在接收到故障之前,最后一个比特经过故障链路的时刻与故障之后使用备份路径的数据的第一个比特到达接收机的时刻之间的时间。在这里假设用TDetect表示检测故障的时间,TNotify表示通知时间,TSwitchov表示切换时间,并且dij表示的是在两个节点i与j之间发送一个数据比特所需要的排队、传输和传播延迟的总的时间。然后,对图11给出的实例而言,用于通信TService的总的服务中断时间是如下给出的TService=TDetect+TNotify+TSwitchover+(dBE-dEF)-(dDE-dEF) (1)数值(dBE-dEF)-(dDE-dEF)不取决于重新路由技术,而是取决于发生故障的位置。因此,我们定义了总的修复时间TRepair,该时间只取决于重新路由机制TRepair=TDetect+TNotify+TSwitchover(2)总的修复时间是重新路由机制在链路故障之后恢复通信而实际耗费的业务中断时间的一部分。
MAC和物理层的保护自愈环环形网是一种所有节点都附着在同一组物理链路上的网络拓扑。每个链路形成一个环路。在反转环(Counter Rotating Ring)的拓扑结构中,所有链路都是单向的,业务量在半个链路上沿着一个方向流动,并且在另一半沿反方向流动。自愈环是特殊的反转环网络,它是按照如下方式进行重新路由的。在正常运作中,业务量只是在一个方向上从源发送到目的地的。如果链路发生故障,则从另一个方向到达目的地,由此可以避开故障链路。自愈环需要昂贵的特定硬件,并且浪费了多达一半的可用带宽来提供完全冗余。另一方面,低层保护机制是可用的速度最快的重新路由机制,因为自愈环可以在50毫秒以内重新路由业务量。这种自愈环的实例包括以下四种MAC和物理重新路由机制,它们全都依赖于一种反转环拓扑·SONET UPSR自动保护切换;·SONET BLSR自动保护切换;·光纤分布式数据接口(FDDI)保护切换;以及·RPR智能保护切换。
网络层保护因特网之类的分组交换网络本身就能够恢复链路故障。路由协议考虑到了拓扑结构变化,例如链路故障,相应地,该协议使用了最短路径算法来重新计算路由表。在重新计算和会聚了网络的所有路由表的时候,使用故障链路的所有路径都通过其他链路而被重新路由。然而,会聚相对较慢并且通常耗费了数十秒的时间。至少在某种程度上,这是因为与低层重新路由机制相比,路由协议用以检测链路故障并且细粒度非常粗糙(1秒)的定时器会使等式(2)中的TDetect项变得更大。其次,在这里必须将故障告知网络中的所有路由器。通知消息的传播耗费了大约数十微秒的时间,由此使得TNotify相对于TDetect而言是可以忽略的。实际上,路由器仅仅需要转发消息,而不用进行任何附加处理。最后,在切换路径之前必须重新计算路由表。重新计算路由表意味着使用CPU密集的最短路径算法,在大型网络中,这种算法可能会耗费数百微秒的时间TSwitchover。
近年来提出了通过减小等式(2)中的TDetect和TSwitchover项而在小于1秒的时间以内进行IP重新路由的主张。该方法建议使用次秒(subsecond)计时器来检测故障,并且缩小TDetect项的值。此外还提出由于当前路由协议中使用的最短路径算法正在逐渐废弃,因此路由会聚很慢,如果使用更快和更现代的算法,那么当前路由协议可以在若干毫秒中重新计算路由表。在使用了经过修改的路由协议的网络中,在适宜的条件下,所预期的重新路由时间有可能小于1秒,但是必需在当前路由算法和路由器中对达到毫秒级恢复时间所需要的规则实施方式进行重大修改。
系统和制品细节正如本领域已知的那样,这里论述的方法和设备可以作为制品散发,其中该制品自身包含了计算机可读介质,并且在所述介质上包含了计算机可读代码装置。计算机可读程序代码装置可以结合计算机系统来进行操作,以便实施用于执行或创建这里论述的设备的所有或某些步骤。计算机可读介质可以是一种可记录介质(例如软盘、硬盘驱动器、光盘或存储卡),也可以是一种传输介质(例如包含了光纤的网络、万维网、电缆、或是使用时分多址、码分多址的无线信道或其他射频信道)。并且任何那些已知或者已开发的能够保存适合与计算机系统结合使用的信息的介质都是可以使用的。计算机可读代码装置是允许计算机读取指令和数据的任何机制,例如磁介质上的磁性变化或是光盘表面的高度变化。
这里描述的计算机系统和服务器都包括一个存储器,该存储器对相关联的处理器进行配置,以便实施这里公开的方法、步骤和功能。存储器可以是分散的,也可以处于本地,并且处理器也可以分散或单一的。此外,存储器可以用电、磁或光存储器来实现,但也可以是这些或其他类型存储设备的任何组合。另外,在这里应该在足够宽的范围中解释术语“存储器”,使之包含任何那些能够从相关处理器可以寻址的空间中的地址读取信息或是将信息写入其中。借助于这种定义,网络信息将仍旧处于存储器中,因为相关处理器可以从网络中检索该信息。
应该理解的是,这里显示和描述的实施例及变体只是为了对本发明的原理进行说明,本领域技术人员是可以在不脱离本发明的范围和实质的情况下进行多种修改的。
权利要求
1.一种用于在分组网络中保护数据的方法,所述方法包括以下步骤根据接收分组报头部分中的信息来对所述分组进行分类,其中所述分类步骤使用一个或多个规则来确定是否应该保护所述接收分组;以及如果所述分组分类确定应该保护所述接收分组,则在至少两条路径上传送所述接收分组。
2.权利要求1的方法,其中所述一个或多个规则确定是否应该保护与所述接收分组相关联的服务。
3.权利要求1的方法,其中所述一个或多个规则确定是否应该保护与所述接收分组相关联的用户。
4.一种用于在分组网络中保护数据的方法,所述方法包括以下步骤根据接收分组报头部分中的信息来对所述接收分组进行分类,其中所述分类步骤使用了一个或多个规则来确定所述接收分组是否是具有至少一个附加版本的受保护分组;以及如果所述分组分类确定所述接收分组是受保护的分组,则仅仅传送所述接收分组的一个版本。
5.权利要求4的方法,其中所述接收分组的一个版本是在主要路径上接收的,并且所述至少一个附加版本是在次要路径上接收的,其中所述方法还包括如下步骤如果在所述主要路径上检测到故障,则切换到所述次要路径。
6.权利要求4的方法,还包括以下步骤检测与所述接收分组的所述版本之一相关联的路径上的故障。
7.一种网络处理器,该处理器可以用于基于一个或多个规则并且根据接收分组报头部分中的信息来对所述分组进行分类,以便确定是否应该保护所述接收分组;以及如果所述分组分类确定应该保护所述接收分组,则在至少两条路径上传送所述接收分组。
8.一种网络处理器,该处理器可以用于基于一个或多个规则并且根据接收分组报头部分中的信息来对所述接收分组进行分类,以便确定所述接收分组是否是具有至少一个附加版本的受保护分组;以及如果所述分组分类确定所述接收分组是受保护的分组,则仅仅传送所述接收分组的一个版本。
9.一种多服务接入节点,包括一个或多个用于接收来自一个或多个用户的分组的端口;以及一个网络处理器,该处理器可以用于基于一个或多个规则并且根据接收分组报头部分中的信息来对所述分组进行分类,以便确定是否应该保护所述接收分组;以及如果所述分组分类确定应该保护所述接收分组,则在至少两条路径上传送所述接收分组。
10.一种分组网络中的路由器,包括一个或多个用于接收分组的端口;以及一个网络处理器,该处理器可以用于基于一个或多个规则并且根据接收分组报头部分中的信息来对所述接收分组进行分类,以便确定所述接收分组是否是具有至少一个附加版本的受保护分组;以及如果所述分组分类确定所述接收分组是受保护的分组,则仅仅传送所述接收分组的一个版本。
全文摘要
本发明涉及在一个或多个分组网络中实现单个服务流保护以及数据恢复的方法和系统。所公开技术允许为业务量划分优先级并且防止会聚等级降至单流等级。由此可以只为那些对故障敏感的服务提供保护。受保护的数据会在主要路径以及一个或多个备份数据路径上得到复制。在出现链路故障之后,受保护数据可以快速有效地得到恢复,而不会出现明显的业务中断。接收分组使用一个或多个用于确定是否应该保护接收分组的规则且基于分组报头部分中的信息而被分类。在入口节点,如果该分组分类确定应该保护接收分组,则在至少两条路径上传送接收分组。在出口节点,如果确定接收分组是受保护的,则期待接收分组的多个版本并且只传送接收分组的一个版本。
文档编号H04L12/56GK1710887SQ20051005483
公开日2005年12月21日 申请日期2005年3月17日 优先权日2004年6月18日
发明者马克·A·博尔多格纳, 克里斯托弗·W·汉密尔顿, 迪帕克·卡塔里亚, 普拉温·K·帕塔克, 马克·B·西姆金斯 申请人:艾格瑞系统有限公司