专利名称:用于管理容错网络上的节点的设备和方法
技术领域:
本发明总体上涉及计算机网络,更具体地涉及管理容错网络(f au 11 tolerant network)上的通信业务(communication traffic)。
背景技术:
网络提供从网络上的 一个节点到该网络上的其他节点的通信。节点 可以包括利用网络向该网络上的其他设备传送信息的各种设备。例如, 网络上的工作站可以在网络上与服务器或打印机通信。在更基本的网络 中,传感器可以向基础(base)计算机传送信息,所述基础计算机可以 向才几才成致动器(mechanical actuator)传送4言息。基础计算才几可以与 各种传感器和机械致动器进行通信以执行期望的操作。
通信信道提供了允许网络与网络节点进行通信的媒体。通信信道可 以是一个或多个导线或光缆。通信信道可以是使用例如射频、微波或红 外线的无线通信信道。
网络可以是局域网(LAN) 。 LAN上的节点可以经由广域网与其他 LAN进行通信。为了提供数据在网络内的路由以及将数据路由到各种其 他连接的网络,网络可以使用有助于数据路由的设备。例如,交换机 (switch)、路由器、集线器、桥接器(bridge)可以被用于在节点以 及网络之间传送和交换数据。
所述网络可以使用允许节点接收和传送数据的协议。使用最多的共 用协议的其中一种是以太网。以太网允许节点对数据进行封包 (package),将数据传送到期望的节点,以及在期望的节点对数据进 行拆封(unpackage)。以太网网络上的节点可以使用网络接口卡来将 数据从节点供应到通信信道。
以太网协议还提供对在传输期间可能被破坏或丟失的数据的恢复。 然而,当网络上的节点或设备失去与网络的连接时,该协议不能进行恢 复。容错(fault tolerance)常常被提供以确保持续的节点到节点的 通信。网络上的组件的冗余性允许节点在第 一组件出现失效时通过第二 组件进行通信。容错网络的节点可以具有一个以上网络接口卡,并且包 括具有多个通信路径的节点。网络容错管理器监视着失效(fai lure)的检测和失效排除的处理。失效排除包括对指示失效的节点或组件的数据 传输进行重定向。容错管理器可以终止通过第 一 网络接口卡或通信路径 的通信。
即使容错网络可以通过网络的第二组件恢复通信,耦合到以太网网
络的节点有时也会遭受这样的情形(condition),在这样的情形下, 使节点产生紊乱的业务量(amount of traffic),假定耦合到网络的 其他节点的电子身份(electronic identity),或以其他方式干扰网 络的期望操作。在部署于关键应用中的容错网络中,此失效沖莫式可能会 导致网络上的该节点或其他节点失去可见性(visibility)。在一些情 况下,此失效会引起对与节点相关联的设备的控制的丧失。
因此,需要高效且有效的系统和方法来防止来自失效的节点或设备 的错误通信对网络上其他节点的正常(legitimate)通信的干扰和/或 阻止。另外,所述系统和方法可以向容错管理器提供关于网络的哪些组 件或设备正在产生错误通信的信息。
发明内容
因此,本发明的目标是提供用于管理容错网络上的通信业务的设 备、系统和方法。根据本发明的示例性实施例,容错网络可以具有两个 或更多节点。所述系统可以具有两个或更多通信信道。每个通信信道都 耦合着两个或更多节点。每个节点有选择地在所述两个或更多通信信道 中的一个上进行通信。所述系统还具有与两个或更多信道进行通信的交 换机。所述交换机接收两个或更多通信信道上的网络业务并且终止两个 或更多通信信道上的网络业务。网络业务的终止使得容错管理器对所述 两个或更多通信信道中的一个上的网络业务进行重新路由(reroute)。
在可替换的实施例中,交换机可以根据所接收的网络业务错误或网 络业务量(volume)来终止网络业务。在另一个实施例中,交换机具有 用于确定网络业务统计量(statistics)的网络业务分对斤。交换才几可以 将网络业务统计量传送到容错管理器。在另一个实施例中,交换机对网 络业务的终止是由容错管理器来控制或命令(dictate)的。在又一个 实施例中,交换机对网络业务的终止就终止了来自选择的节点的业务。
根据如下结合附图所给出的详细描述,本发明的如上和其他目标和 优点将会很明显,在所有附图中,同样的附图标记指代同样的部件,其中
图1是用于实现本发明的实施例的示例性通信网络的概括性示意图。
图2是用于实现本发明的实施例的通信网络的框图。 图3是图示出本发明的第一示例性实施例的流程图。 图4是图示出本发明的第二示例性实施例的流程图。
具体实施例方式
如图1中所示,容错网络100向节点提供了用于网络通信的附加设 备和通信信道。网络通信是在两个或更多通信信道上被传送和接收的。 第一通信信道102提供节点之间的网络通信。如果第一通信信道102失 效(fail),则容错管理器(未示出)可以在第二通信信道104上对通 信进行重新路由。
容错网络100可以包括一些具有多个网络接口卡的节点,例如,如 图1中所示的节点A和节点B。容错网络IOO还可以包括一些具有被耦 合到网络的通信信道的单网络接口卡的节点,例如节点C和节点D。根 据示例性实施例,交换机106 ;故提供来控制在网络通信信道102和104 上的通信业务。交换机106可以终止第一通信信道102或第二通信信道 104上的网络业务,以使容错管理器对网络业务进行重新路由。
当在使用中时,容错网络100提供冗余(redundant)的设备来补 偿设备失效。例如,如果用于将节点A耦合到第一通信信道102的网络 接口卡失效,则容错管理器可以终止通过该网络接口卡到节点A的通信。 容错管理器将开始经由第二通信信道104将去往节点A的通信发送到第 二网络接口卡。容错网络还可以补偿通信信道的失效。例如,如果第一 通信信道102在节点B和节点A之间的点处出现失效,则容错管理器可 以经由第一通信信道102继续向节点B传送通信。为了改正(correct) 与不能在第一通信信道102发送通信到节点B以外相关联的问题,容错 管理器可以开始在第二通信信道l(M上发送通信。当网络设备失效或者 管理器节点终止到组件的网络通信时,错误消息可能会继续被失效的或 终止的组件传送。这些错误消息可以产生不必要的拥塞或干扰正常的网 络业务。
根据本发明的示例性实施例,交换机106可以检测来自已终止的节 点A的错误通信的增加。交换机106可以独立地终止第一通信信道102上的通信。容错管理器可以通过将通信传送到节点A和节点B的第二网 络接口卡来改正到节点A和节点B的失败通信。交换机106可以成功地 阻止错误通信干扰正常通信并且允许容错管理器将以节点A和节点B为 目的地的通信重新路由到第二通信路径104。
在硬件结构方面,交换机106可以包括处理器、存储器和一个或多 个输入和输出接口设备。本地接口可以具有附加元件,在此为简单起见 而将其省略,例如用于实现通信的控制器、緩冲器(高速緩存)、驱动
器、中继器和接收器。此外,本地接口可以包括用于在网络的组件之间 实现适当通信的地址、控制和/或数据连接。
所述系统和方法还可以被并入到与计算机或交换机的其他适当操 作设备一起使用的软件中。存储在或加载在存储器中的软件可以包括一 个或多个分离的程序,每个程序都包括用于实现本发明的方法和系统的 可执行指令的有序列表。所述软件可以与操作系统一起工作。操作系统 实质上控制着计算机程序(例如存储在存储器内的软件)的执行,并且 提供调度(scheduling)、输入-输出控制、文件和数据管理、存储器 管理以及通信控制和有关服务。所述系统和方法还可以包括图形用户界 面(GUI),用于使管理员或用户能够输入与管理容错网络上的通信业 务的交换机106相关联的约束条件,这将在之后被论述。
图2是用于实现本发明的实施例的通信网络的框图。容错网络200 包含容错管理器202。容错管理器202以开环排列的方式连接到第一网 络交换机204、第二网络交换机206和第三网络交换机208。多种通信 信道连接网络交换机和节点A、 B、 C和D。图2仅描绘了连接到通信信 道的三个网络交换机和四个节点,不过任何数目的节点可以被连接到任 何数目的交换机,只要那些数目符合网络协议以及交换机端口数目的限 制。此外,可以采用与图1中所描绘的方式类似的方式将节点直接连接 到通信信道。
容错管理器203控制着用于网络节点的通信信道。容错网络200中 的本地失效可以被表征为设备失效影响前往节点的一个网络接口卡的 通信。例如,节点D的网络接口卡Dl的本地失效可以引起容错管理器 切换到网络接口卡D2。节点D现在可以经由网络接口卡D2与第三交换 才/L 208进4亍通信。
尽管节点D不再通过网络接口卡Dl传送业务,但是第二交换机206仍旧可能舍接收到由网络接口卡Dl的失效或与该失效相关的网络的组 件所产生的大量错误业务。根据本发明的示例性实施例,第二交换机206 可以识别由网络接口卡Dl产生的大量错误业务。第二交换机206可以 终止从网络接口卡Dl接收到的网络业务。通过釆取该行动(action), 第二交换机206防止错误消息传播通过通信网络并防止在通信中产生不 必要的拥塞或更多错误。
交换机还可以通过经由交换机终止所有的网络业务并且允许容错 管理器采取适当行动来采取附加措施。根据上面的例子,第二交换机2 06 可以终止所有的通信。容错管理器202可以通过第一网络接口卡Bl和 第一交换机204引导来自节点B的通信。容错管理器202还可以通过第 二网络接口卡C2和第三交换机208引导来自节点C的通信。第二交换 机206终止所有业务的结果使得通信网络继续通信,且同时防止由节点 C的第一网络接口卡CI产生的错误通过网络传播并导致更多问题。
上面的例子是以说明为目的。本领域技术人员将会意识到,交换机 可以采取各种复杂的行动。例如,交换机可以与容错管理器进行通信或 者使存储器存储容错管理器的预定义的程序。这些预定义的程序是容错 管理器将根据特定网络组件失效而采取的行动。交换机可以对这些行动 进行归类(sort through)和分析并且执行某些行动以使容错管理器做 出响应。交换机还可以具有多种预定义的阈值等级(level ),所述阈 值等级确定交换机应该在何时执行哪些行动。例如,如果交换机接收到 预定义的网络业务量,那么交换机就可以终止通信。
交换机可以使用多种存储的阈值和行动来控制网络中的错误业务。 这些行动和阈值可以根据特定的一般(general)网络配置和容错管理 器而一皮设置和标准化。如前所论述的那样,所述^f亍动和阈^直可以才艮据用 户或管理员输入的参数来定制。交换机还可以识别交换机所支持的组件 并且根据所支持的组件来定义行动。
在图2的示例性系统中,第一交换机204可以经由管理员的指令或 其他识别过程来识别节点A必须经由第一交换机204来进行通信。第 一交换机204可以确定在终止通信之前要求相对高的错误业务的阈值。 这是因为如果第 一 交换机终止所有通信的话,至节点A的通信将会丢失。 所述阈值可以将中断网络业务的错误作为整体来考虑并且考虑与节点A 通信的需要。尽管这是个相对简单的例子,但是本领域技术人员将会意识到在考虑到在现实通信网络中交换机所看到的节点和网络组件的数 目时交换机可以执行的复杂算法。
交换机可以考虑容错管理器所使用的多种失效检测模式。容错网络 所使用的多种失效检测模式是已知的。可以在多种这些失效检测模式下 使用交换机以辅助容4普网络才企测至少 一个网络组件的失-丈并且响应该 失效。
在可替换的实施例中,交换机还可以收集网络通信统计量并且将统 计量报告给容错管理器。容错管理器能够使用这些统计量来确定将要使 用的适当的通信信道和设备。交换机可以使用网络的协议经由网络的通 信信道将错误业务传送到容错管理器。可替换地,交换机可以具有用于 与容错管理器进行通信的独立通信信道。
交换机所收集的统计量可能不会被容错管理器看到。例如,错误消 息可能没有被交换机传播并且可能不会被容错管理器查看。本发明允许 交换机收集该信息并且将该信息传送到容错管理器。之后将会详细描述 该实施例的一个方面。
图3是图示出本发明的第一示例性方法300的流程图。根据第一示 例性方法300,交换机提供在第一信道上从第一节点到第二节点的通信 (块302 )。交换机确定从第一节点到第二节点的通信的失效模式(块 304 )。如前所论述的那样,交换机可以考虑各种因素来确定何时应该 采取行动。这可以包括例如业务阔值、网络可用的设备以及容错管理器的模式或行动。
交换机提供在第二信道上从第一节点到第二节点的通信(块306 )。
交换机可以终止第一信道或第二信道上的网络业务(块308 )。交换机 所采取的行动或网络业务的终止使得容错管理器对网络业务进行重新 路由(块310)。这允许交换机根据可能不会被容错管理器查看的本地 网络业务来控制和改变网络业务。如前所论述的那样,交换机可以^f皮预编程为考虑各种网络因素以及容错管理器所特有的因素和容错管理器 所采取的行动。
图4是图示出本发明的第二示例性实施例400的流程图。根据第二 示例性方法400,交换机提供在第一信道上从第一节点到第二节点的通 信(块402 )。类似于第一示例性方法300,交换机确定从第一节点到 第二节点的通信的失效模式(块4Q4)。交换机还提供在第二信道上从第一节点到第二节点的通信(块406 )。交换机可以终止第一信道或第 二信道上的网络业务(块408 )。交换机所采取的行动或网络业务的终 止使得容错管理器对网络业务进行重新路由(块410),如先前关于第 一示例性方法300所论述的那样。
交换机可以确定网络业务统计量(块412)。例如,交换才几可以记 录产生网络业务的组件和数量。交换机可以计算和分析这些统计量。所 述统计量可以考虑交换机所传送的业务总量。交换机可以使用这些统计 量来确定要采取什么行动。可替换地,交换机可以将网络业务统计量传 送到容错管理器(块414)。网络业务统计量可以包括由交换机收集的 所有数据或统计量的汇总版本。容错管理器可以利用这些统计量来确定 适当的容错模式或其他行动。
将会理解到,上文只是对本发明的原理进行说明并且本领域技术人 员能够在不偏离本发明的范围和精神的情况下进行各种修改。因此,这 样的实施例将会^^见为落入本发明的范围。例如,示例性实施例;故图示 为在网络的交换机内实现,然而,本领域技术人员将会意识到本发明的 实施例可以被在各种网络组件中实现,例如路由器、集线器和服务器。
本领域技术人员将会意识到,本发明能够通过除所描述的实施例以 外的方式实现,所述实施例是为了说明的目的而提供的,而不是为了限 制,并且本发明仅通过随后的权利要求书来限定。
权利要求
1.一种容错网络,包括至少两个节点(A、B);至少两个信道(102、104),每个信道都与所述至少两个节点(A、B)通信;其中每个节点(A、B)有选择地在多个信道(102、104)中的一个上进行通信;以及交换机(106),与所述至少两个信道(102、104)通信,其中交换机(106)接收网络业务并且终止一个或多个信道(102、104)上的网络业务,使得容错管理器(202)根据接收到的网络业务对所述至少两个信道(102、104)中的一个信道上的网络业务进行重新路由。
2. 如权利要求1所述的容错网络,其中交换机(106 )根据所接收 的网络业务错误来终止网络业务。
3. 如权利要求1所述的容错网络,其中交换机(106 )根据网络业 务量来终止网络业务。
4. 如权利要求1所述的容错网络,其中交换机(106)还包括用 于确定网络业务统计量的网络业务分析。
5. 如权利要求4所述的容错网络,其中交换机(106)将网络业务 统计量传送到容错管理器(202 )。
6. 如权利要求1所述的容错网络,其中由交换机(106)对网络业 务的终止是由容错管理器(202 )来控制的。
7. 如权利要求1所述的容错网络,其中由交换机(106)对网络业 务的终止是由容错管理器(202 )来命令的。
8. 如权利要求1所述的容错网络,其中由交换机(106)对网络业 务的终止就终止了来自选择的节点(A、 B)的业务。
全文摘要
本发明公开了用于管理容错网络上的通信业务的设备、系统和方法。示例性系统可以包括具有至少两个节点和至少两个通信信道的容错网络。每个通信信道都与两个节点中的每一个节点通信。每个节点有选择地在多个信道中的一个信道上进行通信。交换机与所述至少两个信道通信。交换机接收网络业务并且终止一个或多个信道上的网络业务。网络业务的终止使得容错管理器根据接收到的网络业务对所述两个通信信道中的一个信道上的网络业务进行重新路由。
文档编号H04L29/14GK101292502SQ200680038571
公开日2008年10月22日 申请日期2006年8月15日 优先权日2005年8月17日
发明者F·希德尔 申请人:霍尼韦尔国际公司