在数据中心以太网中的流量控制管理方法、系统和设备的制作方法

文档序号:7919092阅读:288来源:国知局
专利名称:在数据中心以太网中的流量控制管理方法、系统和设备的制作方法
技术领域
本发明主要涉及流量控制,尤其涉及经由延伸距离的流量控制。
技术背景数据中心以太网(DCE)是一种新兴的工业标准,该标准提出对 现有网络进行修改,以便将以太网定位成是用于所有类型的数据中心 业务量的首选汇聚组织(convergence fabric )。近期的研究发现,以 太网是一种具有处于图1所示数据中心的1/0合并的汇聚组织。预计 这种合并将会简化平台架构并降低总的平台成本。在"Proposal for Traffic Differentiation in Ethernet Networks"中描述了关于合并建议 的更多细节,并且该文献可以在http:〃www.ieee802.org/l/files/publie /docs2005/new-wadekar-virtual。/。20-links-0305.pdf找到。对DCE (也被称为增强型以太网和低等待时间以太网)来说, 目前提出的主要改变包括在链路层添加以信用点(credit)为基础的流 量控制、拥塞检测以及数据速率节流,以及添加具有服务质量区分的 虚拟通道(virtual lane )。值得一提的是,这些功能并未影响到存在 于DCE等级之上的传输控制协议/网际协议(TCP/IP)。此外还应该 指出,DCE的目的是在不需要TCP/IP开销的情况下执行操作。这样 做会提供一种不需要卸载处理或加速器的更简单的低成本方法。发明内容根据例示实施例,在这里提供一种用于在相隔延伸距离的源节点 与目的地节点之间的数据中心以太网(DCE)网络中管理流量控制的 方法、系统和设备。源节点与目的地节点之间的起始序列被拦截,其
中该起始序列用于确定可以用于在源节点和目的地节点中接收分组的 緩存信用点。针对源节点和目的地节点产生应答,其中该应答指示的 是可以在散布于源节点与目的地节点之间的至少一个扩展数据接口中 使用的緩存信用点。该启动序列根据来自扩展数据接口的应答而被完 成。此外,保存在扩展数据接口中的数据还可以用于链路恢复。


现在参考附图,其中相同的部件是以相同方式编号的图l描述的是在数据中心以太网(DCE)网络中提出的业务量合并;图2描述的是根据例示实施例的扩展DCE组织;图3描述的是根据例示实施例并处于扩展DCE组织中的源节点 与目的地节点之间的启动序列;图4描述的是根据例示实施例来向扩展DCE組织中的源节点和 目的地节点发送应答;图5描述的是根据例示实施例的緩存信用点应答以及EDI緩存 数据重传;图6描述的是根据例示实施例的扩展DCE组织中的恢复处理;以及图7描述的是根据例示实施例的EDI的详细视图。
具体实施方式
可以预见的是,在经由长距离(10千米到约100千米或更远)的 应用中将会用到DCE网络,其中所述应用包括光纤通道存储局域网 的容灾恢复和封装,该网络则可以是用于XRC和全局镜像应用的网 络。此外,即使源与目的地的地理距离并不遥远,DCE网络的拓朴结 构也还是有可能需要很大的距离。例如,多交换机组织可以用于互连 相邻办公建筑物的不同楼层上的节 出并以反向传播信用点为基础的流量控制未必可以扩展到这些距离。虽然用于DCE的最终规范尚未发布,但是可以设想,对经由延伸距 离的以信用点为基础的流量控制操作来说,其需要的链路緩存将会远 远多于可以为网络接口卡(NIC)设计所给予的链路緩存。即使可以 物理延长这些链路,但是高性能仍旧需要始终用数据来填充这些链路。 否则,緩存信用点不足有可能会导致产生糟糕到无法接受的性能。根据一个例示实施例,在大型DCE网络中,链路层上的可靠性 是通过在NIC等级的硬件中管理流量控制以及通过补偿延伸距离的 效果来增强的。在图2中显示了一个基本的扩展DCE组织100。该组织包括一 个扩展DCE网络140,其中分组是经由该网络传播的。在图2中,延 伸距离接口 (EDI) 110a和110b是作为交换机端口表示的,其中该交 换机端口可以具有专为延伸距离设计的可插式光学收发信机。但是, 在这里也可以使用独立的DCE通道扩展产品或波分复用器(WDM) 来实施EDI的功能。为了简化说明,后续描述主要参考的是如用经过 修改的交换机端口实施的EDI。无论是作为交换机端口、独立产品还 是WDM来实施,该EDI都需要具有经由长距离延伸的端口的知识。 举例来说,该知识既可以通过简单地读取与交换才几端口上的可插式光 学装置相关联的重要产品数据(VPD)来确定,也可以通过经由软件 管理界面或其他装置配置该交换机来确定。 一旦确定该知识,那么可 以激活最优的緩存信用点管理。在下文中将会参考图7来对此进行更 详细的描述。如图2所示,EDI110a和110b散布于源节点120与目的地节点 130之间。源节点120和目的地节点130中的每一个包括NIC,并且 经由DCE链路115和DCE网络140来相互通信。虽然在图中仅仅显 示并且在这里仅仅描述了两个EDI,但是应该了解,可以使用任何适 当数量的EDI。如图3所示,EDI110a和110b可以窃听源节点120与目的地节 点130之间的初始化序列。在这个序列中,源节点120和目的地节点
130都会确定可供数据传输使用的緩存信用点,也就是可以在每一个 节点中用于接收分组的緩存器空间。通常,緩存-緩存信用点(BBC)信息是在节点之间交换的,由 此每一个节点将会得知可以在其他节点中使用的緩存信用点。作为起 始处理的一部分,较小的緩存器(无论是在源节点还是目的地节点中) 将会控制可以在节点之间传送的数据量。如图3所示,与允许不间断地进行起始序列不同,EDI 110a和 110b可以拦截来自网络140的任何一方的緩存信用点报告。然后,如 图4所示,EDI 110a和110b可以插入其自身的链路初始化响应,其 中该响应实际指示的是可以在EDI中使用的緩存信用点。该结果可以 被认为是从EDI 110a到源节点120以及从EDI 110b到目的地节点130 的"虚拟化"链路初始化序列。EDI110a和110b可以包括控制逻辑,如下文中参考图7所例示 和描述的那样,该控制逻辑控制緩存信用点信息的拦截和插入。如图 5所示, 一旦链路初始化完成,那么EDI110a、 110b会将其自身的緩 存信用点分别传送到源节点120和目的地节点130,由此源节点和目 的地节点都看起来是经由很短的链路连接的。EDI 110a和110b可以 产生用于指示可用緩存信用点的应答,并且将其分别传送到源节点 120和目的地节点130。由于源节点120和目的地节点130全都接收到 连续的緩存信用点确认流,因此,它们将会提供连续的数据分组流。 这样做将会保持填充长链路,并且改进性能。关于分组传输和分组接 收确认的更多细节是在共同转让的美国专利申请11/847,965中提供 的,其中该申请在这里引入作为参考。关于PSN的更多细节是在共同 转让的美国专利申请11/426,421中提供的,并且该申请同样在这里引 入作为参考。这种方法存在的一个显著问题是在EDI已经报告了分组接收 成功之后从链路故障中恢复。根据一个例示实施例,该恢复是由EDI 而不是由附属的源和目的地节点执行的。每一个EDI都被设计有足够 大的数据緩存器,以便容纳例如长达100km的链路。如图6所示,当
发生链路错误、例如无法递送分组时,EDI 110a和110b将会辨认出 这种情况,并且执行从其自身緩存器中恢复的处理,由此根据需要来 重传分组,以便进行恢复。这样一来,恢复处理并没有留给源和目的 地节点,而是由EDI来执行的。在图6中,链路错误是用附图标记150a 和150c表示的。附图标记150b表示的一种特殊链路故障是光损耗(LOL)。这 种链路故障可以被假设成会使在网络上传输的所有数据无效。在这种 情况下,EDI 110a和110b将会清洗其緩存,无效化传输中的分组, 防止将无效分组存储在緩存器中,以及等待虚拟EDI接口链路重新初 始化。EDI110a和110b会将LOL故障分别传播到源节点120和目的 地节点130,由此这些节点将会停止发送分组。 一旦EDI将LOL故 障告知源节点和目的地节点,那么源节点和目的地节点将会清洗其緩 存器。这种链路故障处理与先前提出的其它类型的链路扩展技术不同。 根据例示实施例的链路故障恢复处理将会确保扩展距离链路上的端到 端数据完整性,同时还在比仅仅使用DCE流量控制所能实现的距离 更长的距离上提供最大性能。图7描述的是#>据例示实施例并且如图2 6所示的EDI的详细 视图。EDI 110a、 110b中的每一个都可以包括与在DCE网络的交换 机中发现的组件相类似的组件,例如虛拟产品数据(VPD)标识组件 710、緩存信用点存储器730以及控制逻辑750。但是,与传统的交换 机不同,EDI包括一个专为远程传输设计的光学收发信机740。此夕卜, 緩存信用点存储器730可以大于那些在传统交换机中发现的緩存器, 以便容纳那些经由长距离接收的数据。作为替换,EDI可以借助现有 交换机并且通过插入光学收发信机以及使用緩存信用点合并 (pooling )或是将緩存存储卡与具有更大緩存存储器的卡相交换来实 施。如果换出緩存存储卡,那么EDI中的緩存信用点存储器将被报告 给网络中的管理模块的管理软件。如果使用的是緩存合并,那么EDI 所需要的信用点总量可以由受网络管理员控制的管理模块来确定。如
果插入新的緩存存储卡和可插式光学装置,那么EDI可以使用VPD 标识单元710来对其进行识别。此外,EDI还包括用于链路恢复的逻 辑720。这个用于链路恢复的逻辑从长距离光学收发信机740接收一 个关于链路错误状况的指示,并且在与控制逻辑750和緩存信用点存 储器730拥塞的情况下工作,以便通过恢复緩存器730或者在LOL 情况下清洗緩存器730,以及通过无效化传输中的分组并且等待重新 初始化来从链路错误中恢复。根据例示实施例,在延伸距离上进行的无损DCE的操作将被启 用。此外,在长链路上还可以启用更高的性能和带宽利用率。虽然在这里参考例示实施例而对本发明进行了描述,但是本领域 技术人员应该理解,在没有脱离本发明的范围的情况下,各种变更都 是可行的,并且在这里可以用等价物来替换这些例示实施例的部件。 此外,在不脱离本发明的本质范围的情况下,在这里可以采取众多修 改,以使特定的情形或材料适应于本发明的教导。由此,本发明并不 局限于作为被认为是执行本发明的最佳模式而被公开的特定实施例, 相反,本发明将会包含落入附加权利要求范围以内的所有实施例。
权利要求
1. 一种用于在数据中心以太网(DCE)网络中管理流量控制的方法,包括在DCE网络中的源节点与目的地节点之间拦截起始序列,以便确定可以用于接收分组的缓存信用点,其中源节点和目的地节点相隔一个延伸距离;产生针对源节点和目的地节点的应答,该应答指示的是在散布于源节点与目的地节点之间的至少一个扩展数据接口上可用的缓存信用点;根据来自扩展数据接口的应答来完成起始序列。
2. 根据权利要求1所述的方法,还包括持续向源节点和目的 地节点提供关于扩展数据接口中的可用緩存信用点的应答。
3. 根据权利要求1所述的方法,其中扩展数据接口产生的应答 使源节点和目的地节点看上去似乎这些节点之间的链路很短。
4. 根据权利要求1所述的方法,其中扩展数据接口产生的应答 被传送到源节点和目的地节点。
5. 根据权利要求1所述的方法,其中源节点与目的地节点之间 的延伸距离跨越了多链路、大规模的DCE组织。
6. 根据权利要求1所述的方法,还包括使用保存在扩展数据 接口的緩存器中的数据来从链路故障中恢复。
7. 根据权利要求6所述的方法,其中如果链路故障是光损耗, 那么恢复步骤包括清洗保存在扩展数据接口的緩存器中的分组,无 效化在扩展数据接口上接收的分组,以及阻止在緩存器中存储接收到 的无效分组。
8. —种用于在数据中心以太网(DCE)网络中管理流程控制的 系统,包括源节点,用于传送和接收分组;目的地节点,用于接收分组和传送分组,其中源节点和目的地节 点相隔一个延伸距离;散布在源节点与目的地节点之间的至少 一个扩展数据接口 ,用于 在DCE网络中的源节点与目的地节点之间拦截起始序列,以便确定 可以用于接收分组的緩存信用点,其中该扩展数据接口产生针对源节 点和目的地节点的应答,该应答指示的是在散布于源节点与目的地节 点之间的至少一个扩展数据接口上可用的緩存信用点;以及起始序列 是根据来自扩展数据接口的应答而被完成的。
9. 根据权利要求8所述的系统,其中扩展数据接口持续向源节 点和目的地节点提供关于可用緩存信用点的应答。
10. 根据权利要求8所述的系统,其中扩展数据接口产生的应答 使源节点和目的地节点看上去似乎这些节点之间的链路很短。
11. 根据权利要求8所述的系统,其中扩展数据接口产生的应答 被传送到源节点和目的地节点。
12. 根据权利要求8所述的系统,其中源节点与目的地节点之间 的延伸距离跨越了多链路、大规模的DCE组织。
13. 根据权利要求8所述的系统,其中在扩展数据接口中可用的 緩存信用点被用于从链路故障中恢复。
14,根据权利要求13所述的系统,其中如果链路故障是光损耗, 那么扩展数据接口将会通过清洗保存在扩展数据接口的緩存器中的分 组以及通过阻止在緩存器中存储接收到的无效分组来执行恢复。
15. —种用于在数据中心以太网(DCE)网络中管理流量控制的 设备,包括远程收发信机,用于在DCE网络中的源节点与目的地节点之间 拦截起始序列,其中源节点与目的地节点相隔一个延伸距离,并且该 设备散布在源节点与目的地节点之间;緩存信用点存储器,用于存储分组;以及控制逻辑,用于确定可以在緩存信用点存储器中用于存储分组的 緩存信用点,以及产生针对源节点和目的地节点的应答,其中该应答 指示的是在緩存信用点存储器中可用的緩存信用点,并且其中起始序列是根据这些应答来完成的。
16. 根据权利要求15所述的设备,其中收发信机持续向源节点 和目的地节点提供关于可用緩存信用点的应答。
17. 根据权利要求15所述的设备,其中控制逻辑产生的应答使 源节点和目的地节点看上去似乎这些节点之间的链路很短。
18. 根据权利要求15所述的设备,其中控制逻辑产生的应答被 收发信机传送到源节点和目的地节点。
19. 根据权利要求15所述的设备,其中源节点与目的地节点之 间的延伸距离跨越了多链路、大规模的DCE组织。
20. 根据权利要求15所述的设备,还包括链路恢复逻辑,其中 该逻辑使用在緩存信用点存储器中可用的緩存信用点来从链路故障中 恢复,并且其中如果链路故障是光损耗,那么链路恢复逻辑通过清洗 保存在緩存器中的分组,无效化传输中的分组以及阻止在緩存器中保 存接收到的无效分组来执行恢复处理。
全文摘要
本发明涉及在数据中心以太网中的流量控制管理方法、系统和设备。在数据中心以太网(DCE)网络中,流量控制是在相隔一个延伸距离的源节点与目的地节点之间管理的。源节点与目的地节点之间的起始序列被拦截。该起始序列用于确定可以用于在源节点和目的地节点中接收分组的缓存信用点。针对源节点和目的地节点产生应答,该应答指示的是可以在散布于源节点与目的地节点之间的至少一个扩展数据接口中使用的缓存信用点。该启动序列则是根据来自扩展数据接口的应答而被完成的。
文档编号H04L12/56GK101399770SQ20081014924
公开日2009年4月1日 申请日期2008年9月17日 优先权日2007年9月27日
发明者C·德库萨蒂斯, 托马斯·A.·格里格 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1