专利名称:延长InfiniBand网络的实时到达的方法
技术领域:
本发明涉及一种用于延长Infin氾and网络的超出该InfiniBand结 构现有可能的实时到达的装置,并且尤其是,允许InfiniBand分组 经本身不遵循InfiniBand结构的网络被运送。这允许InfiniBand通信 量与以其它诸如网际协议版本6(IPv6)或者异步传输模式(ATM)单元 的标准协议共享物理网络。此外,由于在该装置中非常大的流量控 制缓存,伴随着防止缓冲溢出的流量控制信用方案的使用,本发明 允许大量数据在广域网(WAN)内被运输,同时仍然确保数据分组会由于接收机上不充足的缓存资源而不被丢失。为了有助于确保数据 分组在WAN内不被丢弃,该装置还可以包括许多的业务质量(QOS) 功能,其用于限制数据在响应背压的过程中进入WAN的注入速 率。本发明还可以允许数据分组被以允许一个以上的装置连接到 WAN这样的一种方式路由,从而允许InfiniBand网络使用最少的装 置能够扩展为两个以上的物理位置。包含在该装置内的处理器可以 操纵管理功能,诸如InfiniBand子网管理代理和设备管理。
背景技术:
众所周知,由于在InfiniBand结构内每个虚拟通道(VL)许可的信 用至多128KiB的限制,10Gbit InfiniBand仅仅能够达到大约 10km。这种限制对可以立即传输的数据量设置了一个上限,因为标 准InfiniBand发射机没有可资利用的信用而不能传送。此外,众所周知,限制可以传输的数据量小于网络路径的带宽等待时间积将直 接限制可以获得的最大数据传送速率。例如,具有130微秒的往返行程等待时间的10Gbit InfiniBand链 路具有128KiB的带宽等待时间积,其是一个InfiniBand链路内的单 个VL的所能准许的信用的最大量。典型地,InfiniBand链路将具有1个以上的入口和出口 VL(直至 15个),该InfiniBand结构指定必须每个被独立地缓存,并且流量被 控制以防止线路的头部堵塞以及流量控制停滞。在一些实施例中, 该InfiniBand接口包含附加的流量控制缓冲器单元从WAN时钟域 转换为InfiniBand时钟域。由于物理上的限制,数据在光纤上以小于光速的速率传输。当 光纤被认为是携带比特的导管的时候,很明显,整个的长的光纤可 以包含运送中的许多兆比特的数据。例如,如果在传输10Gbit数据 流的特定的光纤中光速是5ns/米,并且光纤是100km长,那么该光 纤在每个方向将包含5兆比特的数据。许多WAN路径也包括来自 带内设备增加的等待时间,诸如再生设备、光多路复用、增加/丢弃 多路转换器、路由器、开关等等。这个额外的设备增加了附加的等 待时间,并且进一步延长路径的带宽等待时间积。正如InfiniBand结构所定义的,该InfiniBand电子和光信号协议 与传统的WAN环境不兼容,或者不适用于传统的WAN环境。典 型地,WAN环境在长距离光纤上使用同步光纤网(SONET)标准。此外,为了减轻InfiniBand网络管理,正如InfiniBand结构所描 述的,所希望的是对InfiniBand数据分组执行路由选择。无需对所 有其它的参加者施加实质上的政策,路由选择允许每个远距离的站 点在较大InfiniBand网络上的其所属部分保持局部控制。发明内容当结合在一起的时候,光纤的物理限制,需要具有超过路径的带宽等待时间积的缓冲能力,以及在InfiniBand结构内的多个VL的 特点,都变得显而易见,需要将其中较好管理的非常大的缓冲存储 器的装置由InfiniBand网络延长到横贯大陆的距离。例如,不考虑 任何额外的等待时间开销,具有15个VL的实际5000km的距离将 需要894MiB的缓冲存储器。该装置的一部分功能是为了将在本地短InfiniBand链路上广告的 信用(其典型地是8KiB)延长为更加适用于WAN的数字(其典型 地是每个VL 512MiB)。这是使用先入先出缓存器(FIFO)做到的, 当本地InfiniBand信用是可利用的时候将其排空,并且当输入数据 抵达之时填满。周期性地,该装置经由用于每个有效的VL的信用 广告数据分组通知其它的远程装置在FIFO内更多的空间是可利用 的,并且该远程装置使用这个信息以确保其除FIFO可以接受的之外 永不传送更多的数据。这是相同的基本流控制机理(端到端信用信息 交换),其被以InfiniBand结构方式使用,但是,其被比例增大以操 纵缓存的十亿字节,并且更加适用于WAN环境。以这样的方式, InfiniBand型流量控制语义被保持在很大的距离上,以确保数据分组 由于拥塞而不被丢弃。在另一个实施例中,大容量缓冲存储器可以以所接收的数据分 组的不同次序的顺序采用在多个FIFO结构以外的数据分组。如果在本地InfiniBand端口上存在信用缺乏,那么该FIFO将填 满,但是由于信用数据分组在WAN上发送,在FIFO可以溢出之 前,该发射机将停止发送。信用数据分组可以插入进IPv6有效载荷结构中,或者替换地,他们可以嵌入在用于改善效率的IPv6延长头 部中。信用信息或者数据被以在66/64b代码中设置的顺序编码。 InfiniBand数据分组可以被设置在IPv6或者IPv4数据分组内传输的 UDP或者DCCP数据包的有效载荷结构内。为了实现与WAN标准兼容,该InfiniBand数据分组由在其它的 协议内的装置封装,诸如,在SONET(POS)上在数据分组内的 IPv6,用于在WAN上传输。如在IBTA中阐述的,全双工独立传输 与接收数据路径是由链路状态机控制的。该InfiniBand物理链路状 态机可以通过在WAN上交换非InfiniBand数据分组来保持,其中 这样做建立一个存在于WAN中的端到端路径,数据分组的交换包 括PPP LCP(根据RFC 1661)数据分组、以太网ARP(根据RFC 826 和RFC 2461(IPv6邻居发现))交换,TCP对话初始化(根据RFC 793),建立ATM SVC(根据ATM论坛专用网网络接口规范),或者 任何其它的对话启动形式。在被封装之后,该数据分组在WAN上传输,并且该接收装置 执行去封装步骤,除去在封装期间增加的数据,从而恢复原始 InfiniBand数据分组。这个封装起到两个作用,第一个是将光信号格式改变为可以在 WAN连接上自然地运输的东西,诸如SONET。这允许该装置直接 连接到SONET光学设备,其是较大的SONET拓扑结构的一部分, 并且被运输直到单个远程目的地。SONET协议,诸如通用成帧协议 (GFP)设计成用于这种封装任务。该封装部件能够支持多个网络,该 网络包括IPv6、 IPv6的UDP、 IPv6的DCCP、 ATM AAL5或者 GFP的任何一个。这也允许该装置与在WAN内的智能设备接口,其可以路由发 送特殊的数据分组或者单元。通过依靠WAN去执行聚集、路由选 择和/或切换许多的连接,这也允许InfiniBand业务与来自其它的信 源的业务共享WAN基础结构。诸如ATM适配层5(AAL5)、在POS上的IPv6和在以太网上的 IPv6的协议被设计正是考虑于此。为了在WAN上建立和保持端到端路径的目的,除了封装的 InfiniBand数据分组之外,用于交换非InfiniBand数据分组的通信装 置是必要的。许多的封装通过该装置是允许的,包括ATMAAL5、在POS上 的IPv6、在以太网上的IPv6、在IPv6中的DCCP、在IPv6中的 UDP、在通用多协议标记切换(GMPLS)上的IPv6、 GFP等等。类似 地,可以支持许多的WAN信令标准和速度,包括SONET、以太网 LAN-PHY和以太网WAN-PHY。单个装置可以支持许多的封装和信 令标准,并且用户可以在安装期间选择使用哪一个。对于小于10km的较短的距离,该封装被放弃,并且只是使用由 InfiniBand结构与非常大的流量控制缓存器结合而限定的光信号去延 长正常InfiniBand设备的到达,同时充分地遵循InfiniBand结构。在 这种情况下,该封装过程被简化为空封装,并且发出不变的 InfiniBand数据分组。信用模块的数目和/或信用模块大小可以被增 加以延长范围超出lOkm,同时仍然观察到另外不变的InfiniBand通 信协议。多个装置当该装置使用一个封装协议连接到智能WAN的时 候,其能够寻址,有二个以上的装置通信是可能的。这允许设置在许多的物理站点上的装置去共享相同的WAN连接和相同的装置, 同时延长和链接其InfiniBand网络进入很大的网状网络之内。在这个操作模式中,该装置需要去检査每个进来的本地 InfiniBand数据分组,以确定其应该发送给哪个远程装置,然后形成 恰当的封装将其传送。这可以通过检査在InfiniBand数据分组内的 局部标识符(LID),并且使用由InfiniBand规范定义的切换基础结 构,或者通过检査在InfiniBand数据分组内的全局标识符(GID),并 且基于子网前缀的最长的前缀匹配的路由选择来做到。每个装置也必须保留其流量控制缓存器的单独的部分用于每个 可允许的远程装置。这进一步增加N-l倍对缓冲存储器的需要,这 里N是在该网状网络中装置的数目。当接收到多点传送InfiniBand数据分组的时候,该装置或者将它 们映射到适宜的WAN多点传送地址上,或者执行数据分组复制以 将该数据分组的多个复制发送给预订该多点传送组的每个远程装 置。正如InfiniBand结构版本1.2所指定的,InfiniBand路由选择操 作需要该装置将128比特(bit) IPv6 GID变换为本地InfiniBand路 径描述,16比特局部标识符(LID), 24比特分割键和4比特业务水 平,用于使用全球路由头部(GRH)在本地InfiniBand网络上传输。当该装置在智能网络上,而不是在点对点结构中使用的时候, 在智能网络内的业务质量问题变为重要。该装置仅仅确保InfiniBand 数据分组决不会由于不足的缓存而被丢弃,其没有提供任何保证, 智能网络不会由于内部拥塞或者其它因素而丢弃数据分组。这主要指的是将数据分组在网络内的丢失减到最小是由该装置来控制数据分组到网络的注入速度。当它们被发送进WAN到接收 单元时,该装置通过在数据分组之间插入延迟来完成这些。注入速度可以或者由用户设置,或者通过相互作用和在装置和 智能网络之间的协议动态地控制。这种动态控制中包含有许多协议 和方法。第二种方法是利用该装置来特别地标记数据分组,使得该智能 网络可以将损失减到最小。这种方法可以与注入速度控制一起使 用。在该装置的管理模块内的管理软件担负运行任何的协议和方 法,其可以是使用通用的处理器经由WAN为建立服务质量保证所 必需的。附图简要说明
图1至3是示出可以在一个系统内采用的路由分组的数据流程 图。具有矩形边角的每个方框表示缓存、变换的过程或者判定点。 大的圆角方框表示相关的功能组。箭头示出数据分组流的方向。图1是用于原型的装置的数据流程图。其示出用于本发明一个 实施例的主要的模块。图2是用于设计成能与许多的WAN信令标准和协议互操作的 特定的远程实施例的数据流程图。其共享在图1中略述的许多的功 能块。图3是用于特定的减少特征短距的实施例的数据流程图,其举 例说明InfiniBand结构可以如何用作WAN协议。优选实施例详细说明本领域技术人员可以知道,各种各样的标准和资源为常规的数 字数据成分所固有。在此处涉及的如该领域中已知的一些标准和操作原理可以参考以下找到 InfiniBand行业协会(2005)。 InfiniBand结构版本1.2(也称为 "IBTA,,)。 Internet工程任务组(1998)。 RFC 2460-网际协议,版本6(IPv6)规范。 Internet工程任务组(1998)。在SONET/SDH上的RFC 2615-PPPo ATM论坛(1994)。 ATM用户网络接口规范版本3.1 。 鲁国际电信联盟。ITU-T推荐1.432.1 —般特性。 争开放系统互连(OSI)—基准模型基本模型(1994)。 ISO 7498-1:1994參IEEE802.3ae条款49; 66/64b编码方案参考图1,描述了在样机装置内的数据流。该装置包含六个主要 的模块InfiniBand接口、管理模块、分组路由选择、封装/去封装 部件(ENCAP)、 Wan接口和大容量缓冲存储器。存在可用于实现这 些模块的每个的各种各样的技术。这些模块被确定为在数据流程图 中的逻辑功能,特定的实施例可以选择在不同的物理模块之中传播 这些逻辑功能以实现更加最佳的实施例。该装置可以在每个方向同 时地保持大约每秒十亿字节InfiniBand数据分组的传送速率。该InfiniBand接口给本地IB构造提供LAN连接。为了清楚, 该InfiniBand接口包括二个小的流量控制缓存器以便从另一个附着 的模块仲裁数据速率。该管理模块提供了一个各种各样的高级管理和控制协议的实施 方式,该各种各样的高级管理和控制协议需要通过该装置可以遵循的各种各样的标准,例如,IB子网管理代理,用于在SONET上的 数据分组的一点对一点(PPP)协议,ATM操作和维护单元(OAM)以 及用于以太网的邻近发现高速缓存/询问的实施。典型地,这个模块 将使用某种常规微处理器与用于任何低等待时间或者高频管理数据 分组的专用的逻辑相结合的形式实现,诸如某种OAM单元。该分组路由选择模块实现由多个装置InfiniBand路由选择需要的 功能以及如上所述的业务质量(QOS)性能。这也提供了如在距离延长 的背景下论述的WAN信用数据分组。该分组路由选择模块也能够 识别将传送给用于特殊处理的管理模块的数据分组。该封装/去封装模块实现在以上的协议封装的背景下论述的封装 过程。对于一个实施例,该协议是OSI 7层参考模型(如在ISO 7498-1:1994中定义的),并且是从由层l(物理)、层2(数据链路)、层3(网 络)和层4(传输)组成的组中选择出来的。该样机的示意图示出几个可允许的不同的方案。该封装模块依 靠来自路由选择模块的附加的数据来确定封装的准确的形式。去封 装从封装的数据中恢复原始IB数据分组。 一些数据分组可以路由到 管理模块,并且如果他们被确定为管理数据分组,不经由去封装模 块发送。WAN接口是到WAN端口的通用接口。如这里所示,其包括一 个光学子系统,但是,WAN接口是使用电信号可允许的。成帧器单 元或功能从封装模块提取数据分组数据,并且格式其以符合选择的 WAN协议。例如,该以太网规范将该成帧器作为媒体访问控制 (MAC)、物理编码子层(PCS)和物理媒体附件(PMA)的组合引用。该成帧器也执行反相,和从WAN接口提取数据分组以传送给去封装 模块。支持的成帧格式包括SONET/SDH、 IOGBASE-R、 InfiniBand、 10GBASE-W和由IEEE 802.3ae条款49—10GBASE-R定义的66/64b编码方案。大容量缓冲存储器根据距离延长的描述实现信用管理单元。基 本的存储器的准确的性质可以取决于实施例变化。图2描述了在用于本发明的远程的结构的优选实施例内的数据 流程。本发明的这个实施例包括印刷电路板(PCB)组件,其包含在现 场可编程门阵列(FPGA)内实现的芯片上的系统,CX4铜 4xInfmiBand连接器,SONET/以太网成帧器/映射器,注册的双数据 速率2(DDR2)同步的动态随机存取存储器(SDRAM)的2个时隙,网 络搜索引擎,管理处理器支持元件和可换的WAN光学组件,其遵 循MSA-300规范。该FPGA提供用于该装置的唯一的功能,同时该部件的剩余部 分是工业标准部分。该FPGA实现用于主数据路径的四个电气接 口, 2.5Gbit 4xInfmiBand—连接至U CX4连接器,266MHz DDR2 SDRAM-用于FIFO, SPI-4.2-连接到成帧器/映射器和LA-1-连接到 网络搜索引擎。该FIFO缓存器是使用标准DDR2 SDRAM实现的。通过时分多 路复用访问该存储器用于提供一个具有10Gbit/秒以上的最大入口带 宽的有效的双口 RAM,而同时地保持一个10Gbit/秒以上的出口带 宽。这允许廉价的商品存储器用于该FIFO缓存器。在FPGA内的 控制逻辑将SDRAM分割为多个VL,并且操作SDRAM存储器总线 去提供FIFO功能。使用遵循由光网际互连论坛(OIF)定义的规范的部件提供对 WAN访问。特别地,SFI-4.1接口用于经由MSA-300规范定义的连 接器连接到一个光学组件。前述的接口还可以即时地转换为IEEE 802.3ae XSBI接口,供10G以太网LAN PHY使用。取决于用户需 求和安装的光学组件,该可换的模块允许该装置在具有不同的发射 功率和接收机灵敏度的几个种类的光纤上支持OC-192 SONET、 10G 以太网LANPHY禾B 10G以太网LANPHY。该装置可以直接在光WAN上,或者间接地经由额外的标准联 网设备通信,诸如,SONET/SDH多路复用器、光再生器、分组路 由器和单元开关。该SFI-4.1/XSBI接口连接到成帧器/映射器,其内部地操纵许多 方面,低电平通信协议(在以太网用语中的MAC/PCS/PMA功能)。 该FPGA经SPI-4.2接口与成帧器/映射器交换整个数据分组(或者在 ATM情形下的单元),该成帧器/映射器然后转变成期望的WAN信 令协议。这个变换由国际电信联盟(ITU)、 Internet工程任务组 (IETF)、 ATM论坛、电子和电气工程师协会(IEEE)和光网际互连论 坛(OIF)出版的标准管理。最后的部件是LA-1连接的网络搜索引擎(NSE)。 NSE用作 InfiniBand路由选择特点的一部分,以将进来的IPv6寻址变换为本 地InfiniBand路径描述。该FPGA将从WAN得到的数据分组中提 取IPv6数据分组,并且将其传送给NSE,然后其将迅速地搜索内部 表以找到一个匹配,并且然后将相关数据(匹配的IB路径)返回给 FPGA。根据需要,当其变为可利用时,在FPGA内的管理处理器将 以新的数据更新NSE表。本发明的第二个实施例在图3中示出。这个实施例是在图2中 示出的其原型的装置的成本降低版本。这个实施例的主要目的是使 用仅仅如由InfiniBand结构定义的四倍的数据速率(QDR) lxlnfm氾and允许距离延长直至10km。这个实施由FPGA、 CX4连接器、单个QDR SRAM芯片和XFP 光学组件构成。该FPGA直接与10Gbit 4x Infin旧and(本地)和10Gbit lx InfiniBand(WAN)两者连接。象在远程的实施例中一样, 一个可换的模块提供光WAN接 口。但是,代替MSA-300接口,这个模块遵循XFP规范(如由XFP MSA组定义的),并且经10Gbit XFI总线直接与FPGA交换。这允 许用户去选择一个较好地适合其局部环境的XFP模块。该FIFO缓存器是使用QDR(或者QDR2)SRAM实现的,其是最 佳地设计用于小的双端口存储器的存储器的形式。在FPGA中的控 制器将存储器分割为多个VL,并且管理FIFO的操作。
权利要求
1、一种在长距离连接上传输InfiniBand数据分组的方法,所述方法包括在另一个协议内封装InfiniBand数据分组;在长距离连接WAN上传送封装的数据分组;通过除去封装和恢复InfiniBand数据分组对InfiniBand数据分组去封装;在WAN上保持InfiniBand物理链路状态机;和在WAN上保持InfiniBand型流量控制。
2、 根据权利要求1所述的方法,其中,协议是OSI 7层参考模 型,并且选自由层l、层2、层3和层4组成的组。
3、 根据权利要求1或2所述的方法,其中,传送封装的 InfiniBand还包括将在WAN上的InfiniBand链路距离延长到大于大 约100km的距离。
4、 根据权利要求3所述的方法,其中,提高链路距离还包括将 在链路上广告的InfiniBand信用提高超过每个VL大约12KiB。
5、 根据权利要求4所述的方法,其中,提高可利用的信用包括 提高每个广告信用模块字节的数目。
6、 根据权利要求4所述的方法,其中,提高可利用的信用包括提高每个广告信用模块的数目。
7、 根据权利要求4所述的方法,其中,提高可利用的信用包括提高信用模块的数目和在每个广告中每个模块字节的数目。
8、 根据权利要求1 7任何一个所述的方法,其中,保持流量控 制语义包括发送单元在用于去封装的InfiniBand数据分组的接收单 元上选择出口 VL。
9、 根据权利要求1~8任何一个所述的方法,其中,保持 InfiniBand物理链路状态机还包括在WAN上交换非InfiniBand数据 分组,其中这样做建立一个存在于WAN中的端到端路径,数据分 组的交换选自由PPP LCP数据分组、以太网ARP交换、TCP对话 初始化和建立ATM SVC组成的组。
10、 根据权利要求1~9任何一个所述的方法,其中,保持 InfiniBand型流量控制还包括在大于128KiB的缓冲存储器中缓存在 WAN端口上接收的数据分组。
11、 一种由逻辑电路组成用于传输InfiniBand数据分组的装置, 包括一个InfiniBand接口,其耦合到InfiniBand路由和QOS部件, 其中-所述InfiniBand路由和QOS部件的InfiniBand到WAN路径被 耦合到封装/去封装部件(ENCAP);ENCAP部件的IB到WAN路径被耦合到WAN接口 ; WAN接口的WAN到IB路径被耦合到ENCAP部件; ENCAP部件的WAN到IB路径被耦合到大容量缓冲存储器; 大容量缓冲存储器被耦合到InfiniBand接口的WAN到IB路径;信用管理单元产生用于WAN的信用,并且产生施加到 InfiniBand接口上的背压;ENCAP部件被耦合到用于封装和去封装信用数据的信用管理单 元;禾口管理模块提供InfiniBand子网管理代理、WAN端到端协商和管 理业务。
12、 根据权利要求11所述的装置,其中,该装置能够在每个方 向同时地保持大约每秒十亿字节InfiniBand数据分组的传送速率。
13、 根据权利要求11或者12所述的装置,其中,InfiniBand接 口包含附加的流量控制缓冲器单元以便从WAN时钟域转换为 InfiniBand时钟域。
14、 根据权利要求11、 12或者13所述的装置,其中,ENCAP 部件能够支持多个网络,该网络包括IPv6、 IPv6的UDP、 IPv6的 DCCP、 ATM AAL5或者GFP的任何一个。
15、 根据权利要求11 14任何一个所述的装置,其中,该WAN 接口进一步包括能够支持多个网络格式的成帧器单元,包括SONET/SDH、 IOGBASE-R、 InfiniBand和IOGBASE画W的任何一个;禾口能够支持SONET/SDH、 10GBASE-R或者InfiniBand的任何一个的光学子系统。
16、 根据权利要求15所述的装置,其中,光学子系统还能够到 达大于由IBTA InfiniBand结构版本1.2单独指定的距离,或者届时 与其它诸如SONET/SDH多路复用器、光再生器、数据分组路由 器、单元开关或者其它设备耦合。
17、 根据权利要求11~16任何一个所述的装置,其中,大容量缓冲存储器能够以所接收的数据分组的不同次序的顺序采用在多个 FIFO结构以外的数据分组。
18、 根据权利要求11~17任何一个所述的装置,其中,通过提 高信用模块大小和/或提高每个广告模块的数目,信用管理单元广告 比由InfiniBand规范定义的更多的信用。
19、 根据权利要求11~18任何一个所述的装置,其中,权利要 求10的管理模块还包括通用目的处理器;和在WAN和IB接口两者上发送和接收数据分组的机构。
20、 根据权利要求11 19任何一个所述的装置,其中,大容量 缓冲存储器还包括多个DDR2存储器模块(DIMMS);其中控制逻辑在DDR2存储器内保持多个FIFO结构;禾口 其中每个FIFO结构用于缓存WAN到InfiniBand VL;和 其中在存储器以外的数据分组流被调节以确保数据分组由于在 InfiniBand接口上的拥塞而不被丢弃。
21、 根据权利要求11所述的装置,用于在每个方向同时地保持 每秒十亿字节InfiniBand数据分组的最大传送率,还包括附加的流量控制缓冲器单元,以便从WAN时钟域转换为IB时 钟域;其中ENCAP部件能够支持多个网络,该网络包括IPv6、 IPv6 的UDP、 IPv6的DCCP、 ATM AAL5或者GFP的任何一个;能够支持多个网络格式的成帧器单元,包括SONET/SDH、 IOGBASE-R、 InfiniBand和10GBASE-W的任何一个;耦合的能够支持SONET/SDH、 10GBASE-R或者InfiniBand的 任何一个的光学子系统,其中光学子系统还能够到达大于由IBTA InfiniBand结构版本 1.2单独指定的距离,或者届时与其它诸如SONET/SDH多路复用 器、光再生器、数据分组路由器、单元开关或者其它的设备耦合;其中大容量缓冲存储器能够以所接收的数据分组的不同次序的 顺序采用在多个FIFO结构以外的数据分组,并且其中大容量缓冲存 储器还包括多个DDR2存储器模件(DIMMS);其中控制逻辑在DDR2存储器内保持多个FIFO结构;禾口 其中每个FIFO结构用于缓存WAN到InfiniBand VL;和其中在存储器以外的数据分组流被调节以确保数据分组由于在 InfiniBand接口上的拥塞不被丢弃,其中通过提高信用模块大小和/或提高每个广告模块的数目,信 用管理单元广告比由Infm旧and规范定义的更多的信用。其中管理模块进一步包括 通用目的处理器;禾口在WAN和IB接口两者上发送和接收数据分组的机构。
22、 根据权利要求11~21任何一个所述的装置,其中,ENCAP 部件执行空封装,并且发出不变的InfiniBand数据分组。
23、 根据权利要求11 22任何一个所述的装置,其中大容量缓 冲存储器还包括多个SRAM存储器芯片;其中控制逻辑在QDR存储器内保持多个FIFO结构;和 其中每个FIFO结构用于缓存WAN到InfiniBand VL;和 其中在存储器以外的分组流被调节以确保数据分组由于在 InfiniBand接口上的拥塞不被丢弃。
24、 根据权利要求23所述的装置,其中,SRAM存储器芯片是 QDR2 SRAM。
25、 根据权利要求21所述的装置, 其中大容量缓冲存储器包括多个SRAM存储器芯片;和 其中控制逻辑在QDR存储器内保持多个FIFO结构;和 其中每个FIFO结构用于缓存WAN到InfiniBand VL;禾口 其中在存储器以外的分组流被调节以确保数据分组由于在InfiniBand接口上的拥塞不被丢弃。
26、 根据权利要求11 25任何一个所述的装置,其中, InfiniBand数据分组被设置在IPv6数据分组的有效载荷结构内。
27、 根据权利要求11 26任何一个所述的装置,其中,信用数 据被以延长头部的方式在IPv6头部内编码。
28、 根据权利要求27所述的装置,其中,信用数据被以延长头 部的方式在IPv6头部内编码。
29、 根据权利要求11 28任何一个所述的装置其中ENCAP部件以除与由IEEE 802.3ae条款49定义的66/64b 编码方案兼容之外的方式成帧InfiniBand数据分组;和其中ENCAP部件可以除去条款49兼容的成帧,并且恢复原始 InfiniBand数据分组。
30、 根据权利要求29所述的装置,其中,信用数据被以在 66/64b代码中设置的顺序编码。
31、 根据权利要求11 30任何一个所述的装置,其中, InfiniBand数据分组被设置在IPv6或者IPv4数据分组内传输的UDP 或者DCCP数据包的有效载荷结构内。
32、 根据权利要求11~30任何一个所述的装置,其中, InfiniBand数据分组按照ATM适配层5(AAL5)被分段为ATM单 元。
33、 根据权利要求11~30任何一个所述的装置,其中, InfiniBand数据分组被设置在通用成帧协议数据分组的有效载荷结构 内,和设置在SONET/SDH帧内。
34、 根据权利要求11~33任何一个所述的装置,其中,信用数 据被已封装的有效载荷结构编码。
35、 一种系统,包括 耦合到第一设备的第一 InfiniBand结构; 耦合到第二设备的第一设备; 耦合到第二 InfiniBand结构的第二设备; 其中,第一和第二设备还包括封装和去封装InfiniBand数据分组到另一个网络协议的逻辑电 路;和缓存InfiniBand数据分组的逻辑电路;禾口 携带封装的InfiniBand数据分组的网络接口 。
36、 根据权利要求35所述的系统,其中,第一设备和第二设备 还间接地耦合在延长的WAN网络上,延长的WAN网络包括 SONET/SDH多路复用器、光再生器、数据分组路由器和单元开关 的一个或多个。
37、 根据权利要求35或36所述的系统,其中,基于在网络或 者管理结构内速率小于或等于可允许的最大速率的条件,数据分组 进入ENCAP部件的流动速率可以受到设备限制。
38、 根据权利要求35、 36或37所述的系统,其中,该系统还 包括数据分组或者单元切换的或者路由的网络在二个设备之间退出;其中二个以上的设备能够连接到这个网络;和 其中每个终端设备能够封装和将数据分组寻址到一个以上的目的地设备。
39、 根据权利要求35~38任何一个所述的系统,还包括权利要 求21的装置。
40、 根据权利要求35~38任何一个所述的系统,还包括权利要 求25的装置。
41、 根据权利要求35 38任何一个所述的系统,还包括 具有分离的LID地址空间和不同的子网前缀的二个Infin旧and结构;集成进设备的分组路由部件,其中逻辑电路通过在GRH中检查目的地GID来确定给定的 InfiniBand数据分组的LID地址;和其中逻辑电路图能够使用来自GRH的信息代替LID、 SL、 VL 或者InfiniBand数据分组的其它的成分。9
全文摘要
本发明涉及一种用于延长InfiniBand网络的实时到达的装置的系统。方法和装置可以将InfiniBand网络连接到长距离连接(例如,WAN),同时保持完整的10Gbit InfiniBand速度,并且保留由InfiniBand结构(IBTA)指定的语义。该系统包括InfiniBand接口、管理模块、分组路由、封装/去封装、大容量缓冲存储器和WAN接口、逻辑和电路。本发明适用于有效地使用单个传输流在很大的距离上移动大量数据。
文档编号H04L29/04GK101258719SQ200680026207
公开日2008年9月3日 申请日期2006年7月17日 优先权日2005年7月17日
发明者克里斯多佛·耶斯克, 大卫·托马斯·索斯韦尔, 詹森·加里·贡特普 申请人:黑曜石研究有限公司