一种多处理器节点互联系统和服务器的制作方法

文档序号:31778015发布日期:2022-10-12 09:01阅读:43来源:国知局
一种多处理器节点互联系统和服务器的制作方法

1.本技术涉及服务器领域,特别是涉及一种多处理器节点互联系统和服务器。


背景技术:

2.目前多路服务器的各计算节点能够支持的处理器数量一般不超过四个,但多路服务器常常需要支持8处理器、16处理器、32处理器等配置,所以处理器需要分布在多个计算节点上,各计算节点之间通过高速印制电路板(printed circuit board,pcb)背板进行信号连接。在数据传输过程中,不同节点数据需要依次经过第一个计算节点的pcb板、再经过pcb背板或高速线缆、再经过第二个计算节点pcb板。
3.由于pcb板对高频信号的损耗相对较大,当数据在pcb板上的传输距离较长时,常常由于信号损耗过大,导致系统出现无法满足总线规范、总线初始化失败、信号传输出错等问题。
4.由此可见,如何提供一种损耗更小的多处理器节点的连接方式,从而提高服务器数据传输效率和稳定性,是本领域技术人员亟需解决的问题。


技术实现要素:

5.本技术的目的是提供一种多处理器节点互联系统和服务器,以减少数据传输过程中的损耗,从而提高服务器数据传输效率和稳定性。
6.为解决上述技术问题,本技术提供一种多处理器节点互联系统,包括:至少两个计算节点,各所述计算节点均包含多个处理器;
7.各所述处理器间通过线缆连接,且通过cache一致性opencapi总线通信。
8.优选的,还包括多个opencapi设备;
9.各所述opencapi设备分别与各所述计算节点连接。
10.优选的,各所述计算节点内,各所述处理器通过pcb电路板连接。
11.优选的,所述各所述处理器间通过线缆连接具体为:
12.将各所述处理器的各端口映射至所述计算节点的机箱上,以生成op-bus端口;
13.利用线缆连接各所述机箱上的op-bus接口。
14.优选的,所述将各所述处理器的各端口映射至所述计算节点的机箱上包括:
15.各op-bus总线的第一端与各所述处理器的op-bus端口连接,所述op-bus总线的第二端固定于所述机箱后置窗口的位置。
16.优选的,还包括:
17.将所述线缆设置于各所述计算节点的散热器与机箱间,以防止所述线缆脱落。
18.优选的,所述opencapi总线设置有至少一个备用通道。
19.优选的,还包括备用通道冗余度检测单元;
20.所述通道冗余度检测单元与所述opencapi总线连接,以获取未使用的所述备用通道的数量;
21.当检测到未使用的所述备用通道的数量低于通道阈值时,向管理人员发送预警信息,并控制报警装置工作。
22.优选的,所述报警装置包括蜂鸣器和指示灯。
23.为了解决上述技术问题,本技术还提供了一种服务器,包括所述的多处理器节点互联系统。
24.本技术提供了一种多处理器节点互联系统,该系统包括:至少两个计算节点,各计算节点均包含多个处理器;各计算节点间通过线缆连接,且通过opencapi总线通信。由此可见,本技术所提供的技术方案中,通过将不同节点之间处理器的互联总线全路径由高速线缆实现,不需要在计算板pcb上进行走线,减少了数据传输过程中的损耗,从而延长了节点之间的传输距离。并利用opencapi总线实现不同计算节点间的通信,提高了多处理器的信号传输速度和多处理器互联系统的运算能力。
25.此外,本技术还提供了一种服务器,包括上述多处理器节点互联系统,效果同上。
附图说明
26.为了更清楚地说明本技术实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
27.图1为本技术实施例所提供的一种多处理器节点互联系统的示意图;
28.图2为本技术实施例所提供的一种opencapi总线的连接结构;
29.图3为本技术实施例所提供的一种16路服务器互联拓扑的结构图。
具体实施方式
30.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本技术保护范围。
31.本技术的核心是提供一种多处理器节点互联系统和服务器,以减少数据传输过程中的损耗,从而提高服务器数据传输效率和稳定性。
32.为了使本技术领域的人员更好地理解本技术方案,下面结合附图和具体实施方式对本技术作进一步的详细说明。
33.图1为本技术实施例所提供的一种多处理器节点互联系统的示意图,如图1所示,该系统包括:至少两个计算节点,各计算节点均包含多个处理器;各处理器间通过线缆连接,且通过cache一致性opencapi总线通信。
34.如图1所示,在两个多处理器节点之间的互联拓扑应用场景中,每个节点上有4个处理器,两个节点内处理器通过一种开放的cache一致性op-bus总线互联实现了8个处理器的cache一致性互联,即为8路服务器。同节点内4颗处理器由于相对位置固定且距离较近,处理器互联总线x-bus仍在计算板pcb上走线,此处不做限定。
35.在具体实施中,由于opencapi是一种开放的协议标准,任何厂商都可以开发支持opencapi总线标准的设备,且由于它是一种cache一致性总线标准,和其他总线(例如pcie
总线)相比可以实现更高的数据传输效率。
36.图2为本技术实施例所提供的一种opencapi总线的连接结构示意图,如图2所示,本发明中的节点间处理器互联总线op-bus端口连接器安装在处理器基板上,即处理器上op-bus接口不是以底部pin脚形态,而是以一个端口对应一个或几个独立连接器安装在处理器上方(附图1中以1个op-bus端口对应1个op-bus连接器为例),供匹配的op-bus线缆端子进行安装。处理器上op-bus以外的其他信号仍以底部pin脚形态安装到处理器插座上,与计算板进行连接,例如节点内处理器间的x-bus互联总线。op-bus线缆的端子插入到处理器op-bus连接器后,处理器安装散热器,利用散热器的挤压力固定线缆和连接器的可靠连接,即使服务器进行远途运输也能保证线缆不发生松动。
37.进一步的,计算节点中的各处理器还可以与opencapi设备连接,以提高计算节点的存储空间和网络扩展能力,其中,opencapi设备可以是存储设备,也可以为网络设备,此处不做限定。
38.本实施例提供了一种多处理器节点互联系统,该系统包括:至少两个计算节点,各计算节点均包含多个处理器;各计算节点间通过线缆连接,且通过opencapi总线通信。由此可见,本技术所提供的技术方案中,通过将不同节点之间处理器的互联总线全路径由高速线缆实现,不需要在计算板pcb上进行走线,减少了数据传输过程中的损耗,从而延长了节点之间的传输距离。并利用opencapi总线实现不同计算节点间的通信,提高了多处理器的信号传输速度和多处理器互联系统的运算能力。
39.作为优选的实施例,各计算节点内,各处理器通过pcb电路板连接,各处理器间通过线缆连接具体为:
40.将各处理器的各端口映射至计算节点的机箱上,以生成op-bus端口;
41.利用线缆连接各机箱上的op-bus接口。
42.如图2所示,本发明中的节点间处理器互联总线op-bus端口连接器安装在处理器基板上,即处理器上op-bus接口不是以底部pin脚形态,而是以一个端口对应一个或几个独立连接器安装在处理器上方(附图1中以1个op-bus端口对应1个op-bus连接器为例),供匹配的op-bus线缆端子进行安装。处理器上op-bus以外的其他信号仍以底部pin脚形态安装到处理器插座上,与计算板进行连接,比如节点内处理器间的互联总线x-bus。
43.作为优选的实施例,将各处理器的各端口映射至计算节点的机箱上包括:各op-bus总线的第一端与各处理器的op-bus端口连接,op-bus总线的第二端固定于机箱后置窗口的位置。多处理器节点互联系统还包括多个opencapi设备;各opencapi设备分别与各计算节点连接。
44.计算节点内部op-bus线缆一端安装到处理器op-bus连接器上,另一端在结构上固定到机箱后置窗口的位置,以保证后续拆装opencapi线缆时,无需频繁打开计算节点的机箱。每个处理器可提供4个op-bus端口,当两个节点smp互联(配置为8路服务器)时,每个节点内每个处理器后窗op-bus连接器只需连接一个节点间互联op-bus线缆,其余3个op-bus连接器可以供i/o扩展op-bus线缆连接到i/o扩展板上的opencapi设备,opencapi设备可以是存储设备,也可以为网络设备,可提高计算节点的存储空间和网络扩展能力。由于opencapi是一种开放的协议标准,任何厂商都可以开发支持opencapi总线标准的设备,且由于它是一种cache一致性总线标准,和pcie总线相比可以实现更高的与处理器/内存的传
输效率。
45.如果三个节点smp互联(配置为12路服务器)时,每个处理器后窗op-bus连接器需要连接两个节点之间互联op-bus线缆(分别连接到两个节点内两个处理器),其余两个op-bus连接器可供i/o扩展op-bus线缆去扩展opencapi设备。同理,如果四个节点smp互联(配置为16路服务器)时,每个节点内每个处理器后窗op-bus连接器需要连接三个节点之间互联op-bus线缆(分别连接到三个节点内三个处理器),其余一个op-bus连接器可供i/o扩展opencapi线缆去扩展opencapi设备。原则上,一个节点内一颗处理器可提供四个op-bus端口,即可以供四根节点间互联op-bus线缆去连接四个其他节点内四颗处理器,即可以配置为5个节点smp互联架构(20路服务器)。但考虑多路服务器处理器架构的对称性,结合负载的性能优化等特性,传统上一般设计为16路服务器,其余的op-bus端口连接到opencapi设备,以提高服务器的计算性能、存储能力和网络传输能力。
46.op-bus线缆的端子a插入到处理器op-bus连接器后,处理器安装散热器,利用散热器的挤压力固定线缆和连接器的可靠连接,即使服务器进行远途运输也能保证线缆不发生松动。
47.可以理解的是,opencapi总线通常需要8个高速通道,当某个高速通道信号质量差或通道发生故障时,需要减少opencapi总线使用的通道数量,导致数据传输速度降低。
48.为了解决这一问题,可以为opencapi总线设置备用通道。作为优选的实施,opencapi总线设置有至少一个备用通道。进一步的,为了保证opencapi总线的通道冗余度,还需要在多处理器节点互联系统中设置备用通道冗余度检测单元;通道冗余度检测单元与opencapi总线连接,以获取未使用的备用通道的数量;当检测到未使用的备用通道的数量低于通道阈值时,向管理人员发送预警信息,并控制报警装置工作。报警装置包括蜂鸣器和指示灯,当检测到未使用的备用通道的数量低于通道阈值,控制蜂鸣器发声和指示灯闪烁,以提醒管理人员及时进行维护。
49.图3为本技术实施例所提供的一种16路服务器互联拓扑的结构图,如图3所示,本发明中op-bus总线将完全由线缆实现32gt/s高速信号的传输,首先经过节点1内op-bus线缆,再经过节点间op-bus线缆,再经过节点2内op-bus线缆,完成两个不同节点间处理器的高速通信。
50.此外,本发明中的互联架构继续保持了不同节点间处理器通信的2-跳架构,全线缆设计没有额外增加处理器跳转动作。同时,全高速线缆设计信号损耗小、延迟低,提高了处理器通信效率和稳定性,传输32gt/s高速信号时并不需要额外增加中继器等芯片提高信号传输质量。
51.附图1的端口1通过节点间op-bus线缆实现不同节点之间处理器的互联,端口2通过i/o扩展opencapi线缆实现处理器与opencapi设备的连接。通常来说,opencapi总线需要8个高速信号通道,接收和发送信号通道是独立的,所以总共需要16对插分信号通道。当信号质量不好或者某个通道故障时,可进行降通道,如8通道降为4通道、4通道降为2通道等。由于opencapi总线连接的是i/o设备,降通道只影响一个i/o设备自身的性能,不会对其他i/o性能产生影响。op-bus总线物理上互联的是两个处理器之间的opencapi总线端口,但组成的是多处理器的互联网络,其架构是对称的、负载是均衡的,多路服务器的任意两个处理器之间的通信都有可能会用到任意一个op-bus通路。因此op-bus总线需要有更高的冗余
度,保证某个通道信号故障时总线仍能够满带宽工作。所以本发明中op-bus总线需要9个高速信号通道,其中一个通道作为备用通道,当某一个信号通道发生故障时其余8个仍能够正常工作,不需要将通道数量降为4通道,从而保证了多路服务器的可用性。
52.处理器提供支持9个信号通道的op-bus端口,节点内互联op-bus线缆和节点间互联op-bus线缆与opencapi线缆在结构上兼容,本发明在opencapi线缆基础上对其4根低速边带信号重新定义为2对高速插分信号(标准slimsas x8线缆为例,默认提供16对高速插分信号,同时提供16个低速边带信号,opencapi总线对这些边带信号默认没有定义),用于备用通道收、发信号的传输。处理器op-bus端口定义了1个边带信号用于侦测该op-bus端口的模式(op-bus或opencapi),该信号在处理器基板上进行了上拉处理(10k电阻上拉到3.3v_standby),节点间op-bus线缆对该模式侦测信号进行了接地处理,opencapi线缆上不做特殊处理,节点内op-bus线缆上也不做特殊处理,即实现了用作op-bus时该信号为低,用作opencapi时该信号为高,处理器即可通过该信号电平判断op-bus端口的配置模式。
53.处理器op-bus端口可提供了一个边带信号用于指示op-bus总线当前的冗余度,当9个通道都可以正常工作时该信号无效,表示总线冗余度充足,当其中一个通道故障而没有备用通道时该信号有效,表示总线冗余度不足。节点内op-bus线缆分出一条分支线缆,将该信号连接到计算板,发送到服务器健康管理控制器,同时经过硬盘灯控制电路连接到后窗led指示灯。用户可通过web管理界面知道op-bus总线的冗余度情况,也可通过后窗led等直观观察到op-bus总线冗余度情况。用户获知提示后将检查信号传输路径上的器件,包括处理器、线缆等是否功能正常,并对异常部件进行有计划的更换维修。
54.此外,本技术还提供了一种服务器,包括上述多处理器节点互联系统外。
55.本实施例提供了一种服务器,包括上述多处理器节点互联系统,该系统包括:至少两个计算节点,各计算节点均包含多个处理器;各计算节点间通过线缆连接,且通过opencapi总线通信。由此可见,本技术所提供的技术方案中,通过将不同节点之间处理器的互联总线全路径由高速线缆实现,不需要在计算板pcb上进行走线,减少了数据传输过程中的损耗,从而延长了节点之间的传输距离。并利用opencapi总线实现不同计算节点间的通信,提高了多处理器的信号传输速度和多处理器互联系统的运算能力。
56.以上对本技术所提供的多处理器节点互联系统及服务器进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以对本技术进行若干改进和修饰,这些改进和修饰也落入本技术权利要求的保护范围内。
57.还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1