解耦式的异构系统的制作方法

文档序号:37716627发布日期:2024-04-23 11:47阅读:19来源:国知局
解耦式的异构系统的制作方法

本发明涉及服务器,具体涉及解耦式的异构系统。


背景技术:

1、不同于传统的单一cpu(中央处理器)架构,异构架构下可以将任务进行合理的分配,逻辑性较强的任务可以交由cpu进行串行处理,而需要大批量浮点运算的任务可以交由gpu(图形处理单元)等进行处理,从而实现整机算力的合理化利用和开发。

2、但在高功率工作的情况下,异构架构整机功耗更高,需要更高的散热需求。传统的风冷或水冷难以满足异构架构的散热需求,一般采用浸没式液冷的冷却方式。

3、目前,服务器所有的设备都在同一个tank(箱)中进行浸没式液冷,且为了保证散热的可靠性,一般选取散热风险最大的地方作为调控点。但服务器中不同器件的散热需求一般是不同的,这就导致增加了不必要的散热工作,增加了散热所需的功耗。


技术实现思路

1、有鉴于此,本发明提供了一种解耦式的异构系统,以解决现有服务器散热功耗偏大的问题。

2、第一方面,本发明提供了一种解耦式的异构系统,所述异构系统包括:管理模组和至少一个逻辑集成模组;所述逻辑集成模组包括:支持cxl协议的主服务器模组、内存box模组和gpu box模组;所述主服务器模组包括至少一个处理器;

3、所述主服务器模组与所述内存box模组、所述gpu box模组之间均通过外置线缆相连;所述内存box模组与所述gpu box模组之间通过外置线缆相连;

4、所述主服务器模组、所述内存box模组、所述gpu box模组分别被配置为独立设置在相应的浸没液冷箱中;

5、所述管理模组用于获取所述主服务器模组收集到的状态信息,对所述逻辑集成模组的主服务器模组进行集中监控。

6、在一些可选的实施方式中,所述内存box模组包括:cxl交换模组和多个内存单元;

7、多个所述内存单元分别与所述cxl交换模组相连,形成内存池;

8、所述cxl交换模组与所述主服务器模组和/或所述gpu box模组相连,以使所述主服务器模组和/或所述gpu box模组读写所述内存单元。

9、在一些可选的实施方式中,所述gpu box模组默认工作于设备偏置模式;

10、在所述设备偏置模式下,所述gpu box模组直接访问所述内存box模组的内存单元;所述主服务器模组在所述gpu box模组允许的情况下,访问所述内存box模组的内存单元。

11、在一些可选的实施方式中,所述gpu box模组还可以工作于主机偏置模式;

12、在需要切换至主机偏置模式的情况下,所述gpu box模组从所述设备偏置模式切换至所述主机偏置模式;

13、在所述主机偏置模式下,主服务器模组直接访问所述内存box模组的内存单元;所述gpu box模组在所述主服务器模组允许的情况下,访问所述内存box模组的内存单元。

14、在一些可选的实施方式中,所述主服务器模组还用于向所述gpu box模组发送目标页面数量np;

15、所述gpu box模组维护第一翻转位和第二翻转位,所述第一翻转位在页面列表奇数次翻转时取反,所述第二翻转位在页面列表偶数次翻转时取反;

16、所述gpu box模组用于根据所述目标页面数量np确定目标翻转次数n和目标页面索引index;所述目标翻转次数n和所述目标页面索引index分别满足:n=int(np,ntotal),index=mod(np,ntotal);其中,ntotal表示所述页面列表中的页面数量,int()为向下取整函数,mod()为取余函数;

17、所述gpu box模组包括切换控制电路;所述切换控制电路设有四个输入端和两个输出端,且所述切换控制电路包括:第一异或门、第二异或门、第一非门、第二非门、第一与门、第二与门、第三与门、第四与门、第一或门和第二或门;

18、所述第一异或门的第一输入端、第二输入端分别与所述切换控制电路的第一输入端、第三输入端相连;

19、所述第二异或门的第一输入端、第二输入端分别与所述切换控制电路的第二输入端、第三输入端相连;

20、所述第一非门的输入端与所述切换控制电路的第四输入端相连;

21、所述第二非门的输入端与所述第二异或门的输出端相连;

22、所述第一与门的第一输入端、第二输入端分别与所述第一异或门的输出端、所述第一非门的输出端相连;

23、所述第二与门的第一输入端、第二输入端分别与所述第一异或门的输出端、所述切换控制电路的第四输入端相连;

24、所述第三与门的第一输入端、第二输入端分别与所述切换控制电路的第四输入端、所述第二非门的输出端相连;

25、所述第四与门的第一输入端、第二输入端分别与所述第一非门的输出端、所述第二异或门的输出端相连;

26、所述第一或门的第一输入端、第二输入端分别与所述第一与门的输出端、所述第三与门的输出端相连;

27、所述第二或门的第一输入端、第二输入端分别与所述第二与门的输出端、所述第四与门的输出端相连;

28、所述第一或门的输出端作为所述切换控制电路的第一输出端,所述第二或门的输出端作为所述切换控制电路的第二输出端;

29、所述切换控制电路的四个输入端分别用于输入所述第一翻转位、所述第二翻转位、所述目标翻转次数n的高位、所述目标翻转次数n的低位,所述切换控制电路的两个输出端分别用于输出新第一翻转位和新第二翻转位;

30、在所述gpu box模组当前的第一翻转位、第二翻转位,与所述切换控制电路所输出的新第一翻转位和新第二翻转位均相同,且当前所处理页面的页面索引与所述目标页面索引index相同,所述gpu box模组确定需要切换至主机偏置模式。

31、在一些可选的实施方式中,所述内存box模组还包括:第一bmc;

32、所述第一bmc用于对多个所述内存单元进行监控,形成内存单元状态信息,并将所述内存单元状态监控信息上报至所述主服务器模组。

33、在一些可选的实施方式中,所述异构系统还包括:网络交换机;所述逻辑集成模组还包括:dpu单元;

34、所述dpu单元与所述主服务器模组和所述网络交换机相连,用于获取所述主服务器模组收集到的状态信息,并将所述状态信息发送至所述网络交换机;

35、所述网络交换机还与所述管理模组相连,用于将所述状态信息转发至所述管理模组;

36、包括多个所述dpu单元的dpu模组,被配置为设置在相应的浸没液冷箱中。

37、在一些可选的实施方式中,所述管理模组包括:控制器和fpga;所述控制器与所述fpga通信连接;

38、所述控制器用于获取所述主服务器模组收集到的监控信息,并将所述监控信息发送至所述fpga;

39、所述fpga对所述监控信息进行集中统计处理。

40、在一些可选的实施方式中,异构系统还包括:电源模组;所述电源模组包括多个电源单元;

41、多个所述电源单元通过供电线缆分别与所述管理模组、所述主服务器模组、所述内存box模组、所述gpu box模组相连。

42、在一些可选的实施方式中,所述电源模组还包括:第二bmc;

43、所述第二bmc用于获取多个所述电源单元供电信息,并将所述供电信息发送至所述管理模组;

44、所述管理模组还用于获取所述电源模组中各个电源单元的所述供电信息,根据所述供电信息对所述电源单元进行监控。

45、在一些可选的实施方式中,所述gpu box模组包括:pcie交换机和多个gpu单元;

46、多个所述gpu单元分别与所述pcie交换机相连;

47、所述pcie交换机用于与所述主服务器模组和/或所述内存box模组相连,以上行输入来自所述主服务器模组的pcie资源,和/或对所述内存box模组执行读写操作。

48、本发明基于cxl协议可以实现对处理器、内存和gpu的解耦,将异构系统调整为全解耦的架构,从而可以将处理器、内存、gpu等不同部件独立设置在相应的浸没液冷箱中,从而可以针对不同的部件使用不同的冷却液,且基于部件本身的散热需求设置不同的散热指标,可以降低整机系统的散热成本,提高散热效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1