具有双冷凝器单元的两相浸没冷却系统的制作方法

文档序号:32696561发布日期:2022-12-27 21:12阅读:33来源:国知局
具有双冷凝器单元的两相浸没冷却系统的制作方法

1.本发明的实施方式通常涉及服务器和数据中心冷却。更具体地,本发明的实施方式涉及具有双冷凝器单元的两相浸没冷却系统。


背景技术:

2.用于包括若干活动电子机架的数据中心的热管理对于确保在机架中操作的服务器和/或其它信息技术(it)设备的适当性能(例如,执行it服务)是十分重要的。然而,在没有适当的热管理的情况下,机架内的热环境(例如,温度)可能超过热操作阈值,这可能导致不利的结果(例如,服务器故障等)。管理热环境的一种方法是使用冷却空气来冷却it设备。冷却空气通过冷却单元再循环。由it设备产生的热量被冷却空气捕获并且被冷却单元提取。
3.近来,数据中心已经部署了更高功率密度的电子机架,其中,更高密度的芯片被更紧密地封装在一起以提供更大的计算能力和低通信开销。通过维持适当的热环境来冷却这些高密度机架对于现有的冷却系统(例如基于空气冷却的任何系统)来说可能是问题。
4.另一方面,涉及将电子器件至少部分浸没在电介质溶液中的浸没冷却对于高密度电子器件来说是可行解决方案。然而,在现有的数据中心中实现浸没冷却具有挑战。用于浸没冷却的现有解决方案具有单个冷凝器单元。这种解决方案可能无法满足高功率密度计算系统的高可靠性和冗余要求。


技术实现要素:

5.本技术的一个方面提供了这样一种浸没冷却系统,包括:浸没罐,容纳至少部分浸没在浸没罐内的相变液体内的一个或多个信息技术设备,其中,信息技术设备配置为提供信息技术服务,其中,当信息技术设备操作时,信息技术设备产生被传递到相变液体的热量,从而使得相变液体中的至少一些转变成蒸汽相;初级冷凝器单元,位于浸没罐上方并且配置为接收来自外部冷却单元的冷却液体,以将蒸汽相的相变液体冷凝回液体相;以及次级冷凝器单元,经由蒸汽管线和液体管线联接到浸没罐,其中,次级冷凝器单元配置为接收来自外部冷却单元的冷却液体,以将蒸汽管线处的蒸汽冷凝为液体相的相变液体,其中,初级冷凝器单元和次级冷凝器单元配置为并行、串行或在单个冷凝器模式下操作。
6.本技术的另一个方面提供了这样一种方法,包括:接收来自具有初级冷凝器单元和次级冷凝器单元的冷却系统的功耗和温度信息;基于功耗和温度信息确定冷却系统的第一操作模式,其中,初级冷凝器单元和次级冷凝器单元的第一操作模式是并行、串行或单个冷凝器模式中的一种,其中,第一操作模式是使用冷却优化器来确定的;以及将冷却系统配置为以第一操作模式操作。
7.本技术的另一个方面提供了这样一种数据中心,包括:外部冷却单元;以及浸没冷却系统,联接到外部冷却单元,浸没冷却系统包括:浸没罐,容纳至少部分浸没在浸没罐内的相变液体内的一个或多个信息技术设备,其中,信息技术设备配置为提供信息技术服务,
其中,当信息技术设备操作时,信息技术设备产生被传递到相变液体的热量,从而使得相变液体中的至少一些转变成蒸汽相;初级冷凝器单元,位于浸没罐上方并且配置为接收来自外部冷却单元的冷却液体并且将蒸汽相的相变液体冷凝回液体相;以及次级冷凝器单元,经由蒸汽管线和液体管线联接到浸没罐,其中,次级冷凝器单元配置为接收来自外部冷却单元的冷却液体,其中,次级冷凝器单元将相变液体从蒸汽相相冷凝成液体相,其中,初级冷凝器单元和次级冷凝器单元配置为并行、串行或在单个冷凝器模式下操作。
附图说明
8.本发明的实施方式在附图中以示例的方式而非限制的方式示出,在附图中,相同的附图标记表示类似的元件。
9.图1是示出根据一个实施方式的浸没冷却系统的框图。
10.图2是示出根据一个实施方式的用于浸没冷却系统的控制系统的框图。
11.图3是示出根据一个实施方式的用于浸没冷却系统的双冷凝器单元的串行操作模式的框图。
12.图4是示出根据一个实施方式的用于浸没冷却系统的双冷凝器单元的并行操作模式的框图。
13.图5是示出根据一个实施方式的用于浸没冷却系统的双冷凝器单元的单个次级冷凝器操作模式的框图。
14.图6是示出根据一个实施方式的用于浸没冷却系统的双冷凝器单元的单个初级冷凝器操作模式的框图。
15.图7是示出根据一个实施方式的操作浸没冷却系统的方法的流程图。
具体实施方式
16.将参考下面讨论的细节描述本发明的各种实施方式和方面,并且附图将示出各种实施方式。下面的描述和附图是对本发明的说明,并不构成对本发明的限制。描述了许多具体细节以提供对本发明的各种实施方式的透彻理解。然而,在某些情况下,为了提供本发明的实施方式的简洁讨论,没有描述公知的或常规的细节。
17.在说明书中提及“一个实施方式”或“实施方式”意味着结合可包括在本发明的至少一个实施方式中的实施方式描述的特定特征、结构或特性。在说明书的各个地方出现的短语“在一个实施方式中”不一定都是指相同的实施方式。
18.本公开的方面涉及包括双冷凝器单元的浸没冷却解决方案,其中,初级冷凝器单元在浸没罐处实现,并且次级冷凝器单元可位于浸没罐附近或顶部上。浸没系统处的第一冷凝器的蒸汽回路和液体回路可连接到次级冷凝器单元的蒸汽管线和液体管线。蒸汽或者在浸没系统处冷凝,或者上升到次级冷凝器单元以在次级冷凝器单元处冷凝。外部冷却回路可直接连接到第一冷凝器和第二冷凝器,以供给来自外部冷却单元的冷却液体。可在外部回路处使用三个阀来设置双冷凝器单元,以针对不同的冷却能力以不同的操作模式操作,使得双冷凝器单元可提供设计上的冗余、高可靠性,并且可针对不同的冷却性能进行配置。
19.根据第一方面,浸没冷却系统包括浸没罐和位于浸没罐内的一个或多个信息技术
(it)设备。it设备配置为提供it服务并且至少部分地浸没在相变液体内,其中,当it设备提供it服务时,it设备产生被传递到相变液体的热量,从而使得相变液体中的至少一些转变成蒸汽相。该浸没冷却系统包括初级冷凝器单元,该初级冷凝器单元在浸没罐内位于浸没流体的顶部上,并且配置为接收来自外部冷却单元的冷却液体,以将蒸汽相的相变液体冷凝回液体相。浸没冷却系统包括经由蒸汽管线和液体管线联接到浸没罐的次级冷凝器单元,其中,次级冷凝器单元配置为从外部冷却单元接收冷却液体,以将蒸汽管线处的蒸汽冷凝成液体相的相变液体,其中,初级冷凝器单元和次级冷凝器单元配置为在并行、串行或单个冷凝器模式下操作,其中,初级冷凝器单元在浸没罐内。
20.在一个实施方式中,浸没冷却系统还包括在初级冷凝器单元与次级冷凝器单元之间的第一液体管线和第二液体管线,其中,第一液体管线和第二液体管线形成液体回路,以在初级冷凝器单元与次级冷凝器单元之间循环冷却液体。在一个实施方式中,浸没冷却系统还包括第一阀、第二阀、第三阀以及泵,其中,第一阀将外部冷却单元的供给管线联接到第一液体管线并将第一液体管线等分,其中,第一阀是三通阀;第二阀将次级冷凝器单元附近的等分的第一液体管线联接到外部冷却单元的释放管线;第三阀将第二液体管线联接到外部冷却单元的释放管线;以及泵位于外部冷却单元的释放管线处。
21.在一个实施方式中,第一阀设置为从外部冷却单元到初级冷凝器单元打开,并且设置为从外部冷却单元到次级冷凝器单元关闭,第二阀设置为打开,并且第三阀设置为关闭,以在串行模式下操作初级冷凝器单元和次级冷凝器单元。在一个实施方式中,第一阀设置为从外部冷却单元到初级冷凝器单元以及从外部冷却单元到次级冷凝器单元打开,第二阀设置为关闭,并且第三阀设置为打开,以在并行模式下操作初级冷凝器单元和次级冷凝器单元。
22.在一个实施方式中,第一阀设置为从外部冷却单元到初级冷凝器单元关闭,并且设置为从外部冷却单元到次级冷凝器单元打开,第二阀设置为关闭,并且第三阀设置为打开,以在单个冷凝器模式下操作次级冷凝器单元。在一个实施方式中,第一阀设置为从外部冷却单元到初级冷凝器单元打开,并且设置为从外部冷却单元到次级冷凝器单元关闭,第二阀设置为关闭,并且第三阀设置为打开,以在单个冷凝器模式下操作初级冷凝器单元。
23.在一个实施方式中,浸没冷却系统还包括温度传感器、功率传感器以及控制器,其中,温度传感器位于外部冷却单元的供给管线处并且配置为感测由外部冷却单元供给的液体的温度信息;功率传感器位于浸没罐处并且配置为感测一个或多个it设备的功耗信息;以及控制器电联接到温度传感器和功率传感器,该控制器包括冷却优化器,以基于温度和功耗信息来确定初级冷凝器单元和次级冷凝器单元的操作模式。
24.根据第二方面,系统从具有初级冷凝器单元和次级冷凝器单元的冷却系统接收热负载和温度信息。该系统基于功率消耗和温度信息确定冷却系统的第一操作模式,其中,初级冷凝器单元和次级冷凝器单元的第一操作模式是并行、串行或单个冷凝器模式中的一种,其中,第一操作模式使用冷却优化器来确定。该系统将冷却系统配置为以第一操作模式操作。
25.在一个实施方式中,系统设置多个阀的操作状态,其中,多个阀配置为在并行、串行或单个冷凝器模式中的一种模式下操作初级冷凝器单元和次级冷凝器单元。在一个实施方式中,温度和功率信息包括时间序列温度数据和/或时间序列功率数据。在一个实施方式
中,冷却优化器包括机器学习神经网络优化器。
26.在一个实施方式中,当多个阀在并行模式下操作时,系统设置多个阀的操作状态,其中,这些阀的操作状态管理分配到两个冷凝器的冷却流体。
27.在一个实施方式中,初级冷凝器单元和次级冷凝器单元为浸没冷却系统提供冷却。在一个实施方式中,响应于接收附加功耗信息,系统基于附加功耗信息确定冷却系统的第二操作模式,并且系统将冷却系统配置为从第一操作模式操作到第二操作模式。
28.根据第三方面,数据中心包括外部冷却单元和联接到外部冷却单元的浸没冷却系统。浸没冷却系统包括浸没罐和位于浸没罐内的一个或多个信息技术(it)设备。it设备配置为提供it服务并且至少部分地浸没在相变液体内,其中,当it设备提供it服务时,it设备产生被传递到相变液体的热量,从而使得相变液体中的至少一些转变成蒸汽相。浸没冷却系统包括位于浸没罐上方的初级冷凝器单元,并且配置为接收来自外部冷却单元的冷却液体,以将蒸汽相的相变液体冷凝回液体相。浸没冷却系统包括经由蒸汽管线和液体管线联接到浸没罐的次级冷凝器单元,其中,次级冷凝器单元配置为从外部冷却单元接收冷却液体以冷凝蒸汽以相变为液体,其中,初级冷凝器单元和次级冷凝器单元配置为在并行、串行或单个冷凝器模式下操作。
29.图1是示出根据一个实施方式的浸没冷却系统100的框图。具体而言,该图示出了浸没冷却系统100(以下称为冷却系统),浸没冷却系统100配置为浸没冷却一个或多个信息技术(it)设备102。冷却系统100可以是作为数据中心的一部分的冷却系统。在一个实施方式中,冷却系统100包括浸没罐101、初级冷凝器单元103和用于双冷凝器单元的次级冷凝器单元105。浸没罐101可容纳用于冷却浸没罐101的相变液体/流体。浸没罐101可包括位于浸没罐101内的it设备102。
30.it设备102可配置为提供it服务。具体地,it设备102可包括主机服务器(称为主机节点)和/或一个或多个计算服务器(也称为计算节点,例如cpu服务器和gpu服务器)。主机服务器(具有一个或多个cpu)通常通过网络(例如,因特网)与客户端(图1中未示出)连接,以接收对例如存储服务(例如,基于云的存储服务,例如备份和/或恢复)的特定服务的请求,执行应用以执行某些操作(例如,图像处理、深度数据学习算法或建模等,作为服务软件或saas平台的一部分)。响应于该请求,主机服务器将任务分配给由主机服务器管理的一个或多个性能计算节点或计算服务器(具有一个或多个gpu)。在一个实施方式中,it设备102可执行任何类型的计算任务和/或可以是任何类型的计算装置(例如,服务器、存储装置等)。在一个实施方式中,it设备102可以是边缘计算装置。因此,当it设备102提供it服务的同时,该设备产生被传递到相变液体104中的热量。
31.参考图1,初级冷凝器单元103可包括位于浸没罐101内的冷凝盘管。浸没罐101内的蒸汽可上升到初级冷凝器单元103的冷凝盘管,然后蒸汽在浸没罐101内冷凝回液体相。浸没罐101可包括容纳在浸没罐101内的蒸汽回路109和液体回路107,蒸汽回路109和液体回路107可使相变液体在浸没罐101与初级冷凝器单元103之间以蒸汽相和液体相循环。
32.在一个实施方式中,蒸汽回路109和液体回路107分别连接并延伸到蒸汽管线119和液体管线117。在一个实施方式中,浸没罐101包括蒸汽端口106和液体端口108,其中,蒸汽端口106和液体端口108分别联接到蒸汽管线119和液体管线117以将浸没罐101连接到次级冷凝器单元105。在一个实施方式中,这两个端口装配有干式快速断开联接器。干式快速
断开联接器设计成用于软管和管道的快速且无溢出的连接和断开。蒸汽管线119和液体管线117可连接到次级冷凝器单元105以将蒸汽相的相变液体引导到次级冷凝器单元105,并且将液体相的相变液体从次级冷凝器单元105引导回到浸没罐101。例如,蒸汽可经由蒸汽管线119上升到次级冷凝器单元105的冷凝盘管,在那里蒸汽可冷凝成液体相。冷凝的液体然后可通过重力经由液体管线117返回到浸没罐101。
33.在一个实施方式中,冷却系统100包括外部冷却单元111以向冷凝器单元103和105提供冷却液体。如图所示,冷却系统100可包括连接在初级冷凝器单元103、次级冷凝器单元105和外部冷却单元111之间的多个冷却液体管线。在一个实施方式中,冷却液体与相变液体不同。在一个实施方式中,冷却液体是水。
34.在一个实施方式中,冷却系统100包括形成回路的第一液体管线113和第二液体管线115,以在冷凝器单元103和105之间循环冷却液体。在一个实施方式中,冷却系统100包括在外部冷却单元111与第一液体管线113之间的供给管线121,供给管线121将第一液体管线113等分(例如,将第一液体管线113划分成两个部分)。
35.在一个实施方式中,可存在用于控制初级冷凝器单元103和次级冷凝器单元105的冷却流体分配和操作的三个阀。在一个实施方式中,冷却系统100包括将第一液体管线113等分的、联接在供给管线121与第一液体管线113之间的第一(三通)阀131,其中,供给管线121联接到外部冷却单元111的供给端口。
36.在一个实施方式中,冷却系统100包括联接在返回管线123与第一液体管线113的靠近次级冷凝器单元105的部分之间的第二(双向)阀133,其中,返回管线123联接到外部冷却单元111的返回端口。
37.在一个实施方式中,冷却系统100包括在联接在第二液体管线115与返回管线123之间的管线120处的第三(双向)阀135。在一个实施方式中,冷却系统100包括在返回管线123处的泵125,以便于流体在返回管线123处流动。注意,阀131至阀135可具有可切换打开和关闭的端口,以使初级冷凝器单元和次级冷凝器单元串行、并行和在单个冷凝器操作模式下操作,如在图3至图6中进一步所示。
38.在整个系统中,双冷凝器单元103、105的冗余和高可靠性可根据对不同功耗负载或热管理要求的需要在不同操作模式下操作。
39.图2是示出根据一个实施方式的用于浸没冷却系统100的控制系统的框图。控制系统包括功率传感器201、温度传感器203和控制器205。功率传感器201可测量浸没罐101内的it设备102的功率/电子信息。温度传感器203可测量从外部冷却单元111提供给初级冷凝器单元103和次级冷凝器单元105的冷却液体的温度。控制器205可控制阀131至阀135的操作状态。在一个实施方式中,控制器205可与浸没罐管理控制器集成,该浸没罐管理控制器管理和控制容纳在浸没罐101处的相变液体104的量。
40.在一个实施方式中,控制器205可以是专用处理器,例如专用集成电路(asic)、通用微处理器、现场可编程门阵列(fpga)、数字信号控制器或硬件逻辑结构(例如,滤波器、算术逻辑单元和专用状态机)的集合。在一个实施方式中,控制器205可以是具有模拟元件(例如,电阻器、电容器、电感器等)和/或数字元件(例如,基于逻辑的元件,诸如晶体管等)的组合的电路。控制器205还可包括存储器。在一个实施方式中,控制器205可以是浸没罐101的一部分(或集成的)。在另一实施方式中,控制器205可以是至少部分浸没在相变液体104内
的it设备102中的一个。
41.在一个实施方式中,控制器205通信地联接(例如,有线和/或无线连接)到阀131至阀135、功率传感器201和温度传感器203。具体地,控制器205配置为实时地接收来自传感器201至传感器203的功耗和/或温度信息(作为电信号),并且控制阀131至阀135(例如,通过向阀的控制电路(例如,电子开关)发送控制信号),以便调节阀131至阀135的操作状态(例如,至少部分地打开阀、打开阀所有通路、或关闭阀)。在一个实施方式中,控制器205可基于实时功耗和/或温度信息来控制阀131至阀135。
42.在一个实施方式中,控制器205可包括冷却优化器,该冷却优化器可确定阀131至阀135的操作状态,以在优化的操作策略(例如,优化的冷却性能、优化的功率效率或其组合等)中操作冷却系统100。在一个实施方式中,冷却优化器包括机器学习模型,可训练该机器学习模型以选择冷却系统100的操作模式。机器学习模型的示例包括支持向量机、随机森林、回归模型、决策树等。
43.在一个实施方式中,机器学习模型是可训练的深度学习神经网络模型,其可使用功耗和/或温度信息训练以选择用于冷却系统100的操作模式(例如,串行、并行或单个冷凝器)。深度学习神经网络模型的示例包括长期记忆模型、变压器、卷积神经网络模型、多层感知器、强化学习模型、模拟学习模型等。注意,功率消耗和/或温度信息可包括在预定时间段内从冷却系统100收集的实时或历史时间序列信息。可使用冷却系统100的过去和/或实时功耗和/或温度信息以及设计数据来训练冷却优化器。
44.冷却系统100可配置为在至少四种操作模式下操作。如图3至图6进一步所示,至少四种操作模式是串行模式、并行模式、单个次级冷凝器模式或单个初级冷凝器模式。
45.图3是示出根据一个实施方式的用于浸没冷却系统的双冷凝器单元的串行操作模式的框图。在该串行操作模式下,阀135关闭,阀133打开,并且阀131设置为从端口#2到端口#0打开以及从端口#2到端口#1关闭。打开的阀/端口允许液体流过阀/端口。关闭的阀/端口阻止液体流过阀/端口。在该串行操作模式下,冷却流体从外部冷却单元111输送到初级冷凝器单元103,然后输送到次级冷凝器单元105。
46.图4是示出根据一个实施方式的用于浸没冷却系统的双冷凝器单元的并行操作模式的框图。在这种并行操作模式下阀135打开并且阀133关闭。阀131的端口#2至端口#0以及端口#2至端口#1打开。在这种并行操作模式下,冷却液体从外部冷却单元111并行地分配到初级冷凝器单元103和次级冷凝器单元105两者。
47.图5是示出根据一个实施方式的用于浸没冷却系统的双冷凝器单元的单个次级冷凝器操作模式的框图。在这种单个次级冷凝器模式下,阀135打开并且阀133关闭。阀131的端口#2至端口#1打开以及端口#2至端口#0关闭。在这种单个次级冷凝器模式下,冷却液体从外部冷却单元111分配到仅次级冷凝器单元105,并且仅次级冷凝器单元105用于冷却浸没罐101。
48.图6是示出根据一个实施方式的用于浸没冷却系统的双冷凝器单元的单个初级冷凝器操作模式的框图。在这种单个初级冷凝器模式下,阀135打开,阀133关闭。阀131的端口#2至端口#0打开,以及端口#2至端口#1关闭。在该单个初级冷凝器模式下,冷却液体从外部冷却单元111分配到仅初级冷凝器单元103,并且仅初级冷凝器单元103用于冷却浸没罐101。
49.图7是示出根据一个实施方式的操作浸没冷却系统的方法的流程图。过程700可由可包括软件、硬件或其组合的处理逻辑来执行。例如,过程700可由图2的控制器205执行以控制冷却系统100。
50.在框701,处理逻辑接收来自具有初级冷凝器单元103和次级冷凝器单元105的冷却系统100的功率消耗和温度信息。
51.初级冷凝器单元103可容纳在冷却系统100的浸没罐101内。次级冷凝器单元105可位于浸没罐的顶部上,并且可经由蒸汽管线和液体管线联接到浸没罐101,以将相变液体循环到次级冷凝器单元105。
52.处理逻辑可从功率传感器201检索功率消耗信息,该功率传感器201测量功率/电、浸没罐101中的it设备102的计算负载信息,其中,功率/电、计算负载信息可被转换为浸没罐101处的热负载输出。处理逻辑可从温度传感器203检索温度信息,该温度传感器203测量与外部冷却单元111联接的供给管线121处的冷却液体的温度。
53.在框703,处理逻辑使用冷却优化器确定初级冷凝器单元和次级冷凝器单元的第一操作模式。
54.在框705,第一操作模式是四种操作模式(两个冷凝器串行、两个冷凝器并行、单个次级冷凝器模式或单个初级冷凝器模式)中的一种。
55.例如,处理逻辑可包括优化器算法,该优化器算法被训练以选择用于冷却系统100的第一操作模式,其中,第一操作模式是四种操作模式(两个冷凝器串行、两个冷凝器并行、单个次级冷凝器模式或单个初级冷凝器模式)中的一种。
56.在框707,冷却优化器是机器学习模型或深度学习神经网络模型。例如,优化器算法可包括可训练的机器学习模型或深度学习神经网络模型。
57.在框709,处理逻辑将冷却系统配置为在第一操作模式下操作。例如,处理逻辑将阀131至阀135的与第一操作模式相对应的操作状态设置为在第一操作模式下操作冷却系统100。
58.在一个实施方式中,在接收实时功耗/温度信息的同时,处理逻辑使用冷却优化器基于实时功耗/温度信息来确定应为冷却系统选择的第二操作模式,并且处理逻辑将冷却系统配置为从第一操作模式操作到第二操作模式。
59.在前面的说明书中,已经参考本发明的特定示例性实施方式描述了本发明的实施方式。显然,可对本发明的实施方式进行各种修改,而不背离如所附权利要求书中所阐述的本发明的更宽的精神和范围。因此,说明书和附图被认为是说明性的,而不是限制性的。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1