一种液冷散热器的制作方法

文档序号:28166218发布日期:2021-12-24 22:31阅读:138来源:国知局
一种液冷散热器的制作方法

1.本发明涉及液冷散热领域,更具体地,特别是指一种液冷散热器。


背景技术:

2.半导体集成电路技术发展迅速,芯片集成规模不断打破限制,芯片功耗不断增加,芯片散热也成为无法避开的话题。在数据中心领域,例如intel2022年下一代sapphire rapids cpu功耗将达到350

400w,broadcom2020年发布的100g交换芯片也已达到400w级别,nvidia最新的a100gpu功耗将达到500w级别,类似其之前发布的delta gpu系统,8块gpu 卡的服务器在gpu方面就消耗4000w的功耗。
3.传统的风冷式散热系统,在面对功耗激增的各类cpu/gpu芯片、标卡及模组时显得略有不足,且因散热效率低带来的功耗、噪音也增加不少。风冷散热不能满足如此之高的功耗需求,现有技术使用液冷来处理散热问题。现有技术的液冷大致分为三类:冷板式液冷方案、浸没式液冷方案和后置式液冷交换器方案。
4.冷板式液冷方案即芯片表面放置一块冷板,冷却液通过管道流经芯片表面的冷板,带走芯片热量,然后冷却液通过机箱内部或者机架内的热交换器进行冷却。浸没式液冷方案是将服务器整机设备浸没到绝缘的冷却液箱体中,通过冷却液受热蒸发带走设备热量,蒸发的冷却液气体通过管道到达外部的冷却装置,冷却液重新冷凝后回流到冷却箱中。后置式液冷交换器方案,即在服务器后窗出风口放置一热交换器,热交换器中的液体吸收服务器吹出热风中的热量,冷却后的气流再回流到机器进风口,而加热的冷却液则通过管道输送到机房中心外部进行重新制冷,之后重新流入机架后端的热交换器。上述三种方案都可以实现对设备、大规模芯片模块实现散热的功能,但缺点是无法实现精确控制,对机器内模块之间缺乏灵活的调控策略。
5.针对现有技术中液冷难以精确控制大功率散热的问题,目前尚无有效的解决方案。


技术实现要素:

6.有鉴于此,本发明实施例的目的在于提出一种液冷散热器,能够实现分立地精确控制发热芯片或者模组散热。
7.基于上述目的,本发明实施例的第一方面提供了一种液冷散热器,包括:
8.进液管和出液管,分别用于获取低温冷却液和排出高温冷却液;
9.分流装置和汇集装置,分别连接到进液管和出液管,以将低温冷却液分流到多路、和从多路汇集高温冷却液;
10.多路液冷支管,每路液冷支管均在两端分别连接到分流装置和汇集装置以传输冷却液,并且每路液冷支管均流经一个发热芯片的所在位置;
11.多个散热冷板,每个散热冷板均设置在液冷支管上直接接触一个发热芯片的位置,每个散热冷板均从液冷支管中靠近分流装置的一侧获取低温冷却液来冷却发热芯片,
并将冷却发热芯片后产生的高温冷却液向液冷支管中靠近汇集装置的一侧排出。
12.在一些实施方式中,液冷散热器还包括多个控制阀,每个控制阀均设置在一路液冷支管上,并配置用于调整液冷支管内的冷却液流速。
13.在一些实施方式中,液冷散热器还包括多个流量计,每个流量计均设置在一路液冷支管上,并配置用于检测并输出液冷支管内的冷却液流速。
14.在一些实施方式中,液冷散热器还包括多个漏液检测线,每个漏液检测线均缠绕设置在一路液冷支管的全部长度上,并配置用于响应于检测到液冷支管漏液而发出告警信号。
15.在一些实施方式中,液冷散热器还包括多个倾斜传感器,分散设置于发热芯片所在板卡上的不同位置,并配置用于检测并输出板卡的倾斜角度和姿态。
16.在一些实施方式中,液冷散热器还包括多个湿度传感器,分散设置于发热芯片所在板卡上的不同位置,并配置用于检测并输出板卡周围环境中的空气湿度。
17.本发明实施例的第二方面提供了另一种液冷散热器,包括前述的液冷散热器中所限定的部件,并且还额外包括:
18.基板管理控制器,配置为接收发热芯片和冷却液流速的相关信息,并根据相关信息生成和发出控制指令;
19.数字信号处理器,连接到发热芯片以获取发热芯片的相关信息并反馈给基板管理控制器,连接到多个流量计以获取冷却液流速的相关信息并反馈给基板管理控制器,接收并将控制指令送达以控制多个控制阀。
20.在一些实施方式中,液冷散热器还包括:
21.第一总线格式转换器,设置在数字信号处理器和多个流量计之间,配置为将从多个流量计获取的冷却液流速的相关信息从rs

485格式转化为通用异步收发传输器格式以传输到数字信号处理器的通用异步收发传输器接口;
22.内部集成电路总线切换器,设置在数字信号处理器和多个控制阀之间,配置为将在内部集成电路总线上接收到的控制指令分别送达以控制多个控制阀;
23.多个变送器,分别设置在内部集成电路总线切换器和多个控制阀之间,配置为将内部集成电路总线上的控制指令从数字形式转化为模拟电流形式来分别控制多个控制阀。
24.本发明实施例的第三方面提供了另一种液冷散热器,包括前述的液冷散热器中所限定的部件,并且还额外包括:
25.复杂可编程逻辑器件,配置为接收部件姿态、环境湿度、和漏液情况的相关信息,并根据相关信息而选择性地告警;
26.数字信号处理器,连接到多个倾斜传感器和多个湿度传感器以获取部件姿态和环境湿度的相关信息并反馈给复杂可编程逻辑器件,连接到多个漏液检测线以获取漏液情况的相关信息并反馈给复杂可编程逻辑器件。
27.在一些实施方式中,液冷散热器还包括:
28.第二总线格式转换器,设置在数字信号处理器、和多个倾斜传感器与多个湿度传感器之间,配置为将从多个倾斜传感器和多个湿度传感器获取的部件姿态和环境湿度的相关信息从rs

485格式转化为通用异步收发传输器格式以传输到数字信号处理器的通用异步收发传输器接口;
29.比较器,设置在数字信号处理器和多个漏液检测线之间,配置为将从多个漏液检测线获取到的电阻与预定电阻相比较以确定漏液情况的相关信息,并将漏液情况的相关信息传输到数字信号处理器。
30.本发明具有以下有益技术效果:本发明实施例提供的液冷散热器,通过使用进液管和出液管,分别用于获取低温冷却液和排出高温冷却液;分流装置和汇集装置,分别连接到进液管和出液管,以将低温冷却液分流到多路、和从多路汇集高温冷却液;多路液冷支管,每路液冷支管均在两端分别连接到分流装置和汇集装置以传输冷却液,并且每路液冷支管均流经一个发热芯片的所在位置;多个散热冷板,每个散热冷板均设置在液冷支管上直接接触一个发热芯片的位置,每个散热冷板均从液冷支管中靠近分流装置的一侧获取低温冷却液来冷却发热芯片,并将冷却发热芯片后产生的高温冷却液向液冷支管中靠近汇集装置的一侧排出的技术方案,能够实现分立地精确控制发热芯片或者模组散热。
附图说明
31.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
32.图1为本发明提供的液冷散热器的物理结构示意图;
33.图2为本发明提供的液冷散热器的控制系统连接关系图;
34.图3为本发明提供的液冷散热器的保护系统连接关系图;
35.图4为本发明提供的液冷散热器的控制逻辑图。
具体实施方式
36.为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
37.需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
38.基于上述目的,本发明实施例的第一个方面,提出了一种实现分立地精确控制发热芯片或者模组散热的液冷散热器的一个实施例。图1示出的是本发明提供的液冷散热器的第一实施例的结构示意图。
39.所述的液冷散热器,如图1所示包括:
40.进液管和出液管,分别用于获取低温冷却液和排出高温冷却液;
41.分流装置和汇集装置,分别连接到进液管和出液管,以将低温冷却液分流到多路、和从多路汇集高温冷却液;
42.多路液冷支管,每路液冷支管均在两端分别连接到分流装置和汇集装置以传输冷却液,并且每路液冷支管均流经一个发热芯片的所在位置;
43.多个散热冷板,每个散热冷板均设置在液冷支管上直接接触一个发热芯片的位置,每个散热冷板均从液冷支管中靠近分流装置的一侧获取低温冷却液来冷却发热芯片,
并将冷却发热芯片后产生的高温冷却液向液冷支管中靠近汇集装置的一侧排出。
44.在一些实施方式中,液冷散热器还包括多个控制阀,每个控制阀均设置在一路液冷支管上,并配置用于受控调整液冷支管内的冷却液流速。
45.在一些实施方式中,液冷散热器还包括多个流量计,每个流量计均设置在一路液冷支管上,并配置用于检测并输出液冷支管内的冷却液流速。
46.在一些实施方式中,液冷散热器还包括多个漏液检测线,每个漏液检测线均缠绕设置在一路液冷支管的全部长度上,并配置用于响应于检测到液冷支管漏液而发出告警信号。
47.在一些实施方式中,液冷散热器还包括多个倾斜传感器,分散设置于发热芯片所在板卡上的不同位置,并配置用于检测并输出板卡的倾斜角度和姿态。
48.在一些实施方式中,液冷散热器还包括多个湿度传感器,分散设置于发热芯片所在板卡上的不同位置,并配置用于检测并输出板卡周围环境中的空气湿度。
49.本发明例公开所述的装置、设备等可为各种电子终端设备,例如手机、个人数字助理(pda)、平板电脑(pad)、智能电视等,也可以是大型终端设备,如服务器等,因此本发明实施例公开的保护范围不应限定为某种特定类型的装置、设备。本发明实施例公开所述的客户端可以是以电子硬件、计算机软件或两者的组合形式应用于上述任意一种电子终端设备中。
50.下面根据具体实施例进一步阐述本发明的具体实施方式。
51.如图1所示,该gpu(图形处理器)系统有gpu
‑0…
gpu

7共8个模组(即发热芯片),每个模组分别有独立的散热冷板,与之对应的每个冷板都有一条冷液管道相连,冷液管道两端分别与分流装置、汇集装置相连接。冷却液通过进液管、分流装置进入冷液支路/制冷板,将gpu模组热量带走,通过汇集装置和出液管流出机箱外,并在外部进行再次冷却。
52.在分流装置与每一条冷液支管之间串入电磁流量控制阀

0到7、液体流量计

0到7,其中电磁流量控制阀用于控制每一条管道冷液流通流量,液体流量计用于检测实际管路中液体流量数据。
53.在gpu系统基板的四个角分别安装四个倾斜传感器

0/1/2/3,四组倾斜传感器用于实时监测基板的倾斜角度,用于整机系统的姿态感知。在gpu 基板的进液端、出液端以及基板中央位置,布置了4个空气湿度传感器,用于定时监测机箱内部空气湿度。
54.在8条冷液管道上分别绕有一根漏液检测线缆,漏液检测线用于常规的检查管道上的漏液。
55.从上述实施例可以看出,本发明实施例提供的液冷散热器,通过使用进液管和出液管,分别用于获取低温冷却液和排出高温冷却液;分流装置和汇集装置,分别连接到进液管和出液管,以将低温冷却液分流到多路、和从多路汇集高温冷却液;多路液冷支管,每路液冷支管均在两端分别连接到分流装置和汇集装置以传输冷却液,并且每路液冷支管均流经一个发热芯片的所在位置;多个散热冷板,每个散热冷板均串联在一路液冷支管上直接接触一个发热芯片的位置,每个散热冷板均从液冷支管中靠近分流装置的一侧获取低温冷却液来冷却发热芯片,并将冷却发热芯片后产生的高温冷却液向液冷支管中靠近汇集装置的一侧排出的技术方案,能够实现分立地精确控制发热芯片或者模组散热。
56.基于上述目的,本发明实施例的第二个方面,提出了一种实现分立地精确控制发
热芯片或者模组散热的液冷散热器的另一个实施例。液冷散热器包括前述的液冷散热器中所限定的部件,并且还额外包括:
57.基板管理控制器,配置为接收发热芯片和冷却液流速的相关信息,并根据相关信息生成和发出控制指令;
58.数字信号处理器,连接到发热芯片以获取发热芯片的相关信息并反馈给基板管理控制器,连接到多个流量计以获取冷却液流速的相关信息并反馈给基板管理控制器,接收并将控制指令送达以控制多个控制阀。
59.在一些实施方式中,液冷散热器还包括:
60.第一总线格式转换器,设置在数字信号处理器和多个流量计之间,配置为将从多个流量计获取的冷却液流速的相关信息从rs

485格式转化为通用异步收发传输器格式以传输到数字信号处理器的通用异步收发传输器接口;
61.内部集成电路总线切换器,设置在数字信号处理器和多个控制阀之间,配置为将在内部集成电路总线上接收到的控制指令分别送达以控制多个控制阀;
62.多个变送器,分别设置在内部集成电路总线切换器和多个控制阀之间,配置为将内部集成电路总线上的控制指令从数字形式转化为模拟电流形式来分别控制多个控制阀。
63.图2为dsp(数字信号处理器)控制系统框图,dsp通过i2c(内部集成电路总线)与bmc(基板管理控制器)进行数据交互,用于获取gpu温度等健康数据。dsp使用i2c总线,通过i2c switch(内部集成电路总线切换器)选通8个变送器中其中一个,每个变送器输出4

20ma范围的电流用于控制电磁流量控制阀的导通限度。
64.dsp有uart(异步收发传输器)接口,通过uart转rs

485芯片转换为rs

485总线,然后连接8个流量传感器,用于获取每个冷液管道内实际液体流量信息。dsp还有i2c接口,连接8组gpu供电输入的vr(电压调节器)芯片,用于获取gpu芯片的输入功耗。
65.从上述实施例可以看出,本发明实施例提供的液冷散热器,通过使用进液管和出液管,分别用于获取低温冷却液和排出高温冷却液;分流装置和汇集装置,分别连接到进液管和出液管,以将低温冷却液分流到多路、和从多路汇集高温冷却液;多路液冷支管,每路液冷支管均在两端分别连接到分流装置和汇集装置以传输冷却液,并且每路液冷支管均流经一个发热芯片的所在位置;多个散热冷板,每个散热冷板均串联在一路液冷支管上直接接触一个发热芯片的位置,每个散热冷板均从液冷支管中靠近分流装置的一侧获取低温冷却液来冷却发热芯片,并将冷却发热芯片后产生的高温冷却液向液冷支管中靠近汇集装置的一侧排出的技术方案,能够实现分立地精确控制发热芯片或者模组散热。
66.基于上述目的,本发明实施例的第三个方面,提出了一种实现分立地精确控制发热芯片或者模组散热的液冷散热器的另一个实施例。液冷散热器包括前述的液冷散热器中所限定的部件,并且还额外包括:
67.复杂可编程逻辑器件,配置为接收部件姿态、环境湿度、和漏液情况的相关信息,并根据相关信息而选择性地告警;
68.数字信号处理器,连接到多个倾斜传感器和多个湿度传感器以获取部件姿态和环境湿度的相关信息并反馈给复杂可编程逻辑器件,连接到多个漏液检测线以获取漏液情况的相关信息并反馈给复杂可编程逻辑器件。
69.在一些实施方式中,液冷散热器还包括:
70.第二总线格式转换器,设置在数字信号处理器、和多个倾斜传感器与多个湿度传感器之间,配置为将从多个倾斜传感器和多个湿度传感器获取的部件姿态和环境湿度的相关信息从rs

485格式转化为通用异步收发传输器格式以传输到数字信号处理器的通用异步收发传输器接口;
71.比较器,设置在数字信号处理器和多个漏液检测线之间,配置为将从多个漏液检测线获取到的电阻与预定电阻相比较以确定漏液情况的相关信息,并将漏液情况的相关信息传输到数字信号处理器。
72.图3为dsp保护系统框图,dsp有uart接口通过uart转rs

485芯片转换为rs

485总线,然后连接4个倾斜传感器、4个湿度传感器。dsp 还连接个比较器,其输入一侧连接8组漏液感应线,用于检查是否发生漏液,比较器的输出连接到dsp的8个gpio(通用输入输出总线)。
73.从上述实施例可以看出,本发明实施例提供的液冷散热器,通过使用进液管和出液管,分别用于获取低温冷却液和排出高温冷却液;分流装置和汇集装置,分别连接到进液管和出液管,以将低温冷却液分流到多路、和从多路汇集高温冷却液;多路液冷支管,每路液冷支管均在两端分别连接到分流装置和汇集装置以传输冷却液,并且每路液冷支管均流经一个发热芯片的所在位置;多个散热冷板,每个散热冷板均设置在液冷支管上直接接触一个发热芯片的位置,每个散热冷板均从液冷支管中靠近分流装置的一侧获取低温冷却液来冷却发热芯片,并将冷却发热芯片后产生的高温冷却液向液冷支管中靠近汇集装置的一侧排出的技术方案,能够实现分立地精确控制发热芯片或者模组散热。
74.在此之外,本发明还公开了上述液冷散热器的实施例的工作方式。参见图4,bmc管理单元通过i2c访问gpu加速单元,获取gpu设备信息、温度信息,并将每个gpu的温度数据通过i2c传递给dsp处理单元。
75.dsp调用pid算法进行运算后,将控制数据通过i2c输出给变送器,变送器则输出4

20ma控制信号,控制电磁控制阀打开程度,控制冷液流量。当gpu温度升高,相应的控制阀打开程度增加,冷却液流量增大将带走gpu更多的热量,使gpu温度保持在一定范围。由此部分构成外环的温度控制闭环系统。设置在冷液支管上的流量计则用于检查实际管道中液体的流量,dsp将获取该流量数据,用于反馈校正实际控制阀的开度。由此构成内环的流量闭环控制系统。
76.dsp通过i2c访问gpu输入供电vr获取gpu的功耗,并作为前馈控制量参与到冷却液流量中。当gpu利用率突然增加,gpu发热量增加,温度也会上升,但由于温度作为一个缓慢变化量,dsp不能即时调整冷却液流量,但是dsp可以很快获取到此vr输入功耗增加信息,dsp将提前做出控制动作,将gpu温度控制在一个比较稳定的范围。同样,当gpu功耗降低时,gpu发热量降低,dsp也可以提前获取到vr输入功耗数据,将适当的关闭控制阀开度,控制冷却液流量在较低的水平。
77.常规的漏液检测线用于检查冷却液管道是否发生漏液现象,当有漏液现象发生时,漏液检测线的阻抗值发生变化,比较器则将检测到漏液线上微弱的电压变化并输出电平信号到dsp的gpio,dsp检测到该信号后,记录下触发源,并迅速触发中断信号给主板cpld。cpld控制gpu系统迅速下电。
78.同时,dsp通过485总线方位gpu基板上设计的4组湿度传感器,则用于检查gpu模块
周围空气湿度,当系统内湿度超过一定范围,dsp记录该数据,并触发bmc告警。
79.此外,gpu基板上设计的4个倾斜传感器,则用于检测gpu机器姿态信息,当机箱发生倾斜或者安放不到位情况下,dsp同样将中断信号给cpld, cpld将禁止gpu系统上电,防止出现倾斜液体渗漏问题。
80.所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上所述的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1