专利名称::利于液冷式电子器件机架冷却的系统和方法
技术领域:
:本发明总体上涉及利于液冷式的、安装于机架上的各个电子单元的总成(比如安装于机架上的计算机服务器单元)的操作的装置和方法。
背景技术:
:集成电路芯片以及包括芯片的模块的功耗持续增大以便获得处理器性能的增加。这个趋势对模块和系统级别两方面的冷却都带来了挑战。需要增大的气流量以有效地冷却高功率模块和限制排入计算机中心的空气的温度。在许多大型服务器应用场合,处理器连同其相关电子器件(例如存储器、磁盘驱动器、电源等)组装于堆叠在机架或框架内的可移除抽屉式构造中。在其它情况下,电子器件可处于机架或框架内的固定位置。通常,部件借助由一个或更多使空气移动的装置(例如风扇或鼓风机)推动的、沿平行的气流路径一通常为前后方向一移动的空气所冷却。在某些情况下,通过使用更大功率的使空气移动的装置或通过增大现有使空气移动的装置的旋转速度(也就是RPM)来提供更大的气流,可以处理单个抽屉内增大的功耗。然而,这种方法在计算站(例如数据中心)情况下的机架级别存在问题。由离开机架的空气所承载的大量热负荷在有效处理该负荷的室温调节有效性方面带来很大压力。这对于具有"服务器群(serverfarm)"或大量非常接近的计算机机架的大型装置尤其如此。在这种装置中,液体冷却(例如水冷)是一种具有吸引力的管理较高热通量的技术。液体以有效率的方式吸收由部件/模块散发的热量。典型地,热量最终从该液体传至外部环境_或者空气或者其他液体冷却剂
发明内容通过提供利于电子器件冷却的系统,现在技术的缺点得到克服并且提供了另外的优点。该系统包括电子器件机架、至少两个模块化冷却单元(MCU)、气-液热交换器、至少一个隔离阀以及至少一个控制器。该电子器件机架包括至少一个发热电子器件子系统,并且包括分别能够使外部空气进入和排出的进气口侧和出气口侧。所述MCU与所述电子器件机架相关联,并且构造成并行地向所述至少一个发热电子器件子系统提供系统冷却剂,以利于冷却所述至少一个发热电子器件子系统。每个MCU包括液-液热交换器、第一冷却剂回路和第二冷却剂回路。在运行时,每个MCU的所述第一冷却剂回路从源头接收冷的冷却剂并且使所述冷的冷却剂中的至少一部分经过所述液-液热交换器,而所述第二冷却剂回路向所述至少一个发热电子器件子系统提供冷却的系统冷却剂,并且在所述液-液热交换器中将来自所述至少一个发热电子器件子系统的热量排至所述第一冷却剂回路中的冷的冷却剂。所述气-液热交换器耦连成从所述至少两个MCU接收系统冷却剂,并且将系统冷却剂排至所述至少两个MCU。所述至少一个隔离阀耦连成选择性地切断经过所述气-液热交换器的系统冷却剂流。所述至少一个控制器耦连至所述至少一个隔离阀,用于在检测到所述至少两个MCU中的一个MCU失效时自动地切断经过所述气-液热交换器的系统冷却剂流。当运行时,所述至少两个MCU并行地向所述至少一个发热电子器件子系统提供冷却的系统冷却剂,以对所述至少一个发热电子器件子系统进行液体冷却;并且并行地向所述气-液热交换器提供冷却的系统冷却剂,用于冷却经过所述电子器件机架的空气的至少一部分。在检测到所述至少两个MCU中的一个MCU失效时,所述至少一个控制器使用所述至少一个隔离阀来自动地切断经过所述气-液热交换器的系统冷却剂流,同时系统冷却剂经由至少一个剩下的运行的MCU继续流向所述至少一个发热电子器件子系统,以继续对所述至少一个发热电子器件子系统液体冷却。。在另一方面中,提供了一种数据中心,其包括多个电子器件机架和多个冷却系统。每个电子器件机架包括至少一个发热电子器件子系统以及分别能够使外部空气进入和排出的进气口侧和出气口侧。每个冷却系统与相应的电子器件机架相关联并且包括至少两个模块化冷却单元(MCU),其与所述电子器件机架相关联,并且构造成并行地向所述至少一个发热电子器件子系统提供系统冷却剂,以利于冷却所述至少一个发热电子器件子系统;气-液热交换器,其与所述电子器件机架相关联,用于对经过所述电子器件机架的空气的至少一部分进行冷却;至少一个隔离阀,其耦连成选择性地切断经过所述气-液热交换器的系统冷却剂流;以及至少一个控制器,其耦连至所述至少一个隔离阀,用于在检测到所述至少两个MCU中的一个MCU失效时自动地切断经过所述气-液热交换器的系统冷却剂流。所述至少两个MCU中的每个MCU包括液-液热交换器、第一冷却剂回路和第二冷却剂回路。在运行时,每个MCU的所述第一冷却剂回路从源头接收冷的冷却剂并且使所述冷的冷却剂中的至少一部分经过所述液-液热交换器,而所述第二冷却剂回路向所述至少一个发热电子器件子系统提供冷却的系统冷却剂,并且在所述液-液热交换器中将来自所述至少一个发热电子器件子系统的热量排至所述第一冷却剂回路中的冷的冷却剂。此外,所述至少两个MCU并行地向气-液热交换器供应系统冷却剂,并且接收来自气-液热交换器排出的系统冷却剂。这样,当运行时,所述至少两个MCU并行地向相关电子器件机架的至少一个发热电子器件子系统提供冷却的系统冷却剂,以对所述至少一个发热电子器件子系统进行液体冷却;并且并行地向所述气-液热交换器提供冷却的系统冷却剂,用于冷却经过相关电子器件机架的空气的至少一部分。在检测到所述至少两个MCU中的一个MCU失效时,所述至少一个控制器使用所述至少一个隔离阀来自动地切断经过所述气-液热交换器的系统冷却剂流,同时系统冷却剂经由至少一个剩下的运行的MCU继续流向相关电子器件机架的所述至少一个发热电子器件子系统,以继续对所述至少一个发热电子器件子系统液体冷却。在又一方面,提供了一种利于电子器件机架冷却的方法。该方法包括冷却电子器件机架的至少一个发热电子器件子系统,所述电子器件机架包括分别能够使外部空气进入和排出的进气口侧和出气口侧,该冷却步骤包括使用与所述电子器件机架相关联的至少两个模块化冷却单元(MCU)并行地向所述电子器件机架的所述至少一个发热电子器件子系统提供系统冷却剂,所述至少两个MCU中的每个MCU包括液-液热交换器、第一冷却剂回路和第二冷却剂回路,并且,在运行时,每个MCU的所述第一冷却剂回路从源头接收冷的冷却剂并且使所述冷的冷却剂中的至少一部分经过所述液-液热交换器,而所述第二冷却剂回路便于向所述电子器件机架的所述至少一个发热电子器件子系统提供冷却的系统冷却剂,并且在所述液-液热交换器中将来自所述至少一个发热电子器件子系统的热量排至所述第一冷却剂回路中的冷的冷却剂;以及利用与所述电子器件机架相关联地设置的气-液热交换器来对经过所述电子器件机架的空气的至少一部分进行冷却,所述气-液热交换器耦连成从所述至少两个MCU接收系统冷却剂,并且将系统冷却剂排至所述至少两个MCU;以及监控所述至少两个MCU中的MCU的失效,并且一旦检测到所述至少两个MCU中的一个MCU失效就自动地切断经过所述气-液热交换器的系统冷却剂流,同时继续经由至少一个剩下的运行的MCU向所述至少一个发热电子器件子系统提供系统冷却剂流。进一步的、另外的特点和优点通过本发明的技术实现。本发明的其它实施方式和方面在这里详细描述并且视为所要求发明的一部分。说明书结尾处的权利要求书中特别指出并且明确地主张了作为本发明的主题。本发明的前述和其它目标、特点以及优点从以下结合附图的具体描述中将变得明显,在附图中图1图示了气冷式计算机设备的常规高架地板(raisedfloor)布局的一个实施方式;图2图示了根据本发明一个方面的、由本发明解决的一个问题,示出在气冷式计算机设备的高架地板布局的一个实施方式中的再循环气流4莫式;图3是根据本发明一个方面的电子器件机架的一个实施方式的平面剖视图,其中该电子器件机架利用了设置在其出气口侧处的至少一个气-液热交换器;图4是根据本发明一个方面的、液冷式电子器件机架的一个实施方式的前视图,该液冷式电子器件机架包括由一装置冷却的多个电子器件子系统;图5是根据本发明一个方面的电子器件机架的电子器件子系统的一个实施方式的示意图,其中电子器件模块通过由设置于该电子器件机架内的一个或多个模块化冷却单元所提供的系统冷却剂而液体式冷却;图6是根据本发明一个方面的模块化冷却单元的一个实施方式的示意图,该模块化冷却单元设置于液冷式电子器件机架内;图7是根据本发明一个方面的电子器件子系统布局的一个实施方式的俯视图;其中该电子器件子系统布局示出了用于冷却该电子器件子系统的部件的气一液冷却子系统;图8示出了根据本发明一个方面的部分组装的电子器件子系统布局的一个详细实施方式,其中所述电子器件子系统包括八个待主动冷却的发热电子部件,每个发热电子部件具有与之耦连的基于液体的冷却系统的相应液冷式冷板;图9是根据本发明一个方面的包括液冷式电子器件机架以及与之相关联的冷却系统的系统的一个实施方式的示意图,其中所述冷却系统包括两个模块化的冷却单元(MCU),所述冷却单元用于并行地向该机架的电子器件子系统提供液体冷却剂,并且并行地向例如设置在电子器件机架的出气口侧处、用于冷却由此排出的空气的气-液热交换器提供液体冷却剂;图IO是根据本发明一个方面的由图9的系统控制器执行的、便于检测MCU1处的失效并对此作出响应关掉MCU1并且切断朝向气-液热交换器的冷却剂流的过程的一个实施方式的流程图11是根据本发明一个方面的由图9的MCU1控制器执行的、便于监控系统冷却剂的温度,并且在检测到失效时关掉MCU1并且切断隔离阀1的过程的一个实施方式的流程图12是根据本发明一个方面的由图9的系统控制器执行的、便于检测MCU2处的失效并对此作出响应关掉MCU2并且切断经过气-液热交换器的冷却剂流的过程的一个实施方式的流程图;以及图13是根据本发明一个方面的由图9的MCU2控制器执行的、便于监控系统冷却剂的温度,并且在检测到失效时关掉MCU2并且切断隔离阀2的过程的一个实施方式的流程图。具体实施例方式这里所使用的术语"电子器件机架"、"安装于机架上的电子设备"以及"机架单元"是可互换地使用的,并且除非特别另外指明,其包括具有计算机系统或电子系统的一个或多个发热部件的任意壳体、框架、机架、隔室、刀片式服务器系统等,并且例如可以是具有高、中或低端处理能力的独立式计算机处理器。在一个实施方式中,电子器件机架可包括多个电子器件子系统,它们每个都具有布置于其中、需要冷却的一个或多个发热部件。"电子器件子系统"指的是其中布置有一个或多个发热电子部件的任何子壳体、刀片、大段内存、抽屉、节点、隔室等。电子器件机架的每个电子器件子系统相对于电子器件机架是可移动的或固定的,多抽屉机架单元的安装于机架上的电子器件抽屉和刀片式中心系统的刀片是待冷却的电子器件机架的子系统的两个示例。"电子部件"是指例如计算机系统或其他电子器件单元的需要冷却的任意发热电子部件。举例来说,电子部件可以包括一个或多个集成电路芯片以及/或者其他的待冷却的电子装置,包括一个或多个处理器芯片、存储器芯片以及存储器支撑芯片。作为进一步的例子,电子部件可以包括设置于公共承载件上的一个或多个棵芯片(baredie)或者一个或多个封装芯片。这里所使用的术语"主要发热部件"是指电子器件子系统内的主要的发热电子部件,而"次要发热部件"是指电子器件子系统中产生的热量少于待冷却的主要发热部件的那些电子部件。"主15要发热芯片"是指例如包括主要发热芯片和次要发热芯片的发热电子部件内的主要的发热晶片或芯片(其中的一个例子是处理器芯片)。"次要发热芯片"是指多芯片电子部件中发热量小于其中的主要发热芯片的那些芯片(存储器芯片和存储器支持芯片是待冷却的次要芯片的例子)。作为一个示例,发热电子部件可以包括位于公共承载件上的多个主要发热棵芯片以及多个次要发热芯片。进一步地,除非特别另外指明,术语"液冷式冷板"是指任意常规的导热结构,其具有多个通道或者通路,形成于其中,供液体冷却剂经其流过。另外,本文中的"以冶金方式结合"是指两部件借助任意装置熔焊、硬钎焊或者软钎焊到一起。本文所使用的"气-液热交换器组件,,是指具有如本文所述特征的、液态冷却剂能穿过其中流动的任何热交换机构;并且包括一个或多个串联或并联地耦接的分立的气-液热交换器。气-液热交换器可包括例如一个或多个冷却剂流路,所迷冷却剂流路由与多个气冷式冷却翅片热接触或机械式接触的导热管(比如铜管或其它管)构成。气-液热交换器的尺寸、构造和结构能在不脱离这里所公开发明的范围之下改变。"液-液热交换器,,可以包括例如两个或更多个由互相热接触或机械式接触的导热管(比如铜管或其它管)构成的冷却剂流路。液-液热交换器的尺寸、构造和结构能在不脱离这里所公开发明的范围之下改变。而且,"数据中心"指的是包含一个或多个待冷却的电子器件机架的计算机装置。作为具体示例,数据中心可包含一排或多排安装于机架上的计算单元,比如服务器单元。设备冷却剂以及系统冷却剂的一个示例是水。不过,本文中所公开的概念适于与设备侧和/或系统侧上的其他类型的冷却剂结合使用。例如,一种或多种冷却剂可以包括盐水、碳氟化合物液体、液态金属或其它类似的冷却剂,或者制冷剂,同时仍然保持本发明的优点和独特的特点。下面参照附图,附图由于能理解的原因不是按比例绘制,其中相同的参考标号在不同的附图中用来表示相同或类似的部件。如图l所示,在现有技术中典型的气冷式计算机装置100的高架地板布局中,多个电子器件机架110布置为一排或多排。计算机装置(比如图1中所示出的)可容纳几百或者甚至几千个微处理器。在图1的布置中,冷空气经由地板通风口从限定于高架地板140和计算机室的基部或底层地板165之间的供气室145进入计算机室。冷却空气通过位于电子器件机架的进气口侧120处的百叶窗式盖板进入并且通过电子器件机架的背面(也就是,出气口侧130)排出。每个电子器件机架110可具有使空气移动的装置(例如风扇或鼓风机)以提供强制的入口至出口的气流以冷却机架的抽屉内的电子部件。供气室145经由布置于计算机装置的"冷"空气通道中的多孔地板砖160将调节的冷却空气提供至电子器件机架的进气口侧。调节的冷却空气由一个或多个同样布置于计算机装置100内的空气调节单元150供应至供气室145。室内空气在调节空气单元150的上部附近进入每个调节空气单元150。该室内空气包括一部分从数据中心的、由电子器件机架110的相对出气口侧130所限定的"热"空气通道排出的排出空气。由于经过电子器件机架的气流需求不断增加,以及典型计算机室设备内空气分布的限制,可能会出现室内循环问题。这在图2的高架地板布局中示出,其中出现了从电子器件机架的出气口侧130返回至由电子器件机架的相对进气口侧120所限定的冷空气通道的热空气再循环200。之所以能出现这个再循环是因为通过砖160供应的调节空气通常仅是在布置于电子器件机架中的使空气移动的装置的作用下强制通过电子器件机架的空气流量的一部分。这可能是由于例如砖的尺寸(或扩散流量)上的限制。入口侧空气的其余供应部分通常通过再循环200由周边室内空气弥补。这个再循环流本质上通常非常复杂,并且能导致机架单元入口温度显著地高于预期。从计算机室设备的热通道排出的热空气至冷通道的再循环会损害机架内计算机系统或电子系统的性能和可靠性。数据中心设备通常设计为在18-35。C范围内的机架进气口温度下运行。然而,对于比如图1中所示的高架地板布局,温度的范围能够从机架下部(接近冷却空气输入地板孔)的15。C至2(TC变化到电子器件机架上部一此处热空气能形成自持续的再循环回路一的高达45-50。C的温度。由于可允许的机架热负荷受限于"热"部分处的机架入口空气温度,因此这个温度分布导致低的处理性能。另外,计算机装置设备对于客户而言几乎一直代表着高额的资本投入。因而,从产品可靠性和性能的观点以及从客户满意度和商业前景看,维持进入空气的温度均匀是很重要的。通过本发明所公开的装置和方法来解决这种计算机和电子系统的有效冷却,并改善一个或多个机架单元由于气流再循环而导致的局部热空气入口温度。图3示出了根据本发明一个方面的总体上用300标识的冷却电子系统的一个实施方式。在这个实施方式中,电子系统300包括具有入口门盖320和出口门盖330的电子器件才几架310,入口门盖和出口门盖具有开口以允许外部空气从电子器件机架310的进气口侧向着出气口侧进入和流出。这个系统还包括至少一个使空气移动的装置312,该使空气移动的装置312用于使外部空气移动以穿过至少一个定位于电子器件机架内的电子器件抽屉单元314。出口门盖330内布置有热交换组件340。热交换组件340包括气-液热交换器,经过电子器件机架的从入口至出口的气流穿过该气-液热交换器。使用计算机室水调节器(CRWC)350由作为CRWC350的输入而提供的设备或者当地较冷的冷却剂360来緩冲热交换组件340。CRWC350向热交换组件340提供系统水或系统冷却剂。热交换组件340将经过电子器件机架的从入口到出口的排出气流中的热量移走,并且经由系统水或冷却剂将热量传至CRWC350。有利地,在计算机设备的一个或多个电子器件机架的出口门盖处设置例如如这里所公开的具有气-液热交换器的热交换组件能够显著地降低计算机设备内已有的空气调节单元上的热负荷,并且有利于安装于机架上的电子器件单元的冷却。图4示出了液冷式电子器件机架400的一个实施方式,该液冷式电子器件机架400使用了将要利用本文所描述的系统和方法进行监控和操作的冷却系统。在一个实施方式中,液冷式电子器件机架400包括多个电子器件子系统410,所述电子器件子系统410为处理器或服务器节点。如图所示,大的功率调节器420设置在液冷式电子器件机架400的上部,并且两个模块化的冷却单元(MCU)430设置在该液冷式电子器件机架的下部中。在本文描述的实施方式中,仅以示例性的方式假定冷却剂是水或者基于水的溶液。除了MCU430,该冷却系统还包括系统水供应歧管431、系统水返回歧管432、将系统水供应歧管431耦连至电子器件子系统410的歧管-节点流体连接软管433、以及将各电子器件子系统410耦连至系统水返回歧管432的节点-歧管流体连接软管434。每个MCU430经由相应的系统水供应软管435与系统水供应歧管431流体连通,并且每个MWCU430经由相应的系统水返回软管436与系统水返回歧管432流体连通。如图所示,电子器件子系统的热负荷从系统水传至由设备水供应线路440和设备水返回线路441供应的较冷的设备水,在图示的实施方式中,设备水供应线路440和设备水返回线路"1设置于高架地板145和基部地板165之间。图5示意性地示出了图4中的冷却系统的操作,其中,液冷式冷板500图示为耦连至液冷式电子器件机架400内的电子器件子系统410的电子器件模块501。通过借助泵520而在由模块化水冷却单元430的液-液热交换器521、线路522、523和冷板500限定的系统冷却剂回路内循环通过冷板500的系统冷却剂,热量从电子器件模块501被移走。系统冷却剂回路和模块化水冷却单元设计成提供具有受控温度和压力、且具有受控的化学成分并且相对于电子器件模块具有受控清洁度的冷却剂。而且,系统冷却剂与线路440、441中的控制较少的设备冷却剂(热量最终传至此)实体上分开。图6示出了根据本发明一个方面的模块化水冷却单元430的一个更加详细的实施方式。如图6所示,模块化水冷却单元430包括第一冷却回路,其中供应610、凉的i殳备冷却剂,并且冷却剂经过由马达625驱动的控制阀620。岡620决定将要流经热交换器521的设备冷却剂的量,其中所述设备冷却剂的一部分可能经由旁通孔口635直接返回。该模块化水冷却单元还包括具有贮存罐640的第二冷却回路,来自该贮存罐640的系统冷却剂通过泵650或者泵651净皮泵送入用于对其进行调节和输出的热交换器521,并且作为冷却的系统冷却剂被泵送至待冷却的电子器件机架。冷却的系统冷却剂经由系统水供应软管435和系统水返回软管436被供应至液冷式电子器件机架的系统水供应歧管和系统水返回歧管。图7示出了电子器件子系统410的部件布局的一个实施方式,其中,一个或多个使空气移动的装置711提供强制气流715,以冷却电子器件子系统713内的多个部件712。冷空气通过抽屉的前部731进入,并且通过抽屉的后部733排出。待冷却的多个部件包括多个其上耦连有(基于液体的冷却系统的)液冷式冷板720的处理器模块;以及其上耦连有气冷式热沉的存储器模块730(例如双列直插式内存模块(DIMM))的多个阵列和多排存储器支持模块732(例如DIMM控制模块)。在图示的实施方式中,存储器模块730和存储器支持模块732的一部分排列在电子器件子系统410的前部731附近,并且一部分排列在电子器件子系统410的后部733附近。另外,在图7的实施方式中,存储器模块730和存储器支持模块732由穿过该电子器件子系统的气流715冷却。图示的该基于液体的冷却系统还包括与液冷式冷板720连接并且与之流体连通的多个冷却剂运送管。所述冷却剂运送管包括多组冷却剂运送管,其中,每组包括(例如)冷却剂供应管740、跨接管7"和冷却剂返回管742。在该实施方式中,每组管将液体冷却剂提供给一对串联连接的冷板720(其耦连至一对处理器模块)。冷却剂经由冷却剂供应管740流入每对冷板中的第一冷板,并且经由可以导热也可以不导热的跨接管或线路741从该对冷板中的第一冷板流至第二冷板。冷却剂通过相应的冷却剂返回管742从该对冷板的第二冷板返回。图8更为详细地示出了另一电子器件抽屉布局,其包括八个处理器模块,每个处理器模块具有相应的液冷式冷板,液冷式冷板与其耦连的基于液体的冷却系统构成。该基于液体的冷却系统图示为还包括相关的冷却剂运送管,其用于方便液体冷却剂经过液冷式冷板;以及集管子组件,其便于将液体冷却剂分配至所述液冷式冷板,并且便于液体冷却剂从所述液冷式冷板返回。作为特定的例子,经过基于液体的冷却子系统的液体冷却剂是冷水。如所公知的那样,在执行将电子器件系统的发热电子部件的热量移走的任务时,各种液体冷却剂要比空气好得多,因此能够更有效地将部件维持在与增强的可靠性以及最佳性能相对应的理想温度。在设计和配置基于液体的冷却系统时,有利地构造这样的系统该系统能够使可靠性最大化,并且使泄漏的潜在风险最小化,同时还能满足给定的电子器件系统实施方式的所有其他的机械、电学以及化学要求。这些更为耐用的冷却系统在其组装和实施时具有独特的问题。例如,一种组装方案是利用该电子器件系统内的多个配件,并且使用挠性的塑料或橡胶管来连接集管、冷板、泵以及其他部件。不过这种方案可能不能满足既定客户要求的规格,并且不能满足可靠性的需求。因此,本发明在一个方面中提出了耐用且可靠的基于液体的冷却系统,该冷却系统特别地预先配置且预先制造成一体式结构,以定位在具体的电子器件抽屉内。图8是根据本发明一个方面的电子器件抽屉以及一体式冷却系统的一个实施方式的等距视图。图示的该平面式服务器組件包括多层印刷电路板,待冷却的存储器DIMM槽以及各种电子部件物理地以及电学地附连至所述印刷电路板。在图示的冷却系统中,设置有供应集管以将来自单个入口的液体冷却剂分配至多个并行的冷却剂流路;并且返回集管将从该多个并行的冷却剂流路排出的冷却剂收集到单个出口中。每个并行的冷却剂流路包括一个或多个按照流路串联布置的冷板,所述冷板用于冷却一个或多个所述冷板机械地或热学地耦连于其上的电子部件。并行流路的数量和串联连接的液冷式冷板的数量例如取决于所希望的装置温度、可用的冷却剂温度和冷却剂流速、以及由每个电子部件散发的总热负荷。更具体地,图8示出了部分组装的电子器件系统813以及耦连至待冷却的主要发热部件(例如包括处理器芯片)的组装好的基于液体的冷却系统815。在该实施方式中,该电子器件系统构造成用于(或构造成作为)电子器件机架的电子器件抽屉,并且示例性地包括支持基板或平板805、多个存储器模块槽810(具有未示出的存储器模块(例如双列直插内存模块))、多排存储器支持模块832(每个都耦连有气冷式热沉834)、以及设置于该基于液体的冷却系统815的液冷式冷板820下方的多个处理器模块(未示出)。除了液冷式冷板820,该基于液体的冷却系统815包括多个冷却剂运送管,所述冷却剂运送管包括与相应的液冷式冷板820流体连通的冷却剂供应管840和冷却剂返回管842。冷却剂运送管840、842还连接至集管(或歧管)子组件850,所述集管(或歧管)子组件850便于将液体冷却剂分配至冷却剂供应管,并且使液体冷却剂从冷却剂返回管842返回。在该实施方式中,靠近电子器件抽屉813的前部831耦连至存储器支持模块832的气冷式热沉834在高度上要比靠近电子器件抽屉813的后部833耦连至存储器支持模块832的气冷式热沉834,矮。这种尺寸差用来容纳冷却剂运送管840、842,因为在该实施方式中集管子组件850位于电子器件抽屉的前部831处,而多个液冷式冷板820处于抽屉的中部。基于液体的冷却系统815包括预先配置的一体式结构,其包括多个(预组装的)液冷式冷板820,所述液冷式冷板820构造并且布置成间隔关系以与相应的发热电子部件接合。在该实施方式中,每个液冷式冷板820包括液体冷却剂入口和液体冷却剂出口以及附连子组件(即冷板/负载臂组件)。每个附连子组件用于将其相应的液冷式冷板820耦连至相关的电子部件以形成冷板和电子部件总成。在冷板的侧面上设置有对齐开口(即通孔),以在组装过程中接纳对齐销或定位榫,这一点在前面引入的名为"MethodofAssemblingaCoolingSystemforaMulti-ComponentElectronicsSystem"的专利申请中有进一步的描述。另外,在附连子组件内设置有连接器(或者导引销),其便于该附连子组件的使用。如图8所示,集管子组件850包括两个液体歧管即冷却剂供应集管852和冷却剂返回集管854,在一个实施方式中,这两个液体歧管通过支撑托架耦连到一起。在图8的一体式冷却结构中,冷却剂供应集管852与每个冷却剂供应管840以冶金方式结合并与之流体连通,而冷却剂返回集管854与每个冷却剂返回管852以冶金方式结合并与之流体连通。从集管子组件延伸出单个冷却剂入口851和单个冷却剂出口853,以用于耦连至电子器件机架的冷却剂供应歧管和返回歧管(未示出)。图8还示出了预配置的冷却剂运送管的一个实施方式。除了冷却剂供应管840和冷却剂返回管842,还设置有跨接管或线路841,其例如用来将一个液冷式冷板的液体冷却剂出口连接至另一个液冷式冷板的液体冷却剂入口,使冷板以流体流串联的方式连接,且该对冷板经由相应的一组冷却剂供应和返回管接收和返回液体冷却剂。在一个实施方式中,冷却剂供应管840、跨接管841以及冷却剂返回管8"均预配置成由导热材料例如铜或铝形成的半刚性的管子,并且这些管子分别以流体密封的方式硬钎焊、软钎焊或者熔焊到集管子组件和/或液冷式冷板。这些管子针对具体的电子器件系统进行预配置,从而便于以与电子器件系统相接合的关系安装该一体式结构。电子器件机架内的发热电子部件的液体冷却能极大地促进将这些部件产生的热量移走。不过,在某些高性能系统中,被液体冷却的某些部件例如处理器散发的热量可能超出该液体冷却系统移走热量的能力。例如,完整配置的液冷式电子器件机架例如上面描述的那些可能散发大约72kW的热量。该热量中的一半可以由液体冷却剂利用例如前述的液冷式冷板移走。该热量中的另一半可能是由气冷式的存储器、电源等散发。鉴于电子器件机架在数据中心地板上的设置密度,来自电子器件机架的这种高的空气热负荷将会给已有的空气调节设备带来很大的压力。因此,本发明提出的一种方案是将气-液热交换器例如结合至电子器件机架的出气口侧,以将从电子器件机架排出的空气中23的热量移走。在本发明中提出将该方案与冷却电子器件机架内的某些主要发热部件的液冷式冷板相组合。为了提供需要数量的冷却剂,与该电子器件机架相关联地设置两个MCU,并且系统冷却剂以与系统冷却剂供向设置于该电子器件机架的一个或多个电子器件子系统内的液冷式冷板的流动相并行的方式从每个MCU被送至气-液热交换器。需要注意的是,如果需要,朝向各个液冷式冷板的系统冷却剂流可以是众多串联/并联设置中的任意一种。此外,对于高有效性系统,下面描述不管电子器件机架中的一个模块化冷却单元是否失效均保持另一个模块化冷却单元运行的技术。这允许向待液体冷却的机架的一个或多个电子器件子系统连续地提供系统冷却剂。为了便于电子器件机架内的主要发热电子部件的液体冷却,(在检测到一个MCU或两个MCU失效时)使用一个或多个隔离阀来切断朝向气-液热交换器的流动,从而保存用于直接冷却电子器件子系统的冷却剂。下面参考图9至图13的系统和方法的实施方式对本发明的上面概述的方面作进一步说明。图9示出了系统的一个实施方式,其中,电子器件机架900包括多个发热电子器件子系统910,发热电子器件子系统910使用包括至少两个模块化冷却单元(MCU)920、930(分别被标以"MCU1,,和"MCU2")的冷却系统进行液体冷却。MCU被构造成并耦连成并行地向多个发热电子器件子系统提供系统冷却剂,以利于这些发热电子器件子系统的液体冷却。每个MCU920、930分别包括液-液热交换器921、931、第一冷却剂回路922、932以及第二冷却剂回路923、933。第一冷却剂回路922、932耦连成经由(例如)设备水供应线路440和设备水返回线路441接收冷的冷却剂例如设备冷却剂。每个第一冷却剂回路922、932使流经其中的冷的冷却剂中的至少一部分经过相应的液-液热交换器921、931。每个第二冷却剂回路923、933向电子器件机架900的多个发热电子器件子系统910提供冷却的系统冷却剂,并且经由相应的液-液热交换器921、931将所述多个发热电子器件子系统910的热量排至第一冷却剂回路922、932中的冷的冷却剂。笫二冷却剂回路923、933包括相应的冷却剂供应线路924、934,冷却剂供应线路924、934将来自液-液热交换器921、931的冷却的系统冷却剂供应至系统冷却剂供应歧管940。系统冷却剂供应歧管940(例如使用耦连至系统冷却剂供应歧管的相应端口的快速连接接头)经由挠性供应软管941耦连至电子器件机架900的所述多个发热电子器件子系统910。类似地,第二冷却剂回路923、933包括将系统冷却剂返回歧管950耦连至相应的液-液热交换器921、931的系统冷却剂返回线路925、935。系统冷却剂经由将发热电子器件子系统耦连至系统冷却剂返回歧管950的挠性返回软管951从多个发热电子器件组件910排出。在一个实施方式中,所述返回软管可以经由快速连接接头耦连至系统冷却剂返回歧管的相应端口。进一步地,在一个实施方式中,所述的多个发热电子器件子系统均包括相应的基于液体的冷却子系统(例如上面结合图7和图8所描述的那些),所述基于液体的冷却子系统耦连至挠性供应软管941和挠性返回软管951,以利于设置于该电子器件子系统内的一个或多个发热电子部件的液体冷却。除了并行地向电子器件机架的多个发热电子器件子系统供应系统冷却剂以及并行地将来自电子器件机架的多个发热电子器件子系统的系统冷却剂排放,MCU920、930还并行地向例如设置用来冷却从电子器件机架的进气口側向其出气口侧流经该电子器件机架的空气的气-液热交换器960提供系统冷却剂。作为示例,气-液热交换器960是设置于电子器件机架900的出气口侧的后门热交换器。进一步地,在一个示例中,气-液热交换器960的尺寸能够冷却几乎所有的从电子器件机架900排出的空气,从而降低包含该电子器件机架的数据中心的空气调节需求。在一个示例中,数据中心中的多个电子器件机架均设置有例如此处所述的并且在图9中示出的冷却系统。在图9的实施方式中,系统冷却剂经由将系统冷却剂供应歧管940与气-液热交换器960耦连的冷却剂供应线路961、以及将该气-液热交换器与系统冷却剂返回歧管950耦连的冷却剂返回线路962而流向气-液热交换器960和从气-液热交换器960流出。可以在气-液热交换器960的入口处和出口处以及/或者系统冷却剂供应和返回歧管的对应端口处设置快速连接接头,以便于冷却剂供应线路961和冷却剂返回线路962的连接。在一个实施方式中,假定在要求的设计参数内,图示的两个MCU中的一个MCU的尺寸不能够用作用来移走多个发热电子器件子系统和气-液热交换器这两者的全部热负荷的主MCU(另一个MCU为备用MCU)。因此,在正常操作时这两个MCU920、930并行地起作用。这也确保了冷却系统的冗余措施。如图所示,冷却系统还包括系统控制器970、MCU1控制器980以及MCU2控制器990,其一起配合以监控每个MCU的系统冷却剂温度,并且在检测到一个MCU失效则自动地隔断气-液热交换器960(并且确保失效的MCU停止运转),从而通过剩下的运行的MCU而避免降低对于机架的电子器件子系统系统的冷却剂的冷却性能的降低。在一个实施方式中,MCU1控制器和MCU2控制器是各自均与相应的MCU相关联的控制卡。如图所示,系统控制器970耦连至MCU1控制器和MCU2控制器。MCU1控制器980耦连至温度传感器T,981,该温度传感器T,981设置用来感知系统冷却剂供应线路924内的(例如靠近MCU1920内的液-液热交换器921的冷却剂出口的)系统冷却剂的温度。另外,MCU1控制器980耦连至电磁致动的隔离阀982,在图示的实施方式中,该隔离阀982设置于将系统冷却剂供应歧管940与气-液热交换器960以流体连通的方式耦连的冷却剂供应线路961内。类似地,MCU2控制器9卯耦连至MCU2930、i殳置用来感知系统冷却剂供应线路934内的系统冷却剂温度的第二温度传感器T2991、以及第二隔离阀S2992,在图示的示例中,该第二隔离阀S2992耦连至将气-液热交换器960与系统冷却剂返回歧管950耦连的冷却剂返回线路962。图IO至图13是示出由系统控制器970、MCU1控制器980以及MCU2控制器990执行的处理的流程图。表l描述了图10至图13的示例性流程图中所用的变量、以及当该冷却系统正常运行时每个变量的可能的值和初始条件。表1<table>tableseeoriginaldocumentpage27</column></row><table>在图10至图13中,这些变量还进一步地附带有数字"l"或数字"2",其分别代表该变量是应用于第一温度传感器或第二温度传感器、第一或第二MCU、或者第一或第二隔离阀。在下面的论述中,尽管参考系统控制器970(图9)和MCU1控制卡980和MCU2控制卡990内的处理进行描述,但是本领域人员将会认识到,此处所描述的处理很容易就能通过与每个温度传感器、隔离阀和MCU耦连的单个控制器来执行。在图示的实施方式中,图10和图12示出了系统控制器970内的执行的处理,而图ll示出了MCU1控制器980的处理,图13示出了MCU2控制器990的处理(都是示例的方式)。从图IO开始,系统控制器从MCU1控制器接收变量TS1作为输入1000,变量TS1指示从MCU1输出的系统冷却剂是否符合规定(即是否在限定的范围内)。该系统控制器开始确定MCU1是否在运行(即变量ST1是否等于1)1005。如果是"否",则处理返回MCU1控制器1030,并且系统控制器将当前的ST1和SV1值发送回MCU1控制器。如果MCU1正在运行,则系统控制器确定温度传感器Tl感知的温度是否符合规定(即TS1是否等于1)1010。如果是"是",则处理返回至MCU1控制器1030。如果由温度传感器Tl感知的系统冷却剂温度不符合规定,则系统控制器确定MCU2是否已经停止运行(即ST2是否等于0)1015。如果是"否",则将变量ST1设定为0,以表示MCU1应该被停止运行1020,并且将变量SV1设定为0以直接关闭隔离阀S11025。这些新的值返回给MCU1控制器1030,MCU1控制器对这些新的值进行处理,这一点将在后文描述。如果MCU2已经被停止运行,则处理判断隔离阀Sl是否已经关闭(FV1是否等于1)1035。如果是"否",则将变量SV1设定为0以指示关闭隔离阀S11040,之后处理返回至MCU1控制器,且新的SV1值实现隔离阀Sl的关闭。如果隔离阀S1已经被关闭,则系统控制器将变量ST1设定为等于0以使MCU1停止运行1045,并且发出警报(例如给数据中心操作人员)以指示相关电子器件机架的冷却系统正在停止运行1050,之后处理返回至MCU1控制器以实现MCU1停止运行。如前所述的,图11示出了由MCU1控制器980(图9)执行的处理的一个实施方式。MCU1控制器接收来自系统控制器的变量ST1和SV1作为输入1100,并且初始判断MCU1是否已经停止运行(FS1是否等于1)1105。如果是"是",则处理返回至系统控制器1145。如果是"否",则处理确定MCU1是否要停止运行(ST1是否等于0)1110。如果是"是",MCU1控制器使MCU1停止运行1115,并且将变量FS1设定为等于11120,指示MCU1已经停止运行,之后处理返回到系统控制器1145。如果不准备使MCU1停止运行,则处理确定隔离阀Sl是否已经关闭(FV1是否等于0)1125。如果是"是,,,则处理等待一段时间t1130,然后读取温度传感器1^1135。作为示例,在运行中时间t可以是15-30秒。然后处理确定温度传感器T1的值是否符合规定(例如,Tl是否大于预定的可接受的下限(LL)并且小于预定的可接受的上限(UL))1140。如果是"否",则将变量TS1设定为0,以指示系统冷却剂温度不符合规定1150,并且处理返回到系统控制器1145。根据确定步骤1125,如果隔离阀Sl并未关闭,则处理确定隔离阀Sl是否要关闭1155。如果是"否",则处理等待一段时间t,然后如上所述地进行。否则,MCU1控制器关闭隔离阀Sl1160,并且设定变量FV1等于11165,并且使处理控制返回至系统控制器1145。如前所述,图12示出了关于MCU2控制器的系统控制器处理。如上面结合图10所描述的,系统控制器从MCU2控制器接收变量TS2作为输入1200,其指示第二系统冷却剂温度是否符合规定(即是否在预定的范围内)。该系统控制器初始确定MCU2是否在运行(ST2是否等于l)。如果是"否",则处理返回至MCU2控制器1230,且系统控制器将当前的ST2和SV2值发送回MCU2控制器。如果MCU2正在运行,则系统控制器确定温度传感器T2感知的温度是否符合规定(TS2是否等于1)1210。如果是"是",则处理返回至MCU2控制器1230。如果由温度传感器T2感知的系统冷却剂温度不符合规定,则系统控制器确定MCU2是否已经停止运行(ST2是否等于0)1215。如果是"否",则将变量ST2设定为0以表示MCU2应当被停止运行1220,并且将变量SV2设定为0以直接关闭隔离阀S21225。这些新的值返回给MCU2控制器1230,MCU2控制器处理这些新的值,这一点在后文描述。如果MCU2已经停止运行,则处理确定隔离阀S2是否已经关闭(FV2是否等于1)1235。如果是"否",则将变量SV2设定为0以指示关闭隔离阀S21240,之后处理返回至MCU2控制器,且新的SV2值将隔离阀S2关闭。如果隔离阀S2已经关闭,则系统控制器将变量ST2设定为等于0以关闭MCU21245,并且发出警报(例如给数据中心操作人员)指示相关电子器件机架的冷却系统正在停止运行1250,之后处理返回MCU2控制器以实现MCU2停止运行。图13示出了通过MCU2控制器执行的处理的一个实施方式。MCU2控制器从系统控制器接收变量ST2和SV2作为输入1300,并且初始确定MCU2是否已经停止运行(即FS2是否等于1)1305。如果是"是",则处理返回至系统控制器1345。如果是"否",则处理确定MCU2是否要停止运行(ST2是否等于0)1310。如果是"是",MCU2控制器使MCU2停止运行1315,并且将变量FS2设定为等于11320,指示MCU2已经停止运行,之后处理返回到系统控制器1345。如果不准备使MCU2停止运行,则处理确定隔离阀S2是否已经关闭(FV2是否等于0)1325。如果是"是,,,则处理等待一段时间t1330,然后读取温度传感器T21335。作为示例,在运行中时间t可以是15-30秒。然后处理确定温度传感器T2的值是否符合规定(例如,T2是否大于预定的可接受的下限(LL)并且小于预定的可接受的上限(UL))1340。如果是"否",则将变量TS2设定为0,以指示系统冷却剂温度不符合规定1350,并且处理返回到系统控制器1345。根据确定步骤1325,如果隔离阀S2并未关闭,则处理确定隔离阀S2是否要关闭1355。如果是"否",则处理等待一段时间t,然后如上所述地进行。否则,MCU2控制器关闭隔离阀S21360,并且设定变量FV2等于11365,并且使处理控制返回至系统控制器1345。本领域技术人员从上面的描述中将能认识到,冷却剂控制阀操作的各个方面以及图中所示的程序可以通过提供例如设置在冷却剂供应设备内的适当控制器并且使用耦连至控制器的电磁操作的控制阀而自动化。更具体地说,上面给出的具体描述是结合能够在计算机、网络或者计算机群上执行的程序而进行的论述。这些程序上的描述以及图示可以被本领域技术人员使用,从而将其工作实质最有效地传递给其他的本领域技术人员。它们可以在硬件或软件、或者这两者的组合中执行。这里方法整体上构思为是实现期望结果的步骤的顺序。这些步骤是那些需要对物理量进行操纵的物理处理。通常,尽管不是必要地,这些物理量采用能够存储、传递、組合、对比或其他处理的电或磁信号的形式。主要出于乂>用的原因,有时将这些信号称为位、值、元件、符号、字符、术语、数字、对象、属性等证明是方便的。不过,需要注意的是,所有这些和类似的术语将与适当的物理量相关联,并且仅仅是应用于这些量的方便标签。另外,要进行的处理经常用通常与操作人员进行的手动操作相关联的的术语来指代,例如"关闭"或"打开"。操作人员的这种介入在本文中所描述的、形成本发明一部分的操作中并不是必须的;这些操作可以作为自动机器操作来实施。可用于执行本发明的操作的机器包括多用途的数字计算机或者类似的装置。本发明的各个方面优选在高级程序语言或者面向对象的编程语言中执行以与计算机通信。不过,如果期望的话,本发明的各个方面可以在汇编语言或者机器语言中执行。在任何情况下,所述语言都可以是编译性语言或者解释性语言。本发明可以实施为包括记录介质的机构或者计算机程序产品。这种机构或者计算机程序产品可以包括但不限于该程序的CM-ROM、磁盘、磁带、硬盘、计算机RAM或ROM以及/或者电子的、磁的、光学的、生物的或者其他类似的实施方式。事实上,该机构或者计算机程序产品可以包括任意固体的或者流体的传输介质一磁的或者光学的等,其用于存储或者传输信号,所述信号能够被用来控制多用途或者特殊用途可编程计算机的根据本发明方法的操作的机器读取;并且/或者还用来构造其根据本发明系统的部件。本发明的各个方面可以在一系统中实施。系统可以包括包括处理器和内存装置以及可选的存储装置的计算机、例如视频显示器的输出装置以及/或者例如键盘或者计算机鼠标的输入装置。而且,系统可以包括互联的计算机网络。计算机既可以是独立式(例如传统的桌上型个人计算机),也可以结合到另外的环境中(例如部分集群的计算环境)。该系统可以针对需要的目的特定地构造以进行例如本发明的方法步骤,或者其可以包括一个或多个多用途计算机,这些计算机可以由计算机中存储的根据本发明教导的计算机程序选择性地致动或者重新配置。本发明所提出的这些程序本质上并不涉及特定的计算环境。由所给出的描述,用于各种该系统的所需结构将是显而易见的。本发明的一个或多个方面的性能可以在软件、固件、硬件或者其一些组合中实施。本发明的一个或多个方面可以包括在具有例如计算机可用介质的产品(例如一个或多个计算程序产品)的某些部分中。该介质具有例如计算机可读程序代码装置或者逻辑(例如指令、代码、命令等)以提供和促进本发明的性能。产品的所述某些部分可以作为计算机系统的一部分,或者单独地出售。另外,可以提供至少一个程序存储装置,该程序存储装置能够被实施至少一个指令程序的机器读取并且由该机器执行,以执行本发明的能力。本文中示出的流程图仅仅是示例。在不脱离本发明的精神的情况下对本文中描述的这些图或者步骤(或操作)可以有多种变化。例如,这些步骤可以以不同的顺序执行,或者可以添加、删减或者改动步骤。所有这些变体都被认为是所主张发明的一部分。尽管这里已经详细示出和描述了优选实施例,但是对于本领域技术人员而言很明显,在不脱离本发明的精神之下能做出各种变型、增加、替代等,并且因此这些视为处于本发明如所附权利要求限定的范围内。权利要求1.一种利于冷却电子器件的系统,所述系统包括电子器件机架,其包括至少一个发热电子器件子系统,并且包括分别能够使外部空气进入和排出的进气口侧和出气口侧;至少两个模块化冷却单元(MCU),其与所述电子器件机架相关联,并且构造成并行地向所述至少一个发热电子器件子系统提供系统冷却剂,以利于冷却所述至少一个发热电子器件子系统,其中,所述至少两个MCU中的每个MCU包括液-液热交换器、第一冷却剂回路和第二冷却剂回路,并且,在运行时,每个MCU的所述第一冷却剂回路从源头接收冷的冷却剂并且使所述冷的冷却剂中的至少一部分经过所述液-液热交换器,而所述第二冷却剂回路向所述至少一个发热电子器件子系统提供冷却的系统冷却剂,并且在所述液-液热交换器中将来自所述至少一个发热电子器件子系统的热量排至所述第一冷却剂回路中的冷的冷却剂;气-液热交换器,其与所述电子器件机架相关联,用于对经过所述电子器件机架的空气的至少一部分进行冷却,并且所述气-液热交换器耦连成从所述至少两个MCU接收系统冷却剂,并且将系统冷却剂排至所述至少两个MCU;至少一个隔离阀,其耦连成选择性地切断经过所述气-液热交换器的系统冷却剂流;以及至少一个控制器,其耦连至所述至少一个隔离阀,用于在检测到所述至少两个MCU中的一个MCU失效时自动地切断经过所述气-液热交换器的系统冷却剂流,其中,当运行时,所述至少两个MCU并行地向所述至少一个发热电子器件子系统提供冷却的系统冷却剂,以对所述至少一个发热电子器件子系统进行液体冷却;并且并行地向所述气-液热交换器提供冷却的系统冷却剂,用于冷却经过所述电子器件机架的空气的至少一部分,其中,在检测到所述至少两个MCU中的一个MCU失效时,所述至少一个控制器使用所述至少一个隔离阀来自动地切断经过所述气-液热交换器的系统冷却剂流,同时系统冷却剂经由至少一个剩下的运行的MCU继续流向所述至少一个发热电子器件子系统,以继续对所述至少一个发热电子器件子系统液体冷却。2.如权利要求l所述的系统,其还包括与所述电子器件机架相关联的系统冷却剂供应歧管和系统冷却剂返回歧管,所述系统冷却剂供应歧管和所述系统冷却剂返回歧管均以流体连通的方式与所述至少两个MCU耦连,以利于向所述至少一个发热电子器件子系统提供系统冷却剂,其中,所述气-液热交换器经由冷却剂供应线路耦连至所述系统冷却剂供应歧管以从所述系统冷却剂供应歧管接收系统冷却剂,并且经由冷却剂返回线路耦连至所述系统冷却剂返回歧管以将系统冷却剂排至所述系统冷却剂返回歧管,其中,当运行时,所述至少两个MCU并行地向所述系统冷却剂供应歧管提供冷却的系统冷却剂,并且并行地接收从所述系统冷却剂返回歧管排出的系统冷却剂,并且,一个发热i子器件;系统和所述气.:液热交换i。、、'3.如权利要求2所述的系统,其中,所述至少两个模块化冷却单元包括第一模块化冷却单元和第二模块化冷却单元,其中,所迷至少一个控制器包括第一模块化冷却单元控制器和第二模块化冷却单元控制器,其中,所述第一模块化冷却单元控制器和所述第二模块化冷却单元控制器分别监控所述第一模块化冷却单元和所述第二模块化冷却单元的运行。4.如权利要求3所述的系统,其还包括第一温度传感器和第二温度传感器,其中,所述第一温度传感器设置用来感知所述第一模块化冷却单元的在其液-液热交换器与所述系统冷却剂供应歧管之间的所述第二冷却剂回路中的系统冷却剂温度;而所述第二温度传感器设置用来感知所述第二模块化冷却单元的在其液-液热交换器与所述系统冷却剂供应歧管之间的所述第二冷却剂回路中的系统冷却剂温度,其中,位于预定温度范围之外的系统冷却剂温度由所述第一模块化冷却单元控制器或所述第二模块化冷却单元控制器标识为相应的第一模块化冷却单元或者第二模块化冷却单元失效。5.如权利要求4所述的系统,其中,所述至少一个隔离阀包括第一隔离阀和第二隔离阀,所述第一隔离阀由所述第一模块化冷却单元控制器控制,而所述第二隔离阀由所述第二模块化冷却单元控制器控制,其中,所述第一模块化冷却单元控制器便于经由所述第一温度传感器来检测位于所述预定温度范围之外的系统冷却剂温度,并且对此作出响应而关闭所述第一隔离阀从而切断经过所述气-液热交换器的系统冷却剂流;而所述第二模块化冷却单元控制器便于经由所述第二温度传感器来检测位于所述预定温度范围之外的系统冷却剂温度,并且对此作出响应而关闭所述第二隔离阀从而切断经过所述气-液热交换器的系统冷却剂流。6.如权利要求5所述的系统,其中,所述第一隔离阀耦连至所述冷却剂供应线路,以便于当所述第一温度传感器感知的系统冷却剂温度位于所述预定温度范围之外时自动切断流向所述气-液热交换器的系统冷却剂流;所述第二隔离阀耦连至所述冷却剂返回线路,以便于当所述第二温度传感器感知的系统冷却剂温度位于所述预定温度范围之外时自动切断经过所述气-液热交换器的系统冷却剂流。7.如权利要求3所述的系统,其中,所述至少一个控制器还包括系统控制器,所述系统控制器耦连至所述第一模块化冷却单元控制器和所述第二模块化冷却单元控制器,并且便于使所述至少两个MCU中的至少一个失效的MCU停止运行。8.如权利要求l所述的系统,其中,所述气-液热交换器设置于所述电子器件机架的所述出气口侧,以用于冷却从所述电子器件机架排出的空气,其中,所述电子器件机架还包括至少一个使空气移动的装置,所述至少一个使空气移动的装置便于外部气流经过所述电子器件机架,所述气-液热交换器使进入包含所述电子器件机架的数据中心的空气的温度降低,从而降低所述数据中心的空气调节需求,其中,所述电子器件机架还包括多个发热电子器件子系统,每个发热电子器件子系统包括至少一个发热电子部件,其中,所述利于冷却电子器件的系统还包括多个冷却子系统,每个冷却子系统包括至少一个液冷式冷板,每个液冷式冷板与所述多个发热电子器件子系统中的相应发热电子子系统的相应发热电子部件相关联,以利于对其冷却。9.如权利要求8所述的系统,其还包括由所述电子器件机架支撑并且设置在所述电子器件机架的进气口侧的系统冷却剂供应歧管和系统冷却剂返回歧管,所述系统冷却剂供应歧管和所述系统冷却剂返回歧管均以流体连通的方式与所述至少两个MCU耦连,以利于向所述多个冷却子系统提供系统冷却剂,其中,所述气-液热交换器经由冷却剂供应线路耦连至所述系统冷却剂供应歧管以从所述系统冷却剂供应歧管接收系统冷却剂,并且经由冷却剂返回线路耦连至所述系统冷却剂返回歧管以将系统冷却剂排至所述系统冷却剂返回歧管,其中,所述至少两个MCU设置于所述电子器件机架的下部,并且当运行时,所述至少两个MCU并行地向所述系统冷却剂供应歧管提供冷却的系统冷却剂,并且并行地接收从所述系统冷却剂返回歧管排出的系统冷却剂,并且,所述系统冷却剂供应歧管并行地将冷却的系统冷却剂供应至所述多个冷却子系统和所述气-液热交换器。10.—种数据中心,其包括多个电子器件机架,每个电子器件机架包括至少一个发热电子器件子系统以及分别能够使外部空气进入和排出的进气口侧和出气口侧;多个冷却系统,每个冷却系统与相应的电子器件机架相关联并且包括至少两个模块化冷却单元(MCU),其与所述电子器件机架相关联,并且构造成并行地向所述至少一个发热电子器件子系统提供系统冷却剂,以利于冷却所述至少一个发热电子器件子系统,其中,所述至少两个MCU中的每个MCU包括液-液热交换器、第一冷却剂回路和第二冷却剂回路,并且,在运行时,每个MCU的所述第一冷却经过所述液-液热交换器,而所述第二冷却剂回路向所述至少一个发热电子器件子系统提供冷却的系统冷却剂,并且在所述液-液热交换器中将来自所述相关电子器件机架的所述至少一个发热电子器件子系统的热量排至所述第一冷却剂回路中的冷的冷却剂;气-液热交换器,其与所述电子器件机架相关联,用于对经过所述电子器件机架的空气的至少一部分进行冷却,并且所述气-液热交换器耦连成从所述至少两个MCU接收系统冷却剂,并且将系统冷却剂排至所述至少两个MCU;至少一个隔离阀,其耦连成选择性地切断经过所述气-液热交换器的系统冷却剂流;以及至少一个控制器,其耦连至所述至少一个隔离阀,用于在检测到所述至少两个MCU中的一个MCU失效时自动地切断经过所述气-液热交换器的系统冷却剂流,其中,当运行时,所述至少两个MCU并行地向相关电子器件机架的所述至少一个发热电子器件子系统提供冷却的系统冷却剂,以对所述至少一个发热电子器件子系统进行液体冷却;并且并行地向所述气-液热交换器提供冷却的系统冷却剂,用于冷却经过相关电子器件机架的空气的至少一部分,其中,在检测到所述至少两个MCU中的一个MCU失效时,所述至少一个控制器使用所述至少一个隔离岡来自动地切断经过所述气_液热交换器的系统冷却剂流,同时系统冷却剂经由至少一个剩下的运行的MCU继续流向相关电子器件机架的所述至少一个发热电子器件子系统,以继续对所述至少一个发热电子器件子系统液体进行冷却。11.如权利要求IO所述的数据中心,其中,每个冷却系统的所述至少两个模块化冷却单元包括第一模块化冷却单元和第二模块化冷却单元,其中,每个冷却系统还包括第一温度传感器和第二温度传感器,所述第一温度传感器设置用来感知所述第一模块化冷却单元的在其液-液热交换器的出口附近的所述第二冷却剂回路中的系统冷却剂温度,而所述第二温度传感器设置用来感知所述第二模块化冷却单元的在其液-液热交换器的出口附近的所述第二冷却剂回路中的系统冷却剂温度,其中,感知到的系统冷却剂温度位于预定温度范围之外代表相应的第一模块化冷却单元或者笫二模块化冷却单元失效。12.如权利要求11所述的数据中心,其中,每个冷却系统的所述至少一个隔离阀包括第一隔离阀和第二隔离阀,所述第一隔离阀和所述第二隔离阀均设置成当所述至少一个控制器检测到所述第一模块化冷却单元或第二模块化冷却单元失效时便于切断流经所述气-液热交换器的系统冷却剂流。13.如权利要求12所述的数据中心,其中,每个冷却系统还包括系统冷却剂供应歧管和系统冷却剂返回歧管,所述系统冷却剂供应歧管和所述系统冷却剂返回歧管均以流体连通的方式与所述至少两个MCU耦连,以利于向相关电子器件机架的所述至少一个发热电子器件子系统提供系统冷却剂,其中,所述气-液热交换器经由冷却剂供应线路耦连至所述系统冷却剂供应歧管以从所述系统冷却剂供应歧管接收系统冷却剂,并且经由冷却剂返回线路耦连至所述系统冷却剂返回歧管以将系统冷却剂排至所述系统冷却剂返回歧管,其中,当运行时,所述至少两个MCU并行地向所述系统冷却剂供应歧管提供冷却的系统冷却剂,并且并行地接收从所述系统冷却剂返回歧管排出的系统冷却剂,并且,所述系统冷却剂供应歧管将冷却的系统冷却剂供应至相关电子器件机架的所述至少一个发热电子器件子系统和所述气-液热交换器,并且所述第一隔离阀和所述第二隔离阀与所述冷却剂供应线路或所述冷却剂返回线路中的至少一个流体连通地设置。14.一种利于冷却电子器件机架的方法,该方法包括冷却电子器件机架的至少一个发热电子器件子系统,所述电子器件机架包括分别能够使外部空气进入和排出的进气口侧和出气口侧,该冷却步骤包括使用与所述电子器件机架相关联的至少两个模块化冷却单元(MCU)并行地向所述电子器件机架的所述至少一个发热电子器件子系统提供系统冷却剂,所述至少两个MCU中的每个MCU包括液-液热交换器、第一冷却剂回路和第二冷却剂回路,并且,在运行时,每个MCU的所述第一冷却剂回路从源头接收冷的冷却剂并且使所述冷的冷却剂中的至少一部分经过所述液-液热交换器,而所述第二冷却剂回路便于向所述电子器件机架的所述至少一个发热电子器件子系统提供冷却的系统冷却剂,并且在所述液-液热交换器中将来自所述至少一个发热电子器件子系统的热量排至所述第一冷却剂回路中的冷的冷却剂;以及利用与所述电子器件机架相关联地设置的气-液热交换器来对经过所述电子器件机架的空气的至少一部分进行冷却,所述气-液热交换器耦连成从所述至少两个MCU接收系统冷却剂,并且将系统冷却剂排至所述至少两个MCU;以及监控所述至少两个MCU中的MCU的失效,并且一旦检测到所迷至少两个MCU中的一个MCU失效就自动地切断经过所述气-液热交换器的系统冷却剂流,同时继续经由至少一个剩下的运行的MCU向所述至少一个发热电子器件子系统提供系统冷却剂流,以继续对所述至少一个发热电子器件子系统液体冷却。15.如权利要求14所述的方法,其还包括自动确定所述至少两个MCU中的哪个MCU失效,并且自动地使该失效的MCU停止运行,同时继续运行至少一个剩下的运行的MCU,以向所述电子器件机架的所述至少一个发热电子器件子系统提供冷却的系统冷却剂,以对所述至少一个发热电子器件子系统液体冷却。16.如权利要求14所述的方法,其中,所述使用还包括使用与所述电子器件机架相关联的系统冷却剂供应歧管和系统冷却剂返回歧管,所述系统冷却剂供应歧管和所述系统冷却剂返回歧管均以流体连通的方式与所述至少两个模块化冷却单元耦连,以利于向所述至少一个发热电子器件子系统提供系统冷却剂,其中,所述利用还包括经由冷却剂供应线路将来自所述系统冷却剂供应歧管的系统冷却剂提供给所述气-液热交换器,并且经由冷却剂返回线路将来自所述气_液热交换器的系统冷却剂排放至所述系统冷却剂返回歧管,其中,所述冷却剂供应线路或冷却剂返回线路中的至少一个具有与之相关联的至少一个隔离阀,所述至少一个隔离阀便于在检测到所述至少两个MCU中的至少一个MCU失效时后自动切断经过所述气-液热交换器的系统冷却剂流。17.如权利要求16所述的方法,其中,所述监控还包括监控所述至少两个MCU中的笫一MCU的在其液-液热交换器与所述系统冷却剂供应歧管之间的第二冷却剂回路中的第一系统冷却剂温度;并且监控所述至少两个MCU中的第二MCU的在其液-液热交换器与所述系统冷却剂供应歧管之间的第二冷却剂回路中的第二系统冷却剂温度;其中,当所述第一系统冷却剂温度或所述第二系统冷却剂温度位于预定的温度范围之外时,所述至少两个MCU中的相应的第一或第二MCU被认为失效并且被自动地切断,并自动地切断经过所述气-液热交换器的系统冷却剂流。18.如权利要求16所述的方法,其中,所述自动切断包括使用第一隔离阀或第二隔离阀中的至少一个,所述第一隔离阀与所述至少两个MCU中的第一MCU相关联,所述第二隔离阀与所述至少两个MCU中的第二MCU相关联,其中,所述自动切断还包括在检测到所述第一MCU失效时自动地关闭所述第一隔离阀或者在检测到所述第二MCU失效时自动地关闭所述第二隔离阀。19.如权利要求18所述的方法,其还包括在所述第一MCU和所述第二MCU均失效时发出警报信号,以指示停止冷却。20.如权利要求14所述的方法,其中,所述监控还包括在切断经过所述气-液热交换的系统冷却剂流之后等待一段时间t,然后感知所述至少两个MCU中的至少一个第二冷却剂回路中的系统冷却剂温度,并且确定感知到的该系统冷却剂温度是否在预定的温度范围内,如果不在预定的温度范围内,则发出信号以使包括具有感知到的系统冷却剂温度的至少一个第二冷却剂回路的至少一个MCU停止运行。全文摘要提供了一种利于液冷式电子器件机架冷却的系统和方法,所述电子器件机架包括发热电子器件子系统,从该机架的进气口侧流向出气口侧的空气流经该发热电子器件子系统。第一和第二模块化冷却单元(MCU)与所述机架相关联,并且构造成向电子器件机架提供系统冷却剂以对其冷却。系统冷却剂供应和返回歧管与所述MCU流体连通,以便于向电子器件子系统提供系统冷却剂,并且向与该机架相关联的气-液热交换器提供系统冷却剂以冷却经过机架的空气。控制器监控系统冷却剂,并且在检测到所述MCU中的一个失效以后利用至少一个隔离阀自动切断经过热交换器的系统冷却剂流,同时允许剩下的运行的MCU向电子器件子系统提供系统冷却剂以对其液体冷却。文档编号G06F1/20GK101442893SQ20081018126公开日2009年5月27日申请日期2008年11月18日优先权日2007年11月19日发明者小弗朗西斯·R·克鲁格,小迈克尔·J·埃尔斯沃斯,爱德华·J·塞米纳罗,罗博特·K·马尔拉迪,罗格·R·施密特申请人:国际商业机器公司