数据中心压力异常检测和修复的制作方法

文档序号:11236898阅读:661来源:国知局
数据中心压力异常检测和修复的制造方法与工艺



背景技术:

在利用针对环境控制的热通道容器单元的数据中心中,宏观压力问题偶尔发生。例如,如果操作用于使一组服务器冷却的风扇使得空气以超过可以从其移除空气的速率的速率吹到热通道容器单元中,那么热通道容器单元将相对于相邻的(一个或多个)冷通道变得过压。随着压力增加,热通道容器单元中的热空气可以将容器面板和其他开口推出到(一个或多个)冷通道中并且吹到附近的服务器中。这些服务器可以超过其指定热值和导致热警报,或可能由于过热而变得损坏。热通道容器单元中的过度压力还可以使得其他环境控制部件被损坏。例如,用于从热通道容器单元中汲取热空气的排气扇可以潜在地由过度压力而损坏。



技术实现要素:

在此描述了可操作用于自动地检测数据中心内的压力异常、当检测到这样的异常时生成警报、以及发起修复异常的动作的系统。根据实施例,系统监视用于消散由数据中心中的一个或多个服务器生成的热的多个风扇中的每个风扇。风扇可以包括例如将空气吹到热通道容器单元中的服务器风扇或刀片机箱风扇。通过这样的监视,系统获得指示风扇中的每个风扇的实际速度如何与风扇中的每个风扇的目标速度有关的数据。系统然后将所获得的数据与参考数据相比较,针对多个风扇中的每个风扇,参考数据指示在基本上中性压力的环境中风扇的实际速度如何与风扇的目标速度有关。基于比较,系统确定在数据中心中是否存在压力异常。如果系统确定在数据中心中存在压力异常,那么系统可以生成警报和/或采取修复异常的步骤。这样的步骤可以包括例如修改风扇中的一个或多个风扇的操作方式和/或修改服务器中的一个或多个服务器的操作方式。

提供该概述以引入以在详细描述中下文进一步描述的简化形式的概念的选择。该概述不旨在标识所要求保护的主题的关键特征或基本特征,其也不旨在用于限制所要求保护的主题的范围。此外,应注意到,要求保护的主题不限于本文档的详细描述和/或其他章节中所描述的特定实施例。仅出于说明的目的,在本文中呈现了这样的实施例。基于在此所包含的教导,附加的实施例对于相关领域的技术人员而言将是明显的。

附图说明

并入本文并且形成说明书的一部分的附图图示了本发明的实施例,并且连同说明书进一步用于解释本发明的原理并且使得相关领域的技术人员能够制造和使用本发明。

图1是可以被实现在数据中心中并且可以受益于在此所描述的压力异常检测和修复实施例的示例热通道容器系统的透视图。

图2是可以被实现在数据中心中并且可以受益于在此所描述的压力异常检测和修复实施例的另一示例热通道容器系统的侧视图。

图3是能够通过监视数据中心中的服务器风扇来自动地检测压力异常并且响应于这样的检测而采取某些动作的示例数据中心管理系统的框图。

图4是能够通过监视数据中心中的刀片服务器机箱风扇来自动地检测压力异常并且响应于这样的检测而采取某些动作的示例数据中心管理系统的框图。

图5描绘了用于生成针对多个风扇中的每个风扇指示在基本上中性压力的环境中风扇的实际速度如何与风扇的目标速度有关的风扇参考数据的方法的流程图。

图6描绘了根据实施例的用于自动地检测数据中心内的压力异常的方法的流程图。

图7描绘了根据实施例的用于响应于检测到数据中心内的压力异常而自动地采取动作的方法的流程图。

图8是可以用于实现各种实施例的示例基于处理器的计算机系统的框图。

根据当结合在其中相同参考符号始终标识对应的元件的附图以下所阐述的详细描述,本发明的特征和优点将变得更明显。在附图中,相同参考数字通常指示相同的功能上类似和/或结构上类似的元件。元件首先出现的附图由对应的参考符号中的最左边的(一个或多个)数字指示。

具体实施方式

i.介绍

以下详细描述参考图示本发明的示例性实施例的附图。然而,本发明的范围不限于这些实施例,而是相反由所附的权利要求限定。因此,超过附图中所示的那些实施例的实施例(诸如所图示的实施例的修改版本)可以仍然由本发明涵盖。

说明书中对“一个实施例”、“实施例”、“示例实施例”等的引用指示所描述的实施例可以包括特定特征、结构或特性,但是每个实施例可以不必包括特定特征、结构或特性。而且,这样的短语不必参考相同实施例。而且,当结合实施例描述特定特征、结构或特性时,应提出其在相关领域的技术人员的知识内结合无论是否明确描述的其他实施例来实现这样的特征、结构或特性。

在此描述了可操作用于自动地检测数据中心内的压力异常、当检测到这样的异常时生成警报、以及发起修复异常的动作的系统。根据实施例,系统监视用于消散由数据中心中的一个或多个服务器生成的热的多个风扇中的每个风扇。风扇可以包括例如将空气吹到热通道容器单元中的服务器风扇或刀片机箱风扇。通过这样的监视,系统获得指示风扇中的每个风扇的实际速度如何与风扇中的每个风扇的目标速度有关的数据。系统然后将所获得的数据与参考数据相比较,针对多个风扇中的每个风扇,参考数据指示在基本上中性压力的环境中风扇的实际速度如何与风扇的目标速度有关。基于比较,系统确定压力异常是否存在于数据中心中。如果系统确定压力异常存在于数据中心中,那么系统可以生成警报和/或采取修复异常的步骤。这样的步骤可以包括例如修改风扇中的一个或多个风扇的操作方式和/或修改服务器中的一个或多个服务器的操作方式。

章节ii描述可以被实现在数据中心中的示例热通道容器系统和当使用这样的系统时可能出现的技术问题。章节iii描述示例数据中心管理系统,其可以通过自动地检测数据中心中的压力异常、提出关于这样的异常的警报以及采取修复这样的异常的动作来帮助解决这样的技术问题。章节iv描述可以被用于实现在此所描述的各种实施例的示例基于处理器的计算机系统。章节v描述一些附加的示例性实施例。章节vi提供一些结束语。

ii.示例热通道容器系统和与其相关联的问题

图1是可以被实现在数据中心中并且可以受益于在此所描述的压力异常检测和修复实施例的示例热通道容器系统100的透视图。出于各种原因,包括但不限于保护数据中心计算设备、节约能力并且通过管理气流降低冷却成本,热通道容器系统100可以被安装在数据中心中。热通道容器系统100仅代表一种类型的热通道容器系统。相关领域的技术人员将理解到,可以采取实现热通道容器系统的各种各样的其他方法,并且根据这样的其他方法所实现的热通道容器系统还可以受益于在此所描述的压力异常检测和修复实施例。

如在图1中所示,示例热通道容器系统100包括被布置在数据中心的地板102上的多个服务器机柜1061-10614。每个服务器机柜1061-10614被配置为容纳多个服务器。每个服务器具有至少一个冷进气口和至少一个热出气口。每个服务器位于服务器机柜中,使得其(一个或多个)冷进气口面对或暴露于两个冷通道112、114之一,而其(一个或多个)热出气口面对或暴露于热通道116。服务器机柜1061-10614的物理结构、容纳在其中的服务器和门108、110用于将冷通道112、114中的空气与热通道116中的空气隔离。然而其他结构或方法可以用于提供冷通道112、114与热通道116之间的隔离。例如,泡沫或某种其他材料可以被插入服务器与服务器机柜1061-10614的内壁之间,以提供冷通道112、114中的空气与热通道116中的空气之间的进一步的隔离。此外,在其中在服务器机柜1061-10614之间或服务器机柜1061-10614中的任一个与地板/天花板之间存在间隙的场景中,面板或其他物理障碍可以被安装以防止空气通过这样的间隙在热通道116与冷通道112、114之间流动。由这些各种结构在热通道周围创建的外壳可以被称为“热通道容器单元”。

冷却系统(在图1中未示出)产生被冷却的空气118,其经由地板102中的通风孔104循环到冷通道112、114的每个冷通道中。可以使用用于使被冷却的空气118循环到冷通道112、114中的各种其他方法。例如,被冷却的空气118可以经由服务器行的末尾处的壁中的通风孔或天花板中的通风孔而被循环到冷通道112、114的每个冷通道中。集成在被安装在服务器机柜1061-10614中的服务器内的风扇操作用于经由其冷进气口将被冷却的空气118汲取到服务器中。被冷却的空气118从服务器的内部部件吸收热,从而变为被加热的空气120。这样的被加热的空气120经由服务器热出气口由服务器风扇而被排出到热通道116中。

应注意到,朝向服务器部件汲取被冷却的空气118并且排出被加热的空气120远离服务器部件的风扇不需要被集成在服务器自身内,而是可以位于服务器外部。例如,在其中服务器包括被安装在刀片服务器机箱内的刀片服务器的场景中,刀片服务器机箱可以自身包括一个或多个风扇,其操作用于经由一个或多个机箱冷进气口朝向刀片服务器和其部件汲取被冷却的空气118并且经由一个或多个机箱热出气口排出被加热的空气120远离刀片服务器和其部件。

可以通过一个或多个排气扇或其他气流控制机制(在图1中未示出)从其汲取热通道116内的被加热的空气120。例如,被加热的空气120可以经由被布置在热通道116上的天花板中的通风孔从热通道116中汲取并且使用导管的系统在其他地方进行路由。取决于实现,被加热的空气120或其一部分可以被路由返回到冷却系统以便被冷却从而并且再循环到冷通道112、114中。被加热的空气120或其一部分还可以从数据中心被排放到外部世界或者在更冷的气候中重定向返回到数据中心或相邻建筑或空间中以提供加热。在任何情况下,基本上防止将被加热的空气120直接再循环到冷通道112、114中。这帮助确保汲取到服务器中的空气的温度被保持在不超过其操作规格的水平,从而避免对服务器的内部部件的损坏。热通道容器系统100的前述特征还可以提高数据中心的能量效率并且降低冷却成本。

图2是可以被实现在数据中心中并且可以受益于在此所描述的压力异常检测和修复实施例的另一示例热通道容器系统200的侧视图。与热通道容器系统100类似,热通道容器系统200也表示仅一种类型的热通道容器系统。

如在图2中所示出的,示例热通道容器系统200包括被布置在数据中心的地板202上的多个服务器机柜206。每个服务器机柜206被配置为容纳多个服务器。每个服务器具有至少一个冷进气口和至少一个热出气口。每个服务器位于服务器机柜206中,使得其(一个或多个)冷进气口面对或暴露于两个冷通道212、214之一,而其(一个或多个)热出气口面对或暴露于热通道216。服务器机柜206的物理结构和容纳在其中的服务器用于将冷通道212、214中的空气与热通道216中的空气隔离。然而其他结构或方法可以用于提供冷通道212、214与热通道216之间的隔离。例如,如在图2中进一步所示,面板208可以被安装在服务器机柜206的顶部与天花板204之间,以进一步将冷通道212、214中的空气与热通道216中的空气隔离。

计算机房空气调节器(crac)210产生被吹到在底板202下运行的一个或多个通道中的被冷却的空气218。虽然也可以使用用于将被冷却的空气218排放到冷通道212、214中的其他方式,但是这样的被冷却的空气218经由底板202中的通风孔222从这些(一个或多个)通道传递到冷通道212、214中。carc210可以表示例如空气冷却的crac、乙二醇冷却的crac或水冷却的crac。然而其他类型的冷却系统可以被用于产生被冷却的空气218,包括但不限于计算机房空气处理器(crah)和冷却器、抽吸的冷冻剂热交换器和冷却器或者直接或间接汽化冷却系统。

集成在被安装在服务器机柜206中的服务器内的风扇操作用于经由其冷进气口将被冷却的空气218汲取到服务器中。被冷却的空气218从服务器的内部部件吸收热,从而变为被加热的空气220。这样的被加热的空气220经由服务器热出气口由服务器风扇排出到热通道216中。朝向服务器部件汲取被冷却的空气218并且排出被加热的空气220远离服务器部件的风扇不需要被集成在服务器自身内,但是可以位于服务器外部(例如,这样的风扇可以是刀片服务器机箱的一部分)。

可以通过一个或多个排气扇或其他气流控制机制(未示出在图2中)从热通道216中汲取热通道216内的被加热的空气220。例如,被加热的空气220可以经由被布置在热通道216上的天花板204中的通风孔224从热通道216中汲取,并且经由一个或多个通道路由返回以被冷却从而再循环到冷通道212、214中。被加热的空气220的一部分还可以从数据中心被排放到外部世界或者在更冷的气候中重定向返回到数据中心或相邻建筑或空间中以提供加热。在任何情况下,基本上防止将被加热的空气220直接再循环到冷通道212、214中。这帮助确保汲取到服务器中的空气的温度被保持在不超过其操作规格的水平,从而避免对服务器的内部部件的损坏。热通道容器系统200的前述特征还可以提高数据中心的能量效率并且降低冷却成本。

为了获得期望的气流,热通道容器系统100、200可以各自被配置为维持热通道中的微负压。这可以例如在每时间单位期间,通过利用一个或多个排气扇从热通道中汲取比在相同时间单位期间通常被供应到其稍微更大体积的空气而被实现。通过维持热通道中的微负压,空气将倾向于从冷通道自然流动到热通道。而且,当微负压被维持在热通道中时,用于使服务器的内部部件冷却的服务器或刀片机箱风扇将不被要求与以下一样努力工作:其在热通道中的压力超过冷通道中的压力的情况下将进行在那些部件上吹或汲取空气。

然而,当一大组服务器或刀片机箱风扇开始协调操作时,可能发生问题,从而使得非常大数量的空气流动到热通道中。这可能出于各种原因发生。例如,这样的行为可能由冷通道中的周围温度的增加而引起(例如,如果冷通道中的正常周围温度是73°f,并且由于区域中的热波,数据中心使周围温度上升到85°f)。作为另一示例,这样的行为可能由用于控制服务器或刀片机箱风扇速度的算法的问题而引起。还可以存在其他原因。不管原因如何,到热通道中的这样的气流可以超过热通道容器系统的排气能力,从而在热通道中产生比在冷通道中更高的压力。如果操作用于从热通道汲取空气的一个或多个排气扇停止工作或变得不能够以空气正吹到热通道中的速率从热通道移除空气,则可能出现类似情况。

在这些类型的情况中,随着压力在热通道中增加,热通道容器单元中的被加热的空气可以从容器面板和其他开口推出到(一个或多个)冷通道中并且被汲取到附近的服务器中。这些服务器可以超过其指定热值和导致热警报或可能由于过热变得损坏。热通道容器单元中的过度压力还可以使得其他环境控制部件损坏。例如,用于从热通道容器单元中汲取热空气的排气扇可以潜在地由过度压力损坏。在以下章节中,将描述各种数据中心管理系统,其可以通过自动地检测包括热通道容器系统的数据中心中的压力异常并且在发生设备损坏之前采取修复这样的异常的动作来帮助解决这样的问题。

iii.执行自动化压力异常检测和修复的示例数据中心管理系统

图3是能够自动地检测数据中心中的压力异常并且响应于其而采取某些动作的示例数据中心管理系统300的框图。系统300可以例如并且非限制性地被实现为检测并且修复实现热通道容器系统(诸如上文参考图1所讨论的热通道容器系统100、上文参考图2所讨论的热通道容器系统200或某种其他类型的热通道容器系统)的数据中心中的压力异常。

如在图3中所示,数据中心管理系统包括计算设备302和多个服务器3061-306n,其中的每一个经由网络304被连接到计算设备302。计算设备302旨在表示基于处理器的电子设备,其被配置为执行用于执行某些数据中心管理操作的软件,其中的一些操作将在此描述。计算设备302可以表示例如台式计算机或服务器。然而,计算设备302不是这样被限制,并且还可以表示其他类型的计算设备,诸如膝上型计算机、平板计算机、上网本、可穿戴计算机(例如,头戴式计算机)等。

服务器3061-306n表示位于数据中心内的服务器计算机。一般而言,服务器3061-306n的每个服务器被配置为执行包含将数据提供到其他计算机的操作。例如,服务器3061-306n中的一个或多个可以被配置为通过广域网(诸如因特网)将数据提供到客户端计算机。此外,服务器3061-306n中的一个或多个可以被配置为将数据提供到其他服务器(诸如服务器3061-306n中的任何其他那些服务器或者服务器3061-306n驻留在其内的数据中心内或外的任何其他服务器)。服务器3061-306n中的每个服务器可以包括例如专用类型的服务器,诸如web服务器、邮件服务器、文件服务器等。

网络304可以包括数据中心局域网(lan),其促进服务器3061-306n的每个服务器与计算设备302之间的通信。然而,该示例不旨在是限制性的,并且网络304可以包括适于促进计算设备之间的通信的任何类型的网络或网络的组合。(一个或多个)网络304可以包括例如并且非限制性地:广域网(例如,因特网)、个人局域网、私有网络、公共网络、分组网络、电路交换网络、有线网络、和/或无线网络。

如在图3中进一步所示,服务器3061包括多个部件。这些部件包括一个或多个服务器风扇330、风扇控制部件332、一个或多个风扇速度传感器334和数据中心管理代理336。将理解到,每个服务器3062-306n包括相同或者类似部件的实例,但是由于空间限制并且为了便于说明,这些尚未被示出在图3中。

(一个或多个)服务器风扇330包括操作以产生空气流的一个或多个机械设备。例如,每个服务器风扇330可以包括机械设备,其包括径向地附接到中心类似轮毂的部件并且可以与其旋转以产生空气流的多个刀片。每个服务器风扇330可以包括例如固定速度或可变速度的风扇。(一个或多个)服务器风扇330可操作用于出于消散由服务器3061的一个或多个部件生成的热的目的生成气流。可以生成热的服务器部件包括但不限于中央处理单元(cpu)、芯片集、存储器设备、网络适配器、硬盘驱动器、电源等。

在一个实施例中,服务器3061包括一个或多个冷进气口和一个或多个热出气口。进一步根据这样的实施例,每个服务器风扇330可以可操作用于经由(一个或多个)冷进气口将空气汲取到服务器3061中并且经由(一个或多个)热出气口从其排出空气。更进一步根据这样的实施例,(一个或多个)冷进气口可以面对或暴露于数据中心冷通道并且(一个或多个)热出气口可以面对或暴露于数据中心热通道。在该实施例中,每个服务器风扇330可操作用于从冷通道将被冷却的空气汲取到服务器3061中并且从其将被加热的空气排出到热通道中。

风扇控制部件332包括操作以控制每个服务器风扇330旋转速度的部件。风扇速度可以例如以转每分钟(rpm)表示,并且可以从0rpm(即,服务器风扇关闭)到某个上限范围变化。可以由特定服务器风扇实现的不同的风扇速度将取决于风扇类型而发生变化。风扇控制部件332可以被实现在硬件(例如,使用一个或多个数字和/或模拟电路)中、为软件(例如,在服务器3061的一个或多个服务器上执行的软件)或硬件和软件的组合。

风扇控制部件332可以实现用于控制每个服务器风扇330的速度的算法。例如,风扇控制部件332可以实现用于基于任何数目的可确定的因素选择针对每个服务器风扇330的目标风扇速度的算法。例如,可以基于由服务器3061内部、附近或与服务器3061相关联的温度传感器所感测的温度或者基于一个或多个服务器部件的使用的所确定的程度来选择目标风扇速度,虽然这些仅是几个示例。还可能的是,风扇控制部件332可以基于从数据中心管理工具或其他实体接收到的外部输入来选择针对每个服务器风扇330的目标风扇速度,如在此在其他地方将讨论的。

虽然仅单个风扇控制部件332被示出在图3中,但是可能的是,服务器3061可以包括多个风扇控制部件。例如,服务器3061可以包括不同的风扇控制部件,其操作以相应地控制不同的服务器风扇的速度。

(一个或多个)风扇速度传感器334包括一个或多个传感器,其操作用于确定每个服务器风扇330正操作的实际速度。特定服务器风扇330操作的实际速度可以与服务器风扇驱动以如由风扇控制部件332所确定地操作的目标速度不同。例如,虽然风扇控制部件332可以确定特定服务器风扇330应当驱动以2100rpm的速度操作,但是实际上特定服务器风扇330可以以2072rpm的速度操作。目标速度与实际速度之间的差可以归因于若干因素,包括服务器风扇自身的设计,驱动服务器风扇所使用的部件的设计以及服务器风扇正操作的环境条件。例如,如果在服务器3061的(一个或多个)热出气口处存在比在其冷进气口处存在更高的压力,则这可以使得(一个或多个)服务器风扇330以相对于期望的目标速度降低的实际速度操作。

可以用于确定风扇的速度的任何类型的传感器可以用于实现(一个或多个)风扇速度传感器334。在一个实施例中,(一个或多个)风扇速度传感器334包括一个或多个转速表,虽然该示例不旨在是限制性的。

数据中心管理代理336包括在服务器3061(未示出在图3中)的一个或多个处理器上执行的软件部件。通常,数据中心管理代理336执行使得远程执行的数据管理工具能够收集关于服务器3061的各种操作方面的信息并且使得远程执行的数据管理工具能够修改服务器3061的操作方式的操作。

数据中心管理代理336包括报告部件340。报告部件340可操作用于收集关于(一个或多个)服务器风扇330的操作的数据并且将这样的数据发送到远程执行的数据中心管理工具。这样的数据可以包括例如如在特定时间点或给定时间帧内由风扇控制部件332(或被配置为选择服务器风扇330将被驱动到的目标速度的其他部件)所确定的服务器风扇330的目标速度,以及如在相同时间点处或在相同时间帧内由风扇速度传感器334所检测的服务器风扇330的实际速度。

在实施例中,报告部件340操作以间歇地收集每个服务器风扇330的目标速度和实际速度并且将这样的目标速度和实际速度数据发送到远程执行的数据中心管理工具。例如,报告部件340可以操作以周期性地获得这样的数据并且将其提供到远程执行的数据中心管理工具。这样的数据收集和报告由报告部件340执行的确切时间和/或速度可以取决于实现是固定或可配置的。在实施例中,远程执行的数据中心管理工具可以指定这样的数据收集和报告应当何时和/或多久发生一次。数据收集和报告可以由报告部件340自动地执行并且数据可以然后被推送到远程执行的数据中心管理工具。备选地,仅当远程执行的数据中心管理工具针对数据请求(即,轮训)报告部件340时,数据收集和报告可以才仅由报告部件340执行。

如在此在其他地方将讨论的,由报告部件340传达给远程执行的数据中心管理工具的每个服务器风扇330的目标和实际速度数据可以由远程执行的数据中心管理工具被于确定压力异常是否存在于数据中心中。

数据中心管理代理336还包括服务器操作管理部件342。服务器操作管理部件342可操作用于从远程执行的数据中心管理工具接收指令,并且响应于这些指令而改变服务器3061的操作方式。如在此在其他地方将讨论的,服务器3061的操作方式的改变可以旨在修复或以减轻在服务器3061驻留在其中的数据中心内已经检测到的压力异常。服务器操作管理部件342可以改变服务器3061的操作方式的方式可以包括但不限于:改变(例如,降低)一个或多个服务器风扇330的速度;使得数据中心管理代理336开始监视内部服务器部件的温度并且报告给远程执行的数据中心管理工具(或增加这样的监视/报告发生的速率);终止在服务器3061上执行的至少一个过程和/或中断服务器3061的至少一个资源的使用(例如,按照将客户工作流迁移到另一服务器);降低被供应到服务器3061的一个或多个内部部件的功率量;或完全地关闭服务器3061。

如在图3中进一步所示,计算设备302包括数据中心管理工具310。数据中心管理工具310包括由计算设备302(未示出在图3中)的一个或多个处理器执行的软件部件。一般来说,数据中心管理工具310可操作用于从与那些服务器的目标和实际风扇速度有关的服务器3061-306n的每个服务器收集操作数据,并且使用这样的操作数据确定压力异常是否存在于那些服务器被位于其中的数据中心内。此外,数据中心管理工具310可操作用于响应于确定这样的压力异常存在(诸如生成警报和/或以旨在修复异常的方式改变服务器3061-306n中的一个或多个服务器的操作方式)而采取某些动作。

数据中心管理工具310包括风扇监视部件312、压力异常检测部件318以及压力异常响应部件320。为了执行其操作,数据中心管理工具310可操作用于访问实时风扇数据314和风扇参考数据316。实时风扇数据314和风扇参考数据316可以各自被存储在计算设备302内的易失性和/或非易失性存储器中,或者可以被存储在计算设备302外部并且通信地连接到其以用于从而访问的一个或多个易失性和/或非易失性存储器设备中。实时风扇数据314和风扇参考数据316可以各自是与数据中心管理工具310分离地存储,并且从而访问的数据或可以是关于数据中心管理工具310内部地存储(例如,在数据中心管理工具310的一个或多个数据结构内)的数据。

风扇监视部件312可操作用于从被安装在服务器3061-306n的每个服务器上的报告部件(例如,被安装在服务器3061上的报告部件340)收集信息,其中这样的信息包括关于服务器3061-306n的每个服务器上的一个或多个服务器风扇的操作信息。如先前所描述的,这样的信息可以包括针对服务器3061-306n上的每个所监视的服务器的目标速度和实际速度数据。风扇监视部件312将这样的操作信息存储为实时风扇数据314的一部分。这样的实时风扇数据314可以包括从服务器3061-306n接收到的原始目标和实际风扇速度数据,或者其可以包括其经处理的版本。例如,风扇监视部件312可以在将其存储为实时风扇数据314之前对原始目标和实际风扇速度数据执行某些操作(例如,过滤、时间平均、平滑、纠错等)。

压力异常检测部件318可操作用于将所获得的实时风扇数据314与风扇参考数据314相比较,以确定压力异常是否存在于服务器3061-306n驻留在其中的数据中心中。风扇参考数据314是针对由风扇监视部件312所监视的每个服务器风扇指示在基本上中性压力的环境中(即,在其中服务器的(一个或多个)冷进气口处的压力至少粗略地等于其(一个或多个)热出气口处的压力的环境中)服务器风扇的实际速度如何与服务器风扇的目标速度有关。通过将在服务器风扇的操作期间所获得的目标对实际速度数据与针对基本上中性压力的环境中的相同服务器风扇的参考目标对实际速度数据相比较,压力异常检测部件318能够确定压力异常是否存在于数据中心中。下面将关于图5和图6提供关于风扇参考数据314可以如何获得并且压力异常检测部件318如何能够通过将实时风扇数据314与风扇参考数据316相比较来检测压力异常的特定细节。

压力异常响应部件320可操作用于响应于检测到由压力异常检测部件318对压力异常,而自动地执行某些动作。例如,压力异常响应部件320可以生成警报或发送指令到服务器3061-306n中的一个或多个服务器以使得那些服务器改变其操作方式。这样的改变可以旨在修复压力异常。下面将关于图7提供关于可以响应于检测到压力异常而由压力异常响应部件320执行的自动响应的特定细节。

取决于实现,计算设备302可以位于与服务器3061-306n相同的数据中心中或者可以关于数据中心远程地定位。而且,可能的是,服务器3061-306n的各种子集可以位于不同的数据中心中。在这样的场景中,数据管理工具310可能能够检测不同的数据中心中的压力异常并且对相同内容作出反应或进行修复。

而且,虽然数据中心管理工具310被示出为计算设备302的一部分,但是在备选实现中,数据中心管理工具可以被安装并且被执行在服务器3061-306n中的任何一个或多个服务器上。例如,数据中心管理工具310的实例可以被安装并且被执行在服务器3061-306n之一上并且操作以针对服务器3061-306n执行压力异常检测和修复。备选地,数据中心管理工具310的实例可以被安装并且被执行在服务器3061-306n的多个子集的每个子集中的一个服务器上并且操作用于针对该子集中的服务器执行压力异常检测和修复。

图3描绘了在其中服务器风扇被监视并且从而所获得的信息用于检测压力异常的数据中心管理系统300。然而,可以根据实施例监视用于消散由数据中心中的服务器所生成的热的其他类型的风扇,并且从而所获得的信息还可以被用于检测压力异常。仅以示例的方式,图4描绘在其中刀片服务器机箱风扇被监视并且从而所获得的信息用于检测压力异常的备选数据中心管理系统400。

如在图4中所示,数据中心管理系统包括执行数据中心管理工具410的计算设备402和多个刀片服务器机箱4061-406n,其中的每一个经由网络404被连接到计算设备402。除了数据中心管理工具410被配置为与服务器风扇操作信息相反收集刀片服务器机箱风扇操作信息并且经由其分析检测压力异常之外,计算设备402、数据中心管理工具410和网络404可以相应地基本上与先前所描述的计算设备302、数据中心管理工具310和网络304类似。

为此目的,数据中心管理工具410包括风扇监视部件412、压力异常检测部件418和压力异常响应部件420,其可以相应地以基本上与如上文参考图3所描述的风扇监视部件312、压力异常检测部件318和压力异常响应部件320类似的方式操作。而且,除了这样的数据可以与服务器风扇相反指代刀片服务器机箱风扇之外,数据中心管理工具410可操作用于访问可以基本上与实时风扇数据314和风扇参考数据316类似的实时风扇数据414和风扇参考数据416。

刀片服务器机箱4061-406n表示位于数据中心内的刀片服务器机箱。一般而言,刀片服务器机箱4061-406n的每个刀片服务器机箱被配置为容纳一个或多个刀片服务器。如在图4中进一步所示,刀片服务器机箱4061包括若干部件。这些部件包括一个或多个刀片服务器机箱风扇430、风扇控制部件432、一个或多个风扇速度传感器434和数据中心管理代理436。将理解到,每个刀片服务器机箱4062-406n包括相同或者类似部件的实例,但是由于空间限制并且为了便于说明,这些尚未被示出在图4中。

(一个或多个)刀片机箱服务器风扇430包括操作以产生空气流的一个或多个机械设备。例如,每个刀片服务器机箱风扇430可以包括机械设备,其包括径向地附接到中心类似轮毂的部件并且可以与其旋转以产生空气流的多个刀片。每个刀片服务器机箱风扇430可以包括例如固定速度或可变速度的风扇。(一个或多个)刀片服务器机箱风扇430可操作用于出于消散由被安装在刀片服务器机箱4061内的一个或多个刀片服务器所生成的热的目的而生成气流。

在一个实施例中,刀片服务器机箱4061包括一个或多个冷进气口和一个或多个热出气口。进一步根据这样的实施例,每个刀片服务器机箱风扇430可以可操作用于经由(一个或多个)冷进气口将空气汲取到刀片服务器机箱中并且经由(一个或多个)热出气口从其排出空气。更进一步根据这样的实施例,(一个或多个)冷进气口可以面对或暴露于数据中心冷通道并且(一个或多个)热出气口可以面对或暴露于数据中心热通道。在该实施例中,每个刀片服务器机箱风扇430可操作用于从冷通道将被冷却的空气汲取到刀片服务器机箱4061中并且从其将被加热的空气排出到热通道中。

风扇控制部件432包括操作以控制每个刀片服务器机箱风扇430旋转速度的部件。风扇速度可以从0rpm(即,服务器风扇关闭)到某个上限范围变化。可以由特定刀片服务器机箱风扇实现的不同的机箱风扇速度将取决于风扇类型而变化。风扇控制部件432可以被实现在硬件(例如,使用一个或多个数字和/或模拟电路)中、为软件(例如,在刀片服务器机箱4061的一个或多个服务器上执行的软件)或硬件和软件的组合。

风扇控制部件432可以实现用于控制每个刀片服务器机箱风扇430的速度的算法。例如,风扇控制部件432可以实现用于基于任何数目的可确定的因素来选择针对每个刀片服务器机箱风扇430的目标风扇速度的算法。例如,可以基于由刀片服务器机箱4061内部、附近或与刀片服务器4061相关联的温度传感器所感测的温度或者基于一个或多个服务器部件的使用的所确定的程度来选择目标风扇速度,但是这些仅是几个示例。还可能的是,风扇控制部件432可以基于从数据中心管理工具或其他实体接收到的外部输入来选择针对每个刀片服务器机箱风扇430的目标风扇速度,如在此在其他地方将讨论的。

虽然在图4中仅示出单个风扇控制部件432,但是可能的是,刀片服务器机箱4061可以包括多个风扇控制部件。例如,刀片服务器机箱4061可以包括不同的风扇控制部件,其操作以相应地控制不同的(一个或多个)刀片服务器机箱风扇的速度。

(一个或多个)风扇速度传感器434包括一个或多个传感器,其操作以确定每个刀片服务器机箱风扇430正操作的实际速度。可以用于确定风扇的速度的任何类型的传感器可以用于实现(一个或多个)风扇速度传感器434。在一个实施例中,(一个或多个)风扇速度传感器434包括一个或多个转速表,但是该示例不旨在是限制性的。

数据中心管理代理436包括在刀片服务器机箱(未示出在图4中)的一个或多个处理器上执行的软件部件。一般而言,数据中心管理代理436执行使得远程执行的数据管理工具410能够收集关于刀片服务器机箱4061的各种操作方面的信息并且使得远程执行的数据管理工具410能够修改刀片服务器机箱4061的操作方式的操作。

数据中心管理代理436包括报告部件440。报告部件440可操作用于收集关于(一个或多个)刀片服务器机箱风扇的操作的数据并且将这样的数据发送到远程执行的数据中心管理工具410。这样的数据可以包括例如如在特定时间点或给定时间帧内由风扇控制部件432(或被配置为选择刀片服务器机箱风扇430将被驱动到的目标速度的其他部件)所确定的刀片服务器机箱风扇430的目标速度以及如在相同时间点或在相同时间帧内由风扇速度传感器434所检测的刀片服务器机箱风扇430的实际速度。在实施例中,报告部件440操作以间歇地收集每个刀片服务器机箱风扇430的目标速度和实际速度,并且将这样的目标速度和实际速度数据发送到远程执行的数据中心管理工具410。由报告部件440传达给远程执行的数据中心管理工具410的每个刀片服务器机箱风扇430的目标和实际速度数据可以由远程执行的数据中心管理工具410用于确定压力异常否存在于数据中心中。

数据中心管理代理336还包括刀片服务器机箱(bsc)操作管理部件442。bsc操作管理部件442可操作用于从远程执行的数据中心管理工具410接收指令,并且响应于些指令而改变刀片服务器机箱4061的操作方式。如在此在其他地方将讨论的,刀片服务器机箱4061的操作方式的改变可以旨在修复或以减轻在刀片服务器机箱4061驻留在其中的数据中心内已经检测到的压力异常。bsc操作管理部件442可以改变刀片服务器机箱4061的操作方式的方式可以包括但不限于:改变(例如,降低)一个或多个刀片服务器机箱风扇430的速度;使得数据中心管理代理436开始监视刀片服务器和/或刀片服务器部件的温度并且报告给远程地执行的数据中心管理工具410(或者以这样的监视/报告发生的速率增加);或者完全地关闭刀片服务器机箱4061。

在实施例中,数据中心管理代理还可以被安装在被安装在刀片服务器机箱4061内的每个刀片服务器上。这些代理可以由数据中心管理工具410用于执行特定刀片服务器的修复动作,诸如但不限于:终止在刀片服务器上执行的至少一个过程和/或中断刀片服务器的至少一个资源的使用(例如,按照将客户工作流迁移到另一服务器);降低被供应到刀片服务器的一个或多个部件的功率量;或者完全地关闭刀片服务器。

在数据中心管理系统的另一实施例中,被包括在一个或多个服务器中的服务器风扇和被包括在一个或多个刀片机箱中的刀片服务器机箱风扇被监视,并且从而所获得的信息用于检测压力异常。进一步根据这样的实施例,可以通过改变一个或多个服务器、服务器风扇、刀片服务器机箱、刀片服务器机箱风扇或刀片服务器的操作方式来采取修复动作。

图5描绘用于生成如上文相应地参考图3和图4所描述的风扇参考数据316、416的一个示例方法的流程图500。流程图500的方法在此仅以示例的方式描述并且不旨在是限制性的。(一个或多个)相关领域的技术人员将理解到,其他技术可以被用于生成风扇参考数据316、416。

如在图5中所示,流程图500的方法在其中获得针对多个风扇中的每个风扇指示在基本上中性压力的环境中风扇的实际速度如何与风扇的实际速度有关的数据的步骤502处开始。每个风扇可以包括例如服务器风扇或刀片服务器机箱风扇。基本上中性压力的环境可以包括在其中风扇进口处的压力粗略地或基本上等于风扇出口处的压力的环境。

这样的数据可以例如通过使用转速表或其他适合的传感器测试风扇获得,而风扇在基本上中性压力的环境中操作以确定风扇的实际速度如何与风扇将被驱动到的目标速度相比较。还可以通过校准风扇的设计获得这样的数据,使得其当被驱动到特定目标速度时以特定实际速度操作。还可以从与特定风扇相关联的产品规格获得这样的数据。在步骤500所获得的数据可以仅指代个体风扇或特定类型的风扇,例如,特定品牌或模型的风扇。

在步骤500期间所获得的数据可以针对特定风扇或风扇类型指示风扇的实际速度如何与针对多个不同的目标速度的风扇的期望的目标速度有关。例如,对于可变速度风扇而言,可以确定与目标速度的对应的范围有关的实际风扇速度的范围。进一步根据该示例,可以确定与0rpm到某个最大rpm的目标速度范围有关的实际风扇速度的范围。

在步骤504处,被存储在数据存储库或数据结构中的、在步骤502期间所获得的数据对数据中心管理工具(诸如图3的数据中心管理工具310或者图4的数据中心管理工具410中的任一个)可访问。以示例的方式,步骤502期间所获得的数据可以被存储在与数据中心管理工具310、410分离的数据存储库中并且从而被访问或者可以是关于数据中心管理工具310、410内部地存储(例如,在数据中心管理工具310、410的一个或多个数据结构内)的数据。

图6描绘了根据实施例的用于自动地检测数据中心内的压力异常的方法的流程图600。流程图600的方法可以例如通过图3的数据中心管理工具310或图4的数据中心管理工具410执行并且因此将继续参考那些实施例在此描述。然而,该方法不限于那些实施例。

如在图6中所示,流程图600的方法在步骤602处开始,在其期间用于消散由数据中心中的一个或多个服务器所生成的热的多个风扇中的每个风扇被监视,以获得指示风扇中的每个风扇的实际速度如何与风扇中的每个风扇的目标速度有关的数据。风扇可以是例如服务器风扇和/或刀片服务器机箱风扇。该步骤可以例如通过数据中心管理工具310的风扇监视部件312(如上文参考图3所描述的)或者数据中心管理工具410的风扇监视部件412(如上文参考图4所描述的)而被执行。如先前所描述的,这些部件可以从在容纳这样的服务器的其他服务器或刀片服务器上执行的数据中心管理代理收集这样的数据。还如先前所描述的,这样的数据可以被存储为实时风扇数据314、414。

在步骤604处,在步骤602期间所获得的数据与参考数据相比较,针对多个风扇中的每个风扇,参考数据指示在基本中中性压力的环境中风扇的实际速度如何与风扇的目标速度有关。该步骤可以例如通过数据中心管理工具310的压力异常检测部件318(如上文参考图3所描述的)或者数据中心管理工具410的压力异常检测部件418(如上文参考图4所描述的)而被执行。该步骤可以包括例如将实时风扇数据314与风扇参考数据316相比较或将实时风扇数据414与风扇参考数据416相比较。

在步骤606处,至少基于步骤604期间进行的比较,确定压力异常是否存在于数据中心中。像步骤604那样,该步骤还可以例如通过压力异常检测部件318或压力异常检测部件418而被执行。

在步骤602期间所获得的数据与参考数据之间的步骤604中所执行的比较可以包括例如确定在由步骤602期间所获得的数据所指定的实际-目标速度关系与由参考数据所指定的实际-目标速度关系之间的差异或偏差的度量。例如,如果观察到所获得的数据实际-目标速度关系与参考数据实际-目标速度关系之间的特定偏差度或者如果随时间观察到特定偏差模式,那么压力异常检测部件318、418可以确定压力异常存在。以示例的方式,在其中正压力将相对于一个或多个相邻冷通道在热通道容器单元中建立的场景中,人们可以期望看到针对给定目标速度由将被加热的空气吹到热通道容器单元中的风扇所实现的实际速度将比针对基本上中性压力的环境中的相同目标速度所获得的实际速度更低。

在一个实施例中,压力异常检测部件318、418可以确定如果针对特定数目的风扇的差异度量超过特定阈值,则压力异常存在。该方法认识到,压力异常(诸如上文所描述的压力异常(即,正压力将相对于一个或多个相邻冷通道在热通道容器单元中建立))可能显著地影响大量的风扇的行为。例如,如果针对所监视的风扇群体的m%或更大,观察到与参考实际-目标速度关系的n%或更大,那么压力异常检测部件318、418可以确定压力异常存在。除了前述内容之外,压力异常检测部件318、418可以考虑与参考实际-目标速度关系的偏离将被报告的风扇的接近度或位置。

图7描绘了根据实施例的用于响应于检测到数据中心内的压力异常而自动地采取动作的方法的流程图700。流程图700的方法可以例如通过图3的数据中心管理工具310或图4的数据中心管理工具410执行并且因此将继续参考那些实施例在此描述。然而,方法不限于那些实施例。

如在图7中所示,流程图的方法在步骤702处开始,其中确定压力异常存在于数据中心中。该步骤与流程图600的步骤606类似并且因此可以以上文参考该流程图所描述的方式执行。步骤702可以例如由压力异常检测部件318或压力异常检测部件418执行。

在步骤704处,响应于步骤702中的压力异常存在于数据中心中的确定,选择性地执行一个或多个动作。该步骤可以例如通过数据中心管理工具310的压力异常响应部件320(如上文参考图3所描述的)或者数据中心管理工具410的压力异常响应部件420(如上文参考图4所描述的)而被执行。

步骤706、708和710示出了可以响应于压力异常存在的确定而选择性地执行的各种类型的动作。可以隔离或者结合一个或多个其他步骤执行这些步骤的每个步骤。

在步骤706中,生成警报。该警报可以实际上是听觉、视觉、和/或触觉的。可以例如经由计算设备302的用户接口、计算设备402或经由通信地连接到其的计算设备的用户接口生成警报。警报可以被记录在日志中。警报还可以以消息、电子邮件等的形式被发送到另一设备或用户。通过以该方式生成警报,一旦其被检测到,则可以通知数据中心人员压力异常,从而使得他们采取措施帮助修复问题。

在步骤708中,修改用于冷却服务器的风扇中的至少一个风扇的操作方式。例如,在实施例中,压力异常响应部件320可以将命令发送到在服务器3061-306n上执行的服务器操作管理部件342,以使得被确定为与压力异常相关联的某些服务器风扇的速度被降低。同样地,压力异常响应部件420可以将命令发送到在刀片服务器机箱4061-406n上执行的bsc操作管理部件442,以使得被确定为与压力异常相关联的某些刀片服务器机箱风扇的速度被降低。这可以具有降低风扇将被加热的空气吹向的热通道容器单元内的压力的作用,从而帮助修复压力异常。

在实施例中,在压力异常响应部件310、410降低一个或多个风扇的速度之后,压力异常响应部件310、410还可以开始经由数据中心管理代理监视内部服务器部件的温度(或增加这样的信息被报告的速率),使得压力异常响应部件310、410可以确定风扇速度的降低是否将使得那些部件超过指定的发热限制并且潜在地被损坏。如果压力异常响应部件310、410确定风扇速度的降低将使得那些部件超过指定的发热限制并且潜在地被损坏,那么压力异常响应部件310、410可以采取附加步骤,诸如增加风扇速度或关闭一个或多个服务器。

在步骤710中,修改数据中心中的服务器中的至少一个的操作方式。例如,在实施例中,压力异常响应部件310、410可以与数据中心管理代理相互作用以关闭被确定为由压力异常影响的服务器中的一个或多个服务器。作为另一示例,为了确保用户服务水平协议(sla)被满足,压力异常响应部件310、410可操作用于将一个或多个客户工作流从被确定为由压力异常影响的服务器迁移到未被确定为由压力异常影响的服务器。作为又一示例,压力异常响应部件310、410可以与数据中心管理代理交互,以降低被供应到被确定为由压力异常影响的服务器的一个或多个内部部件的功率量,其可以具有降低这样的内部部件的温度的作用。

前述仅是可以由压力异常响应部件320、420采取以尝试并且修复检测到的压力异常的步骤的一些示例。由于这样的步骤可以自动地执行,因而其可以在设备损坏被引起之前并且在不要求由数据中心人员造成的介入的情况下帮助修复压力异常。

iv.示例计算机系统实现

图8描绘了可以用于实现在此所描述的各种实施例的示例基于处理器的计算机系统800。例如,计算机系统800可以用于实现计算设备302、服务器3061-306n中的任一个服务器、计算设备402、刀片服务器机箱4061-406n或被安装在其中的刀片服务器中的任一个。计算机系统800还可以被用于实现图5至图7中所描绘的任何或全部流程图的任何或全部步骤。计算机系统800的描述在此出于图示的目的被提供,并且不旨在是限制性的。实施例可以被实现在进一步的类型的计算机系统中,如相关领域的技术人员将已知的。

如在图8中所示出的,计算机系统800包括处理单元802、系统存储器804和将包括系统存储器804的各种系统部件耦合到处理单元802的总线806。处理单元802可以包括一个或多个微处理器或一个或多个微处理器核。总线806表示任何若干类型的总线架构中的一个或多个总线架构,包括存储器总线或存储器控制器、外围总线、加速图形端口和处理器或者使用任何各种总线架构的本地总线。系统存储器804包括只读存储器(rom)808和随机存取存储器(ram)810。基本输入/输出系统812(bios)被存储在rom808中。

计算机系统800还具有以下驱动器中的一个或多个:硬盘驱动器814,其用于从硬盘读取和写入到硬盘;磁盘驱动器816,其用于从可移除的磁盘818读取或写入到可移除的磁盘818;和光盘驱动器820,其用于从可移除的光盘822或写入到可移除的光盘822(诸如cdrom、dvdrom、蓝光tm盘或其他光学介质)。盘驱动器814、磁盘驱动器816和光盘驱动器820相应地通过硬盘驱动器接口824、磁盘驱动器接口826和光学驱动器接口828被连接到总线806。驱动器和其相关联的计算机可读媒体提供计算机可读指令、数据结构、程序模块和针对计算机的其他数据的非易失性存储。虽然描述了硬盘、可移除的磁盘和可移除的光盘,但是其他类型的计算机可读存储设备和存储结构可以用于存储数据,诸如闪存卡、数字视频光盘、随机存取存储器(ram)、只读存储器(rom)等。

若干程序模块可以被存储在硬盘、磁盘、光盘、rom或ram上。这些程序模块包括操作系统830、一个或多个应用程序832、其他程序模块834和程序数据836。根据各种实施例,程序模块可以包括由处理单元802可执行以执行计算设备302、服务器3061-306n中的任一个服务器、计算设备402、刀片服务器机箱4061-406n或被安装在其中的刀片服务器中的任一个的计算机程序逻辑的任何或全部功能和特征,如上文所描述的。程序模块还可以包括计算机程序逻辑,其当由处理单元802执行时执行参考图5至图7的流程图所示或所描述的步骤或操作中的任一个。

用户可以通过输入设备(诸如键盘838和指点设备840)将命令和信息录入计算机系统800中。其他输入设备(未示出)可以包括麦克风、操纵杆、游戏控制器、扫描器等。在一个实施例中,触摸屏结合显示器844被提供以允许用户经由触摸(如例如通过手指或光笔)的应用将用户输入提供到触摸屏上的一个或多个点。这些和其他输入设备常常通过耦合到总线806的串行端口接口842连接到处理单元802,但是可以通过其他接口(诸如并行端口、游戏端口或者通用串行总线(usb))连接。这样的接口可以是有线或无线接口。

显示器844还经由接口(诸如视频适配器846)被连接到总线806。除了显示器844之外,计算机系统800还可以包括其他外围输出设备(未示出),诸如扬声器和打印机。

计算机系统800通过网络接口或适配器850、调制解调器852或用于通过网络建立通信的其他装置被连接到网络848例如,局域网或广域网(诸如因特网)。可以在内部或外部的调制解调器852经由串行端口接口842被连接到总线806。

如在此所使用的,术语“计算机程序介质”、“计算机可读介质”和“计算机可读存储介质”通常用于指代存储器设备或存储结构(诸如与硬盘驱动器814相关联的硬盘、可移除的磁盘818、可移除的光盘822)以及其他存储器设备或存储结构(诸如闪存卡、数字视频光盘、随机存取存储器(ram)、只读存储器(rom)等)。这样的计算机可读存储介质与通信介质进行区分并且不与通信介质重叠(不包括通信介质)。通信媒体通常实现计算机可读指令、数据结构、程序模块或诸如载波其他传输的经调制的数据信号中的数据。术语“经调制的数据信号”意指具有以关于将信息编码在信号中的这样的方式设定或改变的其特点中的一个或多个的信号。以示例而非限制的方式,通信介质包括无线介质(诸如声学、rf、红外和其他无线介质)。实施例还涉及这样的通信介质。

如上文所指出的,计算机程序和模块(包括应用程序832和其他程序模块834)可以被存储在硬盘、磁盘、光盘、rom、或ram上。还可以经由网络接口850、串行端口接口842或任何其他接口类型接收这样的计算机程序。这样的计算机程序当由应用执行或加载时,使得计算机系统800能够实现在此所讨论的本发明的实施例的特征。因此,这样的计算机程序表示计算机系统800的控制器。

实施例还涉及包括被存储在任何计算机可用介质上的软件的计算机程序产品。这样的软件当在一个或多个数据处理设备中执行时,使得(一个或多个)数据处理设备如在此所描述地操作。本发明的实施例采用现在已知或未来的任何计算机可用或计算机可读介质。计算机可读介质的示例包括但不限于存储器设备和存储结构,诸如ram、硬盘驱动器、软盘、cdrom、dvdrom、压缩碟、磁带、磁性存储设备、光学存储设备、mem、基于纳米技术的存储设备等。

在备选实现中,计算机系统800可以被实现为硬件逻辑/电路或固件。根据进一步的实施例,这些部件中的一个或多个部件可以被实现在片上系统(soc)中。soc可以包括集成电路芯片,其包括以下各项中的一项或多项:处理器(例如、微控制器、微处理器、数字信号处理器(dsp)等)、存储器、一个或多个通信接口和/或进一步的电路和/或执行其功能的嵌入式固件。

v.附加的示例性实施例

在此描述了由在至少一个计算机上执行的数据中心管理软件执行的方法。根据方法,用于消散由数据中心中的一个或多个服务器生成的热的多个风扇中的每个风扇被监视,以获得指示风扇中的每个风扇的实际速度如何与风扇中的每个风扇的目标速度有关的数据。然后,将所获得的数据与参考数据相比较,针对多个风扇中的每个风扇,参考数据指示在基本上中性压力的环境中风扇的实际速度如何与风扇的目标速度有关。基于比较,确定压力异常存在于数据中心中。基于压力异常存在于数据中心中的确定,执行以下各项中的一项或多项:生成警报,以及修改风扇中的至少一个风扇和服务器中的至少一个服务器的一个或多个的操作方式。

在前述方法的实施例中,多个风扇包括服务器风扇和刀片机箱风扇中的一个或多个。

在前述方法的另一实施例中,多个风扇中的每个风扇被配置为将空气吹到热通道容器单元中。

在前述方法的又一实施例中,修改风扇中的至少一个的操作方式包括降低风扇中的至少一个风扇的速度。进一步根据这样的实施例,方法还可以包括响应于降低风扇中的至少一个风扇的速度,监视服务器中的一个或多个服务器的一个或多个内部部件的温度。

在前述方法的又一实施例中,修改服务器中的至少一个服务器的操作方式包括从服务器中的至少一个服务器迁移客户工作流。

在前述方法的另一实施例中,修改服务器中的至少一个服务器的操作方式包括关闭服务器中的至少一个服务器。

在前述方法的又一实施例中,修改服务器中的至少一个服务器的操作方式包括降低被供应到服务器中的一个或多个服务器的一个或多个内部部件的功率量。

在前述方法的附加实施例中,将所获得的数据与参考数据相比较包括:针对风扇中的每个风扇,确定由所获得的数据所指定的实际-目标速度关系与由参考数据所指定的实际-目标速度关系之间的差异度量。进一步根据这样的实施例,基于比较确定压力异常存在于数据中心中可以包括:确定针对特定数目的风扇的差异度量超过特定阈值。

在此还描述了系统。系统包括至少一个处理器和存储器。存储器存储用于由至少一个处理器执行的计算机程序逻辑。计算机程序逻辑包括一个或多个部件,其被配置为当由至少一个处理器执行时执行操作。一个或多个部件包括风扇监视部件、压力异常检测部件和压力异常响应部件。风扇监视部件可操作用于监视用于消散由数据中心中的一个或多个服务器生成的热的多个风扇中的每个风扇,以获得指示风扇中的每个风扇的实际速度如何与风扇中的每个风扇的目标速度有关的数据。压力异常检测部件可操作用于将所获得的数据与参考数据相比较,针对多个风扇中的每个风扇,参考数据指示在基本上中性压力的环境中风扇的实际速度如何与风扇的目标速度有关,并且基于比较来确定压力异常存在于所述数据中心中。压力异常响应部件可操作用于响应于压力异常存在的确定而执行以下各项中的一项或多项:(i)生成警报,和(ii)修改风扇中的至少一个风扇和服务器中的至少一个服务器的一个或多个的操作方式。

在前述系统的实施例中,压力异常响应部件可操作用于通过降低风扇中的至少一个风扇的速度修改风扇中的至少一个风扇的操作方式。进一步根据这样的实施例,压力异常响应部件还可以可操作用于响应于降低风扇中的至少一个的速度,监视服务器中的一个或多个服务器的一个或多个内部部件的温度。

在前述系统的另一实施例中,压力异常响应部件可操作用于通过从服务器中的至少一个服务器迁移至少一个服务或资源来修改服务器中的至少一个服务器的操作方式。

在前述系统的又一实施例中,压力异常响应部件可操作用于通过关闭服务器中的至少一个服务器来修改服务器中的至少一个服务器的操作方式。

在前述系统的又一实施例中,压力异常响应部件可操作用于通过降低供应到服务器中的一个或多个服务器的一个或多个内部部件的功率量来修改服务器中的至少一个服务器的操作方式。

在前述系统的又一实施例中,压力异常检测部件可操作用于通过针对风扇中的每个风扇确定由所获得的数据指定的实际-目标速度关系与由参考数据指定的实际-目标速度关系之间的差异度量来比较所获得的数据与参考数据。进一步根据这样的实施例,压力异常检测部件可以可操作用于通过确定针对特定数目的风扇的差异度量超过特定阈值,来基于比较确定压力异常存在于数据中心中。

在此还描述了一种计算机程序产品。计算机程序产品包括具有记录在其上的计算机程序逻辑的计算机可读存储器,计算机程序逻辑当由至少一个处理器执行时使得至少一个处理器执行包括以下各项的方法:监视用于消散由数据中心中的一个或多个服务器所生成的热的多个风扇中的每个风扇,以获得指示风扇中的每个风扇的实际速度如何与风扇中的每个风扇的目标速度有关的数据;基于至少所获的数据来确定压力异常存在于数据中心中;并且基于压力异常存在于数据中心中的确定,执行以下各项中的一项或多项:生成警报;和修改以下各项中的一项或多项的操作方式:风扇中的至少一个风扇;和服务器中的至少一个服务器。

在前述计算机程序产品的一个实施例中,基于至少所获得的数据确定压力异常存在于数据中心中包括:将所获得的数据与参考数据相比较,针对多个风扇中的每个风扇,参考数据指示在基本上中性压力的环境中风扇的实际速度如何与风扇的目标速度有关。

vi.结论

虽然上文已经描述了各种实施例,但是应当理解,其已经仅以示例而非限制的方式呈现。对于相关领域的技术人员而言将明显的是,在不脱离本发明的精神和范围的情况下,可以在其中做出形式和细节的各种变化。因此,本发明的宽度和范围不应当由上文所描述的示例性实施例中的任一个实施例限定,而是应当仅根据所附的权利要求书和其等价方案限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1