1.本公开一般地涉及针对污染物对环境进行监测。具体地,本公开涉及用于预测和诊断由环境污染引起的对电气元件的损坏的系统和方法。
背景技术:2.环境污染可能引起对计算环境中的硬件资源的重大且不可逆转的损坏。各种物质(诸如硫化氢和其他气态化合物)可导致蠕变腐蚀或类似现象。如果环境污染得不到解决,可能需要更换昂贵的计算硬件。在诸如云计算环境和数据中心的大规模环境中,污染可能会同时影响并需要更换若干硬件元件。
3.当硬件资源出现故障时,环境污染可能难以诊断。例如,蠕变腐蚀(creep corrosion)可能需要数周或数月才能被可见地检测到,并且通常需要放大观察。此外,当细丝或枝晶形成了跨印刷电路板迹线到元件引线的电桥时,典型的结果是短路,其几乎立即破坏污染物,导致故障根本原因的证据很少。结果,对受影响硬件元件的检查通常结果是未发现故障(ntf)。因此,系统管理员可能难以理解硬件资源为何出现故障。在不正确了解硬件故障的根本原因的情况下,环境污染源可能得不到解决,导致不断更换昂贵的硬件。
4.除了更换成本外,持续的硬件故障也可能引起重复的应用程序中断而无警告。例如,服务器硬件故障可能暂时切断客户端对网络应用程序的访问,直到服务器被更换或迁移。结果,网络或其他计算应用程序的服务质量可能受到负面影响。在关键任务应用程序和云服务中,这样的性能下降可能导致违约、客户不满和收入损失。
5.本部分中描述的方法是可以施行的方法,但不一定是先前已经设想或施行的方法。因此,除非另有说明,否则不应假定本部分中描述的任何方法仅因其包括在本部分中而作为现有技术。
附图说明
6.在附图中通过示例而非限制的方式示出了实施例。应当注意,本公开中对“一”或“一个”实施例的引用不一定指相同实施例,它们意味着至少一个。图中:
7.图1图示了根据一些实施例的具有环境污染检测器的示例系统;
8.图2图示了根据一些实施例的环境污染检测器的示例电路图;
9.图3图示了根据一些实施例的用于生成预测警报以警告潜在有害环境污染的一组示例操作;
10.图4图示了根据一些实施例的示例测试试样,其中在两个导电迹线之间形成了电桥。
11.图5图示了根据一些实施例的具有环境污染模块的示例机架系统;
12.图6图示了根据一些实施例的用于提供遥测以促进资源管理的示例一组操作;
13.图7图示了根据一些实施例的用于查看和管理硬件资源的示例图形用户接口(gui);以及
14.图8图示了描绘根据一些实施例的示例计算机系统的框图。
具体实施方式
15.在以下描述中,出于解释的目的,阐述了许多具体细节以提供透彻的理解。可以在没有这些具体细节的情况下实践一个或多个实施例。在一个实施例中描述的特征可以与在不同实施例中描述的特征组合。在一些示例中,为了避免不必要地模糊本发明,众所周知的结构和设备被参考框图形式描述。
16.1.总体概述
17.2.架构概述
18.3.预测警报电路和方法
19.4.测试电路配置和分析
20.5.远程遥测接口和方法
21.6.计算硬件架构
22.7.杂项;扩展
23.1.总体概述
24.本文描述的系统和方法提供主动环境污染物监测。在一些实施例中,系统和方法提供硬件污染的预测通知。预测警报可以由暴露于与其他硬件资源共享的环境的监测机制生成。监测机制可以被配置为检测指示环境污染的早期迹象的电气异常。如果环境污染被检测到,则监测机制可以输出预测警报以通知用户共享环境中的其他硬件资源也可能暴露于相同的污染物。预测警报允许在环境污染引起硬件中断和/或硬件资源需要被更换之前采取适当的动作。
25.在一些实施例中,监测机制被配置为检测测试电路中的电气异常。测试电路可以以在存在环境污染的情况下在测试电路中引起电气异常的方式被设计和电气地激励。此方法允许电气异常在暴露于相同环境的其他硬件资源受到显著影响之前在测试电路中表现出来。例如,可以将与共享环境中的其他硬件资源不同的偏置电压施加到测试电路。在存在腐蚀性环境的情况下,不同的偏置电压(诸如较高的偏置电压)可能有助于引起蠕变腐蚀和类似现象。在某些情况下,在类似水平的蠕变腐蚀在关键硬件元件中表现出来之前,系统可能提供数周或数月的提前通知。
26.在一些实施例中,本文描述的系统和方法促进了环境内污染物来源的根本原因分析和识别。响应于检测到指示环境污染的电气异常,测试电路的电气激励可以停止。此方法有助于防止短路破坏污染物并保留检测到的电气异常的根本原因的证据。附加地或替代地,测试电路可以是可拆卸的或以其他方式容易移除,以允许污染物的化学组成的进一步分析。可以在不影响共享环境中其他硬件资源的正常操作的情况下实现移除,以提供非侵入式的污染物监测和检测。
27.在一些实施例中,本文描述的系统和方法提供远程遥测和管理能力。如果环境污染被检测到,则服务处理器可以更新与受影响的硬件资源相关联的状态信息。服务处理器可以发送警报和/或提供远程主机可访问的接口以向其他位置中的用户通知环境污染。服务处理器可以提供远程管理能力以迁移、关闭、重启和/或以其他方式来配置暴露于潜在有害污染物的计算资源。因此,本技术允许及时采取动作以减轻服务中断的风险。
28.本说明书中描述的和/或权利要求中叙述的一个或多个实施例可能不被包括在此总体概述部分中。
29.2.架构概述
30.图1图示了根据一些实施例的具有环境污染检测器的示例系统。在各种实施例中,图1中描绘的系统可以包括比所示的那些更多或更少的元件。关于一个元件描述的操作可以由另一元件代替执行。附加地或替代地,关于一个元件描述的操作可以被跨多个元件拆分。附加地或替代地,多个元件的操作可以被组合成单个元件。
31.参考图1,共享环境100包括(一个或多个)硬件资源102、环境污染检测器104、指示灯112、服务处理器114和转发引擎116。在一些实施例中,共享环境100对应于封闭区域,诸如硬件机架、机柜、房间或建筑物。然而,在其他实现方案中,共享环境100也可以对应于非封闭空间。共享环境100内的元件(包括(一个或多个)硬件资源102和环境污染检测器104)可能由于物理接近而受到相同的污染物的影响。例如,相同硬件机架或服务器机房间内的硬件元件可能受到类似水平的水蒸气、含硫气体和/或其他潜在有害化合物的影响。环境污染检测器104可以被配置为监测污染并在检测到时生成预测警报以防止和减轻对(一个或多个)硬件资源102的损坏。
32.(一个或多个)硬件资源102表示位于共享环境100内的一个或多个计算和/或其他电子硬件元件。硬件资源可以包括但不限于主板、中央处理单元(cpu)、微处理器、存储驱动或设备、计算机、平板电脑、膝上型电脑、台式机、上网本、服务器、web服务器、网络策略服务器、代理服务器、通用机器、特定功能的硬件设备、硬件路由器、硬件交换机、硬件防火墙、硬件防火墙、硬件网络地址转换器(nat)、硬件负载均衡器、大型机、电视机、内容接收器、机顶盒、打印机、手机、智能手机、个人数字助理(pda)、无线接收器和/或发射器、基站、通信管理设备、路由器、交换机、控制器和/或接入点。
33.环境污染检测器104也位于共享环境100中以监测(一个或多个)硬件资源102对污染物的潜在暴露。在一些实施例中,环境污染检测器104可以嵌入在(一个或多个)硬件资源102中的一个内。例如,环境污染检测器104可以是相同印刷电路板的一部分或插入到与另一硬件资源相同的卡中。在其他实施例中,环境污染检测器104可以是共享一些资源的整个系统的单独模块。例如,环境污染检测器104可以是被安装到与(一个或多个)硬件资源102相同的硬件机架的单独机架模块。一个或多个系统资源(诸如电源、通信通道和/或冷却子系统)可以由这些机架式安装的模块共享。在其他实施例中,环境污染模块可以是与(一个或多个)硬件资源102物理接近而不共享任何系统资源的单独且独立操作的设备。
34.在一些实施例中,环境污染检测器104定位于共享环境100内受气流影响的区域中。例如,环境污染检测器104可以定位于电源或风扇附近,在其处气流被拉动和/或排出。这样的定位增加了环境污染检测器104将处于环境污染物路径中的可能性,这允许早期的检测和警告。
35.环境污染检测器104通常包括偏置电路106、测试电路108和监测电路110。偏置电路106被配置为以在污染物存在的情况下引起异常的方式对测试电路108进行电气激励。监测电路110检测指示污染的异常并且如果检测到则输出警报信号。尽管被描绘为不同的电路,但是在一些实施例中,偏置电路106、测试电路108和监测电路110中的两个或更多个可以是作为同一整体电路的一部分的子电路。例如,这些子电路可以被连接并集成到相同印
刷电路板中。附加地或替代地,环境污染检测器104可以包括取决于特定实现方案的其他电路。
36.共享环境100还包括指示灯112、服务处理器114和转发引擎116。尽管被描绘为与环境污染检测器104相同的共享环境100的一部分,但在其他实施例中,这些元件中的一个或多个可以远程位于不同的环境。附加地或替代地,这些元件中的一个或多个可以从系统完全省略。
37.在一些实施例中,当环境污染环境被污染检测器104检测到时,指示灯112被点亮。指示灯112可以是发光二极管(led)、白炽灯或任何其他类型的灯泡。指示灯112的大小、位置和/或颜色可以被选择为容易被系统管理员注意到的。例如,指示灯112可以被点亮为红色(或一些其他值得注意的颜色)并且定位于硬件机架的前面板上以提供对环境污染的充分警告。
38.服务处理器114是为(一个或多个)硬件资源102提供远程遥测和管理能力的专用处理器。在一些实施例中,服务处理器114监测环境污染检测器104输出的警报信号。如果警报信号被检测到,则服务处理器114可以更新与(一个或多个)硬件资源102相关联的状态信息以指示这些资源可能暴露于环境污染。服务处理器114还可以允许远程管理能力,诸如重新启动、重新配置和迁移资源。
39.在一些实施例中,服务处理器114执行包括服务接口118的一组一个或多个程序。服务接口118管理(一个或多个)远程主机120和服务处理器114之间的交互。例如,服务接口118可以基于服务处理器114的实时监测来呈现关于(一个或多个)硬件资源102的当前状态信息。附加地或替代地,(一个或多个)远程主机120可以经由服务接口118向服务处理器114提交服务请求,诸如重新启动或重新配置资源的请求。
40.在一些实施例中,服务接口118呈现用户接口元素并经由用户接口元素接收输入。接口的示例包括但不限于图形用户接口(gui)、命令行接口(cli)、web接口、触觉接口和语音命令接口。用户接口元素的示例包括复选框、单选按钮、下拉列表、列表框、按钮、切换键、文本字段、日期和时间选择器、命令行、滑块、页面和表单。
41.(一个或多个)远程主机120可以是任何类型的网络主机。示例包括但不限于台式计算机、大型机和移动设备(诸如平板电脑、膝上型电脑、电话、pda等)。在一些实施例中,(一个或多个)远程主机120执行用于与服务接口118通信的客户端应用程序。例如,客户端应用程序可以是允许用户访问web接口以远程监测和管理(一个或多个)硬件资源102的web浏览器。在其他实施例中,客户端应用程序可以允许使用互联网协议(ip)套件的一个或多个通信协议将cli命令提交到服务接口118。
42.转发引擎116可以被配置为将环境污染检测器104生成的警报转发到(一个或多个)远程主机120或其他外部节点。在一些实施例中,用户可以向转发引擎116注册网络地址、电子邮件地址、社交媒体句柄和/或短消息服务(sms)号码。当警报被触发时,转发引擎116可以发送电子邮件、社交媒体消息、sms或其他网络消息以立即通知用户。
43.尽管只有单个环境污染检测器104,但在其他实施例中,可以在整个共享环境100中分布多个检测器。例如,服务器机架可以包括靠近电源的检测器、靠近机架底部的检测器和/或靠近机架顶部的监测器。此方法允许更容易地检测到位于共享环境100内的特定区域的污染物。
44.3.预测警报电路和方法
45.如前所述,环境污染检测器104可以提供共享环境100内的污染物的早期警告。通过早期检测和警报,可以避免对(一个或多个)硬件资源102的显著且不可逆转的损坏。还可以采取先发制人的动作来防止硬件和服务中断。
46.图2图示了根据一些实施例的环境污染检测器104的示例电路图。提供电路用于说明只是为了便于理解。然而,应注意,诸如电阻器、开关和其他电子元件的配置的确切电路可随实现方案而改变。此外,其他电子元件(诸如多路复用器、二极管和存储单元可以。参考图2,电压源202是提供基本恒定的dc电压的偏置电路。电压源202可以包括提供电压偏置的升压转换器、降压转换器和ac
‑
dc转换器和/或其他电路。
47.电压源202被耦合到电阻器204a和电阻器204b的第一端子。电阻器204a的第二端子被耦合到开关208的第一端子。电阻器204b的第二端子被耦合到电阻器204c和电阻器204d的第一端子。电阻器204c的第二端子被接地,并且电阻器204d的第二端子被耦合到比较器212的输入部。
48.开关208的第二端子被耦合到电阻器204e和测试试样210的第一端子。开关控制线也被耦合到开关208以控制电压偏置是否被施加到测试试样210。例如,当环境污染被检测到时,电压偏置可以几乎立即被切断。如下文进一步解释的,开关控制可以被绑定到锁存器214的输出端子以控制测试试样210的电气激励。
49.测试试样210包括一组两个或更多个平行的导电迹线。在一些实施例中,导电迹线是在印刷电路板上窄且均匀地间隔开的铜迹线。导电迹线不彼此连接,而是保持开路(open)。在污染物存在的情况下,电压偏置激励迹线之间电桥的形成。例如,足够高的电压偏置可能激励枝晶生长(也被称为细丝),其桥接铜迹线。如前所述,该电压偏置可以不同于被施加到受保护的系统(例如,(一个或多个)硬件资源102)的电压偏置,以相对于受保护的系统内的电路而加速测试试样210中的枝晶形成。附加地或替代地,测试试样210中的导电迹线可以设计成比受保护的系统内的迹线窄,以加速激励测试试样210中蠕变腐蚀类型现象的形成。
50.在一些实施例中,测试试样210内的冶金和/或其他化学成分可以被设计成与受保护的系统相匹配。如果使用新的制造工艺部署硬件资源,则可以更新测试试样210以匹配当前的制造工艺。例如,导电迹线之间的间隔可能变窄和/或印刷电路板的非导电基板的化学成分可能修改。作为另一个示例,应用于印刷电路板的化学涂层可能会随着时间的推移而演变。匹配制造工艺有助于确保(一个或多个)硬件资源102被充分保护。在其他实施例中,测试试样210的冶金和/或化学成分可以与受保护的系统被不同地设计以引起枝晶形成。例如,可以使用较少的保护涂层和/或使用对枝晶形成更敏感的材料来设计测试试样210。
51.再次参考图2,电阻器204e的第二端子被耦合到比较器212的另一个输入线。比较器212监测参考电压206并将其与跨测试试样210的电压进行比较。当测试试样210中的导电迹线被桥接(诸如通过枝晶形成体而被桥接)时,被监测的电压中的变化可以通过比较器212检测到。因此,枝晶电桥提供在共享环境100内发生的现象的电气证据。
52.比较器212的输出部被耦合到s
‑
r锁存器214的置位输入部(setinput),该锁存器存储环境污染是否已被检测到的指示。例如,高电压水平或“1”可用于指示污染被检测到,并且低电压水平或“0”可指示无污染被检测到。其他实现方案可以使用相反的方式,使得
“
0”指示检测到的污染物并且“1”指示无检测到的污染物。
53.s
‑
r锁存器214的输出部可以经由串行接口(诸如i2c接口)被耦合到指示灯112、服务处理器114、转发引擎116和/或其他元件。在正常操作状态下,s
‑
r锁存器214存储无检测到的污染物的指示。当比较器212检测到指示污染的电压异常时,s
‑
r锁存器214转变到警报状态,其经由串行接口提供环境污染被检测到的通知。
54.在一些实施例中,s
‑
r锁存器214的输出部被耦合到开关208的开关控制。当s
‑
r锁存器214从正常操作状态转变到警报状态时(例如,从“0”转变到“1”),开关控制关闭被施加到测试试样210的电压偏置。这有助于保留已在测试试样210上发展的枝晶和其他细丝形成体,从而留下环境污染的化学证据。
55.在一些实施例中,服务处理器114被连接到s
‑
r锁存器214的复位线。服务处理器114可用于万一发生错误警报或如果问题已被解决,则将s
‑
r锁存器214恢复到其正常操作状态。
56.图3示出了根据一些实施例的用于生成预测警报以警告潜在有害环境污染的一组示例操作。图3中所示的一个或多个操作可以被一起修改、重新排列或省略。因此,图3中所示的特定操作序列不应被解释为限制一个或多个实施例的范围。
57.参考图3,该一组操作包括当环境污染存在时施加偏置电压以在测试电路108中激励电气异常(操作302)。所施加的电压偏置可取决于特定实现方案而改变。在一些实施例中,偏置电压被选择为高于(一个或多个)硬件资源102的偏置/操作电压。例如,如果操作电压是+5伏(v),则可以施加+10v或+12v的偏置电压。在操作电压为+3.5v的硬件中,则+5v或+7.5v的偏置电压可能足够。与(一个或多个)硬件资源102相比,较高的偏置电压在测试电路108中更快地引起枝晶生长,这可能是有利的,因为测试电路108的更换成本低于昂贵的(一个或多个)硬件资源102,并且在发生故障时不会引起服务中断。注意,明显更高的偏置电压可能引起误报警报和/或消耗比所需更多的功率。因此,偏置电压可以在考虑这些竞争性利益的情况下进行调整,并且可以随实现方案的不同而改变。附加地或替代地,如前所述,测试试样中的导电迹线可以设计为比受保护的系统更窄以帮助加速枝晶形成。
58.在偏置电压被施加时,所述过程包括针对指示环境污染的电气异常来监测测试电路108(操作304)。例如,如前所述,比较器212可以将跨测试试样210中的迹线的电压与参考电压206进行比较以检测指示污染的电压变化。附加地或替代地,所述过程可以监测其他电气异常,诸如电流负载的变化。在正常操作模式下,迹线是开路的,电流负载很小或没有。当两个迹线被桥接(诸如通过枝晶形成体或暴露于水分子而被桥接)时,则电流可能开始流过迹线。因此,所述过程可以监测电流中的突然变化以检测指示污染的电气异常。
59.所述过程继续监测直到指示污染的电气异常已被检测到(操作306)。例如,所述过程可以继续监测直到测试试样210中的电流被检测到。
60.响应于检测到电气异常,所述过程停止偏置电压(操作308)。如前所述,停止偏置电压可有助于保留污染物的证据,诸如枝晶和金属细丝。这些证据可能有助于事后分析,以识别共享环境100内污染的根本原因。
61.所述过程还响应于检测到电气异常而触发警报信号(操作310)。在一些实施例中,警报信号被输出到指示灯112并且导致指示灯112被点亮。附加地或替代地,警报信号可以作为中断被提供给服务处理器114,或者服务处理器114可以周期性地检查s
‑
r锁存器214的
状态。附加地或替代地,警报信号可以被发送(诸如经由注册的电子邮件、社交媒体帐户或sms号码)以通知用户。因此用户可以被实时提醒(一个或多个)硬件资源102可能暴露于环境污染并采取适当的预防措施以避免中断和硬件故障。
62.4.测试电路配置和分析
63.环境污染检测器104可以检测来自各种来源的污染物。例如,环境污染检测器104可以检测由共享环境100内的高水平湿度引起的腐蚀。作为另一个示例,环境污染检测器104可以检测可能由电池、未密封的混凝土底层地板或其他来源排放的含硫气体,诸如硫化氢或二氧化硫。在又另一示例中,环境污染检测器104可以检测金属屑(诸如锌晶须),其可以从较旧的穿孔地砖或附近的管道引入。
64.污染物的任何上述示例可能导致在测试试样210中的迹线之间形成电桥。图4示出了根据一些实施例的示例测试试样,其中在两个导电迹线之间形成了电桥。测试试样210包括印刷电路板上的铜迹线402a
‑
f。电路之间的间隔防止电流在测试试样210内流动。然而,电桥404是在铜迹线402b和402c之间产生电连接的细丝。电桥404导致电流在这两个铜迹线之间流动,一个铜迹线充当阳极并且另一个铜迹线充当阴极。电桥404可对应于桥接铜迹线之间的非导电间隔的枝晶形成体、金属屑或任何其他化合物。如上所述,测试试样210上的铜迹线之间的间距可以小于受保护的系统中的迹线之间的间距。例如,铜迹线402b和402c之间的印刷电路板的非导电基板可能比(一个或多个)硬件资源102中的任何铜迹线之间的间隔窄。
65.尽管在图4中描绘了六个迹线,但是测试试样210上的迹线数量可随实现方案而改变。发现了具有约为1到2平方英寸的表面积的印刷电路板具有紧密间隔的平行铜迹线(相距0.1到1毫米),在检测蠕变腐蚀和类似现象方面是有效的。此配置提供了足够的暴露以捕获计算系统的典型气流中的污染物,而不消耗大量的不动产。然而,大小、迹线间距和/或迹线数量可取决于特定应用而改变。
66.在一些实施例中,测试试样210是可移除的以允许当污染被检测到时进行事后分析。例如,测试试样210可以经受显微、照相和/或化学检查。显微镜和/或化学分析可以确定电桥404的化学成分,以有助于隔离污染的根本原因。可以执行冶金诊断来识别枝晶形成体内的金属类型。此外,枝晶形成体的形状也可指示腐蚀源。如前所述,可以通过在电气异常被检测到时近乎瞬时地停止偏置电压以防止高电流负载破坏电桥404来保留此证据。
67.在一些实施例中,测试试样210被包括在机架式安装的硬件模块中。测试试样210可以被添加或以其他方式被集成到另一个模块中,诸如服务器机架模块。替代地,测试试样210可以被集成到独立的机架式安装的模块中。例如,图5示出了根据一些实施例的具有环境污染模块的示例机架系统。硬件机架系统500包括机架式安装的模块502、504和506。这些机架式安装的模块中的一个或多个可以包括先前描述的环境污染检测电路。还应注意,模块和硬件机架的大小和形状可能随实现方案而改变。
68.在一些实施例中,指示灯112可以定位于硬件机架500的前面板上。硬件机架系统500可以提供一个或多个机架式安装的模块之间的串行链路以在污染被检测到时点亮灯。测试电路有助于保护其他昂贵的机架硬件免受不可逆转的损坏。此外,测试电路本身可容易移除以用于事后分析,并可更换以用于未来监测。
69.5.远程遥测接口和方法
70.在一些实施例中,服务处理器114被配置为监测(一个或多个)硬件资源102的状态。例如,服务处理器114可以监测跟踪服务器和/或其他硬件元件的物理状态的一组传感器。该组传感器可以包括环境污染检测器104,服务处理器114可以监测该环境污染检测器104以用于警报。其他传感器(诸如温度、电压、风扇速度和性能传感器)也可以被监测。附加地或替代地,服务处理器114可以收集其他状态信息,诸如事件日志、服务器故障信息和/或其他性能属性。服务处理器114可以以提供(一个或多个)硬件资源102的健康状况的全面概述的方式来聚合和呈现信息。
71.图6示出了根据一些实施例的用于提供远程遥测以促进资源管理的一组示例操作。图6中所示的一个或多个操作可以被一起修改、重新排列或省略。因此,图6中所示的特定操作序列不应被解释为限制一个或多个实施例的范围。
72.参考图6,所述过程包括检测指示环境污染的警报(操作602)。例如,服务处理器114可以监测s
‑
r锁存器214以检测从正常状态到警报状态的转变。
73.响应于检测到警报,服务处理器114更新受影响的硬件资源的一组状态信息(操作604)。在此上下文中,受影响的硬件资源可以是潜在地暴露于环境污染的共享环境100中的任何硬件资源。状态信息可以捕获各种属性,诸如污染被首次检测到的时间、受影响的硬件资源的主机名以及共享环境的位置。附加地或替代地,状态信息可以呈现关于污染的可能原因的信息。可以基于环境污染检测器104检测到的电气异常的类型来做出预测。例如,持续的20兆欧短路指示湿气正在形成。另一方面,如果立即汲取非常大的电流,则可能指示锌晶须或其他金属破坏了迹线。可能需要进一步的显微镜或化学分析,诸如之前描述的,以确认警报的原因。
74.所述过程包括基于受影响的资源的更新后的状态信息来生成或更新服务接口(操作606)。在一些实施例中,服务接口是web接口,诸如网页或网页系列。例如,可以更新web接口中的一个或多个gui元素以识别关于潜在地暴露于污染物的硬件资源的信息。附加地或替代地,服务处理器114可以生成cli和/或先前描述的任何其他接口以呈现状态信息。可以生成接口以引起对警报的注意。例如,gui元素可以以值得注意的颜色呈现、放大和/或以其他方式突出显示以提供充分警告。
75.所述过程还包括向最终用户呈现服务接口(操作608)。例如,服务接口可以经由web应用程序(诸如浏览器或移动应用程序)访问。网页可以被保护以防止未经认证的客户端/用户访问状态信息。
76.图7图示了根据一些实施例的用于查看和管理硬件资源的示例图形用户接口(gui)700。gui 700可以对应于网页并且包括导航窗格702、一般信息704、动作面板(panel)706和状态信息708。导航窗格702允许用户钻取各种硬件系统信息。例如,用户可以查看有关处理器、存储器、电源、冷却、存储、联网、污染物监测器、pci设备和固件的状态信息。此外,导航窗格702允许用户导航到并查看可用的系统、主机和电源管理操作。
77.一般信息704提供系统属性的广泛概述。在本示例中,系统是机架式安装的服务器。这里还列出了各种其他属性,诸如固件版本和网络地址。动作窗格(pane)706允许用户在服务器模块上远程执行各种动作,包括关闭模块、打开定位指示器、更新固件和启动远程控制台。
78.状态信息708提供服务器模块的整体健康状况的快照。在本示例中,除污染物监测
器外,所有子系统处于正常操作状态,其中警报表示污染物被检测到。警报被添加到总问题计数中。这里,总问题计数仅为1。但是,污染可能已经影响了其他子系统,诸如四个安装的处理器中的一个或多个、处理器子系统等。在此情况下,每个识别出的问题可能被相加到一起以获得总问题计数。
79.再次参考图6,所述过程包括确定是否请求服务操作(操作610)。例如,用户可以点击或以其他方式从gui 700的动作窗格706中选择动作。替代地,用户可以通过导航窗格702导航到其他可用动作。
80.如果被请求,则该服务操作由服务处理器114执行(操作612)。例如,服务处理器114可以关闭硬件资源、启动远程控制台、调整基本输入/输出设置(bios)或以其他方式重新配置硬件。早期警报和远程管理能力允许系统管理员迅速采取动作,以防止在腐蚀性环境中发生硬件中断。例如,系统管理员可以使备份服务器上线、重新配置负载均衡器、迁移数据和/或采取其他先发制人的动作。
81.6.计算硬件架构
82.在一些实施例中,本文所描述的技术可以由一个或多个专用计算设备来实现。专用计算设备可以是硬连线的以执行技术,或者可以包括诸如被永久性地编程以执行技术的一个或多个专用集成电路(asic)、现场可编程门阵列(fpga)或网络处理单元(npu)的数字电子设备,或者可以包括编程为根据固件、存储器、其它存储装置或组合中的程序指令执行技术的一个或多个通用硬件处理器。这些专用计算设备还可以将自定义的硬接线逻辑、asic、fpga或npu与自定义的编程组合来实现技术。专用计算设备可以是台式计算机系统、便携式计算机系统、手持式设备、联网设备或结合硬连线和/或程序逻辑来实现技术的任何其它设备。
83.例如,图8是示出可以在其上实现本发明的实施例的计算机系统800的框图。计算机系统800包括总线802或用于传送信息的其它通信机制,以及与总线802耦合用于处理信息的硬件处理器804。硬件处理器804可以是例如通用微处理器。
84.计算机系统800还包括耦合到总线802用于存储信息和要由处理器804执行的指令的主存储器806,诸如随机存取存储器(ram)或其它动态存储设备。主存储器806也可以用于在要由处理器804执行的指令执行期间存储临时变量或其它中间信息。当这些指令被存储在处理器804可访问的非暂态存储介质中时,它们使计算机系统800成为被定制以执行指令中指定的操作的专用机器。
85.计算机系统800还包括耦合到总线802用于存储静态信息和用于处理器804的指令的只读存储器(rom)808或其它静态存储设备。提供了诸如磁盘或光盘的存储设备810,并且存储设备810被耦合到总线802,用于存储信息和指令。
86.计算机系统800可以经由总线802耦合到显示器812,诸如阴极射线管(crt)或发光二极管(led)监视器,用于向计算机用户显示信息。输入设备814(其可以包括字母数字和其它键)被耦合到总线802,用于将信息和命令选择传送到处理器804。另一种类型的用户输入设备是光标控件816,诸如鼠标、轨迹球、或光标方向键,用于向处理器804传送方向信息和命令选择并且用于控制光标在显示器812上的移动。输入设备814通常具有在两个轴(第一轴(例如,x)和第二轴(例如,y))中的两个自由度,这允许设备在平面中指定位置。
87.计算机系统800可以使用定制的硬连线逻辑、一个或多个asic或fpga、固件和/或
程序逻辑来实现本文描述的技术,这些定制的硬连线逻辑、一个或多个asic或fpga、固件和/或程序逻辑与计算机系统结合使计算机系统800成为或将计算机系统800编程为专用机器。根据一个实施例,本文的技术由计算机系统800响应于处理器804执行主存储器806中包含的一条或多条指令的一个或多个序列而执行。这些指令可以从另一个存储介质(诸如存储设备810)读取到主存储器806中。包含在主存储器806中的指令序列的执行使处理器804执行本文描述的处理步骤。在替代实施例中,可以使用硬连线电路系统代替软件指令或与软件指令组合使用。
88.如本文所使用的术语“存储介质”是指存储使机器以特定方式操作的数据和/或指令的任何非瞬态介质。这种存储介质可以包括非易失性介质和/或易失性介质。非易失性介质包括例如光盘或磁盘,诸如存储设备810。易失性介质包括动态存储器,诸如主存储器806。存储介质的常见形式包括例如软盘、柔性盘、硬盘、固态驱动器、磁带或任何其它磁性数据存储介质、cd
‑
rom、任何其它光学数据存储介质、具有孔模式的任何物理介质、ram、prom和eprom、flash
‑
eprom、nvram、任何其它存储器芯片或盒带、内容可寻址存储器(cam)和三元内容可寻址存储器(tcam)。
89.存储介质与传输介质不同但可以与传输介质结合使用。传输介质参与在存储介质之间传输信息。例如,传输介质包括同轴电缆、铜线和光纤,包括包含总线802的电线。传输介质还可以采取声波或光波的形式,诸如在无线电波和红外线数据通信期间生成的那些波。
90.各种形式的介质可以涉及将一条或多条指令的一个或多个序列携带到处理器804以供执行。例如,指令最初可以被携带在远程计算机的磁盘或固态驱动器上。远程计算机可以将指令加载到其动态存储器中,并且使用调制解调器经网络线(诸如,电话线、光纤线缆或同轴线缆)发送指令。计算机系统800本地的调制解调器可以接收网络线上的数据,并且使用红外线发射器将数据转换为红外线信号。红外线探测器可以接收在红外线信号中携带的数据,并且适当的电路系统可以将数据放在总线802上。总线802将数据携带到主存储器806,处理器804从该主存储器806检索并执行指令。由主存储器806接收到的指令可以可选地在被处理器804执行之前或执行之后存储在存储设备810上。
91.计算机系统800还包括耦合到总线802的通信接口818。通信接口818提供耦合到网络链路820的双向数据通信,其中网络链路820连接到本地网络822。例如,通信接口818可以是综合业务数字网(isdn)卡、电缆调制解调器、卫星调制解调器、或向对应类型的电话线提供数据通信连接的调制解调器。作为另一个示例,通信接口818可以是提供到兼容的局域网(lan)的数据通信连接的lan卡。也可以实现无线链路。在任何这种实现中,通信接口818都发送和接收携带表示各种类型信息的数字数据流的电信号、电磁信号或光信号。
92.网络链路820通常通过一个或多个网络向其它数据设备提供数据通信。例如,网络链路820可以通过本地网络822提供到主计算机824或到由互联网服务提供商(isp)826操作的数据设备的连接。isp 826又通过现在通常称为“互联网”828的世界范围的分组数据通信网络提供数据通信服务。本地网络822和互联网828二者都使用携带数字数据流的电信号、电磁信号或光信号。通过各种网络的信号以及在网络链路820上并且通过通信接口818的信号是传输介质的示例形式,其中信息将数字数据携带到计算机系统800或者携带来自计算机系统800的数字数据。
93.计算机系统800可以通过(一个或多个)网络、网络链路820和通信接口818发送消息和接收数据,包括程序代码。在互联网示例中,服务器830可以通过互联网828、isp 826、本地网络822和通信接口818传送对应用程序的请求代码。
94.接收到的代码可以在其被接收到时由处理器804执行,和/或存储在存储设备810或其它非易失性存储器中以供以后执行。
95.7.杂项;扩展
96.实施例针对一种具有一个或多个设备的系统,该一个或多个设备包括硬件处理器并且被配置为执行本文描述的和/或在以下任何权利要求中叙述的任何操作。
97.在实施例中,一种非暂时性计算机可读存储介质包括指令,当该指令由一个或多个硬件处理器执行时,导致执行本文描述的和/或在任何权利要求中叙述的任何操作。
98.可以根据一个或多个实施例使用本文描述的特征和功能的任何组合。在前述说明书中,已经参考可能随实现方案而改变的许多具体细节描述了实施例。因此,说明书和附图被认为是说明性的而不是限制性的。本发明范围的唯一和排他性指标,以及申请人旨在成为本发明范围的内容,是本技术所发布的权利要求集的字面和等效范围,以这样的权利要求发布的具体形式,包括任何后续更正。