一种针对数据中心能源利用效率的巡检方法与流程

文档序号:33625184发布日期:2023-03-25 17:45阅读:46579来源:国知局
一种针对数据中心能源利用效率的巡检方法与流程

1.本发明涉及能源节约检测技术领域,特别涉及一种针对数据中心能源利用效率的巡检方法。


背景技术:

2.在当前社会环境下,计算机技术的应用已经得到了飞速发展,数据中心的用电也越来越大,而服务器完全依靠电能才能驱动运行,同时为确保我国数字经济稳定发展,并且数据中心对电能品质要求高,经常会考虑双路供电,以确保数据中心全年不间断运行。也正是基于这种情况使得我国数据中心耗电量持续增长。但在一个机房的数据中心中除了用于核心处理计算的it设备单元,还有其他的辅助配套设备,例如用于降温的空调单元,用于照明的单元等,这些设备同样也会增加一个机房的能耗供应,然而随着这些设备的线路老化,使得在电量耗能上也会逐步增加,进一步使得数据中心的整体耗能增大,降低数据中心的能源使用效率,增大数据中心的pue值。
3.本技术在基于历史数据的基础上,分析预测数据中心的pue值,方便机房运维人员对数据中心整体的能源利用率进行把控判定,同时本技术还分析预测数据中心各单元的在后续时间的能耗变化情况,辅助机房运维人员对各器件进行判定检测,避免器件的线路老化,造成不必要的耗能用电。而现有的技术方案中并没有针对数据中心能耗采取如本技术分析预测的方案内容。


技术实现要素:

4.本发明针对现有技术中的不足,提供一种针对数据中心能源利用效率的巡检方法,以解决背景技术中所提出的问题。
5.为实现上述目的,本发明采用以下技术方案:
6.一种针对数据中心能源利用效率的巡检方法,包括:
7.s1:针对数据中心中的各个单元,计算在当前时间段中各自在数据中心整体的能耗占比;
8.s2:针对数据中心中的各个单元并在基于马尔科夫链模型下,分析在下一时间段中各个单元的能耗变化;
9.s3:结合步骤s1以及步骤s2的数据内容,预测计算下一时间段数据中心的能源利用效率,以针对性对机房内数据中心的器件进行检测排查,防止器件老化,造成不必要的耗能用电。
10.为优化上述技术方案,采取的具体措施还包括:
11.进一步地,步骤s1的具体内容为:
12.所述数据中心中的各个单元包括有空调单元、风移热单元、配电系统单元、it设备单元;其中,it设备单元是数据中心运算核心,其在数据中心整体的能耗占比越高代表数据中心的能源利用率越高;
13.针对空调单元,基于历史数据统计获取上一时间段中空调单元所消耗的电能a1、当前时间段中空调单元所消耗的电能b1以及在上一时间段中空调单元在数据中心整体所消耗的电能占比x1,进而计算在当前时间段中空调单元的电量增降幅度c1,c1=(b
1-a1)/a1,根据增降幅度c1确定当前时间段中空调单元在数据中心整体所消耗的电能占比x1′
,x1′
=x
1-(x1*c1);其中所述上一时间段也称为上时段,当前时间段也称为本时段;
14.针对风移热单元,基于历史数据统计获取上一时间段中风移热单元所消耗的电能a2、当前时间段中风移热单元所消耗的电能b2以及在上一时间段中风移热单元在数据中心整体所消耗的电能占比x2,进而计算在当前时间段中风移热单元的电量增降幅度c2,c2=(b
2-a2)/a2,根据增降幅度c2确定当前时间段中风移热单元在数据中心整体所消耗的电能占比x2′
,x2′
=x
2-(x2*c2);
15.针对配电系统单元,基于历史数据统计获取上一时间段中配电系统单元所消耗的电能a3、当前时间段中配电系统单元所消耗的电能b3以及在上一时间段中配电系统单元在数据中心整体所消耗的电能占比x3,进而计算在当前时间段中配电系统单元的电量增降幅度c3,c3=(b
3-a3)/a3,根据增降幅度c3确定当前时间段中配电系统单元在数据中心整体所消耗的电能占比x3′
,x3′
=x
3-(x3*c3);
16.针对it设备单元,基于历史数据统计获取上一时间段中it设备单元所消耗的电能a4、当前时间段中it设备单元所消耗的电能b4以及在上一时间段中it设备单元在数据中心整体所消耗的电能占比x4,进而计算在当前时间段中it设备单元的电量增降幅度c4,c4=(b
4-a4)/a4,根据增降幅度c4确定当前时间段中it设备单元在数据中心整体所消耗的电能占比x4′
,x4′
=x
4-(x4*c4)。
17.进一步地,所述风移热单元包括有冷水机、加湿器、照明及辅助设备、开关或发电机;所述配电系统单元包括有ups和pdu;所述it设备单元包括有it设备cpu、进程负载。
18.进一步地,步骤s2的具体内容为:
19.针对空调单元,通过历史数据获取上时段空调单元的能耗转移概率【d1、e1】、本时段空调单元的能耗转移概率【d2、e2】、以及空调单元以外的其他单元能耗转移概率【d3、e3】,其中d1表示在上时段中空调单元的能耗转入概率,e1表示空调单元的能耗转出概率;d2表示在本时段中空调单元的能耗转入概率,e2表示空调单元的能耗转出概率;d3表示在本时段中空调单元以外的其他单元能耗转入至空调单元的能耗转移概率,e2表示空调单元以外的其他单元能耗不转入至空调单元的能耗转移概率;
20.进而基于马尔科夫链模型计算空调单元在下一时间段的能耗转移概率【d4、e4】;其中,d4表示在下一时间段中空调单元的能耗转入概率,也即下一时间段中空调单元能耗增加的概率,且d4=d1*d2+e1*d3,e4表示在下一时间段中空调单元的能耗转出概率,也即下一时间段中空调单元能耗降低的概率,且e4=d1*e2+e1*e3;
21.针对风移热单元,通过历史数据获取上时段风移热单元的能耗转移概率【f1、g1】、本时段风移热单元的能耗转移概率【f2、g2】、以及风移热单元以外的其他单元能耗转移概率【f3、g3】,其中f1表示在上时段中风移热单元的能耗转入概率,g1表示风移热单元的能耗转出概率;f2表示在本时段中风移热单元的能耗转入概率,g2表示风移热单元的能耗转出概率;f3表示在本时段中风移热单元以外的其他单元能耗转入至风移热单元的能耗转移概率,g3表示风移热单元以外的其他单元能耗不转入至风移热单元的能耗转移概率;
22.进而基于马尔科夫链模型计算风移热单元在下一时间段的能耗转移概率【f4、g4】;其中,f4表示在下一时间段中风移热单元的能耗转入概率,也即下一时间段中风移热单元能耗增加的概率,且f4=f1*f2+g1*f3,g4表示在下一时间段中风移热单元的能耗转出概率,也即下一时间段中风移热单元能耗降低的概率,且g4=f1*g2+g1*g3;
23.针对配电系统单元,通过历史数据获取上时段配电系统单元的能耗转移概率【h1、i1】、本时段配电系统单元的能耗转移概率【h2、i2】、以及配电系统单元以外的其他单元能耗转移概率【h3、i3】,其中h1表示在上时段中配电系统单元的能耗转入概率,i1表示配电系统单元的能耗转出概率;h2表示在本时段中配电系统单元的能耗转入概率,i2表示配电系统单元的能耗转出概率;h3表示在本时段中配电系统单元以外的其他单元能耗转入至配电系统单元的能耗转移概率,i3表示配电系统单元以外的其他单元能耗不转入至配电系统单元的能耗转移概率;
24.进而基于马尔科夫链模型计算配电系统单元在下一时间段的能耗转移概率【h4、i4】;其中,h4表示在下一时间段中配电系统单元的能耗转入概率,也即下一时间段中配电系统单元能耗增加的概率,且h4=h1*h2+i1*h3,i4表示在下一时间段中配电系统单元的能耗转出概率,也即下一时间段中配电系统单元能耗降低的概率,且i4=h1*i2+i1*i3;
25.针对it设备单元,通过历史数据获取上时段it设备单元的能耗转移概率【j1、k1】、本时段it设备单元的能耗转移概率【j2、k2】、以及it设备单元以外的其他单元能耗转移概率【j3、k3】,其中j1表示在上时段中it设备单元的能耗转入概率,k1表示it设备单元的能耗转出概率;j2表示在本时段中it设备单元的能耗转入概率,k2表示it设备单元的能耗转出概率;j3表示在本时段中it设备单元以外的其他单元能耗转入至it设备单元的能耗转移概率,k3表示it设备单元以外的其他单元能耗不转入至it设备单元的能耗转移概率;
26.进而基于马尔科夫链模型计算it设备单元在下一时间段的能耗转移概率【j4、k4】;其中,j4表示在下一时间段中it设备单元的能耗转入概率,也即下一时间段中it设备单元能耗增加的概率,且j4=j1*j2+k1*j3,k4表示在下一时间段中it设备单元的能耗转出概率,也即下一时间段中it设备单元能耗降低的概率,且k4=j1*k2+k1*k3。
27.进一步地,步骤s3的具体内容为:
28.针对下一时间段数据中心的能源利用效率,预测能源利用率降低的计算公式如下:
29.pue1=x1′
*d4+x2′
*f4+x3′
*h4+x4′
*j430.针对下一时间段数据中心的能源利用效率,预测能源利用率增加的计算公式如下:
31.pue2=x1′
*e4+x2′
*g4+x3′
*i4+x4′
*k432.因此,运维人员根据下一时间段数据中心能源利用效率增加或降低的预测情况,以及结合步骤s2中各个单元在下一时间段的能耗转移概率,对机房中数据中心的器件进行检测排查,以防止器件老化,造成不必要的耗能用电。
33.本发明的有益效果是:本技术通过分析计算下一时间段数据中心各个单元的能耗变化,以及根据该预测结果预测计算机房数据中心的pue值变化;根据这些数据可以使得机房运维人员可以根据预测数据辅助判断机房各单元器件的老化程度,以实现针对性的检查检测,防止各单元器件、线路的老化,造成不必要的耗能耗电。具体的,可以从预测计算的
pue值观察数据中心宏观整体的能源利用效率,然后从微观的各个单元能耗变化计算中具体分析哪一单元的老化风险较高,以使得针对性排查。
附图说明
34.图1是本发明实施例中上时段机房巡检能耗示意图。
35.图2是本发明实施例中本时段机房巡检能耗示意图。
36.图3是本发明实施例下时段空调能耗转移发生概率计算示意图。
具体实施方式
37.现在结合附图对本发明作进一步详细的说明。
38.本技术主要包括:数据中心智能管理模块和ai能耗分析两个模块。
39.一、对于数据中心智能管理模块,其包括有空调单元、风移热单元、it设备单元、配电系统单元。
40.1、空调单元
41.首先,通过巡检获得当前时段空调消耗的电量,单位(kwh),其次,分析历史能耗数据运算获得上时段能耗数据。机房中的冷却主要是由机房空调负责,所以降低机房空调的耗电量可以有效的降低机房的pue值;
42.以空调举例:通过历史数据统计总能耗和空调自身功率结合计算得出:本机房上时段空调占机房总能耗的15%。本小时空调消耗的电量1.28kwh与上一时段空调消耗的电量1.6kwh相减并除以上一时段消耗的电量得到升降幅比例为20%,即0.2,总耗电量降低0.32(kwh)=0.2x 1.6(kwh);其中:
43.本时段消耗的电量降幅20%计算过程如下:
44.(本时段-上时段)/上时段=正数表示能耗升高;
45.(本时段-上时段)/上时段=负数表示能耗降低;
46.结合本机房上时段空调占机房总功耗的15%得出,本时段数据中心的能耗占比为:12%,计算过程如下:
47.上时段(能耗)0.15-0.15x 0.2(本时段能耗降幅)=0.12;
48.进一步,请参阅图1和图2中实施例来看,在上时段所有精密空调对机房总的能耗占比为15%,在本时段所有精密空调对机房总的能耗占比为12%。
49.2、风移热单元
50.首先,风移热能耗主要由温湿度传感器监控的数据指标为主要依据,其硬件主要包括冷水机、加湿器、照明和辅助设备、开关装置/发电机;通过巡检获得当前时段各硬件的传感器的温度单位(℃),湿度单位(rh);
51.其次,获取历史传感器温湿度数据从而获得上时段传感器温湿度数据;机房中的风移热能耗指标主要指监控机房温湿度传感器获得的采集数据与上时段比较增减幅进行分析,所以通过降低机房风移热硬件(包括冷水机、加湿器、照明和辅助设备、开关装置/发电机温湿度)可以有效的降低机房的pue值;
52.以冷水机举例:通过历史数据统计属于风移热硬件类型上时段能耗计算得出:本机房上时段冷水机占机房总功耗的24%。本小时冷水机的相对湿度为rh(48%)与上一时段
冷水机的相对湿度rh(60%)相减并除以上一时段rh(60%)得到升降幅比例为20%,即,0.2,冷水机总能耗降低rh(20%)=rh(48%)-rh(60%)/rh(60%);其中:
53.本时段冷水机能耗降幅rh(20%)计算过程如下:
54.(本时段-上时段)/上时段=正数表示能耗升高;
55.(本时段-上时段)/上时段=负数表示能耗降低;
56.结合本机房上时段冷水机占机房总功耗的24%得出,本时段机房的冷水机能耗占比为19.2%,具体计算公式如下:
57.上时段(能耗)0.24-0.24x 0.2(本时段能耗降幅)=0.192;
58.同理,计算得出加湿器、照明和辅助设备、开关装置/发电机温湿度等能耗占比,并累加;
59.进一步,请参阅图1和图2中实施例来看,在上时段所有风移热对机房总的能耗占比为冷水机24%+加湿器3%+照明和辅助设备1%+开关装置/发电机1%=29%;在本时段所有风移热对机房总的能耗占比为25.2%。
60.3、it设备单元
61.首先,通过巡检获得本时段it设备cpu温度单位(℃)数据和进程级服务器负载能耗数据百分比单位(%)。其次,分析历史it设备能耗数据获得上时段能耗指标数据。机房中的it设备能耗指标主要组成部分包括由cpu温度和进程级服务器负载组成,所以降低这2部分可以有效的降低机房的it设备pue值;
62.以cpu温度举例:通过历史数据统计it设备上时段能耗得出:本机房cpu温度平均能耗占机房总能耗的30%。本小时it设备cpu温度的平均度数27(℃)与上一时段平均度数30(℃)相减并除以上时段it设备cpu温度的平均度数得到升降幅比例为0.1。总cpu温度降低3(℃)=0.1x 30(℃);其中:
63.本时段cpu温度平均度单位(℃)降幅10%计算过程如下:
64.(本时段-上时段)/上时段=正数表示cpu温度升高(能耗升高);
65.(本时段-上时段)/上时段=负数表示cpu温度降低(能耗降低);
66.结合本机房cpu温度上时段占机房总功耗的30%得出,本时段机房cpu温度能耗占比为0.27,具体计算公式如下:
67.上时段(能耗)0.3-0.3x 0.1(本时段降幅10%)=0.27;同理,计算得出进程级服务器负载能耗占比,并累加;
68.进一步,请参阅图1和图2中实施例来看,在上时段所有it设备单元总的能耗占比为47%;在本时段所有所有it设备单元总的能耗占比为42.3%。
69.4、配电系统单元
70.首先,通过巡检获得本时段配电系统能耗数据千伏安,单位(kva)。其次,分析历史配电系统能耗数据运算获得上时段能耗指标。机房中的配电系统主要组成部分包括ups和pdu,所以降低机房ups和pdu的耗电量可以有效的降低机房的pue值;
71.以ups举例,通过历史数据统计总功耗和ups自身功率结合计算得出:本机房ups占机房总功耗的6%。本小时ups消耗的电量5kva与上一时段ups消耗的电量10(kva)相减并除以上时段ups消耗的电量10(kva)得到升降幅比例为0.5,总ups耗电量降低5(kva)=0.5x 10(kva);其中:
72.本时段ups能耗5(kva)降幅50%计算过程如下:
73.(本时段-上时段)/上时段=正数表示ups能耗升高;
74.(本时段-上时段)/上时段=负数表示ups能耗降低;
75.结合本机房ups上时段占机房总功耗的6%得出,本时段数据中心的ups能耗占比为:0.03。具体计算公式如下:
76.上时段(能耗)0.06-0.06x 0.5(本时段能耗降幅)=0.03;同理,计算得出pdu能耗占比,并累加;
77.进一步的,请参阅图1和图2中实施例来看,在上时段所有配电系统单元总的能耗占比为9%;在本时段所有所有it设备单元总的能耗占比为5%。
78.二、对于ai能耗分析模块。
79.s1:通过构建不同能耗子模块模型生成智能巡检报表,来辅助运维人员进行判定检测;
80.1、基于马尔科夫链模型构建【空调单元模型】,通过结合历史大数据分析,设定本次转移能耗指标及下次能耗异常发生概率,具体举例如下:
81.例1:(马尔可夫链模型需要的三组数据)
82.1)、上时段空调能耗转移的概率【0.3、0.7】;其中0.3表示上时段中空调单元的能耗转入概率,0.7表示上时段中空调单元的能耗转出概率;
83.2)、本时段空调能耗转移的概率【0.6、0.4】;其中0.6表示在本时段中空调单元的能耗转入概率,0.4表示本时段空调单元的能耗转出概率;
84.3)、本时段其他能耗转移到空调的概率【0.3、0.7】;其中0.3表示在本时段中空调单元以外的其他单元能耗转入至空调单元的能耗转移概率,0.7表示空调单元以外的其他单元能耗不转入至空调单元的能耗转移概率;
85.参考附图3,运算得出下时段空调能耗转移发生概率【0.39 0.61】,具体计算过程如下:
86.下时段空调能耗转入发生概率0.3x0.6+0.3x0.7=0.39
87.下时段空调能耗转出发生概率0.3x0.4+0.7x0.7=0.61
88.2、构建【风移热单元模型】结合历史数据分析得到本次转移能耗指标及下次能耗异常发生概率。同例1
89.3、构建【it设备单元模型】结合历史数据分析得到本次转移能耗指标及下次能耗异常发生概率。同例1
90.4、构建【配电系统单元模型】结合历史数据分析得到本次转移能耗指标及下次能耗异常发生概率。同例1
91.通过上述内容生成智能巡检报表的部分内容。
92.s2、将模型运算结果,下时段能耗转移概率更新到巡检报表。通过历史数据和巡检数据预测下次能耗变化概率,从而获得pue预测值。生成完整的智能巡检报表;
93.参考图1和图2:
94.上时段数据中心基础设施能耗占53%,it设备耗电量为47%。数据中心的能源使用效率(pue值)为:(53%+47%)/47%=2.13
95.本时段数据中心基础设施能耗占42.2%,it设备耗电量为42.3%。数据中心的能
源使用效率(pue值)为:(42.2%+42.3%)/42.3%=1.99
96.综上内容可知:
97.针对下一时间段数据中心的能源利用效率,预测能源利用率降低的计算公式如下:(该实施例中为了简述方便,d
4-j4都采取空调单元例1的0.39,e
4-k4都采取空调单元例1的0.61)即应用例子1计算的【0.39 0.61】
98.pue1=(x1′
*d4+x2′
*f4+x3′
*h4+x4′
*j4)/(x4′
*j4)
99.=(0.12*0.39+0.252*0.39+0.05*0.39+0.423*0.39)/(0.423*0.39)=2;
100.针对下一时间段数据中心的能源利用效率,预测能源利用率增加的计算公式如下:
101.pue2=(x1′
*e4+x2′
*g4+x3′
*i4+x4′
*k4)/(x4′
*k4)
102.=(0.12*0.61+0.252*0.61+0.05*0.61+0.423*0.61)/(0.423*0.61)=2
103.由上内容可预测下一时间段数据中心的能源利用效率,即计算pue值.需注意的是由于都采用的是【0.39 0.61】,所以预测的增加、降低值是一样的,但在实际情况中存在区别;
104.进一步地,智能巡检报表内容及格式如表1所示:
105.表1完整的智能巡检报表
106.[0107][0108]
s3、将下时段巡检能耗结果与智能模型预测的能耗结果进行综合分析,协助数据中心节能系统的本时段巡检,同时预测下时段巡检能耗转移概率。预测概率大则需重点关注,概率小则说明目标状况健康。从而帮助数据中心分析能耗情况提供基于人工智能的数据参考。
[0109]
需补充关于pue概念的是:
[0110]
1、pue指的是power usageeffectiveness的简写,是数据中心消耗的所有能源与it负载消耗的能源的比值,是评价数据中心能源效率的最基本和最有效的指标之一。其具体计算公式为:pue=数据中心总能耗/it设备单元能耗。
[0111]
2、pue的影响:pue值越接近于1,表示一个数据中心的绿色化程度越高。当上述值超过1时,则表示数据中心需要额外电力开销以支持it负载。因此,pue的值越高,数据中心的整体效率越低。
[0112]
需要注意的是,发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
[0113]
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有2条留言
  • 136028... 来自[中国] 2023年03月28日 19:06
    非常实用非常实用
    0
  • 185603... 来自[中国] 2023年03月26日 16:58
    非常实用
    0
1