本发明属于数据中心风冷控制,具体来说,涉及一种适用于近场风墙微模块的协同控制优化方法。
背景技术:
1、近场风墙空调是目前换热效率最高的数据中心风冷技术之一,其被广泛应用于各种高功率密度数据中心。但就实际工程而言,目前近场风墙微模块的it系统与冷却系统的节能调度是分开执行的,即it系统的云平台通常采用最少活跃服务器的调度策略,而近场风墙空调则采用基于送/回风温度的反馈控制策略(通常根据送风温度控制风机频率,并根据回风温度控制盘管蒸发温度),二者之间缺乏有效协同,导致易出现局部热点及过度冷却等问题,造成了it系统与冷却系统能耗的此消彼长,并对数据中心的安全稳定造成了极大的影响。
2、为了提高近场风墙空调的精准供冷能力,一种有效的方式是根据微模块内服务器的实时功率变化,对服务器的芯片温度进行预测,以对近场风墙空调各末端风量及盘管蒸发温度进行调控。但受限于流体输配及热容特性,以近场风墙空调为代表的冷却系统在供冷过程中,具有显著的时滞性和调控精度问题,难以动态匹配各服务器的散热量变化。因此,该技术未能从根本上解决数据中心的冷热错配问题。
技术实现思路
1、本发明提供一种适用于近场风墙微模块的协同控制优化方法,解决近场风墙微模块在节能调度中易出现局部热点及过度冷却的技术问题,以提高近场风墙微模块的整体能效和运行稳定性。
2、为解决上述技术问题,本发明采用如下技术方案:
3、本发明提供一种适用于近场风墙微模块的协同控制优化方法,包括以下步骤:
4、步骤10,获取近场风墙微模块在预设时间段内的it系统调度数据和空调系统数据,分别建立微模块服务器实时功耗模型、空调系统功耗模型和服务器温度快速预测模型;
5、步骤20,基于微模块服务器实时功耗模型、空调系统功耗模型和服务器温度快速预测模型,采用实时联合和定时解耦相结合的优化方法,对虚拟机部署及空调系统进行协同控制。
6、作为本发明的进一步改进,所述it系统调度数据包括虚拟机cpu资源需求、虚拟机与服务器间映射关系、各服务器cpu使用率、各服务器实时功耗和各服务器芯片温度;所述空调系统数据包括各末端模块的风机频率、盘管蒸发温度、外机冷凝温度、负荷率和空调系统总功耗。
7、作为本发明的进一步改进,所述步骤10中,根据it系统调度数据,建立微模块服务器实时功耗模型;
8、具体包括:
9、步骤101,从it系统调度数据中筛选出各服务器在不同的芯片温度及cpu使用率下的功耗数据;
10、步骤102,根据各服务器在cpu使用率为0状态下的功耗数据,建立服务器静态功耗矩阵;
11、步骤103,根据各服务器实时功耗随cpu使用率的变化数据,采用多元线性回归方法拟合出各服务器的cpu使用率与动态功耗的转换系数,构成cpu使用率与动态功耗的转换系数矩阵;
12、步骤104,根据各服务器在同一cpu使用率下芯片的不同温度数据,采用多元线性回归方法拟合出各服务器泄漏功耗的表达式,构成服务器泄漏功耗矩阵;
13、步骤105,将服务器静态功耗矩阵、cpu使用率与运行功耗的转换系数矩阵和服务器泄漏功耗矩阵相结合,得到式(1)所示的微模块服务器实时功耗模型:
14、ppm(t)=psc(t)+uvm(t)*mmvm→pm(a(t),f(t))*fh+d(tpm(t)) 式(1)
15、式中,ppm(t)表示服务器实时功耗矩阵,psc(t)表示服务器静态功耗矩阵,uvm(t)表示虚拟机的cpu资源需求矩阵,mmvm→pm(a(t),f(t))表示虚拟机与服务器间的映射矩阵,a(t)表示虚拟机实时部署矩阵,f(t)表示虚拟机迁移矩阵,uvm(t)*mmvm→pm(a(t),f(t))表示服务器的cpu使用率,fh表示cpu使用率与动态功耗的转换系数矩阵,d(tpm(t))表示服务器泄漏功耗矩阵。
16、作为本发明的进一步改进,所述步骤10中,根据空调系统数据,建立式(2)所示的空调系统功耗模型:
17、pfc(t)=pcp(tco(t),tev(t),plr(t))+σpfx(fp(t)) 式(2)
18、式中,pfc(t)表示空调系统总功耗,pcp(tco(t),tev(t),plr(t))表示外机功耗,tco(t)表示盘管蒸发温度,tev(t)表示外机冷凝温度,plr(t)表示负荷率,fp(t)表示各末端模块的风机频率矩阵,pfx(fp(t))表示各末端模块功耗矩阵。
19、作为本发明的进一步改进,所述步骤10中,根据it系统调度数据和空调系统数据,建立服务器温度快速预测模型;
20、具体包括:
21、步骤131,从it系统调度数据中筛选出虚拟机与服务器间映射关系、虚拟机cpu资源需求和各服务器芯片温度,从空调系统数据中筛选出各末端模块的风机频率和盘管蒸发温度,构成建模数据集;
22、步骤132,基于建模数据集,将各末端模块的风机频率、盘管蒸发温度和各服务器的cpu使用率作为bp神经网络模型的输入变量,将各服务器芯片温度作为bp神经网络模型的输出变量,对bp神经网络模型进行训练,得到服务器温度快速预测模型。
23、作为本发明的进一步改进,所述步骤20中,采用实时联合和定时解耦相结合的优化方法,对虚拟机部署及空调系统进行协同控制,包括:
24、步骤21,当云平台收到新虚拟机部署请求时,对新虚拟机的部署位置与各末端模块风机频率进行联合优化,以实现单个虚拟机部署下的服务器与各末端模块的整体功耗最低;
25、步骤22,每到给定时刻,先对各服务器上运行的虚拟机进行整体迁移,以使得服务器总功耗最低;然后对空调系统的盘管蒸发温度和各末端模块风机频率进行优化,以实现空调系统整体功耗最低。
26、作为本发明的进一步改进,所述步骤21具体包括:
27、步骤211,当云平台接收到新虚拟机的部署请求后,根据新虚拟机的cpu资源需求,对所有活跃服务器的剩余cpu资源进行遍历,以寻找可供部署的服务器;
28、步骤212,如果存在可供部署的服务器,则将可供部署的服务器位置作为新虚拟机部署的优化变量,并执行步骤213;如果所有活跃服务器的剩余cpu资源都无法部署新虚拟机,则随机将一台休眠服务器转入活跃状态,部署新虚拟机,并执行步骤214;
29、步骤213,以实现部署后的服务器实时总功耗与末端模块总功耗之和最低为优化目标,以各服务器上运行的所有虚拟机的使用资源之和不超过服务器额定资源总量,以及各服务器芯片温度不超过预设温度阈值为优化约束,采用遗传算法对新虚拟机部署位置与各末端模块的风机频率进行联合优化,得到最优的虚拟机实时部署位置和最优的各末端模块风机频率;由云平台根据最优的虚拟机实时部署位置落实新虚拟机的部署,由空调系统根据最优的各末端模块风机频率对各末端模块的风机频率进行控制;
30、步骤214,以实现新虚拟机部署后各末端模块功耗之和最低为优化目标,以各服务器芯片温度不能超过预设温度阈值为约束,采用遗传算法对各末端模块的风机频率进行优化,得到最优的各末端模块风机频率;由空调系统根据最优的各末端模块风机频率对各末端模块的风机频率进行控制。
31、作为本发明的进一步改进,所述步骤22具体包括:
32、步骤221,在给定时刻,根据服务器上运行的全部虚拟机数量及其cpu资源需求之和计算所需的最少活跃服务器台数;
33、步骤222,根据所需的最少活跃服务器台数,按机架编号顺序和各机架上服务器编号顺序选取服务器作为下一时段的活跃服务器,直到选取的服务器数量达到最少活跃服务器台数为止;
34、步骤223,依据负载均衡策略,将既有虚拟机均匀迁移至被选取的各活跃服务器上;休眠空闲服务器;
35、步骤224,以实现空调系统总功耗最低为优化目标,以各服务器芯片温度不超过预设温度阈值为约束,采用遗传算法对盘管蒸发温度和各末端模块的风机频率进行优化,得到最优的盘管蒸发温度和最优的各末端模块风机频率;
36、步骤225,由空调系统根据最优的盘管蒸发温度对盘管蒸发温度进行调控,并根据最优的各末端模块风机频率对各末端模块的风机频率进行控制。
37、与现有技术相比,本发明的技术方案具有以下有益效果:
38、本发明提供的一种适用于近场风墙微模块的协同控制优化方法,首先获取近场风墙微模块在预设时间段内的it系统调度数据和空调系统数据,分别建立近场风墙微模块的微模块服务器实时功耗模型、空调系统功耗模型和服务器温度快速预测模型;然后在控制阶段,采用实时部署优化时,对新到达虚拟机的部署位置和各末端模块的风机频率进行联合优化,提高服务器散热与空调末端供冷之间的实时匹配度,以减少微模块内局部热点和过冷出现的概率,从而实现单个虚拟机部署下的服务器与空调末端的整体功耗最低;采用定时解耦优化时,在给定时间节点先对各服务器上运行的虚拟机进行整体迁移,以使得服务器的总功耗最低,在此基础上,对空调系统的盘管蒸发温度和各末端模块的风机频率进行优化,以实现空调系统整体功耗最低,并促成服务器散热与空调供冷之间的定时高度匹配,从而进一步提高冷量的利用效率;通过实时联合优化与定时解耦优化的配合,可实现近场风墙微模块的整体能效和运行稳定性的提升。本发明方法从服务器与近场风墙空调的协同控制入手,旨在从根本上解决数据中心的冷热错配,以实现服务器与近场风墙空调的整体能效最优。