本发明涉及数据中心仿真,尤其涉及一种数据中心运行仿真的优化方法及装置。
背景技术:
1、本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
2、随着互联网技术的快速发展,对于大数据计算的需求也越来越大,数据中心的地位也越来越突出。为了使数据中心能够安全地运行,保证服务器在安全温度范围内工作至关重要。
3、目前,为了保证服务器在安全温度范围内工作,大多是通过对数据中心机柜产热、空调系统制冷等物理过程进行建模仿真从而求解出最优的控制策略。
4、但是,由于数据中心建模涉及的物理过程较多,其运行仿真需要消耗较多计算资源,同时,数据中心最优控制策略的筛选需要对各种控制策略的效果进行评估,这对于仿真平台的计算能力提出了更大的要求,然而实际过程中,计算资源极其有限,且对计算时间有限制,因此,如何在数据中心运行仿真过程中,在保障找出数据中心最优控制策略的同时最大限度地减少计算资源的消耗成为了亟待解决的技术问题。
技术实现思路
1、本发明实施例提供一种数据中心运行仿真的优化方法,用以在数据中心运行仿真时,在确保找出数据中心最优控制策略的同时,减少计算资源的消耗,该方法包括:
2、构建数据中心仿真模型;所述数据中心仿真模型包括第一状态预测模型和第二状态预测模型;所述数据中心仿真模型是为强化学习算法提供仿真环境的;所述第一状态预测模型的精确度小于第二状态预测模型的精确度;
3、获取数据中心的状态数据集和动作数据集,所述状态数据集为模拟的数据中心任一时刻的状态数据;动作数据集为根据动作生成规则生成的动作数据;
4、将数据中心的状态数据集和动作数据集输入第一状态预测模型,得到在执行动作数据集中的动作数据之后,第一状态预测模型预测的下一状态数据集;
5、根据预设的状态安全判定条件,判断第一状态预测模型预测的下一状态数据集是否满足状态安全判定条件;所述状态安全判定条件是根据第一状态预测模型预测的精确度设置的;
6、在第一状态预测模型预测的下一状态数据集满足状态安全判定条件的情况下,将数据中心的状态数据集和动作数据集输入第二状态预测模型,得到执行动作数据集中的动作数据之后,第二状态预测模型预测的下一状态数据集;
7、利用状态数据集、动作数据集和第二状态预测模型预测的下一状态数据集对强化学习算法的网络参数进行优化,得到训练好的强化学习算法;
8、利用训练好的强化学习算法确定数据中心的实时状态数据集对应的动作数据集,将实时状态数据集对应的动作数据集确定为数据中心的控制策略。
9、本发明实施例还提供一种数据中心运行仿真的优化装置,用以在数据中心运行仿真时,在确保找出数据中心最优控制策略的同时,减少计算资源的消耗,该装置包括:
10、模型构建模快,用于构建数据中心仿真模型;所述数据中心仿真模型包括第一状态预测模型和第二状态预测模型;所述数据中心仿真模型是为强化学习算法提供仿真环境的;所述第一状态预测模型的精确度小于第二状态预测模型的精确度;
11、数据获取模块,用于获取数据中心的状态数据集和动作数据集,所述状态数据集为模拟的数据中心任一时刻的状态数据;动作数据集为根据动作生成规则生成的动作数据;
12、第一处理模块,用于将数据中心的状态数据集和动作数据集输入第一状态预测模型,得到在执行动作数据集中的动作数据之后,第一状态预测模型预测的下一状态数据集;
13、判断模块,用于根据预设的状态安全判定条件,判断第一状态预测模型预测的下一状态数据集是否满足状态安全判定条件;所述状态安全判定条件是根据第一状态预测模型预测的精确度设置的;
14、第二处理模块,用于在第一状态预测模型预测的下一状态数据集满足状态安全判定条件的情况下,将数据中心的状态数据集和动作数据集输入第二状态预测模型,得到执行动作数据集中的动作数据之后,第二状态预测模型预测的下一状态数据集;
15、训练模块,用于利用状态数据集、动作数据集和第二状态预测模型预测的下一状态数据集对强化学习算法的网络参数进行优化,得到训练好的强化学习算法;
16、动作确定模块,用于利用训练好的强化学习算法确定数据中心的实时状态数据集对应的动作数据集,将实时状态数据集对应的动作数据集确定为数据中心的控制策略。
17、本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述数据中心运行仿真的优化方法。
18、本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述数据中心运行仿真的优化方法。
19、本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述数据中心运行仿真的优化方法。
20、本发明实施例中,构建数据中心仿真模型;所述数据中心仿真模型包括第一状态预测模型和第二状态预测模型;所述数据中心仿真模型是为强化学习算法提供仿真环境的;所述第一状态预测模型的精确度小于第二状态预测模型的精确度;获取数据中心的状态数据集和动作数据集,所述状态数据集为模拟的数据中心任一时刻的状态数据;动作数据集为根据动作生成规则生成的动作数据;将数据中心的状态数据集和动作数据集输入第一状态预测模型,得到在执行动作数据集中的动作数据之后,第一状态预测模型预测的下一状态数据集;根据预设的状态安全判定条件,判断第一状态预测模型预测的下一状态数据集是否满足状态安全判定条件;所述状态安全判定条件是根据第一状态预测模型预测的精确度设置的;在第一状态预测模型预测的下一状态数据集满足状态安全判定条件的情况下,将数据中心的状态数据集和动作数据集输入第二状态预测模型,得到执行动作数据集中的动作数据之后,第二状态预测模型预测的下一状态数据集;利用状态数据集、动作数据集和第二状态预测模型预测的下一状态数据集对强化学习算法的网络参数进行优化,得到训练好的强化学习算法;利用训练好的强化学习算法确定数据中心的实时状态数据集对应的动作数据集,将实时状态数据集对应的动作数据集确定为数据中心的控制策略。与现有技术中数据中心的运行仿真技术方案相比,通过精确度较小的第一状态预测模型可以快速确定出当前状态的下一状态数据,然后根据预设的状态安全判定条件,对当前状态所执行的动作进行筛选,只有筛选通过的动作,才可以利用精确度较高的第二状态预测模型进行仿真,以及利用仿真数据对强化学习算法的网络参数进行优化,这样,避免了使用精确度较高的第二状态预测模型评估无效动作,有效减少了在不可能成为最优控制策略的动作的计算资源消耗,从而可以实现在数据中运行仿真时,在确保找出数据中心最优控制策略的同时,减少计算资源的消耗。
1.一种数据中心运行仿真的优化方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述数据中心的状态数据集包括如下至少一项状态数据:数据中心的各冷通道测点温度、各热通道测点温度、机房空调风机转速、冷却水的供水温度、冷却水的回水温度、冷冻水的供水温度、冷冻水的回水温度;
3.如权利要求1所述的方法,其特征在于,根据预设的状态安全判定条件,判断第一状态预测模型预测的下一状态数据集是否满足状态安全判定条件之后,还包括:
4.如权利要求1所述的方法,其特征在于,根据预设的状态安全判定条件,判断第一状态预测模型预测的下一状态数据集是否满足状态安全判定条件之后,还包括:
5.如权利要求1所述的方法,其特征在于,将数据中心的状态数据集和动作数据集输入第一状态预测模型,得到在执行动作数据集中的动作数据之后,第一状态预测模型预测的下一状态数据集之前,还包括:
6.如权利要求5所述的方法,其特征在于,利用历史状态数据集和历史动作数据集确定第一状态预测模型的参数之后,还包括:
7.如权利要求6所述的方法,其特征在于,利用第一状态预测模型预测的下一历史状态数据集,和第二状态预测模型预测的下一历史状态数据集,确定第一状态预测模型的精确度,包括:
8.如权利要求6所述的方法,其特征在于,计算第一状态预测模型的误差数据之后,还包括:
9.一种数据中心运行仿真的优化装置,其特征在于,包括:
10.如权利要求9所述的装置,其特征在于,所述数据中心的状态数据集包括如下至少一项状态数据:数据中心的各冷通道测点温度、各热通道测点温度、机房空调风机转速、冷却水的供水温度、冷却水的回水温度、冷冻水的供水温度、冷冻水的回水温度;
11.如权利要求9所述的装置,其特征在于,还包括标记模块,用于在判断模块根据预设的状态安全判定条件,判断第一状态预测模型预测的下一状态数据集是否满足状态安全判定条件之后:
12.如权利要求9所述的装置,其特征在于,还包括初始化模块,用于在判断模块在根据预设的状态安全判定条件,判断第一状态预测模型预测的下一状态数据集是否满足状态安全判定条件之后:
13.如权利要求9所述的装置,其特征在于,还包括模型确定模块,用于在第一处理模块将数据中心的状态数据集和动作数据集输入第一状态预测模型,得到在执行动作数据集中的动作数据之后,第一状态预测模型预测的下一状态数据集之前:
14.如权利要求13所述的装置,其特征在于,还包括精度确定模块,用于在模型确定模块利用历史状态数据集和历史动作数据集确定第一状态预测模型的参数之后:
15.如权利要求14所述的装置,其特征在于,精度确定模块,具体用于:
16.如权利要求15所述的装置,其特征在于,还包括条件设置模块,用于在精度确定模块计算第一状态预测模型的误差数据之后:
17.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8任一所述方法。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任一所述方法。
19.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任一所述方法。