基于深度学习和大数据的云计算系统的制作方法

文档序号：32613738发布日期：2022-12-20 20:50阅读：28来源：国知局

1.本发明属于云计算领域，涉及深度强化学习技术，具体是基于深度学习和大数据的云计算系统。

背景技术：

2.当前，云计算技术可谓是计算机服务领域最热门的话题之一。大到行业的领袖企业，如ibm、google，小到一些私人企业，甚至一些乐于追求新技术的技术人员，都在部署或研究云计算，希望通过云计算来巩固或提升自己在行业的地位。云计算环境中采用虚拟化技术，将服务器整体虚拟化为一个数据资源池，由于数据资源种类多、规模大，因此云计算数据资源调度成为云计算研究的热点之一；
3.目前的大多数任务调度算法采用的是先来先服务或短作业优先等较为固定的调度方法；难以满足日益复杂的任务调度情况；而考虑到云平台的每次任务调度即为一次决策，使用深度强化学习可较好的训练出任务调度决策模型；
4.为此，提出基于深度学习和大数据的云计算系统。

技术实现要素：

5.本发明旨在至少解决现有技术中存在的技术问题之一。为此，本发明提出基于深度学习和大数据的云计算系统，该基于深度学习和大数据的云计算系统设置任务收集模块收集云平台接收到的任务数据并将任务根据使用的处理器进行分类；设置云平台数据收集模块预先收集云平台的数据存储空间、cpu计算算力以及gpu计算算力；设置历史数据收集模块收集云平台历史的任务处理数据；设置深度强化学习模型训练模块根据云平台的历史的任务处理数据训练出可对任务选择进行决策的深度强化学习模型；设置任务调度模块使用训练完成的深度强化学习模型云平台的任务选择决策；解决了云平台任务智能调度的问题。
6.为实现上述目的，根据本发明的第一方面的实施例提出基于深度学习和大数据的云计算系统，包括任务收集模块、云平台数据收集模块、历史数据收集模块、深度强化学习模型训练模块以及任务调度模块；其中，各个模块之间通过电气方式连接；
7.其中，所述任务收集模块主要用于收集云平台接收到的任务数据并将任务进行分类；
8.所述任务收集模块将所有任务分为两类；具体的，将使用cpu运算的任务标记为c类；将使用gpu运算的任务标记为g类；进一步的，将所有c类任务保存在任务集合c中；将所有g类任务保存在任务集合g中；任务集合c中的任务标记为c，任务集合g中的任务标记为g；对于任务c，将其所需要的存储空间标记为mc；需要的算力大小标记为cc；将其处理时长标记为tc；对于任务g，将其所需要的存储空间标记为mg；需要的算力大小标记为cg；将其处理时长标记为tg；所述任务收集模块将收集的任务集合c和任务集合g中的任务发送至任务调度模块；
9.其中，所述云平台数据收集模块主要用于预先收集云平台的基础数据；
10.所述云平台数据收集模块预先收集的基础数据包括：云平台的存储空间上限、cpu单位时间运算算力上限以及gpu单位时间运算算力上限；将云平台的存储空间上限标记为mmax；将cpu单位时间运算算力标记为cmax；将gpu单位时间运算算力标记为gmax；
11.所述云平台数据收集模块将收集的云平台基础数据发送至深度强化学习模型训练模块；
12.其中，所述历史数据收集模块主要用于收集云平台历史的任务处理数据；
13.所述历史数据收集模块预先收集的任务处理数据包括历史上云平台接收到的数据处理任务信息以及云平台信息；所述历史数据收集模块收集的数据处理任务信息包括每个任务的种类、任务到达时间、任务需要的存储空间、任务需要的单位时间计算算力以及任务需要的计算时长；将历史任务使用任务集合形式保存；当新的任务到达云平台时，云平台先将其加入任务集合；当任务从任务集合被云平台调取并执行时，将其从任务集合中删除；
14.其中，所述云平台信息包括云平台在每个任务到达时刻的剩余存储空间、cpu剩余单位时间处理算力、gpu剩余单位时间处理算力以及正在处理的每个任务所消耗的存储空间、单位时间算力以及剩余处理时长；将云平台剩余存储空间标记为rm、将cpu剩余单位时间处理算力标记为rc以及将gpu剩余单位时间处理算力标记为rg；
15.所述历史数据收集模块将收集的云平台历史任务处理数据发送至深度强化学习模型训练模块；
16.其中，所述深度强化学习模型训练模块主要用于训练出从任务集合中选择最优数据处理任务进行处理的深度强化学习模型；
17.深度强化学习模型需要为每个决策产生的结果生成奖励函数；所述决策为同时从任务集合中选取若干数据处理任务进行处理；其中，奖励函数包括奖励以及惩罚；
18.所述深度强化学习模型训练模块每次决策所产生的奖励可以包括选择的数据处理任务的数量以及选择的数据处理任务的总等待时长；将选择的数据处理任务集合标记为s；任务集合中任务的数量标记n；任务集合s中每个任务c或g的等待时长即为当前时间减去其到达云平台的时间；将任务c和g的等待时长分别标记为wc以及wg；则任务集合s中的所有任务的总等待时长w即为w＝∑
c∈s
wc+∑
g∈s
wg；则奖励函数j可表示为j＝a*n+b*w；其中，a和b分别为预设的奖励系数；
19.所述深度强化学习模型训练模块每次决策所产生的惩罚可以包括：任务集合s中的任务总需求存储空间超出云平台剩余存储空间rm时的惩罚、总的cpu算力需求超出云平台剩余cpu单位时间算力rc时的惩罚、总的gpu算力需求超出云平台剩余gpu单位时间算力rg时的惩罚、剩余的任务需要等待的总时长以及剩余任务的平均体量大小；其中，将所述剩余任务的平均体量标记为v；则平均体量v的计算公式为其中，o和k均为预设的比例系数；可以理解的是，当平均体量v的值较大时，说明剩余的任务体量均较大，从而惩罚更重，因此，完成对任务体量较大的数据处理任务的补偿；
20.所述深度强化学习模型训练模块以最大化奖励函数和惩罚函数的差值为训练目标，使用历史数据收集模块发送的历史任务数据进行深度强化学习模型的训练；并将训练
完成的深度强化学习模型标记为m；所述深度强化学习模型训练模块将训练完成的深度强化学习模型m发送至任务调度模块；
21.所述任务调度模块主要使用深度强化学习模型m从任务集合中选择最优的若干任务进行处理；
22.所述任务调度模块接收到深度强化学习模型m后，在云平台完成一项任务，留出空余的存储空间、cpu计算算力以及gpu计算算力时，使用深度强化学习模型m从任务集合中选择最优的任务组合，根据任务的种类，分别使用云平台的cpu以及gpu进行处理。
23.与现有技术相比，本发明的有益效果是：
24.本发明设置任务收集模块收集云平台接收到的任务数据并将任务根据使用的处理器进行分类；设置云平台数据收集模块预先收集云平台的数据存储空间、cpu计算算力以及gpu计算算力；设置历史数据收集模块收集云平台历史的任务处理数据；设置深度强化学习模型训练模块根据云平台的历史的任务处理数据训练出可对任务选择进行决策的深度强化学习模型；设置任务调度模块使用训练完成的深度强化学习模型云平台的任务选择决策；解决了云平台任务智能调度的问题。
附图说明
25.图1为本发明的原理图。
具体实施方式
26.下面将结合实施例对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。
27.如图1所示，基于深度学习和大数据的云计算系统，包括任务收集模块、云平台数据收集模块、历史数据收集模块、深度强化学习模型训练模块以及任务调度模块；其中，各个模块之间通过电气方式连接；
28.其中，所述任务收集模块主要用于收集云平台接收到的任务数据并将任务进行分类；
29.可以理解的是，云平台接收到的每个任务具有数据存储、计算算力以及计算时长的需求；且每个任务所使用计算用处理器有cpu和gpu两个选择；每个任务在发送至云平台时，即可估算出该任务所需要的数据存储空间、使用的处理器类型、需要的算力大小以及处理时长；
30.在一个优选的实施例中，所述任务收集模块将所有任务分为两类；具体的，将使用cpu运算的任务标记为c类；将使用gpu运算的任务标记为g类；进一步的，将所有c类任务保存在任务集合c中；将所有g类任务保存在任务集合g中；任务集合c中的任务标记为c，任务集合g中的任务标记为g；对于任务c，将其所需要的存储空间标记为mc；需要的算力大小标记为cc；将其处理时长标记为tc；对于任务g，将其所需要的存储空间标记为mg；需要的算力大小标记为cg；将其处理时长标记为tg；所述任务收集模块将收集的任务集合c和任务集合g中的任务发送至任务调度模块；
31.其中，所述云平台数据收集模块主要用于预先收集云平台的基础数据；
32.可以理解的是，云平台的主要作用为对接收到的数据处理任务进行处理；云平台处理每个任务均需要一定的数据存储空间，计算算力以及计算时长；而云平台的数据存储空间以及计算算力是有限的；
33.在一个优选的实施例中，所述云平台数据收集模块预先收集的基础数据包括：云平台的存储空间上限、cpu单位时间运算算力上限以及gpu单位时间运算算力上限；将云平台的存储空间上限标记为mmax；将cpu单位时间运算算力标记为cmax；将gpu单位时间运算算力标记为gmax；
34.所述云平台数据收集模块将收集的云平台基础数据发送至深度强化学习模型训练模块；
35.其中，所述历史数据收集模块主要用于收集云平台历史的任务处理数据；
36.在一个优选的实施例中，所述历史数据收集模块预先收集的任务处理数据包括历史上云平台接收到的数据处理任务信息以及云平台信息；具体的，所述历史数据收集模块收集的数据处理任务信息包括每个任务的种类、任务到达时间、任务需要的存储空间、任务需要的单位时间计算算力以及任务需要的计算时长；将历史任务使用任务集合形式保存；当新的任务到达云平台时，云平台先将其加入任务集合；当任务从任务集合被云平台调取并执行时，将其从任务集合中删除；
37.其中，所述云平台信息包括云平台在每个任务到达时刻的剩余存储空间、cpu剩余单位时间处理算力、gpu剩余单位时间处理算力以及正在处理的每个任务所消耗的存储空间、单位时间算力以及剩余处理时长；将云平台剩余存储空间标记为rm、将cpu剩余单位时间处理算力标记为rc以及将gpu剩余单位时间处理算力标记为rg；
38.所述历史数据收集模块将收集的云平台历史任务处理数据发送至深度强化学习模型训练模块；
39.其中，所述深度强化学习模型训练模块主要用于训练出从任务集合中选择最优数据处理任务进行处理的深度强化学习模型；
40.可以理解的是，深度强化学习模型需要为每个决策产生的结果生成奖励函数；所述决策为同时从任务集合中选取若干数据处理任务进行处理；其中，奖励函数包括奖励以及惩罚；
41.在一个优选的实施例中，所述深度强化学习模型训练模块每次决策所产生的奖励可以包括选择的数据处理任务的数量以及选择的数据处理任务的总等待时长；将选择的数据处理任务集合标记为s；任务集合中任务的数量标记n；任务集合s中每个任务c或g的等待时长即为当前时间减去其到达云平台的时间；将任务c和g的等待时长分别标记为wc以及wg；则任务集合s中的所有任务的总等待时长w即为w＝∑
c∈s
wc+∑
g∈s
wg；则奖励函数j可表示为j＝a*n+b*w；其中，a和b分别为预设的奖励系数；
42.可以理解的是，该奖励设置将会优先从任务集合中选择等待时间较长以及任务体量较小的数据处理任务；可能会导致任务体量较大的数据处理任务无法得到执行；因此，通过设置每次决策的惩罚函数进行补偿；
43.所述深度强化学习模型训练模块每次决策所产生的惩罚可以包括：任务集合s中的任务总需求存储空间超出云平台剩余存储空间rm时的惩罚、总的cpu算力需求超出云平
台剩余cpu单位时间算力rc时的惩罚、总的gpu算力需求超出云平台剩余gpu单位时间算力rg时的惩罚、剩余的任务需要等待的总时长以及剩余任务的平均体量大小；其中，将所述剩余任务的平均体量标记为v；则平均体量v的计算公式为其中，o和k均为预设的比例系数；可以理解的是，当平均体量v的值较大时，说明剩余的任务体量均较大，从而惩罚更重，因此，完成对任务体量较大的数据处理任务的补偿；
44.所述深度强化学习模型训练模块以最大化奖励函数和惩罚函数的差值为训练目标，使用历史数据收集模块发送的历史任务数据进行深度强化学习模型的训练；并将训练完成的深度强化学习模型标记为m；所述深度强化学习模型训练模块将训练完成的深度强化学习模型m发送至任务调度模块；
45.其中，所述任务调度模块主要使用深度强化学习模型m从任务集合中选择最优的若干任务进行处理；
46.在一个优选的实施例中，所述任务调度模块接收到深度强化学习模型m后，在云平台完成一项任务，留出空余的存储空间、cpu计算算力以及gpu计算算力时，使用深度强化学习模型m从任务集合中选择最优的任务组合，根据任务的种类，分别使用云平台的cpu以及gpu进行处理。
47.以上实施例仅用以说明本发明的技术方法而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方法进行修改或等同替换，而不脱离本发明技术方法的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赖汝珍
技术所有人：赖汝珍
我是此专利的发明人

上一篇：一种780MPa增强塑性双相钢及其制备方法与流程
上一篇：一种基于VR技术的室内消防应急模拟系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。