一种资源调度方法、资源调度装置以及计算机存储介质与流程

文档序号:40832629发布日期:2025-02-06 17:08阅读:2来源:国知局
一种资源调度方法、资源调度装置以及计算机存储介质与流程

本申请涉及分布式计算任务调度,特别是涉及一种资源调度方法、资源调度装置以及计算机存储介质。


背景技术:

1、kubernetes(k8s)是一款开源的集群管理系统,它允许硬件以资源的方式注册并进行管理使用,目前,nvidi(英伟达)官方开源了一款在kubernetes上使用的gpu(graphicsprocessing unit,图形处理器)插件,但是这个插件只能使用单一gpu,无法虚拟化方式使用。例如,在某些场景下,ai(artificial intelligence,人工智能)模型在计算或者推理时,不需要占用整卡gpu,但单个图像处理器无法同时运行多个训练任务或者推理任务,将会大大降低图像处理器的利用率。‌


技术实现思路

1、为解决上述技术问题,本申请提出了一种资源调度方法、资源调度装置以及计算机存储介质。

2、为解决上述技术问题,本申请提出了一种资源调度方法,所述资源调度方法应用于一种资源调度系统,所述资源调度系统包括:虚拟资源计算模块、计算任务调度模块,以及计算节点;所述资源调度方法包括:

3、所述虚拟资源计算模块基于计算任务,获取物理图像处理器卡的虚拟图像处理器卡信息;

4、所述计算任务调度模块将所述虚拟图像处理器卡信息提交到集群管理系统,由所述集群管理系统将所述虚拟图像处理器卡信息调度到所述计算节点;

5、所述计算节点基于所述虚拟图像处理器卡信息获取对应的目标虚拟图像处理器卡;

6、所述计算节点将所述目标虚拟图像处理器卡映射挂在到所述集群管理系统中的容器,以通过所述目标虚拟图像处理器卡执行所述计算任务。

7、其中,所述资源调度系统还包括任务生命周期管理模块;

8、所述资源调度方法,还包括:

9、所述任务生命周期管理模块根据所述计算任务调度模块下发的托管任务,对所述集群管理系统的容器中目标虚拟图像处理器卡执行的任务状态进行监听。

10、其中,所述计算节点包括节点代理和图像处理器虚拟化插件;

11、所述计算节点基于所述虚拟图像处理器卡信息获取对应的目标虚拟图像处理器卡,包括:

12、所述节点代理将所述虚拟图像处理器卡信息发送至所述图像处理器虚拟化插件;

13、所述图像处理器虚拟化插件根据所述虚拟图像处理器卡信息获取目标虚拟图像处理器卡的虚拟标识码,以及所述目标虚拟图像处理器卡所在目标物理图像处理器卡的物理标识码;

14、所述图像处理器虚拟化插件根据所述物理标识码,将所述目标物理图像处理器卡映射挂载到所述集群管理系统中的容器,以运行所述目标虚拟图像处理器卡。

15、其中,所述资源调度方法,还包括:

16、所述图像处理器虚拟化插件获取物理图像处理器卡的物理标识码;

17、所述图像处理器虚拟化插件将每一个物理图像处理器卡虚拟化为若干虚拟图像处理器卡,且生成每一个虚拟图像处理器卡的虚拟标识码;

18、所述图像处理器虚拟化插件构造图像处理器卡表,将所有物理图像处理器卡的物理标识码作为所述图像处理器卡表的值,将所有虚拟图像处理器卡的虚拟标识码作为所述图像处理器卡表的键,并将所述图像处理器卡表上报到所述集群管理系统。

19、其中,所述虚拟资源计算模块基于计算任务,获取物理图像处理器卡的虚拟图像处理器卡信息,包括:

20、所述虚拟资源计算模块从所述集群管理系统请求物理图像处理器卡信息;

21、所述虚拟资源计算模块比对所述物理图像处理器卡信息和所述计算任务的用户信息,获取用户类型;

22、响应于所述用户类型为历史用户,所述虚拟资源计算模块将所述计算任务分配到所述历史用户所使用的物理图像处理器卡,生成所述物理图像处理器卡的虚拟图像处理器卡信息;

23、响应于所述用户类型为新建用户,所述虚拟资源计算模块将所述计算任务分配到空闲的物理图像处理器卡,生成所述物理图像处理器卡的虚拟图像处理器卡信息。

24、其中,所述虚拟资源计算模块基于计算任务,获取物理图像处理器卡的虚拟图像处理器卡信息,包括:

25、响应于所述计算任务为训练任务,所述虚拟资源计算模块根据所述物理图像处理器卡的所有虚拟图像处理器卡,生成所述虚拟图像处理器卡信息;

26、响应于所述计算任务为推理任务,所述虚拟资源计算模块根据用户指定信息,生成分配物理图像处理器卡的虚拟图像处理器卡信息。

27、其中,所述虚拟资源计算模块将所述计算任务分配到所述历史用户所使用的物理图像处理器卡,生成所述物理图像处理器卡的虚拟图像处理器卡信息,包括:

28、所述虚拟资源计算模块获取所述历史用户所使用的物理图像处理器卡的空置虚拟图像处理器卡数量;

29、所述虚拟资源计算模块遍历所述历史用户所使用的所有物理图像处理器卡,判断是否存在所述物理图像处理器卡的空置虚拟图像处理器卡数量满足所述计算任务的虚拟图像处理器卡所需数量;

30、若是,确定所述物理图像处理器卡的虚拟图像处理器卡信息。

31、其中,所述资源调度方法,还包括:

32、响应于所述历史用户所使用的所有物理图像处理器卡中不存在所述空置虚拟图像处理器卡数量满足所述计算任务的虚拟图像处理器卡所需数量的物理图像处理器卡,所述虚拟资源计算模块将所述计算任务分配到空闲的物理图像处理器卡,生成所述物理图像处理器卡的虚拟图像处理器卡信息。

33、为解决上述技术问题,本申请还提出一种资源调度装置,所述资源调度装置包括存储器以及与所述存储器耦接的处理器;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现如上述的资源调度方法。

34、为解决上述技术问题,本申请还提出一种计算机存储介质,所述计算机存储介质用于存储程序数据,所述程序数据在被计算机执行时,用以实现上述的资源调度方法。

35、与现有技术相比,本申请的有益效果是:本申请的资源调度系统包括:虚拟资源计算模块、计算任务调度模块,以及计算节点;所述资源调度方法包括:所述虚拟资源计算模块基于计算任务,获取物理图像处理器卡的虚拟图像处理器卡信息;所述计算任务调度模块将所述虚拟图像处理器卡信息提交到集群管理系统,由所述集群管理系统将所述虚拟图像处理器卡信息调度到所述计算节点;所述计算节点基于所述虚拟图像处理器卡信息获取对应的目标虚拟图像处理器卡;所述计算节点将所述目标虚拟图像处理器卡映射挂在到所述集群管理系统中的容器,以通过所述目标虚拟图像处理器卡执行所述计算任务。通过上述资源调度方法,结合图像处理器卡虚拟化技术,实现在整卡物理图像处理器上运行多个计算任务,有利于提高图像处理器的利用率。



技术特征:

1.一种资源调度方法,其特征在于,所述资源调度方法应用于一种资源调度系统,所述资源调度系统包括:虚拟资源计算模块、计算任务调度模块,以及计算节点;所述资源调度方法包括:

2.根据权利要求1所述的资源调度方法,其特征在于,

3.根据权利要求1所述的资源调度方法,其特征在于,

4.根据权利要求3所述的资源调度方法,其特征在于,

5.根据权利要求1所述的资源调度方法,其特征在于,

6.根据权利要求5所述的资源调度方法,其特征在于,

7.根据权利要求5所述的资源调度方法,其特征在于,

8.根据权利要求7所述的资源调度方法,其特征在于,

9.一种资源调度装置,其特征在于,所述资源调度装置包括存储器以及与所述存储器耦接的处理器;

10.一种计算机存储介质,其特征在于,所述计算机存储介质用于存储程序数据,所述程序数据在被计算机执行时,用以实现如权利要求1至8任一项所述的资源调度方法。


技术总结
本申请提出一种资源调度方法、资源调度装置以及计算机存储介质。所述资源调度方法包括:虚拟资源计算模块基于计算任务,获取物理图像处理器卡的虚拟图像处理器卡信息;计算任务调度模块将虚拟图像处理器卡信息提交到集群管理系统,由集群管理系统将虚拟图像处理器卡信息调度到计算节点;计算节点基于虚拟图像处理器卡信息获取对应的目标虚拟图像处理器卡;计算节点将目标虚拟图像处理器卡映射挂在到集群管理系统中的容器,以通过目标虚拟图像处理器卡执行计算任务。通过上述资源调度方法,结合图像处理器卡虚拟化技术,实现在整卡物理图像处理器上运行多个计算任务,有利于提高图像处理器的利用率。

技术研发人员:江达秀,骆昕,朱家晟
受保护的技术使用者:浙江大华技术股份有限公司
技术研发日:
技术公布日:2025/2/5
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1