任务处理方法、装置及存储介质与流程

文档序号:30379115发布日期:2022-06-11 03:03阅读:来源:国知局

技术特征:
1.一种任务处理方法,其特征在于,应用于计算集群,所述计算集群包括多个计算节点;所述方法包括:当目标任务在待调度队列中的排队时间大于阈值时,在所述多个计算节点中确定n个目标计算节点;所述目标任务为执行时需要多个计算节点的算力的任务,所述n为大于或等于2的整数;在所述目标任务被调度时,利用所述n个目标计算节点执行所述目标任务。2.根据权利要求1所述的方法,其特征在于,所述目标任务的资源清单文件包括容忍参数,所述方法还包括:将所述n个目标计算节点添加污点标记;所述污点标记与所述容忍参数有关。3.根据权利要求2所述的方法,其特征在于,在所述目标任务被调度时,利用所述n个目标计算节点执行所述目标任务,包括:在所述目标任务被调度时,查找与所述容忍参数匹配的污点标记所对应的n个目标计算节点;利用所述n个目标计算节点执行所述目标任务。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:在所述目标任务被调度完毕时,删除所述n个目标计算节点的污点标记。5.根据权利要求2-4任一项所述的方法,其特征在于,所述容忍参数与所述污点标记均包括键名key、键值value和效果effect。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:获取所述待调度队列中提交时间最早且带有容忍参数的任务,得到所述目标任务。7.根据权利要求1-4任一项所述的方法,其特征在于,所述目标任务的资源清单文件包括任务规模;在所述多个计算节点中确定n个目标计算节点,包括:根据所述任务规模确定需要的机柜数量m;其中,所述机柜中包括多个计算节点;分别计算所述计算集群中任一个机柜的计算节点的图形处理器gpu资源分配率之和;确定m个所述gpu资源分配率之和最小的机柜,得到所述m个机柜中的n个所述目标计算节点。8.根据权利要求7所述的方法,其特征在于,所述任务规模包括执行所述目标任务所需的gpu卡数k,所述m与所述k、所述机柜中的计算节点的数量和所述机柜中的计算节点包括的gpu卡的数量有关。9.根据权利要求1-4任一项所述的方法,其特征在于,所述目标任务的资源清单文件包括任务规模;在所述多个计算节点中确定n个目标计算节点,还包括:根据所述任务规模在所述多个机柜中抢占n个目标计算节点。10.一种任务处理装置,其特征在于,应用于计算集群,所述计算集群包括多个计算节点;所述装置包括:任务调度模块,用于当目标任务在待调度队列中的排队时间大于阈值时,在所述多个计算节点中确定n个目标计算节点;所述目标任务为执行时需要多个计算节点的算力的任务,所述n为大于或等于2的整数;任务执行模块,用于在所述目标任务被调度时,利用所述n个目标计算节点执行所述目标任务。
11.一种终端设备,其特征在于,包括:存储器和处理器;所述存储器用于存储计算机指令;所述处理器用于运行所述存储器存储的所述计算机指令实现权利要求1-9中任一项所述的方法。12.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-9中任一项所述的方法。

技术总结
本申请提供一种任务处理方法、装置及存储介质,应用于大数据领域,包括:当目标任务在待调度队列中的排队时间大于阈值时,在多个计算节点中确定N个目标计算节点;在目标任务被调度时,利用N个目标计算节点执行目标任务。本申请的方法,通过判断目标任务的排队时间,确定目标任务是否需要优先调度,当目标任务需调度时,选定目标计算节点并基于目标计算节点执行目标任务,这样减少其他任务的“插队”,也减少了目标任务的排队时间。了目标任务的排队时间。了目标任务的排队时间。


技术研发人员:尹雷 董建波
受保护的技术使用者:阿里巴巴(中国)有限公司
技术研发日:2022.03.21
技术公布日:2022/6/10
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1