一种异构资源调度系统及方法与流程

文档序号:32793979发布日期:2023-01-03 21:53阅读:来源:国知局

技术特征:
1.一种异构资源调度系统,其特征在于,包括样本库、模型创建模块、模型库、服务模块和异构资源集群;异构资源集群包括计算集群和调度模块;模型创建模块用于接收模型构建任务,根据模型构建任务从样本库获取已标注的样本生成训练样本集,以及根据模型构建任务创建ai模型;基于训练样本集和ai模型生成训练请求;调度模块用于根据训练请求调度计算集群进行ai模型的训练;模型创建模块还用于对训练后的ai模型进行测试,判断准确度是否满足要求,若满足要求,将训练后的ai模型发送至模型库;模型库用于部署接收的ai模型,还用于接收服务模块的模型调用请求;基于模型调用请求选择对应的ai模型生成模型运行请求;调度模块还用于根据模型运行请求调度计算集群运行对应的ai模型。2.根据权利要求1所述的异构资源调度系统,其特征在于:所述调度模块还用于监控计算集群的剩余算力资源,预估训练请求和模型运行请求的算力资源使用量,判断算力资源使用量是否大于剩余算力资源,若大于,对训练请求和模型运行请求进行排序,其中,模型运行请求的优先级高于训练请求的优先级。3.根据权利要求1所述的异构资源调度系统,其特征在于:所述模型创建模块包括模型仓库、模型训练单元、样本生成单元和模型测试单元;样本生成单元用于根据模型构建任务从样本库获取已标注的样本生成训练样本集;模型训练单元用于根据模型构建任务从模型仓库中选择初始模型,对初始模型进行参数设置,创建ai模型;模型测试单元用于对训练后的ai模型进行测试。4.根据权利要求3所述的异构资源调度系统,其特征在于:所述模型库还用于将ai模型输出的带有标注的结果发送至样本生成模块;样本生成模块还用于对带有标注的结果进行分类,并存入对应训练样本集。5.根据权利要求1所述的异构资源调度系统,其特征在于:所述计算集群包括若干cpu和若干gpu。6.一种异构资源调度方法,其特征在于,包括如下内容:ai模型创建:接收模型构建任务,根据模型构建任务从样本库获取已标注的样本生成训练样本集,以及根据模型构建任务创建ai模型;训练请求生成:基于训练样本集和ai模型生成训练请求;模型测试:对训练后的ai模型进行测试,判断准确度是否满足要求,若满足要求,将训练后的ai模型部署;模型调用:接收ai模型调用请求;基于模型调用请求选择对应的已部署ai模型生成模型运行请求;资源调度:根据训练请求调度计算集群进行ai模型的训练,以及根据模型运行请求调度计算集群运行对应的ai模型。7.根据权利要求6所述的异构资源调度方法,其特征在于:资源调度步骤中,还监控计算集群的剩余算力资源,预估训练请求和模型运行请求的算力资源使用量,判断算力资源
使用量是否大于剩余算力资源,若大于,对训练请求和模型运行请求进行排序,其中,模型运行请求的优先级高于训练请求的优先级。8.根据权利要求6所述的异构资源调度方法,其特征在于:所述ai模型创建步骤,具体包括:获取样本:根据模型构建任务从样本库获取已标注的样本生成训练样本集;模型创建:根据模型构建任务从模型仓库中选择初始模型,对初始模型进行参数设置,创建ai模型。9.根据权利要求8所述的异构资源调度方法,其特征在于:ai模型创建步骤还包括:样本扩增:从已部署的ai模型获取带有标注的结果,对带有标注的结果进行分类,并存入对应训练样本集。10.根据权利要求6所述的异构资源调度方法,其特征在于:所述资源调度步骤中,计算集群包括若干cpu和若干gpu。

技术总结
本发明涉及数据处理技术领域,具体公开了一种异构资源调度系统及方法,其中系统包括样本库、模型创建模块、模型库、服务模块和异构资源集群;异构资源集群包括计算集群和调度模块;模型创建模块用于从样本库获取已标注的样本生成训练样本集,以及创建AI模型;生成训练请求;调度模块用于根据训练请求调度计算集群进行AI模型的训练;模型创建模块还用于将训练后的AI模型发送至模型库;模型库用于部署接收的AI模型,还用于接收服务模块的模型调用请求;基于模型调用请求选择对应的AI模型生成模型运行请求;调度模块还用于根据模型运行请求调度计算集群运行对应的AI模型。采用本发明的技术方案能够满足多应用对算力资源的需求。技术方案能够满足多应用对算力资源的需求。技术方案能够满足多应用对算力资源的需求。


技术研发人员:任启 李坚 吴佳 李平舟 董振祥 王海 秀春男 高晓婧
受保护的技术使用者:国网冀北电力有限公司 国家电网有限公司
技术研发日:2022.09.22
技术公布日:2023/1/2
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1