针对终端训练模型的内存优化方法、系统、设备及介质与流程

文档序号:35996122发布日期:2023-11-16 08:19阅读:来源:国知局

技术特征:

1.一种针对终端训练模型的内存优化方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种针对终端训练模型的内存优化方法,其特征在于,所述获取所述终端内模型的模型结构和内存访问情况,包括:

3.根据权利要求2所述的一种针对终端训练模型的内存优化方法,其特征在于,所述获取所述多个算子输出的张量所对应的内存指标,包括:

4.根据权利要求2所述的一种针对终端训练模型的内存优化方法,其特征在于,所述云端基于所述内存访问情况和所述第二计算图,生成内存分配方案,包括:

5.根据权利要求4所述的一种针对终端训练模型的内存优化方法,其特征在于,所述基于所述多个张量的内存占用量排列顺序,将所述云端上的模拟内存按二维装箱方法分配给所述张量,包括:

6.根据权利要求5所述的一种针对终端训练模型的内存优化方法,其特征在于,所述终端基于所述第二计算图修订所述模型,并基于所述内存分配方案分配所述终端为训练所述模型所配置的内存,包括:

7.一种针对终端训练模型的内存优化系统,其特征在于,所述系统包括统计模块、第一计算图生成模块、第二计算图生成模块、内存分配方案生成模块和执行模块;

8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的一种针对终端训练模型的内存优化方法。

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的一种针对终端训练模型的内存优化方法。


技术总结
本申请提供一种针对终端训练模型的内存优化方法、系统、设备及介质,属于数据处理领域。方法包括:终端获取自身内部署的模型的模型结构和内存访问情况;将内存访问情况和模型结构发送到云端;云端基于模型结构,生成第一计算图,第一计算图用于表征模型内多个算子的拓扑顺序;云端基于第一计算图,生成第二计算图;云端基于内存访问情况和第二计算图,生成内存分配方案,内存分配方案用于分配终端为训练模型所配置的内存;云端将第二计算图和内存分配方案发送到终端;终端基于第二计算图修订模型,并基于内存分配方案分配终端为训练模型所配置的内存,以执行模型训练。本申请旨在训练模型的过程中减少训练所占据的内存。

技术研发人员:赵凤英,王启鹏,陈震鹏,陆璇
受保护的技术使用者:北京泛睿科技合伙企业(有限合伙)
技术研发日:
技术公布日:2024/1/16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1