深度学习模型超参数训练方法、装置、设备以及存储介质与流程

文档序号:39439852发布日期:2024-09-20 22:40阅读:15来源:国知局
深度学习模型超参数训练方法、装置、设备以及存储介质与流程

本公开涉及计算机,尤其涉及一种深度学习模型超参数训练方法、装置、设备以及存储介质。


背景技术:

1、随着计算机技术的发展,深度学习模型例如卷积神经网络、生成对抗神经网络、长短期记忆神经网络等受到了越来越多的关注,而在深度学习模型的设计中通常包含众多可调超参数,通过对这些超参数的调整,能够对深度学习模型内部复杂的模块流程进行控制,使得深度学习模型可以在不同场景中实现性能最大化。

2、目前,通常由人工进行超参数调整,然而由于深度学习模型单次运行成本较高,超参数规模较大,人工调整超参数往往会是一个繁琐低效的流程,并且,人工进行超参数调整势必会引入不确定因素,导致调参准确性较差,有鉴于此,如何提高超参数调整效果,就成了目前亟待解决的技术问题。


技术实现思路

1、本公开的实施例提供了一种深度学习模型超参数训练方法、装置、设备以及存储介质。

2、第一方面,本公开的实施例提供了一种深度学习模型超参数训练方法,该方法包括:

3、获取深度学习模型对应的多个不同的超参数范围和多个不同的超参数搜索算法;

4、根据多个不同的超参数范围和多个不同的超参数搜索算法,生成深度学习模型对应的多个不同的超参数训练配置数据;

5、针对每个超参数训练配置数据,构建与其对应的容器,并在容器中使用超参数训练配置数据中的超参数范围和超参数搜索算法,以及深度学习模型对应的数据集,对深度学习模型进行超参数训练,并获取训练后的超参数以及模型性能指标;

6、根据多个不同的超参数训练配置数据对应的模型性能指标,从多个不同的超参数训练配置数据对应的超参数中,确定深度学习模型的目标超参数。

7、在第一方面的一些可实现方式中,获取深度学习模型对应的多个不同的超参数范围和多个不同的超参数搜索算法,包括:

8、根据深度学习模型的应用场景和模型特征,确定深度学习模型对应的多个不同的超参数范围和多个不同的超参数搜索算法。

9、在第一方面的一些可实现方式中,获取深度学习模型对应的多个不同的超参数范围和多个不同的超参数搜索算法,包括:

10、接收用户通过界面引导输入的深度学习模型对应的多个不同的超参数范围和多个不同的超参数搜索算法。

11、在第一方面的一些可实现方式中,任意两个超参数训练配置数据中的超参数范围和/或超参数搜索算法不同。

12、在第一方面的一些可实现方式中,构建与超参数训练配置数据对应的容器,包括:

13、根据超参数训练配置数据,预估深度学习模型运行所需资源的资源信息;

14、向kubernetes平台发送容器构建请求,其中,容器构建请求包括资源信息以及深度学习模型的标识信息,以用于kubernetes平台响应于容器构建请求,根据标识信息从预设的镜像仓库中获取深度学习模型对应的运行环境的镜像文件,根据资源信息,进行资源分配,以此建立对应的初始容器,并在初始容器中根据镜像文件搭建深度学习模型对应的运行环境。

15、在第一方面的一些可实现方式中,根据多个不同的超参数训练配置数据对应的模型性能指标,从多个不同的超参数训练配置数据对应的超参数中,确定深度学习模型的目标超参数,包括:

16、从多个不同的超参数训练配置数据对应的超参数中,选择模型性能指标最优的超参数训练配置数据对应的超参数作为深度学习模型的目标超参数。

17、在第一方面的一些可实现方式中,该方法还包括:

18、根据目标超参数对深度学习模型进行配置;

19、使用深度学习模型对应的数据集对配置后的深度学习模型进行参数训练,得到训练完成的深度学习模型。

20、第二方面,本公开的实施例提供了一种深度学习模型超参数训练装置,该装置包括:

21、获取模块,用于获取深度学习模型对应的多个不同的超参数范围和多个不同的超参数搜索算法;

22、生成模块,用于根据多个不同的超参数范围和多个不同的超参数搜索算法,生成深度学习模型对应的多个不同的超参数训练配置数据;

23、训练模块,用于针对每个超参数训练配置数据,构建与其对应的容器,并在容器中使用超参数训练配置数据中的超参数范围和超参数搜索算法,以及深度学习模型对应的数据集,对深度学习模型进行超参数训练,并获取训练后的超参数以及模型性能指标;

24、确定模块,用于根据多个不同的超参数训练配置数据对应的模型性能指标,从多个不同的超参数训练配置数据对应的超参数中,确定深度学习模型的目标超参数。

25、第三方面,本公开的实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如以上所述的方法。

26、第四方面,本公开的实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如以上所述的方法。

27、在本公开的实施例中,可以根据深度学习模型对应的多个不同的超参数范围和多个不同的超参数搜索算法,生成深度学习模型对应的多个不同的超参数训练配置数据,然后针对每个超参数训练配置数据,构建与其对应的容器,并在容器中使用超参数训练配置数据以及深度学习模型对应的数据集,对深度学习模型进行超参数训练,并获取训练后的超参数以及模型性能指标,进而根据多个不同的超参数训练配置数据对应的模型性能指标,从多个不同的超参数训练配置数据对应的超参数中,确定深度学习模型的目标超参数。如此可以实现基于云原生的自动化超参数训练,有效提高超参数调整效果。

28、应当理解,
技术实现要素:
部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。



技术特征:

1.一种深度学习模型超参数训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取深度学习模型对应的多个不同的超参数范围和多个不同的超参数搜索算法,包括:

3.根据权利要求1所述的方法,其特征在于,所述获取深度学习模型对应的多个不同的超参数范围和多个不同的超参数搜索算法,包括:

4.根据权利要求1所述的方法,其特征在于,任意两个超参数训练配置数据中的超参数范围和/或超参数搜索算法不同。

5.根据权利要求1所述的方法,其特征在于,构建与超参数训练配置数据对应的容器,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述多个不同的超参数训练配置数据对应的模型性能指标,从所述多个不同的超参数训练配置数据对应的超参数中,确定所述深度学习模型的目标超参数,包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.一种深度学习模型超参数训练装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使计算机执行权利要求1-7中任一项所述的方法。


技术总结
本公开的实施例提供了一种深度学习模型超参数训练方法、装置、设备以及存储介质,应用于计算机技术领域。该方法包括:获取深度学习模型对应的多个不同的超参数范围和多个不同的超参数搜索算法,并以此生成深度学习模型对应的多个不同的超参数训练配置数据,针对每个超参数训练配置数据,构建与其对应的容器,并在容器中使用超参数训练配置数据以及深度学习模型对应的数据集,对深度学习模型进行超参数训练,并获取训练后的超参数以及模型性能指标;根据多个不同的超参数训练配置数据对应的模型性能指标,从多个不同的超参数训练配置数据对应的超参数中,确定深度学习模型的目标超参数。以此方式,可以有效提高超参数调整效果。

技术研发人员:张美娜,马龙帮,张海陆,程揭章,高玉坤,李海东,韩德昕,刘俊杰
受保护的技术使用者:中科星图北岸科技(青岛)有限公司
技术研发日:
技术公布日:2024/9/19
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1