1.本技术涉及人工智能技术领域,具体而言,本技术涉及一种超参数确定方法、装置、设备及存储介质。
背景技术:2.在机器学习过程中,超参数是在开始学习过程之前设置、并在训练过程中不断调整的参数,不能直接从机器学习模型训练过程中的数据中学习,需要预先定义。
3.目前对于机器学习模型的超参数的设置和调整,需要人工进行不断地尝试,选择最终的最优超参数,这种方式耗时长,工作量大,且效率低。
技术实现要素:4.本技术的主要目的为提供一种超参数确定方法、装置、设备及存储介质,以快速筛选出最优超参数。
5.为了实现上述发明目的,本技术提供一种超参数确定方法,其包括以下步骤:
6.获取机器学习模型,为机器学习模型随机生成多组随机超参数组,其中,每组所述随机超参数组包括一个或多个超参数;
7.调用预先训练好的超参数生成模型分别对每组随机超参数组进行评分,并从所述多组随机超参数组中筛选出评分最高的随机超参数组,得到第一超参数组;
8.将所述第一超参数组配置至所述机器学习模型中,获取训练数据,将所述训练数据输入配置了所述第一超参数组的所述机器学习模型中进行训练,输出第一训练效果;所述第一训练效果包括所述第一超参数组对应的第一训练效果评分;
9.将所述第一超参数组及第一训练效果输入所述超参数生成模型,调用所述超参数生成模型对所述第一超参数组的超参数进行调整,得到第二超参数组;
10.将所述第二超参数组配置至所述机器学习模型中,并将所述训练数据输入配置了所述第二超参数组的所述机器学习模型中进行训练,输出第二训练效果;所述第二训练效果包括所述第二超参数组对应的第二训练效果评分;
11.将所述第二超参数组及第二训练效果输入所述超参数生成模型,调用所述超参数生成模型对所述第二超参数组的超参数进行调整,得到第三超参数组;
12.循环往复,直至得到超过预设数量的超参数组,且没有出现训练效果评分更高的超参数组,则将训练效果评分最高的超参数组筛选为目标超参数组。
13.优选地,所述第一训练效果评分包括多个第一训练效果子评分,所述调用所述超参数生成模型对所述第一超参数组的超参数进行调整,得到第二超参数组的步骤,包括:
14.调用所述超参数生成模型提取所述第一训练效果评分的多个第一训练效果子评分;其中,各所述第一训练效果子评分用于评估所述机器学习模型一个维度的训练效果;
15.从所述多个第一训练效果子评分中筛选出评分低于预设值的目标第一训练效果子评分;
16.确定影响所述目标第一训练效果子评分的因子,根据所述因子对所述第一超参数组的超参数进行调整,得到第二超参数组。
17.进一步地,所述将所述第一超参数组及第一训练效果输入所述超参数生成模型之前,还包括:
18.获取各个所述第一训练效果子评分对应的权重;
19.将各个所述第一训练效果子评分按照对应的权重进行加权求和,得到所述第一训练效果评分。
20.优选地,所述机器学习模型包括决策树分类模型,所述将所述训练数据输入配置了所述第一超参数组的所述机器学习模型中进行训练,包括:
21.从所述训练数据中随机抽取n个训练样本;
22.基于决策树算法对所述n个训练样本进行训练,得到n个训练后的决策树分类模型;
23.判断所述n个训练后的决策树分类模型的训练结果是否都满足要求;
24.若是,将所述n个训练后的决策树分类模型进行组合,得到目标机器学习模型;所述目标机器学习模型为完成训练的机器学习模型。
25.优选地,所述训练结果包括损失值,所述判断所述n个训练后的决策树分类模型的训练结果是否都满足要求,包括:
26.利用预设的损失函数分别计算训练后的每个训练后的决策树分类模型的损失值;
27.判断所述每个训练后的决策树分类模型的损失值是否都低于预设损失值;
28.若是,则判定所述n个训练后的决策树分类模型完成训练。
29.优选地,所述获取训练数据,包括:
30.获取初始数据,对所述初始数据进行预处理,并利用预处理后的所述初始数据建立所述机器学习模型的训练数据。
31.优选地,所述对所述初始数据进行预处理,包括:
32.将所述初始数据分割为多个子数据块,并根据数据结构分别为每个子数据块分配唯一的标识符;
33.遍历所有标识符,对应各个标识符保留唯一一个数据块,去除其他具有相同标识符的数据块,得到去除重复数据的所述初始数据。
34.本技术还提供一种超参数确定装置,其包括:
35.生成模块,用于获取机器学习模型,为机器学习模型随机生成多组随机超参数组,其中,每组所述随机超参数组包括一个或多个超参数;
36.调用模块,用于调用预先训练好的超参数生成模型分别对每组随机超参数组进行评分,并从所述多组随机超参数组中筛选出评分最高的随机超参数组,得到第一超参数组;
37.配置模块,用于将所述第一超参数组配置至所述机器学习模型中,获取训练数据,将所述训练数据输入配置了所述第一超参数组的所述机器学习模型中进行训练,输出第一训练效果;所述第一训练效果包括所述第一超参数组对应的第一训练效果评分;
38.输入模块,用于将所述第一超参数组及第一训练效果输入所述超参数生成模型,调用所述超参数生成模型对所述第一超参数组的超参数进行调整,得到第二超参数组;
39.配置模块,还用于将所述第二超参数组配置至所述机器学习模型中,并将所述训
练数据输入配置了所述第二超参数组的所述机器学习模型中进行训练,输出第二训练效果;所述第二训练效果包括所述第二超参数组对应的第二训练效果评分;
40.输入模块,还用于将所述第二超参数组及第二训练效果输入所述超参数生成模型,调用所述超参数生成模型对所述第二超参数组的超参数进行调整,得到第三超参数组,循环往复,直至得到超过预设数量的超参数组,且没有出现训练效果评分更高的超参数组;
41.筛选模块,用于将训练效果评分最高的超参数组筛选为目标超参数组。
42.本技术还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
43.本技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述方法的步骤。
44.本技术所提供的一种超参数确定方法、装置、设备及存储介质,为机器学习模型随机生成多组随机超参数组,调用预先训练好的超参数生成模型分别对每组随机超参数组进行评分,并从多组随机超参数组中筛选出评分最高的随机超参数组,以得到较优的第一超参数组,用于后续配置至机器学习模型,以便快速得到最优的超参数组;将第一超参数组配置至机器学习模型中,获取训练数据,将训练数据输入配置了第一超参数组的所述机器学习模型中进行训练,输出第一训练效果,将第一超参数组及第一训练效果输入超参数生成模型,调用超参数生成模型对第一超参数组的超参数进行调整,得到第二超参数组;将第二超参数组配置至所述机器学习模型中,并将训练数据输入配置了第二超参数组的机器学习模型中进行训练,输出第二训练效果;将第二超参数组及第二训练效果输入超参数生成模型中,得到第三超参数组,循环往复,直至得到超过预设数量的超参数组,且没有出现训练效果评分更高的超参数组,则将训练效果评分最高的超参数组筛选为目标超参数组,以通过将每次训练得到的训练效果评分以及当前超参数组输入超参数生成模型中进行评估,使用超参数生成模型指导下一次超参数组的调整,以通过人工智能的方式自动调整超参数组,提高最优超参数的获取效率。
附图说明
45.图1为本技术一实施例的超参数确定方法的流程示意图;
46.图2为本技术一实施例的超参数确定装置的结构示意框图;
47.图3为本技术一实施例的计算机设备的结构示意框图。
48.本技术目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
49.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
50.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
51.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
52.参考图1,本技术提出一种超参数确定方法,以服务器为执行主体,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
53.本技术中,该超参数确定方法以解决当前对于机器学习模型的超参数的设置和调整,需要人工进行不断地尝试,选择最终的最优超参数,这种方式效率低的技术问题,参照图1,其中一个实施例中,该超参数确定方法包括如下步骤:
54.s11、获取机器学习模型,为机器学习模型随机生成多组随机超参数组,其中,每组所述随机超参数组包括一个或多个超参数;
55.s12、调用预先训练好的超参数生成模型分别对每组随机超参数组进行评分,并从所述多组随机超参数组中筛选出评分最高的随机超参数组,得到第一超参数组;
56.s13、将所述第一超参数组配置至所述机器学习模型中,获取训练数据,将所述训练数据输入配置了所述第一超参数组的所述机器学习模型中进行训练,输出第一训练效果;所述第一训练效果包括所述第一超参数组对应的第一训练效果评分;
57.s14、将所述第一超参数组及第一训练效果输入所述超参数生成模型,调用所述超参数生成模型对所述第一超参数组的超参数进行调整,得到第二超参数组;
58.s15、将所述第二超参数组配置至所述机器学习模型中,并将所述训练数据输入配置了所述第二超参数组的所述机器学习模型中进行训练,输出第二训练效果;所述第二训练效果包括所述第二超参数组对应的第二训练效果评分;
59.s16、将所述第二超参数组及第二训练效果输入所述超参数生成模型,调用所述超参数生成模型对所述第二超参数组的超参数进行调整,得到第三超参数组;
60.s17、循环往复,直至得到超过预设数量的超参数组,且没有出现训练效果评分更高的超参数组,则将训练效果评分最高的超参数组筛选为目标超参数组。
61.如上述步骤s11所述,随机超参数组可人工设定或计算机设备根据机器学习模型所需要的超参数随机设置的超参数组,该随机超参数组包括一个或多个超参数,具体数量根据机器学习模型的特性设定。其中,机器学习模型为未训练的神经网络模型,如分类模型、自然语言处理模型等等。随机超参数组中包括至少一个超参数,在机器学习的上下文中,超参数是在开始学习过程之前设置值的参数,通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果。
62.如上述步骤s12所述,超参数生成模型用于评估随机生成的随机超参数组,为每组随机超参数组生成一个评分,如根据每组超参数组中的超参数的数量及对应数值是否合理进行评估,生成每组超参数组对应的评分。本实施例基于生成的评分,从多组随机超参数组中筛选出评分最高的随机超参数组,将评分最高的随机超参数组作为第一超参数组。
63.如上述步骤s13所述,第一训练效果评分用于表征机器学习模型配置第一超参数组的训练效果的优劣程度,即可用于表征按照第一超参数组训练得到的机器学习模型的训
练效果,训练效果比如机器学习模型对实体识别的准确性。其中,训练数据根据所需训练的机器学习模型的类型进行获取,例如,机器学习模型为实体识别模型时,则训练数据为文本数据。
64.如上述步骤s14所述,本步骤的超参数生成模型为神经网络模型,还用于根据训练效果对原超参数组进行调整,生成新的超参数组。具体的,将机器学习模型输出的第一训练效果、随机生成的第一超参数组输入所述超参数生成模型中,利用超参数生成模型根据第一训练效果对第一超参数组中的超参数进行调整,将调整超参数后的第一超参数组作为第二超参数组。例如,当第一训练效果中表征机器学习模型的训练效率较慢时,则查询第一超参数组中与训练效率相关的超参数,对其进行调整,以得到第二超参数组,使后续对机器学习模型进行训练时,提高机器学习模型的训练效率。
65.如上述步骤s15所述,第二训练效果评分用于表征第二超参数组的优劣程度,具体可用于表征按照第二超参数组训练得到的机器学习模型的训练效果,训练效果比如准确性。本步骤将超参数生成模型生成的第二超参数组配置至机器学习模型中,并将训练数据输入配置了第二超参数组的机器学习模型中进行再次训练,得到第二训练效果。
66.如上述步骤s16
‑
s17所述,本步骤的超参数生成模型根据第二训练效果对第二超参数组进行再次调整,将调整超参数后的第二超参数组作为第三超参数组,并将第三超参数组配置至机器学习模型中进行再次训练,循环往复,即利用超参数生成模型调整后的超参数组对机器学习模型进行多次训练,并在每次训练后,将机器学习模型的训练效果及原超参数组再次输入超参数生成模型中,生成新的超参数组,以此类推,直至达到迭代停止条件,迭代停止条件是停止迭代优化过程的条件或依据,比如迭代次数大于或等于预设迭代次数且没有出现训练效果评分更高的超参数组,或者,超参数组的数量大于预设数量且没有出现训练效果评分更高的超参数组。比如,预设迭代次数为20次,则超参数组也是20组,且在20组中,连续后面5组中没有出现训练效果评分比之前更高的超参数组,则达到迭代停止条件,在此不作具体限定。
67.其中,预设数量是预先设定的超参数组的数量,比如20。超参数组中的超参数个数由相应的机器学习算子确定,比如机器学习算子为随机森林,超参数组中包括学习率和树的数目两个超参数。超参数组具体可包括一个或多个待优化的超参数。
68.本技术所提供的一种超参数确定方法,通过为机器学习模型随机生成多组随机超参数组,调用预先训练好的超参数生成模型分别对每组随机超参数组进行评分,并从多组随机超参数组中筛选出评分最高的随机超参数组,以得到较优的第一超参数组,用于后续配置至机器学习模型,以便快速得到最优的超参数组;将第一超参数组配置至机器学习模型中,获取训练数据,将训练数据输入配置了第一超参数组的所述机器学习模型中进行训练,输出第一训练效果,将第一超参数组及第一训练效果输入超参数生成模型,调用超参数生成模型对第一超参数组的超参数进行调整,得到第二超参数组;将第二超参数组配置至所述机器学习模型中,并将训练数据输入配置了第二超参数组的机器学习模型中进行训练,输出第二训练效果;将第二超参数组及第二训练效果输入超参数生成模型中,得到第三超参数组,循环往复,直至得到超过预设数量的超参数组,且没有出现训练效果评分更高的超参数组,则将训练效果评分最高的超参数组筛选为目标超参数组,以通过将每次训练得到的训练效果评分以及当前超参数组输入超参数生成模型中进行评估,使用超参数生成模
型指导下一次超参数组的调整,以通过人工智能的方式自动调整超参数组,提高最优超参数的获取效率。
69.在一实施例中,所述第一训练效果评分包括多个第一训练效果子评分,在步骤s14中,所述调用所述超参数生成模型对所述第一超参数组的超参数进行调整,得到第二超参数组的步骤,可具体包括:
70.s141、调用所述超参数生成模型提取所述第一训练效果评分的多个第一训练效果子评分;其中,各所述第一训练效果子评分用于评估所述机器学习模型一个维度的训练效果;
71.s142、从所述多个第一训练效果子评分中筛选出评分低于预设值的目标第一训练效果子评分;
72.s143、确定影响所述目标第一训练效果子评分的因子,根据所述因子对所述第一超参数组的超参数进行调整,得到第二超参数组。
73.在本实施例中,除了训练效果评分之外,还应该确定评分低的原因,根据原因查询与该原因相关的超参数,对原超参数组的超参数进行调整之后,得到新的超参数组。因此,本实施例筛选出评分低于预设值的目标第一训练效果子评分,并确定影响所述目标第一训练效果子评分的因子,对与该因子相关的第一超参数组的超参数进行调整,得到第二超参数组。例如,假设第一超参数组具有a、b、c三个超参数,当目标第一训练效果子评分低于预设值的原因是机器学习模型的鲁棒性较差,则查询影响机器学习模型的鲁棒性较差的超参数,假设是a,则将a朝提高机器学习模型的鲁棒性的方向进行调整,如增大a的数值,得到第二超参数组。
74.其中,第一训练效果评分越高表征相应超参数组对优化帮助越大,也即表征相应超参数组为最优超参数组的可能性越大。相应地,第一训练效果评分越低表征相应超参数组为最优超参数组的可能性越小,则通过查询第一训练效果评分中评分过低的第一训练效果子评分,通过调整评分较低的第一训练效果子评分对应的超参数,以提高第一训练效果评分。第一训练效果评分的取值范围可以自定义,比如[0,1],或者[0,100],在此不作具体限定。
[0075]
在一实施例中,所述将所述第一超参数组及第一训练效果输入所述超参数生成模型中之前,还可包括:
[0076]
获取各个所述第一训练效果子评分对应的权重;
[0077]
将各个所述第一训练效果子评分按照对应的权重进行加权求和,得到所述第一训练效果评分。
[0078]
在本实施例中,按照各第一训练效果子评分对应的权重对相应的第一训练效果子评分进行加权求和,得到第一超参数组对应的第一训练效果评分,由此通过权重来体现机器学习模型对超参数优化的影响程度。也可通过动态调整各第一训练效果子评分的权重来实现机器学习模型的自适应,以降低非相关机器学习模型对优化的影响,提高相关机器学习模型对优化的影响,从而提高超参数优化效率和准确性。
[0079]
在一实施例中,所述机器学习模型包括决策树分类模型,在步骤s13中,所述将所述训练数据输入配置了所述第一超参数组的所述机器学习模型中进行训练,可具体包括:
[0080]
s131、从所述训练数据中随机抽取n个训练样本;
[0081]
s132、基于决策树算法对所述n个训练样本进行训练,得到n个训练后的决策树分类模型;
[0082]
s133、判断所述n个训练后的决策树分类模型的训练结果是否都满足要求;
[0083]
s134、若是,将所述n个训练后的决策树分类模型进行组合,得到目标机器学习模型;所述目标机器学习模型为完成训练的机器学习模型。
[0084]
在本实施例中,可以基于决策树算法对n个训练样本进行训练,得到n个训练后的决策树分类模型。其中,抽取n个训练样本时,可以将时间节点相近的训练数据作为一个训练样本,如将同一个月内的训练数据作为一个训练样本,以基于决策树算法对训练样本进行训练时,得到的每个训练后的决策树分类模型都可以实现机器学习模型的一种或多种功能。
[0085]
此外,还可将n个训练后的决策树分类模型进行随机组合,得到训练好的机器学习模型,即目标机器学习模型。例如,可以选取n个训练后的决策树分类模型中的任意至少两个,组合成为机器学习模型,从而使利用单独训练好的决策树分类模型组合得到的机器学习模型具有更佳地训练结果。
[0086]
此外,计算机设备还可定时从训练集中随机拉取训练样本,并基于训练样本来训练出一部分新增的决策树分类模型,比如,机器学习模型是由200个决策树分类模型构成,那么每次更新时,可以训练出150个新的决策树分类模型,之后对所有的决策树分类模型(即350个决策树分类模型)进行验证,得到各个决策树分类模型的分类效果,然后从所有的决策树分类模型中选出200个决策树分类模型,并将该300个决策树分类模型进行组合得到新的机器学习模型,以对机器学习模型进行实时更新。
[0087]
在一实施例中,所述训练结果包括损失值,在步骤s133中,所述判断所述n个训练后的决策树分类模型的训练结果是否都满足要求,可具体包括:
[0088]
s1331、利用预设的损失函数分别计算训练后的每个训练后的决策树分类模型的损失值;
[0089]
s1332、判断所述每个训练后的决策树分类模型的损失值是否都低于预设损失值;
[0090]
s1333、若是,则判定所述n个训练后的决策树分类模型完成训练。
[0091]
在本实施例中,对于任一个决策树分类模型,在决策树分类模型每次训练后,可利用损失函数计算决策树分类模型训练完成后的损失值,并在损失值满足预设阈值或小于预设损失值时,即满足要求,则表明该决策树分类模型达到训练要求,完成所述决策树分类模型的训练,当所有决策树分类模型都完成训练时,将所有决策树分类模型进行组合,得到机器学习模型。
[0092]
当所述损失值不小于预设损失值时,可根据损失值在决策树分类模型的神经网络结构中进行前向传递,调整决策树分类模型的相关参数,基于重新设置的相关参数对调整后的决策树分类模型进行重新训练,并计算再次训练,直至所述损失值小于预设损失值为止,至此决策树分类模型训练结束。
[0093]
在一实施例中,所述获取训练数据,可具体包括:
[0094]
获取初始数据,对所述初始数据进行预处理,并利用预处理后的所述初始数据建立所述机器学习模型的训练数据。
[0095]
具体的,可对抽取得到的初始数据如用户数据进行归一化预处理,如转换为统一
的数据格式,或将初始数据中无实质意义的数据去除,然后根据归一化预处理的初始数据建立机器学习模型的训练数据和用于对训练后的机器学习模型进行测试的测试数据,例如,可将初始数据中百分之九十的部分作为训练数据,将剩余百分之十的部分作为测试数据。此外,所述机器学习模型的训练数据和测试数据之间容量之比可以根据具体场景需求来进行设置。
[0096]
在一实施例中,所述对所述初始数据进行预处理,可具体包括:
[0097]
将所述初始数据分割为多个子数据块,并根据数据结构分别为每个子数据块分配唯一的标识符;
[0098]
遍历所有标识符,对应各个标识符保留唯一一个数据块,去除其他具有相同标识符的数据块,得到去除重复数据的所述初始数据。
[0099]
本实施例将初始数据分割为多个子数据块,每个子数据块的大小一致,并根据数据结构分别为每个子数据块分配唯一的标识符,该标识符用于区分不同的数据块,因此相同的数据块会有相同的标识符,然后利用标识符去除重复数据,以得到去除重复数据的初始数据。具体的,可遍历所有标识符,对应各个标识符保留唯一一个数据块,去除其他具有相同标识符的数据块。
[0100]
其中,数据结构是指相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成。常用的数据结构有:数组,栈,链表,队列,树,图,堆,散列表等等。
[0101]
参照图2,本技术实施例中还提供一种超参数确定装置,包括:
[0102]
生成模块11,用于获取机器学习模型,为机器学习模型随机生成多组随机超参数组,其中,每组所述随机超参数组包括一个或多个超参数;
[0103]
调用模块12,用于调用预先训练好的超参数生成模型分别对每组随机超参数组进行评分,并从所述多组随机超参数组中筛选出评分最高的随机超参数组,得到第一超参数组;
[0104]
配置模块13,用于将所述第一超参数组配置至所述机器学习模型中,获取训练数据,将所述训练数据输入配置了所述第一超参数组的所述机器学习模型中进行训练,输出第一训练效果;所述第一训练效果包括所述第一超参数组对应的第一训练效果评分;
[0105]
输入模块14,用于将所述第一超参数组及第一训练效果输入所述超参数生成模型,调用所述超参数生成模型对所述第一超参数组的超参数进行调整,得到第二超参数组;
[0106]
所述配置模块13,还用于将所述第二超参数组配置至所述机器学习模型中,并将所述训练数据输入配置了所述第二超参数组的所述机器学习模型中进行训练,输出第二训练效果;所述第二训练效果包括所述第二超参数组对应的第二训练效果评分;
[0107]
所述输入模块14,还用于将所述第二超参数组及第二训练效果输入所述超参数生成模型,调用所述超参数生成模型对所述第二超参数组的超参数进行调整,得到第三超参数组,循环往复,直至得到超过预设数量的超参数组,且没有出现训练效果评分更高的超参数组;
[0108]
筛选模块15,用于将训练效果评分最高的超参数组筛选为目标超参数组。
[0109]
随机超参数组可人工设定或计算机设备根据机器学习模型所需要的超参数随机设置的超参数组,该随机超参数组包括一个或多个超参数,具体数量根据机器学习模型的
特性设定。其中,机器学习模型为未训练的神经网络模型,如分类模型、自然语言处理模型等等。随机超参数组中包括至少一个超参数,在机器学习的上下文中,超参数是在开始学习过程之前设置值的参数,通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果。
[0110]
超参数生成模型用于评估随机生成的随机超参数组,为每组随机超参数组生成一个评分,如根据每组超参数组中的超参数的数量及对应数值是否合理进行评估,生成每组超参数组对应的评分。本实施例基于生成的评分,从多组随机超参数组中筛选出评分最高的随机超参数组,将评分最高的随机超参数组作为第一超参数组。
[0111]
第一训练效果评分用于表征机器学习模型配置第一超参数组的训练效果的优劣程度,即可用于表征按照第一超参数组训练得到的机器学习模型的训练效果,训练效果比如机器学习模型对实体识别的准确性。其中,训练数据根据所需训练的机器学习模型的类型进行获取,例如,机器学习模型为实体识别模型时,则训练数据为文本数据。
[0112]
本实施例的超参数生成模型为神经网络模型,还用于根据训练效果对原超参数组进行调整,生成新的超参数组。具体的,将机器学习模型输出的第一训练效果、随机生成的第一超参数组输入预先构建的超参数生成模型中,利用超参数生成模型根据第一训练效果对第一超参数组中的超参数进行调整,将调整超参数后的第一超参数组作为第二超参数组。例如,当第一训练效果中表征机器学习模型的训练效率较慢时,则查询第一超参数组中与训练效率相关的超参数,对其进行调整,以得到第二超参数组,使后续对机器学习模型进行训练时,提高机器学习模型的训练效率。
[0113]
第二训练效果评分用于表征第二超参数组的优劣程度,具体可用于表征按照第二超参数组训练得到的机器学习模型的训练效果,训练效果比如准确性。本步骤将超参数生成模型生成的第二超参数组配置至机器学习模型中,并将训练数据输入配置了第二超参数组的机器学习模型中进行再次训练,得到第二训练效果。
[0114]
本实施例的超参数生成模型还根据第二训练效果对第二超参数组进行再次调整,将调整超参数后的第二超参数组作为第三超参数组,并将第三超参数组配置至机器学习模型中进行再次训练,循环往复,即利用超参数生成模型调整后的超参数组对机器学习模型进行多次训练,并在每次训练后,将机器学习模型的训练效果及原超参数组再次输入超参数生成模型中,生成新的超参数组,以此类推,直至达到迭代停止条件,迭代停止条件是停止迭代优化过程的条件或依据,比如迭代次数大于或等于预设迭代次数且没有出现训练效果评分更高的超参数组,或者,超参数组的数量大于预设数量。比如,预设迭代次数为20次,则超参数组也是20组,且在20组中,连续后面5组中没有出现训练效果评分比之前更高的超参数组,则达到迭代停止条件,在此不作具体限定。
[0115]
其中,预设数量是预先设定的超参数组的数量,比如20。超参数组中的超参数个数由相应的机器学习算子确定,比如机器学习算子为随机森林,超参数组中包括学习率和树的数目两个超参数。超参数组具体可包括一个或多个待优化的超参数。
[0116]
如上所述,可以理解地,本技术中提出的所述超参数确定装置的各组成部分可以实现如上所述超参数确定方法任一项的功能,具体结构不再赘述。
[0117]
参照图3,本技术实施例中还提供一种计算机设备,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机
设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质存储有操作系统、计算机程序和数据库。该内存器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储训练数据、超参数组等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种超参数确定方法。
[0118]
上述处理器执行上述的超参数确定方法,包括:
[0119]
获取机器学习模型,为机器学习模型随机生成多组随机超参数组,其中,每组所述随机超参数组包括一个或多个超参数;
[0120]
调用预先训练好的超参数生成模型分别对每组随机超参数组进行评分,并从所述多组随机超参数组中筛选出评分最高的随机超参数组,得到第一超参数组;将所述第一超参数组配置至所述机器学习模型中,获取训练数据,将所述训练数据输入配置了所述第一超参数组的所述机器学习模型中进行训练,输出第一训练效果;所述第一训练效果包括所述第一超参数组对应的第一训练效果评分;
[0121]
将所述第一超参数组及第一训练效果输入所述超参数生成模型,调用所述超参数生成模型对所述第一超参数组的超参数进行调整,得到第二超参数组;
[0122]
将所述第二超参数组配置至所述机器学习模型中,并将所述训练数据输入配置了所述第二超参数组的所述机器学习模型中进行训练,输出第二训练效果;其中,所述第二训练效果包括所述第二超参数组对应的第二训练效果评分;
[0123]
将所述第二超参数组及第二训练效果输入所述超参数生成模型,调用所述超参数生成模型对所述第二超参数组的超参数进行调整,得到第三超参数组;
[0124]
循环往复,直至得到超过预设数量的超参数组,且没有出现训练效果评分更高的超参数组,则将训练效果评分最高的超参数组筛选为目标超参数组。
[0125]
本技术一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种超参数确定方法,包括步骤:
[0126]
获取机器学习模型,为机器学习模型随机生成多组随机超参数组,其中,每组所述随机超参数组包括一个或多个超参数;
[0127]
调用预先训练好的超参数生成模型分别对每组随机超参数组进行评分,并从所述多组随机超参数组中筛选出评分最高的随机超参数组,得到第一超参数组;将所述第一超参数组配置至所述机器学习模型中,获取训练数据,将所述训练数据输入配置了所述第一超参数组的所述机器学习模型中进行训练,输出第一训练效果;所述第一训练效果包括所述第一超参数组对应的第一训练效果评分;
[0128]
将所述第一超参数组及第一训练效果输入所述超参数生成模型,调用所述超参数生成模型对所述第一超参数组的超参数进行调整,得到第二超参数组;
[0129]
将所述第二超参数组配置至所述机器学习模型中,并将所述训练数据输入配置了所述第二超参数组的所述机器学习模型中进行训练,输出第二训练效果;其中,所述第二训练效果包括所述第二超参数组对应的第二训练效果评分;
[0130]
将所述第二超参数组及第二训练效果输入所述超参数生成模型,调用所述超参数生成模型对所述第二超参数组的超参数进行调整,得到第三超参数组;
[0131]
循环往复,直至得到超过预设数量的超参数组,且没有出现训练效果评分更高的
超参数组,则将训练效果评分最高的超参数组筛选为目标超参数组。
[0132]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双速据率sdram(ssrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0133]
综上所述,本技术的最大有益效果在于:
[0134]
本技术所提供的一种超参数确定方法、装置、设备及存储介质,为机器学习模型随机生成多组随机超参数组,调用预先训练好的超参数生成模型分别对每组随机超参数组进行评分,并从多组随机超参数组中筛选出评分最高的随机超参数组,以得到较优的第一超参数组,用于后续配置至机器学习模型,以便快速得到最优的超参数组;将第一超参数组配置至机器学习模型中,获取训练数据,将训练数据输入配置了第一超参数组的所述机器学习模型中进行训练,输出第一训练效果,将第一超参数组及第一训练效果输入超参数生成模型,调用超参数生成模型对第一超参数组的超参数进行调整,得到第二超参数组;将第二超参数组配置至所述机器学习模型中,并将训练数据输入配置了第二超参数组的机器学习模型中进行训练,输出第二训练效果;将第二超参数组及第二训练效果输入超参数生成模型中,得到第三超参数组,循环往复,直至得到超过预设数量的超参数组,且没有出现训练效果评分更高的超参数组,则将训练效果评分最高的超参数组筛选为目标超参数组,以通过将每次训练得到的训练效果评分以及当前超参数组输入超参数生成模型中进行评估,使用超参数生成模型指导下一次超参数组的调整,以通过人工智能的方式自动调整超参数组,提高最优超参数的获取效率。
[0135]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
[0136]
以上所述仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。