AI模型的定制方法、电子设备及计算机可读存储介质与流程

文档序号:30385819发布日期:2022-06-11 09:48阅读:142来源:国知局
AI模型的定制方法、电子设备及计算机可读存储介质与流程
ai模型的定制方法、电子设备及计算机可读存储介质
技术领域
1.本技术涉及人工智能技术领域,尤其涉及一种ai模型的定制方法、电子设备及计算机可读存储介质。


背景技术:

2.人工智能(ai)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学,ai技术落地包括数据处理、模型设计、模型训练、模型发布等,落地门槛较高。
3.近年来,人们对ai的需求与日俱增,而具备解决ai能力的提供方较少,并且ai生产过程需要专业工程师反复的调试,耗时耗力,这都导致了供需的不匹配。
4.因此,如何实现ai模型的供需匹配成为亟需解决的问题。


技术实现要素:

5.本技术提供了一种ai模型的定制方法、电子设备及计算机可读存储介质,旨在实现为需求方提供更加符合需求方的需求的ai模型,达成ai模型的供需匹配。
6.第一方面,本技术实施例提供了一种ai模型的定制方法,包括:
7.从终端设备接收需求方输入的业务需求信息;
8.根据所述业务需求信息,确定所述业务需求信息对应的第一ai模型;
9.对所述第一ai模型进行超参数调节,得到第二ai模型;
10.基于样本集,对所述第二ai模型进行模型训练,生成对应的目标ai模型;
11.根据所述终端设备的指令将所述目标ai模型部署到目标设备和/或将所述目标ai模型发布到模型交易平台。
12.第二方面,本技术实施例提供了一种电子设备,包括存储器和处理器;
13.所述存储器用于存储计算机程序;
14.所述处理器,用于执行所述计算机程序并在执行所述计算机程序时,实现上述的ai模型的定制方法。
15.第三方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现上述的ai模型的定制方法。
16.本技术实施例提供了一种ai模型的定制方法、电子设备及计算机可读存储介质,通过从终端设备接收需求方输入的业务需求信息;根据所述业务需求信息,确定所述业务需求信息对应的第一ai模型;对所述第一ai模型进行超参数调节,得到第二ai模型;基于样本集,对所述第二ai模型进行模型训练,生成对应的目标ai模型;根据所述终端设备的指令将所述目标ai模型部署到目标设备和/或将所述目标ai模型发布到模型交易平台。通过自动化地完成ai模型设计和训练,提高了ai模型定制化的效率,得到的ai模型更加符合需求方的需求,达成ai模型的供需匹配。
17.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术实施例的公开内容。
附图说明
18.为了更清楚地说明本技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
19.图1是本技术实施例提供的一种ai模型的定制方法的流程示意图;
20.图2是ai模型的定制方法应用场景的示意图;
21.图3是本技术实施例提供的一种确定所述业务需求信息对应的第一ai模型步骤的流程示意图;
22.图4是本技术实施例提供的一种第一需求设置界面的示意图;
23.图5是本技术实施例提供的一种电子设备的功能模块示意图;
24.图6是automl系统的有向无环图的示意图;
25.图7是本技术实施例提供的一种生成对应的目标ai模型步骤的流程示意图;
26.图8是一实施方式中automl系统底层框架的示意图;
27.图9是本技术实施例提供的一种电子设备的示意性框图。
具体实施方式
28.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
29.下面结合附图,对本技术的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
30.请参阅图1,图1是本技术实施例提供的一种ai模型的定制方法的流程示意图。所述ai模型的定制方法可以应用在电子设备,如终端设备或服务器中,用于生成需求方所需的ai模型等过程;其中,终端设备可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备;服务器可以为独立的服务器,也可以为服务器集群。所述ai模型的定制方法还可以应用在云端,云端是基于应用虚拟化的技术的软件,云端通过提供虚拟化的运行环境,让软件的运行全程无污染、干净、稳定。通过云端进行生成需求方所需的ai模型等过程,从而实现得到的ai模型更加符合需求方的需求,达成ai模型的供需匹配。
31.示例性的,如图2所示,ai模型的定制方法应用在服务器时的场景示意图。服务器可以从终端设备获取业务需求信息,执行ai模型的定制方法生成目标ai模型,还可以将生成的目标ai模型发送给终端设备,以便终端设备进行模型测试或部署等操作。
32.如图1所示,本技术实施例的ai模型的定制方法包括步骤s101至步骤s105。
33.s101、从终端设备接收需求方输入的业务需求信息。
34.示例性的,在终端设备的相应显示装置,如显示屏上显示需求设置界面,需求方用户可以在需求设置界面输入相应的业务需求信息。
35.在一些实施方式中,业务需求信息包括但不限于:任务类型、模型部署环境、应用场景、算力需求、预算成本等。
36.其中,任务类型表示需求方需要的ai模型的实用场景,如ai模型需要处理的任务,如分类、检测、视频、自然语言处理等。模型部署环境表示ai模型部署于云端或终端(边端)对应的部署信息,如部署的终端的型号、终端的处理器类型、型号等。例如,终端的处理器类型可以包括cpu(central processing unit)和/或gpu(graphics processing unit)。应用场景可以包括以下至少一种:小样本检测、小物体检测、物体检测、非均衡样本检测等。
37.s102、根据所述业务需求信息,确定所述业务需求信息对应的第一ai模型。
38.第一ai模型,即需求方所需要的目标ai模型的初始模型,基于不同的业务需求信息,生成第一ai模型的方式不同。
39.在一些实施例中,如图3所示,步骤s102可以包括子步骤s1021和子步骤s1022。
40.s1021、根据所述业务需求信息,确定模型生成模式;
41.示例性的,模型生成模式包括第一生成模式、第二生成模式、第三生成模式中的至少一种。对于不同的模型生成模式,模型生成的速度存在差异、生成目标ai模型的算力消耗不同,和/或目标ai模型的规模、准确度不同等等。
42.例如,第一生成模式的模型生成速度比第二生成模式快,第二生成模式的模型生成速度比第三生成模式快;或者第一生成模式生成的模型的准确度比第二生成模式低,第二生成模式生成的模型的准确度比第三生成模式低。
43.示例性的,第一生成模式可以称为基础生成模式,第二生成模式可以称为预制生成模式,第一生成模式可以称为定制生成模式。
44.在一些实施例中,业务需求信息中包括模式设置信息,根据该业务需求信息中的模式设置信息,确定对应的模型生成模式为第一生成模式、第二生成模式或第三生成模式。
45.例如,可以在终端设备的显示装置显示多种生成模式,需求方从中选择一种生成模式输入对应的模式设置信息,根据需求方的选择操作确定模型生成模式。
46.s1022、基于所述模型生成模式对应的模型确定逻辑,确定所述业务需求信息对应的第一ai模型。
47.其中,第一生成模式、第二生成模式、第三生成模式分别对应着相应的不同的模型确定逻辑。
48.在一些实施例中,业务需求信息中还包括模型需求信息,也即需求方对目标ai模型的相关需求描述信息。
49.示例性的,所述ai模型的定制方法还包括:若确定所述模型生成模式为第一生成模式,控制所述终端设备跳转至第一需求设置界面;若确定所述模型生成模式为第二生成模式,控制所述终端设备跳转至第二需求设置界面;若确定所述模型生成模式为第三生成模式,控制所述终端设备跳转至第三需求设置界面;其中,所述第一需求设置界面、所述第二需求设置界面、所述第三需求设置界面不同。
50.针对于不同的需求方用户,可以提供相应不同的需求设置界面,以供需求方输入业务需求信息。其中,需求设置界面包括但不限于第一需求设置界面、第二需求设置界面、
第三需求设置界面等。
51.例如,若确定模型生成模式为第一生成模式,则控制终端设备跳转至第一需求设置界面,例如,如图4所示,图4为第一需求设置界面的示意图,需求方在第一需求设置界面输入业务需求信息。示例性的,需求方在第一需求设置界面输入的业务需求信息包括以下至少一项:任务类型、模型部署环境、应用场景、算力需求、预算成本。比如,如图4中所示,基于第一需求设置界面输入应用场景信息。
52.又如,若确定模型生成模式为第二生成模式,则控制终端设备跳转至第二需求设置界面,需求方在第二需求设置界面输入业务需求信息。示例性的,需求方在第二需求设置界面输入的业务需求信息包括以下至少一项:任务类型、模型部署环境、应用场景、算力需求、预算成本。
53.其中,第二生成模式的预算成本高于第一生成模式的预算成本。
54.又如,若确定模型生成模式为第三生成模式,则控制终端设备跳转至第三需求设置界面,需求方在第三需求设置界面输入业务需求信息。示例性的,需求方在第三需求设置界面输入的业务需求信息包括以下至少一项:神经网络模型架构、超参数配置信息。
55.其中,神经网络模型架构,比如vgg(visual geometry group)、resnet(residual network)、densenet(densely connected convolutional networks)、inception等,包括模型主干网络(backbone)、头部网络(head),颈部网络(neck)等;超参数配置信息可以包括多种超参数,包括但不限于dropout、weights decay(权值衰减)、学习率等。
56.在一些实施例中,所述第一生成模式对应的模型确定逻辑,包括:根据所述模型需求信息在基础数据库中确定所述第一ai模型;所述第二生成模式对应的模型确定逻辑,包括:根据所述模型需求信息和预设的专家经验逻辑在预训练模型中确定所述第一ai模型;所述第三生成模式对应的模型确定逻辑,包括:根据所述专家经验逻辑和网络结构搜索逻辑在网络结构向量空间中确定所述第一ai模型。
57.其中,基础数据库包括不同业务需求,如不同任务(分类、检测、视频、自然语言处理等)的标准数据模块、模型选择模块、超参数配置模块等,可以理解为模型的模型仓库模块。若确定模型生成模式为第一生成模式,通过查询基础数据库,确定与需求方输入的业务需求信息中的模型需求信息相匹配的第一ai模型。
58.专家经验逻辑可以包括专家、专业工程师在场景任务数据上沉淀的经验逻辑,例如面向不同终端、场景,所对应的预制的预训练(pretrain)模型、超参配置等。
59.示例性的,预制层封装的专家经验逻辑可以包多种芯片型号(可以细化到对应的型号)、算力需求、应用场景(比如小样本检测、小物体检测、非均衡样本检测、任务类型),以及对应的预训练模型和超参数配置信息。若确定模型生成模式为第二生成模式,可以根据预设的专家经验逻辑确定模型需求信息对应的预训练模型为第一ai模型。
60.网络结构向量空间可以为多个不同网络模型的并集,网络模型可以用一个向量描述,该向量至少可以描述网络模型的宽度、深度、激活函数、损失函数等。若确定模型生成模式为第三生成模式,具有较高的自由度,可以从头开始进行网络结构、超参数设置、数据处理等自动化搜索流程。是一种基于automl(自动化机器学习技术)算法的数据、场景、算力驱动的定制化ai落地服务,虽然搜索耗时较长,但是全定制化,例如生成的模型的准确度更高,更适用于特定的场景。示例性的,可以基于pretrian automl的automl算法搜索确定第
一ai模型,既满足耗时小,又满足定制化。
61.在一些实施方式中,所述网络结构向量空间包括网络结构向量空间图(graph),所述网络结构向量空间图包括多个网络单元和所述多个网络单元之间的连接。在另一些实施方式中,网络结构向量空间也可以以向量的形式描述,向量中各元素可以用于表示网络单元和网络单元之间的连接。当然本技术实施例也不限于此。
62.所述网络结构向量空间中可以包括很多操作,基于不同的连接方式,这些操作中的全部或部分操作可以构成不同的神经网络,或者说,基于不同的连接方式,这些操作中的全部或部分操作构成的神经网络的网络结构可以不同。
63.示例性的,所述网络结构向量空间中包括卷积(conv)操作,dw(depthwise)卷积操作等网络单元。多个网络单元,和多个网络单元之间的连接可以构成一个神经网络。
64.s103、对所述第一ai模型进行超参数调节,得到第二ai模型。
65.除了确定第一ai模型以外,还需要对第一ai模型进行超参数调节,确定出合适的超参数,从而得到对应的第二ai模型。
66.在一些实施例中,所述对所述第一ai模型进行超参数调节,得到第二ai模型可以包括:若确定所述模型生成模式为第一生成模式,根据所述基础数据库中所述第一ai模型的超参数确定所述第二ai模型的超参数;若确定所述模型生成模式为第二生成模式,根据预设的专家经验逻辑在预设的超参数配置信息中确定所述第二ai模型的超参数;若确定所述模型生成模式为第三生成模式,基于预设的超参数调优算法,对所述业务需求信息中的超参数配置信息进行调优,确定所述第二ai模型的超参数。
67.针对于不同的模型生成模式,对第一ai模型进行超参数调节的方式也不相同。
68.例如,若确定模型生成模式为第一生成模式,则查询基础数据库,将查询到的基础数据库中第一ai模型的超参数,确定为第二ai模型的超参数。
69.又如,若确定模型生成模式为第二生成模式,则根据预设的专家经验逻辑,基于预设的超参数配置信息,确定第二ai模型的超参数。
70.再如,若确定模型生成模式为第三生成模式,则根据获取的业务需求信息中的超参数配置信息,基于预设的超参数调优算法,对该超参数配置信息进行调优,将调优后获得的超参数确定为第二ai模型的超参数。示例性的,超参数调优算法包括但不限于网格搜索、随机搜索、贝叶斯优化等。
71.可以理解的,随机搜索方法本身是无偏的(unbias),不存在搜索偏差,可以适用于多种不同的任务。从而基于随机搜索策略,在所述网络结构向量空间中搜索网络结构,可以降低或消除不同的任务、数据上的搜索偏差(search bias),保证搜索得到的网络结构的稳定性。
72.s104、基于样本集,对所述第二ai模型进行模型训练,生成对应的目标ai模型。
73.针对于上述列举的各种不同的模型生成模式,获得第二ai模型之后,基于样本集,也即训练数据,对第二ai模型进行模型训练。其中,对于样本集,也可以采用不同方式来获取。
74.在一些实施方式中,获取所述终端设备上传的样本集。也即,通过终端设备上传样本集,接收终端设备上传的样本集,将其作为训练数据,对第二ai模型进行模型训练。
75.在另一些实施方式中,获取所述终端设备根据用户指定发送的样本集的存储地
址,根据所述存储地址获取所述样本集。也即,样本集可能存储于云端等指定存储地址,通过终端设备发送样本集的存储地址,基于获得的存储地址进行数据访问,从而获得样本集。
76.在另一些实施方式中,根据所述业务需求信息,在预设的样本库中确定对应的样本集。也即,在样本库中存储各种样本数据,基于所获得的业务需求信息,查询样本库,将与业务需求信息对应的样本数据作为样本集。
77.示例性的,电子设备包括基于web界面的标准化业务需求输入模块和自动化训练服务模块,其中,基于web界面的标准化业务需求输入模块用于面向需求方采集需求方的需求,自动化训练服务模块用于针对需求方的需求进行自动化ai模型设计、模型训练、超参数调节等,并实现数据自动化和部署自动化。
78.对于不同的需求方用户,通过标准化业务需求输入模块显示不同的需求设置界面。示例性的,如图5所示,图5为提供的一种电子设备的功能模块示意图,基于web界面的标准化业务需求输入模块包括面向需求方的需求发布子模块11,需求发布子模块11用于需求方发布需求,并为需求方提供需求填写的引导功能。需求发布子模块11具有多个不同的需求设置界面,包括但不限于第一需求设置界面、第二需求设置界面、第三需求设置界面。
79.例如,当需求方不知道如何定义ai问题时,可以提供引导需求方填写业务需求信息的需求设置界面,让需求方填写相应的业务需求信息,或者选择默认值,比如该ai模型计划用在云端或边端、检测类别、预算成本等信息。
80.又如,当需求方知道如何将需求转化为ai问题时,可以提供对应的需求设置界面,需求方只需基于该需求设置界面上传对应的数据,如ai模型的超参数,比如输入相应超参数或者点击按钮选择相应超参数,即可进行自动化服务。
81.在一些实施例中,如图5所示,需求发布子模块11包括需求池单元111。在接收到需求方输入的业务需求信息之后,将该业务需求信息存储于需求池单元111。
82.在一些实施例中,如图5所示,基于web界面的标准化业务需求输入模块还包括在线标注器子模块12,自动化训练服务模块还包括数据格式转换子模块21,其中,数据格式转换子模块21用于将数据进行不同标准开源格式的转换,以支持不同的算法。通过在线标注器子模块12为样本集作标注,从而获得对应的标注数据,并通过数据格式转换子模块21将标注数据进行目标数据格式转换,从而获得对应的目标数据。之后,再基于该目标数据对第二ai模型进行模型训练,生成对应的符合需求方要求的目标ai模型。
83.在一些实施例中,如图5所示,电子设备还包括面向研发方的automl方案设计模块30和人工ml方案设计模块40,automl方案设计模块30用于自动化设计完成需求方的ai模型,人工ml方案设计模块40用于研发方手动操作完成需求方的ai模型。
84.在一些实施例中,所述ai模型的定制方法可以用于automl系统,该automl系统可以部署在服务器或计算机设备。
85.automl系统包括有向无环图(directed acyclic graph,dag),该有向无环图用于描述基础层的自动化工作流,实现自动化工作流的架构封装。
86.示例性的,如图6所示为有向无环图的示意图。其中,实线表示已经激活的工作流,虚线表示没有激活的工作流,在以第一生成模式生成模型时,执行实线表示的工作流。
87.如图7所示,所述步骤s104可以包括子步骤s1041和子步骤s1042。
88.s1041、在所述有向无环图中确定工作流路径,所述有向无环图用于描述所述
automl系统的自动化工作流,所述工作流路径包括所述第一ai模型的模型标识、所述第二ai模型的超参数的超参数标识、训练策略的标识,以及所述模型标识和所述超参数标识之间的路径、所述超参数标识和所述训练策略的标识之间的路径。
89.在一些实施方式中,有向无环图包括多个ai模型的模型标识和多个超参数的超参数标识。示例性的,如图6所示,图6中的vgg、resnet、densenet、inception为目前主流的ai模型,又可称为神经网络模型架构的名称标识;图6中的dropout、weights decay、学习率为可选的超参数,即超参数的超参数标识。
90.s1042、基于所述工作流路径,基于所述样本集对所述第二ai模型进行训练,生成所述目标ai模型。
91.在一些实施方式中,所述ai模型的定制方法还包括:根据所述业务需求信息确定所述样本集的数据增强策略;基于所述数据增强策略对所述样本集的数据进行增强处理,以提高数据的信息量,训练得到的模型可以更准确。
92.示例性的,所述数据增强策略包括以下至少一种:数据清洗、数据预处理、数据扩充,其中数据扩充可以包括翻转、剪裁、旋转等。
93.如图6所示,通过翻转、裁剪、旋转处理对样本集的数据进行数据扩充增强处理,根据扩充后的数据和确定的超参数,对第二ai模型进行训练,训练完毕后得到目标ai模型。
94.在一些实施例中,所述确定所述业务需求信息对应的第一ai模型可以包括:
95.根据所述业务需求在所述有向无环图的多个ai模型的模型标识中确定一个模型标识为所述第一ai模型的模型标识;所述对所述第一ai模型进行超参数调节,得到第二ai模型可以包括:在所述有向无环图中确定至少一个超参数标识为所述第二ai模型的超参数的超参数标识。
96.例如,如图6所示,从vgg、resnet、densenet、inception等多个ai模型的模型标识中,确定其中的vgg为第一ai模型的模型标识。在该有向无环图中确定dropout、weights decay、学习率为第二ai模型的超参数的超参数标识。
97.在一些实施例中,生成对应的目标ai模型之后还包括:对所述目标ai模型进行评估。示例性的,如图5所示,电子设备还包括automl自动化评估模块50,automl自动化评估模块50用于对automl方案设计模块30生成的目标ai模型进行评估。
98.s105、根据所述终端设备的指令将所述目标ai模型部署到目标设备和/或将所述目标ai模型发布到模型交易平台。
99.示例性的,如图5所示,电子设备还包括方案展示模块60,方案展示模块60用于将生成的目标ai模型,基于终端设备的指令部署到目标设备,和/或将目标ai模型发布到模型交易平台。
100.在一些实施例中,如图5所示,电子设备还包括automl引擎子模块70,自动化训练服务模块以automl引擎子模块70为内核,automl引擎子模块70用于接收并执行automl任务或者手工设计的计算任务。自动化训练服务模块还包括数据集管理子模块22、训练资源管理子模块23和模型管理子模块24,其中,数据集管理子模块22用于为用户需求和automl引擎子模块70提供安全可靠的数据集管理;训练资源管理子模块23用于为automl引擎子模块70提供训练资源管理;模型管理子模块24用于已训练的目标ai模型的管理和展示,以及在目标ai模型上进行新数据微调和新算法开发。
101.在一些实施方式中,如图8所示,automl系统可以以tensorflow、pytorch、caffe、mxnet开源框架等(并不限于此)做为底层框架。
102.示例性的,通过底层框架输出依次进入nncf框架、onnx框架、tnn框架,迭代后用于arm、gpu或cpu芯片。
103.具体地,通过上述主流开源框架,例如,tensorflow可无缝转接tf-lite,然后可打通众多芯片,如mtk-apu、cpu等。tensorflow、pytorch、caffe、mxnet框架输出可依次进入nncf框架、onnx框架、tnn框架,无缝打通到arm、gpu、cpu等众多芯片。
104.进一步地,automl系统可以链接至模型交易平台,用于提供ai系统的saas服务模式,在产品的web界面上设置模型的对外发布按钮,并将按钮对应链接至交易平台,以实现自动化生产的模型的对外发布。
105.具体地,本实施例提供了所述automl系统产品化后的saas形态,软件即服务,用于模型自动化生产完成后的对外发布,在web界面上设置交易平台按钮,并将其链接至模型交易平台。
106.在一些实施例中,所述ai模型的定制方法还包括:若确定所述模型生成模式为第二生成模式或第三生成模式,将确定的第一ai模型存储在基础数据库中,在所述有向无环图中增加所述第一ai模型的模型标识;以及将所述第二ai模型的超参数存储在所述基础数据库中,在所述有向无环图中增加所述超参数的超参数标识。
107.对于采用第二生成模式或第三生成模式,确定的第一ai模型,由于该第一ai模型并不是从基础数据库中获得,因而在生成该第一ai模型后,将该第一ai模型存储在基础数据库中,以及将对应的第二ai模型的超参数也存储在基础数据库中。并且,在有向无环图中增加该第一ai模型的模型标识,以及在有向无环图中增加第二ai模型的超参数的超参数标识。从而丰富基础数据库以及有向无环图,为后续再进行ai模型定制使用。
108.本技术实施例提供的ai模型的定制方法,通过从终端设备接收需求方输入的业务需求信息;根据所述业务需求信息,确定所述业务需求信息对应的第一ai模型;对所述第一ai模型进行超参数调节,得到第二ai模型;基于样本集,对所述第二ai模型进行模型训练,生成对应的目标ai模型;根据所述终端设备的指令将所述目标ai模型部署到目标设备和/或将所述目标ai模型发布到模型交易平台。通过自动化地完成ai模型设计和训练,提高了ai模型定制化的效率,并节约了成本,得到的ai模型更加符合需求方的需求,达成ai模型的供需匹配。
109.请结合上述实施例参阅图9,图9是本技术实施例提供的电子设备600的示意性框图。该电子设备600包括处理器601和存储器602。
110.示例性的,处理器601和存储器602通过总线603连接,该总线603比如为i2c(inter-integrated circuit)总线。
111.具体地,处理器601可以是微控制单元(micro-controller unit,mcu)、中央处理单元(central processing unit,cpu)或数字信号处理器(digital signal processor,dsp)等。
112.具体地,存储器602可以是flash芯片、只读存储器(rom,read-only memory)磁盘、光盘、u盘或移动硬盘等。
113.其中,所述处理器601用于运行存储在存储器602中的计算机程序,并在执行所述
计算机程序时实现前述的ai模型的定制方法。
114.示例性的,所述处理器601用于运行存储在存储器602中的计算机程序,并在执行所述计算机程序时实现如下步骤:
115.从终端设备接收需求方输入的业务需求信息;
116.根据所述业务需求信息,确定所述业务需求信息对应的第一ai模型;
117.对所述第一ai模型进行超参数调节,得到第二ai模型;
118.基于样本集,对所述第二ai模型进行模型训练,生成对应的目标ai模型;
119.根据所述终端设备的指令将所述目标ai模型部署到目标设备和/或将所述目标ai模型发布到模型交易平台。
120.在一些实施例中,所述处理器在实现所述根据所述业务需求信息,确定所述业务需求信息对应的第一ai模型时,用于实现:
121.根据所述业务需求信息,确定模型生成模式;
122.基于所述模型生成模式对应的模型确定逻辑,确定所述业务需求信息对应的第一ai模型。
123.在一些实施例中,所述业务需求信息包括模式设置信息和模型需求信息;所述处理器在实现所述根据所述业务需求信息,确定模型生成模式时,用于实现:
124.根据所述业务需求信息中的模式设置信息,确定所述模型生成模式为第一生成模式、第二生成模式或第三生成模式;
125.其中,所述第一生成模式对应的模型确定逻辑,包括:根据所述模型需求信息在基础数据库中确定所述第一ai模型;
126.所述第二生成模式对应的模型确定逻辑,包括:根据所述模型需求信息和预设的专家经验逻辑在预训练模型中确定所述第一ai模型;
127.所述第三生成模式对应的模型确定逻辑,包括:根据所述专家经验逻辑和网络结构搜索逻辑在网络结构向量空间中确定所述第一ai模型。
128.在一些实施例中,所述处理器还用于实现:
129.若确定所述模型生成模式为第一生成模式,控制所述终端设备跳转至第一需求设置界面;
130.若确定所述模型生成模式为第二生成模式,控制所述终端设备跳转至第二需求设置界面;
131.若确定所述模型生成模式为第三生成模式,控制所述终端设备跳转至第三需求设置界面;
132.其中,所述第一需求设置界面、所述第二需求设置界面、所述第三需求设置界面不同。
133.在一些实施例中,所述需求方在所述第一需求设置界面输入的业务需求信息包括以下至少一项:任务类型、模型部署环境、应用场景、算力需求、预算成本;
134.所述需求方在所述第二需求设置界面输入的业务需求信息包括以下至少一项:任务类型、模型部署环境、应用场景、算力需求、预算成本;其中,所述第二生成模式的预算成本高于所述第一生成模式的预算成本;
135.所述需求方在所述第三需求设置界面输入的业务需求信息包括以下至少一项:神
经网络模型架构、超参数配置信息;所述超参数配置信息包括权值衰减、学习率中至少一项。
136.在一些实施例中,所述处理器在实现所述对所述第一ai模型进行超参数调节,得到第二ai模型时,用于实现:
137.若确定所述模型生成模式为第一生成模式,根据所述基础数据库中所述第一ai模型的超参数确定所述第二ai模型的超参数;
138.若确定所述模型生成模式为第二生成模式,根据预设的专家经验逻辑在预设的超参数配置信息中确定所述第二ai模型的超参数;
139.若确定所述模型生成模式为第三生成模式,基于预设的超参数调优算法,对所述业务需求信息中的超参数配置信息进行调优,确定所述第二ai模型的超参数。
140.在一些实施例中,所述处理器还用于实现:
141.获取所述终端设备上传的样本集;
142.获取所述终端设备根据用户指定发送的样本集的存储地址,根据所述存储地址获取所述样本集;
143.根据所述业务需求信息,在预设的样本库中确定对应的样本集。
144.在一些实施例中,所述ai模型的定制方法用于automl系统,所述automl系统包括有向无环图;所述处理器在实现所述对所述第二ai模型进行模型训练,生成对应的目标ai模型时,用于实现:
145.在所述有向无环图中确定工作流路径,所述有向无环图用于描述所述automl系统的自动化工作流,所述工作流路径包括所述第一ai模型的模型标识、所述第二ai模型的超参数的超参数标识、训练策略的标识,以及所述模型标识和所述超参数标识之间的路径、所述超参数标识和所述训练策略的标识之间的路径;
146.基于所述工作流路径,基于所述样本集对所述第二ai模型进行训练,生成所述目标ai模型。
147.在一些实施例中,所述有向无环图包括多个ai模型的模型标识和超参数的超参数标识;所述处理器在实现所述确定所述业务需求信息对应的第一ai模型时,用于实现:
148.根据所述业务需求在所述有向无环图的多个ai模型的模型标识中确定一个模型标识为所述第一ai模型的模型标识;
149.所述处理器在实现所述对所述第一ai模型进行超参数调节,得到第二ai模型时,用于实现:
150.在所述有向无环图中确定至少一个超参数标识为所述第二ai模型的超参数的超参数标识。
151.在一些实施例中,所述处理器还用于实现:
152.若确定所述模型生成模式为第二生成模式或第三生成模式,将确定的第一ai模型存储在基础数据库中,在所述有向无环图中增加所述第一ai模型的模型标识;以及将所述第二ai模型的超参数存储在所述基础数据库中,在所述有向无环图中增加所述超参数的超参数标识。
153.本技术实施例提供的电子设备的具体原理和实现方式均与前述实施例的ai模型的定制方法类似,此处不再赘述。
154.本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现上述实施例提供的ai模型的定制方法的步骤。
155.其中,所述计算机可读存储介质可以是前述任一实施例所述的电子设备的内部存储单元,例如所述电子设备的硬盘或内存。所述计算机可读存储介质也可以是所述电子设备的外部存储设备,例如所述电子设备上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。
156.应当理解,在此本技术中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本技术。
157.还应当理解,在本技术和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
158.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1