本发明涉及机器学习模型,更具体地说,涉及一种代码生成的机器学习模型生成方法及系统。
背景技术:
1、机器学习模型是一种通过学习训练数据,来调整模型参数,以最小化预测输出与真实标签之间的误差的数学函数;机器学习模型代码的开发通常需要业务问题专家、数据科学家、算法专家等人员高度手工参与,导致机器学习模型代码的开发不仅开发门槛高,且开发效率较低;中国申请,申请号202310849920.x一种机器学习模型代码的生成方法及装置,公开了一种通过具有相同的业务应用和系统环境的已有模型代码,处理生成目标模型代码的方式方法,虽然可以在一定程度上解决上述问题,但是该种方式有很大的局限性,如果找不到适合的符合要求的已有模型代码,则根本无法实施,需要一种适用性更高的代码生成的机器学习模型生成方法及系统。
技术实现思路
1、本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种代码生成的机器学习模型生成方法,还提供了一种代码生成的机器学习模型生成系统。
2、本发明解决其技术问题所采用的技术方案是:
3、构造一种代码生成的机器学习模型生成方法,其中,包括以下步骤:
4、步骤一:建立模型代码数据库:
5、收集归属于同一行业中的历史机器学习模型代码,构建历史模型数据库;
6、历史模型数据库中按照模型的类型分类,形成多个类型模块;
7、对属于同一类型模块的模型代码,分别依据每一段具体代码实现的目的进行归类,形成多个代码子集,代码子集的名称已代码目的进行命名;
8、同时依据每一段具体代码所具有的特性生成相应的代码标签;
9、步骤二:生成机器学习模型:
10、接收机器学习模型生成任务,分析任务目标并选择合适的模型类型,构建选择模型类型下的达成任务目标的基础代码框架;
11、依据基础代码框架中每一个部分需要实现的目的在相应代码子集中进行一次匹配,将符合要求的匹配结果作为预选项;
12、分析业务应用和/或系统环境对基础代码框架中每一个部分的设定一个或多个特性标签;
13、将特性标签作为匹配项在对应的预选项中进行二次匹配,筛除匹配度低于第一设定值的代码;
14、对剩余代码进行排列组合,生成多个机器学习模型代码;
15、依据机器学习模型代码生成机器学习模型,并试运行,筛除代码出错率高于第二设定值的机器学习模型。
16、本发明所述的代码生成的机器学习模型生成方法,其中,所述分别依据每一段具体代码实现的目的进行归类,形成多个代码子集,代码子集的名称已代码目的进行命名采用方法:
17、获取模型代码文本,将模型代码文本转译为代码语义;
18、进行语义分析,将存在关联的语义的代码归纳为一段;
19、进行语义分析,得到一段代码的语义,并归纳代码目的;
20、将具有语义的每段代码作为代码子集,代码目的作为代码子集的名称。
21、本发明所述的代码生成的机器学习模型生成方法,其中,所述依据每一段具体代码所具有的特性生成相应的代码标签采用方法:
22、基于对每段代码的语义分析结果,筛除语义中常规词,剩余的词作为特性词生成相应的代码标签。
23、本发明所述的代码生成的机器学习模型生成方法,其中,所述分析业务应用和/或系统环境对基础代码框架中每一个部分的设定一个或多个特性标签采用方法:
24、遍历基础代码框架中每一个部分,将各部分归类为行业通用代码和行业特殊代码;
25、对于行业通用代码,设定行业通用的特性标签;
26、对于行业特殊代码,设定符合实际的业务应用和/或系统环境的需求的特性标签。
27、本发明所述的代码生成的机器学习模型生成方法,其中,所述模型的类型分为神经网络类模型、神经主义类模型、决策树类模型、概率类模型和近邻类模型。
28、一种代码生成的机器学习模型生成系统,应用于如上述的代码生成的机器学习模型生成方法,其中,所述系统包括模型代码数据库构建单元和机器学习模型生成单元;
29、所述模型代码数据库构建单元,用于收集归属于同一行业中的历史机器学习模型代码,构建历史模型数据库;历史模型数据库中按照模型的类型分类,形成多个类型模块;对属于同一类型模块的模型代码,分别依据每一段具体代码实现的目的进行归类,形成多个代码子集,代码子集的名称已代码目的进行命名;同时依据每一段具体代码所具有的特性生成相应的代码标签;
30、所述机器学习模型生成单元,用于接收机器学习模型生成任务,分析任务目标并选择合适的模型类型,构建选择模型类型下的达成任务目标的基础代码框架;依据基础代码框架中每一个部分需要实现的目的在相应代码子集中进行一次匹配,将符合要求的匹配结果作为预选项;分析业务应用和/或系统环境对基础代码框架中每一个部分的设定一个或多个特性标签;将特性标签作为匹配项在对应的预选项中进行二次匹配,筛除匹配度低于第一设定值的代码;对剩余代码进行排列组合,生成多个机器学习模型代码;依据机器学习模型代码生成机器学习模型,并试运行,筛除代码出错率高于第二设定值的机器学习模型。
31、本发明所述的代码生成的机器学习模型生成系统,其中,所述分别依据每一段具体代码实现的目的进行归类,形成多个代码子集,代码子集的名称已代码目的进行命名采用方法:
32、获取模型代码文本,将模型代码文本转译为代码语义;
33、进行语义分析,将存在关联的语义的代码归纳为一段;
34、进行语义分析,得到一段代码的语义,并归纳代码目的;
35、将具有语义的每段代码作为代码子集,代码目的作为代码子集的名称。
36、本发明所述的代码生成的机器学习模型生成系统,其中,所述依据每一段具体代码所具有的特性生成相应的代码标签采用方法:
37、基于对每段代码的语义分析结果,筛除语义中常规词,剩余的词作为特性词生成相应的代码标签。
38、本发明所述的代码生成的机器学习模型生成系统,其中,所述分析业务应用和/或系统环境对基础代码框架中每一个部分的设定一个或多个特性标签采用方法:
39、遍历基础代码框架中每一个部分,将各部分归类为行业通用代码和行业特殊代码;
40、对于行业通用代码,设定行业通用的特性标签;
41、对于行业特殊代码,设定符合实际的业务应用和/或系统环境的需求的特性标签。
42、本发明所述的代码生成的机器学习模型生成系统,其中,所述模型的类型分为神经网络类模型、神经主义类模型、决策树类模型、概率类模型和近邻类模型。
43、本发明的有益效果在于:应用本技术的方式方法,通过对数据代码类型分类,以及对代码含义挖掘并设定标签,以整个行业历史机器学习模型代码作为数据库,在进行机器学习模型生成时,可以有更多可选的代码选择,同时匹配度可以根据需要进行调整,能够大幅度的提升代码自动生成的效率以及精度,自动筛选得到的代码后期调整的工作量也较小。