AI模型的自动迭代运维方法、系统、设备及存储介质与流程

文档序号:21643584发布日期:2020-07-29 02:56阅读:来源:国知局

技术特征:

1.一种ai模型的自动迭代运维方法,其特征在于,所述自动迭代运维方法包括以下步骤:

s1、获取训练集对应的版本号及待训练ai模型对应的版本名;

s2、根据所述版本号及所述版本名使用训练服务从文件系统自动下载所述训练集和所述待训练ai模型;

s3、所述训练服务使用所述训练集自动对所述待训练ai模型进行训练;

s4、所述训练服务自动对训练的效果进行评估,以得到评估结果;

s5、所述训练服务根据所述评估结果判断是否进行模型替换,若是则自动热加载替换模型。

2.如权利要求1所述的ai模型的自动迭代运维方法,其特征在于,所述s1还包括:获取训练方式和待替换ai模型对应的版本名;

所述s2还包括:根据所述待替换ai模型对应的版本名使用训练服务从所述文件系统自动下载所述待替换ai模型;

所述训练方式包括增量训练和全量训练;

所述s3包括:

若所述训练方式为全量训练,则所述训练服务使用所述训练集自动对所述待训练ai模型进行训练,以得到全量训练后的模型;

若所述训练方式为增量训练,则所述训练服务使用所述训练集自动对所述待替换ai模型进行训练,以得到增量训练后的模型;

所述s4包括以下步骤:

若所述训练方式为全量训练,则所述训练服务自动对所述待训练ai模型和所述全量训练后的模型的精确率和/或召回率进行比较,以得到评估结果;

若所述训练方式为增量训练,则所述训练服务自动对所述待替换ai模型和所述增量训练后的模型的精确率和/或召回率进行比较,以得到评估结果。

3.如权利要求2所述的ai模型的自动迭代运维方法,其特征在于,在所述s2和所述s3之间还包括以下步骤:

所述训练服务自动对所述训练集及所述待训练ai模型和/或所述待替换ai模型进行格式校验,所述训练服务根据校验结果自动判断所述训练集及所述待训练ai模型和/或所述待替换ai模型是否可用。

4.如权利要求2所述的ai模型的自动迭代运维方法,其特征在于,所述待训练ai模型、所述待替换ai模型、所述全量训练后的模型、所述增量训练后的模型均为python数据模型;

所述s3和所述s4之间还包括以下步骤:

所述训练服务自动将所述python数据模型转换成java数据模型,并对所述java数据模型进行格式校验,若校验通过则执行所述s4。

5.如权利要求1所述的ai模型的自动迭代运维方法,其特征在于,所述版本名包括业务线名、场景名、数据周期名。

6.如权利要求1所述的ai模型的自动迭代运维方法,其特征在于,所述s5包括以下步骤:

所述训练服务根据所述评估结果判断是否进行模型替换,若是则判断是否自动替换,若是则自动热加载替换模型,若否则将所述评估结果通过邮件和/或短信发送至预设的接收端。

7.一种ai模型的自动迭代运维系统,其特征在于,包括前端、管理端和训练服务端;

所述前端用于获取训练集对应的版本号;

所述管理端用于获取待训练ai模型对应的版本名;

所述训练服务端包括下载模块、训练模块、评估模块和替换模块;

所述下载模块用于根据所述版本号及所述版本名从文件系统自动下载所述训练集和所述待训练ai模型;

所述训练模块用于使用所述训练集自动对所述待训练ai模型进行训练;

所述评估模块用于自动对训练的效果进行评估,以得到评估结果;

所述替换模块用于根据所述评估结果判断是否进行模型替换,若是则自动热加载替换模型。

8.如权利要求7所述的ai模型的自动迭代运维系统,其特征在于,所述前端还用于获取训练方式,所述管理端还用于获取待替换ai模型对应的版本名;

所述下载模块还用于根据所述待替换ai模型对应的版本名从所述文件系统自动下载所述待替换ai模型;

所述训练方式包括增量训练和全量训练;

所述训练模块包括全量训练单元和增量训练单元;

所述全量训练单元用于在所述训练方式为全量训练时使用所述训练集自动对所述待训练ai模型进行训练,以得到全量训练后的模型;

所述增量训练单元用于在所述训练方式为增量训练时使用所述训练集自动对所述待替换ai模型进行训练,以得到增量训练后的模型;

所述评估模块包括全量评估单元和增量评估单元;

所述全量评估单元用于在所述训练方式为全量训练时自动对所述待训练ai模型和所述全量训练后的模型的精确率和/或召回率进行比较,以得到评估结果;

所述增量评估单元用于在所述训练方式为增量训练时自动对所述待替换ai模型和所述增量训练后的模型的精确率和/或召回率进行比较,以得到评估结果。

9.如权利要求8所述的ai模型的自动迭代运维系统,其特征在于,所述训练服务端还包括校验模块;

所述校验模块用于自动对所述训练集及所述待训练ai模型和/或所述待替换ai模型进行格式校验,并根据校验结果自动判断所述训练集及所述待训练ai模型和/或所述待替换ai模型是否可用。

10.如权利要求8所述的ai模型的自动迭代运维系统,其特征在于,所述待训练ai模型、所述待替换ai模型、所述全量训练后的模型、所述增量训练后的模型均为python数据模型;

所述训练服务端还包括模型转换模块;

所述模型转换模块用于自动将所述python数据模型转换成java数据模型,并对所述java数据模型进行格式校验,若校验通过则调用所述评估模块。

11.如权利要求7所述的ai模型的自动迭代运维系统,其特征在于,所述版本名包括业务线名、场景名、数据周期名。

12.如权利要求7所述的ai模型的自动迭代运维系统,其特征在于,

所述替换模块包括第一判断单元、第二判断单元、自动替换单元和结果发送单元;

所述第一判断单元用于根据所述评估结果判断是否进行模型替换,若是则调用所述第二判断单元;

所述第二判断单元用于判断是否自动替换,若是则调用所述自动替换单元,若否则调用所述结果发送单元;

所述自动替换单元用于自动热加载替换模型;

所述结果发送单元用于将所述评估结果通过邮件和/或短信发送至预设的接收端。

13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6任意一项所述的ai模型的自动迭代运维方法。

14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6任意一项所述的ai模型的自动迭代运维方法的步骤。


技术总结
本发明公开了一种AI模型的自动迭代运维方法、系统、设备及存储介质,AI模型的自动迭代运维方法包括:获取训练集对应的版本号及待训练AI模型对应的版本名;根据版本号及版本名使用训练服务从文件系统自动下载训练集和待训练AI模型;训练服务使用训练集自动对待训练AI模型进行训练;训练服务自动对训练的效果进行评估,以得到评估结果;训练服务根据评估结果判断是否进行模型替换,若是则自动热加载替换模型。本发明以AI训练侧服务为中心,配合管理端,可做到AI模型自动迭代运维,按照不同的场景可做到各种不同的模型运维和版本配置;并且使运维人员与各业务模型的复杂逻辑隔离,版本透明,能在减少运维成本的基础上提高运维效率。

技术研发人员:范博;周海刚;陈宇;艾青;王乐
受保护的技术使用者:上海携程商务有限公司
技术研发日:2020.03.18
技术公布日:2020.07.28
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1