线上分类模型的学习更新方法及相关设备与流程

文档序号：35266220发布日期：2023-08-30 00:07阅读：15来源：国知局

本申请涉及计算机，尤其涉及一种线上分类模型的学习更新方法、装置、电子设备及存储介质。

背景技术：

1、随着机器学习技术的快速发展，越来越多的线上业务是提供机器学习模型来实现的。这其中，分类业务是一重要的应用场景，常见的线上分类业务如，图像分类、文本分类、文本实体抽取、语音识别等。上述线上分类业务均可以通过线上分类模型来实现。随着业务场景的精益求精，线上分类模型也需要不断进行学习更新提高效果来满足业务预期。然而，相关技术中的线上分类模型的学习更新方案，普遍存在成本高、效率低的问题。

技术实现思路

1、有鉴于此，本申请的目的在于提出一种线上分类模型的学习更新方法、装置、电子设备及存储介质。

2、基于上述目的，本申请提供了一种线上分类模型的学习更新方法，包括：

3、根据线上分类模型的业务数据，生成学习样本数据并存储；

4、每隔预定的时长，在存储的所述学习样本数据中，拉取一定量的目标学习样本数据，并基于所述目标学习样本数据发布标注任务；响应于所述标注任务完成，得到标注后的目标学习样本数据；

5、根据所述标注后的目标学习样本数据，生成训练数据集并进行训练，得到模型更新数据；

6、根据所述模型更新数据，更新所述线上分类模型。

7、在一些实施方式中，根据线上分类模型的实际业务数据，生成学习样本数据并存储，包括：

8、对于线上分类模型产生的一份业务数据，确定所述线上分类模型输出的各分类结果中，预测概率最大的第一分类结果，以及预测概率第二大的第二分类结果；

9、响应于确定所述第一分类结果与所述第二分类结果的差值小于预定的阈值，将所述业务数据确定为所述学习样本数据。

10、在一些实施方式中，响应于确定所述第一分类结果与所述第二分类结果的差值小于预定的阈值，将该业务数据确定为所述学习样本数据，包括：

11、响应于确定所述第一分类结果与所述第二分类结果的差值小于预定的阈值，进一步将所述第一分类结果与所述第二分类结果构成数据对，在预设的数据对集合进行匹配检索，响应于得到匹配检索结果，将所述业务数据确定为所述学习样本数据。

12、在一些实施方式中，生成学习样本数据并存储，包括：

13、确定所述业务数据的存储位置信息；

14、根据所述第一分类结果与所述第二分类结果，确定所述业务数据中的目标数据的位置信息；

15、将所述业务数据的存储位置信息、所述第一分类结果、所述第二分类结果和所述业务数据中的目标数据的位置信息，作为一份所述学习样本数据进行存储。

16、在一些实施方式中，基于所述目标学习样本数据发布标注任务，之后还包括：

17、响应于所述标注任务开始被处理，根据所述业务数据的存储位置信息，获取所述业务数据。

18、在一些实施方式中，根据所述标注后的目标学习样本数据，生成训练数据集并进行训练，得到模型更新数据，包括：

19、根据所述业务数据的存储位置信息，获取所述业务数据；

20、根据所述业务数据以及所述标注后的目标学习样本数据，生成训练数据集并进行训练，得到模型更新数据。

21、在一些实施方式中，根据模型更新数据，更新所述线上分类模型，包括：

22、根据所述模型更新数据，更新所述线上分类模型，得到待部署分类模型；

23、使用预定的测试数据集，分别对所述线上分类模型和所述待部署分类模型进行测试；

24、响应于确定所述待部署分类模型的测试结果优于所述线上分类模型测试结果，使用所述待部署分类模型替换所述线上分类模型。

25、基于同一技术构思，本申请还提供了一种线上分类模型的学习更新装置，包括：

26、生成模块，被配置为根据线上分类模型的业务数据，生成学习样本数据并存储；

27、标注模块，被配置为每隔预定的时长，在存储的所述学习样本数据中，拉取一定量的目标学习样本数据，并基于所述目标学习样本数据发布标注任务；响应于所述标注任务完成，得到标注后的目标学习样本数据；

28、训练模块，被配置为根据所述标注后的目标学习样本数据，生成训练数据集并进行训练，得到模型更新数据；

29、更新模块，被配置为根据所述模型更新数据，更新所述线上分类模型。

30、基于同一技术构思，本申请还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上任意一项所述的方法。

31、基于同一技术构思，本申请还提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令用于使计算机执行如上任意一项所述的方法。

32、从上面所述可以看出，本申请提供的线上分类模型的学习更新方法、装置、电子设备及存储介质，将数据标注、模型训练、模型更新三个任务进行有效的整合联动，实现线上分类模型学习更新全流程的自动化；其中，特别是对于标注任务采用定时任务的方式，有效的提升了数据标注的效率、节约了成本。

技术特征：

1.一种线上分类模型的学习更新方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，根据线上分类模型的业务数据，生成学习样本数据并存储，包括：

3.根据权利要求2所述的方法，其特征在于，响应于确定所述第一分类结果与所述第二分类结果的差值小于预定的阈值，将该业务数据确定为所述学习样本数据，包括：

4.根据权利要求2所述的方法，其特征在于，生成学习样本数据并存储，包括：

5.根据权利要求4所述的方法，其特征在于，基于所述目标学习样本数据发布标注任务，之后还包括：

6.根据权利要求4所述的方法，其特征在于，根据所述标注后的目标学习样本数据，生成训练数据集并进行训练，得到模型更新数据，包括：

7.根据权利要求1所述的方法，其特征在于，根据模型更新数据，更新所述线上分类模型，包括：

8.一种线上分类模型的学习更新装置，其特征在于，包括：

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法。

10.一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，其特征在于，所述计算机指令用于使计算机执行如权利要求1至7任意一项所述的方法。

技术总结
本申请提供一种线上分类模型的学习更新方法、装置、电子设备及存储介质。所述方法，包括：根据线上分类模型的业务数据，生成学习样本数据并存储；每隔预定的时长，在存储的所述学习样本数据中，拉取一定量的目标学习样本数据，并基于所述目标学习样本数据发布标注任务；响应于所述标注任务完成，得到标注后的目标学习样本数据；根据所述标注后的目标学习样本数据，生成训练数据集并进行训练，得到模型更新数据；根据所述模型更新数据，更新所述线上分类模型。

技术研发人员：曾劲
受保护的技术使用者：北京有竹居网络技术有限公司
技术研发日：
技术公布日：2024/1/14

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曾劲
技术所有人：北京有竹居网络技术有限公司
我是此专利的发明人

上一篇：半导体结构及其制造方法与流程
上一篇：一种十字路口双U型转弯代替直行与左转弯的通行方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。