基于元学习的模型训练方法、推荐方法和装置与流程

文档序号：34322905发布日期：2023-06-01 02:15阅读：40来源：国知局

本说明书实施例涉及计算机，特别涉及一种基于元学习的模型训练方法、推荐方法和装置。

背景技术：

1、元学习(meta learning)是一种学习如何学习的方法。元学习可以解决小样本情况下的模型训练问题，因而得到了广泛的应用。在元学习的过程中需要划分训练任务。在相关技术中，可以根据人工先验知识划分训练任务。例如，根据人工先验知识将多个训练数据划分为多个训练任务，以便根据所述多个训练任务进行元学习。但是，训练数据往往有着复杂的表现形式。上述相关技术中训练任务的划分依赖于人工经验，造成元学习的效果不佳。

技术实现思路

1、本说明书实施例提供一种基于元学习的模型训练方法、推荐方法和装置，以合理的划分训练任务，提高元学习的效果。本说明书实施例的技术方案如下。

2、本说明书实施例的第一方面，提供了一种基于元学习的模型训练方法，包括：

3、获取多个第一训练数据，所述第一训练数据包括第一产品数据、第一用户数据和第一标签，所述第一标签用于表示第一产品数据与第一用户数据是否关联；

4、通过分析第一训练数据之间的相似性，构建多个训练任务；

5、根据所述多个训练任务进行元学习，得到元模型；

6、根据第二训练数据训练所述元模型，得到业务模型，所述第二训练数据包括第二产品数据、第二用户数据和第二标签，所述第二标签用于表示第二产品数据与第二用户数据是否关联，所述业务模型用于对产品数据与用户数据相关联的可能性进行预测。

7、本说明书实施例的第二方面，提供了一种推荐方法，包括：

8、接收终端设备发来的推荐请求，所述推荐请求中包括用户数据；

9、通过业务模型，对所述用户数据与产品数据集中各产品数据相关联的可能性进行预测；其中，所述业务模型通过以下方式训练得到：获取多个第一训练数据；通过分析第一训练数据之间的相似性，构建多个训练任务；根据所述多个训练任务进行元学习，得到元模型；根据第二训练数据训练元模型，得到业务模型；

10、向终端设备反馈目标产品数据，所述目标产品数据为所述产品数据集中与所述用户数据相关联的可能性最大的产品数据。

11、本说明书实施例的第三方面，提供了一种基于元学习的模型训练装置，包括：

12、获取单元，用于获取多个第一训练数据，所述第一训练数据包括第一产品数据、第一用户数据和第一标签，所述第一标签用于表示第一产品数据与第一用户数据是否关联；

13、训练任务构建单元，用于通过分析第一训练数据之间的相似性，构建多个训练任务；

14、元学习单元，用于根据所述多个训练任务进行元学习，得到元模型；

15、训练单元，用于根据第二训练数据训练元模型，得到业务模型，所述第二训练数据包括第二产品数据、第二用户数据和第二标签，所述第二标签用于表示第二产品数据与第二用户数据是否关联，所述业务模型用于对产品数据与用户数据相关联的可能性进行预测。

16、本说明书实施例的第四方面，提供了一种推荐装置，包括：

17、接收单元，用于接收终端设备发来的推荐请求，所述推荐请求中包括用户数据；

18、预测单元，用于通过业务模型，对所述用户数据与产品数据集中各产品数据相关联的可能性进行预测；其中，所述业务模型通过以下方式训练得到：获取多个第一训练数据；通过分析第一训练数据之间的相似性，构建多个训练任务；根据所述多个训练任务进行元学习，得到元模型；根据第二训练数据训练元模型，得到业务模型；

19、反馈单元，用于向终端设备反馈目标产品数据，所述目标产品数据为所述产品数据集中与所述用户数据相关联的可能性最大的产品数据。

20、本说明书实施例的第五方面，提供了一种计算机存储介质，所述计算机存储介质存储有计算机程序指令，所述计算机程序指令被执行时实现第一方面或第二方面所述方法的步骤。

21、本说明书实施例提供的技术方案，可以获取多个第一训练数据；可以通过分析第一训练数据之间的相似性，构建多个训练任务；可以根据所述多个训练任务进行元学习，得到元模型；可以根据第二训练数据训练所述元模型，得到业务模型，所述业务模型用于对产品数据与用户数据相关联的可能性进行预测。通过分析第一训练数据之间的相似性构建多个训练任务。使得可以根据第一训练数据进行自适应的训练任务划分，而不依赖于预先设定的划分规则，例如根据人工先验知识设定的划分规则。这样可以更好的将相似的训练数据划分至同一训练任务，将相异的训练数据划分至不同训练任务。从而可以提高元学习的效果。

技术特征：

1.一种基于元学习的模型训练方法，包括：

2.根据权利要求1所述的方法，所述构建多个训练任务，包括：

3.根据权利要求1所述的方法，所述根据所述多个训练任务进行元学习，包括：

4.根据权利要求1所述的方法，所述根据第二训练数据训练所述元模型，包括：

5.根据权利要求4所述的方法，所述多个预测场景对应多个第一特征数据，所述第一特征数据用于表示预测场景下产品的特征；所述方法还包括：

6.根据权利要求4所述的方法，所述多个预测场景对应多个第二特征数据，所述第二特征数据用于表示预测场景下用户的特征；所述方法还包括：

7.一种推荐方法，包括：

8.根据权利要求7所述的方法，所述对所述用户数据与产品数据集中各产品数据相关联的可能性进行预测，包括：

9.根据权利要求7所述的方法，所述对所述用户数据与产品数据集中各产品数据相关联的可能性进行预测，包括：

10.一种基于元学习的模型训练装置，包括：

11.一种推荐装置，包括：

12.一种计算机存储介质，所述计算机存储介质存储有计算机程序指令，所述计算机程序指令被执行时实现权利要求1至9中任一项所述方法的步骤。

技术总结
本说明书实施例公开了一种基于元学习的模型训练方法、推荐方法和装置。所述基于元学习的模型训练方法包括：获取多个第一训练数据，所述第一训练数据包括第一产品数据、第一用户数据和第一标签，所述第一标签用于表示第一产品数据与第一用户数据是否关联；通过分析第一训练数据之间的相似性，构建多个训练任务；根据所述多个训练任务进行元学习，得到元模型；根据第二训练数据训练所述元模型，得到业务模型，所述第二训练数据包括第二产品数据、第二用户数据和第二标签，所述第二标签用于表示第二产品数据与第二用户数据是否关联，所述业务模型用于对产品数据与用户数据相关联的可能性进行预测。本说明书实施例可以提高元学习的效果。

技术研发人员：郇兆鑫,周俊,顾立宏,张晓露,张公铎
受保护的技术使用者：支付宝（杭州）信息技术有限公司
技术研发日：
技术公布日：2024/1/12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郇兆鑫周俊顾立宏张晓露张公铎
技术所有人：支付宝（杭州）信息技术有限公司
我是此专利的发明人

上一篇：一种水平方向减震的轿底架装配结构的制作方法
上一篇：防水型一体化电能表壳体的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。