模型训练方法、资源推荐方法、样本生成方法和装置与流程

文档序号:35281084发布日期:2023-09-01 00:43阅读:61来源:国知局
模型训练方法、资源推荐方法、样本生成方法和装置与流程

本公开涉及人工智能,尤其涉及信息流、智能推荐领域,更具体地,本公开提供了一种资源推荐模型的训练方法、资源推荐方法、生成训练样本的方法、装置、电子设备、存储介质以及计算机程序产品。


背景技术:

1、视频网站、图书网站等平台可以根据用户的历史行为,向用户推荐视频、文本等资源,然而目前资源推荐的效果较差,影响了用户体验。


技术实现思路

1、本公开提供了一种资源推荐模型的训练方法、资源推荐方法、生成训练样本的方法、装置、电子设备、存储介质以及计算机程序产品。

2、根据本公开的一方面,提供了一种资源推荐模型的训练方法,资源推荐模型包括第一子模型和第二子模型,方法包括:获取训练样本;训练样本包括对象的对象特征、第一资源的第一资源特征、第二资源的第二资源特征、第一标签、第二标签和第三标签,第一标签表征对象对第一资源的偏好程度与对象对第二资源的偏好程度之间的差异,第二标签表征对象对第一资源的偏好程度,第三标签表征对象对第二资源的偏好程度;利用第一子模型处理对象特征、第一资源特征和第二资源特征,得到第一评价值;将对象特征、第一资源特征输入第二子模型,得到第二评价值;将对象特征、第二资源特征输入第二子模型,得到第三评价值;以及根据第一评价值和第一标签之间的第一差异,第二评价值和第二标签之间的第二差异,以及第三评价值和第三标签之间的第三差异,训练第一子模型和第二子模型。

3、根据本公开的另一方面,提供了一种资源推荐方法,包括:确定目标对象和待推荐的多个候选资源;针对多个候选资源中的每个候选资源,利用资源推荐模型处理目标对象的目标对象特征和候选资源的候选资源特征,得到针对候选资源的推荐评价值;根据多个候选资源的多个推荐评价值,从多个候选资源中确定目标资源;以及向目标对象推荐目标资源;其中,资源推荐模型是利用上述资源推荐模型的训练方法训练得到的。

4、根据本公开的另一方面,提供了一种生成训练样本的方法,包括:根据对象针对多个资源产生的行为,将多个资源划分为多个资源集合;多个资源为已向对象展示的资源;以及根据多个资源集合中的至少一个资源集合,生成训练样本;其中,训练样本包括对象的对象特征、第一资源的第一资源特征、第二资源的第二资源特征、第一标签、第二标签和第三标签,第一标签表征对象对第一资源的偏好程度与对象对第二资源的偏好程度之间的差异,第二标签表征对象对第一资源的偏好程度,第三标签表征对象对第二资源的偏好程度。

5、根据本公开的另一方面,提供了一种资源推荐模型的训练装置,资源推荐模型包括第一子模型和第二子模型,装置包括:样本获取模块,用于获取训练样本;训练样本包括对象的对象特征、第一资源的第一资源特征、第二资源的第二资源特征、第一标签、第二标签和第三标签,第一标签表征对象对第一资源的偏好程度与对象对第二资源的偏好程度之间的差异,第二标签表征对象对第一资源的偏好程度,第三标签表征对象对第二资源的偏好程度;第一评价值确定模块,用于利用第一子模型处理对象特征、第一资源特征和第二资源特征,得到第一评价值;第二评价值确定模块,用于将对象特征、第一资源特征输入第二子模型,得到第二评价值;第三评价值确定模块,用于将对象特征、第二资源特征输入第二子模型,得到第三评价值;以及训练模块,用于根据第一评价值和第一标签之间的第一差异,第二评价值和第二标签之间的第二差异,以及第三评价值和第三标签之间的第三差异,训练第一子模型和第二子模型。

6、根据本公开的另一方面,提供了一种资源推荐装置,包括:信息确定模块,用于确定目标对象和待推荐的多个候选资源;推荐评价值确定模块,用于针对多个候选资源中的每个候选资源,利用资源推荐模型处理目标对象的目标对象特征和候选资源的候选资源特征,得到针对候选资源的推荐评价值;目标资源确定模块,用于根据多个候选资源的多个推荐评价值,从多个候选资源中确定目标资源;以及推荐模块,用于向目标对象推荐目标资源;其中,资源推荐模型是利用上述训练得到的。

7、根据本公开的另一方面,提供了一种生成训练样本的装置,包括:划分模块,用于根据对象针对多个资源产生的行为,将多个资源划分为多个资源集合;多个资源为已向对象展示的资源;以及生成模块,用于根据多个资源集合中的至少一个资源集合,生成训练样本;其中,训练样本包括对象的对象特征、第一资源的第一资源特征、第二资源的第二资源特征、第一标签、第二标签和第三标签,第一标签表征对象对第一资源的偏好程度与对象对第二资源的偏好程度之间的差异,第二标签表征对象对第一资源的偏好程度,第三标签表征对象对第二资源的偏好程度。

8、根据本公开的另一个方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开提供的方法。

9、根据本公开的另一个方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开提供的方法。

10、根据本公开的另一个方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开提供的方法。

11、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种资源推荐模型的训练方法,所述资源推荐模型包括第一子模型和第二子模型,所述方法包括:

2.根据权利要求1所述的方法,其中,所述利用所述第一子模型处理所述对象特征、所述第一资源特征和所述第二资源特征,得到第一评价值包括:

3.根据权利要求1所述的方法,其中,所述根据所述第一评价值和所述第一标签之间的第一差异,所述第二评价值和所述第二标签之间的第二差异,以及所述第三评价值和所述第三标签之间的第三差异,训练所述第一子模型和所述第二子模型包括:

4.一种资源推荐方法,包括:

5.根据权利要求4所述的方法,其中,利用资源推荐模型处理所述目标对象的目标对象特征和所述候选资源的候选资源特征,得到针对所述候选资源的推荐评价值包括:

6.根据权利要求4所述的方法,其中,利用资源推荐模型处理所述目标对象的目标对象特征和所述候选资源的候选资源特征,得到针对所述候选资源的推荐评价值包括:

7.一种生成训练样本的方法,包括:

8.根据权利要求7所述的方法,其中,所述根据对象针对多个资源产生的行为,将所述多个资源划分为多个资源集合包括:

9.根据权利要求7所述的方法,其中,所述根据所述多个资源集合中的至少一个资源集合,生成训练样本包括:

10.根据权利要求7所述的方法,其中,所述根据所述多个资源集合中的至少一个资源集合,生成训练样本包括:

11.根据权利要求7所述的方法,其中,所述多个资源集合包括浏览集合,所述浏览集合中的资源对应有浏览时长;所述根据所述多个资源集合中的至少一个资源集合,生成训练样本包括:

12.一种资源推荐模型的训练装置,所述资源推荐模型包括第一子模型和第二子模型,所述装置包括:

13.根据权利要求12所述的装置,其中,所述第一评价值确定模块包括:

14.根据权利要求12所述的装置,其中,所述训练模块包括:

15.一种资源推荐装置,包括:

16.根据权利要求15所述的装置,其中,推荐评价值确定模块包括:

17.根据权利要求15所述的装置,其中,推荐评价值确定模块包括:

18.一种生成训练样本的装置,包括:

19.根据权利要求18所述的装置,其中,所述划分模块包括:

20.根据权利要求18所述的装置,其中,所述生成模块包括:

21.根据权利要求18所述的装置,其中,所述生成模块包括:

22.根据权利要求18所述的装置,其中,所述多个资源集合包括浏览集合,所述浏览集合中的资源对应有浏览时长;所述生成模块包括:

23.一种电子设备,包括:

24.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至11中任一项所述的方法。

25.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至11中任一项所述的方法。


技术总结
本公开提供了一种模型训练方法、资源推荐方法、样本生成方法和装置,涉及人工智能技术领域,尤其涉及信息流、智能推荐领域。具体实现方案为:训练样本包括对象的对象特征、第一资源的第一资源特征、第二资源的第二资源特征、第一标签、第二标签和第三标签,第一标签表征对象对第一资源、第二资源的偏好程度之间的差异,第二标签和第三标签分别表征对象对第一资源和第二资源的偏好程度;利用第一子模型处理对象特征、第一资源特征和第二资源特征,得到第一评价值;将对象特征、第一资源特征输入第二子模型,得到第二评价值;将对象特征、第二资源特征输入第二子模型,得到第三评价值;根据多个评价值和多个标签之间的差异,训练资源推荐模型。

技术研发人员:胡小雨,王朝旭,王卓颖,张宗涛,潘超,苏军平,崔宁馨,郑宇航
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:
技术公布日:2024/1/14
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1