一种跨域推荐及模型训练的方法、装置、设备及存储介质与流程

文档序号:36146816发布日期:2023-11-23 01:13阅读:38来源:国知局
一种跨域推荐及模型训练的方法与流程

本公开的实施方式涉及通信,更具体地,本公开的实施方式涉及一种跨域推荐及模型训练的方法、装置、设备及存储介质。


背景技术:

1、本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

2、内容推荐可以帮助用户在海量的信息中找到真正感兴趣的内容。因此,通常需要根据用户的历史数据(包括历史浏览记录、历史喜爱度等行为数据)来确定用户的兴趣偏好,从而为用户提供精准的内容推荐服务。然而,传统的推荐算法往往仅能够对某一领域内历史数据丰富的用户进行推荐,而无法对该领域内历史数据稀疏的用户实现推荐。比如,在视频推荐场景中,某些活跃度较低的用户在该视频领域内的视频行为(包括观看、投币、点赞等行为)数据较为稀疏,从而导致无法刻画这些用户的兴趣偏好,难以实现精准推荐以及多样性推荐。而跨域推荐旨在结合多个领域的信息对用户进行内容推荐,即通过引入其他领域(辅助域/源域)的信息进行辅助,从而在目标域内对用户实现精准推荐,提高目标域的推荐效果。

3、目前,相关技术中的跨域推荐算法无法很好地运用辅助域的信息,导致跨域推荐效果较差。


技术实现思路

1、在本公开实施方式的第一方面中,提供了一种跨域推荐模型的训练方法,包括:

2、获取训练样本集,所述训练样本集包括样本用户的id特征、样本物品的id特征以及所述样本用户与所述样本物品的目标相似度;所述样本物品包括目标域的第一样本物品和区别于所述目标域的至少一个辅助域的第二样本物品;所述目标相似度包括所述样本用户与所述第一样本物品的第一目标相似度,以及所述样本用户与所述第二样本物品的第二目标相似度;

3、将所述训练样本集输入待训练模型,以由所述待训练模型生成所述样本用户对应的目标域样本用户向量和所述第一样本物品对应的第一样本物品向量,并基于所述目标域样本用户向量和所述第一样本物品向量,输出所述样本用户和所述第一样本物品的第一预测相似度;其中,所述目标域样本用户向量包括用于表征所述样本用户在所述目标域的独有兴趣的目标独有样本用户向量,以及用于表征所述样本用户在所述目标域和所述辅助域的通用兴趣的共享样本用户向量;

4、基于所述第一预测相似度和所述第一目标相似度对所述模型进行迭代训练,直至第一损失函数收敛或迭代次数达到上限。

5、可选的,所述训练样本集包括训练正样本集和训练负样本集,其中,所述训练正样本集包含的样本物品为与所述样本用户存在历史交互行为的物品,所述训练负样本集包含的样本物品为与所述样本用户不存在所述历史交互行为的物品。

6、可选的,所述待训练模型生成所述样本用户对应的目标域样本用户向量,包括:所述待训练模型基于所述样本用户的id特征生成所述目标独有样本用户向量和所述共享样本用户向量;将所述目标独有样本用户向量和所述共享样本用户向量进行融合,得到所述目标域样本用户向量。

7、可选的,所述方法还包括:所述待训练模型生成所述样本用户对应的辅助域样本用户向量和所述第二样本物品对应的第二样本物品向量,并基于所述辅助域样本用户向量和所述第二样本物品向量,输出所述样本用户和所述第二样本物品的第二预测相似度;其中,所述辅助域样本用户向量包括用于表征所述样本用户在所述辅助域的独有兴趣的辅助独有样本用户向量,以及所述共享样本用户向量;基于所述第二预测相似度和所述第二目标相似度对所述模型进行迭代训练,直至第二损失函数收敛或迭代次数达到上限。

8、可选的,所述第一损失函数包括对应于所述目标域样本用户向量的第一结果损失函数,以及对应于所述目标独有样本用户向量和所述共享样本用户向量的第一中间值损失函数;所述第二损失函数包括对应于所述辅助域样本用户向量的第二结果损失函数,以及对应于所述辅助独有样本用户向量和所述共享样本用户向量的第二中间值损失函数。

9、可选的,所述第一结果损失函数用于计算所述目标域样本用户向量与所述第一样本物品向量的预测相似度的损失值;所述第二结果损失函数用于计算所述辅助域样本用户向量与所述第二样本物品向量的预测相似度的损失值。

10、可选的,所述第一中间值损失函数用于计算所述目标独有样本用户向量与所述第一样本物品向量的预测相似度的损失值,以及所述共享样本用户向量与所述第一样本物品向量的预测相似度的损失值;所述第二中间值损失函数用于计算所述辅助独有样本用户向量与所述第二样本物品向量的预测相似度的损失值,以及所述共享样本用户向量与所述第二样本物品向量的预测相似度的损失值。

11、在本公开实施方式的第二方面中,提供了一种跨域推荐方法,包括:

12、获取目标用户的id特征,以及目标域中待推荐物品的id特征;

13、基于所述目标用户的id特征和所述待推荐物品的id特征,分别生成所述目标用户对应的用户向量和所述待推荐物品对应的物品向量;其中,所述用户向量包括用于表征所述目标用户在所述目标域的独有兴趣的独有用户向量,以及用于表征所述目标用户在所述目标域和区别于所述目标域的至少一个辅助域的通用兴趣的共享用户向量;

14、基于所述用户向量和所述物品向量计算所述目标用户与所述待推荐物品的相似度,并基于所述相似度向所述目标用户推荐预设数量的目标物品。

15、在本公开实施方式的第三方面中,提供了一种跨域推荐模型的训练装置,包括:

16、样本获取单元,用于获取训练样本集,所述训练样本集包括样本用户的id特征、样本物品的id特征以及所述样本用户与所述样本物品的目标相似度;所述样本物品包括目标域的第一样本物品和区别于所述目标域的至少一个辅助域的第二样本物品;所述目标相似度包括所述样本用户与所述第一样本物品的第一目标相似度,以及所述样本用户与所述第二样本物品的第二目标相似度;

17、输出单元,用于将所述训练样本集输入待训练模型,以由所述待训练模型生成所述样本用户对应的目标域样本用户向量和所述第一样本物品对应的第一样本物品向量,并基于所述目标域样本用户向量和所述第一样本物品向量,输出所述样本用户和所述第一样本物品的第一预测相似度;其中,所述目标域样本用户向量包括用于表征所述样本用户在所述目标域的独有兴趣的目标独有样本用户向量,以及用于表征所述样本用户在所述目标域和所述辅助域的通用兴趣的共享样本用户向量;

18、训练单元,用于基于所述第一预测相似度和所述第一目标相似度对所述模型进行迭代训练,直至第一损失函数收敛或迭代次数达到上限。

19、在本公开实施方式的第四方面中,提供了一种跨域推荐装置,包括:

20、获取单元,用于获取目标用户的id特征,以及目标域中待推荐物品的id特征;

21、生成单元,用于基于所述目标用户的id特征和所述待推荐物品的id特征,分别生成所述目标用户对应的用户向量和所述待推荐物品对应的物品向量;其中,所述用户向量包括用于表征所述目标用户在所述目标域的独有兴趣的独有用户向量,以及用于表征所述目标用户在所述目标域和区别于所述目标域的至少一个辅助域的通用兴趣的共享用户向量;

22、推荐单元,用于基于所述用户向量和所述物品向量计算所述目标用户与所述待推荐物品的相似度,并基于所述相似度向所述目标用户推荐预设数量的目标物品。

23、在本公开实施方式的第五方面中,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一/二方面的实施例中所述的方法。

24、在本公开实施方式的第六方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一/二方面的实施例中所述方法的步骤。

25、本公开以上的实施方式,至少具有如下的有益效果:

26、提供一种跨域推荐模型的训练方法,在训练跨域推荐模型的过程中,通过引入用于表征用户在目标域和至少一个区别于目标域的辅助域的通用兴趣的共享用户向量,然后对该共享用户向量和用于表征用户在目标域的独有兴趣的独有用户向量同时进行训练,使得训练完成的跨域推荐模型能够精准刻画出用户在目标域的独有兴趣和多个领域之间的通用兴趣,即通过刻画出用户更全面的兴趣来对用户实现精准的内容推荐以及多样性推荐,从而实现了多个领域之间的跨域推荐,有效提升了目标域的推荐效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1