一种用于消除推荐系统中隐藏混杂的端到端训练方法及装置

文档序号:36784630发布日期:2024-01-23 11:59阅读:13来源:国知局
一种用于消除推荐系统中隐藏混杂的端到端训练方法及装置

本发明涉及计算机,尤其涉及一种用于消除推荐系统中隐藏混杂的端到端训练方法及装置。


背景技术:

1、推荐系统通过过滤出可能会对用户感兴趣的物品,在现代网站和移动应用中起着关键作用。通常,推荐模型是基于历史用户交互数据进行训练的。然而,挖掘用户偏好的一个关键挑战是,用户总是选择与其喜好相符的物品进行交互,导致具有交互的数据与不具有交互的数据之间的分布存在显著差异,这也被称为选择偏差。

2、已经有许多方法被提出来解决数据选择偏差问题,例如基于误差插补(eib)方法、逆概率加权方法,以及双稳健方法。基于这些方法,最近的一些研究进一步提出使用多任务学习和参数共享来缓解数据稀疏性问题,例如全空间多任务学习方法,以及全空间反事实多任务学习方法。

3、然而,上述研究忽略了一个重要且常见的问题,即由隐藏或未测量混杂因素引起的选择偏差:它们只考虑了由测量到的混杂因素引起的选择偏差。实际上,由于信息限制或隐私限制,隐藏混杂因素在推荐系统中普遍存在且不可避免。具体而言,推荐系统难以收集导致用户转化的外生信息,以及在用户在自我选择过程中的私人信息。


技术实现思路

1、鉴于此,本发明的实施例提供了一种用于消除推荐系统中隐藏混杂的端到端训练方法,以消除或改善现有技术中存在的一个或更多个缺陷。

2、本发明的一个方面提供了一种用于消除推荐系统中隐藏混杂的端到端训练方法,所述方法的步骤包括:

3、从数据库中获取历史数据构建初始数据集,基于历史数据中的用户属性和商品属性构建用户商品属性向量,将所述用户商品属性向量输入到预设的第一误差插补模型中,构建插补数据集,将所述插补数据集和初始数据集合并为有偏数据集;

4、获取通过对用户进行随机调查获取的无偏数据集;

5、在对预设的预测模型的每轮次训练中,从所述有偏数据集抽取一条有偏数据,从所述无偏数据集抽取一条无偏数据;

6、基于抽取的有偏数据计算预设的第一倾向性得分模型和第一误差插补模型的初始损失函数值;

7、将抽取到的有偏数据输入到预设的预测模型和第二倾向性得分模型,基于预测模型输出的第一预测推荐值计算所述预测模型的初始损失函数值,基于所述预测模型的初始损失函数值和第二倾向性得分模型输出的第二权重值计算所述预测模型的有偏损失函数值;

8、基于所述预测模型输出的第一预测推荐值和第二倾向性得分模型输出的第二权重值计算预测模型的全空间损失函数值;

9、基于抽取的无偏数据计算所述预测模型的无偏损失函数值;

10、基于所述预测模型的有偏损失函数值和无偏损失函数值计算所述预测模型的校准损失函数值;

11、基于所述第一倾向性得分模型的初始损失函数值、第一误差插补模型的初始损失函数值、预测模型的全空间损失函数值、预测模型的有偏损失函数值、预测模型的无偏损失函数值和预测模型的校准损失函数值计算联合损失函数值,基于联合损失函数值更新所述预测模型的参数;

12、基于完成训练的预测模型计算预测推荐值。

13、采用上述方案,有偏数据和无偏数据具有互补的特点。有偏数据通常具有大的样本量,因此可以捕捉整个空间中更多用户的偏好信息。然而,有偏数据不可避免地会受到隐藏混杂因素的影响。相比之下,无偏数据的样本量要小得多。然而,无偏数据没有混杂问题,能够无视用户转化的外生信息,以及在用户在自我选择过程中的私人信息,是评估去偏方法的金标准,本方案首先采用有偏数据和无偏数据共同对预测模型求解损失函数,并进一步采用多个其他模型共同求解损失函数,利用多个损失函数求出联合损失函数的方式,充分利用了有偏数据和无偏数据,且能通过多个模型互补的方式提高预测模型的训练效果。

14、在本发明的一些实施方式中,每条所述有偏数据和无偏数据均包括用户商品属性向量、标签推荐值和标签权重值,在基于抽取的有偏数据计算预设的第一倾向性得分模型和第一误差插补模型的初始损失函数值的步骤中,将所述用户商品属性向量输入到第一倾向性得分模型和第一误差插补模型中,所述第一倾向性得分模型输出对应用户商品属性向量的第一权重值,所述第一误差插补模型输出的第一插补推荐值,基于所述第一权重值和标签权重值计算第一倾向性得分模型的初始损失函数值,基于所述第一插补推荐值和标签推荐值计算第一误差插补模型的初始损失函数值;

15、在基于预测模型输出的第一预测推荐值计算所述预测模型的初始损失函数值的步骤中,将所述用户商品属性向量输入到所述预测模型中,所述预测模型输出的第一预测推荐值,基于所述第一预测推荐值和标签推荐值计算预测模型的初始损失函数值。

16、在本发明的一些实施方式中,在基于所述预测模型输出的第一预测推荐值和第二倾向性得分模型输出的第二权重值计算预测模型的全空间损失函数值的步骤中,计算预设的标签指标值与标签推荐值的乘积,以及所述第二权重值与第一预测推荐值的乘积,将所述标签指标值与标签推荐值的乘积作为标签值,以所述第二权重值与第一预测推荐值的乘积作为预测值,基于所述标签值与预测值计算预测模型的全空间损失函数值。

17、在具体实施过程中,全空间指所有可能的用户商品组合,初始数据集和无偏数据集都是全空间数据的一部分。在全空间中,可定义每个用户商品组合的标签指示值,表示该用户商品组合的标签值是否在初始数据集中,若该用户商品组合的标签值在初始数据集中,则标签指示值为1;否则为0,表示用户商品组合的标签值未被观测到。

18、在本发明的一些实施方式中,在基于所述预测模型的初始损失函数值和第二倾向性得分模型输出的第二权重值计算所述预测模型的有偏损失函数值的步骤中,基于如下公式计算:

19、

20、其中,表示所述预测模型的有偏损失函数值,表示有偏数据集中用户u1与商品i1对应的有偏数据的标签指标值,表示所述预测模型的初始损失函数值,表示第二倾向性得分模型基于抽取到的有偏数据输出的第二权重值。

21、在具体实施过程中,所述预测模型的初始损失函数值为所述预测模型输出的第一预测推荐值与标签推荐值间的距离,称为预测模型的预测误差。

22、在本发明的一些实施方式中,基于所述预测模型的初始损失函数值和第二倾向性得分模型输出的第二权重值计算所述预测模型的有偏损失函数值的步骤中,基于如下公式计算:

23、

24、其中,表示所述预测模型的有偏损失函数值,表示有偏数据集中用户u1与商品i1对应的有偏数据的标签指标值,表示所述预测模型的初始损失函数值,表示第二倾向性得分模型基于抽取到的有偏数据输出的第二权重值,表示将有偏数据中的用户商品属性向量输入到第二误差插补模型,所述第二误差插补模型输出的第二插补推荐值。

25、在本发明的一些实施方式中,在基于抽取的无偏数据计算所述预测模型的无偏损失函数值的步骤中,将抽取的无偏数据输入到所述预测模型中,所述预测模型输出第二预测推荐值,以所述第二预测推荐值和标签推荐值分别作为预测值和标签值计算无偏损失函数值。

26、在本发明的一些实施方式中,在基于所述预测模型的有偏损失函数值和无偏损失函数值计算所述预测模型的校准损失函数值的步骤中,以所述无偏损失函数值和有偏损失函数值分别作为预测值和标签值计算校准损失函数值。

27、在本发明的一些实施方式中,在基于所述第一倾向性得分模型的初始损失函数值、第一误差插补模型的初始损失函数值、预测模型的全空间损失函数值、预测模型的有偏损失函数值、预测模型的无偏损失函数值和预测模型的校准损失函数值计算联合损失函数值的步骤中,基于如下公式计算联合损失函数值:

28、

29、其中,表示联合损失函数值,表示所述第一倾向性得分模型的初始损失函数值,表示第一误差插补模型的初始损失函数值,表示预测模型的全空间损失函数值,表示预测模型的有偏损失函数值,表示预测模型的无偏损失函数值,表示预测模型的校准损失函数值,α、β1、β2、β3和β4均为预设的权重参数。

30、在本发明的一些实施方式中,在基于完成训练的预测模型计算预测推荐值的步骤中,对所述预测模型完成预设轮次的训练,每轮次的训练均计算出联合损失函数值,并对所述预测模型的参数进行更新。

31、本发明的第二方面还提供一种用于消除推荐系统中隐藏混杂的端到端训练装置,该装置包括计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机指令,所述处理器用于执行所述存储器中存储的计算机指令,当所述计算机指令被处理器执行时该装置实现如前所述方法所实现的步骤。

32、本发明的第三方面还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时以实现前述用于消除推荐系统中隐藏混杂的端到端训练方法所实现的步骤。

33、本发明的附加优点、目的,以及特征将在下面的描述中将部分地加以阐述,且将对于本领域普通技术人员在研究下文后部分地变得明显,或者可以根据本发明的实践而获知。本发明的目的和其它优点可以通过在说明书以及附图中具体指出并获得。

34、本领域技术人员将会理解的是,能够用本发明实现的目的和优点不限于以上具体所述,并且根据以下详细说明将更清楚地理解本发明能够实现的上述和其他目的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1