基于互信息解耦的公平个性化推荐方法、设备及存储介质

文档序号:33968176发布日期:2023-04-26 19:03阅读:63来源:国知局
基于互信息解耦的公平个性化推荐方法、设备及存储介质

本发明涉及推荐领域,具体来说是一种基于基于互信息解耦的公平个性化推荐方法、电子设备及存储介质。


背景技术:

1、机器学习算法已经渗透到我们生活的各个方面,作为机器学习最普遍的应用之一,推荐系统正在对人类社会产生关键性的影响,越来越多的人使用推荐系统寻求信息和决策。基于协同过滤的模型作为主流的推荐技术之一,通过挖掘用户的历史记录进行个性化产品推荐,然而,基于协同过滤的模型由数据驱动,容易受数据或算法偏差产生不公平的推荐结果。

2、在决策层面,“公平”指的是不基于任何人或群体的先天固有或后天形成的偏见,因此一个不公平的推荐系统是决策向某一特定的人群倾斜。例如在职业推荐系统中,男性用户会被推荐更多的高薪职业,女性用户则会被推荐更多的低薪职业,即使他们的资历相同。

3、现有的以公平性为目标的协同过滤推荐模型,大多仅考虑从敏感信息对推荐公平性的影响,而忽略了用户与产品表征中非敏感信息对推荐准确性与公平性的影响。尽管这些方法在某种程度上实现了公平性,却导致推荐准确性得大幅下降。


技术实现思路

1、本发明为了解决现有技术的不足之处,提出了一种基于互信息解耦的公平个性化推荐方法、设备及存储介质,旨在消除用户、产品嵌入向量中敏感信息的同时,鼓励模型从交互数据中捕获非敏感信息;在缓解推荐不公平性的同时,也能兼顾推荐的准确性,并能保证推荐内容的质量。

2、本发明为达到上述发明目的,采用如下技术方案:

3、本发明一种基于互信息解耦的公平个性化推荐方法的特点在于,是按如下步骤进行:

4、步骤1、构造原始数据,包括:用户对产品的评分矩阵,用户敏感属性矩阵:

5、假设有m个用户和n个产品,令u表示用户集,且u={u1,...,um,...,um},其中,um表示第m个用户,1≤m≤m;令v表示产品集,且v={v1,...,vn,...,vn},其中,vn表示第n个产品,1≤n≤n;

6、令rmn表示第m个用户um对第n个产品vn是否有交互,若第m个用户um对第n个产品vn有交互,则令rmn=1,否则令rmn=0,从而得到用户对产品的交互矩阵记为r={rmn}m×n;

7、令用户敏感属性矩阵s={s1,...,sm,...,sm},其中,sm表示第m个用户的敏感属性值;

8、步骤2、构建有偏嵌入网络,包括:有偏独热编码层、敏感信息编码器、敏感属性预测层,用于学习用户与产品的有偏嵌入,并得到第m个用户的敏感属性预测值

9、步骤3、根据式(1)计算有偏嵌入网络的损失函数la(θa):

10、

11、式(1)中,θa=[p,q,wa]是待学习的参数;

12、步骤4、使用梯度下降法对有偏嵌入网络进行训练,并最小化损失函数la(θa),直到损失函数收敛为止,从而得到训练后的有偏嵌入网络及其对应的最优参数其中,p*表示用户的最优有偏嵌入矩阵,q*表示产品的最优有偏嵌入矩阵,表示最优的推断敏感属性的参数;

13、步骤5、构成混合嵌入网络,包括:混合独热编码层、混合信息编码器、偏好预测层,用于学习用户与产品的混合嵌入,并得到第m个用户um对第n个产品vn的预测偏好分数

14、步骤6、根据式(2)计算损失函数lr(θr):

15、

16、式(2)中,θr=[w,z]是待优化的参数,dm={(i,j)|i∈rm,j∈v-rm}是第m个用户um的训练数据,(i,j)代表与um有交互的第i个产品vi以及与um没有交互的第j个产品vi所构成的产品对;表示第m个用户um对第i个产品vi的预测偏好分数,表示第m个用户um对第j个产品vj的预测偏好分数,λ是正则化项系数,||·||表示l2范数;

17、步骤7、使用梯度下降法对混合嵌入网络进行训练,并最小化损失函数lr(θr),直到损失函数收敛为止,从而得到训练后的混合嵌入网络及其对应的最优参数其中,w*表示用户的最优混合嵌入矩阵,z*表示产品的最优混合嵌入矩阵;

18、步骤8、构建无偏嵌入网络,包括:无偏独热编码层、互信息下界优化层,互信息上界优化层,用于学习用户与产品的无偏嵌入,并得到用户侧互信息下界和产品侧互信息下界用户侧互信息上界和产品侧互信息上界

19、步骤9、根据式(3)和式(4)分别计算优化用户侧的损失函数l(φ1)与产品侧的损失函数l(φ2):

20、

21、

22、式(3)和式(4)中,φ1与φ2为待优化的参数;

23、步骤10、使用梯度下降法对无偏嵌入学习网络进行训练,并在每次迭代训练中,先最小化式(5)所示的损失函数lh(θh)来更新参数θh=[e,f],再最小化式(6)所示的损失函数lφ(φ)来更新参数φ=[φ1,φ2],直到损失函数lh(θh)收敛为止,从而得到训练后的无偏嵌入网络及其对应的最优参数

24、

25、lφ(φ)=l(φ1)+l(φ2)(6)

26、式(5)中,γ对应控制用户与产品的互信息下界的超参数,β对应控制用户与产品的互信息上界的超参数;

27、步骤11、通过式(7)得到满足公平性要求的用户对产品的评分矩阵

28、

29、本发明所述的基于互信息解耦的公平个性化推荐方法的特点也在于,所述步骤2包括:

30、步骤2.1、所述有偏独热编码层将用户集u与产品集v分别映射到有偏嵌入空间,从而得到用户的有偏嵌入矩阵p=[p1,...,pm...,pm]、产品的有偏嵌入矩阵q=[q1,...,qn...,qn],其中,pm表示第m个用户um的有偏嵌入向量;qn表示第n个产品vn的有偏嵌入向量;

31、步骤2.2、构建敏感信息编码器,包括:k个图卷积层,令当前图卷积层为k;

32、将用户的有偏嵌入矩阵p和产品的有偏嵌入矩阵q输入敏感信息编码器中,并利用式(8)计算经过第k个图卷积层后输出的第m个用户um的有偏嵌入向量与第n个产品vn的有偏嵌入向量

33、

34、式(8)中,rm表示与第m个用户um有交互的产品集合,tn表示与第n个产品vn有交互的用户集合,表示第k-1个图卷积层输出的第m个用户um的有偏嵌入向量,表示第k-1个图卷积层输出的第n个产品vn的有偏嵌入向量,当k=1,令令|rm|表示与第m个用户um有交互的产品集合的数量,|tn|表示与第n个产品vn有交互的用户集合的数量;

35、步骤2.3、所述敏感属性预测层利用式(9)计算第m个用户um经过k个图卷积层后得到的敏感属性预测值

36、

37、式(9)中,wa表示推断敏感属性的参数;表示第k个图卷积层输出的第m个用户um的有偏嵌入向量;σ(·)表示sigmoid激活函数。

38、所述步骤5包括:

39、步骤5.1、所述混合独热编码层将用户集u与产品集v分别映射到混合嵌入空间,从而得到用户的混合嵌入矩阵w=[w1,...,wm...,wm]和产品的混合嵌入矩阵z=[z1,...,zn...,zn],其中,wm表示第m个用户um的混合嵌入向量;zn表示第n个产品vn的混合嵌入向量;

40、步骤5.2、构建混合信息编码器,包含:k个图卷积层,令当前图卷积层为k;

41、步骤5.3、将用户的混合嵌入矩阵w和产品的混合嵌入矩阵z输入进混合信息编码器中,并利用式(10)计算经过第k个图卷积层后输出的第m个用户um的混合嵌入向量与第n个产品vn的混合嵌入向量

42、

43、式(10)中,表示第k-1个图卷积层输出的第m个用户um的混合嵌入向量,表示第k-1个图卷积层输出的第n个产品vn的混合嵌入向量,当k=1,初始化

44、步骤5.4、所述偏好预测层利用式(11)计算第m个用户um对第n个产品vn的预测偏好分数

45、

46、式(11)中,<·,·>表示内积,表示第k个图卷积层输出的第m个用户um的混合嵌入向量,表示第k个图卷积层输出的第n个产品vn的混合嵌入向量。

47、所述步骤8包括:

48、步骤8.1、所述无偏独热编码层将用户集u与产品集v分别映射到无偏嵌入空间,从而得到用户的无偏嵌入矩阵e=[e1,...,em...,em]和产品的无偏嵌入矩阵f=[f1,...,fn...,fn],其中,em表示第m个用户um的无偏嵌入向量;fn表示第n个产品vn的无偏嵌入向量;

49、步骤8.2、所述互信息下界优化层利用式(12)和式(13)分别计算用户侧互信息下界和产品侧互信息下界

50、

51、

52、式(12)和式(13)中,表示第m个用户um的最优混合嵌入向量,表示第m个用户um的最优有偏嵌入向量;表示第n个产品vn的最优混合嵌入向量,表示第n个产品vn的最优有偏嵌入向量;ej表示从集合中随机采样,得到的第j个用户uj的无偏嵌入向量;表示从用户的最优有偏嵌入矩阵p*中,随机选取第j个用户uj的有偏嵌入向量,fj表示从集合中随机采样,得到的第j个产品vj的无偏嵌入向量;表示从产品的最优有偏嵌入矩阵q*中,随机选取第j个产品vj的有偏嵌入向量,π(·,·)表示皮尔逊相关系数;g(·,·,·)为分数函数,并有:

53、

54、

55、式(14)和式(15)中,sim(·)是余弦相似性,α为控制权重系数的超参数;

56、步骤8.3、所述互信息上界层利用式(16)和式(17)分别计算用户侧互信息上界和产品侧互信息上界

57、

58、

59、式(16)和式(17)中,qφ1(·|·)表示用户侧的参数为φ1的高斯分布,表示产品侧的参数为φ2的高斯分布。

60、本发明一种电子设备,包括存储器以及处理器的特点在于,所述存储器用于存储支持处理器执行任一所述基于互信息解耦的公平个性化推荐方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

61、本发明一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序的特点在于,所述计算机程序被处理器运行时执行任一所述基于互信息解耦的公平个性化推荐方法的步骤。

62、与已有技术相比,本发明有益效果体现在:

63、本发明针对由敏感信息导致的推荐不公平性,提出了一种基于互信息的双重约束,通过使用互信息上界与下界的优化用户与产品嵌入,用于消除用户与产品嵌入向量中的敏感信息,提升其非敏感信息。而现有的技术仅考虑敏感信息的影响,即使在一定程度上保证了推荐公平性,却导致推荐准确性的大幅度下降。为此,本发明构建了一个基于互信息的去偏框架,提出最大化互信息下界与最小化互信息上界的优化方式,用于实现基于互信息的双重约束目标,从而提高了任意基于嵌入向量的协同过滤模型的公平性,同时防止了推荐准确性的大幅度下降。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1