一种基于因果推理的可解释推荐方法和系统与流程

文档序号:38365359发布日期:2024-06-19 12:19阅读:21来源:国知局
一种基于因果推理的可解释推荐方法和系统与流程

本发明属于路径推理领域,尤其涉及一种基于因果推理的可解释推荐方法和系统。


背景技术:

1、目前整个社会处于网络化时代的快速发展之中,互联网空间中各种应用的不断出现,导致了数据规模的爆炸式增长。大数据既具有巨大的潜力和丰富的价值,会对人类社会的发展产生革命性的影响;但是大数据也带来了严重的“信息过载”问题。推荐系统,作为一种解决“信息过载”问题的有效方法,已经成为学术界和工业界的关注热点并得到了广泛应用,形成了众多相关研究成果。现有的推荐系统主要基于协同过滤、内容过滤和混合过滤方法。协同过滤依赖用户和项目的交互数据,内容过滤使用项目的特征数据,而混合方法结合了这两者的优点。

2、随着深度学习技术的兴起,人工神经网络技术被广泛用于各个。它不仅应用于辅助处理特征,后来逐渐成为推荐系统的重要组成部分。随着深度学习的迅猛发展,神经网络越来越深,参数量越来越大,人类无法理解深度神经网络模型的决策原理,模型成为了一个“黑箱”。它不仅加剧了推荐系统本身的偏差问题,更是存在一定的不可解释性。而因果推理是统计学中的常用手段,近年来被引入推荐系统中,解决推荐问题中的曝光偏差、流行度偏差等问题。除了因果推理外,现有的方法也可以使用正则化、对抗学习、强化学习等技术来消除推荐系统中固有的偏差。这对提高推荐系统的性能有较大帮助,同时无偏的数据与模型有助于研究者构建可解释的推荐系统领域,推荐系统也不例外。作为人工智能领域中一个重要的研究方向,推荐系统中的可解释性也具有重要的研究意义。可解释的推荐模型可以是模型固有的,也可以是推理结束后生成解释。解释的呈现方式也有许多种,如文本解释、主题词云、多媒体(视频及图像),便于用户理解,例如通过知识图谱中的实际路径将推荐性和可解释性结合起来;也可以使用结合了矩阵分解与基于注意力的gru网络,使从评分和评论中学习到的特征一致。但是由于深度学习模型本身复杂度的限制,利用深度学习方法进行可解释推荐的有效性并不能得到较好的保证。

3、协同过滤算法作为当今推荐系统的主流算法,拥有较高的精度和效率,然而其算法具有固有的数据稀疏与冷启动问题。基于人工神经网络的推荐技术在今年来取得了较大的进展与优异的成绩,但神经网络的推理过程缺乏可解释性。同时,由于用户信息的影响,原始数据中往往存在各种各样的偏差,会影响推荐系统的性能,同时也让推荐结果解释性变差。

4、基于知识图谱的推荐可以获得推理路径,使构建向用户推荐物品的同时给出推荐原因的可解释推荐系统成为可能。同时,因果干预作为统计学中的一种常用手段,常常可以有效消除原始数据中的部分偏差,以期提高推荐系统的推荐能力。


技术实现思路

1、为解决上述技术问题,本发明提出一种基于因果推理的可解释推荐方法的技术方案,以解决上述技术问题。

2、本发明第一方面公开了一种基于因果推理的可解释推荐方法,所述方法包括:

3、步骤s1、选取电影数据集和音乐数据集;基于倾向得分匹配的偏差去混淆方法对电影数据集进行偏差去混淆,得到去偏后的电影数据集;

4、步骤s2、在dbpedia与freebase两个知识图谱上分别使用所述电影数据集、去偏后的电影数据集和音乐数据集训练transe模型,得到嵌入表示;

5、其中,bpedia是指数据库版本的wikipedia,中文可译作“dbpedia知识库”或“dbpedia知识图谱”;

6、freebase是一个大型的协作知识库,其中包含了大量由社区成员贡献的结构化数据。在中文语境中,freebase通常直接被称为“freebase”或者翻译为“自由基”知识库。由于freebase自身并没有官方的中文名称,所以在中文文献和网络资源中,人们通常使用其英文原名“freebase”来指代这个知识库。在中文学术出版物或网络文章中,有时可能会见到“自由基知识库”这样的翻译。

7、步骤s3、利用transe得到的嵌入表示来训练策略-价值网络;应用训练好的策略-价值网络进行路径推理;

8、步骤s4、对去偏后的电影数据集进行路径推理得到的多条候选路径,选择生成概率高于预设值的路径作为推荐过程的解释;最后对可解释路径进行排序,从而生成top-k推荐路径及推荐列表。

9、根据本发明第一方面的方法,在所述步骤s1中,倾向得分匹配的方法包括:

10、使用逻辑回归算法估计倾向得分:在倾向得分匹配问题中,使用二元回归来估计倾向得分,即每个个体进入处理组的概率,从而得到该个体的倾向得分;

11、匹配:根据倾向得分匹配处理组和对照组中具有相同倾向得分的个体,每个参与个体可与一个或多个非参与个体匹配;

12、检查平衡性:评价处理组和对照组的组间均衡性;

13、估计平均处理效应ate,其中ate具体是指倾向得分匹配的平均处理效应。

14、根据本发明第一方面的方法,在所述步骤s2中,所述在dbpedia与freebase两个知识图谱上分别使用所述电影数据集、去偏后的电影数据集和音乐数据集训练transe模型的方法包括:

15、首先,处理电影数据集、去偏后的电影数据集和音乐数据集中的缺失项;

16、然后,对电影数据集、去偏后的电影数据集和音乐数据集进行阈值舍弃,防止数据过稀疏;

17、应用负采样的知识图谱、阈值舍弃后的电影数据集、去偏后的电影数据集和音乐数据集,基于嵌入算法transe学习知识图谱中实体与关系的低维表征。

18、根据本发明第一方面的方法,在所述步骤s3中,应用训练好的策略-价值网络进行路径推理的方法包括:

19、在策略-价值网络的引导下,从某个用户开始,使用以动作概率和奖励为指导的束搜索策略来探索知识图谱上的候选路径,同时为每个用户推荐项目。

20、本发明第二方面公开了一种基于因果推理的可解释推荐系统,所述系统包括:

21、第一处理模块,被配置为,选取电影数据集和音乐数据集;基于倾向得分匹配的偏差去混淆方法对电影数据集进行偏差去混淆,得到去偏后的电影数据集;

22、第二处理模块,被配置为,在dbpedia与freebase两个知识图谱上分别使用所述电影数据集、去偏后的电影数据集和音乐数据集训练transe模型,得到嵌入表示;

23、第三处理模块,被配置为,利用transe得到的嵌入表示来训练策略-价值网络;应用训练好的策略-价值网络进行路径推理;

24、第四处理模块,被配置为,对去偏后的电影数据集进行路径推理得到的多条候选路径,选择生成概率高于预设值的路径作为推荐过程的解释;最后对可解释路径进行排序,从而生成top-k推荐路径及推荐列表。

25、根据本发明第二方面的系统,倾向得分匹配包括:

26、使用逻辑回归算法估计倾向得分:在倾向得分匹配问题中,使用二元回归来估计倾向得分,即每个个体进入处理组的概率,从而得到该个体的倾向得分;

27、匹配:根据倾向得分匹配处理组和对照组中具有相同倾向得分的个体,每个参与个体可与一个或多个非参与个体匹配;

28、检查平衡性:评价处理组和对照组的组间均衡性;

29、估计平均处理效应ate。

30、根据本发明第二方面的系统,所述在dbpedia与freebase两个知识图谱上分别使用所述电影数据集、去偏后的电影数据集和音乐数据集训练transe模型包括:

31、首先,处理电影数据集、去偏后的电影数据集和音乐数据集中的缺失项;

32、然后,对电影数据集、去偏后的电影数据集和音乐数据集进行阈值舍弃,防止数据过稀疏;

33、应用负采样的知识图谱、阈值舍弃后的电影数据集、去偏后的电影数据集和音乐数据集,基于嵌入算法transe学习知识图谱中实体与关系的低维表征。

34、根据本发明第二方面的系统,应用训练好的策略-价值网络进行路径推理包括:

35、在策略-价值网络的引导下,从某个用户开始,使用以动作概率和奖励为指导的束搜索策略来探索知识图谱上的候选路径,同时为每个用户推荐项目。

36、本发明第三方面公开了一种电子设备。电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时,实现本公开第一方面中任一项的一种基于因果推理的可解释推荐方法中的步骤。

37、本发明第四方面公开了一种计算机可读存储介质。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现本公开第一方面中任一项的一种基于因果推理的可解释推荐方法中的步骤。

38、综上,本发明提出的方案能够使构建向用户推荐物品的同时给出推荐原因的可解释推荐系统成为可能。同时,因果干预作为统计学中的一种常用手段,常常可以有效消除原始数据中的部分偏差,以期提高推荐系统的推荐能力。不仅在一定程度上解决了协同过滤算法固有的数据稀疏与冷启动问题,也有效消除原始数据中的部分偏差,提高了推荐系统的推荐能力和可解释性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1