一种基于图神经网络的神经时间门自适应融合会话推荐方法

文档序号：35292992发布日期：2023-09-01 15:28阅读：41来源：国知局

本发明属于推荐系统领域，涉及图神经网络、深度学习，尤其涉及基于图神经网络的会话推荐方法。

背景技术：

1、随着技术的进步和在线服务的普及，人们能够以更快的方式获取大量的在线信息。然而，最近普适计算的发展导致了在线数据过载问题。因此，推荐系统的发展近来受到了极大的关注。一般而言，推荐系统充当信息过滤工具，为用户提供合适的个性化内容或信息。在推荐系统里，通常利用用户和物品的所有历史交互来学习用户对项目的偏好，基于会话的推荐正是这样的存在。其作为主要的推荐系统类别之一，需进一步发展以提供适用于不同应用场景的更高效的推荐。

2、会话是由一个时间段内用户的交互行为序列构成，基于会话的推荐是基于当前历史会话序列来推荐用户下一个点击的物品。由于会话内的点击序列是有序的，所以在对项目建模时考虑其时间顺序是非常必要的。作为一种特殊的推荐场景，基于会话的推荐一直以来有很多学者在对其研究。传统的方法主要是采用基于相似性或者马尔可夫链来生成推荐，但前者忽略了会话的顺序信息，后者则受到了强独立性假设的限制。最近，深度学习的快速发展为解决这些问题提供了一些新方向。研究发现，将循环神经网络(rnn)和图神经网络(gnn)等模型应用到会话推荐场景下，不仅对以上问题提供了有效的解决方案，而且对于获得精确的项目嵌入以及考虑项目的复杂转换方面，其需求也得到了明显的提升，因此，基于图神经网络的推荐方法。

3、尽管针对会话推荐已经提出了多种方法，但有一些问题仍未得到很好的解决。其中很重要的一点在于，用户在网上购物时，其意图往往是由多种不同程度的兴趣杂糅在一起而组成的，推荐系统需要挖掘用户的深层意图，才能准确地捕获用户的偏好，为用户生成精确的个性化推荐。为了实现这一目标，现有的方法开始对用户兴趣进行分层建模，分别提取长期偏好和短期偏好，以综合考虑用户偏好的全局稳定性和局部波动性，但在融合长短期偏好时，通常使用基于标量的加权模式来融合长期和短期偏好，这种方法过于粗糙，无法充分学习当前偏好的表达性嵌入。

4、因此，如何充分挖掘序列内部全局的时序关系以及细粒度融合长期和短期偏好，学习到更有代表性和更全面的融合偏好嵌入，使模型能挖掘到更精准的用户偏好，最终完成更为精准的推荐，成为了待解决的问题。

技术实现思路

1、本发明的目的是提供一种基于图神经网络的神经时间门自适应融合会话推荐方法，将会话中提取的长短期偏好通过神经时间门自适应地调节对当前兴趣的贡献，用以更加准确地对用户最终偏好进行建模，提升推荐性能。

2、本发明通过以下技术方案解决上述技术问题：

3、一种基于图神经网络的神经时间门自适应融合会话推荐方法，包括：

4、1)、会话图构建层：将用户的历史会话点击序列作为输入，构建成会话图；

5、2)、会话嵌入层：通过图神经网络学习项目在会话图上的嵌入，得到项目嵌入的向量表示；

6、3)、注意力网络层：所有项目向量输入注意力网络，分别提取出用户的长期偏好和短期偏好；

7、4)、神经时间门层：神经时间门融合长期偏好和短期偏好，生成最终的偏好嵌入；

8、5)、评分预测层：融合项目嵌入与最终偏好嵌入，其结果输入归一化指数函数，对候选项目进行评分预测。

9、具体地，所述步骤1)包括：

10、在数据处理方面，本模型主要基于图神经网络方法，需将用户原始的历史会话点击序列构建成具有原序列对应关系的会话图，使其更好地表示出原序列中的各个项目及其复杂的转换关系，具体如下：将所有会话中的唯一项表示为一个集合v＝{v1,v2,...,vm}，s＝[vs,1,vs,2,...,vs,n]表示按时间戳排序的匿名会话序列，其中vs，i∈v表示用户在会话s内点击的第i个项目，以项目vs，i∈v为会话图gs的节点，(vs，i-1，vs，i)∈εs为会话图gs的有向边，其边的方向代表一个用户在点击vs，i-1之后点击vs，i，将每个会话序列s构建成一个有向图gs＝(vs，εs)。

11、进一步地，步骤2)包括：

12、为了更好地处理图结构数据，引入了门控图神经网络方法。在考虑丰富节点连接的情况下，能够自动提取会话图的特征向量，即通过图神经网络学习项目在会话图上的嵌入向量vi，其学习过程具体如下：将会话图中的每一个项目的特征表示到一个统一的空间中，得到的向量即为利用gnn得到的d维项目嵌入vi，采用更适合处理序列数据的门控图神经网络对图gs的节点进行更新，其计算过程为：

13、

14、其中，被定义为两个相邻的序矩阵和的级联，表示会话图的传入和传出边的加权连接。邻接矩阵as区分了有向图中边的类型，定义了有向图中的节点如何通过传入和传出的边相互连接。为as中的第i行，代表节点vs，i的出度值和入度值。此外，由于会话序列中可能出现重复项，因此需要对每条边计算一个归一化的赋值，该边的初始值除以该节点的传入或传出边的数量。

15、以上即为通过节点的入度值和出度值聚合其邻居节点的特征信息。其中，是聚合信息后节点的状态向量，是会话s中的节点向量的拼接矩阵，是可学习的权重矩阵，是偏差向量。

16、

17、

18、其中，是可学习的权重矩阵，σ(·)是sigmoid函数，将连续值映射到(0，1)之间。和分别是重置门和更新门，重置门过滤掉前一时刻节点状态与当前节点状态无关的部分，更新门决定以前的状态信息保存到当前时间步的内容。

19、

20、

21、其中，是可学习的权重，tanh(·)表示双曲正切函数，⊙是元素相乘。通过前一状态当前状态和重置门构造候选状态在更新门的控制下，将前一个隐藏状态和候选状态组合，不断更新会话图中的所有节点直到收敛之后，获得最终状态的节点向量，图中的节点对应序列中的不同项目，即得到项目嵌入的向量表示vi。

22、进一步地，步骤3)包括：

23、为了更好的预测用户的下一次点击，精准提取用户偏好，制定了一种对用户的兴趣进行分层建模的策略。在得到所有项目向量之后，通过注意力网络分别提取用户的长期偏好和短期偏好，具体计算过程如下：

24、将每个会话表示为嵌入向量对于会话s＝[vs，1，vs，2，...，vs，n]，局部嵌入sl可以简单地定义为最后一个点击项vs，n的项目向量vn作为用户的短期偏好，即一个会话由参与该会话的最后一个节点向量直接表示：

25、sl＝vn

26、聚合所有的节点向量提取会话图gs的全局嵌入sg。由于嵌入中的信息可能具有不同级别的优先级，需要采用注意力机制来更好地表示长期会话偏好。在计算出会话中项目的注意力系数αi后，用户的长期偏好可以表示为注意力系数αi与会话的节点向量vi的加权和，具体描述如下：

27、αi＝qtσ(w1vn+w2vi+c)

28、

29、其中参数和是控制项目嵌入向量的权重矩阵。

30、进一步地，步骤4)包括：

31、考虑到用户兴趣的全局稳定性和局部波动性，将会话的长期偏好和短期偏好相结合，能更好地反映当前会话的综合特征，以强调当前偏好与长期稳定偏好对于下一时刻用户兴趣变化的不同程度的影响，更适应用户复杂多变的交互行为。

32、为了充分融合会话的长短期偏好，使其生成的最终偏好的嵌入向量包含更多当前用户有用的特征信息，根据所提出的神经时间门自适应地融合sl和sg，生成最终偏好的嵌入，其流程如图3所示，具体计算过程如下：

33、神经时间门的任务是根据上次交互的时间与需要进行推荐的时间之间的滞后δt，在维度水平上调整长期偏好嵌入和短期偏好嵌入的贡献值。为了将时间延迟编码为一个中间嵌入，将其离散化为给定用户任意两个连续交互之间的最小时间差δmin的倍数。在这种思想下，离散化的时滞被计算为：

34、

35、其中，表示δ的最大值。通过上述公式，将δt映射到一个不超过c的正数，然后通过对一个可学习的嵌入矩阵的查找，可以得到时间嵌入

36、t＝tδ

37、其中，为离散化时滞的独热向量。

38、通过sigmoid函数计算归一化的神经门控单元向量

39、g＝sigmoid(wlsl+wgsg+wδt+bg)

40、其中，和分别是神经门控中的参数和偏差向量。

41、给定用户的最终偏好嵌入sz通过以下的融合得到：

42、

43、其中，表示元素级乘积。另外，g是一个向量而非标量，其作用在于使神经时间门在维度层面上调节长期偏好和短期偏好对用户当前兴趣的贡献。

44、进一步地，步骤5)包括：

45、在评分预测层，结合用户的最终偏好，评估候选项目在用户兴趣中的匹配度，通过乘法计算得出每个候选项目的推荐得分，即通过融合偏好嵌入sz和项目嵌入vi，作为用户u对项目vi的归一化评分的预测，应用一个softmax函数得到模型的输出向量

46、

47、

48、其中，表示所有候选项目的推荐分数，是一个0到1之间的小数，表示在会话s中出现下一次点击项目的概率。

49、对于每个会话图，定义了一个损失函数来计算候选项目的真实概率分布和预测评分之间的交叉熵，写成如下形式：

50、

51、其中，m是训练集中的唯一项目的数量，yi∈{0，1}是项目vi的预测点击概率，函数用梯度下降法来实现最优化。

52、经过上述步骤1)到步骤5)的操作之后，得到用户点击某一候选项目的预测概率，具体模型流程如图2所示。对于不同的候选项目，根据计算出的预测概率值按从大到小的顺序排列，取排名前k的项目对于不同的候选项目，根据计算出的预测概率值按从大到小的顺序排列，取排名前k的项目作为推荐的候选项目。

53、本发明的有益效果如下：

54、1)、本发明是一种基于会话图的推荐方法，将会话构建成会话图，可以让模型捕捉到会话中极为复杂的项目转移关系。

55、2)、本发明是一种融合神经时间门的推荐方法，神经门可以自适应地提取与合并长短期偏好中最重要的部分，使得生成的最终偏好的嵌入向量包含更多有用的特征信息，更加全面地获取用户的个性化偏好，使推荐的结果更加符合用户的兴趣。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈乔松胡静黄泽锰汪祝周俊丞
技术所有人：重庆邮电大学
我是此专利的发明人

上一篇：一种远红外线连接线材焊接机的制作方法
上一篇：一种吸波复合材料、雷达用的环境件、雷达及制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。