基于共享物品相关信息的跨平台序列推荐方法及装置

文档序号:31699036发布日期:2022-10-01 07:07阅读:33来源:国知局
基于共享物品相关信息的跨平台序列推荐方法及装置
factorization[c]//proceedings of the 14th acm sigkdd international conference on knowledge discovery and data mining.2008:650-658.


技术实现要素:

[0009]
本发明是为了解决上述问题而进行的,目的在于提供基于共享物品相关信息的跨平台序列推荐方法及装置,能够解决数据稀疏问题并有效提高目标平台的推荐性能。
[0010]
本发明为了实现上述目的,采用了以下方案:
[0011]
《方法》
[0012]
如图1所示,本发明提供基于共享物品相关信息的跨平台序列推荐方法,其特征在于,包括以下步骤:
[0013]
步骤1:从辅助平台上获取物品embedding信息;
[0014]
步骤2:对步骤1得到的辅助平台上物品的embedding向量信息,判断其信息中是否有用户的行为信息,过滤掉用户的相关信息,确保转移到目标平台的数据都是物品侧的信息;
[0015]
步骤3:将步骤2中过滤处理后辅助平台的物品embedding信息迁移到目标平台中;
[0016]
步骤4:利用步骤3得到的目标平台中整合了辅助平台迁移而来的物品embedding信息,得到目标平台物品信息的额外嵌入向量的统一表示,使用早期融合来合并嵌入向量;
[0017]
步骤5:根据步骤3和4得到的从辅助平台迁移过来的物品侧信息,平台级的注意力单元动态调整两个平台信息,弥合两个平台的embedding空间差异,通过使用预测函数来估计用户和物品之间的交互概率,利用embedding向量信息进行序列推荐。
[0018]
优选地,本发明提供的基于共享物品相关信息的跨平台序列推荐方法,步骤4包括如下子步骤:
[0019]
步骤4-1:把辅助平台的物品embedding信息迁移到目标平台后,基于隐空间表征学习的推荐模型,为每个用户和物品在隐空间分配实值向量刻画其兴趣与属性,将稀疏的用户和物品原始表示投影到实值向量中,得到用户和物品的独热编码表示,基于迁移向量增强的嵌入向量层,将稀疏的用户和物品编码投影到密集向量中,通过引入维度自适应模块,得到辅助平台的物品嵌入向量;
[0020]
步骤4-2:基于步骤4-1得到的辅助平台的物品嵌入向量,将其迁移至目标平台,将用户id(u)和物品id(i)编码为一个独热编码,通过两个嵌入矩阵分别将用户与物品的原始id表示转化为稠密向量表示;
[0021]
步骤4-3:对步骤4-2中得到的跨平台迁移数据信息,为了丰富对于用户的刻画与表征,基于用户在目标平台的交互历史,与辅助平台迁移的物品向量,使用基于物品的协同过滤方法,将辅助平台迁移过来的物品嵌入整合至一个额外用户嵌入向量中;
[0022]
步骤4-4:对步骤4-3中得到的用户额外向量表示,使用早期整合来合并嵌入向量,使得可以显示地捕获两个嵌入向量之间的交互关系,得到不同物品的不同重要性表示;
[0023]
步骤4-5:对步骤4-4中得到不同物品的不同重要性,在考虑平台间差异的基础上,设计平台层注意力网络控制来自两个平台的预测信号的影响,使用早期融合来合并嵌入向量,得到对于用户的最终表征向量。
[0024]
优选地,本发明提供的基于共享物品相关信息的跨平台序列推荐方法,在步骤4-1
中,利用辅助平台的数据来促进目标平台中物品重叠的推荐质量,设置一个用户与物品的交互矩阵每个条目的二进制值定义为:
[0025][0026]
在辅助平台中,设置另一个二元用户-物品交互矩阵其中k和l是用户和物品的数量;l项的一部分也出现在目标平台中,它们被命名为共享项;从交互矩阵和中,跨平台推荐的目标是学习一个预测函数来估计一个给定的用户u与目标平台中的项目i交互的可能性。
[0027]
优选地,本发明提供的基于共享物品相关信息的跨平台序列推荐方法,在步骤4-2中,利用步骤4-1得到的辅助平台的物品嵌入向量,将其迁移至目标平台,遵循普遍采用的做法,将稀疏的用户和物品原始表示投影到实值向量中。具体而言,首先将用户id(u)和物品id(i)编码为一个独热编码,如下所示:
[0028][0029]
式中,是一个矢量,除了数值为1的u-th(i-th)条目外,其他都是零值。然后,将稀疏的独热编码(and)和多热编码交互历史分别投射到局部嵌入和转移嵌入中。
[0030]
优选地,本发明提供的基于共享物品相关信息的跨平台序列推荐方法,在步骤4-3中,使用基于物品的协同过滤方法,利用物品层注意力网络层,刻画与表征用户信息,基于用户在目标平台的交互历史,与辅助平台迁移的物品向量,将迁移的物品嵌入融合至一个额外用户嵌入向量在利用了目标平台的历史交互之外,该向量还包含来自于辅助平台的协同过滤信号,可以进一步增强对于用户的表征能力,计算方式如下:
[0031][0032]
式中,是的l1范数,代表着用户u交互过的物品数量;在计算时,需要对于用户历史以多热编码表示,即基于用户历史的多热编码与迁移的向量得到额外用户嵌入向量
[0033]
对用户统一嵌入向量表达以及目标平台中整合了辅助平台迁移过来的物品信息,平台级的注意力单元动态调整两个平台信息,弥合两个平台的embedding空间差异,然而,值得一提的是,交互过的不同物品起的作用可能是不同的,故在真实情况下,简单池化操作往往无法得到合适的用户表征,而采用本发明方法则可以很好解决该问题。
[0034]
优选地,本发明提供的基于共享物品相关信息的跨平台序列推荐方法,在步骤4-4中,设计物品层注意力网络来建模不同物品的不同重要性,物品级注意力单元根据以下公式为每个转移的项目嵌入学习一个特定的权重γ
uj

[0035][0036][0037]
式中,和b1表示全连接层的权重矩阵和偏置;和b1是注意力网络的可学习参数。该物品级的注意力网络的输入为用户嵌入向量与目标物品嵌入向量的交互(逐项相乘),使得学习的权重可以根据不同的用户自适应地改变。
[0038]
优选地,本发明提供的基于共享物品相关信息的跨平台序列推荐方法,在步骤4-5中,基于平台层注意力网络层,在考虑平台间差异的基础上,通过平台层注意力网络来控制来自两个平台的预测信号的影响,以得到对于用户的最终表征向量;这里使用早期融合来合并嵌入向量,可以显式地捕获两个嵌入向量之间的交互,融合的用户统一嵌入向量的表示如下:
[0039][0040]
式中,η
pi
和η
qi
分别是和的可学习的权重,用来平衡对于物品i而言、来自目标平台与辅助平台的信息的重要性。
[0041]
优选地,本发明提供的基于共享物品相关信息的跨平台序列推荐方法,在步骤5中,对用户的最终表征向量,使用两个嵌入向量,利用点积作为预测函数,设计一个框架来利用辅助平台已转移的物品嵌入信息,预测用户交互概率,产生个性化推荐列表。可采用随机批量梯度下降法,在小批量模式下对natsr模型进行优化。在构造批量单元时,首先对一批历史用户-物品交互对(u,i)进行采样,更好的为用户个性化服务需求提供帮助。
[0042]
优选地,本发明提供的基于共享物品相关信息的跨平台序列推荐方法,在步骤5中,利用跨平台推荐的通用框架,不共享用户行为数据,采用内积模型来得到的值,计算方式如下:
[0043][0044]
式中,σ是sigmoid函数。这种预测函数可以很容易地扩展到更复杂的函数,例如多层感知机模型。
[0045]
《装置》
[0046]
进一步,本发明还提供了基于共享物品相关信息的跨平台序列推荐装置,采用上文《方法》中任意一项所描述的方法进行跨平台序列推荐,其特征在于,包括:
[0047]
信息获取模块,从辅助平台上获取物品embedding信息;
[0048]
过滤模块,对信息获取模块得到的辅助平台上物品的embedding向量信息,过滤掉用户的相关信息,确保转移到目标平台的数据都是物品侧的信息;
[0049]
迁移模块,将过滤处理后辅助平台的物品embedding信息迁移到目标平台中;
[0050]
向量嵌入模块,利用迁移模块得到的目标平台中整合了辅助平台迁移而来的物品embedding信息,得到目标平台物品信息的额外嵌入向量的统一表示,使用早期融合来合并嵌入向量;
[0051]
序列推荐模块,根据融合模块和向量嵌入模块得到的从辅助平台迁移过来的物品侧信息,平台级的注意力单元动态调整两个平台信息,弥合两个平台的embedding空间差
异,通过使用预测函数来估计用户和物品之间的交互概率,利用embedding向量信息进行序列推荐;以及
[0052]
控制部,与信息获取模块、过滤模块、迁移模块、向量嵌入模块、序列推荐模块均通信相连,控制它们的运行。
[0053]
优选地,本发明提供的基于共享物品相关信息的跨平台序列推荐装置,还可以还包括:输入显示部,与信息获取模块、本地嵌入模块、迁移模块、向量嵌入模块、序列推荐模块、控制部均通信相连,让用户输入控制指令,并根据控制指令进行相应的显示。
[0054]
发明的作用与效果
[0055]
本发明所提供的基于共享物品相关信息的跨平台序列推荐方法及装置,采用以上方法构建了新的跨平台序列推荐模型natsr(neural attentive transfer sequential recommendation),仅物品侧的数据进行跨平台共享,允许协同过滤信号的传输,共享从辅助平台的用户-物品交互行为中学习物品的嵌入,两级注意力设计允许natsr模型从传输的物品嵌入中提取有用的信号,并适当地将它们与目标平台中的数据相结合;因此,本发明在保护用户隐私信息的前提下,缓解了目标平台的数据稀疏问题,并能够从用户历史行为序列中挖掘获得最佳的用户偏好表示,以满足用户对感兴趣项目的个性化需求,帮助用户发现对自己有价值的信息,同时让信息能够展现在对它感兴趣的用户面前,有效提高了目标平台的推荐性能。
附图说明
[0056]
图1为本发明涉及的基于共享物品相关信息的跨平台序列推荐方法的流程图;
[0057]
图2为本发明实施例涉及的跨平台序列推荐模型natsr的结构示意图;
[0058]
图3为本发明实施例涉及的transfer的模块示意图(对应步骤4)。
具体实施方式
[0059]
以下结合附图对本发明涉及的基于共享物品相关信息的跨平台序列推荐方法、装置及系统的具体实施方案进行详细地说明。
[0060]
《实施例》
[0061]
本发明在现有序列推荐方法的基础上开展研究,提出了一种基于共享物品相关信息的跨平台序列推荐方法。通过从辅助平台上获取物品embedding信息,过滤掉用户相关信息;第二,把辅助平台的物品embedding信息迁移到目标平台中,以便后续使用;第三,目标平台利用辅助平台迁移过来的物品embedding向量信息;最后,平台级的注意力单元动态调整两个平台信息,弥合两个平台的embedding空间差异,利用整合后的embedding向量信息进行个性化推荐服务。
[0062]
如图1~3所示,本发明提出的基于共享物品相关信息的跨平台序列推荐方法,包括以下步骤:
[0063]
输入为用户历史行为序列s1,s2,

,s
t
,如用户集合u={u1,u2,

,un},物品集合i={i1,i2,

,in},其中|u|=m,|i|=n。用户u在t时刻之前交互的物品序列记为其中表示物品集合的子集。测试数据中用户u的交互项目集合为给定所有用户交互序列集合序列推荐任务的目标在于
预测用户u在下一个时刻t会交互的物品。本发明中用粗体大写字母(如,),表示矩阵、用粗体小写字母(如,)表示向量和用普通小写字母(如,x)表示标量。如果没有特别说明,所有的向量都是列式的,表示的转置。本发明用符号σ、relu和

分别表示sigmoid函数、rectifier函数和element-wise的操作。
[0064]
s1步骤1:从辅助平台上获取物品embedding信息;基于隐空间表征学习的推荐模型,为每个用户和物品在隐空间分配实值向量刻画其兴趣与属性,将稀疏的用户和物品原始表示投影到实值向量中,得到用户和物品的独热编码表示;
[0065]
基于隐空间表征学习的推荐模型是推荐系统中的一种通用框架,它为每个用户和物品在隐空间分配实值向量刻画其兴趣与属性。遵循普遍采用的做法,将稀疏的用户和物品原始表示投影到实值向量中。具体而言,首先将用户id(u)和物品id(i)编码为一个独热编码,如下所示:
[0066][0067]
其中是一个矢量,除了数值为1的u-th(i-th)条目外,其他都是零值。然后,将稀疏的独热编码(和)投射到局部嵌入和转移嵌入中。
[0068]
s2步骤2:步骤1得到的辅助平台上物品的embedding向量信息以及用户和物品的独热编码表示,在转移到目标平台的过程中需要过滤掉用户的相关信息,进行本地嵌入操作;
[0069]
通过两个嵌入矩阵分别将用户与物品的原始id表示转化为稠密向量表示。本地嵌入向量表示公式如下所示:
[0070][0071]
其中和是要学习的参数,d代表隐空间的维度,是一个超参数。和是本地嵌入向量,它们是通过优化与学习目标平台的数据得到。
[0072]
两个平台的嵌入向量空间可能有差异,因为两个平台中的训练数据可能具有不同的规模和不同的分布。此外,嵌入向量的维度可能就有较大差别。为了解决这个问题,采用了一个全连接网络来调整嵌入向量的空间,具体表示如下,
[0073][0074]
其中和是映射矩阵和偏差,均为可学习参数。是在辅助平台中离线学习得到,进而迁移至目标平台。
[0075]
应该注意的是,此处规定d的取值大小以及两个平台的嵌入物品表示形式只是为了举例说明本发明的具体实施流程,并不用作限定本发明。
[0076]
s3步骤3:步骤2把辅助平台的物品embedding信息迁移到目标平台中。
[0077]
s4步骤4:利用步骤3得到的目标平台中整合了辅助平台迁移而来的物品embedding信息,得到目标平台物品信息的额外嵌入向量的统一表示,使用早期融合来合并嵌入向量;
[0078]
使用基于物品的协同过滤方法,将迁移的物品嵌入融合至一个额外用户嵌入向量中。在利用了目标平台的历史交互之外,该向量还包含来自于辅助平台的
协同过滤信号,可以进一步增强对于用户的表征能力。利用平均池化的思想,它是神经网络中广泛使用的建模组件,计算的方式如下,
[0079][0080]
其中是的l1范数,代表着用户u交互过的物品数量。在实际计算时,此处需要对于用户历史以多热编码表示,即基于用户历史的多热编码与迁移的向量得到额外用户嵌入向量
[0081]
应注意的是,对迁移的物品嵌入统一表示采用仅为举例说明本发明的具体实施步骤,并不用作限定本发明。
[0082]
在获得本地用户嵌入向量、物品嵌入向量和额外用户嵌入向量之后,使用早期融合来合并嵌入向量,使得可以显式地捕获两个嵌入向量之间的交互。融合的用户统一嵌入向量的表示如下所示,
[0083][0084]
其中η
pi
和η
qi
分别是和的可学习的权重,用来平衡对于物品i而言、来自目标平台与辅助平台的信息的重要性。
[0085]
s5步骤5:根据步骤3和4得到的用户统一嵌入向量表达以及目标平台中整合了辅助平台迁移过来的物品信息,平台级的注意力单元动态调整两个平台信息,弥合两个平台的embedding空间差异,通过使用预测函数来估计用户和物品之间的交互概率,利用embedding向量信息进行序列推荐。
[0086]
在跨平台推荐的通用框架上,不共享用户行为数据,采用一个简单而广泛使用的内积模型来估计的值,计算方式如下所示,
[0087][0088]
其中σ是sigmoid函数。注意,这种预测函数可以很容易地扩展到更复杂的函数,例如多层感知机模型。
[0089]
本发明中步骤4具体包括以下子步骤:
[0090]
步骤4-1:基于迁移向量增强的嵌入向量层。将稀疏的用户和物品编码投影到密集向量中。通过引入维度自适应模块,得到了辅助平台的物品嵌入向量;
[0091]
跨平台序列推荐的一个典型问题设置是利用辅助平台的数据来促进目标平台中物品重叠的推荐质量,有一个用户与物品的交互矩阵每个条目的二进制值定义为,
[0092][0093]
在辅助平台中,有另一个二元用户-物品交互矩阵其中k和l是用户和物品的数量。l项的一部分也出现在目标平台中,它们被命名为共享项。从交互矩阵和中,跨平台推荐的目标是学习一个预测函数来估计一个给定的用户u与目标平台中的项目i交互的可能性。
[0094]
应注意的是,对一个用户与物品的交互矩阵的表示,仅为举例说明本发明的具体实施步骤,并不用作限定本发明。
[0095]
步骤4-2:基于步骤4-1得到的辅助平台的物品嵌入向量,将其迁移至目标平台;
[0096]
迁移的物品嵌入矩阵定义为,
[0097][0098]
其中是一个全零向量,是辅助平台中物品i的离线学习嵌入。按照目标平台中物品ids的相同顺序来组织中转移的物品嵌入,以便能够用其id查找物品嵌入。假设的可用性,即经营辅助平台的公司已经采用了基于嵌入的推荐系统。
[0099]
步骤4-3:对步骤4-2中得到的跨平台数据信息,基于物品层注意力网络层:为了丰富对于用户的刻画与表征,基于用户在目标平台的交互历史,与辅助平台迁移的物品向量,得到一个用户额外嵌入向量
[0100]
步骤4-4:对步骤4-3中得到的用户额外向量表示,设计了一个物品层注意力网络来建模不同物品的不同重要性;
[0101]
交互过的不同物品起的作用可能是不同的,故在真实情况下,简单池化操作可能无法得到合适的用户表征,因此为每一个物品分配一个权重,改进后的计算方式如下所示,
[0102][0103]
其中权重无法由数据直接得到或由人为指定,引入了一个物品级的注意力网络,该网络在推荐任务中取得了巨大的成功。具体来说,物品级注意力单元根据以下公式为每个转移的项目嵌入学习一个特定的权重γ
uj
。如下所示,
[0104][0105][0106]
其中和b1表示全连接层的权重矩阵和偏置。项目级注意力单元的输入是用户和目标项目之间的交互,这使得学习到的注意力分数对给定用户敏感。
[0107]
应注意的是,对物品级注意力单元表示方法,仅为举例说明本发明的具体实施步骤,并不用作限定本发明。
[0108]
步骤4-5:对步骤4-4中得到的不同物品的不同重要性,基于平台层注意力网络层:在考虑平台间差异的基础上,设计了一个平台层注意力网络来控制来自两个平台的预测信号的影响,以得到对于用户的最终表征向量;
[0109]
然后进入步骤5,根据步骤4-5得到用户的最终表征向量,利用内积作为预测函数。设计一个框架来利用辅助平台已转移的物品嵌入信息。
[0110]
采用随机批量梯度下降法,在小批量模式下对natsr模型进行优化,这是一种广泛适用于神经网络模型的优化方法。在构造批量单元时,首先对一批历史用户-物品交互对(u,i)进行采样。
[0111]
基于以上方法,本实施例还提供了能够自动实现该方法的跨平台序列推荐装置,该装置包括信息获取模块、过滤模块、迁移模块、向量嵌入模块、序列推荐模块、输入显示部以及控制部。
[0112]
信息获取模块根据上文步骤a1所描述的内容,从辅助平台上获取物品embedding信息。
[0113]
过滤模块根据上文步骤a2所描述的内容,对信息获取模块得到的辅助平台上物品的embedding向量信息,过滤掉用户的相关信息,确保转移到目标平台的数据都是物品侧的信息。
[0114]
迁移模块根据上文步骤a3所描述的内容,将过滤处理后辅助平台的物品embedding信息迁移到目标平台中。
[0115]
向量嵌入模块根据上文步骤a4所描述的内容,利用迁移模块得到的目标平台中整合了辅助平台迁移而来的物品embedding信息,得到目标平台物品信息的额外嵌入向量的统一表示,使用早期融合来合并嵌入向量;
[0116]
序列推荐模块根据上文步骤a5所描述的内容,基于从迁移模块和向量嵌入模块得到的从辅助平台迁移过来的物品侧信息,平台级的注意力单元动态调整两个平台信息,弥合两个平台的embedding空间差异,通过使用预测函数来估计用户和物品之间的交互概率,利用embedding向量信息进行序列推荐。
[0117]
输入显示部与信息获取模块、过滤模块、迁移模块、向量嵌入模块、序列推荐模块均通信相连,让用户输入控制指令,并根据控制指令进行相应的显示。
[0118]
控制部与信息获取模块、过滤模块、迁移模块、向量嵌入模块、序列推荐模块、输入显示部均通信相连,控制它们的运行。
[0119]
以上实施例仅仅是对本发明技术方案所做的举例说明。本发明所涉及的基于共享物品相关信息的跨平台序列推荐方法、装置及系统并不仅仅限定于在以上实施例中所描述的内容,而是以权利要求所限定的范围为准。本发明所属领域技术人员在该实施例的基础上所做的任何修改或补充或等效替换,都在本发明的权利要求所要求保护的范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1