技术特征:
1.一种融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,该方法包括:步骤i:对数据集中的初始数据空间进行划分,获得的每个子空间视为一个区域,进而根据兴趣点的原始空间信息获取兴趣点的所属区域,将兴趣点的原始空间信息转换为粗粒度的空间信息;步骤ii:整合用户
‑
兴趣点的交互信息和兴趣点的粗粒度的空间信息,构建知识图谱;所述知识图谱包含的实体有:用户、兴趣点、空间信息,包含的关系有:用户
‑
兴趣点、兴趣点
‑
区域;其中用户
‑
兴趣点代表用户与兴趣点之间存在历史交互;兴趣点
‑
区域代表兴趣点的位置位于某个区域内;步骤iii:基于知识图谱中的路径静态信息捕捉实体之间的潜在关系,并融合用户签到序列的时序动态信息来学习用户偏好;所述实体间的潜在关系通过实体间的潜在关系路径体现,所述实体间的潜在关系路径,是指知识图谱中连接两个实体的多跳路径,能够表示两个实体间的潜在关系,包括用户与兴趣点之间的潜在关系路径、兴趣点与兴趣点之间的潜在关系路径两个类别;步骤iv:基于学习到的用户偏好为用户推荐兴趣点,生成推荐结果的解释。2.根据权利要求1所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述数据集,是指由某一基于位置的社交网络中用户的签到数据构成的集合,其中包含签到数据所涉及的用户id、兴趣点id、用户
‑
兴趣点的交互时间,以及兴趣点的位置信息。3.根据权利要求1或2所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述初始数据空间,是指数据集中所有兴趣点的位置信息构成的空间。4.根据权利要求1所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述步骤i包括如下步骤:步骤i
‑
1:设置超参数:区域边长阈值δ;步骤i
‑
2:初始化待划分的空间集合x,令x={初始数据空间};步骤i
‑
3:将x中的每个空间按横坐标划分成两个大小相同的子空间,判断各子空间边长是否小于区域边长阈值δ,如果存在子空间边长小于区域边长阈值δ,则停止划分,输出最终的区域划分结果,结束步骤i,否则,令x={当前步骤划分得到的多个子空间},执行步骤i
‑
4;步骤i
‑
4:将x中的每个空间按纵坐标划分成两个大小相同的子空间,判断各子空间边长是否小于区域边长阈值δ,如果存在子空间边长小于区域边长阈值δ,则停止划分,输出最终的区域划分结果,结束步骤i,否则,令x={当前步骤划分得到的多个子空间},转至步骤i
‑
3。5.根据权利要求1所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述关系用户
‑
兴趣点表示为(u1,签到,v1);所述关系兴趣点
‑
区域表示为(v1,隶属于,a1);其中u1为任一用户,v1为任一兴趣点,a1为兴趣点v1位于的区域。6.根据权利要求1所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述步骤iii包括如下步骤:步骤iii
‑
1:利用现有的知识图谱嵌入方法学习知识图谱中各实体和关系的嵌入表示;步骤iii
‑
2:根据知识图谱中各实体和关系的嵌入表示,学习实体间的潜在关系表示;步骤iii
‑
3:在知识图谱中实体间的路径静态信息的基础上,进一步融合用户签到的时
序动态信息,进而学习用户偏好。7.根据权利要求6所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述步骤iii
‑
1包括如下步骤:步骤iii
‑1‑
1:根据知识图谱获取邻居上下文和路径上下文;对于给定的任意实体e,实体e的邻居上下文c
n
(e)是以e为头实体的三元组中出现的所有关系
‑
尾实体对;对于给定的两个实体e和e
′
,实体e和实体e
′
的路径上下文c
p
(e,e
′
)是指实体e到实体e
′
的一组路径中出现的所有合成关系;其中,所述合成关系,是指一个实体到另一个实体的某条路径中的多个关系形成的多元组;步骤iii
‑1‑
2:形成由邻居上下文和路径上下文组成的三元组上下文,并基于三元组上下文得到知识图谱嵌入方法的得分函数f(e,r,e
′
):f(e,r,e
′
)=p((e,r,e
′
)|c(e,r,e
′
);θ
e
)其中,e和e
′
为给定的两个实体;r表示关系;θ
e
为嵌入方法的参数,p(
·
)表示概率,c(e,r,e
′
)表示由邻居上下文和路径上下文组成的三元组上下文;步骤iii
‑1‑
3:通过最大化知识图谱中所有三元组的联合概率p(kg|θ
e
)训练参数θ
e
,从而实现知识图谱嵌入方法的训练;其中,kg是构建的知识图谱;步骤iii
‑1‑
4:根据训练好的知识图谱嵌入方法,获得所有实体和关系的嵌入表示。8.根据权利要求6所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述步骤iii
‑
2包括如下步骤:步骤iii
‑2‑
1:学习实体间的潜在关系路径的嵌入表示;假设对于实体对(e,e
′
),存在k跳潜在关系路径则p1(e,e
′
)的嵌入表示p1(e,e
′
)为:其中,e
i
和r
i
分别是实体e
i
和关系r
i
的嵌入表示,e
k
=e
′
;步骤iii
‑2‑
2:将实体对(e,e
′
)间的多条潜在关系路径的嵌入表示组成表征矩阵p(e,e
′
):其中,n表示实体对(e,e
′
)间的潜在关系路径数量,当1≤i≤n时,p
i
(e,e
′
)表示潜在关系路径p
i
(e,e
′
)的嵌入表示;步骤iii
‑2‑
3:基于自注意力机制学习各潜在关系路径的权重,并根据权重聚合多条潜在关系路径,形成实体间潜在关系表示;充分考虑不同潜在关系路径之间的关系,在表征矩阵p(e,e
′
)的基础上,利用自注意力机制计算得到实体间的潜在关系表示p
′
(e,e
′
):
p
′
(e,e
′
)=attention(p(e,e
′
)w
q
,p(e,e
′
)w
k
,p(e,e
′
)w
v
)其中,w
q
、w
k
、w
v
分别表示注意力机制中query、key、value的权重矩阵,d表示维度,softmax(
·
)表示归一化函数。9.根据权利要求6所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述步骤iii
‑
3包括如下步骤:步骤iii
‑3‑
1:从所述数据集获取用户的签到序列;步骤iii
‑3‑
2:获取用户的签到序列中涉及的实体间的潜在关系表示;用户
‑
兴趣点、兴趣点
‑
兴趣点两类实体间的潜在关系表示,分别为用户与在第1个时间步上访问的兴趣点之间的潜在关系表示、被连续访问的两个兴趣点之间的潜在关系表示;步骤iii
‑3‑
3:根据实体间的潜在关系表示初始化循环神经网络的输入向量;第1个时间步t1上的输入向量x1为:其中,是用户实体u和兴趣点实体之间的潜在关系表示;是兴趣点的嵌入表示;表示连接操作;当1<l≤t时,第l个时间步t
l
上的输入向量x
l
可以表示为:其中,t表示时间步数量;是被连续访问的两个兴趣点和之间的潜在关系表示;是兴趣点的嵌入表示;步骤iii
‑3‑
4:根据时间步更新循环神经网络;步骤iii
‑3‑
5:通过循环神经网络的每一个时间步对信息的存储以及过滤,输出最后一个时间步的隐藏向量h
t
;步骤iii
‑3‑
6:融合用户实体的嵌入表示和最后一个时间步的隐藏向量,以得到用户与最后一个时间步的兴趣点之间的交互向量;步骤iii
‑3‑
7:采用多层感知器mlp将交互向量映射为预测的用户u访问兴趣点的访问概率从而得到用户u对兴趣点的偏好程度。10.根据权利要求1所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述步骤iv包括如下步骤:步骤iv
‑
1:使用交叉熵损失构建兴趣点推荐的目标函数,并最小化目标函数以进行参数学习;步骤iv
‑
2:将学习到的参数代入步骤iii,计算最终用户访问各兴趣点的概率,输出概率最大的top
‑
k兴趣点;步骤iv
‑
3:生成兴趣点推荐结果的解释;对于数据集中某用户u1,假设该用户在时间t1防问过兴趣点并且曾在时间t2访问过兴趣点即存在签到对于推荐的一个兴趣点生成推荐解释的方法为:将用户u1与兴趣点之间的路径视为由用户u1与第1个时间步上访问的兴趣点之间的潜
在关系路径被连续访问的两个兴趣点之间的潜在关系路径组成,其中,每个实体对之间存在多条关系路径;根据权重值,选择潜在关系路径和由这些潜在关系路径组成的完整路径形成向u1推荐目标兴趣点的解释。
技术总结
本发明公开了一种融合知识图谱和时序特征的可解释兴趣点推荐方法,涉及兴趣点推荐技术领域。该方法主要包括三个部分:知识图谱构建、实体间的潜在关系表示学习及用户行为的时序动态性捕捉、输出可解释的推荐结果,实体间的潜在关系表示学习是基于构建的知识图谱实现的,通过捕捉实体间的多条潜在关系路径,学习实体间的潜在关系表示,并进一步利用用户的签到序列,即融合路径静态信息和时序动态信息来学习用户偏好,最后基于学习到的用户偏好为用户推荐兴趣点,并提供推荐结果的解释。本发明能够在保证推荐精准度的同时,生成可解释的推理路径,通过提供推荐结果的解释,保证推荐方法的透明度,进而提高用户对推荐结果的信任水平和接受度。水平和接受度。水平和接受度。
技术研发人员:申德荣 石美惠 寇月 聂铁铮
受保护的技术使用者:东北大学
技术研发日:2021.08.24
技术公布日:2021/11/16