一种基于知识图谱的新闻推荐方法

文档序号:30609949发布日期:2022-07-01 23:22阅读:159来源:国知局
一种基于知识图谱的新闻推荐方法

1.本发明涉推荐系统的新闻推荐领域,尤其是一种基于知识图谱的新闻推荐技术。


背景技术:

2.新闻推荐系统的目的是处理海量的新闻,为用户提供个性化的推荐。新闻推荐中的一个主要问题是获取精确的新闻表示和用户表示,以此来评估待推荐项目的有效性。在新闻推荐领域中,许多的新闻都具有高度的时间敏感性,大约90%的文章只会在发布后的两天内被人点击,然后被更新的新闻所取代。因此,为了克服传统的协同过滤方法具有的冷启动的局限性,有必要彻底的利用新闻的内部潜在信息,以获取新闻的精确表示。在通常情况下,新闻标题和内容由不同类型的知名实体填充,例如政客、名人和事件,有效的利用这种具有丰富语义的实体可以提高推荐的效率。然而,现有的大多数新闻推荐系统忽视了利用实体的外部知识和新闻之间的主题相关性。针对上述问题,本章提出一种利用知识图谱来增强新闻推荐系统性能的方法。


技术实现要素:

3.针对上述现有技术的不足,本发明提供一种基于知识图谱的新闻推荐方法。其目的在于解决以往方法中存在的新闻建模不充分及推荐准确率低的问题。
4.为了实现上述目的,本发明提供了一种基于知识图谱的新闻推荐方法,包括以下步骤:
5.a1、实体识别
6.a2、单词层面新闻建模
7.a3、知识层面新闻建模
8.a4、获取新闻表示
9.a5、获取用户表示
10.a6、预测输出
11.本发明提供了一种基于知识图谱的新闻推荐方法。与现有技术相比,具备以下有益效果:
12.利用新闻标题中富含知识实体的特性,将知识图谱作为一种辅助信息引入进来,同时利用知识图谱富含关系的特性,使用相邻知识实体来丰富标题中实体的表示,并使用注意力机制来区分标题中重要的实体和其重要的邻居,接着使用消息传递机制和消息聚合机制来收集相邻实体的信息,以此来学习新闻标题的知识层面的表示。通过与原有的单词层面的表示相结合,将这两部分的结果融合到一起得到最终的新闻表示。。
附图说明
13.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本
发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
14.图1是基于知识图谱的新闻推荐方法的整体框架图。
15.图2是基于新闻类别的注意力机制示意图。
具体实施方式
16.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
17.下面结合说明书附图以及具体的实施方式对本发明作详细的说明。如图1所示,一种基于知识图谱的新闻推荐系统包括步骤a1~a6:
18.a1、实体识别
19.a2、单词层面新闻建模
20.a3、知识层面新闻建模
21.a4、获取新闻表示
22.a5、获取用户表示
23.a6、预测输出
24.下面对各个步骤进行详细描述。
25.在步骤a1中,根据新闻标题中的单词,找到其中所包含的知识实体,具体是通过实体链接技术和实体消歧技术找到新闻标题中包含的知识实体。
26.在步骤a2中,给定新闻vi的标题单词序列表示为vi=[w1,w2,

,wm],使用词嵌入技术将单词序列转化为一组嵌入向量集ew=[e1,e2,

,em],接着使用卷积神经网络提取标题的局部信息,然后使用一个基于新闻类别的注意力网络得到新闻标题的单词层面的表示。式1表示卷积操作,式2和式3表示注意力网络:
[0027]ci
=relu(fw×e(e-k):(i+k)
+bw)(1)
[0028][0029][0030]
在步骤a3中,使用实体嵌入技术将新闻标题中包含的知识实体转化为实体向量,接着根据知识图谱的结构,使用消息传递机制,找到标题中包含的实体的邻居,最后使用消息聚合机制,将实体邻居的消息聚合起来,形成最后的新闻标题的知识层面的表示。式4和式5表示消息传递,式6和式7表示消息聚合:
[0031][0032][0033][0034]
agg
concat
=σ(w
·
(e0||e1||...||e
l
)+b)(7)
[0035]
在步骤a4中,给定输入的新闻vi,根据a2获得的单词层面的表示和a3获得的知识层面的表示,获取新闻的最终表示。其中v表示最终的新闻表示,vw表示单词层面的新闻表示,vk表示知识层面的新闻表示:
[0036]
v=[vw,vk](8)
[0037]
在步骤a5中,根据用户的历史点击新闻纪录和候选新闻,逐个计算历史新闻与候选新闻的相关性,以此获取不同历史新闻的权重,然后通过加权来获取用户表示。式9表示计算历史新闻的权重,式10来获取用户表示:
[0038][0039][0040]
在步骤a6中,根据a4计算的新闻表示和a5计算的用户表示,通过内积操作来预测用户点击新闻的概率。式11计算点击的概率,式12为损失函数:
[0041][0042][0043]
本发明提出了一种基于知识图谱的新闻推荐方法,创新点包括:
[0044]
提出了一种基于知识图谱的新闻推荐的方法。该方法对新闻标题进行单词层面和知识层面的建模,采取基于新闻类别的注意力机制来识别标题中重要的单词,并使用消息传递和消息聚集机制进一步丰富新闻标题中知识实体的建模。从而弥补了传统方法对新闻标题建模的不足,进一步提高了新闻推荐的准确率。
[0045]
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。


技术特征:
1.一种基于知识图谱的新闻推荐的方法。其特征在于,所述方法由计算机执行,包括以下步骤:a1、实体识别a2、单词层面新闻建模a3、知识层面新闻建模a4、获取新闻表示a5、获取用户表示a6、预测输出。2.如权利要求1所述的基于知识图谱的新闻推荐的方法,其特征在于,根据新闻标题中的单词,找到其中所包含的知识实体,a1的具体实现过程如下:通过实体链接技术和实体消歧技术找到新闻标题中包含的知识实体。3.如权利要求1所述的基于知识图谱的新闻推荐的方法,其特征在于,对新闻标题进行单词层面的建模,a2的具体实现过程如下:给定新闻v
i
的标题单词序列表示为v
i
=[w1,w2,...

w
m
],使用词嵌入技术将单词序列转化为一组嵌入向量集e
w
=[e1,e2,...,e
m
],接着使用卷积神经网络提取标题的局部信息,然后使用一个基于新闻类别的注意力网络得到新闻标题的单词层面的表示。式1表示卷积操作,式2和式3表示注意力网络:c
i
=relu(f
w
×
e
(i-k):(i+k)
+b
w
)(1)(1)4.如权利要求1所述的基于知识图谱的新闻推荐的方法,其特征在于,对新闻标题进行知识层面的建模,a3的具体实现过程如下:使用实体嵌入技术将新闻标题中包含的知识实体转化为实体向量,接着根据知识图谱的结构,使用消息传递机制,找到标题中包含的实体的邻居,最后使用消息聚合机制,将实体邻居的消息聚合起来,形成最后的新闻标题的知识层面的表示。式4和式5表示消息传递,式6和式7表示消息聚合:式6和式7表示消息聚合:式6和式7表示消息聚合:agg
concat
=σ(w
·
(e0||e1||...||e
l
)+b)(7)5.如权利要求1所述的基于知识图谱的新闻推荐的方法,其特征在于,获取新闻的表示,a4的具体实现过程如下:给定输入的新闻v
i
,根据a2获得的单词层面的表示和a3获得的知识层面的表示,获取新闻的最终表示。其中v表示最终的新闻表示,v
w
表示单词层面的新闻表示,v
k
表示知识层面的新闻表示:v=[v
w
,v
k
](8)6.如权利要求1所述的基于知识图谱的新闻推荐的方法,其特征在于,获取用户的表示,a5的具体实现过程如下:根据用户的历史点击新闻纪录和候选新闻,逐个计算历史新闻与候选新闻的相关性,以此获取不同历史新闻的权重,然后通过加权来获取用户表示。式9
表示计算历史新闻的权重,式10来获取用户表示:式10来获取用户表示:7.如权利要求1所述的基于知识图谱的新闻推荐的方法,其特征在于,获取用户点击候选新闻的概率,a6的具体实现过程如下:根据a4计算的新闻表示和a5计算的用户表示,通过内积操作来预测用户点击新闻的概率。式11计算点击的概率,式12为损失函数:式12为损失函数:

技术总结
本发明涉及推荐系统的新闻推荐领域,尤其是一种基于知识图谱的新闻推荐方法。1)根据新闻标题中的单词,找到其中所包含的知识实体,具体是通过实体链接技术和实体消歧技术找到新闻标题中包含的知识实体;2)使用词嵌入技术将新闻标题的单词序列转化为一组嵌入向量集,接着使用卷积神经网络提取标题的局部信息,然后使用一个基于新闻类别的注意力网络得到新闻标题的单词层面的表示;3)使用实体嵌入技术将新闻标题中包含的知识实体转化为实体向量,接着根据知识图谱的结构,使用消息传递机制,找到标题中包含的实体的邻居,最后使用消息聚合机制,将实体邻居的消息聚合起来,形成最后的新闻标题的知识层面的表示;4)根据第二步获得的单词层面的表示和第三步获得的知识层面的表示,获取新闻的最终表示;5)根据用户的历史点击新闻纪录和候选新闻,逐个计算历史新闻与候选新闻的相关性,以此获取不同历史新闻的权重,然后通过加权来获取用户表示;6)根据第四步计算的新闻表示和第五步计算的用户表示,通过内积操作来预测用户点击候选新闻的概率。通过内积操作来预测用户点击候选新闻的概率。


技术研发人员:杨晔 李平
受保护的技术使用者:长沙理工大学
技术研发日:2022.03.15
技术公布日:2022/6/30
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1