一种人物关系知识图谱构建方法、设备、介质及产品

文档序号:38429944发布日期:2024-06-24 14:18阅读:8来源:国知局
一种人物关系知识图谱构建方法、设备、介质及产品


背景技术:

1、社交网络的迅速发展和普及已经彻底改变了人们的生活方式和社会交往模式。通过社交网络,人们可以迅速地扩展社交圈子,与来自不同文化背景和兴趣爱好的人们进行交流和连接。社交网络中的人物关系错综复杂,构成了一个复杂的网络结构,呈现出多层次、多维度的联系和互动。通过分析人物之间的关系,可以识别出有影响力的重要人物,了解他们的观点和行为对社交网络中其他人的影响程度。此外,社交网络人物关系分析有助于优化社交网络平台的管理和发展,深入研究社会的运作机制和人际关系模式。

2、现在对于社交网络人物关系知识图谱的构建技术已有广泛研究和应用,其中比较主流的方法有两种:一种是利用社交网络用户的点赞、关注、评论等基本信息构建社交网络人物关系知识图谱,但是这样构建出来的网络过于简单和浅显,没有考虑社交网络中隐藏的更深层、更复杂的关系。另一种方法是对社交网络推文中的内容进行实体识别、关系抽取等操作提取出人物之间的关系,从而构建社交网络的人物关系知识图谱。而通过传统的实体与关系抽取方式来构建社交网络人物关系知识图谱的缺点在于:第一,这种方式可以比较好地处理只隐藏成对关系的推文,但是对于存在高阶关系的推文,使用这种方式会导致人物实体和关系预测不准确;第二,使用传统的分词方式来提取人物实体,会导致一些嵌套的人物实体无法被识别。


技术实现思路

1、为解决现有技术存在的上述问题,本发明提供了一种人物关系知识图谱构建方法、设备、介质及产品。

2、为实现上述目的,本发明提供了如下方案:

3、一种人物关系知识图谱构建方法,所述方法包括:

4、获取推文语句,并使用面向邻域的打包方案预测推文语句中的跨度集合;所述跨度集合包括主语跨度和实体跨度;

5、将所述实体跨度作为主语跨度的宾语标签,采用标记悬浮技术使用主语标签和宾语标签标记所述推文语句,得到标记后的语句;

6、基于标记后的语句生成主语表征向量、宾语表征向量以及关系表征向量;

7、将所述主语表征向量、所述宾语表征向量以及所述关系表征向量均作为节点,将连接所述主语表征向量、所述宾语表征向量和所述关系表征向量的边以及连接两两关系表征向量的边作为超边,构建超图;

8、引入超图神经网络对所述超图的边和节点进行更新学习,得到更新后的超图;

9、基于更新后的超图将主语、宾语以及关系表征进行分类,得到分类后的实体表征和关系表征;

10、利用交叉熵损失监督实体表征和关系表征,以构建人物关系知识图谱。

11、可选地,获取推文语句,并使用面向邻域的打包方案预测推文语句中的跨度集合,具体包括:

12、获取推文语句,并使用面向邻域的打包方案预测推文语句的初始跨度集合;

13、确定每一初始跨度集合的分数,并基于所述分数对初始跨度集合进行排序,得到跨度集合序列;

14、选取跨度集合序列中的前k个初始跨度集合作为推文语句中的跨度集合。

15、可选地,将所述实体跨度作为主语跨度的宾语标签,采用标记悬浮技术使用主语标签和宾语标签标记所述推文语句,得到标记后的语句,具体包括:

16、在主语跨度前后插入一对实体标签,并为每个实体跨度分配一对悬浮标记;

17、将悬浮标记打包在一起,并插入到推文语句的末尾,将标记st(i)和标记ed(i)分别作为主语跨度si的起始标记索引和结束标记索引,得到标记后的语句。

18、可选地,基于标记后的语句生成主语表征向量、宾语表征向量以及关系表征向量,具体包括:

19、得到标记后的语句得到推文语句的上下文化隐藏表示;

20、基于推文语句的上下文化隐藏表示确定主语表征向量和宾语表征向量;

21、基于主语表征向量和宾语表征向量得到关系表征向量。

22、可选地,引入超图神经网络对所述超图的边和节点进行更新学习,得到更新后的超图,具体包括:

23、采用注意力机制,通过学习加权和对所述超图中相邻边的每个节点的消息进行聚合;并将聚合后的消息添加到原节点的表示中,实现节点的更新;

24、基于更新后的节点完成边的更新。

25、可选地,基于更新后的超图将主语、宾语以及关系表征进行分类,得到分类后的实体和关系表征,具体包括:

26、对于主语跨度,基于更新后的超图连接该主语跨度对应的主语表示和宾语表示,得到主语实体表示;

27、确定主语实体表示在第一类型上的概率分布,并基于主语实体表示在第一类型上的概率分布完成主语和宾语分类,得到实体表征;

28、确定更新后的超图中关系在第二类型上的概率分布,并基于关系在第二类型上的概率分布完成关系分类,得到关系表征。

29、可选地,所述交叉熵损失基于主语实体表示在第一类型上的概率分布以及关系在第二类型上的概率分布确定得到。

30、一种计算机设备,包括:存储器、处理器以存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序以实现上述任一项所述的人物关系知识图谱构建方法的步骤。

31、一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述的人物关系知识图谱构建方法的步骤。

32、一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任一项所述的人物关系知识图谱构建方法的步骤。

33、根据本发明提供的具体实施例,本发明公开了以下技术效果:

34、本发明使用面向邻域的打包方案和悬浮标记技术来识别并标记推文语句中的实体跨度,使用超图神经网络结合消息传递来进行高阶推理,最后对超图中的实体节点和关系节点进行分类并使用交叉熵损失监督实体和关系的预测,从而获取大规模社交网络中的人物和实体关系,以使人物实体和关系的提取更加准确,进而使人物关系知识图谱构建更加准确。基于此,有助于企业更有效地构建和维护基于社交网络数据的人物关系知识图谱,为企业提供更深入的洞察力,帮助企业更好地理解和分析社交网络中的人物关系,为业务决策提供更准确的信息基础,从而推动企业社交网络战略、市场营销和用户关系管理等。



技术特征:

1.一种人物关系知识图谱构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的人物关系知识图谱构建方法,其特征在于,获取推文语句,并使用面向邻域的打包方案预测推文语句中的跨度集合,具体包括:

3.根据权利要求1所述的人物关系知识图谱构建方法,其特征在于,将所述实体跨度作为主语跨度的宾语标签,采用标记悬浮技术使用主语标签和宾语标签标记所述推文语句,得到标记后的语句,具体包括:

4.根据权利要求1所述的人物关系知识图谱构建方法,其特征在于,基于标记后的语句生成主语表征向量、宾语表征向量以及关系表征向量,具体包括:

5.根据权利要求1所述的人物关系知识图谱构建方法,其特征在于,引入超图神经网络对所述超图的边和节点进行更新学习,得到更新后的超图,具体包括:

6.根据权利要求1所述的人物关系知识图谱构建方法,其特征在于,基于更新后的超图将主语、宾语以及关系表征进行分类,得到分类后的实体和关系表征,具体包括:

7.根据权利要求6所述的人物关系知识图谱构建方法,其特征在于,所述交叉熵损失基于主语实体表示在第一类型上的概率分布以及关系在第二类型上的概率分布确定得到。

8.一种计算机设备,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-7中任一项所述人物关系知识图谱构建方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7中任一项所述人物关系知识图谱构建方法的步骤。

10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7中任一项所述人物关系知识图谱构建方法的步骤。


技术总结
本发明公开一种人物关系知识图谱构建方法、设备、介质及产品,涉及数据处理领域。本发明使用面向邻域的打包方案和悬浮标记技术来识别并标记推文语句中的实体跨度,使用超图神经网络结合消息传递来进行高阶推理,最后对超图中的实体节点和关系节点进行分类并使用交叉熵损失监督实体和关系的预测,从而获取大规模社交网络中的人物和实体关系,以使人物实体和关系的提取更加准确,进而使人物关系知识图谱构建更加准确。基于此,有助于企业更有效地构建和维护基于社交网络数据的人物关系知识图谱,为企业提供更深入的洞察力,进而能够为业务决策提供更准确的信息基础,从而推动企业社交网络战略、市场营销和用户关系管理等。

技术研发人员:程渤,王梦妮,陈俊亮,杨嘉佳,曹蓉
受保护的技术使用者:北京邮电大学
技术研发日:
技术公布日:2024/6/23
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1