一种知识图谱补全模型简化方法及系统与流程

文档序号:37897226发布日期:2024-05-09 21:41阅读:16来源:国知局
一种知识图谱补全模型简化方法及系统与流程

本发明涉及数据处理,尤其涉及一种知识图谱补全模型简化方法。


背景技术:

1、知识图谱(即knowledge graph,kg)是真实世界知识的集合,表示为一组(h,r,t)形式的三元组,其中,三元组中h、r、t分别表示头实体、关系类型和尾实体。

2、随着知识图谱的不断发展,在各种知识驱动的人工智能应用和场景中,知识图谱做出了重大贡献,如自动问答、机器阅读、信息检索、对话系统等。由于对高质量知识的需求越来越大,知识图谱的完整性和可靠性也变得越来越重要。因此,知识图补全(即knowledgegraph completion,kgc)已经被广泛研究和关注,不仅被用于推理知识图谱中缺失的关系中,还被用于识别知识图谱中的三元组是否有效。

3、近年来,各种知识图谱补全模型已被广泛开发和应用于知识推理和预测任务,并在许多面向知识图谱的应用任务中取得了有竞争力的性能,显示了其捕捉关系事实和利用异构信息建模不同场景的能力。这些模型通常将三元组中的实体和关系表示为实数向量,并用这些向量评估三元组的合理性。

4、因此,传统的知识图谱补全模型通常将每个实体映射成一个唯一的多维向量、将每个关系映射成一个唯一的多维向量。然而,这种策略会导致存储向量矩阵的内存消耗增加,并且在建模真实世界的知识图谱时会产生高计算成本,特别是在知识图谱中实体和关系的数量量级比较大的情况下。

5、有鉴于此,如何提供一种知识图谱补全模型简化方法,在简化实体表示的参数规模的基础上,仍保持原始知识图谱补全模型的性能,成为亟需解决的问题。


技术实现思路

1、本发明提供一种知识图谱补全模型简化方法,一种知识图谱补全模型简化系统,一种知识图谱补全模型简化装置,一种电子设备,以及一种计算机可读存储介质,用以至少提供解决在简化实体表示的参数规模的基础上,仍保持原始知识图谱补全模型的性能的问题。

2、根据本发明实施例的第一方面,提供一种知识图谱补全模型简化方法,包括:

3、将原始知识图谱中的初始元素映射到统一的语义空间中进行初始化处理,得到所述初始元素在所述语义空间中对应的初始向量,其中,所述初始向由初始实体集合、初始关系集合和第一概念集合构成;

4、基于构建的坍缩知识图谱,对所述原始知识图谱进行处理,得到锚实体以及第二概念集合,其中,所述锚实体与所述锚实体对应的概念构成的参数规模不大于所述初始实体集合的参数规模;所述第二概念集合为在所述第一概念集合中,根据与所述锚实体对应的概念的相关性排序,获取的相关性符合预设条件,且引入外部语义知识库后得到的概念集合;

5、以所述锚实体、所述第二概念集合以及所述初始关系集合,生成词表;

6、通过目标架构框架,基于所述词表,以及所述锚实体与目标实体的距离向量,对所述目标实体进行更新,生成目标实体向量,并通过对三元组中的缺失元素进行推理,输出推理结果。

7、根据本发明实施例的第二方面,提供一种知识图谱补全模型简化系统,包括:

8、初始化模块,用于将原始知识图谱中的初始元素映射到统一的语义空间中进行初始化处理,得到所述初始元素在所述语义空间中对应的初始向量,其中,所述初始向由初始实体集合、初始关系集合和第一概念集合构成;

9、坍缩图谱构建模块,用于基于构建的坍缩知识图谱,对所述原始知识图谱进行处理,得到锚实体以及第二概念集合,其中,所述锚实体与所述锚实体对应的概念构成的参数规模不大于所述初始实体集合的参数规模;所述第二概念集合为在所述第一概念集合中,根据与所述锚实体对应的概念的相关性排序,获取的相关性符合预设条件,且引入外部语义知识库后得到的概念集合;

10、词表生成模块,用于以所述锚实体、所述第二概念集合以及所述初始关系集合,生成词表;

11、更新推理模块,用于通过目标架构框架,基于所述词表,以及所述锚实体与目标实体的距离向量,对所述目标实体进行更新,生成目标实体向量,并通过对三元组中的缺失元素进行推理,输出推理结果。

12、根据本发明实施例的第三方面,提供一种知识图谱补全模型简化装置,包括:

13、初始化模块,被配置为将原始知识图谱中的初始元素映射到统一的语义空间中进行初始化处理,得到所述初始元素在所述语义空间中对应的初始向量,其中,所述初始向由初始实体集合、初始关系集合和第一概念集合构成;

14、坍缩图谱构建模块,被配置为基于构建的坍缩知识图谱,对所述原始知识图谱进行处理,得到锚实体以及第二概念集合,其中,所述锚实体与所述锚实体对应的概念构成的参数规模不大于所述初始实体集合的参数规模;所述第二概念集合为在所述第一概念集合中,根据与所述锚实体对应的概念的相关性排序,获取的相关性符合预设条件,且引入外部语义知识库后得到的概念集合;

15、词表生成模块,被配置为以所述锚实体、所述第二概念集合以及所述初始关系集合,生成词表;

16、更新推理模块,被配置为通过目标架构框架,基于所述词表,以及所述锚实体与目标实体的距离向量,对所述目标实体进行更新,生成目标实体向量,并通过对三元组中的缺失元素进行推理,输出推理结果。

17、根据本说明书实施例的第四方面,提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如本说明书实施例第一方面所述的知识图谱补全模型简化方法的步骤。

18、根据本说明书实施例的第五方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如本说明书实施例第一方面所述的知识图谱补全模型简化方法的步骤。

19、根据本说明书实施例提供的一种知识图谱补全模型简化方法,首先将原始知识图谱中的初始元素映射到统一的语义空间中进行初始化处理,得到所述初始元素在所述语义空间中对应的初始向量;然后基于构建的坍缩知识图谱,对所述原始知识图谱进行处理,得到锚实体a以及第二概念集合,其中,所述锚实体与所述锚实体对应的概念构成的参数规模不大于所述初始实体集合的参数规模;所述第二概念集合为在所述第一概念集合中,根据与所述锚实体对应的概念的相关性排序,获取的相关性符合预设条件,且引入外部语义知识库后得到的概念集合;其次以所述锚实体、所述第二概念集合以及所述初始关系集合,生成词表;最后通过目标架构框架,基于所述词表,以及所述锚实体与目标实体的距离向量,对所述目标实体进行更新,生成目标实体向量,并通过对三元组中的缺失元素进行推理,输出推理结果。

20、应用本说明书实施例提供的方法,以坍缩知识图谱模型得到的锚实体和第二概念集合置换原始知识图谱中的初始实体集合,实现对知识图谱补全模型的简化,一方面“做减法(剔除)”,即大幅度降低实体向量的数量;另一方面“做加法(补充)”,即引入外部语义知识库中高质量、离散化、结构化的概念,来弥补上述“做减法”带来的知识图谱补全准确率的损失;最终实现在降低知识图谱补全模型参数规模的情况下,尽可能保障知识图谱补全模型的性能,实现知识图谱补全任务中存储(及计算)复杂度与模型性能的平衡,最终实现对传统知识图谱补全模型的简化。

21、上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1