基于知识图谱嵌入表示的预测方法、装置和计算机设备与流程

文档序号:25055921发布日期:2021-05-14 13:58阅读:155来源:国知局
基于知识图谱嵌入表示的预测方法、装置和计算机设备与流程

1.本申请涉及知识图谱技术领域,特别是涉及一种基于知识图谱嵌入表示的预测方法、装置、计算机设备和存储介质。


背景技术:

2.随着人工智能技术的发展,出现了用于语义分析和推理预测功能的知识图谱技术。为了更好地运用知识图谱对语义和关系进行处理,一般需要对知识图谱中的实体和关系进行嵌入表示,便于快速准确地对语义进行分析和预测。传统基于知识图谱嵌入表示的预测方法,通常是通过转移距离模型或语义匹配模型,对实体和关系进行转换和表示,为后续语义分析和推理预测提供基础。
3.然而,传统基于知识图谱嵌入表示的预测方法,通常是对不同的实体和关系进行统一的平移或分析,当头实体、尾实体不对等时,无法兼顾头实体、尾实体和关系的特性,无法准确地对相关语义或关系进行分析和预测。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种能够准确地对相关语义或关系进行分析和预测的基于知识图谱嵌入表示的预测方法、装置、计算机设备和存储介质。
5.一种基于知识图谱嵌入表示的预测方法,所述方法包括:
6.获取基于语义知识和关联关系的目标知识图谱,以及获取所述目标知识图谱中的三元组,所述三元组包括第一实体、第二实体和目标关系;
7.获取所述目标关系对应的第一法向量和第二法向量,以及获取基于所述第一实体、所述第二实体和所述目标关系形成的关系矩阵;
8.按照所述第一法向量确定出所述第一实体对应的第一映射实体,按照所述第二法向量确定出所述第二实体对应的第二映射实体,按照所述关系矩阵对应的循环矩阵确定出所述目标关系对应的实体关系映射向量;
9.按照预设的打分函数,对所述第一映射实体、所述第二映射实体和所述实体关系映射向量进行训练,得到所述第一映射实体对应的第一嵌入实体、所述第二映射实体对应的第二嵌入实体和所述目标关系对应的目标嵌入关系;
10.应用所述第一嵌入实体、所述第二嵌入实体和所述目标嵌入关系,对所述目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
11.在其中一个实施例中,所述获取基于语义知识和关联关系的目标知识图谱,包括:
12.若所述第一实体与第二实体之间的反向关系与所述目标关系不一致,或所述第一实体对应的语义类别与所述第二实体对应的语义类别不一致,或所述第一实体或所述第二实体对应的出度或入度不一致,或所述目标关系连接对应的第一实体数量与对应的第二实体数量不一致,则将所述第一实体与所述第二实体对应的知识图谱确定为所述目标知识图谱。
13.在其中一个实施例中,所述按照所述第一法向量确定出所述第一实体对应的第一映射实体,按照所述第二法向量确定出所述第二实体对应的第二映射实体,按照所述关系矩阵对应的循环矩阵确定出所述目标关系对应的实体关系映射向量,包括:
14.将所述第一实体映射至所述第一法向量对应的第一超平面,得到第一映射实体;
15.将所述第二实体映射至所述第二法向量对应的第二超平面,得到第二映射实体;
16.对于所述目标关系,通过所述关系矩阵对应的循环矩阵,对所述第一实体、所述第二实体进行映射,得到所述目标关系对应的实体关系映射向量。
17.在其中一个实施例中,所述循环矩阵的获取方式,包括:
18.对所述关系矩阵中的元素进行平移,得到所述循环矩阵。
19.在其中一个实施例中,所述预设的打分函数包括第一打分函数和第二打分函数;
20.所述按照预设的打分函数,对所述第一映射实体、所述第二映射实体和所述实体关系映射向量进行训练,得到所述第一映射实体对应的第一嵌入实体、所述第二映射实体对应的第二嵌入实体和所述目标关系对应的目标嵌入关系,包括:
21.按照所述第一打分函数,对所述第一映射实体、所述第二映射实体进行训练,得到所述第一映射实体对应的第一嵌入实体和所述第二映射实体对应的第二嵌入实体;
22.按照所述第二打分函数,对所述目标关系和所述实体关系映射向量进行训练,得到所述目标关系对应的目标嵌入关系。
23.在其中一个实施例中,所述按照所述第一打分函数,对所述第一映射实体、所述第二映射实体进行训练,得到所述第一映射实体对应的第一嵌入实体和所述第二映射实体对应的第二嵌入实体,包括:
24.根据所述第一映射实体和所述目标关系,确定出所述第二实体对应的实体画像;
25.获取所述第二映射实体和所述实体画像之间的相似性;
26.按照所述第一打分函数和所述映射相似性,对所述第一映射实体、所述第二映射实体进行训练,得到所述第一映射实体对应的第一嵌入实体和所述第二映射实体对应的第二嵌入实体。
27.在其中一个实施例中,所述方法还包括:
28.为所述目标知识图谱设置对应的时间窗口,构建基于流式数据的目标知识图谱;
29.按照所述时间窗口,执行所述获取基于语义知识和关联关系的目标知识图谱的步骤,直到得到所述第一嵌入实体、所述第二嵌入实体和所述目标嵌入关系,并应用所述第一嵌入实体、所述第二嵌入实体和所述目标嵌入关系,对基于所述流式数据的目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
30.一种基于知识图谱嵌入表示的预测装置,所述装置包括:
31.第一数据获取模块,用于获取基于语义知识和关联关系的目标知识图谱,以及获取所述目标知识图谱中的三元组,所述三元组包括第一实体、第二实体和目标关系;
32.第二数据获取模块,用于获取所述目标关系对应的第一法向量和第二法向量,以及获取基于所述第一实体、所述第二实体和所述目标关系形成的关系矩阵;
33.映射数据获取模块,用于按照所述第一法向量确定出所述第一实体对应的第一映射实体,按照所述第二法向量确定出所述第二实体对应的第二映射实体,按照所述关系矩阵对应的循环矩阵确定出所述目标关系对应的实体关系映射向量;
34.数据嵌入表示模块,用于按照预设的打分函数,对所述第一映射实体、所述第二映射实体和所述实体关系映射向量进行训练,得到所述第一映射实体对应的第一嵌入实体、所述第二映射实体对应的第二嵌入实体和所述目标关系对应的目标嵌入关系;
35.嵌入预测模块,用于应用所述第一嵌入实体、所述第二嵌入实体和所述目标嵌入关系,对所述目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
36.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例所述的方法。
37.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述的方法。
38.上述基于知识图谱嵌入表示的预测方法、装置、计算机设备和存储介质,通过按照第一法向量确定出第一实体对应的第一映射实体,按照第二法向量确定出第二实体对应的第二映射实体,按照关系矩阵对应的循环矩阵确定出目标关系对应的实体关系映射向量,能够分别针对第一实体、第二实体和目标关系进行独立的映射,兼顾第一实体、第二实体和目标关系的特性,并按照预设的打分函数,对第一映射实体、第二映射实体和实体关系映射向量进行训练,得到第一映射实体对应的第一嵌入实体、第二映射实体对应的第二嵌入实体和目标关系对应的目标嵌入关系,在兼顾第一实体、第二实体和目标关系特性的基础上,应用第一嵌入实体、第二嵌入实体和目标嵌入关系,准确地对目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
附图说明
39.图1为一个实施例中基于知识图谱嵌入表示的预测方法的应用环境图;
40.图2为一个实施例中基于知识图谱嵌入表示的预测方法的流程示意图;
41.图3为一个实施例中步骤s300的一种可实施方式的流程示意图;
42.图4为一个实施例中实体单独映射方法示意图;
43.图5为一个实施例中步骤s400的一种可实施方式的流程示意图;
44.图6为一个实施例中基于知识图谱嵌入表示的预测装置的流程示意图;
45.图7为一个实施例中计算机设备的内部结构图。
具体实施方式
46.为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
47.本申请提供的基于知识图谱嵌入表示的预测方法,可以应用于如图1所示的应用环境中。针对实时收集的多源异构的实时大数据,根据语义知识、关联关系,构建知识图谱,并对知识图谱中的实体和关系进行建模,得到知识图谱的第一嵌入实体、第二嵌入实体和目标嵌入关系,并应用第一嵌入实体、第二嵌入实体和目标嵌入关系,在兼顾第一实体、第二实体和目标关系特性的基础上,应用第一嵌入实体、第二嵌入实体和目标嵌入关系,准确地对目标知识图谱对应的语义知识和关联关系中的至少一种进行预测,根据预测结果进行风险管理。可选地,从实体与关系的语义、结构、数量等方面动态分析知识图谱的特殊性以
及对嵌入表示方法的影响。根据流式知识图谱头实体(第一实体)、尾实体(第二实体)动态变化的不对等特征,依据实体和关系的相互作用,设计基于滑动窗口的动态互相关知识图谱嵌入表示算法;并在窗口内部采用自适应学习率降低不对等特征对模型学习的影响。示例地,以上述方法应用于保险领域为例进行说明,为提高保险行业核保核赔工作的效率和精准性,进一步防止道德风险和逆选择事件,需要融合外部数据源,构建保险行业的知识图谱。首先,多源异构的实时大数据涉及到结构化、半结构和非结构数据,且需要快速处理实时到来的数据;此外,需构筑基于语义知识和关联关系的知识图谱,利用不同的场景化应用动态构建专家决策的推理规则。并依据实体和关系的相互作用,分析头实体、尾实体动态变化的不对等特征,采用头实体、尾实体独立建模的嵌入表示算法和基于循环矩阵的嵌入表示算法,以可实现针对易变数据流的融合处理。
48.在一个实施例中,如图2所示,提供了一种基于知识图谱嵌入表示的预测方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
49.步骤s100,获取基于语义知识和关联关系的目标知识图谱,以及获取目标知识图谱中的三元组,三元组包括第一实体、第二实体和目标关系。
50.步骤s200,获取目标关系对应的第一法向量和第二法向量,以及获取基于第一实体、第二实体和目标关系形成的关系矩阵。
51.步骤s300,按照第一法向量确定出第一实体对应的第一映射实体,按照第二法向量确定出第二实体对应的第二映射实体,按照关系矩阵对应的循环矩阵确定出目标关系对应的实体关系映射向量。
52.步骤s400,按照预设的打分函数,对第一映射实体、第二映射实体和实体关系映射向量进行训练,得到第一映射实体对应的第一嵌入实体、第二映射实体对应的第二嵌入实体和目标关系对应的目标嵌入关系。
53.步骤s500,应用第一嵌入实体、第二嵌入实体和目标嵌入关系,对目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
54.其中,目标知识图谱是指需要进行嵌入表示,并根据嵌入表示进行语义知识和/或关联关系预测的知识图谱。
55.具体地,获取目标知识图谱,为目标知识图谱中的目标关系设置对应的两个法向量,第一法向量和第二法向量。按照第一法向量确,对第一实体进行映射,得到第一映射实体。按照第二法向量确,对第二实体进行映射,得到第二映射实体。按照关系矩阵对应的循环矩阵,确定出目标关系对应的实体关系映射向量。其中,针对第一实体、第二实体和目标关系进行独立的映射,得到的第一映射实体、第二映射实体和实体关系映射向量能够兼顾第一实体、第二实体和目标关系各自的特性。接着,按照预设的打分函数,对第一映射实体、第二映射实体和实体关系映射向量进行训练,在打分函数的约束下,得到第一映射实体对应的第一嵌入实体、第二映射实体对应的第二嵌入实体和目标关系对应的目标嵌入关系。最后,应用第一嵌入实体、第二嵌入实体和目标嵌入关系,对目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
56.上述基于知识图谱嵌入表示的预测方法,通过按照第一法向量确定出第一实体对
应的第一映射实体,按照第二法向量确定出第二实体对应的第二映射实体,按照关系矩阵对应的循环矩阵确定出目标关系对应的实体关系映射向量,能够分别针对第一实体、第二实体和目标关系进行独立的映射,兼顾第一实体、第二实体和目标关系的特性,并按照预设的打分函数,对第一映射实体、第二映射实体和实体关系映射向量进行训练,得到第一映射实体对应的第一嵌入实体、第二映射实体对应的第二嵌入实体和目标关系对应的目标嵌入关系,在兼顾第一实体、第二实体和目标关系特性的基础上,应用第一嵌入实体、第二嵌入实体和目标嵌入关系,准确地对目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
57.在一个实施例中,为步骤s100的一种可实施方式,包括:
58.若第一实体与第二实体之间的反向关系与目标关系不一致,或第一实体对应的语义类别与第二实体对应的语义类别不一致,或第一实体或第二实体对应的出度或入度不一致,或目标关系连接对应的第一实体数量与对应的第二实体数量不一致,则将第一实体与第二实体对应的知识图谱确定为目标知识图谱。
59.具体地,本实施例是对头实体、尾实体不对等的知识图谱进行的识别,通常情况下若第一实体与第二实体之间的反向关系与目标关系(正向关系)不一致,或第一实体对应的语义类别与第二实体对应的语义类别不一致,或第一实体或第二实体对应的出度或入度不一致,或目标关系连接对应的第一实体数量与对应的第二实体数量不一致,则认为该知识图谱是头实体、尾实体不对等的知识图谱,则将该知识图谱确定为目标知识图谱。
60.具体地,头实体、尾实体不对等的情况如下:给定知识图谱g={<h,r,t,τ>|h,t∈e,r∈r,τ∈ω},其中,h代表第一实体(头实体),t代表第二实体(尾实体),r代表目标关系、τ代表时间戳。e表示实体集,r表示关系集,ω表示滑动窗口的窗口大小。在窗口时间ω内,假设r
‑1表示关系r的反向关系,实体e的出度节点为(e
i
,r
x
),实体e的入度节点为(r
y
,e
j
),(e
i
,r
x
)的个数分为实体e的出度n
od
(e),(r
y
,e
j
)的个数分为实体e的入度n
in
(e)。若知识图谱满足如下三个条件之一,即该知识图谱具有不对等特征,为目标知识图谱。条件一:头实体、尾实体的语义异构:对于关系r,或者表示与关系r链接的所有头实体的语义类别和s
tr
表示与关系r链接的所有尾实体的语义类别。条件二:头实体、尾实体的局部知识结构异构:对于四元组<h,r,t,τ>,或者或者条件三:头实体、尾实体数量异构:对于关系r,或者在知识图谱g中,其中,|h
r
|表示关系r链接的头实体数,|tr|表示关系r链接的尾实体数,|h|表示知识图谱中所有头实体的数量和|t|表示知识图谱中所有尾实体的数量。其中,应对头实体、尾实体不对等特征的关键在于:正确区分头实体、尾实体,从整体角度还是个体角度区分头实体、尾实体;建模实体与关系的交互,捕捉实体和关系之间的相互作用。
61.上述实施例中,通过知识图谱自身的特性,确定出了具有不对等特征的目标知识图谱,为后续对目标知识图谱中的实体和关系进行单独嵌入表示提供数据基础。
62.在一个实施例中,如图3所示,为步骤s300的一种可实施方式,包括:
63.步骤310,将第一实体映射至第一法向量对应的第一超平面,得到第一映射实体。
64.步骤320,将第二实体映射至第二法向量对应的第二超平面,得到第二映射实体。
65.步骤330,对于目标关系,通过关系矩阵对应的循环矩阵,对第一实体、第二实体进
行映射,得到目标关系对应的实体关系映射向量。
66.其中,超平面是n维欧氏空间中余维度等于一的线性子空间,第一法向量与第一超平面对应,第二法向量与第二超平面对应。
67.具体地,关于第一映射实体和第二映射实体的确定方式如下:
68.实体(第一实体或第二实体)和关系(目标关系)都有语义且语义有远近之分。通常情况下,在一个滑动窗口内部,不同关系的语义不同且链接的实体的语义也有差别,而同种关系链接的实体语义接近。如公式1所示,为每个关系的头实体(第一实体)和尾实体(第二实体)分别给一个作用函数。
[0069][0070]
其中,和是作用函数,可以是权重、向量、矩阵或者其他函数,表示相应的对h的操作,或对t的操作。实体的嵌入表示可通过以下三个步骤完成:一、对实体、关系统一计算二、利用头实体和关系的映射关系,为计算尾实体做准备,即计算三、计算对头实体、尾实体操作的相似性,即设置打分函数在平移模型中sim()=||||l1,l2是一阶或二阶距离。
[0071]
为对头实体和尾实体进行独立建模,如图4所示,为实体单独映射方法示意图,该实体单独映射方法具有普适性(universality),该平移模型可以计为transu,该transu模型可以应用于头实体、尾实体不对等的知识图谱,也可以用于头实体、尾实体对等的知识图谱。该transu模型体现在每个关系r采用2个法向量,将第一法向量wrh分配给头实体,将第二法向量wrt分配给尾实体,以区分二者的不对等特征。
[0072]
在滑动窗口内部,对实体(第一实体和第二实体)、关系(目标关系)统一成像。基于超平面映射原理,关系r所成的像为r向量,头实体h、尾实体t所处的像是超平面映射得到的向量,图4中由超平面映射原理可得的计算公式如公式2所示:
[0073][0074]
可选地,对关系矩阵中的元素进行平移,得到循环矩阵。关于循环矩阵和实体关系映射向量的确定方式如下:
[0075]
在滑动窗口内,需要实体和关系进行细粒度交互时,主要表现在实体和关系映射这一步。因此,采用循环矩阵作为函数获取实体和关系的交互。循环矩阵中的每一行相对于前一行向量向左或向右移动一个元素。因此,它可以分为左循环矩阵、右循环矩阵,分别表示为a
l
=circl(a)和a
r
=circr(a),其中a是第一行向量,为循环向量。
[0076]
左循环矩阵的元素由公式(3)表示,右循环矩阵的元素由公式(4)表示,左循环矩阵和右循环矩阵之间的转换关系如公式(5)所示。
[0077][0078][0079]
[0080]
上述实施例中,分别对第一实体、第二实体和目标关系进行单独映射,得到第一实体对应的第一映射实体、第二实体对应的第二映射实体和目标关系对应的实体关系映射向量。上述单独映射方式,能够保留第一实体、第二实体和目标关系各自的特性,为后续知识图谱嵌入提供数据基础,以准确地对目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
[0081]
在一个实施例中,如图5所示,为步骤s400的一种可实施方式,包括:
[0082]
步骤s410,按照第一打分函数,对第一映射实体、第二映射实体进行训练,得到第一映射实体对应的第一嵌入实体和第二映射实体对应的第二嵌入实体。
[0083]
步骤s420,按照第二打分函数,对目标关系和实体关系映射向量进行训练,得到目标关系对应的目标嵌入关系。
[0084]
其中,预设的打分函数包括第一打分函数和第二打分函数。
[0085]
可选地,根据第一映射实体和目标关系,确定出第二实体对应的实体画像;获取第二映射实体和实体画像之间的相似性;按照第一打分函数和映射相似性,对第一映射实体、第二映射实体进行训练,得到第一映射实体对应的第一嵌入实体和第二映射实体对应的第二嵌入实体。
[0086]
具体地,对于实体,首先,利用头实体和关系的映射为尾实体做画像(第二实体对应的实体画像),将h

和r的线性操作看作t

的映射t
mapping
,根据向量空间的平行四边形法则可得:
[0087]
t
mapping
=h

+r
ꢀꢀꢀ
(6)
[0088]
其中,h为第一实体,t为第二实体,h

为第一映射实体,t

为第二映射实体。
[0089]
接着,计算头实体(第一实体)、尾实体(第二实体)操作的相似性(第二映射实体和实体画像之间的相似性)。采用l1,l2

norm计算尾实体t

与计算得到的映射t
mapping
之间的相似性,具体如公式(7)所示:
[0090][0091]
在滑动窗口内部,由于transu模型需要h

和t

可以通过超平面上的关系向量r,以低误差的方式连接,满足公式(2)、公式(3)、公式(7)。所以,打分函数可以公式(8)表示。
[0092][0093]
将公式(8)的第一打分函数转化为带约束(如公式(9))的最小化问题,然后进行训练。
[0094][0095]
为应对不频繁出现的实体训练时间较长的问题,可以采用具有自适应能力的adadelta训练模型。该模型可以使用平方梯度的指数衰减平均值e[g2]和平方更新e[δ2]来加大近期的梯度和更新。
[0096]
对于关系,在一个滑动窗口内部,设置基于循环矩阵的自适应学习模型。对于每个四元组<h,r,t,τ>,设定实体嵌入表示e={h,t}∈e
n
,关系嵌入表示为r∈r
n
。对于每个r,通过循环矩阵a∈r
n
×
m
或a∈r
m
×
n
(m>n),对实体向量e做映射,得到向量e
r
。这里,令a
er
为右循环矩阵,左循环矩阵同理,第二打分函数如公式(10)所示:
[0097][0098]
在训练阶段,基于循环矩阵的打分函数f
r
(h,t)可以转化为带约束的最小化问题,可以选取具有自适应能力的adadelta模型以优化求解。
[0099]
通过上述公式(9)对应的第一打分函数的优化,可以得到第一映射实体对应的第一嵌入实体和第二映射实体对应的第二嵌入实体。通过上述公式(10)对应的第二打分函数,可以得到目标关系对应的目标嵌入关系。第一嵌入实体、第二嵌入实体、目标嵌入关系为目标知识图谱对应的嵌入表示,该知识图谱嵌入表示能够兼顾第一实体、第二实体和目标关系的特性,应用第一嵌入实体、第二嵌入实体和目标嵌入关系,准确地对目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
[0100]
上述实施例中,通过打分函数对知识图谱嵌入表示第一嵌入实体、第二嵌入实体、目标嵌入关系进行优化,该知识图谱嵌入表示能够兼顾第一实体、第二实体和目标关系的特性,应用第一嵌入实体、第二嵌入实体和目标嵌入关系,准确地对目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
[0101]
在一实施例中,基于知识图谱嵌入表示的预测方法还包括:
[0102]
为目标知识图谱设置对应的时间窗口,构建基于流式数据的目标知识图谱;按照时间窗口,执行获取基于语义知识和关联关系的目标知识图谱的步骤,直到得到第一嵌入实体、第二嵌入实体和目标嵌入关系,并应用第一嵌入实体、第二嵌入实体和目标嵌入关系,对基于流式数据的目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
[0103]
具体地,为满足知识图谱对应的数据流的动态变化,为目标知识图谱设置对应的时间窗口,构建基于流式数据的目标知识图谱。在进行知识图谱嵌入时,可以按照时间窗口,执行获取基于语义知识和关联关系的目标知识图谱的步骤,并获取目标关系对应的第一法向量和第二法向量,以及获取基于第一实体、第二实体和目标关系形成的关系矩阵,按照第一法向量确定出第一实体对应的第一映射实体,按照第二法向量确定出第二实体对应的第二映射实体,按照关系矩阵对应的循环矩阵确定出目标关系对应的实体关系映射向量,按照预设的打分函数,对第一映射实体、第二映射实体和实体关系映射向量进行训练,得到第一映射实体对应的第一嵌入实体、第二映射实体对应的第二嵌入实体和目标关系对应的目标嵌入关系,并应用第一嵌入实体、第二嵌入实体和目标嵌入关系,对基于流式数据的目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。上述实施例中的τ代表时间戳,ω为时间窗口。通过,时间窗口ω的设置,可以实现基于流式知识图谱的嵌入表示。
[0104]
上述实施例中,通过时间窗口的设置方式,可以对不断变化的数据流进行知识图谱的嵌入表示,并在知识图谱嵌入表示的基础上,实现对基于流式数据的目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
[0105]
应该理解的是,虽然图1

3、5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1

3、5中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执
行。
[0106]
在一个实施例中,如图6所示,提供了一种基于知识图谱嵌入表示的预测装置,包括:第一数据获取模块601、第二数据获取模块602、映射数据获取模块603、数据嵌入表示模块604和嵌入预测模块605,其中:
[0107]
第一数据获取模块601,用于获取基于语义知识和关联关系的目标知识图谱,以及获取目标知识图谱中的三元组,三元组包括第一实体、第二实体和目标关系;
[0108]
第二数据获取模块602,用于获取目标关系对应的第一法向量和第二法向量,以及获取基于第一实体、第二实体和目标关系形成的关系矩阵;
[0109]
映射数据获取模块603,用于按照第一法向量确定出第一实体对应的第一映射实体,按照第二法向量确定出第二实体对应的第二映射实体,按照关系矩阵对应的循环矩阵确定出目标关系对应的实体关系映射向量;
[0110]
数据嵌入表示模块604,用于按照预设的打分函数,对第一映射实体、第二映射实体和实体关系映射向量进行训练,得到第一映射实体对应的第一嵌入实体、第二映射实体对应的第二嵌入实体和目标关系对应的目标嵌入关系;
[0111]
嵌入预测模块605,用于应用第一嵌入实体、第二嵌入实体和目标嵌入关系,对目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
[0112]
在其中一个实施例中,第一数据获取模块601还用于执行若第一实体与第二实体之间的反向关系与目标关系不一致,或第一实体对应的语义类别与第二实体对应的语义类别不一致,或第一实体或第二实体对应的出度或入度不一致,或目标关系连接对应的第一实体数量与对应的第二实体数量不一致,则将第一实体与第二实体对应的知识图谱确定为目标知识图谱。
[0113]
在其中一个实施例中,映射数据获取模块603还用于将第一实体映射至第一法向量对应的第一超平面,得到第一映射实体;将第二实体映射至第二法向量对应的第二超平面,得到第二映射实体;对于目标关系,通过关系矩阵对应的循环矩阵,对第一实体、第二实体进行映射,得到目标关系对应的实体关系映射向量。
[0114]
在其中一个实施例中,映射数据获取模块603还用于对关系矩阵中的元素进行平移,得到循环矩阵。
[0115]
在其中一个实施例中,预设的打分函数包括第一打分函数和第二打分函数;映射数据获取模块603还用于按照第一打分函数,对第一映射实体、第二映射实体进行训练,得到第一映射实体对应的第一嵌入实体和第二映射实体对应的第二嵌入实体;按照第二打分函数,对目标关系和实体关系映射向量进行训练,得到目标关系对应的目标嵌入关系。
[0116]
在其中一个实施例中,数据嵌入表示模块604还用于根据第一映射实体和目标关系,确定出第二实体对应的实体画像;获取第二映射实体和实体画像之间的相似性;按照第一打分函数和映射相似性,对第一映射实体、第二映射实体进行训练,得到第一映射实体对应的第一嵌入实体和第二映射实体对应的第二嵌入实体。
[0117]
在其中一个实施例中,基于知识图谱嵌入表示的预测装置还包括数据流确定模块,用于为目标知识图谱设置对应的时间窗口,构建基于流式数据的目标知识图谱;按照时间窗口,执行获取基于语义知识和关联关系的目标知识图谱的步骤,直到得到第一嵌入实体、第二嵌入实体和目标嵌入关系,并应用第一嵌入实体、第二嵌入实体和目标嵌入关系,
对基于流式数据的目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
[0118]
关于基于知识图谱嵌入表示的预测装置的具体限定可以参见上文中对于基于知识图谱嵌入表示的预测方法的限定,在此不再赘述。上述基于知识图谱嵌入表示的预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0119]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过wifi、运营商网络、nfc(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种基于知识图谱嵌入表示的预测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
[0120]
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0121]
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
[0122]
获取基于语义知识和关联关系的目标知识图谱,以及获取目标知识图谱中的三元组,三元组包括第一实体、第二实体和目标关系;
[0123]
获取目标关系对应的第一法向量和第二法向量,以及获取基于第一实体、第二实体和目标关系形成的关系矩阵;
[0124]
按照第一法向量确定出第一实体对应的第一映射实体,按照第二法向量确定出第二实体对应的第二映射实体,按照关系矩阵对应的循环矩阵确定出目标关系对应的实体关系映射向量;
[0125]
按照预设的打分函数,对第一映射实体、第二映射实体和实体关系映射向量进行训练,得到第一映射实体对应的第一嵌入实体、第二映射实体对应的第二嵌入实体和目标关系对应的目标嵌入关系;
[0126]
应用第一嵌入实体、第二嵌入实体和目标嵌入关系,对目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
[0127]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:若第一实体与第二实体之间的反向关系与目标关系不一致,或第一实体对应的语义类别与第二实体对应的语义类别不一致,或第一实体或第二实体对应的出度或入度不一致,或目标关系连接对应的第一实体数量与对应的第二实体数量不一致,则将第一实体与第二实体对应的知识图谱确定为目标知识图谱。
[0128]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将第一实体映射至
第一法向量对应的第一超平面,得到第一映射实体;将第二实体映射至第二法向量对应的第二超平面,得到第二映射实体;对于目标关系,通过关系矩阵对应的循环矩阵,对第一实体、第二实体进行映射,得到目标关系对应的实体关系映射向量。
[0129]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对关系矩阵中的元素进行平移,得到循环矩阵。
[0130]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:按照第一打分函数,对第一映射实体、第二映射实体进行训练,得到第一映射实体对应的第一嵌入实体和第二映射实体对应的第二嵌入实体;按照第二打分函数,对目标关系和实体关系映射向量进行训练,得到目标关系对应的目标嵌入关系。
[0131]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据第一映射实体和目标关系,确定出第二实体对应的实体画像;获取第二映射实体和实体画像之间的相似性;按照第一打分函数和映射相似性,对第一映射实体、第二映射实体进行训练,得到第一映射实体对应的第一嵌入实体和第二映射实体对应的第二嵌入实体。
[0132]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:为目标知识图谱设置对应的时间窗口,构建基于流式数据的目标知识图谱;按照时间窗口,执行获取基于语义知识和关联关系的目标知识图谱的步骤,直到得到第一嵌入实体、第二嵌入实体和目标嵌入关系,并应用第一嵌入实体、第二嵌入实体和目标嵌入关系,对基于流式数据的目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
[0133]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
[0134]
获取基于语义知识和关联关系的目标知识图谱,以及获取目标知识图谱中的三元组,三元组包括第一实体、第二实体和目标关系;
[0135]
获取目标关系对应的第一法向量和第二法向量,以及获取基于第一实体、第二实体和目标关系形成的关系矩阵;
[0136]
按照第一法向量确定出第一实体对应的第一映射实体,按照第二法向量确定出第二实体对应的第二映射实体,按照关系矩阵对应的循环矩阵确定出目标关系对应的实体关系映射向量;
[0137]
按照预设的打分函数,对第一映射实体、第二映射实体和实体关系映射向量进行训练,得到第一映射实体对应的第一嵌入实体、第二映射实体对应的第二嵌入实体和目标关系对应的目标嵌入关系;
[0138]
应用第一嵌入实体、第二嵌入实体和目标嵌入关系,对目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
[0139]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:若第一实体与第二实体之间的反向关系与目标关系不一致,或第一实体对应的语义类别与第二实体对应的语义类别不一致,或第一实体或第二实体对应的出度或入度不一致,或目标关系连接对应的第一实体数量与对应的第二实体数量不一致,则将第一实体与第二实体对应的知识图谱确定为目标知识图谱。
[0140]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将第一实体映射至第一法向量对应的第一超平面,得到第一映射实体;将第二实体映射至第二法向量对应
的第二超平面,得到第二映射实体;对于目标关系,通过关系矩阵对应的循环矩阵,对第一实体、第二实体进行映射,得到目标关系对应的实体关系映射向量。
[0141]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对关系矩阵中的元素进行平移,得到循环矩阵。
[0142]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:按照第一打分函数,对第一映射实体、第二映射实体进行训练,得到第一映射实体对应的第一嵌入实体和第二映射实体对应的第二嵌入实体;按照第二打分函数,对目标关系和实体关系映射向量进行训练,得到目标关系对应的目标嵌入关系。
[0143]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据第一映射实体和目标关系,确定出第二实体对应的实体画像;获取第二映射实体和实体画像之间的相似性;按照第一打分函数和映射相似性,对第一映射实体、第二映射实体进行训练,得到第一映射实体对应的第一嵌入实体和第二映射实体对应的第二嵌入实体。
[0144]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:为目标知识图谱设置对应的时间窗口,构建基于流式数据的目标知识图谱;按照时间窗口,执行获取基于语义知识和关联关系的目标知识图谱的步骤,直到得到第一嵌入实体、第二嵌入实体和目标嵌入关系,并应用第一嵌入实体、第二嵌入实体和目标嵌入关系,对基于流式数据的目标知识图谱对应的语义知识和关联关系中的至少一种进行预测。
[0145]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read

only memory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。
[0146]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0147]
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1