本发明涉及人工智能,尤其涉及一种知识图谱构建方法、装置、设备及存储介质。
背景技术:
1、在金融领域中,随着金融交易的复杂性和数据量的急剧增长,如何有效地管理和分析这些数据变得至关重要。传统的金融数据分析方法往往依赖于规则驱动或统计模型,这些方法在处理复杂的金融关系网络时面临诸多挑战,尤其是在分析多关系、多维度的金融交易数据时。这些数据通常涉及到多个实体(如客户、账户、企业等)之间的交互,并且这些交互具有高度的时间和方向性动态特征。
2、为了更好地理解和管理这些复杂的金融关系网络,知识图谱作为一种新兴的技术手段被引入到金融数据分析中。知识图谱能够以图结构形式表示实体及其之间的关系,通过将数据中的实体表示为节点,关系表示为边,形成一个完整的网络图谱。这种图谱不仅可以帮助识别和分析实体之间的直接关系,还能够通过推理和推断发现潜在的复杂关系。
3、然而,现有的知识图谱构建方法在处理金融交易中的动态特征(如时间特征和方向特征)时存在一定的局限性。例如,传统方法往往难以有效地捕捉资金流向的变化以及时间维度上关系的演变,这在反洗钱、风险管理和资金流向分析等应用中至关重要。为了克服这些挑战,需要在知识图谱的构建过程中引入更为先进的特征处理和优化技术,如图神经网络(gnn),以增强知识图谱在复杂金融环境中的应用效果。
技术实现思路
1、本发明的主要目的在于提供一种知识图谱构建方法、装置、设备及存储介质,旨在解决现有技术无法有效处理实体之间基础关系的时间和方向特征,导致在复杂网络中的动态变化分析和流向识别方面存在不足的技术问题。
2、为实现上述目的,本发明提供一种知识图谱构建方法,包括:
3、基于构建知识图谱的需求,识别并确定参与活动的多个实体类型,定义所述实体类型之间的基础关系;
4、将所述实体类型和所述基础关系以节点和边的形式构建为初始的图结构,形成初步知识图谱;
5、根据所述基础关系的时间特征,创建一个时序特征权重矩阵,将所述时序特征权重矩阵与基础关系的属性一起存储在所述初步知识图谱的图结构中;
6、从每条基础关系中提取方向特征,基于提取的方向特征,为基础关系创建一个方向特征矩阵,将方向特征矩阵与基础关系的属性一起存储在所述初步知识图谱的图结构中;
7、对初步知识图谱中的节点和边的多维度特征进行组合和优化,生成更新后的表示,并应用于初步知识图谱中形成目标知识图谱。
8、在一个实施例中,将所述实体类型和所述基础关系以节点和边的形式构建为初始的图结构,形成初步知识图谱,包括:
9、将所述实体类型和所述基础关系以节点和边的形式构建为初始的图结构,形成初步关系网络;
10、将所述初步关系网络扩展为完整的知识图谱结构,确定所述知识图谱中的节点类型和边类型,为每个节点和边分配特征向量,形成知识图谱的基本表示;
11、为每种基础关系创建一个向量表示,包含基础关系的类型信息和时间特征;
12、将基础关系的属性嵌入到所述知识图谱的节点和边表示中,并与节点嵌入进行联合学习,形成所述初步知识图谱。
13、在一个实施例中,将基础关系的属性嵌入到所述知识图谱的节点和边表示中,并与节点嵌入进行联合学习,形成所述初步知识图谱,包括:
14、从每条基础关系中提取关系类型特征,所述关系类型特征用于描述基础关系的具体性质,并被表示为第一embedding向量;
15、从每条基础关系中提取事件发生时间特征,所述事件发生时间特征用于表示基础关系发生的时间顺序或时间点,并被表示为第二embedding向量;
16、将所述第一embedding向量与所述第二embedding向量结合后,与对应节点的embedding向量一同输入到compgcn模型中进行联合学习;
17、通过compgcn模型的联合学习,生成更新后的节点和边的特征表示,将更新后的节点和边的特征表示整合到图结构中,生成所述初步知识图谱。
18、在一个实施例中,对初步知识图谱中的节点和边的多维度特征进行组合和优化,生成更新后的表示,并应用于初步知识图谱中形成目标知识图谱,包括:
19、对所述初步知识图谱中的每个节点和边进行多维度特征的嵌入,将节点和边的属性特征、时间特征、方向特征和关系类型特征进行向量化,形成初始特征表示;
20、将所述初始特征表示输入到compgcn模型中,通过多层图卷积运算,对节点和边的多维度特征进行聚合,以整合节点及其相邻节点和关联边的特征信息;
21、在每一层图卷积运算后,应用非线性激活函数,对聚合后的特征进行激活,提升节点和边的特征表示;
22、经过多层图卷积和非线性激活处理后,将各层输出的特征进行组合,生成更新后的节点和边的表示;
23、将更新后的节点和边的表示重新应用到所述初步知识图谱中,替代原有的表示,最终形成所述目标知识图谱。
24、在一个实施例中,通过多层图卷积运算,对节点和边的多维度特征进行聚合,包括:
25、根据初步知识图谱中的节点和边的多维度特征确定聚合函数;
26、在每一层图卷积运算中,将节点的自身特征与邻居节点的特征进行组合,生成更新后的节点表示,将边的自身特征与其关联节点的特征进行组合,生成更新后的边表示;
27、在多层图卷积运算中,逐层应用聚合函数,每层基于前一层生成的节点和边表示进行新的聚合和更新,逐步优化节点和边的表示,以捕捉更深层次的特征信息。
28、在一个实施例中,将所述实体类型和所述基础关系以节点和边的形式构建为初始的图结构,形成初步知识图谱,包括:
29、将所述实体类型表示为节点,在图结构中为每个实体类型创建相应的节点;
30、将所述基础关系表示为边,在图结构中为每种基础关系创建相应的边;
31、为每条基础关系添加反向关系,在图结构中形成与原始关系相对应的反向边;
32、在图结构中为每个节点增加一条自循环边,以保留节点的自有信息;
33、对反向边和自循环边进行特征向量化处理,将反向边和自循环边表示为向量,并与基础关系的特征向量结合,构建初始的图结构;
34、将所述节点和边的特征向量存储在初始的图结构中,通过整合基础关系、反向边和自循环边,最终形成完整的初步知识图谱。
35、在一个实施例中,从每条基础关系中提取方向特征,基于提取的方向特征,为基础关系创建一个方向特征矩阵,包括:
36、从每条基础关系中提取方向特征,所述方向特征表示资金在关系中的流动方向;
37、将提取的方向特征映射为二进制值,其中0表示无方向性或双向关系,1表示有明确的方向性或单向关系;
38、将映射后的方向特征进行量化处理,转化为能够表示方向性强度或重要性的量化数值,基于量化后的方向特征创建一个方向特征矩阵。
39、进一步地,为实现上述目的,本发明还提供一种知识图谱构建装置,包括:
40、实体与关系定义模块,基于构建知识图谱的需求,识别并确定参与活动的多个实体类型,定义所述实体类型之间的基础关系;
41、初始图结构构建模块,将所述实体类型和所述基础关系以节点和边的形式构建为初始的图结构,形成初步知识图谱;
42、时序特征处理模块,根据所述基础关系的时间特征,创建一个时序特征权重矩阵,将所述时序特征权重矩阵与基础关系的属性一起存储在所述初步知识图谱的图结构中;
43、方向特征处理模块,从每条基础关系中提取方向特征,基于提取的方向特征,为基础关系创建一个方向特征矩阵,将方向特征矩阵与基础关系的属性一起存储在所述初步知识图谱的图结构中;
44、特征组合与优化模块,对初步知识图谱中的节点和边的多维度特征进行组合和优化,生成更新后的表示,并应用于初步知识图谱中形成目标知识图谱。
45、进一步地,为实现上述目的,本发明还提供一种计算机设备,所述计算机设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的知识图谱构建程序,所述知识图谱构建程序被所述处理器执行时实现如上述所述的知识图谱构建方法的步骤。
46、进一步地,为实现上述目的,本发明还提供一种计算机存储介质,所述存储介质上存储有知识图谱构建程序,所述知识图谱构建程序被处理器执行时实现如上所述的知识图谱构建方法的步骤。
47、有益效果:本发明涉及一种知识图谱构建方法,根据构建知识图谱的需求,识别并确定多个参与活动的实体类型,定义所述实体类型之间的基础关系。通过将所述实体类型和基础关系以节点和边的形式构建为初始的图结构,形成初步知识图谱。根据基础关系的时间特征,创建时序特征权重矩阵,将其与基础关系的属性存储在初步知识图谱中。接着,从基础关系中提取方向特征,生成方向特征矩阵,并与其他特征一同存储。对初步知识图谱中的节点和边的多维度特征进行组合和优化,最终生成更新的表示,并形成目标知识图谱。本发明不仅能够动态适应不同场景下的知识需求,还通过时序特征和方向特征的引入,显著提升了知识图谱在时序分析和方向性推理中的表现。