技术特征:
1.一种基于自监督学习的动态图表示学习方法,其特征在于,包括如下步骤:s1、在图中以任意节点作为中心节点,分别采样得到时空子图、非时序子图以及非空间子图;s2、利用时空权重编码器,捕获图中的时间和空间信息,得到对应节点的节点表征和子图的图级别表征;s3、通过对比学习方法最大化节点表征和子图的图级别表征之间的互信息来学习节点的表征,分别从时间和空间的角度定义总损失函数;s4、通过总损失函数完成时空权重编码器的训练,最后将动态图中所有的节点送入训练好的时空权重编码器中,得到动态图的节点表征。2.如权利要求1所述的基于自监督学习的动态图表示学习方法,其特征在于,步骤s1的具体步骤为:给定动态图其中v代表边的集合,是一系列边的集合,在图中存在边e=(v,w,t)∈e
t
表示节点v和节点w在t时刻产生的边,代表一个能够将每条边映射到一个时间戳的函数;对时空子图g
v
的采样包括以下两个步骤:初始边选择以及时空随机游走。3.如权利要求2所述的基于自监督学习的动态图表示学习方法,其特征在于:在初始边选择步骤中,以节点v为中心节点进行采样;采样包括无偏采样和有偏采样;对于无偏采样,定义节点v周围的所有边集合为ψ
v
,使用一种均匀分布的采样方式对初始边进行采样;边e=(v,w,t)∈ψ
v
被选中的概率定义为:对于有偏采样,认定节点v周围的所有边具有不同概率被选中;有偏采样根据边缘出现的时间为边缘分配不同的采样概率;具体来说,边e=(v,w,t)∈ψ
v
被选中的概率定义为:其中,e
′
∈ψ
v
表示任意一条与中心节点v相连的边,为边e
′
对应的时间,表示边e所对应的时间,t
min
是与动态图中的边相关联的最小时间。4.如权利要求2所述的基于自监督学习的动态图表示学习方法,其特征在于:时空随机游走步骤的主要任务是选择下一个节点;下一个节点从时空邻居集合γ中选择;时空邻居集合定义为:其中,γ
t
(v)表示节点v在时间t的时空邻居集合,w表示与节点v相邻的节点,t
′
表示节点w和节点v之间的边上的时间;时空随机游走包括有偏时空随机游走和无偏时空随机游走;对于无偏时空随机游走,给定任意边e=(u,v,t),节点v在时间t的时空邻居w∈γ
t
(v)被选中的概率如下:
对于有偏时空随机游走,节点v在时间t的时空邻居w∈γ
t
(v)被选中的概率为:其中,w
′
表示表示节点v在时间t的任意时空邻居,δ(w)为节点w对应的时间,δ(w
′
)为节点w
′
对应的时间。5.如权利要求2所述的基于自监督学习的动态图表示学习方法,其特征在于:引用随机游走的思想,在采样时不考虑时间因素进行采样;以节点v为中心节点进行随机游走以采样非时序子图并且以节点o为中心节点进行时空随机游走,得到非空间子图g
o
。6.如权利要求1所述的基于自监督学习的动态图表示学习方法,其特征在于,步骤s2的具体步骤为:时空权重编码器包括时间聚合器和空间聚合器;对于时间聚合器,当发生了涉及节点本身的事件时,节点v在时间t的时序表征z
v
(t)表示为:z
v
(t)=lstm(f
(v,w)
(t),h
v
(t-))其中,lstm表示为lstm模型,f
(v,w)
(t)表示节点v和w之间在t时刻的交互特征,h
v
(t-)是节点v上一次更新的时间;空间聚合器用于合并时空邻居的表征信息,能够根据邻居节点的不同出现时间分配不同的权重;节点v在时间t的空间表征定义如下:其中,w∈neighbor表示与节点v相连的节点w,表示计算当前时间t与时间t
w
间距的时间编码,z
w
(t)是节点w在t时刻的时序表征,w1是可学习参数;最终,通过聚合时序表征z
v
(t)和空间表征得到节点v在时间t的节点表征h
v
(t):其中,w2是可学习参数;非时序子图的图级别表征以及非空间子图g
o
的图级别表征s
o
通过时空权重编码器获得;时空子图的图级别表征s
v
通过readout函数获得。7.如权利要求1所述的基于自监督学习的动态图表示学习方法,其特征在于,步骤s3的具体步骤为:通过对比正负样本,以进行时空权重编码器的训练;对比学习目标是区分时空子图、非时序子图以及非空间子图;对于正样本的选择,将时空子图的节点表征和时空子图的图级别表征构成正样本;将非时序子图的图级别表征和时空子图g
v
的节点表征h
v
构成时间负样本,时间负样本的损失函数定义为:
其中,σ表示sigmoid函数,φ为边际值,表示期望函数,s
v
为时空子图的图级别表征,h
v
为时空子图中节点v的节点表征,为非时序子图的图级别表征;将非空间子图g
o
的图级别表征s
o
和时空子图g
v
的节点表征h
v
构成空间负样本;空间负样本的损失函数定义为:其中,σ是sigmoid函数,是边际值,表示期望函数,s
v
为时空子图的图级别表征,h
v
为时空子图中节点v的节点表征,s
o
为非空间子图的图级别表征;时空权重编码器的总损失函数为:其中λ为总损失函数的平衡参数。
技术总结
本发明涉及一种基于自监督学习的动态图表示学习方法,包括:对动态图进行采样,分别得到时空子图、非时序子图、非空间子图;利用时空权重编码器分别得到三个子图的节点级以及图级别的表征;设计时空对比学习,分别从时间和空间的角度定义总损失函数;通过总损失函数完成时空权重编码器的训练,最后将动态图中所有的节点送入训练好的时空权重编码器中,得到动态图的节点表征,并将其应用到动态图模型类应用场景中分类、推荐、链路预测等任务中。本发明融合了动态图的时间和空间信息,增强了动态图表示方法的性能;具有良好的可解释性、可验证性、表征性能和可迁移性。并且本发明在现实中可以应用于电商网络,用以预测用户可能购买的商品。商品。商品。
技术研发人员:鲍鹏 李家年
受保护的技术使用者:北京交通大学
技术研发日:2022.04.28
技术公布日:2022/9/6