本发明涉及关系补全技术领域,尤其是涉及一种人物关系补全方法、装置及电子设备。
背景技术:
当前在社会公共安全治理任务中,需要建立可疑人物关系网络进行有针对性的可疑人物行为特征分析进而确定可疑人物。但是往往会出现人物关系网络丢失的情况,造成了可疑人物行为特征分析不准确的问题。
技术实现要素:
本发明的目的在于提供了一种人物关系补全方法、装置及电子设备,可以有效提高人物关系分析的准确性。
第一方面,本发明提供了一种人物关系补全方法,其中,包括:
获取人物关系网络,并根据所述人物关系网络建立完整子图人物关系网络集和缺失子图人物关系网络集,基于所述完整子图人物关系网络集构建完整邻接矩阵集,基于所述缺失子图人物关系网络集构建缺失邻接矩阵集;
基于所述完整邻接矩阵集建立补充邻接矩阵集;
根据第一非线性变换函数和线性聚合函数对所述补充邻接矩阵集进行压缩得到特征集;
根据第二非线性变换函数对所述特征集进行重构,得到重构邻接矩阵集;
交替优化关系真伪判别模型与关系重构模型,使得重构邻接矩阵集与完整邻接矩阵集符合相同的空间分布;
根据所述关系重构模型对所述缺失邻接矩阵集进行补全,以使人物关系完整。
进一步的,所述获取人物关系网络,并根据所述人物关系网络建立完整子图人物关系网络集和缺失子图人物关系网络集,基于所述完整子图人物关系网络构建完整邻接矩阵集,基于所述缺失子图人物关系网络构建缺失邻接矩阵集的步骤,包括:
根据广度优先搜索算法对所述人物关系网络进行遍历,构建子图人物关系网络,根据网络缺失情况构建完整子图人物关系网络集以及缺失子图人物关系网络集;
基于完整子图人物关系网络集,建立完整邻接矩阵集;
基于缺失子图人物关系网络集,建立缺失邻接矩阵集。
进一步的,所述基于所述完整邻接矩阵集建立补充邻接矩阵集的步骤,包括:
根据所述完整邻接矩阵集建立掩码矩阵;
将所述完整邻接矩阵集与所述掩码矩阵进行哈达玛乘积,得到补充邻接矩阵集。
进一步的,所述根据第一非线性变换函数和线性聚合函数对所述补充邻接矩阵集进行压缩得到特征集的步骤,包括:
根据所述第一非线性变换函数对所述补充邻接矩阵集进行压缩得到特征空间,其中所述第一非线性变换函数的算式为:
z=tanh(w*x+b)
其中,z为特征空间,w和b为训练参数,x为补充邻接矩阵集,tanh为激活函数;
根据线性聚合函数对所述特征空间进行压缩得到所述特征集。
进一步的,所述第二非线性变换函数的算式为:
p=σ(w'*x′+b')
其中,p为重构邻接矩阵集,w'和b'为训练参数,x′为特征集,σ为激活函数。
进一步的,所述交替优化关系真伪判别模型与关系重构模型,使得重构邻接矩阵集与完整邻接矩阵集符合相同的空间分布的步骤,包括:
根据重构损失算式计算所述重构邻接矩阵集的重构损失,其中,所述重构损失算式为:
lre=σ1||(tk*k*m-p'k*k*m)*mk*k*m||2+σ2||(tk*k*m-p'k*k*m)*(1-mk*k*m)||2
其中,lre为重构损失,σ1为缺失部分的损失权重,σ2缺失部分的重构损失,tk*k*m为完整邻接矩阵集,mk*k*m为掩码矩阵,p'k*k*m为重构邻接矩阵集;
根据所述关系真伪判别模型判断重构后的邻接矩阵集是否符合真实的邻接矩阵集的分布,建立判别损失函数,利用所述判别损失函数计算所述重构邻接矩阵集和完整的邻接矩阵集的判别损失,其中,所述判别损失函数为:
其中,t为完整邻接矩阵集,r为重构邻接矩阵集,j为关系真伪判别模型,用来判断重构后的邻接矩阵集是否符真实邻接矩阵集的分布,v为判别损失;
对关系重构模型和关系真伪判别模型进行交替训练使得联合损失最小,得到最终的关系重构模型,以使完整邻接矩阵集与重构邻接矩阵集符合相同的空间分布。
进一步的,所述关系真伪判别模型的算式为:
j(x″)=σ(tan(w″x″+b″)w″′+b″′)
其中,w″、b″、w″′、b″′均为可训练参数,x″为关系真伪判别模型的输入量。
进一步的,所述联合损失的算式为:
lall=log[(j(t))-log(1-j(r))]+lre
其中,t为完整邻接矩阵集,r为重构邻接矩阵集,j为关系真伪判别模型,lre为重构损失。
第二方面,本发明提供了一种人物关系补全装置,其中,包括:
获取单元,用于获取人物关系网络,构建完整子图人物关系网络集以及缺失子图人物关系网络集,基于所述完整子图人物关系网络集构建完整邻接矩阵集,基于所述缺失子图人物关系网络集构建缺失邻接矩阵集;
补充邻接矩阵集单元,用于基于所述完整邻接矩阵集建立补充邻接矩阵集;
特征集单元,用于根据第一非线性变换函数和线性聚合函数对所述补充邻接矩阵集进行压缩得到特征集;
重构邻接矩阵集单元,用于根据第二非线性变换函数对所述特征集进行重构,得到重构邻接矩阵集;
重构模型单元,用于基于鉴别器模型将所述完整邻接矩阵集与所述重构邻接矩阵集转换为重构模型;
人物关系补全单元,用于根据所述重构模型对所述缺失邻接矩阵集进行补全,以使人物关系完整。
第三方面,本发明提供了一种电子设备,其中,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现第一方面所述的人物关系补全方法的步骤。
第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中,所述计算机程序被处理器运行时执行第一方面所述的人物关系补全方法的步骤。
本发明实施例带来了以下有益效果:
本发明提供了一种人物关系补全方法、装置及电子设备,通过获取人物关系网络,构建完整子图人物关系网络集以及缺失子图人物关系网络集,并根据构建的子图人物关系网络建立完整邻接矩阵集和缺失邻接矩阵集;基于完整邻接矩阵集建立补充邻接矩阵集;根据第一非线性变换函数和线性聚合函数对补充邻接矩阵集进行压缩得到特征集;根据第二非线性变换函数对特征集进行重构,得到重构邻接矩阵集;交替优化关系真伪判别模型与关系重构模型,使得重构邻接矩阵集与完整邻接矩阵集符合相同的空间分布;最终根据关系重构模型对缺失邻接矩阵集进行补全,以使人物关系完整。在本实施例提供的上述方式中,通过获取人物关系网络,并建立完整邻接矩阵集和缺失邻接矩阵集,再基于完整邻接矩阵集建立补充邻接矩阵集,再通过第一非线性变换函数、线性聚合函数和第二非线性变换函数对补充邻接矩阵集进行压缩和补充得到重构邻接矩阵集,最终交替优化关系真伪判别模型与关系重构模型,使得重构邻接矩阵集与完整邻接矩阵集符合相同的空间分布,并利用生成的关系重构模型实现了对缺失矩阵集的补全,以使人物关系完整,避免了现有技术中会出现人物关系网络丢失的情况,造成可疑人物行为特征分析不准确的问题,可以有效提高人物关系分析的准确性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的人物关系补全方法流程图;
图2为本发明实施例一提供的建立补充邻接矩阵集方法流程图;
图3为本发明实施例二提供的人物关系补全装置示意图;
图4为本发明实施例供的电子设备的结构示意图。
图标:301-获取单元;302-补充邻接矩阵集单元;303-特征集单元;304-重构邻接矩阵集单元;305-关系重构模型单元;306-人物关系补全单元;400-处理器;401-存储器;402-总线;403-通信接口。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
考虑到现有技术中人物行为特征分析时往往会出现人物关系网络丢失的情况,造成了可疑人物行为特征分析不准确的问题。本发明提供了一种人物关系补全方法、装置及电子设备,该技术通过获取人物关系网络,并根据人物关系网络建立完整子图人物关系网络集和缺失子图人物关系网络集,基于完整子图人物关系网络构建完整邻接矩阵集,基于缺失子图人物关系网络构建缺失邻接矩阵集;基于完整邻接矩阵集建立补充邻接矩阵集;根据第一非线性变换函数和线性聚合函数对补充邻接矩阵集进行压缩得到特征集;根据第二非线性变换函数对特征集进行重构,得到重构邻接矩阵集;交替优化关系真伪判别模型与关系重构模型,使得重构邻接矩阵集与完整邻接矩阵集符合相同的空间分布;根据关系重构模型对缺失邻接矩阵集进行补全,以使人物关系完整。本发明有效提高人物关系分析的准确性。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种人物关系补全方法进行详细介绍。
实施例一:
参照图1所示的一种人物关系补全方法流程图,可以由诸如计算机、处理器等电子设备执行,该方法主要包括步骤s101至步骤s106:
步骤s101,获取人物关系网络,并根据人物关系网络建立完整子图人物关系网络集和缺失子图人物关系网络集,基于完整子图人物关系网络构集建完整邻接矩阵集,基于缺失子图人物关系网络集构建缺失邻接矩阵集。
步骤s102,基于完整邻接矩阵集建立补充邻接矩阵集。
步骤s103,根据第一非线性变换函数和线性聚合函数对补充邻接矩阵集进行压缩得到特征集。
步骤s104,根据第二非线性变换函数对特征集进行重构,得到重构邻接矩阵集。
步骤s105,交替优化关系真伪判别模型与关系重构模型,使得重构邻接矩阵集与完整邻接矩阵集符合相同的空间分布。
步骤s106,根据关系重构模型对缺失邻接矩阵集进行补全,以使人物关系完整。
在本实施例提供的上述方式中,通过获取人物关系网络,构建完整子图人物关系网络集以及缺失子图人物关系网络集,并根据构建的子图人物关系网络。建立完整邻接矩阵集和缺失邻接矩阵集,再基于完整邻接矩阵集建立补充邻接矩阵集,再通过第一非线性变换函数、线性聚合函数和第二非线性变换函数对补充邻接矩阵集进行压缩和补充得到重构邻接矩阵集,最终交替优化关系真伪判别模型与关系重构模型,使得重构邻接矩阵集与完整邻接矩阵集符合相同的空间分布,并利用生成的关系重构模型实现了对缺失矩阵集的补全,以使人物关系完整,避免了现有技术中会出现人物关系网络丢失的情况,造成可疑人物行为特征分析不准确的问题,可以有效提高人物关系分析的准确性。
在具体实施时,获取人物关系网络,构建完整子图人物关系网络集以及缺失子图人物关系网络集,基于完整子图人物关系网络构建完整邻接矩阵集,基于缺失子图人物关系网络构建缺失邻接矩阵集的步骤,包括:
构建子图人物关系网络,根据网络缺失情况构建完整子图人物关系网络集以及缺失子图人物关系网络集;
基于完整子图人物关系网络集,建立完整邻接矩阵集;
基于缺失人物关系网络集,建立缺失邻接矩阵集。
在一种具体的实施方式中,基于人物关系网络,以可疑的人物作为中心节点,采用广度优先搜索算法遍历周围的k个节点。构建子图人物关系网络(g1,g2,g3…gn),再以可疑人物作为中心节点,首先遍历一阶邻居节点,如果一阶邻居节点数目s<k,则遍历二阶邻居节点,如果一阶与二阶邻居节点数目之和s大于>k,则计算二阶邻居节点的度值,删除排名靠后的节点,最终得出k个节点。依据人物关系网络构建完整邻接矩阵集tk*k*m,其中k表示节点个数,m表示完整子图网络数量。
在具体实施时,如图2所示建立补充邻接矩阵集方法流程图,基于完整邻接矩阵集建立补充邻接矩阵集的步骤,包括以下步骤s201~s202:
步骤s201,根据完整邻接矩阵集建立掩码矩阵。
步骤s202,将完整邻接矩阵集与掩码矩阵进行哈达玛乘积,得到补充邻接矩阵集。
在一种具体的实施方式中,基于完整邻接矩阵集tk*k*m,使临边随机失活,创造随机掩码矩阵mk*k*m,其中m由0,1构成,mij=0表示节点i与节点j关系丢失。补充邻接矩阵集等于tk*k*m与mk*k*m进行哈达玛乘积。
在具体实施时,根据第一非线性变换函数和线性聚合函数对补充邻接矩阵集进行压缩得到特征集的步骤,包括以下步骤a~b:
步骤a,根据第一非线性变换函数对补充邻接矩阵集进行压缩得到特征空间,其中第一非线性变换函数的算式(1)为:
z=tanh(w*x+b)(1)
其中,z为特征空间,w和b为训练参数,x为补充邻接矩阵集,tanh为激活函数。
步骤b,根据线性聚合函数对特征空间进行压缩得到所述特征集。
在具体实施时,第二非线性变换函数的算式(2)为:
p=σ(w'*x′+b')(2)
其中,p为重构邻接矩阵集,w'和b'为训练参数,x′为特征集,σ为激活函数。
在具体实施时,交替优化关系真伪判别模型与关系重构模型,使得重构邻接矩阵集与完整邻接矩阵集符合相同的空间分布的步骤,包括以下步骤c~e:
步骤c,根据重构损失算式(3)计算重构邻接矩阵集的重构损失,其中,重构损失算式(3)为:
lre=σ1||(tk*k*m-p'k*k*m)*mk*k*m||2+σ2||(tk*k*m-p'k*k*m)*(1-mk*k*m)||2(3)
其中,lre为重构损失,σ1为缺失部分的损失权重,σ2缺失部分的重构损失,tk*k*m为完整邻接矩阵集,mk*k*m为掩码矩阵,p'k*k*m为重构邻接矩阵集。
步骤d,根据关系真伪判别模型判断重构后的邻接矩阵集是否符合真实的邻接矩阵集的分布,建立判别损失函数(4),利用判别损失函数(4)计算重构邻接矩阵集和完整的邻接矩阵集的判别损失,其中,所述判别损失函数(4)为:
其中,t为完整邻接矩阵集,r为重构邻接矩阵集,j为关系真伪判别模型,v判别损失;
步骤e,对关系重构模型和关系真伪判别模型进行交替训练使得联合损失最小,得到最终的关系重构模型,以使完整邻接矩阵集与重构邻接矩阵集符合相同的空间分布。
在具体实施时,关系真伪判别模型的算式(5)为:
j(x″)=σ(tan(w″x″+b″)w″′+b″′)(5)
其中,w″、b″、w″′、b″′均为可训练参数,x″为关系真伪判别模型的输入量。
联合损失函数的算式(6)为:
lall=log[(j(t))-log(1-j(r))]+lre(6)
其中,t为完整邻接矩阵集,r为重构邻接矩阵集,j为关系真伪判别模型,lre为重构损失。
在一种具体的实施方式中,把重构邻接矩阵集和完整邻接矩阵集输入到关系真伪判别模型中,判断两者是否拥有相同的空间分布,通过抗网络算式进行交叉训练,使重构邻接矩阵集和完整邻接矩阵集具有相同的空间分布。
实施例二:
参照图3所示的一种人物关系补全装置示意图,包括:
获取单元301,用于获取人物关系网络,构建完整子图人物关系网络集以及缺失子图人物关系网络集,基于完整子图人物关系网络集构建完整邻接矩阵集,基于缺失子图人物关系网络集构建缺失邻接矩阵集。
补充邻接矩阵集单元302,用于基于完整邻接矩阵集建立补充邻接矩阵集。
特征集单元303,用于根据第一非线性变换函数和线性聚合函数对补充邻接矩阵集进行压缩得到特征集。
重构邻接矩阵集单元304,用于根据第二非线性变换函数对特征集进行重构,得到重构邻接矩阵集。
关系重构模型单元305,交替优化关系真伪判别模型与关系重构模型,使得重构邻接矩阵集与完整邻接矩阵集符合相同的空间分布。
人物关系补全单元306,用于根据关系重构模型对缺失邻接矩阵集进行补全,以使人物关系完整。
在本实施例提供的上述装置中,通过获取人物关系网络,构建完整子图人物关系网络集以及缺失子图人物关系网络集,基于完整子图人物关系网络集构建完整邻接矩阵集,基于缺失子图人物关系网络集构建缺失邻接矩阵集。并建立完整邻接矩阵集和缺失邻接矩阵集,再基于完整邻接矩阵集建立补充邻接矩阵集,再通过第一非线性变换函数、线性聚合函数和第二非线性变换函数对补充邻接矩阵集进行压缩和补充得到重构邻接矩阵集,最终交替优化关系真伪判别模型与关系重构模型,使得重构邻接矩阵集与完整邻接矩阵集符合相同的空间分布,并利用生成的关系重构模型实现了对缺失矩阵集的补全,以使人物关系完整,避免了现有技术中会出现人物关系网络丢失的情况,造成可疑人物行为特征分析不准确的问题,可以有效提高人物关系分析的准确性。
在具体实施时,获取单元301还用于根据广度优先搜索算法对人物关系网络进行遍历,构建子图人物关系网络,根据网络缺失情况构建完整子图人物关系网络集以及缺失子图人物关系网络集;
基于完整子图人物关系网络集,建立完整邻接矩阵集;
基于缺失子图人物关系网络集,建立缺失邻接矩阵集。
在具体实施时,补充邻接矩阵集单元302还用于根据完整邻接矩阵集建立掩码矩阵;
将完整邻接矩阵集与掩码矩阵进行哈达玛乘积,得到补充邻接矩阵集。
在具体实施时,特征集单元303还用于根据第一非线性变换函数对补充邻接矩阵集进行压缩得到特征空间,其中第一非线性变换函数的算式(7)为:
z(x,w)=tanh(w*x+b)(7)
其中,z为特征空间,w和b为训练参数,x为补充邻接矩阵集,tanh为激活函数;
根据线性聚合函数对特征空间进行压缩得到特征集。
在具体实施时,第二非线性变换函数的算式(8)为:
p(x,w)=σ(w'*x+b')(8)
其中,p为重构邻接矩阵集,w和b为训练参数,x为特征集,σ为激活函数。
在具体实施时,关系重构模型单元305还用于根据重构损失算式(9)计算重构邻接矩阵集的重构损失,其中,重构损失算式(9)为:
lre=σ1||(tk*k*m-p'k*k*m)*mk*k*m||2+σ2||(tk*k*m-p'k*k*m)*(1-mk*k*m)||2(9)
其中,lre为重构损失,σ1为缺失部分的损失权重,σ2缺失部分的重构损失,tk*k*m为完整邻接矩阵集,mk*k*m为掩码矩阵,p'k*k*m为重构邻接矩阵集;
根据关系真伪判别模型判断重构后的邻接矩阵集是否符合真实的邻接矩阵集的分布,建立判别损失函数,利用判别损失函数计算重构邻接矩阵集和完整的邻接矩阵集的判别损失,其中,判别损失函数(10)为:
其中,t为完整邻接矩阵集,r为重构邻接矩阵集,j为关系真伪判别模型,用来判断重构后的邻接矩阵集是否符真实邻接矩阵集的分布,v为判别损失;
对关系重构模型和关系真伪判别模型进行交替训练使得联合损失最小,得到最终的关系重构模型,以使完整邻接矩阵集与重构邻接矩阵集符合相同的空间分布。
在具体实施时,关系真伪判别模型的算式(11)为:
j(x″)=σ(tan(w″x″+b″)w″′+b″′)(11)
其中,w″、b″、w″′、b″′均为可训练参数,x″为关系真伪判别模型的输入量。
联合损失的算式(12)为:
lall=log[(j(t))-log(1-j(r))]+lre(12)
其中,t为完整邻接矩阵集,r为重构邻接矩阵集,j为关系真伪判别模型,lre为重构损失。
本发明实施例还提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现实施例一人物关系补全方法的步骤。
图4为本发明实施例提供的一种电子设备的结构示意图,该电子设备包括:处理器400,存储器401,总线402和通信接口403,处理器400、通信接口403和存储器401通过总线402连接;处理器400用于执行存储器401中存储的可执行模块,例如计算机程序。
其中,存储器401可能包含高速随机存取存储器(ram,randomaccessmemory),也可能还包括非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。通过至少一个通信接口403(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线402可以是isa总线、pci总线或eisa总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器401用于存储程序,所述处理器400在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器400中,或者由处理器400实现。
处理器400可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器400中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器400可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现成可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器401,处理器400读取存储器401中的信息,结合其硬件完成上述方法的步骤。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其中,计算机程序被处理器400运行时执行实施例一人物关系补全方法的步骤。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。