用户身份数据确定方法、装置、设备和介质与流程

文档序号:20701743发布日期:2020-05-12 15:48阅读:214来源:国知局
用户身份数据确定方法、装置、设备和介质与流程

本申请实施例涉及计算机技术领域,具体涉及大数据技术,尤其涉及一种用户身份数据确定方法、装置、设备和介质。



背景技术:

目前,业务方采集的用户数据存在不同维度的用户身份信息,例如身份证、手机号、设备码等。然而,单个类型的身份信息所关联的数据往往有限,因此需要将同一用户的不同类型身份信息进行关联,以为业务方提供更大的数据价值。

相关技术中,将同一用户的不同类型身份信息进行关联,采用如下方式:方式一,根据已知类型的身份信息,定制构建同一用户的不同类型身份信息之间的连接关系。例如,构建姓名-身份证-手机号之间的连接关系;方式二,基于全图方式,利用离线计算方式对全图的身份信息进行遍历,得到同一用户的不同类型身份信息之间的连接关系。

然而,上述方式一,灵活性低,如果新增身份信息类别,则需要重新构建连接关系;方式二,通过对全图的身份信息进行遍历,得到同一用户的不同类型身份信息之间的连接关系,计算成本高,造成资源浪费。



技术实现要素:

本申请实施例公开一种用户身份数据确定方法、装置、设备和介质,不仅提高了灵活性,还无需对全图中的身份信息进行遍历,提高了计算效率,节约了资源,并且通过引入虚拟节点对用户身份信息之间的关联关系进行泛化,提高了数据准召率和召回率。

第一方面,本申请实施例公开了一种用户身份数据确定方法,该方法包括:

获取用户身份查询请求,其中所述用户身份查询请求包括起始身份信息;

基于关系图谱,确定与所述起始身份信息属于同一用户的目标身份信息;

其中,所述关系图谱包括用户身份信息节点和虚拟节点,以及不同节点之间的边关系;所述虚拟节点根据空间特征确定。

本申请实施例通过根据用户身份查询请求包括的起始身份信息,从包括用户身份信息节点和虚拟节点,以及不同节点之间的边关系的关系图谱中,确定与起始身份信息属于同一用户的目标身份信息,其中虚拟节点根据空间特征确定。由此,不仅提高了灵活性,还无需对全图中的身份信息进行遍历,提高了计算效率,节约了资源,并且通过引入虚拟节点对用户身份信息之间的关联关系进行泛化,提高了数据准召率和召回率。

另外,根据本申请上述实施例的用户身份数据确定方法,还可以具有如下附加的技术特征:

可选的,在所述关系图谱中,为用户身份信息构建用户身份信息节点;

根据空间特征,构建虚拟节点;

根据共现关系,构建不同用户身份信息节点之间的显性边关系;

根据空间特征,构建用户身份信息节点和虚拟节点之间的隐性边关系。

上述申请中的一个实施例具有如下优点或有益效果:通过根据共现关系,构建不同用户身份信息节点之间的显性边关系,根据空间特征,构建用户身份信息节点和虚拟节点之间的隐形边关系,以实现对用户身份信息关系进行泛化。

可选的,根据空间特征,构建虚拟节点,包括:每隔第一长度距离确定一区域,为该区域构建虚拟节点;

相应地,根据空间特征,构建用户身份信息节点和虚拟节点之间的隐性边关系,包括:

获取在虚拟节点关联区域中出现的用户身份信息,并构建所述虚拟节点与出现的用户身份信息节点之间的隐性边关系。

可选的,根据空间特征,构建虚拟节点,包括:每隔第一长度距离确定一区域,每隔第一时长确定一时段,且为该区域中每一时段分别构建虚拟节点;

相应地,根据空间特征,构建用户身份信息节点和虚拟节点之间的隐性边关系,包括:

获取关联时段在虚拟节点关联区域中出现的用户身份信息,并构建所述虚拟节点与出现的用户身份信息节点之间的隐性边关系。

上述申请中的一个实施例具有如下优点或有益效果:通过根据空间特征,或者空间特征和时间特征,构建虚拟节点与用户身份信息节点之间的隐性边关系,丰富了用户身份信息的关联能力。

可选的,基于关系图谱,确定与所述起始身份信息属于同一用户的目标身份信息,包括:

在所述关系图谱中,以所述起始身份信息关联的身份信息节点为起始身份信息节点进行遍历得到目标子图谱;

确定所述起始身份信息节点,与所述目标子图谱中其他身份信息节点之间的相关度;

根据所述相关度,确定与所述起始身份信息属于同一用户的目标身份信息。

上述申请中的一个实施例具有如下优点或有益效果:通过获取与起始身份信息对应的目标子图谱,并根据目标子图谱中其他身份信息节点与起始身份信息节点之间的相关度,确定属于同一用户的目标身份信息,实现对局部图谱进行遍历,而避免对整个图谱进行遍历操作,提高了计算效率,节省了计算资源。

可选的,在所述关系图谱中,以所述起始身份信息关联的身份信息节点为起始身份信息节点进行遍历,得到目标子图谱,包括:

在所述关系图谱中,以所述起始身份信息关联的身份信息节点为起始身份信息节点进行遍历,获取与所述起始身份信息节点关联的目标节点,并添加到所述目标子图谱中;

若所述目标节点为虚拟节点,则确定所述目标节点为目标虚拟节点,并根据空间特征,从所述关系图谱中获取与所述目标虚拟节点关联的其他虚拟节点;

将所述其他虚拟节点添加到所述目标子图谱中,且构建所述其他虚拟节点与所述目标虚拟节点之间的泛化边关系。

可选的,根据空间特征,从所述关系图谱中获取与所述目标虚拟节点关联的其他虚拟节点,包括:

将与所述目标虚拟节点之间,关联区域在第二长度内且关联时段在第二时长内的虚拟节点,作为与所述目标虚拟节点关联的其他虚拟节点。

上述申请中的一个实施例具有如下优点或有益效果:在目标节点为虚拟节点时,获取其他虚拟节点,并构建其他虚拟节点与目标虚拟节点之间的泛化边关系,以增加获取的身份信息数量,降低获取的身份信息局限性。

可选的,确定所述起始身份信息节点,与所述目标子图谱中其他身份信息节点之间的相关度,包括:

根据所述起始身份信息节点,与所述目标子图谱中其他身份信息节点之间的边关系数量和边关系类型,确定所述相关度。

上述申请中的一个实施例具有如下优点或有益效果:通过根据边关系数量和边关系类型,确定相关度,使得确定与起始身份信息属于同一用户的目标身份信息准确和可靠性更高。

可选的,所述方法还包括:根据所述关系图谱中不同节点之间的边关系,提取用户身份信息节点的候选连通路径;

相应地,基于关系图谱,确定与所述起始身份信息属于同一用户的目标身份信息,包括:

确定所述起始身份信息所属的起始身份信息类型;

根据所述起始身份信息类型,从所述候选连通路径中选择目标连通路径;

基于所述目标连通路径,从所述关系图谱中提取与所述起始身份信息属于同一用户的目标身份信息。

上述申请中的一个实施例具有如下优点或有益效果:根据起始身份信息所述的起始身份信息类型,选择目标连通路径,以从关系图谱中提取与起始身份信息属于同一用户的目标身份信息,提高了获取目标身份信息的多样性。

第二方面,本申请实施例还公开了一种用户身份数据确定装置,包括:

获取模块,用于获取用户身份查询请求,其中所述用户身份查询请求包括起始身份信息;

确定模块,用于基于关系图谱,确定与所述起始身份信息属于同一用户的目标身份信息;

其中,所述关系图谱包括用户身份信息节点和虚拟节点,以及不同节点之间的边关系;所述虚拟节点根据空间特征确定。

第三方面,本申请实施例还公开了一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任一实施例所述的用户身份数据确定方法。

第四方面,本申请实施例还公开了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请任一实施例所述的用户身份数据确定方法。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案,不构成对本申请的限定。其中:

图1是本申请实施例公开的构建关系图谱的流程示意图;

图2是本申请实施例公开的一种用户身份数据确定方法的流程示意图;

图3是本申请实施例公开的一种在关系图谱中遍历得到目标子图谱的流程示意图;

图4是本申请实施例公开的另一种在关系图谱中遍历得到目标子图谱的流程示意图;

图5(a)-图5(b)是本申请实施例公开的遍历关系图谱得到目标子图谱的示意图;

图6是本申请公开的另一种用户身份数据确定方法的流程示意图;

图7是本申请实施例公开的一种用户身份数据确定装置的结构示意图;

图8是本申请实施例公开的一种电子设备的结构示意图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

本申请实施例针对相关技术中,同一用户的不同类别身份信息进行关联时,存在灵活性低,需要对全图中的身份信息进行遍历,导致的计算成本高,造成资源浪费的问题,提出了一种用户身份数据确定方法。

本申请实施例,通过根据用户身份查询请求中包括的起始身份信息,从包括用户身份信息节点和虚拟节点,以及不同节点之间的边关系的关系图谱中,确定与起始身份信息属于同一用户的目标身份信息。由此,不仅提高了灵活性,还无需对全图中的身份信息进行遍历,提高了计算效率,节约了资源,并且通过引入虚拟节点对用户身份信息之间的关联关系进行泛化,提高了数据准召率和召回率。

为了清楚说明本申请实施例公开的用户身份数据确定方法中,基于关系图谱,确定与起始身份信息属于同一用户的目标身份信息的过程,下面首先对本申请实施例中构建关系图谱进行说明。

图1是本申请实施例公开的构建关系图谱的流程示意图,本申请实施例公开的构建关系图谱,可由用户身份数据确定装置来执行,该装置可以由软件和/硬件实现,可集成于电子设备的内部。该方法包括如下步骤:

s101,在所述关系图谱中,为用户身份信息构建用户身份信息节点。

在本实施例中,用户身份信息包括用户真实身份信息和采集用户身份信息的设备身份信息(采集设备身份信息)。其中,采集设备可以是但不限于:基站、摄像头、声纹采集设备和指纹采集设备等。

例如,用户真实身份信息包括:身份证、手机号码和生物特征等。其中,生物特征可为人脸图像、虹膜、指纹及声音等;采集设备身份信息包括:国际移动设备标识(internationalmobileequipmentidentity,简称为:imei)和媒体访问控制(mediaaccesscontroladdress,简称为:mac)地址等。

在执行s101之前,首先将获取的用户数据进行结构化转换,并将结构化数据导入到身份宽表中。然后,通过关系转换器从身份宽表中的用户数据中提取不同类型的用户身份信息以及不同用户身份信息之间的共现关系。在本申请实施例中,身份宽表是指包括不同身份信息字段的表。共现关系是指一条用户数据中包括至少两个用户身份信息。

进而,根据提取的不同类型用户身份信息,在关系图谱中构建用户身份信息节点。其中,用户身份信息节点包括:用户真实身份信息节点和采集设备身份信息节点。本实施例中关系图谱可为初始关系图谱。

需要说明的,本实施例中,身份宽表结构可如下表1所述:

表1

此外,身份宽表可定义在任何存储数据库中,比如es/hbase/mysql等。

s102,根据空间特征,构建虚拟节点。

其中,虚拟节点是指能够将不同类型的用户身份信息进行连接的节点。

示例性的,构建虚拟节点可通过如下方式实现:

方式一,每隔第一长度距离确定一区域,为该区域构建虚拟节点。

其中,第一长度距离可根据实际需要进行设置,此处对其不做具体限定。比如,第一长度距离设置为10米(m)或者20m等。

在本实施例中,每隔第一长度距离确定一区域之后,通过确定在该区域中是否存在用户身份信息节点(比如采集设备),若存在则建立虚拟节点,以为后续建立虚拟节点与用户身份信息节点之间的隐性边关系奠定基础。

方式二,每隔第一长度距离确定一区域,每隔第一时长确定一时段,且为该区域中每一时段分别构建虚拟节点。

其中,第一时长可根据实际需要进行设置,此处对其不做具体限定。例如,第一时长设置为2小时(h)或者一周等。

也就是说,本实施例在上述方式一的基础上,通过增加第一时长,并根据第一时长确定一时段,为该区域中每一时段分别构建虚拟节点,使得该区域中的构建的虚拟节点分布更充分全面。

s103,根据共现关系,构建不同用户身份信息节点之间的显性边关系。

s104,根据空间特征,构建用户身份信息节点和虚拟节点之间的隐性边关系。

示例性的,由于s102中构建虚拟节点的两种方式,本申请实施例构建用户身份信息节点和虚拟节点之间的隐性边关系时,对应也存在两种方式,具体如下:

方式一,获取在虚拟节点关联区域中出现的用户身份信息,并构建虚拟节点与出现的用户身份信息节点之间的隐性边关系。

方式二,获取关联时段在虚拟节点关联区域中出现的用户身份信息,并构建所述虚拟节点与出现的用户身份信息节点之间的隐性边关系。

其中,关联时段可以是构建虚拟节点过程中所确定的任一时段,例如构建虚拟节点过程中确定有0:00-6:00,6:00-12:00,12:00-18:00和18:00-24:00四种时段,根据业务需求可以将任一时段作为关联时段,不同虚拟节点的关联时段可以不同。关联区域的范围大于构建虚拟节点过程中所确定的区域范围,例如每隔10m选一个虚拟节点,相应地可以每隔50m选虚拟节点的关联区域。由于关联区域范围大于虚拟节点自身的区域范围,使关联区域范围内存在至少两个虚拟节点,以便于构建属于同一关联区域范围内的不同虚拟节点之间的泛化边关系。

在构建不同用户身份信息节点之间的显性边关系,以及用户身份信息和虚拟节点之间的隐性边关系之后,即可得到关系图谱。

例如,若用户身份信息节点为王二和王二的手机号码,并且在第一长度距离10m确定的区域1中出现基站1,则建立虚拟节点,然后构建王二与手机号码的显性边关系,并构建手机号码与虚拟节点,和王二与虚拟节点之间的隐性边关系,得到关系图谱。

进一步的,在构建关系图谱过程中,本申请实施例还可统计用户身份信息节点的边数量,并根据统计的边数量在时间、空间上,对用户身份信息进行聚合或分裂,得到聚合后的用户身份信息节点或分裂后的用户身份信息节点。此外,为了能够区分聚合后的用户身份信息和分裂后的用户身份信息,还可为聚合后的用户身份信息节点和分裂后的用户身份信息节点添加类型,边数量等属性信息。其中,类型包括:原始、聚合和分裂。

此外,本申请实施例还可将关系图谱存储到关联引擎中,以为后续查询任一用户的目标身份信息奠定基础。其中,存储到关联引擎中包括关系图谱本身及关系图谱中的数据信息。

可以理解的是,本申请实施例通过构建不同用户身份信息节点之间的显性边关系,以及用户身份信息节点和虚拟节点之间的隐性边关系,不仅能够得到不同用户身份信息之间的关联关系,还能通过虚拟节点获取到与用户身份信息存在隐性关系的其他身份信息,使得将同一用户相关的尽可能多身份信息进行关联,为后续查询用户身份信息提供了有利条件。

本申请实施例公开的用户身份数据确定方法,通过在初始关系图谱中,构建用户身份信息节点,根据空间特征构建虚拟节点,然后根据共现关系,构建不同用户身份信息节点之间的显性边关系,并根据空间特征,构建用户身份信息节点和虚拟节点之间的隐性边关系,得到关系图谱,从而基于构建的关系图谱为后续确定同一用户的目标身份信息提供了条件。

通过上述介绍可知,本申请实施例通过在初始关系图谱中,构建不同身份信息节点之间的显性边关系,以及构建用户身份信息和虚拟节点之间的隐性边关系,以得到关系图谱,通过该关系图谱为后续确定目标身份信息奠定了基础。基于上述实施例构建的关系图谱,下面对本申请实施例公开的用户身份数据确定方法进行说明。

如图2所示,该方法可以包括:

s201,获取用户身份查询请求,其中所述用户身份查询请求包括起始身份信息。

s202,基于关系图谱,确定与所述起始身份信息属于同一用户的目标身份信息。

其中,所述关系图谱包括用户身份信息节点和虚拟节点,以及不同节点之间的边关系;所述虚拟节点根据空间特征确定。

示例性的,通过对获取的用户身份查询请求进行解析,得到起始身份信息。然后,基于起始身份信息从关系图谱中,确定与该起始身份信息属于同一用户的目标身份信息。

需要说明的是,上述用户身份查询请求中除了包括起始身份信息之外,还可包括目标身份信息和/或查询的目标时间区间,此处对其不做限定。其中,当确定用户身份查询请求中仅包括起始身份信息时,则按照默认方式将查询到的与起始身份信息属于同一用户的所有身份信息作为目标身份信息。

当获取到起始身份信息之后,为了避免执行无效的查询操作。本实施例还可对起始身份信息进行合法性校验,以确定存储的用户身份信息数据中是否包含该起始身份信息,若包含则说明合法,则执行查询操作,若不包含,则说明该查询操作不合法,返回查询失败消息。

其中,若用户身份查询请求中还包括查询时间区间,则还确定该时间区间是否合法。例如,若关联引擎中存储的是用户q2019年12月之前的数据信息,那么当查询时间区间为2020年2月,则确定该查询时间区间不合法。

进一步的,在确定起始身份信息合法,执行基于关系图谱,确定与起始身份信息属于同一用户的目标身份信息时,可在关系图谱中,以起始身份信息关联的身份信息节点为起始身份信息节点进行遍历得到目标子图谱;确定起始身份信息节点,与目标子图谱中其他身份信息节点之间的相关度;根据相关度,确定与起始身份信息属于同一用户的目标身份信息。

需要说明的是,在关系图谱中进行遍历得到目标子图谱,将在下面实施例中进行说明,此处对其不做过多赘述。

其中,确定起始身份信息节点,与目标子图谱中其他身份信息节点之间的相关度,包括:根据所述起始身份信息节点,与所述目标子图谱中其他身份信息节点之间的边关系数量和边关系类型,确定所述相关度。

在本申请实施例中,起始身份信息节点与目标子图谱中其他身份信息节点之间的边关系数量越少,且边关系为显性边关系,则说明相关度越高,反之相关度越低。

本申请实施例公开的用户身份数据确定方法,通过根据用户身份查询请求包括的起始身份信息,从包括用户身份信息节点和虚拟节点,以及不同节点之间的边关系的关系图谱中,确定与起始身份信息属于同一用户的目标身份信息,其中虚拟节点根据空间特征确定。由此,不仅提高了灵活性,还无需对全图中的身份信息进行遍历,提高了计算效率,节约了资源,并且通过引入虚拟节点对用户身份信息之间的关联关系进行泛化,提高了数据准召率和召回率。

下面结合图3和图4,对本申请实施例中在关系图谱中,以起始身份信息关联的身份信息节点为起始身份信息节点进行遍历,得到目标子图谱的过程进行说明。

首先,如图3所示,本申请实施例得到目标子图谱包括如下:

s301,在所述关系图谱中,以所述起始身份信息关联的身份信息节点为起始身份信息节点进行遍历,获取与所述起始身份信息节点关联的目标节点,并添加到所述目标子图谱中。

s302,若所述目标节点为虚拟节点,则确定所述目标节点为目标虚拟节点,并根据空间特征,从所述关系图谱中获取与所述目标虚拟节点关联的其他虚拟节点。

其中,根据空间特征,从关系图谱中获取与目标虚拟节点关联的其他虚拟节点,包括:将与目标虚拟节点之间,关联区域在第二长度内且关联时段在第二时长内的虚拟节点,作为与所述目标虚拟节点关联的其他虚拟节点。

例如,若目标虚拟节点为f,那么当与目标虚拟节点f之间关联区域在20m内且时间段在2h内的虚拟节点为虚拟节点e,则将虚拟节点e作为其他虚拟节点。

s303,将所述其他虚拟节点添加到所述目标子图谱中,且构建所述其他虚拟节点与所述目标虚拟节点之间的泛化边关系。

在本发明实施例中,泛化边关系具体是指不同虚拟节点之间的连接边关系,即其他虚拟节点与目标虚拟节点之间的边关系。通过不同虚拟节点之间的泛化边关系,以及用户身份信息节点和虚拟节点之间的隐性边关系,可以将不同虚拟节点关联的用户身份信息节点联系起来,以挖掘是否属于同一用户,可以提高召回率。

其中,为了防止得到的目标子图谱规格过大,过于复杂,本申请实施例还可对起始身份信息节点进行扩线度设置。扩线度可根据实际需要进行设置。其中,扩线度可以携带在用户身份查询请求中,或者当用户身份查询请求中未携带扩线度时,按照默认设置的扩线度进行查询,此处对其不做具体限定。

例如,若扩线度为4,起始身份信息为王二人脸信息,那么以王二人脸信息关联的王二人脸信息节点为起点遍历关系图谱,获取一度扩线节点为摄像机y1,二度扩线节点为虚拟节点1,三度扩线节点为虚拟节点2,四度扩线节点为采集设备w,从而得到扩线节点集合为{摄像机y1、虚拟节点1、虚拟节点2、采集设备w},基于上述扩线节点集合中各节点与起始身份信息节点构建的关系图谱,即为目标子图谱。

进一步的,本申请实施例还可通过另一方式得到目标子图谱,具体如图4所示。

s401,在所述关系图谱中,以所述起始身份信息关联的身份信息节点为起始身份信息节点进行遍历,获取与所述起始身份信息节点关联的目标节点。

s402,若所述目标节点为用户身份信息节点,则将用户身份信息节点添加到目标子图谱中。

例如,如图5(a)所示,若扩线度为4,起始身份信息为a,那么以a关联的a节点为起点遍历关系图谱,获取一度扩线节点有b;二度扩线节点有b1、b2和c;三度扩线节点有b11、b12、c1、c2和d;四度扩线节点c11、c12、d1和d2,从而得到扩线节点集合为{b、b1、b2、c、b11、b12、c1、c2、d、c11、c12、d1和d2},基于上述扩线节点集合中各节点与起始身份信息节点构建关系图谱,即为目标子图谱,具体如图5(b)。

图6是本申请公开的另一种用户身份数据确定方法的流程示意图。该实施例为本申请用户身份数据确定方法的另一种实现方案。下面结合图6,对上述情况进行说明。该方法具体包括如下:

如图6所示,该方法可以包括:

s601,获取用户身份查询请求,其中所述用户身份查询请求包括起始身份信息。

s602,根据所述关系图谱中不同节点之间的边关系,提取用户身份信息节点的候选连通路径。

在本发明实施例中,不同节点包括关系图谱中任一节点类型,即用户身份信息节点和虚拟节点。相应地,边关系包括显性边关系和隐性边关系。

示例性的,可从连通路径库中,提取所有用户身份信息节点的候选连通路径。

s603,确定所述起始身份信息所属的起始身份信息类型。

s604,根据所述起始身份信息类型,从所述候选连通路径中选择目标连通路径。

s605,基于所述目标连通路径,从所述关系图谱中提取与所述起始身份信息属于同一用户的目标身份信息。

其中,起始身份信息类型包括:身份证、手机号码和生物特征等。

例如,若起始身份信息类型为王二,则根据王二选择与王二具有连通关系的连通路径r1和r2作为目标连通路径,当连通路径r2中的身份证属于王二,则确定身份证为王二的目标身份信息。

本申请实施例公开的用户身份数据确定方法,通过提取用户身份信息节点的候选连通路径,以根据确定的起始身份信息类型,从候选连通路径中选择目标连通路径,并基于目标连通路径,从关系图谱中提取与起始身份信息属于同一用户的目标身份信息。不仅提高了灵活性,还无需对全图中的身份信息进行遍历,提高了计算效率,节约了资源,并且通过引入虚拟节点对用户身份信息之间的关联关系进行泛化,提高了数据准召率和召回率。

图7是本申请实施例公开的一种用户身份数据确定装置的结构示意图。该用户身份数据确定装置可以采用软件和/或硬件的方式实现,并可集成在电子设备上。

如图7所示,本实施例公开的一种用户身份数据确定装置700包括获取模块710和确定模块720,其中:

获取模块710,用于获取用户身份查询请求,其中所述用户身份查询请求包括起始身份信息;

确定模块720,用于基于关系图谱,确定与所述起始身份信息属于同一用户的目标身份信息;

其中,所述关系图谱包括用户身份信息节点和虚拟节点,以及不同节点之间的边关系;所述虚拟节点根据空间特征确定。

作为本申请的一种可选的实现形式,所述装置还包括:关系图谱构建模块;

其中,关系图谱构建模块,用于在所述关系图谱中,为用户身份信息构建用户身份信息节点;根据空间特征,构建虚拟节点;根据共现关系,构建不同用户身份信息节点之间的显性边关系;根据空间特征,构建用户身份信息节点和虚拟节点之间的隐性边关系。

作为本申请的一种可选的实现形式,关系图谱构建模块,还用于每隔第一长度距离确定一区域,为该区域构建虚拟节点;

关系图谱构建模块,还用于获取在虚拟节点关联区域中出现的用户身份信息,并构建所述虚拟节点与出现的用户身份信息节点之间的隐性边关系。

作为本申请的一种可选的实现形式,关系图谱构建模块,还用于每隔第一长度距离确定一区域,每隔第一时长确定一时段,且为该区域中每一时段分别构建虚拟节点;

关系图谱构建模块,还用于获取关联时段在虚拟节点关联区域中出现的用户身份信息,并构建所述虚拟节点与出现的用户身份信息节点之间的隐性边关系。

作为本申请的一种可选的实现形式,确定模块720,具体用于:

在所述关系图谱中,以所述起始身份信息关联的身份信息节点为起始身份信息节点进行遍历得到目标子图谱;

确定所述起始身份信息节点,与所述目标子图谱中其他身份信息节点之间的相关度;

根据所述相关度,确定与所述起始身份信息属于同一用户的目标身份信息。

作为本申请的一种可选的实现形式,确定模块720还包括:构建子图谱单元;

其中,构建子图谱单元,用于在所述关系图谱中,以所述起始身份信息关联的身份信息节点为起始身份信息节点进行遍历,获取与所述起始身份信息节点关联的目标节点,并添加到所述目标子图谱中;

若所述目标节点为虚拟节点,则确定所述目标节点为目标虚拟节点,并根据空间特征,从所述关系图谱中获取与所述目标虚拟节点关联的其他虚拟节点;

将所述其他虚拟节点添加到所述目标子图谱中,且构建所述其他虚拟节点与所述目标虚拟节点之间的泛化边关系。

作为本申请的一种可选的实现形式,构建子图谱单元,还用于:

将与所述目标虚拟节点之间,关联区域在第二长度内且关联时段在第二时长内的虚拟节点,作为与所述目标虚拟节点关联的其他虚拟节点。

作为本申请的一种可选的实现形式,确定模块720还用于:

根据所述起始身份信息节点,与所述目标子图谱中其他身份信息节点之间的边关系数量和边关系类型,确定所述相关度。

作为本申请的一种可选的实现形式,所述装置还包括:路径提取模块;

其中,路径提取模块,用于根据所述关系图谱中不同节点之间的边关系,提取用户身份信息节点的候选连通路径;

相应地,确定模块720还用于:

确定所述起始身份信息所属的起始身份信息类型;

根据所述起始身份信息类型,从所述候选连通路径中选择目标连通路径;

基于所述目标连通路径,从所述关系图谱中提取与所述起始身份信息属于同一用户的目标身份信息。

需要说明的是,前述对用户身份数据确定方法实施例的解释说明也适用于该实施例的用户身份数据确定装置,其实现原理类似,此处不再赘述。

本实施例公开的用户身份数据确定装置,通过根据用户身份查询请求包括的起始身份信息,从包括用户身份信息节点和虚拟节点,以及不同节点之间的边关系的关系图谱中,确定与起始身份信息属于同一用户的目标身份信息,其中虚拟节点根据空间特征确定。由此,不仅提高了灵活性,还无需对全图中的身份信息进行遍历,提高了计算效率,节约了资源,并且通过引入虚拟节点对用户身份信息之间的关联关系进行泛化,提高了数据准召率和召回率。

根据本申请的实施例,本申请还公开了一种电子设备和一种可读存储介质。

如图8所示,是根据本申请实施例的用户身份数据确定方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图8所示,该电子设备包括:一个或多个处理器801、存储器802,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备公开部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图8中以一个处理器801为例。

存储器802即为本申请所公开的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所公开的用户身份数据确定方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所公开的用户身份数据确定方法。

存储器802作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的基于区块链的鉴权方法对应的程序指令/模块(例如,附图7所示的获取模块710和确定模块720)。处理器801通过运行存储在存储器802中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的用户身份数据确定方法。

存储器802可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据用户身份数据确定方法的电子设备的使用所创建的数据等。此外,存储器802可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器802可选包括相对于处理器801远程设置的存储器,这些远程存储器可以通过网络连接至用户身份数据确定方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

用户身份数据确定方法的电子设备还可以包括:输入装置803和输出装置804。处理器801、存储器802、输入装置803和输出装置804可以通过总线或者其他方式连接,图8中以通过总线连接为例。

输入装置803可接收输入的数字或字符信息,以及产生与基于区块链的鉴权方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置804可以包括显示设备、辅助照明装置(例如,led)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据公开给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据公开给可编程处理器的任何信号。

为了公开与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入公开给计算机。其它种类的装置还可以用于公开与用户的交互;例如,公开给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案,通过根据用户身份查询请求包括的起始身份信息,从包括用户身份信息节点和虚拟节点,以及不同节点之间的边关系的关系图谱中,确定与起始身份信息属于同一用户的目标身份信息,其中虚拟节点根据空间特征确定。由此,不仅提高了灵活性,还无需对全图中的身份信息进行遍历,提高了计算效率,节约了资源,并且通过引入虚拟节点对用户身份信息之间的关联关系进行泛化,提高了数据准召率和召回率。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1