本申请属于数据处理,尤其涉及一种增量图划分方法、装置、设备、介质及产品。
背景技术:
1、随着互联网技术的发展应用,目前在风控挖掘分析、营销推荐分析等场景下,均可以利用涉及大量对象的存量数据构建存量图,通过该存量图可以将联系密切的对象归为同一子图,每个子图相当于一个社群,并且可在不同子图之间建立关联边。如此,通过对存量图进行计算分析,可以实现在风控挖掘分析场景下为不同对象评估风险值,在营销推荐分析场景下为不同对象推荐相应营销内容等实际应用。
2、相关技术中,当获取到最新增量数据时,通常需要通过全局的图谱算法进行图计算分析,从而完成增量图划分,然而相关技术中增量图划分时的运算量较大,划分时间较长,无法满足实时性需求。
技术实现思路
1、本申请实施例提供一种增量图划分方法、装置、设备、介质及产品,能够改善增量图划分时的运算量较大,划分时间较长,无法满足实时性需求的问题。
2、第一方面,本申请实施例提供一种增量图划分方法,该方法包括:
3、在获取到新增数据节点的情况下,确定n个子图中与新增数据节点存在关联边的至少一个子图,其中,n个子图是基于社区发现算法对存量图进行划分得到的;
4、在至少一个子图包括第一子图和第二子图的情况下,获取第一子图和第二子图的目标权重增益阈值,其中,新增数据节点与第一子图存在第一关联边,新增数据节点与第二子图存在第二关联边;
5、基于第一关联边和第二关联边的权重值,确定新增数据节点的权重增量;
6、在权重增量大于目标权重增益阈值的情况下,确定第一子图与第二子图满足预设聚合条件,聚合第一子图与第二子图,得到第三子图,并将新增数据节点划分至第三子图。
7、第二方面,本申请实施例提供一种增量图划分装置,该装置包括:
8、确定模块,用于在获取到新增数据节点的情况下,确定n个子图中与新增数据节点存在关联边的至少一个子图,其中,n个子图是基于社区发现算法对存量图进行划分得到的;
9、获取模块,用于在至少一个子图包括第一子图和第二子图的情况下,获取第一子图和第二子图的目标权重增益阈值,其中,新增数据节点与第一子图存在第一关联边,新增数据节点与第二子图存在第二关联边;
10、确定模块,还用于基于第一关联边和第二关联边的权重值,确定新增数据节点的权重增量;
11、划分模块,用于在权重增量大于目标权重增益阈值的情况下,确定第一子图与第二子图满足预设聚合条件,聚合第一子图与第二子图,得到第三子图,并将新增数据节点划分至第三子图。
12、第三方面,本申请实施例提供一种电子设备,包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现第一方面所示的增量图划分方法的步骤。
13、第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质上存储程序或指令,程序或指令被处理器执行时实现如第一方面所示的增量图划分方法的步骤。
14、第五方面,本申请实施例提供一种计算机程序产品,计算机程序产品被存储在非易失的存储介质中,计算机程序产品被至少一个处理器执行时实现如第一方面所示的增量图划分方法的步骤。
15、第六方面,本申请实施例提供一种芯片,该芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面的增量图划分方法的步骤。
16、本申请实施例提供一种增量图划分方法、装置、设备、介质及产品,基于社区发现算法预先对存量图进行划分得到n个子图,在获取到新增数据节点的情况下,确定n个子图中与新增数据节点存在关联边的至少一个子图,若至少一个子图包括第一子图和第二子图,说明该新增数据节点与不止一个社群中的社群节点具有关联关系。基于此,本申请获取第一子图和第二子图的目标权重增益阈值,并基于新增数据节点与两个子图之间的关联边的权重值,确定新增数据节点的权重增量。若该权重增量大于目标权重增益阈值,则可以说明在第一子图与第二子图之间添加新增数据节点之后,该权重增量能够使得第一子图与第二子图之间的模块度增益得以提升,进而使得第一子图与第二子图满足预设聚合条件。如此,通过聚合第一子图与第二子图,能够得到受新增数据节点影响的第三子图,通过遍历每个新增数据节点,即可将n个子图中所有满足预设聚合条件的子图进行两两融合,实现对原有存量图的图结构的重新划分,且整个划分过程无需涉及大量运算,仅需预先离线计算目标权重增益阈值即可,在获取到新增数据节点的场景下可以完成增量图的实时划分,满足实时性需求。
1.一种增量图划分方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,在所述权重增量大于所述目标权重增益阈值的情况下,确定所述第一子图与所述第二子图之间的关联度满足预设聚合条件,包括:
4.根据权利要求1所述的方法,其特征在于,所述第一关联边对应第一权重,所述第二关联边对应第二权重,所述基于所述第一关联边和所述第二关联边的权重值,确定所述新增数据节点的权重增量,包括:
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述第一子图与m1个子图存在关联边,所述第二子图与m2个子图存在关联边,所述m1个子图中包括所述第二子图,所述m2个子图中包括所述第一子图,在所述获取所述第一子图和所述第二子图的目标权重增益阈值之前,所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,所述基于所述m1个第三权重、所述m2个第四权重,以及第五权重,计算所述第一子图和第二子图的目标权重增益阈值,包括:
8.根据权利要求1所述的方法,其特征在于,每个子图包括多个节点,所述在获取到新增数据节点的情况下,确定n个子图中与所述新增数据节点存在关联边的至少一个子图,包括:
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
10.一种增量图划分装置,其特征在于,包括:
11.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至8中任意一项所述的增量图划分方法。
13.一种计算机程序产品,其特征在于,所述计算机程序产品被存储在非易失的存储介质中,所述计算机程序产品被至少一个处理器执行时实现如权利要求1至8中任意一项所述的增量图划分方法。