本申请属于数据挖掘,尤其涉及一种频繁子图挖掘方法和终端设备。
背景技术:
1、频繁子图挖掘是指从一个图集或者一个大图中找出频繁出现的子结构,是数据挖掘领域的一项重要研究课题,并被广泛应用于蛋白质功能发现、游戏推荐、软件工程、化合物分类等众多领域。
2、现有技术通常是先计算较小的频繁子图,基于较小的频繁子图扩展生成其他候选子图;然后计算候选子图的同构映射,在找到超过固定数量的同构子图后,可以判定该候选子图为频繁子图,即完成频繁子图的挖掘。然而,通过现有技术生成的候选子图中,非频繁子图数量过多,也就是说终端设备会耗费大量时间在计算非频繁子图的同构映射中,不仅增加了终端设备的计算开销,且降低了对频繁子图的挖掘效率。
技术实现思路
1、本申请实施例提供了一种频繁子图挖掘方法和终端设备,减少了终端设备的计算开销,并提高了对频繁子图的挖掘效率。
2、第一方面,本申请实施例提供了一种频繁子图挖掘方法,包括:
3、获取已构建的知识图谱;
4、从所述知识图谱中选取包括设定属性的目标实体的初始频繁子图,以及与所述目标实体关联的频繁边;
5、根据所述初始频繁子图中任意的第一目标实体的第一类型和第一值域,以及所述频繁边对应的第二目标实体的第二类型和第二值域,生成候选子图;
6、根据所述候选子图确定目标频繁子图。
7、第二方面,本申请实施例提供了一种频繁子图挖掘装置,包括:
8、图谱获取单元,用于获取已构建的知识图谱;
9、选取单元,用于从所述知识图谱中选取包括设定属性的目标实体的初始频繁子图,以及与所述目标实体关联的频繁边;
10、第一子图生成单元,用于根据所述初始频繁子图中任意的第一目标实体的第一类型和第一值域,以及所述频繁边对应的第二目标实体的第二类型和第二值域,生成候选子图;
11、第一频繁子图确定单元,用于根据所述候选子图确定目标频繁子图。
12、第三方面,本申请实施例提供了一种终端设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,上述处理器执行所述计算机程序时实现如上述第一方面中任一项所述的频繁子图挖掘方法。
13、第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述的频繁子图挖掘方法。
14、第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备可执行上述第一方面中任一项所述的频繁子图挖掘方法。
15、本申请实施例与现有技术相比存在的有益效果是:
16、本申请实施例提供的一种频繁子图挖掘方法,同构获取已构建的知识图谱;从知识图谱中选取包括设定属性的目标实体的初始频繁子图,以及与目标实体关联的频繁边;根据初始频繁子图中任意的第一目标实体的第一类型和第一值域,以及频繁边对应的第二目标实体的第二类型和第二值域,生成候选子图; 根据候选子图确定目标频繁子图。与现有技术生成大量的候选子图相比,本申请需要根据初始频繁子图和频繁边对应的各个实体的类型和值域生成候选子图,从而减少了生成的候选子图的数量,进而减少了终端设备的计算开销,提高了对频繁子图的挖掘效率。
1.一种频繁子图挖掘方法,其特征在于,包括:
2.如权利要求1所述的频繁子图挖掘方法,其特征在于,所述根据所述初始频繁子图中任意的第一目标实体的第一类型和第一值域,以及所述频繁边对应的第二目标实体的第二类型和第二值域,生成候选子图,包括:
3.如权利要求2所述的频繁子图挖掘方法,其特征在于,所述根据所述初始频繁子图、所述频繁边以及所述第二目标实体生成第一子图,包括:
4.如权利要求3所述的频繁子图挖掘方法,其特征在于,所述根据所述候选子图确定目标频繁子图,包括:
5.如权利要求4所述的频繁子图挖掘方法,其特征在于,所述根据所述第五值域和所述第三值域,确定所述目标频繁子图,包括:
6.如权利要求5所述的频繁子图挖掘方法,其特征在于,在计算所述候选子图的第一支持度之后,还包括:
7.如权利要求6所述的频繁子图挖掘方法,其特征在于,所述确定包含所述第三实例的所述候选子图的第二同构子图,包括:
8.如权利要求7所述的频繁子图挖掘方法,其特征在于,所述根据所述第四实例的属性确定所述第二同构子图,包括:
9.如权利要求6所述的频繁子图挖掘方法,其特征在于,在计算所述候选子图的第二支持度之后,还包括:
10.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至9任一项所述的频繁子图挖掘方法。