
1.本技术涉及数据处理技术领域,尤其涉及一种基于图数据库的数据共享方法及装置。
背景技术:2.随着互联网技术的快速发展,支持海量数据分析的图数据库在实现多种任务需求时得到了广泛的应用。图数据库可以实现客户关系图谱查询、客户关系链路追踪以及核心客户发现等任务需求,有效解决企业因数据缺失而无法有效拓展业务客户的问题。
3.一般情况下,不同的业务使用不同的图数据库,而不同的图数据库会将数据存储在各自对应的存储空间中,当存在关联关系的两个业务需要使用同一份数据时,该份数据需要两个业务分别对应的图数据库进行数据共享,并通过进一步的数据下载和数据交互才能得到。但不同图数据库之间需要经过请求使用、同意授权、数据下载等复杂的步骤才能进行数据共享,影响了图数据库的使用效率。
4.因此,如何使不同图数据库之间的数据进行数据共享,提高图数据库的使用效率,成为目前亟待解决的问题。
技术实现要素:5.有鉴于此,本技术实施例提供了一种基于图数据库的数据共享方法及装置,旨在提高图数据库的使用效率。
6.第一方面,本技术实施例提供了一种基于图数据库的数据共享方法,所述方法包括:
7.确定目标业务需求对应的目标图数据库;
8.通过所述目标图数据库对所述目标业务需求进行分析,获得与所述目标业务需求对应的目标数据请求;
9.通过预先构建的数据源库对所述目标数据请求进行查询,获得与所述目标数据请求对应的第一目标数据,所述数据源库包括多个图数据库的数据。
10.可选地,所述通过预先构建的数据源库对所述目标数据请求进行查询,获得与所述目标数据请求对应的第一目标数据,包括:
11.通过与所述数据源库对应的元数据集群对所述目标数据请求进行查询,获得与所述目标数据请求对应的目标元数据;
12.根据所述目标元数据进行查询,获得所述第一目标数据。
13.可选地,所述根据所述目标元数据进行查询,获得所述第一目标数据,包括:
14.根据所述目标元数据进行查询,获得与所述目标数据请求对应的第二目标数据;
15.通过数据转化工具将所述第二目标数据的数据类型转化为所述目标图数据库所需的数据类型,获得所述第一目标数据。
16.可选地,在所述获得与所述目标数据请求对应的第二目标数据之后,还包括:
17.通过所述数据源库对所述第二目标数据进行计算,获得所述第二目标数据对应的目标视图;
18.所述通过数据转化工具将所述第二目标数据的数据类型转化为所述目标图数据库所需的数据类型,获得所述第一目标数据,具体为:
19.通过所述数据复制工具将所述目标视图的类型转化为所述目标图数据库所需的数据类型,获得所述第一目标数据。
20.可选地,所述数据源库通过对象存储cos存储数据。
21.可选地,所述数据源库包括分布式并行结构化数据库集群mpp。
22.可选地,所述目标图数据库包括图分析平台tigergraph。
23.第二方面,本技术实施例提供了一种基于图数据库的数据共享装置,所述装置包括:
24.确定模块,用于确定目标业务需求对应的目标图数据库;
25.分析模块,用于通过所述目标图数据库对所述目标业务需求进行分析,获得与所述目标业务需求对应的目标数据请求;
26.查询模块,用于通过预先构建的数据源库对所述目标数据请求进行查询,获得与所述目标数据请求对应的目标数据,所述数据源库包括多个图数据库的数据。
27.第三方面,本技术实施例提供了一种基于图数据库的数据共享设备,所述设备包括:
28.存储器,用于存储计算机程序;
29.处理器,用于执行所述计算机程序,以使所述设备执行前述第一方面所述的基于图数据库的数据共享方法。
30.第四方面,本技术实施例提供了一种计算机存储介质,所述计算机可读存储介质上存储有计算机程序,当所述计算机程序被运行时,运行所述计算机程序的设备实现前述第一方面所述的基于图数据库的数据共享方法。
31.相较于现有技术,本技术实施例具有以下有益效果:
32.本技术实施例提供了一种基于图数据库的数据共享方法及装置,在该方法中,首先,确定目标业务需求对应的目标图数据库;然后,通过目标图数据库对目标业务需求进行分析,获得与目标业务需求对应的目标数据请求;最后,通过预先构建的数据源库对目标数据请求进行查询,获得与目标数据请求对应的第一目标数据,数据源库包括多个图数据库的数据。可见,该方法中,根据通过目标图数据库对目标任务需求分析得到的目标数据请求,从预先构建的包括了多个图数据库数据的数据源库中进行查询,得到所需要的第一目标数据,避免目标图数据库需要其他图数据库中的数据时,进行请求使用、同意授权和数据下载等复杂步骤,从根本上实现了多个图数据库之间的数据共享,从而提高了图数据库的使用效率。
附图说明
33.为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这
些附图获得其他的附图。
34.图1为本技术实施例提供的一种基于图数据库的数据共享方法的应用场景;
35.图2为本技术实施例提供的一种基于图数据库的数据共享方法的流程图;
36.图3为本技术实施例提供的一种基于图数据库的数据共享方法装置的结构示意图。
具体实施方式
37.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
38.目前,一般情况下,不同的业务使用不同的图数据库,而不同的图数据库会将数据存储在各自对应的存储空间中,当存在关联关系的两个业务需要使用同一份数据时,该份数据需要两个业务分别对应的图数据库进行数据共享,并通过进一步的数据下载和数据交互才能得到。但不同图数据库之间需要经过请求使用、同意授权等复杂的步骤才能进行数据共享,影响了图数据库的使用效率。因此,如何使不同图数据库之间的数据进行数据共享,提高图数据库的使用效率,成为目前亟待解决的问题。
39.基于此,为了解决上述问题,本技术实施例提供了一种基于图数据库的数据共享方法及装置,在该方法中,首先,确定目标业务需求对应的目标图数据库;然后,通过目标图数据库对目标业务需求进行分析,获得与目标业务需求对应的目标数据请求;最后,通过预先构建的数据源库对目标数据请求进行查询,获得与目标数据请求对应的第一目标数据,数据源库包括多个图数据库的数据。可见,该方法中,根据通过目标图数据库对目标任务需求分析得到的目标数据请求,从预先构建的包括了多个图数据库数据的数据源库中进行查询,得到所需要的第一目标数据,避免目标图数据库需要其他图数据库中的数据时,进行请求使用、同意授权和数据下载请求使用、同意授权和数据下载等复杂步骤,从根本上实现了多个图数据库之间的数据共享,从而提高了图数据库的使用效率。
40.举例来说,本技术实施例的场景之一,可以是应用到如图1所示的场景中。该场景包括数据库101和服务器102,其中,数据库101包括多个任务需求对应的多个图数据库,服务器102采用本技术实施例提供的实施方式,从数据库101中确定目标任务需求对应的目标图数据库,采用本技术实施例提供的实施方式进行不同图数据库之间的数据共享。
41.首先,在上述应用场景中,虽然将本技术实施例提供的实施方式的动作描述由服务器102执行;但是,本技术实施例在执行主体方面不受限制,只要执行了本技术实施例提供的实施方式所公开的动作即可。
42.其次,上述场景仅是本技术实施例提供的一个场景示例,本技术实施例并不限于此场景。
43.下面结合附图,通过实施例来详细说明本技术实施例中基于图数据库的数据共享方法及装置的具体实现方式。
44.参见图2,该图为本技术实施例提供的一种基于图数据库的数据共享方法的流程图,结合图2所示,具体可以包括:
45.s201:确定目标业务需求对应的目标图数据库。
46.先根据目标业务的业务需求确定与该目标业务需求对应的目标图数据库,一般情况下,不同的业务对应不同的图数据库。举例来说,目标业务可以是客户的关系图谱查询,比如客户同年龄段的朋友、亲戚等关系图谱查询;也可以是核心客户的发现,针对不同业务需求对应的不同客户群体,发现核心客户;还可以是社区发现,例如根据客户的社交网络找出其社区结构,以进行后续相关业务的推荐。当然,也可以是其他目标业务,并不影响本技术实施例的实现。
47.在一种可能的实施方式中,目标图数据库可以是图分析平台tigergraph。tigergraph图数据库是企业级可扩展图数据库,其连接了数据孤岛,可进行大规模、深入的运营分析。实现不同领域内实时欺诈检测、护理路径建议、个性化推荐等多种不同业务。利用tigergraph图数据库可以深度挖掘企业供应链上下游链路图谱,聚焦高价值客户,精准锁定营销目标,有效解决因上游客户信息缺失而无法有效拓展客户的瓶颈问题,提升业务实现的成功率。当然,也可以采用其他图数据库,并不影响本技术实施例的实现。
48.s202:通过目标图数据库对目标业务需求进行分析,获得与目标业务需求对应的目标数据请求。
49.通过图数据库对目标业务需求进行分析,得到实现目标业务需求需要何种数据的目标数据请求。
50.s203:通过预先构建的数据源库对目标数据请求进行查询,获得与目标数据请求对应的第一目标数据,数据源库包括多个图数据库的数据。
51.预先将多种业务需求对应的多个图数据库的数据存储在数据源库中,通过该预先构建好的数据源库对目标数据请求进行查询,得到与目标数据请求对应的第一目标数据。
52.在一种可能的实施方式中,数据源库可以是分布式并行结构化数据库集群mpp。mpp数据库中包括多个节点,每个节点都有独立的磁盘存储系统和内存系统,可以将多个图数据库的数据存储到各个节点上,每个节点通过专用网络或者商业通用网络互相连接,彼此之间可以进行协同计算,作为整体为多个图数据库提供服务。目标图数据库可以通过mpp中其他图数据库对应的节点上获取所需要的目标数据。当然,也可以采用其他数据源库,并不影响本技术实施例的实现。
53.在一种可能的实施方式中,mpp数据库可以设置每个图数据库的访问权限,使存在关联关系的目标任务对应的目标图数据库可以在mpp数据库中,获取有关联关系图数据库中的目标数据,既实现了不同图数据库之间的数据共享,又保证了数据安全的问题。
54.其中,本技术实施例可不具体限定数据源库存储数据的具体方式,为了便于理解,下面结合一种可能的实施方式进行说明。
55.在一种可能的实施方式中,数据源库将多个图数据库的数据通过对象存储cos进行存储。因此,数据源库具体可以通过对象存储cos存储数据。其中,对象存储cos是腾讯云提供的一种用于存储海量文件的简单、可拓展、方便获取和分享数据的分布式存储服务,通过其可以对多个图数据库的海量数据进行分布式存储,以便对不同图数据库的海量数据进行查询。
56.基于上述s201-s203的相关内容可知,本技术实施例中,首先,确定目标业务需求对应的目标图数据库;然后,通过目标图数据库对目标业务需求进行分析,获得与目标业务
需求对应的目标数据请求;最后,通过预先构建的数据源库对目标数据请求进行查询,获得与目标数据请求对应的第一目标数据,数据源库包括多个图数据库的数据。可见,该方法中,根据通过目标图数据库对目标任务需求分析得到的目标数据请求,从预先构建的包括了多个图数据库数据的数据源库中进行查询,得到所需要的第一目标数据,避免目标图数据库需要其他图数据库中的数据时,进行请求使用、同意授权和数据下载等复杂步骤,从根本上实现了多个图数据库之间的数据共享,从而提高了图数据库的使用效率。
57.在本技术实施例中,s203具体可以包括如下s2031-s2032:
58.s2031:通过与数据源库对应的元数据集群对目标数据请求进行查询,获得与目标数据请求对应的目标元数据;
59.在数据源库中获得通过图数据库分析得到的目标数据请求后,通过与数据源库对应的元数据集群对目标数据请求进行查询,得到与目标数据请求对应的目标元数据。其中,元数据集群是数据源库的管理节点,用于管理与数据源库对应的元数据。元数据是指用来描述数据的数据,主要用来描述数据的属性信息,用于支持指示存储位置、历史数据、资源查找、文件记录等功能。查询得到与目标数据请求对应的目标元数据,是为了快速找到对应的目标数据,提高数据查询速度。
60.s2032:根据目标元数据进行查询,获得第一目标数据。
61.根据元数据进行查询得到与目标数据请求对应的第一目标数据。先查询元数据,再根据元数据查询得到目标数据,可以提高在数据源库存储的海量数据中寻找目标业务需求对应的目标数据的速度。
62.对于第一目标数据的具体获得过程,本技术实施例可不具体限定,为了便于理解,下面结合一种可能的实施方式进行说明。
63.在一种可能的实施方式中,在数据源库中根据目标元数据进行查询得到第二目标数据后,可以通过数据转化工具将第二目标数据的数据类型转换为目标图数据库所需的数据类型,得到第一目标数据,以便将第一目标数据复制到目标图数据库中。因此,s032具体可以包括:根据目标元数据进行查询,获得与目标数据请求对应的第二目标数据;通过数据转化工具将第二目标数据的数据类型转化为目标图数据库所需的数据类型,获得第一目标数据。其中,目标图数据所需的数据类型具体为,以点和边为基础存储单元,每个点表示不同的实体,不同点之间的边表示不同点对应的不同实体之间的关系。
64.另外,根据目标数据请求,可以通过数据源库对第二目标数据进行计算,将计算结果生成相对应的目标视图,以便通过数据转化工具将目标视图转换为目标图数据库所需的数据类型,得到第一目标数据。因此,在本技术可选实施例中,方法还包括s1:通过数据源库对第二目标数据进行计算,获得第二目标数据对应的目标视图。相应地,通过数据转化工具将第二目标数据的数据类型转化为目标图数据库所需的数据类型,获得第一目标数据,具体为:通过数据复制工具将目标视图的类型转化为目标图数据库所需的数据类型,获得第一目标数据。
65.其中,视图是一个虚拟表,与真实表相同,同样包含一系列带有名称的行数据和列数据,视图中的数据根据由目标数据请求对第二目标数据进行计算得到的结果生成。若目标业务需求所需目标数据需要与其对应的目标图数据库与其他图数据库的数据进行交互计算得到时,该方法可以在数据源库中将多个图数据库的数据进行交互计算,再在目标图
数据库中使用计算得到的目标视图的计算结果满足目标任务需求,避免了目标图数据库需要获取数据源库中其他图数据库中的数据进行请求使用、同意授权以及数据下载等复杂步骤,也避免了数据源库中存储的不同图数据库的数据存在重复的问题,能够在很大程度上节省数据源库中磁盘的存储空间。
66.以上为本技术实施例提供的基于图数据库的数据共享方法的一些具体实现方式,基于此,本技术还提供了对应的装置。下面将从功能模块化的角度对本技术实施例提供的装置进行介绍。
67.参见图3,该图为本技术实施例提供的一种基于图数据库的数据共享装置300的结构示意图,该装置300可以包括:
68.确定模块301,用于确定目标业务需求对应的目标图数据库;
69.分析模块302,用于通过目标图数据库对目标业务需求进行分析,获得与目标业务需求对应的目标数据请求;
70.查询模块303,用于通过预先构建的数据源库对目标数据请求进行查询,获得与目标数据请求对应的目标数据,数据源库包括多个图数据库的数据。
71.在本技术实施例中,通过确定模块301、分析模块302以及查询模块303这3个模块的配合,根据通过目标图数据库对目标任务需求分析得到的目标数据请求,从预先构建的包括了多个图数据库数据的数据源库中进行查询,得到所需要的第一目标数据,避免目标图数据库需要其他图数据库中的数据时,进行请求使用、同意授权和数据下载等复杂步骤,从根本上实现了多个图数据库之间的数据共享,从而提高了图数据库的使用效率。
72.作为一种实施方式,查询模块303,具体可以包括:
73.第一查询单元,用于通过与数据源库对应的元数据集群对目标数据请求进行查询,获得与目标数据请求对应的目标元数据;
74.第二查询单元,用于根据目标元数据进行查询,获得第一目标数据。
75.作为一种实施方式,第二查询单元,具体可以用于:
76.根据目标元数据进行查询,获得与目标数据请求对应的第二目标数据;
77.通过数据转化工具将第二目标数据的数据类型转化为目标图数据库所需的数据类型,获得第一目标数据。
78.作为一种实施方式,该基于图数据库的数据共享装置300装置,还可以包括:
79.计算模块,用于通过数据源库对第二目标数据进行计算,获得第二目标数据对应的目标视图;
80.相应地,通过数据转化工具将第二目标数据的数据类型转化为目标图数据库所需的数据类型,获得第一目标数据,具体为:
81.通过数据复制工具将目标视图的类型转化为目标图数据库所需的数据类型,获得第一目标数据。
82.作为一种实施方式,查询模块303中的数据源库通过对象存储cos存储数据。
83.作为一种实施方式,查询模块303中的数据源库包括分布式并行结构化数据库集群mpp。
84.作为一种实施方式,确定模块301中的目标图数据库包括图分析平台tigergraph。
85.本技术实施例还提供了对应的设备以及计算机存储介质,用于实现本技术实施例
提供的方案。
86.其中,所述设备包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序,以使所述设备执行本技术任一实施例所述的基于图数据库的数据共享方法。
87.所述计算机存储介质中存储有计算机程序,当所述计算机程序被运行时,运行所述计算机程序的设备实现本技术任一实施例所述的基于图数据库的数据共享方法。本技术实施例中提到的“第一”、“第二”(若存在)等名称中的“第一”、“第二”只是用来做名字标识,并不代表顺序上的第一、第二。
88.通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加通用硬件平台的方式来实现。基于这样的理解,本技术的技术方案可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如只读存储器(英文:read-only memory,rom)/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如路由器等网络通信设备)执行本技术各个实施例或者实施例的某些部分所述的方法。
89.需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元提示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
90.以上所述,仅为本技术的一种具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应该以权利要求的保护范围为准。