一种数据处理方法、装置、设备及计算机可读存储介质与流程

文档序号:28952868发布日期:2022-02-19 11:05阅读:58来源:国知局
一种数据处理方法、装置、设备及计算机可读存储介质与流程

1.本发明涉及数据分析技术领域,尤其涉及一种数据处理方法、装置、设备及计算机可读存储介质。


背景技术:

2.数据仓库的多维数据模型是为了满足用户从多角度、多层次进行数据查询和分析的需要,而建立起来的基于事实表和维的数据库模型,基本的应用是为了实现联机分析处理(online analytical processing,olap)。
3.当然,通过多维数据模型的数据展示、查询和获取就是其作用的展现,但其真实作用的实现在于,通过数据仓库可以根据不同的数据需求建立起各类多维模型,并组成数据集市开放给不同的用户群体使用,也就是根据需求定制的各类数据商品摆放在数据集市中供不同的数据消费者进行采购。
4.相关技术中,这种多维数据模型的实现方式一般是基于hadoop生态圈来完成数据维度及度量的数据膨胀。通常使用hadoop生态圈来完成数据膨胀需要部署多个节点来完成数据的计算,即分治思想的具体实现。但是,hadoop通常用于亿万级规模的数据量,对于千万级规模的数据量来说,部署多节点会造成部分节点的资源使用不饱和,即造成硬件资源的浪费。而且如果用关系型数据模型去进行数据膨胀时,千万级规模数据量用结构化查询语言进行数据膨胀时需要人为进行大量复杂的操作,且数据膨胀性能欠佳。也就是说,相关技术中,针对千万级规模数据量的数据处理缺少性能优良的处理方法。


技术实现要素:

5.本发明期望提供一种数据处理方法、装置、设备及计算机可读存储介质,可以提高数据处理的效率。
6.本发明的技术方案是这样实现的:
7.一种数据处理方法,包括:接收数据源配置参数,根据所述数据源配置参数与目标数据源建立连接;所述数据源配置参数用于表征所述目标数据源的描述信息,所述目标数据源中包括多个数据表;接收数据选择指令,根据所述数据选择指令,从所述多个数据表中确定至少一个度量表和至少一个维度表;接收数据关联指令,根据所述数据关联指令中包括的关联关系,将所述至少一个度量表和所述至少一个维度表按照数据关联模型进行相互关联;接收参数设定指令,根据所述参数设定指令生成膨胀信息;采用所述膨胀信息,对关联后的所述至少一个度量表和所述至少一个维度表进行数据膨胀,获得数据立方体。
8.一种数据处理装置,包括:业务数据层,用于接收数据源配置参数,根据所述数据源配置参数与目标数据源建立连接;所述数据源配置参数用于表征所述目标数据源的描述信息;所述目标数据源中包括多个数据表;数据仓库层,用于接收数据选择指令,根据所述数据选择指令从所述多个数据表中确定至少一个度量表和至少一个维度表;关系层,用于接收数据关联指令,根据所述数据关联指令中包括的关联关系,将所述至少一个度量表和
所述至少一个维度表按照数据关联模型进行相互关联;引擎层,用于接收参数设定指令,根据所述参数设定指令生成膨胀信息;采用所述膨胀信息,对关联后的所述至少一个度量表和所述至少一个维度表进行数据膨胀,获得数据立方体。
9.一种数据处理设备,包括:存储器,用于存储可执行数据指令;处理器,用于执行所述存储器中存储的可执行指令时,实现上述的数据处理的方法。
10.一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行时,实现上述的数据处理的方法。
11.本发明提供的数据处理方法、装置、设备及计算机可读存储介质,接收数据源配置参数,根据数据源配置参数与目标数据源建立连接;目标数据源中包括多个数据表;接收数据选择指令,根据数据选择指令从多个数据表中确定至少一个度量表和至少一个维度表;接收数据关联指令,根据数据关联指令中包括的关联关系,将至少一个度量表和至少一个维度表按照数据关联模型进行相互关联;接收参数设定指令,根据参数设定指令生成膨胀信息;采用所述膨胀信息,对关联后的所述至少一个度量表和所述至少一个维度表进行数据膨胀,获得数据立方体。采用本技术方案,由于根据用户输入的多个不同指令,便可进行维度表和度量表的生成与关联,用户所需膨胀信息的生成,以及对关联后的维度表和度量表的数据膨胀处理,从而获得用户所需的数据立方体,所以,用户仅需输入多个不同的指令,便可快速获得所需的数据立方体,提高了数据处理的效率;而且,由于本发明的数据处理方法可以在一个装置中进行数据膨胀处理,因而,不会存在因部署多个节点进行数据膨胀而造成部分节点的资源使用不饱和,从而造成硬件资源的浪费的问题。
附图说明
12.图1为本发明实施例提供的数据处理方法的一个可选的流程示意图;
13.图2为本发明实施例提供的示例性的一个雪花模型的数据立方体;
14.图3为本发明实施例提供的数据处理方法的另一个可选的流程示意图;
15.图4为本发明实施例提供的数据处理方法的又一个可选的流程示意图;
16.图5为本发明实施例提供的数据处理方法的再一个可选的流程示意图;
17.图6为本发明实施例提供的数据处理方法的另一个可选的流程示意图;
18.图7为本发明实施例提供的数据处理方法的又一个可选的流程示意图;
19.图8为本发明实施例提供的数据处理装置的结构示意图;
20.图9为本发明实施例提供的数据处理设备的结构示意图。
具体实施方式
21.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
22.在以下的描述中,涉及到“本发明的实施例”,其描述了所有可能实施例的子集,但是可以理解,“本发明的实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
23.在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定
的顺序或先后次序,以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。
24.除非另有定义,本发明实施例所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本发明实施例中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。
25.图1是本发明实施例提供的数据处理方法的一个可选的流程示意图,将结合图1示出的步骤进行说明。本发明实施例中的数据处理方法应用于安装有数据处理应用程序的装置,所述装置通过调用该数据处理应用程序实现数据膨胀;所述数据处理应用程序可以以插件的形式存储在所述装置中。
26.s101、接收数据源配置参数,根据数据源配置参数与目标数据源建立连接;数据源配置参数用于表征目标数据源的描述信息,目标数据源中包括多个数据表。
27.在本发明的实施例中,装置可以接收用户输入的表征目标数据源的描述信息的数据源配置参数,根据该数据源配置参数与目标数据源建立连接。装置可以根据用户输入的配置信息,与多种类型的数据源进行连接。示例的,数据源可以包括mysql、oracle和postgresql等,并且,每个数据源中均包括了多个数据表,本发明对数据源的种类不作具体限定。
28.在本发明的实施例中,当用户通过数据源配置参数配置好需要连接的目标数据源,且装置与目标数据源建立连接后,装置可以接收用户输入的测试指令,根据测试指令来测试是否与目标数据源连通,当不连通时,可以向用户发送提示信息,以使用户重新配置数据源配置参数;当连通时,装置展示数据源中的多个数据表。
29.在本发明的实施例中,数据源配置参数可以是目标数据源的链接,装置可以根据用户输入的链接而访问目标数据源,从而与目标数据源建立连接。在本发明的一些实施例中,装置可以将用户输入的数据源配置参数进行存储,以在用户下次进行数据源配置参数的输入时,直接显示所存储的数据源配置信息,从而提高数据源的连接效率。
30.在本发明的实施例中,装置在与目标数据源连接成功后,可以向用户展示目标数据源中的多个数据表以及数据表结构,以供用户进行数据表结构的查看,数据表中的字段的筛选,以及对数据表中的字段类型和字段大小的修改等。
31.s102、接收数据选择指令,根据数据选择指令从多个数据表中确定至少一个度量表和至少一个维度表。
32.在本发明的实施例中,装置可以接收用户输入的数据选择指令,解析出数据选择指令中包含的指示信息,根据指示信息从多个数据表中确定出至少一个度量表和至少一个维度表。
33.s103、接收数据关联指令,根据数据关联指令中包括的关联关系,将至少一个度量表和至少一个维度表按照数据关联模型进行相互关联。
34.在本发明的实施例中,当确定出至少一个度量表和至少一个维度表,且接收到用户输入的数据关联指令后,装置可以从数据关联指令中解析出用户设定的该至少一个度量表和该至少一个维度表之间的关联关系,根据该关联关系将该至少一个度量表和该至少一个维度表按照数据关联模型进行关联。
35.在本发明的实施例中,所述数据关联模型可以包括雪花模型、星型模型和星座模
型中的至少一种。示例性的,装置可以将该至少一个度量表和该至少一个维度表按照雪花模型进行关联,由于雪花模型具有父子关系,因此采用雪花模型可以获得较好的扩展性。
36.图2是本发明实施例提供的示例性的一个雪花模型的数据立方体;如图2所示,事实表里面主要包含两方面的信息:维(即维度)和度量,维度的具体描述信息记录在维度表,事实表中的维度属性只是一个关联到维度表的键,并不记录具体信息;而度量一般都会记录事件的相应数值,例如,产品的销售数量、销售额等。维度表中的信息一般是可以分层的,例如,图2所示,“时间维”的维度表中的“年”、“月”、“日”,以及,“地域维”的维度表中的“省”、“市”、“县”等,这类分层的信息就是为了满足事实表中的度量可以在不同的粒度上完成膨胀(即聚合),例如,维度和度量聚合后可以形成例如“2010年商品的销售额”,“来自上海市的销售额”等多个聚合后的数据。
37.s104、接收参数设定指令,根据参数设定指令生成膨胀信息。
38.由于不同业务和不同的用户所需的数据立方体并不相同,因而所需要的膨胀信息也并不相同。在本发明的实施例中,装置可以接收用户输入的参数设定指令,解析出参数设定指令中包含的参数信息,并根据参数信息生成用户所需的膨胀信息。在本发明的实施例中,参数设定指令可以包括时间点、频率和膨胀字段等。
39.在本发明的实施例中,膨胀信息包括膨胀模板和膨胀任务;其中,膨胀模板包括:膨胀字段、驱动表、非驱动表组、驱动表执行顺序、非驱动表执行顺序和指标计算逻辑。膨胀任务包括:膨胀模板的执行频率和执行时间。例如,当生成一个度量表和两个维度表,且已将该度量表与两个维度表关联时,装置可以根据用户发送的参数设定指令,从生成的维度表或度量表中选择该指令所指向的膨胀字段,以及,将指令所指向的维度表或度量表设定为驱动表,并将指令所指向的度量表或维度表设定为非驱动表,并根据指令设定非驱动表和驱动表之间的具体执行顺序,以及根据指令设定度量表中各个度量之间的计算逻辑。
40.这里,执行时间是进行膨胀的具体时间点,例如,17:00。膨胀字段是指用户从关联后的维度表或度量表中所选择的字段;驱动表组为用户从关联后的维度表或度量表中所指定的数据表,非驱动表组为关联后的维度表或度量表中所有未被指定为驱动表的数据表。驱动表组执行顺序表示各个驱动表的先后执行顺序,非驱动表组执行顺序表示各个非驱动表的先后执行顺序。指标计算逻辑则表示关联后的度量表中各个度量之间的计算关系,例如,(度量1+度量2)*度量3。
41.在本发明的一些实施例中,驱动表为关联后的维度表中数据量最小的一个维度表,或关联后的度量表中数据量最小的一个度量表;如此,可以获得好的数据膨胀效果。在本发明的一些实施例中,数据量为维度表或度量表中所包括的字段的数目。
42.s105、采用膨胀信息,对关联后的至少一个度量表和至少一个维度表进行数据膨胀,获得数据立方体。
43.在本发明的实施例中,装置在生成膨胀模板和膨胀任务后,可以根据生成的膨胀模板和膨胀任务,对已关联好的维度表和度量表进行groupby计算,进而获得用户所需的数据立方体,并将数据立方体输入cube数据库中进行存储,以供用户使用。例如,当生成一个度量表和两个维度表,且已选定了膨胀字段、设定了驱动表、非驱动表、非驱动表和驱动表之间的具体执行顺序,以及设定了度量表中各个度量之间的计算逻辑之后,装置可以将关联后的维度表和度量表进行groupby计算,最终生成数据立方体。
44.上述实施例中,由于装置根据用户输入的多个不同指令,便可进行维度表和度量表的生成与关联,用户所需膨胀信息的生成,以及对关联后的维度表和度量表的数据膨胀处理,从而获得用户所需的数据立方体,所以,用户仅需输入多个不同的指令,便可快速获得所需的数据立方体,提高了数据处理的效率;而且,由于本发明的数据处理方法可以在一个装置中进行数据膨胀处理,因而,不会存在因部署多个节点进行数据膨胀而造成部分节点的资源使用不饱和,造成硬件资源的浪费的问题。
45.在本发明的一些实施例中,每个度量表和每个维度表均包括关联关系字段;上述s103可以通过s1031实现,具体为:
46.s1031、接收数据关联指令,根据数据关联指令中包括的关联关系和至少一个度量表与至少一个维度表中的关联关系字段,将至少一个度量表和至少一个维度表按照数据关联模型进行相互关联。
47.在本发明的实施例中,装置在接收数据关联指令后,可以解析出数据关联指令中用户所设定的关联关系,根据用户所设定的关联关系和该至少一个度量表中的关联关系字段与至少一个维度表中的关联关系字段,将该至少一个度量表与该至少一个维度表按照数据关联模型进行相互关联。例如,当数据关联指令中包括维度表1中的字段a和度量表中的字段b时,装置可以将维度表1中的字段a与维度表1中的字段b进行关联。又例如,生成的维度表为:表a、表b和表c;生成的度量表为:表1和表2;并且,用户的关联指令为表a、表b与表1关联,表c与表2关联时,装置可以根据各个表中的关联关系字段,将表a、表b与表1进行关联,并将表c与表2进行关联。
48.在本发明的一些实施例中,上述s105可以通过s1051实现,具体为:
49.s1051、采用膨胀信息,对关联后的至少一个度量表和至少一个维度表进行多维度笛卡尔积计算,获得数据立方体。
50.在本发明的实施例中,装置在生成膨胀模板和膨胀任务后,可以根据生成的膨胀模板和膨胀任务,对已关联好的维度表和度量表进行多维度笛卡尔积的计算,进而获得用户所需的数据立方体,并将数据立方体输入cube数据库中进行存储,以供用户使用。例如,当生成一个度量表和两个维度表,且已选定了膨胀字段、设定了驱动表、非驱动表、非驱动表和驱动表之间的具体执行顺序,以及设定了度量表中各个度量之间的计算逻辑之后,装置可以计算关联后的维度表和度量表的多维度笛卡尔积,并将最终的计算结果作为生成的数据立方体。
51.图3是本发明实施例提供的数据处理方法的另一个可选的流程示意图,图1中的s102可以通过s1021-s1023实现,将结合图3示出的步骤进行说明。
52.s1021、接收数据选择指令,根据数据选择指令,从多个数据表中选择第一目标数据表;第一目标数据表为数据选择指令所指定的数据表。
53.在本发明的实施例中,当用户确定多个数据表中存在与所需要的度量表或维度表相同的数据表,且输入数据选择指令时,装置可以解析出数据选择指令中包含的数据表的标识,根据数据表标识直接从多个数据表中选取对应的数据表。
54.s1022、将第一目标数据表中的第一数据表作为维度表;第一数据表中的字段表征维度信息。
55.在本发明的实施例中,当用户根据数据表中的字段,确定该数据表中的字段均表
征维度信息,且输入数据选择指令时,装置便可根据数据选择指令中的数据表标识,将对应的数据表作为维度表。
56.s1023、将第一目标数据表中的第二数据表作为度量表;第二数据表中的字段表征度量信息。
57.在本发明的实施例中,当用户根据数据表中的字段,确定该数据表中的字段均表征度量信息,且输入数据选择指令时,装置便可根据数据选择指令中的数据表标识,将对应的数据表作为度量表。
58.图4是本发明实施例提供的数据处理方法的又一个可选的流程示意图,数据选择指令包括数据表选择指令和字段选择指令;图1中的s102可以通过s1024-s1026实现,将结合图4示出的步骤进行说明。
59.s1024、接收数据表选择指令,根据数据表选择指令从多个数据表中选取第二目标数据表;每个数据表中均包含字段;第二目标数据表为数据表选择指令所指定的数据表。
60.在本发明的实施例中,当用户通过查看数据表的字段而确定某些数据表中存在所需的维度信息或度量信息,且输入包括该些数据表标识的数据表选择指令时,装置可根据该数据表选择指令,从多个数据表中选择相应的数据表。
61.在本发明的实施例中,每个数据表中均包括字段,且每个数据表中的数据为表中所包括的字段。
62.s1025、接收字段选择指令,根据字段选择指令对第二目标数据表中的目标字段进行标记,获得带有标记的第二目标数据表;目标字段为字段选择指令所指定的字段。
63.在本发明的实施例中,当装置接收到用户输入的数据表查看指令后,向用户展示相应数据表的表结构和数据表中的字段等信息,并支持用户对数据表内字段的筛选、字段类型的筛选,以及字段大小的修改。
64.在本发明的实施例中,当所选择的数据表中包括了较多数据膨胀时不需要的字段时,用户可以通过向装置发送字段选择指令,来对数据膨胀时所需的字段进行筛选。装置根据接收到的字段选择指令,将对应的数据表中字段选择指令所指向的字段进行标记;并在接收到用户发送的字段选择结束指令时,装置根据该字段选择结束指令,将带有标记的数据表进行本地存储。
65.s1026、根据带有标记的数据表,生成包括目标字段的至少一个度量表和包括目标字段的至少一个维度表。
66.在本发明的实施例中,装置在将带有标记的数据表进行本地存储后,可以对存储后带有标记的数据表进行数据清洗,从而生成至少一个度量表和至少一个维度表。在本发明的实施例中,一个带有标记的数据表生成包括目标字段的一个维度表或包括目标字段的一个度量表。
67.在本发明的一些实施例中,上述s1026可以通过s1实现,具体如下:
68.s1、对带有标记的数据表做抽取转换操作,生成包括目标字段的至少一个度量表和包括目标字段的至少一个维度表。
69.在本发明的实施例中,装置可以对每个带有标记的数据表进行抽取转换操作,生成一个维度表或度量表并进行存储。该度量表或维度表包括了带有标记的数据表中被标记的所有字段。例如,当所标记的字段均是维度字段时,生成的数据表为维度表;当所标记的
字段均是度量字段时,生成的数据表为维度表。在发明的实施例中,装置可以将生成的维度表和度量表进行本地存储。
70.在上述实施例中,由于装置可以直观的显示数据表和相应的数据表结构,并支持用户对数据表内的字段的勾选,以生成要关联的数据表,所以,相比于相关技术中在数据库语言中通过命令行中的命令进行要关联的数据的选择而言,可操作性更强,更简单直观。
71.图5是本发明实施例提供的数据处理方法的再一个可选的流程示意图,在图1中的s102之前包括s100,将以具体在s101之前包括s100为例,结合图5示出的步骤进行说明。
72.s100、接收创建指令,根据创建指令分别创建至少一个第一资源集合和至少一个第二资源集合,其中,每个第一资源集合用于存储确定出的同种类型的维度表,每个第二资源集合用于存储确定出的同种类型的度量表。
73.上述实施例中,装置可以根据用户输入的创建指令,创建用于存储同种类型的维度表的第一资源集合,以及,创建用于存储同种类型的度量表的第二资源集合,以对后续确定出的度量表和维度表进行存储。示例性的,第一资源集合和第二资源集合可以是文件夹。这里,创建用于存储同种类型的维度表的第一资源集合,用于存储同种类型的度量表的第二资源集合,可以便于对所需维度表和度量表的快速定位与搜索,方便对维度表和度量表的查找。
74.在本发明的一些实施例中,维度表或度量表的类型可以根据具体业务定义;例如,当维度表1与维度表2属于同一个主题时,即表明维度表1与维度表2属于同种类型,可存储至同一个资源集合中;又例如,当维度表1和维度表2均为虚拟资源时,则维度表1和维度表2属于同种类型,可存储至同一个资源集合中。
75.图6是本发明实施例提供的数据处理方法的另一个可选的流程示意图,在图5中的s100之后可以包括s201-s204,将结合图6示出的步骤进行说明。
76.s201、确定至少一个第一资源集合对应的业务信息。
77.在本发明的实施例中,装置可以根据创建第一资源集合的用户所对应的业务信息,确定该第一资源集合的业务信息。在本发明的实施例中,业务信息为业务类型。在本发明的实施例中,一个租户对应有至少一个用户,且该至少一个用户的业务类型相同。
78.s202、根据业务信息为至少一个第一资源集合设定访问权限。
79.在本发明的实施例中,装置可以设定与第一资源集合的业务类型相同的租户,可以访问第一资源集合。例如,租户1对应的业务类型为a,租户2对应的业务类型为b,且第一资源集合a的业务类型也为a时,租户1可以访问第一资源集合a,但租户2无法访问第一资源集合a。
80.s203、确定至少一个第二资源集合对应的业务信息。
81.在本发明的实施例中,装置可以根据创建第二资源集合的用户所对应的业务信息,确定该第二资源集合的业务信息。
82.s204、根据业务信息为至少一个第二资源集合设定访问权限;访问权限用于限制没有权限的租户的数据访问操作。
83.在本发明的实施例中,装置可以设定与第二资源集合的业务类型相同的租户,可以访问第二资源集合。例如,租户1对应的业务类型为a,租户2对应的业务类型为b,且第二资源集合b的业务类型也为a时,租户1可以访问第二资源集合b,租户2无法访问第二资源集
合b。
84.在本发明的实施例中,数据访问操作可以为数据查看、数据存储等操作。
85.在本发明实施例中,终端为创建的资源集合设定访问权限,可以使不同租户只能访问并操作自身所对应的资源集合,从而保证数据的安全性。
86.图7是本发明实施例提供的数据处理方法的又一个可选的流程示意图,在图6中的s102之后可以包括s205-s208,将结合图7示出的步骤进行说明。
87.s205、接收数据存储请求,数据存储请求携带租户的标识信息,以及目标第一资源集合的标识信息或目标第二资源集合的标识信息;目标第一资源集合为至少一个第一资源集合中的一个第一资源集合;目标第二资源集合为至少一个第二资源集合中的一个第二资源集合。
88.在本发明的实施例中,当用户需要将确定出的维度表存储至一个第一资源集合时,可以输入包括用户所对应的租户的标识信息和目标第一资源集合的标识信息的数据存储指令,以及,当用户需要将确定出的度量表存储至一个第二资源集合时,可以输入包括用户所对应的租户的标识信息和目标第二资源集合的标识信息的数据存储指令。
89.在本发明的实施例中,租户的标识信息可以是租户的名称等信息。目标第一资源集合的标识信息可以是目标第一资源集合的名称等信息,同样地,目标第二资源集合的标识信息可以是目标第二资源集合的名称等信息。
90.s206、根据租户的标识信息,确定租户的目标访问权限。
91.在本发明的实施例中,装置可以根据租户的名称确定租户所对应的业务类型,并根据业务类型与目标访问权限之间的对应关系,确定租户的目标访问权限。在本发明的实施例中,业务类型与目标访问权限之间的对应关系可以预先设定。
92.s207、根据目标第一资源集合的标识信息,确定目标第一资源集合的访问权限,或根据目标第二资源集合的标识信息,确定目标第二资源集合的访问权限。
93.在本发明的实施例中,装置可以根据目标第一资源集合的名称确定目标第一资源集合所对应的业务类型,并根据业务类型与访问权限之间的对应关系,确定目标第一资源集合的访问权限;根据目标第二资源集合的名称确定目标第二资源集合所对应的业务类型,并根据业务类型与访问权限之间的对应关系,确定目标第二资源集合的访问权限。
94.s208、在目标访问权限满足目标第一资源集合的访问权限时,允许将至少一个维度表存储至目标第一资源集合;或者,在目标访问权限满足目标第二资源集合的访问权限时,允许将至少一个度量表存储至目标第二资源集合。
95.在本发明的实施例中,当装置确定租户的访问权限满足目标第一资源集合的访问权限时,可以将生成的维度表或者将根据数据选择指令直接从多个数据表中选择出的维度表,存储至目标第一资源集合中;以及,当装置确定租户的访问权限满足目标第二资源集合的访问权限时,可以将生成的度量表或者将根据数据选择指令直接从多个数据表中选择出的度量表,存储至目标第二资源集合中。
96.上述实施例中,在存储生成的维度表和度量表时,对租户的权限进行验证,可以使不同租户只能访问并操作自身所对应的资源集合,从而保证了数据的安全性。
97.在本发明的一个实施例中,图7中的s103可以通过s301-s302实现:
98.s301、接收数据关联指令,根据数据关联指令中包括的至少一个度量表的标识信
息和至少一个维度表的标识信息,从目标第一资源集合中选取至少一个维度表,以及从目标第二资源集合中选取至少一个度量表。
99.在本发明的实施例中,当用户输入携带了度量表的标识信息和维度表的标识信息的数据关联指令时,装置可以根据该维度表的标识信息,从多个第一资源集合中确定出该维度表所在的目标第一资源集合,并从该目标第一资源集合中选出该维度表;以及,装置可以根据该度量表的标识信息,从多个第一资源集合中确定出该度量表所在的目标第二资源集合,并从该目标第二资源集合中选出该度量表。
100.s302、根据数据关联指令中包括的关联关系,将选取的至少一个度量表和选取的至少一个维度表按照数据关联模型进行相互关联。
101.在本发明的实施例中,装置在接收到用户输入的数据关联指令后,可以解析出数据关联指令中用户所设定的关联关系,根据用户所设定的关联关系,选出的度量表中的关联关系字段,以及选出的维度表中的关联关系字段,将选出的度量表和维度表按照数据关联模型进行相互关联。
102.本发明实施例还提供一种装置,用于实施上述的数据处理方法。图8为本发明实施例提供的数据处理装置的部分结构示意图。如图8所示,所述数据处理装置1包括:业务数据层11,用于接收数据源配置参数,根据所述数据源配置参数与目标数据源建立连接;所述数据源配置参数用于表征所述目标数据源的描述信息;所述目标数据源中包括多个数据表;数据仓库层12,用于接收数据选择指令,根据所述数据选择指令从所述多个数据表中确定至少一个度量表和至少一个维度表;关系层13,用于接收数据关联指令,根据所述数据关联指令中包括的关联关系,将所述至少一个度量表和所述至少一个维度表按照数据关联模型进行相互关联;引擎层14,用于接收参数设定指令,根据所述参数设定指令生成膨胀信息;采用所述膨胀信息,对关联后的所述至少一个度量表和所述至少一个维度表进行数据膨胀,获得数据立方体。
103.在一些实施例中,每个度量表和每个维度表均包括关联关系字段;所述关系层13,还用于接收数据关联指令,根据所述数据关联指令中包括的关联关系和所述至少一个度量表与所述至少一个维度表中的关联关系字段,将所述至少一个度量表和所述至少一个维度表按照数据关联模型进行相互关联。
104.在一些实施例中,所述引擎层14,还用于采用所述膨胀信息,对关联后的所述至少一个度量表和所述至少一个维度表进行多维度笛卡尔积计算,获得数据立方体。
105.在一些实施例中,所述数据仓库层12,还用于接收数据选择指令,根据所述数据选择指令,从所述多个数据表中选择相应的数据表;将所选择的数据表中的第一数据表作为维度表;所述第一数据表中的字段表征维度信息;将所选择的数据表中的第二数据表作为度量表;所述第二数据表中的字段表征度量信息。
106.在一些实施例中,所述数据选择指令包括数据表选择指令和字段选择指令;所述数据仓库层12,还用于接收所述数据表选择指令,根据所述数据表选择指令从所述多个数据表中选取第二目标数据表;每个数据表中均包含字段;所述第二目标数据表为所述数据表选择指令所指定的数据表;接收所述字段选择指令,根据所述字段选择指令对所述第二目标数据表中的目标字段进行标记,获得带有标记的第二目标数据表;所述目标字段为所述字段选择指令所指定的字段;根据所述带有标记的数据表,生成包括所述目标字段的至
少一个度量表和包括所述目标字段的至少一个维度表。
107.在一些实施例中,所述数据仓库层12,还用于在所述根据所述数据选择指令从所述多个数据表中确定至少一个度量表和至少一个维度表之前,接收创建指令,根据所述创建指令分别创建至少一个第一资源集合和至少一个第二资源集合,其中,每个第一资源集合用于存储确定出的同种类型的维度表,每个第二资源集合用于存储确定出的同种类型的度量表。
108.在一些实施例中,所述数据仓库层12,还用于在所述根据所述创建指令分别创建至少一个第一资源集合和至少一个第二资源集合之后,确定所述至少一个第一资源集合对应的业务信息;根据所述业务信息,为所述至少一个第一资源集合设定访问权限;确定所述至少一个第二资源集合对应的业务信息;根据所述业务信息,为所述至少一个第二资源集合设定访问权限;所述访问权限用于限制没有权限的租户的数据访问操作。
109.在一些实施例中,所述数据仓库层12,还用于在所述根据所述数据选择指令从所述多个数据表中确定至少一个度量表和至少一个维度表之后,接收数据存储请求,所述数据存储请求携带租户的标识信息,以及目标第一资源集合的标识信息或目标第二资源集合的标识信息;所述目标第一资源集合为所述至少一个第一资源集合中的一个第一资源集合;所述目标第二资源集合为所述至少一个第二资源集合中的一个第二资源集合;根据所述租户的标识信息,确定所述租户的目标访问权限;根据所述目标第一资源集合的标识信息,确定所述目标第一资源集合的访问权限,或根据所述目标第二资源集合的标识信息,确定所述目标第二资源集合的访问权限;在所述目标访问权限满足所述目标第一资源集合的访问权限时,允许将所述至少一个维度表存储至所述目标第一资源集合;或者,在所述目标访问权限满足所述目标第二资源集合的访问权限时,允许将所述至少一个度量表存储至所述目标第二资源集合。
110.在一些实施例中,所述关系层13,还用于接收数据关联指令,根据所述数据关联指令中包括的所述至少一个度量表的标识信息和所述至少一个维度表的标识信息,从所述目标第一资源集合中选取所述至少一个维度表,以及从所述目标第二资源集合中选取所述至少一个度量表;根据所述数据关联指令中包括的关联关系,将选取的所述至少一个度量表和选取的所述至少一个维度表按照数据关联模型进行相互关联。
111.在一些实施例中,所述膨胀信息包括:膨胀任务和膨胀模板;所述膨胀任务包括所述膨胀模板的执行频率和执行时间;所述膨胀模板包括:膨胀字段、驱动表组、非驱动表组、驱动表执行顺序、非驱动表执行顺序和指标计算逻辑;其中,所述驱动表为关联后的一个维度表或一个度量表;所述非驱动表为关联后未被选为所述驱动表的维度表和/或度量表。
112.在一些实施例中,所述驱动表为关联后的维度表中数据量最小的一个维度表,或关联后的度量表中数据量最小的一个度量表。
113.在一些实施例中,所述数据关联模型包括以下中的至少一种:雪花模型、星型模型和星座模型。
114.在一些实施例中,所述数据仓库层12,还用于对所述带有标记的数据表做抽取转换操作;根据抽取转换结果生成至少一个度量表和至少一个维度表。
115.本发明实施例还提供一种数据处理设备,用于实施上述的数据处理方法。图9为本发明实施例提供的数据处理设备的部分结构示意图。如图9所示,数据处理设备1包括:存储
器21和处理器22,所述存储器21与所述处理器22通过总线23连接;存储器21,用于存储可执行数据指令;处理器22,用于执行所述存储器中存储的可执行指令时,实现上述方法,例如上述实施例所述的数据处理方法。
116.本发明实施例还提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行时,实现上述方法,例如上述实施例所述的数据处理方法。在本发明实施例中的可执行指令为计算机程序。
117.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
118.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
119.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
120.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
121.以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1