一种数据处理方法、装置及设备与流程

文档序号:21460783发布日期:2020-07-14 16:34阅读:163来源:国知局
一种数据处理方法、装置及设备与流程

本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种数据处理方法、装置及设备。



背景技术:

目前,随着互联网信息技术的发展,数据已经应用到每一个行业和业务智能领域中,各个用户机构每天都会产生海量的数据,人们需要对海量数据进行挖掘和运用。比如金融领域中,各个机构每天会产生大量的交易数据,一般来说,为了保证多个机构的正常运行,各个机构需要通过数据平台获取所需的数据来实现智能风控、用户画像、智能营销等,从而能够对交易用户进行准确的评估,以便更好地为用户提供服务。比如:信贷机构通过数据平台从相应的数据提供商获取用户对应的数据,从而对用户的业务进行评估,根据评估结果为用户提供相应的服务。

数据平台是集数据接入、数据处理、数据存储、查询检索、分析挖掘等应用接口为一体的平台,各个用户可以根据自身的需求通过数据平台调用所需的数据。

但是目前用户在通过数据平台调用数据时,为了满足用户的业务处理需求,往往需要从多个机构的数据源中获取数据。此时,根据用户的数据调用请求,需要分别通过每个机构的数据源对应的查询引擎来调用所需的数据,导致工作量较大,调用繁琐。此时,当在大规模、多租户空间需要使用多种数据源的开放数据,以进行大数据计算的场景下,对于多种数据源的开放数据,如何进行配置以及定制化使用,成为亟待解决的技术问题。



技术实现要素:

有鉴于此,本说明书一个或多个实施例提供了一种数据处理方法、装置及设备,用于实现对多数据源的数据进行统一配置的同时满足用户对数据的定制化使用。

为解决上述技术问题,本说明书实施例是这样实现的:

本说明书实施例提供的一种数据处理方法,所述方法应用于数据平台,包括:

获取各个数据源提供方的数据的配置信息;所述数据的配置信息包括基本信息以及接口信息;

根据所述配置信息将各个所述数据源提供的数据信息进行配置,将配置后的数据信息保存到所述数据平台的数据库中;

获取所述数据平台的用户对于所述数据源提供方提供的数据的调用请求;

基于所述用户的定制化配置信息以及所述配置后的数据信息,将所述数据源提供方提供的数据提供给所述用户。

本说明书实施例提供的一种数据处理装置,所述装置应用于数据平台,包括:

配置信息获取模块,用于获取各个数据源提供方的数据的配置信息;所述数据的配置信息包括基本信息以及接口信息;

配置模块,用于根据所述配置信息将各个所述数据源提供的数据信息进行配置,将配置后的数据信息保存到所述数据平台的数据库中;

数据调用请求获取模块,用于获取所述数据平台的用户对于所述数据源提供方提供的数据的调用请求;

定制化数据提供模块,用于基于所述用户的定制化配置信息以及所述配置后的数据信息,将所述数据源提供方提供的数据提供给所述用户。

本说明书实施例提供的一种数据处理设备,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

获取各个数据源提供方的数据的配置信息;所述数据的配置信息包括基本信息以及接口信息;

根据所述配置信息将各个所述数据源提供的数据信息进行配置,将配置后的数据信息保存到所述数据平台的数据库中;

获取所述数据平台的用户对于所述数据源提供方提供的数据的调用请求;

基于所述用户的定制化配置信息以及所述配置后的数据信息,将所述数据源提供方提供的数据提供给所述用户。

本说明书实施例提供的一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现一种数据处理方法。

本说明书一个实施例能够达到以下有益效果:通过获取各个数据源提供方的数据的配置信息,根据配置信息将各个所述数据源提供的数据信息进行配置,将配置后的数据信息保存到数据平台的数据库中,以实现对多个数据源提供的数据信息在数据平台上进行统一配置,进而提高数据源接入使用的效率;获取数据平台的用户对于数据源提供方的数据的调用请求,基于用户的定制化配置信息,将数据源提供方提供的数据提供给所述用户,能够按照用户的需求对数据进行定制化使用,满足用户使用数据的个性化定制需求。

附图说明

此处所说明的附图用来提供对本说明书一个或多个实施例的进一步理解,构成本说明书一个或多个实施例的一部分,本说明书的示意性实施例及其说明用于解释本说明书一个或多个实施例,并不构成对本说明书一个或多个实施例的不当限定。在附图中:

图1为本说明书实施例提供的一种数据处理方法的整体方案示意图;

图2为本说明书实施例提供的一种数据处理方法的流程示意图;

图3为本说明书实施例提供的一种数据处理方法中配置信息配置界面示意图;

图4为本说明书实施例提供的一种数据处理方法中用户定制化配置信息配置界面示意图;

图5为本说明书实施例提供的对应于图2的一种数据处理装置的结构示意图;

图6为本说明书实施例提供的对应于图2的一种数据处理设备的结构示意图。

具体实施方式

为使本说明书一个或多个实施例的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书一个或多个实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书一个或多个实施例保护的范围。

以下结合附图,详细说明本说明书各实施例提供的技术方案。

图1为本说明书实施例提供的一种数据处理方法的整体方案示意图。如图1所示,包括数据源提供方101、数据平台103以及用户105。需要说明的是,这里的用户105可以表示的是用户使用的设备,比如:公司设备、银行设备或者个人设备等等。数据源提供方能够提供多个数据源对应的数据,比如,图1中包括n个数据源,数据源1提供数据a,数据源2提供数据b,数据源3提供数据c,……,数据源n提供数据m,数据平台103不存储数据,只存储数据对应的数据信息,需要将这n个数据源提供的数据对应的数据信息统一配置到数据平台103上,可以理解为数据平台103需要将n个数据源提供的数据对应的数据信息进行配置,并保存到数据平台103的数据库中。在存储时,可以将一个数据源提供的数据对应的数据信息存储到一个数据库中,如图1所示,可以将数据源1提供的数据a的数据信息a存储到数据平台103的数据库1中,将数据源2提供的数据b的数据信息b存储到数据平台103的数据库2中,……,将数据源n提供的数据m的数据信息m存储到数据平台103的数据库n中。用户105使用的设备可以向数据平台发送数据调用请求,对数据源提供方提供的数据进行定制化调用,用户105的定制化调用是依据数据平台103的配置信息和定制化配置信息,请求到提供方提供的接口进行数据查询,以满足用户使用数据的个性化需求。

接下来,将针对说明书实施例提供的一种数据处理方法结合附图进行具体说明:

图2为本说明书实施例提供的一种数据处理方法的流程示意图。从程序角度而言,流程的执行主体可以为搭载于应用服务器的程序或应用客户端。

如图2所示,该流程可以包括以下步骤:

步骤202:获取各个数据源提供方的数据的配置信息;所述数据的配置信息可以包括基本信息以及接口信息。

数据源提供方可以指的是数据库应用程序所使用的数据库或者数据库服务器。比如:数据供应商可以通过自身的开放应用程序所使用的数据库或者数据库服务器向数据平台提供数据。

配置信息可以表示的是能够让用户在配置表或者配置界面中编辑的变量,数据平台从数据源提供方获取多个数据源提供的数据之后,可以按照各个数据源提供方的数据的配置信息对数据进行配置。

步骤204:根据所述配置信息将各个所述数据源提供的数据信息进行配置,将配置后的数据信息保存到所述数据平台的数据库中。

数据源提供方提供的数据信息可以包括数据的接入方式、查询方式、使用方式、数据源的身份标识等。比如:数据源a提供的数据x为交易数据,此时,该交易数据可以包括交易的发生场景、获取该交易数据的接入地址信息、查询方式信息、使用格式信息以及交易数据x对应的交易类型、交易名称、交易时间、具体交易内容等。

数据平台可以是集数据接入、数据处理、数据存储、查询检索、分析挖掘等应用接口为一体的平台,数据平台上可以存储有各个数据源提供的数据信息,为各个机构实现数据资源共享。数据平台可以提供各类开放数据的展示和申请使用的功能,通过该数据平台申请使用数据后,可以通过其应用开发接入查询数据。数据平台上可以包括多个数据库,用于存储各个数据源提供方提供的数据信息。在具体存储时,可以将数据信息分类存储,一个类型的数据信息存储到同一个类型的数据库中;也可以按照数据源进行存储,一个数据源提供的数据信息存储到同一个类型的数据库中;当然,在实际应用中,也可以根据数据量的大小选择将数据存储到一个数据库中或者多个数据库中。具体的存储可以根据实际应用进行设定。

步骤206:获取所述数据平台的用户对于所述数据源提供方提供的数据的调用请求。

需要说明的是,本说明书中提到的“用户”可以指的是用户使用的具体设备。

在实际应用中,数据平台可以与部分机构签约,定向合作,根据签约机构的需求为签约机构提供需要的数据。除此之外,数据平台上也可以面向所有机构,各个机构可以通过数据平台检索查询数据,申请使用数据等。

当数据平台的用户需要使用该数据平台上的数据信息对应的数据源提供方提供的数据时,可以向数据平台发送数据的调用请求,请求数据平台从相应的数据源提供方的数据调用接口调用数据,并提供调用得到的数据。

步骤208:基于所述用户的定制化配置信息以及所述配置后的数据信息,将所述数据源提供方提供的数据提供给所述用户。

定制化配置信息可以表示用户对数据的使用需求,还可以包括指定部分接口的调用参数。

图2中的方法,通过获取各个数据源提供方的数据的配置信息,根据配置信息将各个所述数据源提供的数据信息进行配置,将配置后的数据信息保存到数据平台的数据库中,以实现对多个数据源提供的数据信息在数据平台上进行统一配置,进而提高数据源接入使用的效率;获取数据平台的用户对于数据源提供方的数据的调用请求,基于用户的定制化配置信息,将数据源提供方提供的数据提供给所述用户,能够按照用户的需求对数据进行定制化使用,满足用户使用数据的个性化定制需求。

基于图2的方法,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。

在实际使用需求中,数据平台将多个数据源提供的数据信息统一接入数据平台时,涉及的业务操作可以包括数据源配置上线以及数据源访问检测。将多个数据源进行配置后,需要进行测试验证,验证通过后才能存储到数据平台上供各用户进行使用。

具体地,所述获取各个数据源提供方的数据配置信息之前,还可以包括:

获取针对数据源提供方提供的数据的配置信息;

针对任意一个配置信息,对所述配置信息进行测试,得到测试结果;

当所述测试结果表示所述配置信息配置正确时,将所述配置信息保存到数据平台上,将所述配置信息上线使用,以根据该配置信息对数据源提供方提供的数据信息进行配置。数据源提供方提供的配置信息经过测验,测验通过之后才能上线提供给各用户的设备进行使用。

在具体测试时,可以根据设定的配置信息格式进行测试,将配置信息中对应的接口地址、参数等填写在测试界面中,点击测试按钮进行测试,查看返回的测试结果,若测试失败,则对配置信息进行修改,重置测试参数。若测试正确,则可以请求上线。

在对配置信息进行测试、调整时,可以根据动态脚本进行测试。假设测试失败,可以针对测试结果对参数进行调整,比如:对查询接口的签名计算逻辑进行调整。

通过上述方法,在根据配置信息对数据源提供方提供的数据信息进行配置之前,可以先对配置信息进行测试,将测试通过的配置信息保存到数据平台上,当获取到数据源提供方提供的数据信息之后,可以直接根据数据平台上保存的配置信息对数据信息进行配置,从而提高配置的效率。

本说明书中提到的对多数据源提供方提供的数据进行统一配置,实际上就是将多个数据源提供方提供的数据信息按照对应的配置信息都保存在同一数据平台的数据库中。具体地,在将多个数据源提供方提供的数据信息保存到同一数据平台上时,需要明确应该将各个数据源的数据信息存储在哪些数据库中,具体实现方法可以如下:

所述基本信息至少包括所述数据源提供的数据的提供方信息;所述根据所述配置信息将各个所述数据源提供的数据信息进行配置,将配置后的数据信息保存到所述数据平台的数据库中,具体包括:

根据配置信息,确定所述数据源提供的数据信息的提供方信息;

确定所述提供方信息对应的数据库类型;

将所述数据源提供的数据信息存储到所述提供方信息对应的数据库中。

需要说明的是,在将数据源提供方提供的数据信息存储到数据平台中时,可以根据提供方信息来确定应该将该数据源提供方提供的数据信息存储到哪个数据库中。比如:数据源提供方a提供了数据x,此时,可以根据数据源提供方a的名称或标识,数据x的分类、应用场景,覆盖范围以及该数据源提供方a提供的数据的开放模式等信息来判断应该将数据x对应的数据信息存储到r类数据库中。其中,一种数据库类型可以对应一个数据库,也可以对应多个数据库,数据库类型对应的数据库数量可以根据实际情况进行设置。

通过上述方法,根据数据源提供的数据的提供方信息确定各个数据源的数据信息在数据平台上的存储数据库类型,可以提高数据信息的配置效率。

在实际应用中,可以是数据源提供方主动将数据信息发送到数据平台上进行配置保存,也可以是数据平台向各个数据源提供方发送获取数据信息的请求,请求各个数据源提供方将数据信息放到数据平台上进行配置保存。用户需要通过数据平台调用数据时,用户可以向数据平台发送数据调用请求,数据平台为用户提供数据调用的调用接口,用户从该调用接口调用所需数据,配置信息中的接口信息至少可以包括接口地址信息、传输协议信息;具体获取数据时,可以包括:

根据所述接口地址信息确定数据源提供方的接口地址;

按照所述传输协议信息对应的传输协议访问所述接口地址,获取所述数据源提供的数据。

在实际应用中,配置信息可以通过附图3中提供的界面进行填写。具体地,可以结合附图3进行详细说明:

图3为本说明书实施例提供的一种数据处理方法中配置信息配置界面示意图。如图3所示,配置信息可以包括基本信息以及接口信息。基本信息可以包括数据源提供方信息,比如:数据源提供方的名称或标识,数据的分类、应用场景,覆盖范围(比如:全国、国际等)以及该数据源提供方提供的数据的开放模式(例如:指定机构专用或者面向全部机构使用)等等信息。

接口信息可以包括接口地址信息、传输协议信息以及参数信息等等。其中,接口地址信息可以填入的是指定请求数据源的接口地址、传输协议信息可以填入数据平台与指定请求数据源的接口进行数据传输时使用的传输协议,比如:传输控制协议(transmissioncontrolprotocol,简称tcp)、用户数据报协议(userdatagramprotocol,简称udp)、internet协议(internetprotocol,简称ip)等。

参数信息可以包括参数类型、参数名称、参数描述信息以及参数的设置方式等等。需要说明的是,针对有些参数,需要先调用数据提供方的其他接口获取参数值,这时需要先配置好获取参数值的接口的数据源信息,再配置获取数据的数据源信息。

上述方法中,从接口地址信息中可以确定数据源提供方提供数据的接口地址,访问该接口地址就可以获取到该数据源提供方提供的数据。不同的数据库之间传输数据时都会采用相应的传输协议,因此,可以先从接口信息中获取到该数据源提供方与数据平台的传输协议,根据该传输协议访问数据源提供方的接口地址,以获得数据源提供方提供的数据。

将所述数据源提供方提供的数据信息存储到所述数据源提供方信息对应确定出的数据库类型对应的数据库中时,如果数据库没有要求的数据格式,可以直接将数据信息按照自身的数据格式存储到数据库中,不需要进行数据格式转换;但是,如果数据库在存储时,有数据格式的要求,此时,需要将数据源提供方提供的数据信息的数据格式转换成数据库要求的数据格式,才能进行存储。具体可以采用以下方法进行实现:

所述将所述数据源提供的数据信息存储到所述数据源提供方信息对应确定出的数据库类型对应的数据库中之前,还可以包括:

获取所述数据库的数据格式信息;

按照所述数据格式信息将所述数据源提供的数据信息进行格式转换,得到格式转换后的数据信息;

所述将所述数据源提供的数据信息存储到所述数据源提供方信息对应确定出的数据库类型对应的数据库中,具体包括:

将所述格式转换后的数据信息存储到所述数据库类型对应的数据库中。

需要说明的是,数据格式(dataformat)可以是数据保存在文件或记录中的编排格式,一般在使用接口传输数据时,数据格式可以包括:轻量级的文本数据交换格式(javascriptobjectnotation,简称json)、可扩展标记语言(extensiblemarkuplanguage,简称xml)、数据序列化格式(yetanothermarkuplanguage,简称yaml)。

比如:数据源提供方a提供的数据信息x的数据格式为xml格式,数据源提供方b提供的数据信息y的数据格式为yaml格式,数据源提供方c提供的数据信息z的数据格式为json)格式,通过分析,需要将数据信息x存储到i类数据库中,需要将数据信息y存储到h类数据库中,需要将数据信息z存储到j类数据库中,假设已知i类数据库、h类数据库对应的存储的数据格式均为xml格式、j类数据库对应的存储的数据格式为yaml格式,此时,数据源提供方a提供的数据信息x可以直接存储到i类数据库中;将数据源提供方b提供的数据信息y的数据格式由yaml格式转换成xml格式,将xml格式的数据信息y存储到h类数据库中;将数据源提供方c提供的数据信息z的数据格式由json格式转换成yaml格式,然后将yaml格式的z数据信息存储到j类数据库中。

在实际应用场景中,将各个数据源提供方提供的数据信息均配置在同一数据平台上之后,数据平台可以为各个用户提供数据查询接口,为用户提供所需的数据,比如:银行a在处理某一笔大额借贷交易时,需要对借贷人的信誉、借贷人的财产情况、偿还能力等进行评估,此时,银行a需要根据其他机构提供的关于该借贷人的基本画像数据进行用户画像,比如:需要利用工商局提供的该借贷人的公司注册数据、从房产管理处获取该借贷人的房产数据以及该借贷人在其他银行的存款数据和借贷数据等。而这些数据的数据信息被数据平台统一配置之后,银行a可以通数据平台获取调用该借贷人的基本画像数据的数据调用接口,并将调用得到的这些数据按照自身的使用需求进行定制化使用,具体地,所述基于所述用户的定制化配置信息,将所述数据库中的数据提供给所述用户,具体可以包括:

获取用户对于数据的调用请求;

根据所述用户的定制化配置信息,确定存储有所述调用请求所调用的数据对应的数据信息的目标数据库;

根据所述目标数据库中的数据信息确定所述调用请求所调用的数据对应的调用接口;

访问所述调用接口,将调用的数据提供给所述用户。

在实际应用中,定制化配置信息可以指的是各个用户对于数据的定制化使用需求。对于用户的定制化配置信息可以通过附图4中提供的界面进行填写。具体地,可以结合附图4进行详细说明:

图4为本说明书实施例提供的一种数据处理方法中用户定制化配置信息配置界面示意图。如图4所示,用户的定制化配置信息可以包括调用接口的身份识别参数、签名方式;还可以包括指定字段、使用数据的数据格式以及多数据源的组合或路由选择使用等等。比如:只需要获取数据中的某几个字段,或需要使用xml格式的数据、或需要从指定数据库中获取数据等。

需要说明的是,这里的指定部分接口可以表示的是目标数据库,调用接口的身份识别参数可以表示的是目标数据库的标识信息;签名方式可以表示的是目标数据库中数据加密的签名方式。

例如:用户需要使用数据x,此时,用户使用数据x的定制化配置信息至少可以包括数据x的数据格式、数据x的使用字段以及数据x的指定调用接口,根据该指定调用接口可以确定指定的存储数据x的目标数据库。根据用户的配置信息从相应的数据库中拿到数据后,将数据转换为用户能够使用的数据,以满足用户的个性化使用需求。

数据平台可以获取用户对于数据的调用请求,比如:获取银行a对于借贷人1的基本画像数据的调用请求。

在获取用户对于数据的调用请求之后,可以根据用户的定制化信息确定存储用户需要调用的数据的目标数据库。在应用场景中,用户可以指定拿取数据的数据库,也可以从存储所需数据的全部数据库中拿取数据,具体可以根据以下两种方法进行描述:

方法一、从指定数据库中获取所需数据对应的数据信息。

更为具体地,所述定制化配置信息中包括数据库标识,所述数据库标识用于指定获取所述用户调用的数据对应的数据信息的目标数据库。

所述根据所述用户的定制化配置信息,确定存储有所述调用请求所调用的数据对应的数据信息的目标数据库,具体可以包括:

将数据库标识对应的数据库确定为目标数据库。

定制化配置信息中可以包括数据库标识,比如:用户a的配置信息指定了数据库q、数据库r,此时,数据平台获取到用户a对于数据x的调用请求时,直接从数据库q以及数据库r中取出数据x发送给用户a。

通过上述方法,根据用户的定制化需求,可以保证为用户更有针对性地提供有效的数据,从而提高用户对数据平台上的数据的使用效率。

方法二、从包含所需数据对应的数据信息的所有数据库中拿取数据信息。

所述根据所述用户的定制化配置信息,确定存储有所述调用请求所调用的数据对应的数据信息的目标数据库,具体可以包括:

根据所述用户的定制化配置信息确定所述调用请求所调用的数据对应的数据信息类型;

确定存储有所述数据信息类型的数据信息的全部数据库;

将存储有所述数据信息类型的数据信息的全部数据库确定为目标数据库。

需要说明的是,用户的定制化配置信息中可以包括需要调用的数据对应的数据信息类型,因此,在获取到用户对于数据的调用请求之后,可以确定用户需要调用的数据对应的数据信息类型。这里的数据信息类型可以是根据数据的业务场景进行的分类,比如:资产数据、身份数据、信用数据等等。

上述方法二中的步骤,主要是为贴合业务需求,在实际应用中,用户可能需要组合使用多个数据源提供的数据,才能更好地利用数据进行后续的业务操作。比如:某银行机构需要完成对某一注册用户的用户画像,需要一些关于该注册用户的线上以及线下数据,此时,就需要结合线上的数据源以及线下的数据源提供的数据,综合确定该注册用户的用户画像。

而每个数据源的数据对应存储到相应的数据库中,因此,可以从多个数据库中获取用户所需的数据,以满足用户使用数据的复杂场景。

根据数据类型可以确定存储该数据类型的数据的全部数据库。可以从这些数据库中将该类型的数据都提供给用户。比如:数据平台接收到公司s对于员工a的身份数据的调用请求,根据公司s对于员工身份数据的配置信息中可以确定员工a的身份数据的数据信息类型是基本画像数据。确定存储有用户a的基本画像数据类型的所有数据库,分别为数据库1、数据库2和数据库3,此时,数据平台可以根据数据库1、数据库2以及数据库3中的数据信息从各个数据库对应的数据源提供方调用数据,并提供给公司s,以便公司s对于员工a进行综合评估。

通过上述方法,根据用户的定制化配置信息尽可能全面地为用户提供所需的数据,从而能够更好地满足用户对于数据的使用需求,提升用户对于数据平台上的数据的使用体验。

在实际应用中,数据平台可以存在签约的定向合作用户,这些定向合作用户与数据平台可以签订订购数据源的协议,签订协议之后,用户可以获取使用相应数据源的身份标识等关键参数值。签约后,定向合作用户可以针对相关数据源进行定制使用,在进行数据查询时,数据平台上提供的查询引擎也会按照用户的定制化配置信息来执行数据查询操作。

对于这些定向合作用户来说,可以在数据平台从数据源提供方获取到数据信息之后,就可以根据定向合作用户的配置信息对数据信息进行提前配置,存储在数据平台上。具体地,可以包括以下步骤:

所述获取所述数据平台的用户对于所述数据源提供方提供的数据的调用请求之前,还可以包括:

获取数据源提供方提供的数据对应的数据信息;

根据用户的定制化信息,对所述数据信息进行预处理;

将预处理后的数据信息保存在所述数据平台的数据库中。

需要说明的是,这里的预处理可以表示根据用户的配置化信息对数据源提供方提供的数据信息进行提前配置。配置完成的数据信息可以指定存储到数据平台的相应数据库中。当然,也可以不指定存储的数据库,具体实现方式可以根据实际需求进行设定。

在实际应用过程中,根据签约协议,可以定时向定向合作用户发送对应数据源提供方提供的数据,也可以在接收到定向合作用户对于数据的调用请求之后,再为用户提供数据调用接口,供定向合作用户进行数据调用。

所述定制化配置信息中包括所述用户指定的字段;

所述基于所述用户的定制化配置信息以及所述配置后的数据信息,将所述数据源提供方提供的数据提供给所述用户,具体可以包括:

获取数据源提供方提供的数据;

从所述数据中选取出用户指定的字段;

将所述字段对应的内容提供给所述用户。

为了满足数据平台的用户对于数据的定制化需求,可以根据用户需求为用户提供准确的数据,具体地,假设用户a要求调用字段a1和字段a2,这两个字段属于数据x,此时,可以从数据x中找出字段a1和字段a2发送给用户a。

用户的定制化需求除了可以指定字段之外,还可以指定所需数据的数据格式信息;

所述定制化配置信息还包括所述用户所需数据的数据格式信息;

所述基于所述用户的定制化配置信息,将所述数据源提供方提供的数据提供给所述用户,具体可以包括:

将所述数据源提供方提供的数据的数据格式转换为所述数据格式信息对应的数据格式,得到转换后的数据;

将所述转换后的数据提供给所述用户。

在实际应用中,数据源提供方提供的数据的数据格式与用户需要使用的数据的数据格式可能会不一致,此时,需要对数据源提供方提供的数据的数据格式进行转换,将与用户需要使用的数据的数据格式一致的数据发送给用户。

比如:用户需要调用数据x和数据y,数据x的数据格式为xml格式,y的数据格式为json格式;而用户使用数据要求的数据格式为xml格式,此时,需要将数据y的格式由json格式转换成xml格式,然后将xml格式的y数据提供给用户。

当然,在用户从数据平台上获取到相应的数据,并使用获取到的数据之后,还可以统计数据使用日志,经过分析加工之后在用户所使用的设备上展示数据使用情况以及数据质量等。

数据平台可以提供数据信息服务应用程序编程接口(applicationprogramminginterface,简称api)供用户使用,同时也可以提供开放门户供外部用户查阅数据源、签约使用数据源。

数据平台将各个数据源的数据进行统一配置之后,当用户想要从数据平台上调用所需的数据时,可以为用户提供一个进行数据调用或查询的界面,这个界面可以叫做数据视图,在这个界面中可以填入用户的定制化配置信息,比如:可以填入用户的身份标识、签名方式、请求调用的数据的使用格式等信息。除此之外,在这个界面中还可以根据应用场景填入多个数据源信息,以保证用户能够同时调用多个数据源的数据进行使用。

本说明书实施例中提供的数据处理方法,通过对多个数据源的数据进行统一配置和管控,并且按照用户的个性化需求为用户提供定制化使用数据,大大提高了数据源接入使用的效率,也能够满足用户的使用需求。此外,数据平台在对数据进行统一配置时,为保证配置上线质量,配置信息通过测试验证、流程化申请上线以及灰度放量发布的过程,降低了投产风险。面对更复杂的业务场景,本方案还支持多数据源组合查询、筛选后再显示数据查询结果,能够解决在大规模、多租户空间使用多种数据源的开放数据进行大数据计算的场景下,数据的规模化接入的效率问题,以及如何保证接入后根据业务需要定制使用的问题。

更为具体地,本说明书实施例提供的方法具体可以实现以下技术效果:

1)多数据源统一接入,使用时定制,在提高数据源接入效率的同时,也支持个性化的定制需求,同时符合数据的本地化、安全性使用的要求。

2)配置化、流程化管理:多数据源的数据统一接入数据平台进行配置→测试→审核→上线流程,用户定制化使用数据时,也需要进行测试验证等过程,在降低接入成本的同时,也能够保证数据使用的质量。

3)配置多版本支持、灰度发布上线:对配置信息进行测试验证,能够满足测试失败后对配置信息进行调整的要求,同时针对修改后的配置信息通过逐步灰度放量把发布上线可能带来的影响和损失控制到最低。

4)多数据源路由选择及组合使用:为了满足业务需求,能够针对应用场景进行多个数据源的组合使用,能够更好地满足用户对数据的使用需求。

基于同样的思路,本说明书实施例还提供了上述方法对应的装置。图5为本说明书实施例提供的对应于图2的一种数据处理装置的结构示意图。如图5所示,该装置可以应用于数据平台,可以包括:

配置信息获取模块502,用于获取各个数据源提供方的数据的配置信息;所述数据的配置信息包括基本信息以及接口信息;

配置模块504,用于根据所述配置信息将各个所述数据源提供的数据信息进行配置,将配置后的数据信息保存到所述数据平台的数据库中;

数据调用请求获取模块506,用于获取所述数据平台的用户对于所述数据源提供方提供的数据的调用请求;

定制化数据提供模块508,用于基于所述用户的定制化配置信息以及所述配置后的数据信息,将所述数据源提供方提供的数据提供给所述用户。

可选的,所述基本信息至少包括所述数据源提供的数据的提供方信息;

所述配置模块504,具体可以包括:

数据源提供方信息确定单元,用于根据配置信息,确定所述数据源提供的数据信息的提供方信息;

数据库类型确定单元,用于确定所述提供方信息对应的数据库类型;

数据存储单元,用于将所述数据源提供的数据信息存储到所述提供方信息对应的数据库中。

可选的,所述装置,还可以包括:

配置信息获取模块,用于获取针对数据源提供方提供的数据的配置信息;

配置信息测试模块,用于针对任意一个配置信息,对所述配置信息进行测试,得到测试结果;

配置信息保存模块,用于当所述测试结果表示所述配置信息配置正确时,将所述配置信息保存到数据平台上。

可选的,所述接口信息至少包括接口地址信息、传输协议信息;

所述装置,还可以包括:

接口地址获取模块,用于根据所述接口地址信息确定数据源提供方的接口地址;

数据获取模块,用于按照所述传输协议信息对应的传输协议访问所述接口地址,获取所述数据源提供的数据。

可选的,所述定制化数据提供模块508,具体可以包括:

数据调用请求获取单元,用于获取用户对于数据的调用请求;

目标数据库获取单元,用于根据所述用户的定制化配置信息,确定存储有所述调用请求所调用的数据对应的数据信息的目标数据库;

数据调用接口确定单元,用于根据所述目标数据库中的数据信息确定所述调用请求所调用的数据对应的调用接口;

数据提供单元,用于访问所述调用接口,将调用的数据提供给所述用户。

可选的,所述定制化配置信息中包括数据库标识,所述数据库标识用于指定获取所述用户调用的数据对应的数据信息的目标数据库;

所述目标数据库获取单元,具体可以用于:

将数据库标识对应的数据库确定为目标数据库。

可选的,所述目标数据库获取单元,具体可以用于:

根据所述用户的定制化配置信息确定所述调用请求所调用的数据对应的数据信息类型;

确定存储有所述数据信息类型的数据信息的全部数据库;

将存储有所述数据信息类型的数据信息的全部数据库确定为目标数据库。

可选的,所述装置,还可以包括:

数据获取模块,用于获取数据源提供方提供的数据对应的数据信息;

数据预处理模块,用于根据用户的定制化信息,对所述数据信息进行预处理;

预处理数据保存模块,用于将预处理后的数据信息保存在所述数据平台的数据库中。

可选的,所述定制化配置信息中包括所述用户指定的字段;

所述定制化数据提供模块508,具体可以包括:

数据获取单元,用于获取数据源提供方提供的数据;

指定字段选取单元,用于从所述数据中选取出用户指定的字段;

字段提供单元,用于将所述字段对应的内容提供给所述用户。

可选的,所述定制化配置信息还包括所述用户所需数据的数据格式信息;

所述定制化数据提供模块508,具体可以包括:

数据格式转换单元,用于将所述数据源提供方提供的数据的数据格式转换为所述数据格式信息对应的数据格式,得到转换后的数据;

数据提供单元,用于将所述转换后的数据提供给所述用户。

基于同样的思路,本说明书实施例还提供了上述方法对应的设备。图6为本说明书实施例提供的对应于图2的一种数据处理设备的结构示意图。如图6所示,设备600可以包括:

至少一个处理器610;以及,

与所述至少一个处理器通信连接的存储器630;其中,

所述存储器630存储有可被所述至少一个处理器610执行的指令620,所述指令被所述至少一个处理器610执行。

所述指令可以使所述至少一个处理器610能够:

获取各个数据源提供方的数据的配置信息;所述数据的配置信息包括基本信息以及接口信息;

根据所述配置信息将各个所述数据源提供的数据信息进行配置,将配置后的数据信息保存到所述数据平台的数据库中;

获取所述数据平台的用户对于所述数据源提供方提供的数据的调用请求;

基于所述用户的定制化配置信息以及所述配置后的数据信息,将所述数据源提供方提供的数据提供给所述用户。

基于同样的思路,本说明书实施例还提供了上述方法对应的计算机可读介质。计算机可读介质上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现以下方法:

获取各个数据源提供方的数据的配置信息;所述数据的配置信息包括基本信息以及接口信息;

根据所述配置信息将各个所述数据源提供的数据信息进行配置,将配置后的数据信息保存到所述数据平台的数据库中;

获取所述数据平台的用户对于所述数据源提供方提供的数据的调用请求;

基于所述用户的定制化配置信息以及所述配置后的数据信息,将所述数据源提供方提供的数据提供给所述用户。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(programmablelogicdevice,pld)(例如现场可编程门阵列(fieldprogrammablegatearray,fpga))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logiccompiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(hardwaredescriptionlanguage,hdl),而hdl也并非仅有一种,而是有许多种,如abel(advancedbooleanexpressionlanguage)、ahdl(alterahardwaredescriptionlanguage)、confluence、cupl(cornelluniversityprogramminglanguage)、hdcal、jhdl(javahardwaredescriptionlanguage)、lava、lola、myhdl、palasm、rhdl(rubyhardwaredescriptionlanguage)等,目前最普遍使用的是vhdl(very-high-speedintegratedcircuithardwaredescriptionlanguage)与verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc625d、atmelat91sam、microchippic18f26k20以及siliconelabsc8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本说明书一个或多个实施例是参照根据本说明书一个或多个实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已,并不用于限制本说明书一个或多个实施例。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1