一种数据标签组织系统及组织方法
【技术领域】
[0001] 本申请设及一种数据标签管理技术,尤其设及一种数据标签组织系统及组织方 法。
【背景技术】
[0002] 目前,在开放的数据平台交易市场,存在许多不同的数据供应商,提供着上千万的 数据标签。要获得指定的数据标签通常需要经过人工进行数据处理,而数据处理大致分为 两大类:联机事务处理(0LT巧和联机分析处理(0LAP),化TP是关系型数据库的主要应用, 性能上由响应时间为衡量标准;0LAP是数据仓库系统的主要应用,W吞吐量为主要衡量标 准。在运两种数据应用环境中,都必须耗费大量人力物力,通过人工大量运行业务逻辑代 码,才能支持各种复杂多变的数据标签需求。
[0003] 前述方法在从需求描述业务到最终结果,需要第Ξ方技术人员介入,难免会因业 务理解差异导致最终开发结果与需求不同;或者存在尽管不同需求存在共性,仍然需要重 复开发,致使开发效率不高,可通用性差的缺陷。
[0004] 有鉴于此,有必要提供一种适用于不同数据平台的,可进行数据标签化组织的系 统及方法,W满足用户简便、高效、准确地从不同数据平台获取各种数据的要求。
【发明内容】
阳〇化]本申请提供了一种数据标签组织系统,包括:数据标签申请模块,用于根据用户指 令申请所需业务数据标签;W及数据标签编译模块,用于依据定义的元数据信息将所需业 务数据标签编译为基于标准S化的S化语句。
[0006] 本申请还提供了一种数据标签组织方法,包括:申请数据标签;定义元数据信息; W及依据所述元数据信息将所需业务数据标签编译为基于标准S化的S化语句。
[0007] 采用本申请的数据标签组织系统与组织方法,可W通过一次定义数据业务过滤规 贝1J,便可自动获取各种数据平台中指定的数据标签,从而可满足用户简便、高效、准确地从 不同数据平台获取各种数据的要求。
【附图说明】
[000引读者在参照附图阅读了本申请的【具体实施方式】W后,将会更清楚地了解本申请的 各个方面。其中,
[0009] 图1为本申请的数据标签组织系统的模块示意图;
[0010] 图2为图1的数据标签组织系统中的模块121的子模块示意图; W11] 图3为本申请的数据标签组织系统中的数据标签信息参数E-R示意图;
[0012] 图4为图3的数据标签信息参数S化列表示意图;
[0013] 图5为本申请的数据标签组织方法的优选流程示意图;
[0014] 图6为图5的数据标签组织方法中的步骤200的优选流程示意图;
[0015] 图7为图5的数据标签组织方法中的步骤300的优选流程示意图。
【具体实施方式】
[0016] 为了使本申请所掲示的技术内容更加详尽与完备,可参照附图化及本申请的下述 各种具体实施例,附图中相同的标记代表相同或相似的组件。然而,本领域的普通技术人员 应当理解,下文中所提供的实施例并非用来限制本申请所涵盖的范围。此外,附图仅仅用于 示意性地加 W说明,并未依照其原尺寸进行绘制。
[0017] 在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个 处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永 久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪 存(flash RAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、 可移动和非可移动媒体可W由任何方法或技术来实现信息存储。信息可W是计算机可读指 令、数据结构、程序的子单元或其他数据。计算机的存储介质的例子包括,但不限于相变内 存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器值RAM)、其他类型的随机存 取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器巧EPROM)、快闪记忆体或 其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘值VD)或其他光学存储、磁 盒式磁带,磁带磁硬盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可W 被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体 (transitcxry media),如调制的数据信号和载波。
[0018] 下面参照附图,对本申请各个方面的【具体实施方式】作进一步的详细描述。
[0019] 请参阅图1,所示为本申请的数据标签组织系统的模块示意图。所述数据标签组织 系统1与用户2通过可视化界面交互通信,可依据用户2的指令,依据用户2对数据标签的 需求组织编译,从而为用户2提供可供查询的基于标准SQL的S化语句。
[0020] 在本申请的一个优选实施例中,所述数据标签组织系统1包括数据标签申请模块 11,数据标签编译模块12 W及执行存储模块13。其中,数据标签申请模块11用于根据用户 指令申请所需业务数据标签,数据标签编译模块12用于依据定义的元数据信息将所需业 务数据标签编译为基于标准S化的S化语句,执行存储模块13用于执行并存储编译后的基 于标准S化的S化语句。
[0021] 具体地,在本申请的另一优选实施例中,数据标签编译模块12还包括:数据标签 定义模块120 W及程序模块121。其中,数据标签定义模块120用于依据所述元数据信息定 义预设数据标签信息,程序模块121用于依据所述预设数据标签信息将所需业务数据标签 编译为基于标准S化的S化语句。
[0022] 执行存储模块13还进一步包括执行模块130, W及存储模块131。其中,执行模块 130用于执行编译后的基于标准S化的S化语句,存储模块131用于存储编译后的基于标准 S化的S化语句。
[0023] 在本实施例中,数据标签定义模块120依据所述元数据信息定义预设数据标签信 息。其中所述元数据信息包括构建数据标签实体-联系图巧ntity Relationship Diagram, E-R图),并依据该E-R图设置数据标签的逻辑信息W及物理信息。举例而言,所述E-R图 包含预设数据标签信息定义如下:
[0024] 数据标签数据源,用于确定基础数据标签的存储信息;
[00巧]数据标签融合方式,用于确定所述基础数据标签的融合方式;
[00%] 数据标签因子逻辑,用于确定所述数据标签与基础数据标签的关系及所述基础数 据标签的过滤规则;
[0027] 数据标签的业务逻辑,用于确定所述数据标签与所述数据标签因子的业务逻辑联 系;所申请的数据标签需求,用于确定所申请的数据标签与数据标签的聚合维度。
[0028] 数据标签容器,用于确定所述数据标签的存储位置;W及
[0029] 数据标签质量,用于确定所述数据标签的数据质量符合所述元数据信息的要求。
[0030] 具体地,请配合同时参阅图1与图3,图3所示为本申请另一实施例中定义所述预 设数据标签信息示意图,简明地示出了在预设的E-R图中标签实体的联系关系实例。其中, 数据标签因子逻辑与数据标签数据源为多对多(M:脚引用联系类型