专利名称:基于元数据快速实现数据仓库过程的方法
技术领域:
本发明涉及一种加速数据仓库过程、提高应用适应能力和扩展能力的方法, 具体地说是一种基于元数据,通过提供人机交互界面,使得数据仓库应用的使用 者能够方便的通过已有多维立方体(称为基础立方体),组成形成新的多维立方 体(称为组合立方体)的基于元数据快速实现数据仓库过程的方法。
背景技术:
联机分析处理(OLAP)的概念最早是由关系数据库之父E. R Codd于1993年提 出的。当时,Codd认为联机事务处理(OLTP)已不能满足终端用户对数据库査询分 析的需要,对大数据库进行的简单査询也不能满足用户分析的需求。用户的决策 分析需要对关系数据库进行大量计算才能得到结果,而査询的结果并不能满足决 策者提出的需求。因此Codd提出了多维数据库和多维分析的概念,即0LAP。
企业数据仓库(0LAP SERVER)建设的主要目的,是为管理者全面、及时的 了解和分析企业运营信息提供丰富的手段,为领导决策指挥的科学性、高效性、 准确性提供强大的技术支持。
与一般性的业务应用系统不同,数据仓库应用的需求提出和明确往往是非常 困难的。主要有以下几点原因
1) 数据仓库应用的使用者往往是企业的领导者和决策者。需求分析人员很 难与其就需求细节进行仔细的讨论与沟通;
2) 由于数据仓库应用在国内的建设还处在刚刚起步的阶段,企业业务人员 及管理人员对这一领域缺乏基本的了解,对系统能够提供怎么的査询分析手段也 没有认识;
3) 大量常规的查询、统计和报表在业务系统中已经完成,企业管理人员即 便有更深层次的管理分析需求,却也往往处于一种"说不清道不明"的状态。
正因为如此, 一个数据仓库过程的完成,往往只起到原型开发的作用。管理 人员只有在看到前端应用之后,才开始对自身的分析应用需求做出更清晰的界 定。这一过程需要多次迭代。
传统的数据仓库应用项目立足于根据数据分析应用的需求,构建大而全的多 维立方体来支撑分析应用。由于此项工作的复杂度很高,导致了数据仓库项目建 设难度大、周期长。
发明内容
本发明的目的是提供一种基于元数据快速实现数据仓库过程的方法,通过该 方法使用者可以直接参与到数据分析模型的构建中来,使得深层次的管理分析需 求能够由使用者自己来实现。开发者只需更多的关心最为核心的业务基础数据, 而不需去了解繁复的数据间应用逻辑和分析需求。 本发明的目的是通过以下技术方案来实现的-一种基于元数据快速实现数据仓库过程的方法,其特征在于它包括以下步
骤
1) 通过元数据,对数据仓库(OLAPSERVER)中已有的基础立方体模型进行解析 并列出其包含的度量和维度,供使用者选择;
2) 使用者将一些具有共有维度的基础立方体进行组合,并利用已有度量创建新 的计算度量;
3) 将使用者所做的组合立方体的定义以XML的形式进行描述并通过开发OLAP SERVER的元数据访问接口,将定义导入OLAP SERVER中,形成组合立方体模 型;
4) 根据使用者所做的组合立方体定义信息,将基础立方体所关联的事实表数据 以共有维度所对应的外键进行关联组合,形成新的事实表或视图来作为组合 立方体的数据支撑。
本发明引入业务元数据对多维立方体模型进行表述,屏蔽其中复杂的技术元 数据信息,使得使用者仅仅通过度量、维度等具有业务含义的关键要素就能够描 述多维立方体模型。通过分析技术元数据与业务元数据间关联关系,将多维立方 体模型转换为各类OLAP SERVER能够识别的表述形式,并通过开发接口程序,将 多维立方体模型导入OLAP SERVER。
本发明中,数据仓库应用的使用者通过人机交互界面,可以列出应用中已有 的多维立方体(称为基础立方体)信息,包括多维立方体的名称、其包含的度量 和维度信息。选择多个具有共有维度信息的基础立方体,可以将其组合形成一个 新的多维立方体(称为组合立方体)。在形成组合立方体的过程中,使用者可以 使用基础立方体中包含的度量和各类常数,通过定义计算表达式,构造出新的度 量。组合立方体定义信息将转换为多维立方体模型的元数据并导入至OLAP SERVER中,形成新的多维分析模型。
通过本发明,数据仓库应用的使用者可以方便的将若干个存在关联维度的简 单多维立方体,通过定义计算度量等方式,组合成为新的复杂多维立方体。数据
仓库应用开发者不需要再将大量精力投入到各类业务关联分析的设计实现中去, 既可縮短应用开发周期,又可提高应用对业务需求,特别是关联分析需求的适应 能力和扩展能力。
本发明的有益效果如下
1、 按照本发明进行数据仓库应用项目建设,改变了传统的数据仓库应用项 目建设方法。本发明使得数据仓库项目建设的复杂度被分解,可以有效的降低项 目建设难度,縮短项目建设周期。
2、 按照本发明进行数据仓库应用项目建设,使用者可在应用过程中自行构 建多维立方体模型,使得数据仓库应用具备很好的可扩展性,能够更好的适应不 断变化的分析需求。
3、 按照本发明进行数据仓库应用项目建设,开发者在建设阶段将着力组织 核心的基础业务数据来构建大量简单的基础多维立方体,这将使得数据仓库应用 的建设具备更好的可迭代性。
附图是本发明的结构示意图。
具体实施方式
' 一种本发明所述的基于元数据快速实现数据仓库过程的方法,它包括以下步
骤
1) 通过元数据,对0LAP SERVER中己有的基础立方体模型进行解析并列出其包 含的度量和维度,供使用者选择;开发者在建设阶段将着力组织大量的核心 业务数据来构建大量简单的基础多维立方体。
2) 使用者将基础立方体业务元数据导出,根据需要选择若干个基础立方体,并 通过构建人机《互界面将一些具有共有维度的基础立方体进行组合,包括选 择共有维度、选择已有度量;并利用已有度量定义新的计算度量,构建新的 组合立方体。
3) 将使用者所确定的组合立方体的定义以XML的形式进行描述并通过开发OLAP SERVER的元数据访问接口,将组合立方体业务元数据导入OLAP SERVER中, 形成组合立方体模型;
4) 根据使用者所做的组合立方体定义信息,将基础立方体所关联的事实表数据 以共有维度所对应的外键进行关联组合,形成新的事实表或视图来作为组合 立方体的数据支撑。举例如下
假设当前已存在基础立方体"销售收入"、"职工"、"客户",其中"销售收入" 立方体中包括度量"销售收入(元)",维度"分支机构"、"销售月度";"职工" 立方体中包括度量"职工人数",维度"分支机构"、"统计月度";"客户"立方 体中包括度量"客户数量",维度"所属分支机构"、"统计月度"。
使用者可以将"销售收入"、"职工"两个基础立方体进行组合,构建新的度 量"人均销售收入(元/人)",针对各分支机构各月度人均产出进行考察,分析 其平均劳动生产率。
使用者可以将"销售收入"、"客户"两个基础立方体进行组合,构建新的度 量"客户平均销售收入(元/客户)",针对各分支机构各月度客户销售收入均值
进行考查,分析各分支机构客户价值分布特点。
使用者可以将"职工"、"客户"两个基础立方体进行组合,构建新的度量"服 务强度(客户/人)",针对各分支机构各月度平均每职工服务客户的数量进行考 査,分析各分支机构职工客户服务工作的强度。
按照本发明进行数据仓库应用项目建设,改变了传统的数据仓库应用项目建 设方法。传统的数据仓库应用项目立足于根据数据分析应用的需求,构建大而全 的多维立方体来支撑分析应用。由于此项工作的复杂度很高,导致了数据仓库项 目建设难度大、周期长的问题。通过本发明,工作思路和工作角度发生逆转,数 据仓库项目建设的复杂度被分解,可以有效的降低项目建设难度,縮短项目建设 周期。
而且,按照本发明进行数据仓库应用项目建设,使用者可在应用过程中自行 构建多维立方体模型的做法,使得数据仓库应用具备很好的可扩展性,能够更好 的适应不断变化的分析需求;
并且,按照本发明进行数据仓库应用项目建设,开发者在建设阶段将着力组 织核心的基础业务数据来构建大量简单的基础多维立方体,这将使得数据仓库应 用的建设具备更好的可迭代性。
权利要求
1、一种基于元数据快速实现数据仓库过程的方法,其特征在于它包括以下步骤1)通过元数据,对数据仓库中已有的一组基础立方体模型进行解析并列出其包含的度量和维度,供使用者选择;2)使用者将一些具有共有维度的基础立方体进行组合,并根据需要利用已有度量创建新的计算度量;3)将使用者所做的组合立方体的定义以XML的形式进行描述并通过开发数据仓库的元数据访问接口,将定义导入数据仓库中,形成组合立方体模型;4)根据使用者所确定的组合立方体定义信息,将基础立方体所关联的事实表数据以共有维度所对应的外键进行关联组合,形成新的事实表或视图来作为组合立方体的数据支撑。
2、根据权利要求1所述的基于元数据快速实现数据仓库过程的方法,其特征 在于在步骤3)中,使用者通过具有业务含义的关键要素度量和维度形成多维 立方体模型。
全文摘要
本发明公开了一种基于元数据快速实现数据仓库过程的方法,首先通过元数据对数据仓库中已有的一组基础立方体模型进行解析并列出其包含的度量和维度;使用者将一些具有共有维度的基础立方体进行组合,并根据需要利用已有度量创建新的计算度量;将定义导入数据仓库中,形成组合立方体模型;根据使用者所确定的组合立方体定义信息,将基础立方体所关联的事实表数据以共有维度所对应的外键进行关联组合,形成新的事实表或视图来作为组合立方体的数据支撑。通过本发明,使用者可以在使用过程中自主的创建多维分析模型,而不是由开发者预先设计完成,大大提高了数据仓库应用对于业务分析需求的适应能力,并由此加速了数据仓库过程。
文档编号G06F17/30GK101178732SQ20071019152
公开日2008年5月14日 申请日期2007年12月12日 优先权日2007年12月12日
发明者庄哲寅, 张明明, 王成现 申请人:江苏省电力公司