一种多级维度动态切换分级及汇总的实现方法
【技术领域】
[0001] 本发明属于计算机技术的大数据、商业智能领域,尤其设及一种多级维度动态切 换及汇总的实现方法。
【背景技术】
[0002] 在计算机技术的大数据、商业智能领域中,维度是一个基本概念,也是一类数据。 如从年龄角度分析数据的构成情况,了解少年、青年、中年、老年人的数据量多少,则运个年 龄就是观察角度,也是一个维度,而"少年"、"青年"、"中年"、"老年"都是运个维度的成员, 维度成员有时也用数值分段即分档的形式表示,如用"10-20"、"20-30"、"30-40"等字样来 做年龄维度的成员构成,其中分档提示"10-20"的字样用来表示年龄大于等于10岁而又小 于20岁的情况,其他分档字样的含义依次类推。在商业智能领域的数据统计分析过程中会 使用多个维度,举例如年龄、性别、职业、学历、爱好等等,运些维度是限制过滤数据和统计 分析数据的重要手段,维度的多少也直接影响了统计分析数据的丰富及细致程度,对于数 据价值发掘、利用意义重大。
[0003] 前述举例说明了维度的基本概念,通常维度的成员构成没有统一标准,多W满足 统计分析要求前提下越简单、越少越好,成员构成简单则生成的统计图表也简单,便于分析 人员理解,成员个数少不但有利于分析人员交互操作,而且还能降低系统处理的开销,提高 处理速度。维度成员构成虽没有统一标准,但存在隐含的正交分类要求,即维度成员应不重 叠、包含又能严密覆盖所有数据,换句话说就是一项数据需要属于且仅属于维度的一个成 员。维度成员构成违法正交性要求会引发数据表达及理解错误。前述年龄维度采用其中任 何一种构成方式都是比较简单的,但如果分析需求比较复杂而维度成员的简单构成不满足 需要时,则需构造、使用多级维度。
[0004] 多级维度的成员构成也没有统一标准,同样是W具体分析场景、需求来设计和构 成的,也不具备场景外的普适性。虽然大数据、商业智能领域中真实的多级维度很多,运里 还是W年龄维度举例说明,便于对比、理解。如果首先将年龄分成"适学"、"适工"、"退休" 几个成员,再将"适学"成员分成"5-10"、"10-15"、"15-20"、"20-25"等几个分档,至此年龄 维度就是一个两级的多级维度了。如使用年龄的一级维度则按"适学"、"适工"、"退休"分 别统计汇总数据,使用年龄的二级维度则按"5-10"、"10-15"、"15-20"、"20-25"分别统计 汇总数据。多级维度是一个维度,但在使用上却有多个简单维度的效果,对于统计分析特别 有帮助。运个年龄多级维度还可W继续补充完善成员的构成,继续扩至Ξ级、四级或更多维 度,但即使是两级的多级维度也比简单维度处理复杂很多,尤其是统计分析时级别的切换、 数据汇总更是复杂了。实现多级维度统计分析时即时进行观察级别切换、统计汇总功能,并 降低实现的存储开销,提高计算速度,增加灵活性、普适性,可W有效推动多级维度的应用, 为业务分析提供有效支撑。
【发明内容】
[0005] 本发明针对多级维度即时进行观察级别切换、统计汇总功能的不足,提供了一种 多级维度动态切换及汇总的实现方法。通过定义多级维度缺省观察级别、维度定长前缀编 码、维度编码KV存储、级别转换字符数、编码到维度名称的查找和转换、根据维度名称进行 数据汇总、多级维度级别展示及切换选择等步骤和方法实现多级维度即时进行观察级别切 换、统计汇总。
[0006] 发明步骤、方法的定义多级维度缺省观察级别是因为多级维度在观察数据的一刻 只能按其中的一个级别进行数据的统计汇总,定义缺省观察级别指定按哪个级别进行统计 汇总,即时修改缺省观察级别也就动态切换了多级维度的观察角度,改变了统计汇总级别, 从而获得统计汇总数据不同,实现了业务上需要的多级别分析。
[0007] 发明步骤、方法的维度定长前缀编码是指定多级维度不同级别使用固定个数的字 符进行编码,前一级编码是后一级编码的前缀,如此定义了数据的包含及扩展关系。
[0008] 发明步骤、方法的维度编码KV存储是指多级维度的全部编码定义W及编码和维 度名称的对应关系WKV的方式进行存储,W加快由维度编码查找、转换维度名称时的随机 查找速度。
[0009] 发明步骤、方法的级别转换字符数是根据各级编码长度计算出特定级别编码所对 应的字符数,其中一级编码的字符数是其本身编码长度,二级编码的字符数是一级编码长 度加上二级编码本身的长度,因此比一级编码长,Ξ级、四级字符数也用类似的方法计算。
[0010] 发明步骤、方法的编码到维度名称的查找和转换是分级统计分析的一个中间步 骤。为节省存储空间,待统计分析数据中多级维度只存一个数据项,运个数据项内容为该多 级维度最大级别的编码,是定长数据项,其前缀是一级编码、二级编码等。如按k级编码统 计分析数据时需先将级别数k转换为对应编码长度字符数n,多级维度数据项均取前η个字 符按KV的方式查找多级维度编码定义,提取相应的维度名称。
[0011] 发明步骤、方法的根据维度名称进行数据汇总是将数据按维度名称相同与否进行 累加、汇总数据,实现数据按维度组织。
[0012] 发明步骤、方法的多级维度级别展示及切换选择是把基于多级维度缺省观察级别 统计汇总的数据W汇总表及分析图形的方式在图形用户界面上呈现出来,同时提示出当前 缺省观察级别到底是哪一级,允许即时修改成其他分级并即时汇总数据、刷新呈现的用户 界面。
[0013] 本发明针对多级维度即时进行观察级别切换、统计汇总功能的不足,提供了一种 多级维度动态切换及汇总的实现方法,实现多级维度统计分析时即时进行观察级别切换、 统计汇总功能,并降低存储开销,提高计算速度,增加灵活性、普适性,可W有效推动多级维 度的应用,为业务分析提供有力支撑。
【附图说明】
[0014] 图1为本发明一种多级维度动态切换及汇总的实现方法之步骤方法示意。
[0015] 图2为本发明一种多级维度动态切换及汇总的实现方法之缺省观察级别突出显 示及即时切换示意图。其中子图201为突出显示功能项,表明"1级"是当前缺省观察级别。 子图202、203、204是非当前缺省观察级别,但是可W通过鼠标点击即时切换为缺省观察级 另IJ。多级维度有且仅有一项是缺省观察级别,当设定了新的缺省观察级别,之前的缺省观察 级别自动变为非缺省观察级别了。
[0016] 图3多级维度的缺省分级做观察角度实现示意图,界面鼠标指向"标准产品"是多 级分档维度,其缺省观察角度为3级,统计汇总数据按3级维度名称进行标记,两个指标、条 形图呈现的效果,从使用角度看多级维度的数据呈现和简单维度是一样的。
[0017] 图4多级维度即时修改缺省观察角度示意图,在多级分档"标准产品"已是当前观 察维度时点击鼠标,弹出截图的本窗口。其中"3级"是缺省观察角度,呈现突出显示状态, 下方对应"3级"数据统计汇总情况。鼠标指向的"2级"是可W设定为新的缺省观察角度 的级别。
[0018] 图5多级维度即时切换缺省显示级别后的页面刷新示意图,和切换之前相比,统 计分析图形的标注发生变化。
【具体实施方式】
[0019] 为使本发明一种多级维度动态切换及汇总的实现方法之目的、技术方案和优点更 加清楚,W下结合优先实施例电信公司产品的多级维度来详细说明实现的方法和技术细 节。借此对本发明如何应用技术手段解决技术问题,并达成技术效果的实现过程能充分理 解并据W实施。 阳020]调研并确定多级维度使用场景需求
[0021] 前述维度和多级维度的设计实现均须W满足使用场景需求为前提,并在运个前提 下追求尽可能简单、高效、灵活地实现,因此调研并确定多级维度使用场景需求是本发明一 种多级维度动态切换及汇总的实现方法具体实施工作的第一步。
[0022] 电信公司产品的多级维度实例使用场景需求调研及确认如表1所示。
[0023]
[0024]表 1 阳0巧]定义缺省观察级别
[0026] 在发明步骤、方法的定义缺省观察级别实施过程就是设置一个存储变量,记录多 级维度的缺省观察级别,初始值为1,在系统使用操作过程中修改,记录最新的缺省观察级 别。
[0027] 维度定长前缀编码、维度编码KV存储的实施
[0028] 在发明步骤、方法的维度定长前缀编码、维度编码KV存储的实施过程中需要先定 义多级维度存储结构,示意如下,其中的fl化ame存放多级维度字段名称,dimid存放多级 维度编码,di皿ame存放维度名称。又fl化ame和dimid合起来做哈希索引的key,di皿ame 做value,数据WKV的方式存储和查找。
[0029] KV存储及查询实现方式有多种可选,可W自行设计、构造散列存储体,提供配套的 查询代码,整个系统浑然一体。也可W找成熟的KV框架搭建KV服务,完成KV数据的存储 及查询服务。
[0030] 存放多级维度字段名称的好处在于使得运一个存储结构可W存放所有的多级维 度编码及名称,方便系统使用和维护。
[0031]
[0032] 电信公司产品的多级维度定义如下:
[0033] ProductID,*,4 :2 :5 :7 :9
[0034] ProductID, 10,接入类
[0035] ProductID, 10101,通信类
[0036] ProductID, 1010101,固定电话
[0037] ProductID, 101010101,固定电话仅含本地语音
[0038] ProductID,101010102,固定公用电话
[0039