使能扩展大型数据集的极端可视化的制作方法

文档序号:8381002阅读:617来源:国知局
使能扩展大型数据集的极端可视化的制作方法
【技术领域】
[0001] 本公开涉及使能扩展大数据集的极端可视化的方法、系统和计算机程序产品。
【背景技术】
[0002] 创建数据库中存储的大数据集的可视化是个难题。分辨率和像素数限制了可以在 任一视觉显示器上显示的数据点的数量。虽然现代移动设备,例如智能电话和平板计算机, 有能力向终端用户提供丰富多样的数据集,但是更小的显示器和减少的像素数进一步加剧 该问题。人眼受限的视觉敏锐度可能将在视觉显示器上标绘符号的庞大数量的数据点减少 到不可辨别的数据点的集合。此外,可用网络带宽,例如与蜂窝网络相关联的带宽,可能在 尝试将大量数据集传送到移动设备以用于可视化时充当瓶颈。所谓的"极端可视化"的各 种方法可以被用来尝试将大数据集可视化为各种类型的图形。例如,常用方法是将许多元 组或数据元素的集合聚集为单独的Bin(箱),每个Bin代表数据点,该数据点是大数据集中 的一定数量的数据点的平均。然后可以在显示器上将Bin可视化为代表数据的图形。其他 方法包括核密度估计和累积分布函数。执行这种类型的数据聚集的经典方法是使用非实时 的、复杂的、数据-处理-和模式密集型数据库查询,例如结构化查询语言(SQL)形式的查 询,来处理数据以供显示。

【发明内容】

[0003] 本公开涉及使能用于数据库中存储的大数据集的极端可视化的计算机实现的方 法、计算机可读介质和计算机系统。一种计算机实现的方法包括:接收请求,在该请求中标 识供应给数据规范语言(DaSL)的输入模式以及由数据库视图展示的类型对象的元数据要 点;请求从数据库提取输入模式以及元数据要点;基于输入模式创建DaSL编译器的实例; 由计算机生成与从元数据要点选择的对象相对应的DaSL查询;请求编译DaSL查询;以及 响应于DaSL查询的编译,接收计算方案和拓扑游标。
[0004] 这个方面的其他实现方式包括相应的计算机系统、装置、和记录在一种或多种计 算机存储设备上的计算机程序,每一个都配置成执行所述方法的动作。一个或多个计算机 的系统可以配置成通过拥有安装在系统上、在操作时使系统执行动作的软件、固件、硬件或 软件、固件、硬件的组合来执行特定操作或动作。一个或多个计算机程序可以配置成通过 包括指令来执行特定操作或动作,其中当所述指令被数据处理装置执行时使该装置执行动 作。
[0005] 上述和其他实现方式中的每一个可选地可以单独或组合地包括如下特征中的一 个或多个:
[0006] 可与一般实现方式结合的第一方面还包括使用图形用户界面选择与数据库相关 联的数据库视图。
[0007] 可与任何一个前述方面结合的第二方面,其中,由模型提取组件执行输入模式以 及元数据要点的提取。
[0008] 可与任何一个前述方面结合的第三方面还包括发送元数据要点以用于显示。
[0009] 可与任何一个前述方面结合的第四方面还包括将DaSL查询编译为计算方案和拓 扑游标以用于可视化数据。
[0010] 可与任何一个前述方面结合的第五方面还包括在数据库中运行计算方案。
[0011] 可与任何一个前述方面结合的第六方面还包括使用拓扑游标响应于运行计算方 案启动数据集的可视化。
[0012] 描述在本说明书中的主题可以在特定实现方式中实现,以便实现如下优点中的一 个或多个。首先,商业智能数据规范语言(DaSL)可以被用来高效地构建用于数据的极端可 视化的表达应用。DaSL基于从由数据源展示的数据模型中提取的输入模式,而且它的简化 表达可以被编译为由数据库支持的本机结构。在示例性实现方式中,大数据集被内存数据 库存储并且由内存数据库进行查询处理。在其它实现方式中,任何数据库都可以使用,但是 相比于利用内存数据库,性能可能受损。第二,DaSL查询是简单和简洁的。例如,DaSL也 有专门的分箱(binning)运算符,以简化数据聚集的执行,而无需创建具有多个资源密集 型操作的复杂查询。第三,DaSL查询相对于基础数据库模式的一些变化是健壮的,因为它 们更接近应用的语义。例如,DaSL查询仅涉及属性而不涉及数据库表。第四,DaSL在资源 空间方面是高效的,在这个意义上,分配给输入的资源空间与Bin的数量成线性,并且独立 于输入的大小。第五,分箱运算符在时间方面也是高效的,因为扫描两次输入节点表就足够 了。第六,内存数据库提供实时提供极端数据可视化所需的性能。其他优点对本领域的普 通技术人员来说是显而易见的。
[0013] 本说明书的主题的一种或多种实现方式的细节展示在附图和下面的描述中。该主 题的其他特征、方面和优点将从该描述、附图和权利要求书中明显看出。
【附图说明】
[0014] 图1示出根据一个实现方式的、存储在数据库中的示例性大数据集表的一部分的 示例性屏幕截图。
[0015] 图2A示出了根据一个实现方式的、使用由经典方法生成的图1的数据的表的一部 分的示例性屏幕截图。
[0016] 图2B示出了根据一个实现方式的、用于数据规范语言(DaSL)查询的示例性计算 方案。
[0017] 图3示出根据一个实现方式的、输入DaSL查询的示例性屏幕截图。
[0018] 图4是根据一个实现方式的、使能用于数据库中存储的大数据集的极端可视化的 示例性分布式计算系统的框图。
[0019] 图5是示出根据一个实现方式的、使能用于数据库中存储的大数据集的极端可视 化的方法的序列图。
[0020] 在各图中,相同的参考标记和标号指示相同元件。
【具体实施方式】
[0021] 本公开一般描述用于使能存储在数据库中的大数据集的极端可视化的计算机实 现的方法、计算机程序产品和系统。给出以下描述以使任一本领域技术人员能做出并使用 本发明,并且在一个或多个特定实现的上下文中提供以下描述。对本领域技术人员来说,对 公开的实现的各种修改将是非常明显的,并且本文定义的一般原理可以应用于其他实现和 应用而不脱离本公开的范围。因此,本公开不打算限制描述和/或示出的实施例,而是符合 与本文公开的原理和特征一致的最宽的范围。
[0022] 创建数据库中存储的大数据集的可视化是个难题。分辨率和像素数限制了可以在 任何视觉显示器上显示的数据点的数量。虽然现代移动设备,例如智能电话和平板计算机, 有能力向终端用户提供丰富多样的数据集,但是更小的显示器和减少的像素数进一步加剧 该问题。人眼受限的视觉敏锐度可能将在视觉显示器上标绘符号的庞大数量的数据点减少 到不可辨别的数据点的集合。此外,可用网络带宽,例如与蜂窝网络相关联的带宽,可能在 尝试将大量数据集传送到移动设备以用于可视化时成为瓶颈。所谓的"极端可视化"的各 种方法可以被用来尝试将大数据集可视化
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1