渐增加的顺序逐层搜索完毕再 向下一级扩展子节点,保证越重要的信息越不容易出现遗漏,保证了图谱数据的完整的准 确性。
[0037] 作为一种优选的,其可视化过程为:将目标信息置于可视化图的中心;将相同级数 的节点分散在一个圆周上,并围绕在上一级节点围成的圆的外面。这样图谱显示方式,节点 层次感很强,方便用户直观了解目标信息的关联信息分布情况;关联图谱的展示形式可以 多种多样,比如说将目标信息作为根节点,逐层扩展节点,形成树形节点图谱,本发明优选 将每级节点分布在一个圆周上,图谱层次分明,逻辑路径清楚,界面整洁,便于相关问题分 析和整理。
[0038] 进一步的,所述关联图谱中,使用不同的颜色和,或不同形状来区分各级节点。将 不同级别的节点用对应颜色或者形状来表示,便于用户进行相应的区分,使得节点的关联 图谱中显示的信息更加丰富,分析更加直观简洁。
[0039] 进一步的,所述关联图谱中,使用不同颜色和,或不同形状来区分不同类型的节 点。根据用户的相关字段设置,提取出来的关联信息对应的节点类型可能不同,例如企业为 目标信息分析其背景时,对应的投资者或者股东可能是企业也有可能是自然人,将这些不 同类型的节点使用不同颜色和或者形状来表示,便于用户进行相应的区分的,进而便于根 据步同的节点类型来进行相关问题的归类和追踪。
[0040] 实施例1
[0041] 在原始数据中经过字段(设置的字段包括:第一字段、第二字段、第三字段、第四字 段、第五字段以及第六字段)提取,提取出来3条数据记录。将第一字段对应的内容作为目标 信息,将第二字段、第三字段、第四字段、第五字段以及第六字段对应的内容作为目标信息 的一度关联信息。其中第一数据记录包含的第一字段、第二字段、第三字段以及第四字段所 对应的信息内容依次为:第一信息A、第二信息B、第三信息C、第四信息D,其中将第一字段对 应的内容(第一信息A)作为目标信息,第一信息A与第二信息B之间是双向的指向关系,BPA OB,第二彳目息C指向第一彳目息:C_>A,第一彳目息A指向第四彳目息D: A_>D;第二条数据记录 中包含的第一字段、第二字段、第三字段、第四字段、第五字段以及第六字段所对应的信息 内容依次为:第二信息B、第三信息C、第五信息E、第六信息F、第七信息G以及第八信息H,相 关的关联信息的指向关系如下:B-C、B-E、B-F、B-G、B-H;第三条信息中包含的第一字 段、第二字段、第三字段、第四字段以及第五字段所对应的信息内容依次为:第五信息E、第 九信息I、第十信息J、第十一信息K以及第十二信息L,相关的关联信息的指向关系如下:E- I、E-J、E-K、E-L。将上述信息的第一字段对应的内容(即第一信息A、第二信息B、第五信 息E)作为目标信息,而将数据记录中的其他信息作为目标信息的关联信息,可以形成如图1 所示的关联信息数据表;在进行相关图谱绘制时,在进行关联图谱绘制时为了使指向关系 便于识别,将信息之间的指向关系进行数字化表示或者标注,比如将正指向关系用"Γ来表 示,将负指向关系用"〇"来表示,将互相指向关系用"2"来表示,形成如图2所示的关系信息 数据表,其中第三列中的数字代表对应关系信息的指向关系,通过进行相应的标注和数字 化表示,在进行关联图谱的节点扩展时,通过搜索相应的指向关系标注,在节点之间添加对 应的有向边。将图1、图2所述的关联信息数据利用可视化工具绘制成对应目标信息的关联 图谱的实现过程如图3所示。
[0042] 如果将第一字段对应的信息(第一信息Α、第二信息Β、第五信息Ε)作为目标信息分 别绘制关联图谱,将其抽象成对应关联图谱中的〇级节点。
[0043] 以第一信息Α为目标信息为例说明图谱实现过程。采用广度优选原则,从图2所述 的关联关联数据表中搜索出所述第一信息A的关联信息:第二信息B、第三信息C、第四信息 D;将所述第二信息B、第三信息C、第四信息D抽象成对应0级节点(第一信息A)的1级子节点, 并且根据图3中的指向关系分别在所述A节点(第一信息A对应节点)与B节点(第二信息B对 应节点)之间添加双向边(A<-->B),在A节点与C节点之间添加反向边C->A,在A节点与D节 点之间添加正向边;1级节点搜索扩展完毕后,将第一信息A对应节点打上墓碑标记。
[0044] 分别从所述第二信息B、第三信息C、第四信息D出发搜索出对应的关联信息;所述 第二信息B具有关联信息:第三信息C、第五信息E、第六信息F和第七信息G以及第八信息H, 将所述第三信息C、第五信息E、第六信息F和第七信息G以及第八信息Η抽象成图谱中第二信 息Β对应1级节点的子节点,并且根据图3所示的关联关系在Β节点和C节点之间添加反向边, 在Β节点与Ε节点之间添加反向边,在Β节点与F节点之间添加正向边,在Β节点与G节点之间 添加正向边,在Β节点与Η节点之间添加反向边,并定义这些新扩展的节点为0级节点的2级 节点。将已计算过的所述第二信息Β、第三信息C、第四信息D打上墓碑标记。直到从第一信息 Α为起点逐级搜索出的所有节点都打上墓碑标记,停止计算。
[0045] 使用例如D3、Google Chart API等可视化工具以第一信息A对应的0节点为中心, 逐级扩展子节点,将下一级节点扩展到上一节点的外围;最终形成以目标信息为中心的关 联图谱。实际上针对每个目标信息的个度关联信息可能都是多个的,而且随着关联度数的 增加,扩展出来的关联信息数量更多;多度关联信息图谱均可以按照上述过程逐级扩展出 来。同样的通过上述扩展方法,形成以目标信息为中心〇级节点的关联关系图谱;通过上述 可视化实现过程,形成以第一信息A为0级节点的二度关联图谱如图4所示,形成以第二信息 B为0级节点的二度关联图谱如图5所示,形成以第五信息E为0级节点的二度关联图谱如图6 所示。分别以第二信息B和第五信息E为中心节点的关联图谱的实现方式与原理与上述过程 相同,在此不再赘述。本实施例中的各个节点圆形图案和对应信息标注表示。
[0046] 实施例2
[0047] 在实施例1的的基础上,为了进一步区分各级节点,将0级节点、1级节点和2级节点 分别用方形图案、圆形图案和菱形图案来表示,本实施例中形成的以第一信息A为目标信息 的2级关联图谱如图7所示,以第二信息B为目标信息的2级关联图谱如图8所示,以第五信息 E为目标信息的2级关联图谱如图9所示,可以看出通过不同的图案,使得各级节点的区分明 显,路径逻辑更加清晰。进一步的,还可以使用不同的颜色来区分不同的节点类型,比如说 关联数据中的数据信息对应的类型包括第一类型、第二类型和第三类型,则在关联图谱中 可以将第一类型、第二类型和第三类型对应的节点图案分别用红色、蓝色和黄色来填充,使 得关联图谱展示的信息内容更加丰富,简明易懂,提高分析效率;本实施例的其他实现过程 与实施例1相同,在此不再赘述。
[0048]尽管上面对本发明说明性的【具体实施方式】进行了描述,以便于本技术领的技术人 员理解本发明,但应该清楚,本发明不限于【具体实施方式】的范围,对本技术领域的普通技术 人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变 化时显而易见的,一切利用本发明构思的发明创造均在保护之列。
【主权项】
1. 一种关联数据可视化展示方法,其特征在于,将目标信息的关联信息抽象成对应级 数的子节点,根据关联信息之间的指向关系在节点之间添加有向边;使用可视化工具构造 出以所述目标信息为起点的节点之间具有有向边的关联关系图谱。2. 如权利要求1所述的关联数据可视化展示方法,其特征在于,包括以下实现步骤: (1) 将目标信息定义为〇级节点,在关联数据中搜索出所述目标信息的一度关联信息, 将所述一度关联信息抽象成对应〇级节点的子节点,并将其定义为1级节点; (2) 将已计算过的O级节点打上墓碑标记,从1级节点出发,在关联数据中搜索出对应的 一度关联信息,并将其抽象为相应1级节点的子节点,并将新扩展节点定义为2级节点; (3) 依此类推,逐级抽象出以目标信息为起点的η级节点。3. 如权利要求2所述的关联数据可视化展示方法,其特征在于,所述可视化工具为: Raphiiiii、D3、Google Chart API或Visual .ly。4. 如权利要求3所述的关联数据可视化展示方法,其特征在于,所述步骤(1)、( 2)和,或 (3)中搜索关联信息进行节点扩展时,遵守广度优先原则。5. 如权利要求4所述的关联数据可视化展示方法,其特征在于,所述步骤(1 )、( 2)和,或 (3)中,根据关联信息的指向关系,在对应节点之间添加有向边,形成节点之间具有有向边 的关联图谱。6. 如权利要求5所述的关联数据可视化展示方法,其特征在于,其可视化过程为:将目 标信息置于可视化图的中心;将相同级数的节点分散在一个圆周上,并围绕在上一级节点 围成的圆的外面。7. 如权利要求6所述的关联数据可视化展示方法,其特征在于,所述关联图谱中,使用 不同的颜色和,或不同形状来区分各级节点。8. 如权利要求7所述的关联数据可视化展示方法,其特征在于,所述关联图谱中,使用 不同颜色和,或不同形状来区分不同类型的节点。9. 如权利要求1至8之一所述的关联数据可视化展示方法,其特征在于,所述关联图谱 节点扩展级数η根据用户实际需要来设定。
【专利摘要】本发明涉及互联网信息处理技术领域,特别涉及一种关联数据可视化展示方法。本发明方法将目标信息的关联信息抽象成对应级数的子节点,根据关联信息之间的指向关系在节点之间添加有向边;使用可视化工具构造出以所述目标信息为起点的节点之间具有有向边的关联关系图谱。本发明可以从海量关联信息数据中分析出与目标信息相关联的其他信息,而且通过在节点之间添加对应的有向边,将关联路径和节点之间的关联方式直观的展示出来;路径清晰,直观易懂,极大的节省了用户用于相关数据整理和分析的人力和时间成本,为目标信息背景分析和挖掘和相关问题分析和追踪提供参考依据,在信息挖掘和信息处理领域有广泛的应用前景。
【IPC分类】G06F17/30
【公开号】CN105488130
【申请号】CN201510828405
【发明人】何宏靖, 范东来, 王维, 赵飞, 颜如宾
【申请人】成都数联铭品科技有限公司
【公开日】2016年4月13日
【申请日】2015年11月25日