知识图谱的处理方法、装置、电子设备和介质与流程

文档序号:31204304发布日期:2022-08-20 02:19阅读:88来源:国知局
知识图谱的处理方法、装置、电子设备和介质与流程

1.本公开涉及计算机技术领域,尤其涉及一种知识图谱的处理方法、装置、电子设备和介质。


背景技术:

2.知识图谱,可称为知识域可视化或知识领域映射地图,能够显示知识发展进程与结构关系的一系列各种不同的图形,并且能够利用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制以及显示知识及它们之间的相互关系。
3.现有技术中,对于知识图谱的可视化显示,主要是通过力导向图实现,用以显示各知识之间的关系节点以及连接关系。
4.然而,对于大数据量的知识图谱,力导向图的显示在视觉上显得杂乱,浏览性较差。


技术实现要素:

5.为了解决上述技术问题,本公开提供了一种知识图谱的处理方法、装置、电子设备和介质。
6.第一方面,本公开提供了一种结构化数据的处理方法,包括:
7.获取知识图谱的原始数据,原始数据包括:至少两个目标实体以及至少两个目标实体间的结构关系;
8.基于至少两个目标实体以及至少两个目标实体间的结构关系,确定图谱网格数据,图谱网格数据为对至少两个目标实体进行网格化处理得到的;
9.基于图谱网格数据,显示知识图谱对应的可视化视图,可视化视图包括:可视化缩略视图或可视化局部视图,可视化局部视图与可视化缩略视图相对应。
10.可选的,基于至少两个目标实体以及至少两个目标实体间的结构关系,确定图谱网格数据,包括:
11.在预设坐标系构建的坐标区域中,确定至少两个目标实体的位置坐标;
12.将坐标区域进行网格化分,得到至少两个一级网格;
13.基于至少两个一级网格中目标实体的存在数量,将至少两个一级网格进行网格划分,得到至少两个二级网格;
14.基于至少两个一级网格中目标实体的存在数量、至少两个二级网格中目标实体的存在数量、至少两个目标实体的位置坐标、至少两个目标实体间的结构关系、以及至少两个目标实体的标签信息,确定图谱网格数据,标签信息是根据目标实体的属性信息确定得到的。
15.可选的,基于至少两个一级网格中目标实体的存在数量、至少两个二级网格中目标实体的存在数量、至少两个目标实体的位置坐标、至少两个目标实体间的结构关系、以及至少两个目标实体的标签信息,确定图谱网格数据之前,还包括:
16.确定每个二级网格中目标实体的存在数量小于预设数量阈值。
17.可选的,基于图谱网格数据,显示知识图谱对应的可视化视图,包括:
18.基于至少两个一级网格中目标实体的存在数量,以一级网格中不同标签信息对应的目标实体,显示知识图谱对应的可视化缩略视图。
19.可选的,还包括:
20.响应于对可视化缩略视图中目标位置的触发操作,确定目标位置对应的目标网格,目标网格为:一级网格或二级网格;
21.确定目标网格中目标实体的存在数量小于预设数量阈值,基于目标网格内包括的全部目标实体以及各目标实体之间的结构关系显示目标网格对应的可视化局部视图。
22.可选的,还包括:
23.响应于对目标网格对应的可视化局部视图的滑动操作,显示与目标网格相连的其他网格对应的可视化局部视图。
24.可选的,还包括:
25.基于预设更新规则,更新图谱网格数据。
26.第二方面,本公开提供了一种知识图谱的处理装置,包括:
27.获取模块,用于获取知识图谱的原始数据,原始数据包括:至少两个目标实体以及至少两个目标实体间的结构关系;
28.确定模块,用于基于至少两个目标实体以及至少两个目标实体间的结构关系,确定图谱网格数据,图谱网格数据为对至少两个目标实体进行网格化处理得到的;
29.显示模块,用于基于图谱网格数据,显示知识图谱对应的可视化视图,可视化视图包括:可视化缩略视图或可视化局部视图,可视化局部视图与可视化缩略视图相对应。
30.可选的,确定模块,具体用于:
31.在预设坐标系构建的坐标区域中,确定至少两个目标实体的位置坐标;
32.将坐标区域进行网格化分,得到至少两个一级网格;
33.基于至少两个一级网格中目标实体的存在数量,将至少两个一级网格进行网格划分,得到至少两个二级网格;
34.基于至少两个一级网格中目标实体的存在数量、至少两个二级网格中目标实体的存在数量、至少两个目标实体的位置坐标、至少两个目标实体间的结构关系、以及至少两个目标实体的标签信息,确定图谱网格数据,标签信息是根据目标实体的属性信息确定得到的。
35.可选的,确定模块,还用于确定每个二级网格中目标实体的存在数量小于预设数量阈值。
36.可选的,显示模块,具体用于:
37.基于至少两个一级网格中目标实体的存在数量,以一级网格中不同标签信息对应的目标实体,显示知识图谱对应的可视化缩略视图。
38.可选的,确定模块,还用于响应于对可视化缩略视图中目标位置的触发操作,确定目标位置对应的目标网格,目标网格为:一级网格或二级网格;
39.显示模块,还用于确定目标网格中目标实体的存在数量小于预设数量阈值,基于目标网格内包括的全部目标实体以及各目标实体之间的结构关系显示目标网格对应的可
视化局部视图。
40.可选的,显示模块,还用于响应于对目标网格对应的可视化局部视图的滑动操作,显示与目标网格相连的其他网格对应的可视化局部视图。
41.可选的,还包括:更新模块;
42.更新模块,用于基于预设更新规则,更新图谱网格数据。
43.第三方面,本公开还提供了一种电子设备,包括:
44.一个或多个处理器;
45.存储装置,用于存储一个或多个程序,
46.当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本发明实施例中的任一种的知识图谱的处理方法。
47.第四方面,本公开还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例中的任一种的知识图谱的处理方法。
48.本公开实施例提供的技术方案与现有技术相比具有如下优点:
49.通过获取到的知识图谱中至少两个目标实体以及至少两个目标实体间的结构关系,对目标实体进行网格化,得到图谱网格数据,并基于图谱网格数据,显示知识图谱对应的可视化视图,其中,可视化视图包括:可视化缩略视图或可视化局部视图,可视化局部视图与可视化缩略视图相对应,从而,能够显示大规模数量的图谱数据,可视化程度较高,有效提升用户浏览性。
附图说明
50.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
51.为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
52.图1是本公开实施例提供的一种知识图谱的处理方法的流程示意图;
53.图2是本公开实施例提供的一种知识图谱原始数据的存储示意图;
54.图3是本公开实施例提供的一种图谱网格化存储示意图;
55.图4是本公开实施例提供的一种知识图谱的处理装置的结构示意图;
56.图5是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
57.为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
58.在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
59.相关技术中,主要通过以下方式实现知识图谱的可视化处理。
60.相关技术一,通过标签传播算法(lpa)实现大规模知识图谱的可视化,如获取知识图谱数据,其中,知识图谱数据包括实体以及实体间的关系,为知识图谱数据中的每个实体标记唯一的标签,遍历知识图谱数据中的所有实体,在知识图谱数据中的所有实体中进行标签传播,直至满足中止条件,基于标签传播结束后每个实体的标签结果,得到由实体的标签组成的标签集合,根据实体间的关系和标签集合中的标签构造图数据,对图数据进行可视化展示。
61.然而,技术一只能展示实体融合成的社区之间的关系,未能展示出原始实体及其原始关系,无法支撑超大规模知识图谱中针对原始数据的深入详细分析。
62.相关技术二,通过粒子系统实现大规模知识图谱可视化方法,包括:海量知识图谱的渲染、粒子系统、粒子材质、代理服务器(service worker)、以及客户端性能优化。
63.其中,海量知识图谱的渲染可为用户提供可视化知识图谱界面,当用户搜索其中某一个节点,可将该节点相关的关系节点都渲染在页面,还可将渲染出的图谱进行存储;客户端启用异步多线程队列进行加载渲染,优化性能;选型使用d3-force力导向图布局+webgl渲染。
64.粒子系统使用points类,points对象只能通过渲染器进行渲染,渲染器渲染时的粒子如果需要用canvas实现,则必须多加一步将canvas转化为纹理,在通过map属性加载进来。
65.每个粒子材质图形的创建,一般是通过canvas描绘或通过加载图片的方式来格式化粒子,一个客户端使用service worker离线资源缓存。
66.然而,技术二展示的是大量数据压缩成粒子对象模型数据后的可视化,无法完全反映出原始实体及其原始关系,无法支撑超大规模知识图谱中针对原始数据的深入详细分析。
67.相关技术三,通过力导向实现知识图谱的可视化,如知识图谱数据提取,构造图数据结构,力导向算法布局,可视化呈现,运算流程可视化交互,能够通过最终知识图谱,为每个节点和关系绑定监听事件,使用户能通过鼠标操作节点和关系。
68.然而,技术三对于知识图谱数据海量增长,单纯的以力导向图展示大规模知识图谱数据,视觉上容易显得杂乱,浏览器性能也难以支撑,无法支撑超大规模知识图谱中针对原始数据的深入详细分析。
69.相关技术四,通过大规模运维实现知识图谱存储和多粒度可视化,如使用x-engine引擎为历史数据存储核心,完成海量实体、属性和关系的知识图谱数据存储,根据lpa算法对知识图谱数据进行聚类,将有较大相似性的实体融合成群或社区,根据用户的查询条件,在服务器端对智能运维知识图谱进行查询处理与数据请求的操作,在终端根据结果进行多粒度的图形渲染,并显示结果。
70.然而,技术四要么只展示群之间(或称社区之间)的关系,要么只展示群内部(或称社区内部)的关系,因lpa算法划分结果不够稳定而存在的随机性,导致被误划分到不同社区的实体间原始关系不易被反映出来,无法支撑超大规模知识图谱中针对原始数据的深入详细分析。
71.图1是本公开实施例提供的一种知识图谱的处理方法的流程示意图。本实施例方法可由知识图谱的处理装置来执行,该装置可采用硬件/或软件的方式来实现,并可配置于
电子设备中。可实现本技术任意实施例的知识图谱的处理方法。如图1所示,该方法具体包括如下:
72.s110、获取知识图谱的原始数据,原始数据包括:至少两个目标实体以及至少两个目标实体间的结构关系。
73.以知识图谱为海量安全日志和情报等数据的攻击图谱为例进行举例说明,原始数据可为1年内的海量安全日志中抽取出的历史攻击资源、受害者及攻击关系,将抽取出的信息存储至图数据库中保存,知识图谱的原始数据的存储示意图可参见图2示例性所示。
74.其中,历史攻击资源和受害者为两个目标实体,攻击关系为两个目标实体之间的结构关系。
75.具体的,可基于攻击资源组织、攻击资源关系、受害者单位、受害者行业等信息,形成攻击资源和受害者的各类实体(网络协议地址、域名、统一资源定位符、样本、邮箱等)及其实体间的攻击关系(如各类攻击关系、域名解析关系等)。
76.s120、基于至少两个目标实体以及至少两个目标实体间的结构关系,确定图谱网格数据。
77.其中,图谱网格数据为对至少两个目标实体进行网格化处理得到的,能够有效表示出各实体的位置信息、各实体之间的结果关系、以及网格划分中各实体的存在数量等。
78.在本实施例中,可选的,基于至少两个目标实体以及至少两个目标实体间的结构关系,确定图谱网格数据,包括:
79.在预设坐标系构建的坐标区域中,确定至少两个目标实体的位置坐标;
80.将坐标区域进行网格化分,得到至少两个一级网格;
81.基于至少两个一级网格中目标实体的存在数量,将至少两个一级网格进行网格划分,得到至少两个二级网格;
82.基于至少两个一级网格中目标实体的存在数量、至少两个二级网格中目标实体的存在数量、至少两个目标实体的位置坐标、至少两个目标实体间的结构关系、以及至少两个目标实体的标签信息,确定图谱网格数据,标签信息是根据目标实体的属性信息确定得到的。
83.其中,可以坐标系中(0,0)、(x,0)、(x,y)、(0,y)四点确定坐标区域,并在坐标区域内随机初始化每个目标实体的位置坐标,存储至图数据库中。
84.其中,在基于至少两个一级网格中目标实体的存在数量,将至少两个一级网格进行网格划分,得到至少两个二级网格之前,还包括:确定一级网格中目标实体的存在数量大于预设数量阈值。
85.可基于图数据库中每个目标实体的位置坐标,将坐标系中(0,0)、(x,0)、(x,y)、(0,y)四点确定的坐标区域划分成n
×
n个顶级网格(一级网格),并计算每个一级网格内包含的目标实体的存在数量,若一级网格中目标实体的存在数量超过m,则可继续对一级网格进行下级划分,得到多个二级网格。
86.结合上述举例,基于图数据库中初始化目标实体的位置坐标,将坐标系中(0,0)、(1000,0)、(1000,1000)、(0,1000)四点确定的坐标区域划分成10
×
10个一级网格,并计算每个一级网格内目标实体的个数,若存在目标实体个数超过500(如上述提及的m的取值)的一级网格,继续针对该一级网格所对应的子区域划分成10
×
10个二级网格并计算每个二级
网格内目标实体的个数,直到新划分出网格中目标实体的个数都不超过500为止,计算出各个网格(包括一级网格和二级网格)的目标实体的个数、分标签包含目标实体的个数、一级网格、区域坐标、中心坐标等网格化数据并存储至数据库。
87.其中,可将至少两个一级网格中目标实体的存在数量、至少两个二级网格中目标实体的存在数量、至少两个目标实体的位置坐标、至少两个目标实体间的结构关系、以及至少两个目标实体的标签信息、中心坐标等信息,存储至图数据库中,实现图谱网格化存储,网格化存储示意图可参见图3示例性所示。
88.需要说明的是,基于存储的多级网格化数据,能够提供各划分网格(一级网格或二级网格)内目标实体总量及各类标签的实体数量,支持大规模图谱各级缩略图的展示,并且提供上下级网格关系,支持从顶级网格向下级各级网格逐级下钻,提供各网格坐标信息,支持最底层网格中原始实体及关系在局部原始图中的展示,并结合原始实体的坐标,通过局部原始图的平滑移动展示附近实体及其关系。
89.在本实施例中,可选的,在确定图谱网格数据之前,还可以包括:
90.确定每个二级网格中目标实体的存在数量小于预设数量阈值。
91.其中,在确定出每个二级网格中目标实体的存在数量小于预设数量阈值,可不再对二级网格进行划分,从而,实现图谱数据的多级有效划分。
92.另外,在确定出二级网格中目标实体的存在数量大于或等于预设数量阈值,则可对二级网格继续进行划分,得到多个三级网格,直至每个三级网格中包括的目标实体的数量都小于预设数量阈值。
93.其中,可选的,在确定出图谱网格数据之后,还可以包括:
94.基于预设更新规则,更新图谱网格数据。
95.其中,对于已有数据设置扩充实体的坐标,补充扩充实体的标签,并追加细化网格数据。
96.其中,可获取新扩充的知识图谱数据,抽取新扩充实体主要属性值形成实体标签,一同存储至图数据库,基于知识图谱中实体间关系,初始化新扩充实体的坐标为关联已有实体坐标的几何中心,针对未关联已有实体的新扩充实体,在坐标系中(0,0)、(x,0)、(x,y)、(0,y)四点确定的区域内随机初始化实体坐标。
97.在坐标系中(0,0)、(x,0)、(x,y)、(0,y)四点确定的区域内,利用力导向算法计算新扩充实体的坐标并更新至图数据库中,基于图数据库中扩充后实体的坐标,更新图谱的现有网格数据,若存在实体个数超过一定阈值m的网格,继续针对该网格所对应的子区域划分成n
×
n个下级网格并计算新网格内实体个数,直到新划分出网格中实体个数都不超过m为止,最后计算出各级网格的实体个数、分标签包含实体个数、上级网格、区域坐标、中心坐标等网格化数据并存储至数据库,实现图谱网格化存储。
98.结合上述举例,每天定时从前一天的安全日志中抽取攻击资源、受害者及攻击关系等,基于攻击资源团伙、攻击资源关系、受害者单位、受害者行业等信息,形成攻击资源和受害者的各类实体及其关系,提取攻击资源组织、攻击事件年份、攻击事件类型、实体类型、受害者单位、受害者行业等主要属性值形成实体标签,一同存储至图数据库,基于图数据库中实体间关系,设置这些每日新增数据中新实体的坐标为关联已有实体坐标的几何中心,针对未关联到已有实体的每日新增实体,在坐标系中(0,0)、(1000,0)、(1000,1000)、(0,
1000)四点确定的区域内随机初始化每日新增实体坐标。
99.其中,每天新增实体和关系保存至图数据库后,在坐标系中(0,0)、(1000,0)、(1000,1000)、(0,1000)四点确定的区域内,每天利用力导向算法计算每日新增实体的坐标并更新至图数据库中,每天新增实体的坐标信息更新至图数据库后,每天更新图谱的现有网格数据,若存在实体个数超过500的网格,继续针对该网格所对应的子区域划分成10
×
10个下级网格并计算新网格内实体个数,直到新划分出网格中实体个数都不超过500为止,并将图谱的新网格数据存储至数据库中。
100.s130、基于图谱网格数据,显示知识图谱对应的可视化视图。
101.其中,可视化视图包括:可视化缩略视图或可视化局部视图,可视化局部视图与可视化缩略视图相对应。
102.其中,可在前端界面展示知识图谱对应的可视化缩略视图或者可视化缩略视图对应的可视化局部视图,通过可视化缩略图展示全局,依赖坐标位置定位基于可视化局部视图展示局部区域内知识图谱中原始实体及其原始关系,开展超大规模知识图谱中针对原始数据的深入详细分析。
103.具体的,对于可视化缩略视图,可基于图谱网格数据进行查找显示,对于可视化局部视图,可基于可视化缩略图中的定位坐标,在局部原始图中展示局部区域内知识图谱。
104.本实施例提供的知识图谱的处理方法,通过获取到的知识图谱中至少两个目标实体以及至少两个目标实体间的结构关系,对目标实体进行网格化,得到图谱网格数据,并基于图谱网格数据,显示知识图谱对应的可视化视图,其中,可视化视图包括:可视化缩略视图或可视化局部视图,可视化局部视图与可视化缩略视图相对应,从而,能够显示大规模数量的图谱数据,可视化程度较高,有效提升用户浏览性。
105.基于上述实施例的描述,在本实施例中,可选的,基于图谱网格数据,显示知识图谱对应的可视化视图,包括:
106.基于至少两个一级网格中目标实体的存在数量,以一级网格中不同标签信息对应的目标实体,显示知识图谱对应的可视化缩略视图。
107.其中,可基于一级网格数据(和用户选择的标签),获取各一级网格内各标签包含的目标实体的个数,将各一级网格内不同标签信息以实体的形式展示在可视化缩略视图中,标签包含的目标实体的个数代表可视化缩略视图中实体的大小。
108.结合上述举例,可在前端界面展示的攻击图谱包括可视化缩略视图和可视化局部视图(局部原始图),基于一级网格数据(和用户选择的标签,如攻击资源组织、攻击事件年份、攻击事件类型、实体类型、受害者单位、受害者行业等),获取各一级网格内各标签包含目标实体的个数,将各一级网格内不同标签以实体的形式展示在可视化缩略视图中,标签包含的目标实体的个数代表可视化缩略视图中实体目标的大小。
109.从而,基于多级网格化数据,提供多级可视化缩略图,解决单一缩略图在“超大规模知识图谱中局部实体过多”情况下“无法展示知识图谱某个区域内过多实体”的问题。
110.在本实施例中,可选的,还可以包括:
111.响应于对可视化缩略视图中目标位置的触发操作,确定目标位置对应的目标网格,目标网格为:一级网格或二级网格;
112.确定目标网格中目标实体的存在数量小于预设数量阈值,基于目标网格内包括的
全部目标实体以及各目标实体之间的结构关系显示目标网格对应的可视化局部视图。
113.其中,用户可对可视化缩略视图中的任一坐标位置进行点击,用以触发显示与该坐标位置对应的可视化局部视图,便于用户观看详细数据。
114.具体的,可借助于目标网格的区域坐标,从图数据库中筛选出该区域内的所有符合条件的实体及其关系,在可视化局部视图中展示该网格覆盖区域内所有符合条件的实体及其关系。
115.另外,在确定出目标网格中目标实体的存在数量大于或等于预设数量阈值时,可对一级网格的下级网格(如二级网格、三级网格等)进行下钻,获取各下级网格内各标签包含目标实体的个数,将各下级网格内不同标签以图谱中实体的形式展示在可视化缩略视图中,直至查找出下级网格中目标实体的存在数量小于预设数量阈值。
116.在本实施例中,可选的,还可以包括:
117.响应于对目标网格对应的可视化局部视图的滑动操作,显示与目标网格相连的其他网格对应的可视化局部视图。
118.其中,在目标网格对应的可视化局部视图中,可支持滑动查看目标网格附近的其他实体以及结构关系,可逐步平滑展示附近实体及其关系,实现跨越不同网格的原始图谱的详细分析能力。
119.从而,在可视化局部视图中,基于网格和实体的坐标信息,通过可视化局部视图的平滑移动,逐步展示附近实体及其关系,支持跨越不同网格的原始实体及其关系的图谱分析,便于超大规模知识图谱中针对原始数据的深入详细分析。
120.本公开实施例,在能够基于各实体坐标,划分出多级网格并计算出各个网格(包括上级网格和下级网格)的实体个数、分标签包含实体个数、上级网格、区域坐标、中心坐标等网格化数据并存储至数据库,实现图谱网格化存储。
121.并且,能够基于存储的多级网格化数据,提供各网格内实体总量及各类标签的实体数量,实现大规模图谱各级缩略图的展示,通过提供上下级网格关系,支持从顶级网格向下级各级网格逐级下钻,通过提供各网格坐标信息,实现最底层网格中原始实体及关系在局部原始图中的展示,并结合原始实体的坐标,通过局部原始图的平滑移动展示附近实体及其关系,依据“网格数据生成的多级缩略图”刻画全局并确定分析重点,依赖“单一网格坐标区域限定的局部原始图”展示原始实体及关系,基于坐标位置支持局部知识图谱的平滑移动,快速有效支撑知识图谱的深入详细分析。
122.图4是本公开实施例提供的一种知识图谱的处理装置的结构示意图;该装置配置于电子设备中,可实现本技术任意实施例的知识图谱的处理方法。该装置具体包括如下:
123.获取模块410,用于获取知识图谱的原始数据,原始数据包括:至少两个目标实体以及至少两个目标实体间的结构关系;
124.确定模块420,用于基于至少两个目标实体以及至少两个目标实体间的结构关系,确定图谱网格数据,图谱网格数据为对至少两个目标实体进行网格化处理得到的;
125.显示模块430,用于基于图谱网格数据,显示知识图谱对应的可视化视图,可视化视图包括:可视化缩略视图或可视化局部视图,可视化局部视图与可视化缩略视图相对应。
126.在本实施例中,可选的,确定模块420,具体用于:
127.在预设坐标系构建的坐标区域中,确定至少两个目标实体的位置坐标;
128.将坐标区域进行网格化分,得到至少两个一级网格;
129.基于至少两个一级网格中目标实体的存在数量,将至少两个一级网格进行网格划分,得到至少两个二级网格;
130.基于至少两个一级网格中目标实体的存在数量、至少两个二级网格中目标实体的存在数量、至少两个目标实体的位置坐标、至少两个目标实体间的结构关系、以及至少两个目标实体的标签信息,确定图谱网格数据,标签信息是根据目标实体的属性信息确定得到的。
131.在本实施例中,可选的,确定模块420,还用于确定每个二级网格中目标实体的存在数量小于预设数量阈值。
132.在本实施例中,可选的,显示模块430,具体用于:
133.基于至少两个一级网格中目标实体的存在数量,以一级网格中不同标签信息对应的目标实体,显示知识图谱对应的可视化缩略视图。
134.在本实施例中,可选的,确定模块420,还用于响应于对可视化缩略视图中目标位置的触发操作,确定目标位置对应的目标网格,目标网格为:一级网格或二级网格;
135.显示模块430,还用于确定目标网格中目标实体的存在数量小于预设数量阈值,基于目标网格内包括的全部目标实体以及各目标实体之间的结构关系显示目标网格对应的可视化局部视图。
136.在本实施例中,可选的,显示模块430,还用于响应于对目标网格对应的可视化局部视图的滑动操作,显示与目标网格相连的其他网格对应的可视化局部视图。
137.在本实施例中,可选的,本实施例装置还包括:更新模块;
138.更新模块,用于基于预设更新规则,更新图谱网格数据。
139.本发明实施例的知识图谱的处理装置,通过获取到的知识图谱中至少两个目标实体以及至少两个目标实体间的结构关系,对目标实体进行网格化,得到图谱网格数据,并基于图谱网格数据,显示知识图谱对应的可视化视图,其中,可视化视图包括:可视化缩略视图或可视化局部视图,可视化局部视图与可视化缩略视图相对应,从而,能够显示大规模数量的图谱数据,可视化程度较高,有效提升用户浏览性。
140.本发明实施例所提供的知识图谱的处理装置可执行本发明任意实施例所提供的知识图谱的处理方法,具备执行方法相应的功能模块和有益效果。
141.本公开还提供一种电子设备,包括:处理器,处理器用于执行存储于存储器的计算机程序,计算机程序被处理器执行时实现上述方法实施例的步骤。
142.图5为本公开提供的一种电子设备的结构示意图,图5示出了适于用来实现本发明实施例实施方式的示例性电子设备的框图。图5显示的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
143.如图5所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器16,系统存储器28,连接不同系统组件(包括系统存储器28和处理器16)的总线18。
144.总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)
总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
145.电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
146.系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(通常称为“硬盘驱动器”)。可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom、dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明实施例各实施例的功能。
147.具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明实施例所描述的实施例中的功能和/或方法。
148.处理器16通过运行存储在系统存储器28中的多个程序中的至少一个程序,从而执行各种功能应用以及信息处理,例如实现本发明实施例所提供的方法实施例。
149.本公开还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法实施例的步骤。
150.可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
151.计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
152.计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。
153.可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及
远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)域连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
154.本公开还提供一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行实现上述方法实施例的步骤。
155.需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
156.以上仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1