基于知识图谱的监察数据分析系统的制作方法

文档序号:32978489发布日期:2023-01-17 21:41阅读:25来源:国知局
基于知识图谱的监察数据分析系统的制作方法

1.本发明涉及数据分析技术领域,尤其涉及监察数据分析系统。


背景技术:

2.监察运用的传统方法仍旧面临着如下问题:
3.1)调查数据种类庞杂且结构多样化;
4.2)处理大量涉及被调查人案件数据效率低下,需要耗费大量人力及时间对数据进行比对排查;
5.3)隐形线索难以发掘,只能基于案件本身已有线索驱动推进调查。
6.所以,迫切需要结合高级信息化技术来提升自身工作的科技水平,进而提高被调查人线索调查工作的科学性及有效性。
7.目前,知识图谱(knowledge graph)是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。将其应用于数据分析技术领域,很有价值。
8.因此,设计并实现基于知识图谱的监察数据分析系统,是本领域技术人员需要解决的问题。


技术实现要素:

9.本发明的目的在于提供基于知识图谱的监察数据分析系统,快速有效分析大量数据,降低线索查找难度。
10.实现上述目的的技术方案是:
11.基于知识图谱的监察数据分析系统,包括:知识建模单元、知识管理单元、知识计算单元、知识应用单元、知识存储单元和数据仓库单元,其中,
12.所述数据仓库单元存储用于构建知识图谱的有关监察的源数据;
13.所述知识建模单元获取源数据,进行领域划分,创建监督对象领域图谱,根据监督对象领域图谱创建监督对象人物画像;
14.所述知识管理单元接入被调查人信息数据或抽取对应源数据,进行三元组关系转换,形成计算机可理解的语义知识,并与监督对象人物画像进行映射关联,形成监察图谱,并由所述知识存储单元存储;
15.所述知识计算单元从所述知识存储单元获取监察图谱,进行归一化的融合处理,并将计算结果融合更新至所述知识存储单元存储的监察图谱中;
16.所述知识应用单元按照实体属性条件从所述知识存储单元中搜索符合条件的实
体数据,进行二次数据处理,获得图谱实体的关系图并展示。
17.优选的,所述的源数据包括结构化数据、半结构化数据、非结构化数据。
18.优选的,所述知识建模单元包括:图谱空间单元、模式构建单元和建模单元,
19.所述图谱空间单元从源数据中预存图谱数据进行领域划分,创建监督对象领域图谱;
20.所述模式构建单元按照“概念-实体-属性-关系-事件-规则-链接”模型,配合建模单元创建监督对象人物画像。
21.优选的,所述建模单元包括自定义模式单元、行业标准模式单元、半自动数据建模单元,
22.所述自定义模式单元根据需要自行创建监督对象人物画像节点、属性、节点关联关系;
23.所述行业标准模式单元根据监督对象人物画像相关标准自动生成节点、属性,自动构建监督对象人物画像;
24.所述半自动数据建模单元从所述数据仓库单元中选择对应的数据源进行节点属性自动映射,人工调整修改,构建监督对象人物画像。
25.优选的,所述知识管理单元包括:其他数据源单元、数据etl(数据仓库技术) 单元、知识获取单元、图谱数据构建单元,
26.所述其他数据源单元接入被调查人信息数据;
27.所述数据etl单元对被调查人信息数据进行数据抽取、清洗、转换处理为符合预设要求的数据,并存入所述数据仓库单元;
28.所述知识获取单元从所述数据etl单元获取处理后的数据,或者从所述数据仓库单元抽取相应主题的数据,进行三元组关系转换,形成计算机可理解的语义知识;
29.所述图谱数据构建单元将所述语义知识与监督对象人物画像进行映射关联,形成监察图谱,传入所述知识存储单元。
30.优选的,所述知识计算单元包括:知识筛选单元、自动融合单元、规则计算单元、神经网络推理单元、复杂图计算单元、在线标引单元、任务中心单元和知识融合单元,
31.所述知识筛选单元从所述知识存储单元获取监察图谱;
32.所述自动融合单元、规则计算单元、神经网络推理单元、复杂图计算单元和在线标引单元相互并列并自由组合编排方式,根据监察图谱向任务中心单元下发计算任务,
33.所述任务中心单元根据计算任务进行计算,得到计算结果,并通过所述知识融合单元融合更新至所述知识存储单元存储的监察图谱中。
34.优选的,所述自动融合单元对监察图谱中待融合实体进行实体属性的合并;
35.所述规则计算单元提供基于规则的推理可视化配置;
36.所述神经网络推理单元集成各神经网络模型进行推理预测;
37.所述复杂图计算单元提供多种图计算的算法;
38.所述在线标引单元连接所述数据仓库单元,为实体提供多模态数据的手工标引功能,将实体与文本、链接、文件数据进行关联。
39.优选的,所述知识应用单元包括:搜索实体单元、业务规则模型单元、关联关系发现单元、路径发现单元、轨迹发现单元、时序探索单元、图谱可视化单元,其中,
40.所述搜索实体单元从所述知识存储单元存储的监察图谱中按照实体属性条件进行搜索,获取符合条件的实体数据,结合所述业务规则模型单元中业务规则模型进行二次数据处理,得到处理结果;
41.所述关联关系发现单元将处理结果转换为关联关系的关系图,
42.所述路径发现单元将处理结果转换为路径的关系图;
43.所述轨迹发现单元将处理结果转换为轨迹的关系图;
44.所述时序探索单元将处理结果转换为时序探索的关系图;
45.所述图谱可视化单元展示各关系图。
46.优选的,所述知识应用单元包括图谱编辑单元;
47.所述图谱编辑单元将关系图中图谱实体关系推送至所述知识融合单元,进行数据人工标注。
48.优选的,还包括知识质量单元,
49.所述知识质量单元监测所述知识存储单元中监察图谱的数据以及所述任务中心单元中任务执行数量,提供监察图谱的统计信息以及执行任务的统计信息。
50.本发明的有益效果是:本发明通过多种渠道获取监察领域数据,并进行信息整合,构建监察知识图谱。在构建好的监察知识图谱的基础上运用算法从数据内在结构和逻辑关系的角度进行分析挖掘、隐形异常线索查找。从而能快速有效的处理大量数据,降低线索查找难度、提升办案效率。
附图说明
51.图1是本发明的基于知识图谱的监察数据分析系统的结构图。
52.图2是本发明的基于知识图谱的监察数据分析系统的具体结构图。
具体实施方式
53.下面将结合附图对本发明作进一步说明。
54.请参阅图1和图2,本发明的基于知识图谱的监察数据分析系统,包括:知识建模单元1、知识管理单元2、知识计算单元3、知识应用单元4、知识存储单元5、知识质量单元6和数据仓库单元7。其中,知识建模单元1、知识管理单元2为图谱构建,知识计算单元3、知识应用单元4为图谱应用。知识存储单元5为图谱数据提供存储服务,知识质量单元6为整个系统提供数据质量监控和任务运行状况监控。
55.数据仓库单元7存储用于构建知识图谱的有关监察的源数据,进行统一管理,源数据包括结构化数据、半结构化数据、非结构化数据。
56.知识建模单元1提供知识图谱的模式构建功能。知识建模单元1获取源数据,进行领域划分,创建监督对象领域图谱,根据监督对象领域图谱创建监督对象人物画像。具体地,知识建模单元1包括:图谱空间单元11、模式构建单元12和建模单元。图谱空间单元11从源数据中预存图谱数据进行领域划分,创建监督对象领域图谱,设置图谱空间的存储路径、大小、名称信息。
57.模式构建单元12按照“概念-实体-属性-关系-事件-规则-链接”模型,配合建模单元创建监督对象人物画像。建模单元包括自定义模式单元13、行业标准模式单元14、半自动
数据建模单元15。即:可以通过自定义模式、行业标准模式、半自动数据建模三种方式创建。
58.其中,自定义模式单元13根据需要自行创建监督对象人物画像节点、属性、节点关联关系,如工作、教育履历节点。行业标准模式单元14根据监督对象人物画像相关标准自动生成节点、属性,自动构建监督对象人物画像,如监督对象人员信息节点,包含姓名、出生日期、年龄等静态和动态属性信息。半自动数据建模单元15从数据仓库单元7中选择对应的数据源进行节点属性自动映射,人工调整修改,构建监督对象人物画像。
59.知识管理单元2接入被调查人信息数据或抽取对应源数据,进行三元组关系转换,形成计算机可理解的语义知识,并与监督对象人物画像进行映射关联,形成监察图谱,并由知识存储单元5存储。其中,被调查人信息数据包括:被调查人信息、组织机构数据、工作、教育、房产、车辆等数据。具体地,知识管理单元2 包括:其他数据源单元21、数据etl单元22、知识获取单元23、图谱数据构建单元25。
60.其他数据源单元21接入被调查人信息数据,对接入的数据源头进行维护,支持数据库、文件、接口方式接入数据,并维护接入数据源的配置信息。接入数据根据其数据质量好坏,可选择直接存入数据仓库单元7中,或者经过数据 etl单元22进行数据抽取、清洗、转换处理为符合预设要求的数据后再存入数据仓库单元7中。数据etl单元22支持对结构化数据、半结构化数据、非结构化数据提供对应数据处理方式。
61.知识获取单元23从数据etl单元22获取处理后的数据,或者从数据仓库单元 7抽取相应主题的数据,进行三元组关系转换,转化成图谱数据和链接数据,形成计算机可理解的语义知识;
62.图谱数据构建单元25将语义知识与监督对象人物画像进行映射关联,形成监察图谱,传入知识存储单元5。
63.往往来源不同的原始数据集对同一实体的描述往往不会完全一样,比如命名模糊、数据格式、数据错误等等。知识计算单元3基于已构建的知识图谱提供数据融合,对多个来源的实体数据进行合并的功能,能够降低知识冗余,提升知识质量。知识计算单元3从知识存储单元5获取监察图谱,进行归一化的融合处理,并将计算结果融合更新至知识存储单元5存储的监察图谱中。具体地,知识计算单元3包括:知识筛选单元31、自动融合单元32、规则计算单元33、神经网络推理单元34、复杂图计算单元35、在线标引单元36、任务中心单元37和知识融合单元38,
64.知识筛选单元31从知识存储单元5获取监察图谱;自动融合单元32、规则计算单元33、神经网络推理单元34、复杂图计算单元35和在线标引单元36相互并列并自由组合编排方式。
65.根据监察图谱,通过自动融合单元32、规则计算单元33、神经网络推理单元 34、复杂图计算单元35和在线标引单元36的自由组合编排方式,向任务中心单元 37下发计算任务,通过对这些实体进行归一化的融合处理,实现图谱数据相似度校验、关系挖掘。任务中心单元37根据计算任务进行计算,得到计算结果,并通过知识融合单元38融合更新至知识存储单元5存储的监察图谱中。
66.其中,自动融合单元32为图谱中的实体提供手工融合功能,支持生成融合候选集,对待融合实体进行冲突检测,支持基于置信度、实体来源、最近更新、统计数量的规则进行实体属性的合并。
67.规则计算单元33提供基于规则的推理可视化配置,通过配置推理起点、类型、推理路径与属性约束完成规则配置,并支持可视化推理验证。
68.神经网络推理单元34集成各神经网络模型进行推理预测;神经网络模型包括 transe等各个模型。神经网络推理单元34支持输入《s,p,o》(主语,谓语,宾语)三元组任意两项的值,推理出第三项的值。
69.复杂图计算单元35提供多种图计算的算法,包含louvain、pagerank、 trianglecount、closeness、betweenness等算法。
70.在线标引单元36连接数据仓库单元7,为实体提供多模态数据的手工标引功能,将实体与文本、链接、文件数据进行关联。
71.通过以上知识推理方法,在知识图谱中自动推导生成新的知识并加入到图谱中,从而丰富其中的知识。扩展图谱的表示能力与知识范围。
72.知识应用单元4为用户提供图谱的可视化探索、分析、隐藏关系挖掘。知识应用单元4按照实体属性条件从知识存储单元5中搜索符合条件的实体数据,进行二次数据处理,获得图谱实体的关系图并展示。具体地,知识应用单元4包括:搜索实体单元41、业务规则模型单元42、关联关系发现单元43、路径发现单元44、轨迹发现单元45、时序探索单元46、图谱可视化单元47、图谱编辑单元48。
73.其中,搜索实体单元41从知识存储单元5存储的监察图谱中按照实体属性条件进行搜索,获取符合条件的实体数据,结合业务规则模型单元42中业务规则模型进行二次数据处理,得到处理结果,最后转换为四种关系图。其中,关联关系发现单元43将处理结果转换为关联关系的关系图;路径发现单元44将处理结果转换为路径的关系图;轨迹发现单元45将处理结果转换为轨迹的关系图;时序探索单元46将处理结果转换为时序探索的关系图;图谱可视化单元47展示各关系图。二次数据处理指二次条件过滤,包含属性过滤,节点过滤,关系过滤。从而过滤掉不符合预设规定的数据。
74.图谱编辑单元48支持在线对图谱实体关系进行图谱编辑。图谱编辑单元48 将关系图中图谱实体关系推送至知识融合单元38,进行数据人工标注。
75.知识存储单元5采用图数数据库、elasticsearch、mysql等数据库,为图谱数据提供知识存储,为其他模块提供知识读取写入服务。
76.知识质量单元6通过监测图谱数据实体、属性、关系等数据以及任务执行数量,即:监测知识存储单元5中监察图谱的数据以及任务中心单元37中任务执行数量,提供知识图谱的统计信息和知识质量指标,执行任务状态等统计信息,其中知识质量指标包括图谱概念、实体、属性、关系的数量统计与分布、模式完整度、知识置信度等。
77.综上,本发明实现了监察领域数据整合、数据关联关系分析、数据挖掘。通过知识建模构建人物画像,全面直观的探索被调查人的深层次特征,利用对人物画像的标签提取、规则计算、神经网络推理、复杂图计算等多种方式进行不一致性比对、异常指标挖掘发现等;基于多种图计算的算法从被调查人的通话记录中提取核心节点,从而发现线索,进而达到降低线索查找难度、提升办案效率。
78.以上实施例仅供说明本发明之用,而非对本发明的限制,有关技术领域的技术人员,在不脱离本发明的精神和范围的情况下,还可以作出各种变换或变型,因此所有等同的技术方案也应该属于本发明的范畴,应由各权利要求所限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1