一种智慧图链和学科树图构建方法、系统及存储介质与流程

文档序号:35274032发布日期:2023-08-30 21:53阅读:59来源:国知局
一种智慧图链和学科树图构建方法、系统及存储介质与流程

本发明涉及人工智能,特别是涉及一种智慧图链和学科树图构建方法、系统及存储介质。


背景技术:

1、随着知识图谱技术的不断发展和完善,知识图谱技术也在各个领域开始应用,知识图谱是基于自然语言处理技术、深度学习技术、向量化方法、协同过滤算法等算法,来实现在垂直领域构建知识图谱、百科知识图谱等的技术。目前来说,知识图谱技术主要在语义搜索、知识问答等多个领域中产生了巨大的价值。

2、现有的知识图谱技术,大部分是通过对“结构化”数据进行提取后,生成三元组结构,例如在“知网”平台上,知识图谱是利用文献数据库的 “显式”信息(即保存在关系型数据库中的字段,如参考文献、作者、关键词等),将某个信息(如关键词)相关的三元组拼接组成知识图谱。但对非结构化数据中的“隐式”信息(如:文本上下文逻辑关系、结论和成果的评价等)挖掘力度有限。

3、现有知识图谱技术从非结构化数据中提取实体和关系时,在语义表示能力、语义关联、知识推理等方面都存在不足,导致在文献数据这种深度文本分析中产出效果有限。并且现有知识图谱三元组都是离散的信息,并没有自动化智能算法将三元组进行逻辑链接。虽然可以通过显式信息找到相关/类似的文献,但文献间的内容逻辑和信息关系都需要人工自行处理,当文献数量大时,这样的方式复杂又耗时,并且会出现由于人工处理所导致的数据遗漏和缺失现象。

4、现有的知识图谱技术产品都有较强的行业属性,例如医疗行业、工业制造业等,大多只能处理行业内信息三元组关联,无法形成自动化宏观整合的产品导致实用价值有限。


技术实现思路

1、本发明的目的是提供一种智慧图链和学科树图构建方法、系统及存储介质,针对多种数据来源,应用智慧图链、智慧树图算法,快速让具有逻辑关联性的三元组形成链条式的智慧图链、智慧树图以及交叉树图,可应用于各个应用场景中。

2、为实现上述目的,本发明提供了如下方案:

3、一种智慧图链和学科树图构建方法,该方法包括以下步骤:

4、获取原始数据,并对原始数据进行预处理;

5、对预处理后的数据进行知识表示、信息抽取、知识融合,构建知识图谱,并存入图数据库;

6、基于图数据库中的知识图谱,进行知识推理、知识分析和知识整合,识别和提取领域关键信息,剔除干扰信息,将三元组进行拼接,最终形成智慧图链和学科树图。

7、进一步地,所述原始数据包括结构化数据、半结构化数据、非结构化数据以及互联网数据。

8、进一步地,所述预处理包括数据清洗。

9、进一步地,所述对预处理后的数据进行知识表示、信息抽取、知识融合,构建知识图谱,并存入图数据库,包括:

10、对预处理后的数据,所述知识表示采用词向量融合算法、语义分析算法、文本结构分析算法,进行向量表示、符号表示,建立语义匹配模型;

11、所述信息抽取为基于实体判定算法进行实体抽取、属性抽取、关系抽取、规则抽取,得到抽取结果;

12、所述知识融合为通过实体对齐、实体消歧、本体对齐、共指解析对抽取结果进行知识融合,以获得知识图谱,并存入图数据库。

13、进一步地,所述基于图数据库中的知识图谱,进行知识推理、知识分析和知识整合,识别和提取领域关键信息,剔除干扰信息,将三元组进行拼接,最终形成智慧图链和学科树图,包括:

14、所述知识推理为基于中心/主题提取算法、图表文本提取算法进行补全推理、关系预测、模型检测以及预测推理,得到智慧图链;

15、所述知识分析为基于智慧图链,采用相关性趋势预测算法进行数据分析、图谱可视化以及模型解释,实现交叉学科判定;

16、所述知识整合是采用图谱最长链约束算法以及图链回环剔除聚合,将三元组进行拼接,对各个智慧图链进行关联和整合,形成学科树图。

17、进一步地,所述方法还包括:在学术概念产生交集时,生成一个交叉学科树图。

18、本发明还提供一种智慧图链和学科树图构建系统,所述系统包括:

19、数据获取模块,用于获取原始数据,并对原始数据进行预处理;

20、知识图谱构建模块,用于对预处理后的数据进行知识表示、信息抽取、知识融合,构建知识图谱,并存入图数据库;

21、学科树图形成模块,用于基于图数据库中的知识图谱,进行知识推理、知识分析和知识整合,识别和提取领域关键信息,剔除干扰信息,将三元组进行拼接,最终形成智慧图链和学科树图。

22、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一所述的智慧图链和学科树图构建方法。

23、根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的智慧图链和学科树图构建方法及系统,(1)应用智慧图链、智慧树图算法,快速让具有逻辑关联性的三元组形成链条式的智慧图链、智慧树图以及交叉树图;(2)在保留原有结构化信息提取的同时,更侧重提取非结构数据的“隐式”信息的相关技术,利用文本结构分析算法、语义分析算法、中心/主题提取算法、图表文本提取算法、语义预测算法等多种算法引擎,提升在非结构化数据的语义表示、语义相关性、知识推理等能力;(3)构建基于三元组超大数据集的图谱链整合系统,利用最长链约束算法、图链回合剔除算法等多种算法引擎,将结构化和非结构化数据中提取的三元组有效拼接为智慧图链;(4)构建基于智慧图链的树图整合系统,例如可以基于学科分类,将该学科智慧图链整合形成一个完整的学科智慧树图;(5)构建基于学科智慧树图的学科交叉树系统,根据不同学科智慧树图之间的数据交叉关系,产出交叉树图信息,为交叉学科研究提供指导路径;(6)智慧图链、智慧树图不再是只作用于一个行业领域,还可应用于各个应用场景中,如司法刑侦、投资金融、制造能源、营销决策等各个领域的应用场景。



技术特征:

1.一种智慧图链和学科树图构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的智慧图链和学科树图构建方法,其特征在于,所述原始数据包括结构化数据、半结构化数据、非结构化数据以及互联网数据。

3.根据权利要求1所述的智慧图链和学科树图构建方法,其特征在于,所述预处理包括数据清洗。

4.根据权利要求2所述的智慧图链和学科树图构建方法,其特征在于,所述对预处理后的数据进行知识表示、信息抽取、知识融合,构建知识图谱,并存入图数据库,包括:

5.根据权利要求2所述的智慧图链和学科树图构建方法,其特征在于,所述基于图数据库中的知识图谱,进行知识推理、知识分析和知识整合,识别和提取领域关键信息,剔除干扰信息,将三元组进行拼接,最终形成智慧图链和学科树图,包括:

6.根据权利要求5所述的智慧图链和学科树图构建方法,其特征在于,所述方法还包括:在学术概念产生交集时,生成一个交叉学科树图。

7.一种智慧图链和学科树图构建系统,其特征在于,所述系统包括:

8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的智慧图链和学科树图构建方法。


技术总结
本发明公开了一种智慧图链和学科树图构建方法、系统及存储介质,所述方法包括:获取原始数据,并对原始数据进行预处理;对预处理后的数据进行知识表示、信息抽取、知识融合,构建知识图谱,并存入图数据库;基于图数据库中的知识图谱,进行知识推理、知识分析和知识整合,识别和提取领域关键信息,剔除干扰信息,将三元组进行拼接,最终形成智慧图链和学科树图。本发明针对多种数据来源,应用智慧图链、智慧树图算法,快速让具有逻辑关联性的三元组形成链条式的智慧图链、学科树图以及交叉树图,可应用于各个应用场景中。

技术研发人员:杨烁,罗庆媛,米芸宏,王轲
受保护的技术使用者:成都诺朗科技有限公司
技术研发日:
技术公布日:2024/1/14
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1