知识图谱的构建方法、装置及存储介质与流程

文档序号:33706998发布日期:2023-03-31 22:02阅读:来源:国知局

技术特征:
1.一种知识图谱的构建方法,其特征在于,所述方法包括:从多元异构的数据源中抽取出多个三元组;对所述多个三元组中的属性和实体进行对齐处理,并将所述多个三元组中表征同一对象的实体所对应的属性进行聚合,得到处理后的多个三元组;基于处理后的多个三元组构建知识图谱。2.根据权利要求1所述的知识图谱的构建方法,其特征在于,从多元异构的数据源中抽取出三元组,包括:通过爬虫从多元异构的数据源中抽取出半结构化数据;将所述半结构化数据转换为json数据;将所述json数据解析为结构化数据并存入关系表;将关系表中的数据映射为三元组。3.根据权利要求2所述的知识图谱的构建方法,其特征在于,将关系表中的数据映射为三元组,包括:根据知识图谱模式层的约束关系,通过d2rq工具将关系表中的数据映射为三元组。4.根据权利要求1所述的知识图谱的构建方法,其特征在于,所述对所述多个三元组中的属性和实体进行对齐处理,包括:判断所述多个三元组中是否存在表征同一对象的属性,如果存在则将表征同一对象的属性对齐处理;判断所述多个三元组中是否存在表征同一对象的实体,如果存在则将表征同一对象的实体对齐处理。5.根据权利要求1所述的知识图谱的构建方法,其特征在于,所述方法还包括:通过图数据库存储所述知识图谱。6.根据权利要求5所述的知识图谱的构建方法,其特征在于,所述图数据库为neo4j数据库。7.一种知识图谱的构建装置,其特征在于,所述知识图谱的构建装置包括:抽取单元,用于从多元异构的数据源中抽取出多个三元组;处理单元,用于对所述多个三元组中的属性和实体进行对齐处理,并将所述多个三元组中表征同一对象的实体所对应的属性进行聚合,得到处理后的多个三元组;构建单元,用于基于处理后的多个三元组构建知识图谱。8.根据权利要求7所述的知识图谱的构建装置,其特征在于,处理单元在用于从多元异构的数据源中抽取出三元组时,具体用于:通过爬虫从多元异构的数据源中抽取出半结构化数据;将所述半结构化数据转换为json数据;将所述json数据解析为结构化数据并存入关系表;将关系表中的数据映射为三元组。9.一种知识图谱的构建装置,其特征在于,包括依次通信相连的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如权利要求1~6任意一项所述的知识图谱的构建方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,
当所述指令在计算机上运行时,执行如权利要求1~6任意一项所述的知识图谱的构建方法。

技术总结
本发明公开了一种知识图谱的构建方法、装置及存储介质,涉及知识图谱技术领域。该知识图谱的构建方法包括:从多元异构的数据源中抽取出多个三元组;对多个三元组中的属性和实体进行对齐处理,并将多个三元组中表征同一对象的实体所对应的属性进行聚合,得到处理后的多个三元组;基于处理后的多个三元组构建知识图谱。本发明公开的知识图谱的构建方法、装置及存储介质可避免出现由于同一对象的不同描述而导致所构建的知识图谱的可靠性降的问题,使得通过所构建的知识图谱进行查询时能够准确查找出相应的数据。查找出相应的数据。查找出相应的数据。


技术研发人员:刘广睿
受保护的技术使用者:北京政务科技有限公司
技术研发日:2022.12.21
技术公布日:2023/3/30
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1