一种本体构建方法、装置及计算机可读介质

文档序号:37120030发布日期:2024-02-22 21:23阅读:18来源:国知局
一种本体构建方法、装置及计算机可读介质

本技术属于自然语言处理与人工智能,尤其涉及一种本体构建方法、装置及计算机可读介质。


背景技术:

1、本体是某一领域的概念的集合,是集成了多个高质量知识库的知识表达系统,可以展示概念、词汇、并延展关系与规则,通过其自有框架、核心概念及概念关系能够帮助调研人员快速理解该领域的知识获取,同时能够提升研究人员的信息检索查全率与查准率,从而提升检索效率,定位到准确的目标信息与文献。

2、已知技术中,构建本体的主流方法仍然是人工构建,如人工构建方法ontologydevelopment 101, 然而,人工构建方法对于人员的知识储备有较高要求,并需要人工耗费大量时间与精力进行领域调研、概念采集等流程,本体构建效率低、准确率低,无法快速高效地实现本体构建,除此之外,由于依赖人工操作,本体构建完成后也不容易进行动态调整。


技术实现思路

1、有鉴于此,本技术提供一种本体构建方法、装置及计算机可读介质,用于通过快速高效的自动化本体构建,克服人工本体构建方式存在的至少部分技术问题。

2、具体技术方案如下:

3、一种本体构建方法,包括:

4、从已知本体中确定与目标主题满足第一相关条件的第一本体和与所述目标主题满足第二相关条件的第二本体;所述目标主题为待构建的目标本体的主题,所述第一相关条件的相关性要求高于所述第二相关条件的相关性要求;

5、基于所述第一本体的本体框架和内容,确定所述目标本体的主框架和候选内容;

6、从已知知识图谱中确定与所述目标主题满足第三相关条件的目标知识图谱,基于所述目标知识图谱确定所述目标主题对应的特征空间范围;

7、从所述候选内容中选取符合所述特征空间范围的目标内容,得到由所述主框架和所述目标内容形成的主本体;

8、对所述主本体与所述第二本体进行本体融合处理,得到所述目标本体。

9、可选的,所述从已知本体中确定与目标主题满足第一相关条件的第一本体和与所述目标主题满足第二相关条件的第二本体,包括:

10、利用预先构建的主题预测模型对已知本体进行主题预测,得到已知本体的主题信息;

11、基于已知本体的主题信息,确定已知本体对应所述目标主题的概率;

12、从多个已知本体中确定对应所述目标主题的概率满足第一概率条件的已知本体,得到所述第一本体,并确定对应所述目标主题的概率满足第二概率条件的已知本体,得到所述第二本体;所述第一本体对应所述目标主题的概率高于所述第二本体对应所述目标主题的概率。

13、可选的,所述基于所述第一本体的本体框架和内容,确定所述目标本体的主框架和候选内容,包括:

14、将所述第一本体的本体框架和内容,分别作为所述目标本体的主框架和候选内容。

15、可选的,所述从已知知识图谱中确定与所述目标主题满足第三相关条件的目标知识图谱,包括:

16、从多个已知知识图谱中,确定对应的主题信息与所述目标主题的相似度满足第一相似度条件的知识图谱,得到所述目标知识图谱。

17、可选的,所述基于所述目标知识图谱确定所述目标主题对应的特征空间范围,包括:

18、从所述目标知识图谱包含的概念中,确定所对应主题信息与所述目标主题的相似度满足第二相似度条件的目标概念;

19、将所述目标概念及所述目标概念的直连概念进行向量化表示,得到所述目标概念及所述目标概念的直连概念分别对应的多维特征向量;所述直连概念为所述目标知识图谱中所述目标概念所处节点的直系子节点中的概念;

20、基于所述目标概念及所述目标概念的直连概念分别对应的多维特征向量中,每维向量的最小值和最大值,构建每维向量对应的子特征空间范围;所述目标主题的特征空间范围包括各维向量分别对应的子特征空间范围。

21、可选的,所述候选内容包括候选概念,所述从所述候选内容中选取符合所述特征空间范围的目标内容,包括:

22、将每个候选概念进行向量化表示,得到每个候选概念的多维特征向量;

23、从各个候选概念中选取所对应的多维特征向量中每维向量处于相应子特征空间范围的目标概念,得到所述目标内容。

24、可选的,在对所述主本体与所述第二本体进行本体融合处理,得到所述目标本体之后,还包括:

25、将所述目标本体中的概念在已有的概念术语集中进行映射,得到所述目标本体中的概念对应的同义术语;

26、基于所述同义术语,对所述目标本体中的概念进行术语扩展和/或概念语种扩展。

27、可选的,在基于所述同义术语,对所述目标本体中的概念进行术语扩展和/或概念语种扩展之后,还包括:

28、基于所述目标本体中概念的术语及同义术语分别在所属领域主题文本中对应的重要性统计信息,确定所述目标本体中的概念对应的满足优选条件的优选术语,并对所述概念的优选术语以外的剩余术语进行基于重要性统计信息的排序。

29、一种本体构建装置,包括:

30、第一确定模块,用于从已知本体中确定与目标主题满足第一相关条件的第一本体和与所述目标主题满足第二相关条件的第二本体;所述目标主题为待构建的目标本体的主题,所述第一相关条件的相关性要求高于所述第二相关条件的相关性要求;

31、第二确定模块,用于基于所述第一本体的本体框架和内容,确定所述目标本体的主框架和候选内容;

32、第三确定模块,用于从已知知识图谱中确定与所述目标主题满足第三相关条件的目标知识图谱,基于所述目标知识图谱确定所述目标主题对应的特征空间范围;

33、选取模块,用于从所述候选内容中选取符合所述特征空间范围的目标内容,得到由所述主框架和所述目标内容形成的主本体;

34、本体融合模块,用于对所述主本体与所述第二本体进行本体融合处理,得到所述目标本体。

35、一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时,能用于实现如上文任一项所述的本体构建方法。

36、根据以上方案可知,本技术公开了一种本体构建方法、装置及计算机可读介质,所公开的方法、装置和计算机可读介质,通过从已知本体中确定与待构建的目标本体的目标主题满足第一相关条件的第一本体,和与目标主题满足第二相关条件的第二本体,并基于第一本体的本体框架和内容,确定目标本体的主框架及候选内容,实现了自动为待构建的目标本体进行主题范围锁定/圈定,所锁定的主题范围即为所述主框架表征的主题范围。并通过从已知知识图谱中确定与目标主题满足第三相关条件的目标知识图谱,基于目标知识图谱确定目标主题对应的特征空间范围,以及从所述候选内容中确定符合该特征空间范围的目标内容,提出并实现了自动为待构建的目标本体进行概念等内容范围的确定,在主题范围和概念等内容范围的自动确定基础上,得到由所述主框架和所述目标内容形成的主本体,之后进一步通过对所述主本体与所述第二本体进行本体融合处理,得到所需的目标本体,实现了目标本体的自动构建。

37、除此之外,还可以通过概念术语的自动映射实现对目标本体中概念的术语扩充,以替代人工的术语枚举,并可对目标本体中的概念进行自动的优选术语选取及相关术语排序。

38、从而,基于本技术,可实现快速高效的自动化本体构建,克服了人工构建方式存在的难度高、效率低、准确率低、耗时长以及构建完成后不易进行动态调整等一系列缺陷,且快速高效的自动化本体构建,可以更好的协助调研人员快速理解所需领域的知识,并能够进一步提升研究人员的信息检索查全率与查准率,从而提升检索效率,便于定位到准确的目标信息与文献。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1