本技术涉及数据处理,尤其涉及一种本体融合的方法、装置、电子设备及存储介质。
背景技术:
1、本体是某一领域的概念的集合,是集成了多个高质量知识库的知识表达系统,可以展示概念、词汇、并延展关系与规则,很大程度上明确了某一领域的范围,提升信息检索效率。在许多专业领域,本体能够提升研究人员的信息检索查全率与查准率,从而提升检索效率,定位到准确的目标信息与文献。
2、但一个综合的专业领域往往包含多个细分领域的本体,本体与本体之间通常都存在相互重叠,共同覆盖的部分。而现有技术中没有有效的手段去处理本体数据重叠的问题,当用户通过相互重叠的本体进行检索时,不仅会生成大量重复内容,同时也会导致用户浪费更多时间进行重复检索。因此本体融合在任何专业领域中都是必要的,但当下的本体融合结束后,无法最大限度地融合已有本体,会遗漏大量重要信息,如概念及属性。
技术实现思路
1、有鉴于此,本技术提供了一种本体融合的方法、装置、电子设备及存储介质,以解决现有技术中互有覆盖的不同本体之间融合过程中无法最大限度融合已有本体,遗漏大量重要信息的问题。
2、为实现上述目的,本技术提供如下技术方案:
3、本技术第一方面公开了一种本体融合的方法,包括:
4、获取主本体和待融合本体的本体信息,其中,所述本体信息包括本体中各个节点的语义类型、概念、关系、其他属性;
5、针对所述待融合本体的每一个节点,基于所述语义类型与所述主本体的中的各个节点进行语义类型匹配;
6、针对所述待融合本体中语义类型匹配成功的每一个节点,基于所述概念,与所述主本体中的各个节点进行概念匹配;若概念匹配成功,则进行节点概念融合;若概念匹配不成功,则进行节点语义类型融合;
7、针对所述待融合本体中未进行概念融合的每一个节点,基于所述概念,与所述主本体每一个节点进行概念匹配,若概念匹配成功,则进行节点概念融合;
8、针对已进行概念融合的节点,确定所述节点是否存在待融合的关系,若确定出所述节点存在待融合的关系,则对所述节点进行关系融合;
9、针对已进行概念融合的节点,确定所述节点是否存在待融合的其他属性,若确定出所述节点存在待融合的其他属性,则对所述节点进行其他属性融合。
10、可选的,上述的方法,所述针对所述待融合本体的每一个节点,基于所述语义类型与所述主本体的中的各个节点进行语义类型匹配,包括:
11、分别获取待进行语义类型匹配的两个节点的语义类型字符串;
12、将所述待进行语义类型匹配的两个节点的语义类型字符串进行对比;
13、若所述待进行语义类型匹配的两个节点的语义类型字符串一致,则语义类型匹配成功;若所述两个节点的语义类型字符串不一致,则语义类型匹配不成功。
14、可选的,上述的方法,所述针对所述待融合本体中语义类型匹配成功的每一个节点,基于所述概念,与所述主本体中的各个节点进行概念匹配,包括:
15、对待进行概念匹配的两个节点进行字符串匹配,得到字符串匹配结果;
16、对所述待进行概念匹配的两个节点进行相似度计算,得到概念相似度;
17、若所述字符串匹配结果为字符串匹配成功或者所述概念相似度大于预设的第一阈值,则判定所述待进行概念匹配的两个节点概念匹配成功;若所述字符串匹配结果为字符串匹配不成功且所述概念相似度不大于所述第一阈值,则判定所述待进行概念匹配的两个节点概念匹配不成功。
18、可选的,上述的方法,所述针对已进行概念融合的节点,确定所述节点是否存在待融合的关系,包括:
19、获取已进行概念融合的节点对应的关系;
20、查询预设的关系词表,若获取到的关系记录在所述关系词表中,则确定所述获取到的关系为待融合的关系;
21、若所述获取到的关系不在所述关系词表中,则计算得到所述获取到的关系的关系相似度;
22、若所述关系相似度大于预设的第二阈值,则所述获取到的关系为待融合的关系;
23、若所述关系相似度不大于所述第二阈值,则所述获取到的关系不是待融合的关系。
24、本技术第二方面公开了一种本体融合的装置,包括:
25、获取单元,用于获取主本体和待融合本体的本体信息,其中,所述本体信息包括本体中各个节点的语义类型、概念、关系、其他属性;
26、语义类型匹配单元,用于针对所述待融合本体的每一个节点,基于所述语义类型与所述主本体的中的各个节点进行语义类型匹配;
27、第一概念匹配单元,用于针对所述待融合本体中语义类型匹配成功的每一个节点,基于所述概念,与所述主本体中的各个节点进行概念匹配;若概念匹配成功,则进行节点概念融合;若概念匹配不成功,则进行节点语义类型融合;
28、第二概念匹配单元,用于针对所述待融合本体中未进行概念融合的每一个节点,基于所述概念,与所述主本体每一个节点进行概念匹配,若概念匹配成功,则进行节点概念融合;
29、关系融合单元,用于针对已进行概念融合的节点,确定所述节点是否存在待融合的关系,若确定出所述节点存在待融合的关系,则对所述节点进行关系融合;
30、属性融合单元,用于针对已进行概念融合的节点,确定所述节点是否存在待融合的其他属性,若确定出所述节点存在待融合的其他属性,则对所述节点进行其他属性融合。
31、可选的,上述的装置,所述语义类型匹配单元,包括:
32、第一获取子单元,用于分别获取待进行语义类型匹配的两个节点的语义类型字符串;
33、对比子单元,用于将所述待进行语义类型匹配的两个节点的语义类型字符串进行对比;
34、第一确定子单元,用于若所述待进行语义类型匹配的两个节点的语义类型字符串一致,则语义类型匹配成功;若所述两个节点的语义类型字符串不一致,则语义类型匹配不成功。
35、可选的,上述的装置,所述第一概念匹配单元,包括:
36、匹配子单元,用于对待进行概念匹配的两个节点进行字符串匹配,得到字符串匹配结果;
37、计算子单元,用于对所述待进行概念匹配的两个节点进行相似度计算,得到概念相似度;
38、第二确定子单元,用于若所述字符串匹配结果为字符串匹配成功或者所述概念相似度大于预设的第一阈值,则判定所述待进行概念匹配的两个节点概念匹配成功;若所述字符串匹配结果为字符串匹配不成功且所述概念相似度不大于所述第一阈值,则判定所述待进行概念匹配的两个节点概念匹配不成功。
39、可选的,上述的装置,所述关系融合单元,包括:
40、第二获取子单元,用于获取已进行概念融合的节点对应的关系;
41、查询子单元,用于查询预设的关系词表,若获取到的关系记录在所述关系词表中,则确定所述获取到的关系为待融合的关系;
42、第二计算子单元,用于若所述获取到的关系不在所述关系词表中,则计算得到所述获取到的关系的关系相似度;
43、第三确定子单元,用于若所述关系相似度大于预设的第二阈值,则所述获取到的关系为待融合的关系;
44、第四确定子单元,用于若所述关系相似度不大于所述第二阈值,则所述获取到的关系不是待融合的关系。
45、本技术第三方面公开了一种电子设备,包括:
46、一个或多个处理器;
47、存储装置,其上存储有一个或多个程序;
48、当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如本技术第一方面中任意一项所述的方法。
49、本技术第四方面公开了一种计算机存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如本技术第一方面中任意一项所述的方法。
50、从上述技术方案可以看出,本技术提供的一种本体融合的方法中,首先获取主本体和待融合本体的本体信息,其中,本体信息包括本体中各个节点的语义类型、概念、关系、其他属性。然后针对待融合本体的每一个节点,基于语义类型与主本体的中的各个节点进行语义类型匹配。接着针对待融合本体中语义类型匹配成功的每一个节点,基于概念,与主本体中的各个节点进行概念匹配;若概念匹配成功,则进行节点概念融合;若概念匹配不成功,则进行节点语义类型融合。针对待融合本体中未进行概念融合的每一个节点,基于概念,与主本体每一个节点进行概念匹配,若概念匹配成功,则进行节点概念融合。针对已进行概念融合的节点,确定节点是否存在待融合的关系,若确定出节点存在待融合的关系,则对节点进行关系融合。最后针对已进行概念融合的节点,确定节点是否存在待融合的其他属性,若确定出节点存在待融合的其他属性,则对节点进行其他属性融合。由此可知,利用本技术的方法,通过语义类型匹配、语义类型融合、概念匹配、概念融合、关系融合、其他属性融合等手段将不同本体进行全方位的数据融合,将重复数据进行融合,最大限度进行了匹配及融合操作,得到一个更综合的本体。解决了现有技术中互有覆盖的不同本体在融合的时候无法最大限度保留已有信息,遗落大量有价值的概念,属性等信息的问题。