医学知识图谱构建方法、应用方法、装置、设备及介质

文档序号:41229202发布日期:2025-03-14 11:57阅读:19来源:国知局
医学知识图谱构建方法、应用方法、装置、设备及介质

本发明涉及医学数据处理,具体而言,涉及一种医学知识图谱构建方法、应用方法、装置、设备及介质。


背景技术:

1、医学知识图谱是一种结构化的医学知识表示形式,它将医学领域的信息以图的形式组织起来,其中节点代表医学实体,例如,疾病、药物、症状等,边代表实体之间的关系,例如,因果关系、治疗关系等。这种图结构使得医学知识之间的关联和推理变得更加直观和高效。

2、现有技术中,医学知识图谱一般先采用有监督的知识提取方法提取医学实体,再进行构建,但是,由于有监督的知识提取方法过于依赖语料库中的标签,对于语料库中标签不完整的实体,有监督的知识提取方法的提取效果则较差,导致构建的医学知识图谱的精度较低。


技术实现思路

1、本发明解决的问题是如何提高医学知识图谱的精度。

2、为解决上述问题,本发明提供一种医学知识图谱构建方法、应用方法、装置、设备及介质。

3、第一方面,本发明提供了一种医学知识图谱构建方法,包括:

4、确定医学文本的实体情况,其中,所述实体情况包括标注充足实体情况、标注稀缺实体情况、规律性实体情况以及复杂性实体情况;

5、将所述医学文本输入至协同集成框架中进行知识挖掘,生成对应的知识挖掘结果,其中,所述协同集成框架包括与所述实体情况对应的有监督挖掘模块、远程监督挖掘模块、规则挖掘模块以及复杂挖掘模块;

6、采用大语言模型整合所有的所述知识挖掘结果,生成实体关系数据,并基于所述实体关系数据,构建初步医学知识图谱;

7、将所述初步医学知识图谱输入至质量控制框架中进行校验,并根据校验结果,生成最终医学知识图谱。

8、可选地,所述质量控制框架包括公理逻辑挖掘模块、公理逻辑校验模块以及迭代补全模块;

9、所述公理逻辑挖掘模块用于挖掘所述初步医学知识图谱中的公理逻辑;

10、所述公理逻辑校验模块用于根据所述公理逻辑对所述初步医学知识图谱进行校验,生成所述校验结果;

11、所述迭代补全模块用于当所述校验结果为错误时,根据所述校验结果,生成修改数据,并根据所述修改数据修改所述初步医学知识图谱,构建中间医学知识图谱,并将所述中间医学知识图谱传输至所述公理逻辑挖掘模块,进行迭代校验,直至所述校验结果为正确时,生成所述最终医学知识图谱,其中,所述最终医学知识图谱为最后一次迭代获取的所述中间医学知识图谱。

12、可选地,所述公理逻辑挖掘模块包括至少一个表示学习单元以及与其对应的公理挖掘单元和筛选单元,每个所述表示学习单元包括不同的表示学习方法;

13、所述表示学习单元用于提取所述初步医学知识图谱中的实体与关系向量;

14、所述公理挖掘单元用于基于公理规则,确定所述实体与关系向量的初步公理逻辑和对应的置信度;

15、所述筛选单元用于根据所述置信度,在所述初步公理逻辑中筛选出所述公理逻辑。

16、可选地,所述知识挖掘结果包括实体识别结果和关系抽取结果,所述将所述医学文本输入至协同集成框架中进行知识挖掘,生成对应的知识挖掘结果,包括:

17、将所述医学文本输入至所述协同集成框架中进行实体识别,生成对应的实体识别结果;

18、将所述医学文本和所述实体识别结果输入至所述协同集成框架中进行关系抽取,生成对应的关系抽取结果。

19、本发明的医学知识图谱构建方法的有益效果是:

20、确定医学文本的实体情况,可便于后续对医学文本中不同实体类型的文本分别进行处理,通过将医学文本中输入至协同集成框架中进行知识挖掘,并针对性地应用与不同实体情况对应的有监督挖掘模块、远程监督挖掘模块、规则挖掘模块以及复杂挖掘模块,可以有效地解决每个实体类型文本中存在的问题,从而提取出医学文本中的实体及其关系,即知识挖掘结果,进而提高知识挖掘的全面性和精度,再采用大语言模型整合不同挖掘模块的知识挖掘结果,确保各个知识挖掘结果的精准性,得到整体连贯的实体关系数据,以完成对医学文本的知识挖掘,从而构建精准的初步医学知识图谱,最后对初步医学知识图谱进行校验,并根据校验结果,生成最终医学知识图谱,以进一步保证医学知识图谱的质量,提高医学知识图谱的精度。

21、第二方面,本发明提供了一种医学知识图谱应用方法,应用如第一方面所述的医学知识图谱构建方法构建的最终医学知识图谱,所述医学知识图谱应用方法,包括:

22、基于最终医学知识图谱,提取与已获取的用户问题关联的知识片段集,其中,所述知识片段集包括至少一个知识片段;

23、采用大语言模型筛选所述知识片段集中的知识片段,生成关键知识片段;

24、采用提示学习技术,将所述关键知识片段与所述用户问题输入到所述大语言模型中,生成结果。

25、可选地,所述用户问题包括问题题干和问题选项,所述基于最终医学知识图谱,提取与所述用户问题关联的知识片段集,包括:

26、采用实体识别技术,分别提取所述问题题干的问题实体和所述问题选项的选项实体,其中,所述问题实体和所述选项实体的数量均为至少一个;

27、组合每个所述问题实体和每个所述选项实体,构建对应的候选实体对;

28、在所述最终医学知识图谱中检索所述候选实体对的n跳内路径,根据所述n跳内路径,生成所述知识片段集。

29、可选地,所述采用提示学习技术,将所述关键知识片段与所述用户问题输入到所述大语言模型中,生成结果,包括:

30、采用线性语言化方法,提取所述所述关键知识片段的头实体、关系和尾实体;

31、顺次拼接所述头实体、所述关系和所述尾实体,生成关键知识文本;

32、采用所述提示学习技术,将所述关键知识文本与所述用户问题输入到所述大语言模型中,生成所述结果。

33、本发明的医学知识图谱应用方法的有益效果是:

34、基于最终医学知识图谱,提取与已获取的用户问题关联的知识片段集,可使提取出的知识片段与用户的搜索问题高度相关,以提高后续结果的准确性。再采用大语言模型筛选知识片段集中的知识片段,得到关键知识片段,可排除不准确或关联性较低的知识片段,去除噪音,保证了关键知识片段的质量。最后采用提示学习技术,将关键知识片段作为提示,与用户问题一同输入到大语言模型中,可引导大语言模型充分利用最终知识图谱中的知识,使模型能够更好地理解问题,生成更准确的结果。

35、第三方面,本发明提供了一种医学知识图谱构建装置,实现如第一方面所述的医学知识图谱构建方法构建的最终医学知识图谱,所述医学知识图谱构建装置包括:

36、划分模块,用于确定医学文本的实体情况,其中,所述实体情况包括标注充足实体情况、标注稀缺实体情况、规律性实体情况以及复杂性实体情况;

37、挖掘模块,用于将所述医学文本输入至协同集成框架中进行知识挖掘,生成对应的知识挖掘结果,其中,所述协同集成框架包括与所述实体情况对应的有监督挖掘模块、远程监督挖掘模块、规则挖掘模块以及复杂挖掘模块;

38、构建模块,用于采用大语言模型整合所有的所述知识挖掘结果,生成实体关系数据,并基于所述实体关系数据,构建初步医学知识图谱;

39、校验模块,用于将所述初步医学知识图谱输入至质量控制框架中进行校验,并根据校验结果,生成最终医学知识图谱。

40、第四方面,本发明提供了一种电子设备,包括存储器和处理器;

41、所述存储器,用于存储计算机程序;

42、所述处理器,用于当执行所述计算机程序时,实现如第一方面所述的医学知识图谱构建方法或者如第二方面所述的医学知识图谱应用方法。

43、第五方面,本发明提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如第一方面所述的医学知识图谱构建方法或者如第二方面所述的医学知识图谱应用方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1