本技术涉及自然语言处理,更具体的说,是涉及一种病历诊断漏写检测方法、装置、设备及可读存储介质。
背景技术:
1、病历诊断填写是医疗领域中至关重要的环节,完整、准确的诊断有助于减少医疗纠纷风险,对后续诊疗行为分析,优化资源配置,提升医疗服务质量有重大意义,因此,病历诊断漏写检测显得尤为必要。
2、目前,病历诊断漏写检测一般采用人工检测的方式,即由医生或者医院的病历质检人员对病历进行检查,将病历中可能漏写的诊断进行标注,然而,病历实际的书写情况非常复杂,通过人工检测病历诊断的漏写情况工作量庞大,检测效率低下,且检测人员的专业素质对检测结果的准确性影响较大。为了解决人工进行病历诊断漏写检测造成的检测效率和检测准确性低下的问题,现有技术中还存在一些通过深度学习模型、规则库或知识库实现的病历诊断漏写检测技术,但是这些技术中都只是依据诊断语义相似度进行诊断漏写检测,而实际上语义不相似的两个诊断可能是同一诊断,这将导致病历诊断漏写检测结果准确度较低。
3、因此,如何提供一种病历诊断漏写检测方法,以提升病历诊断漏写检测结果准确度,成为本领域技术人员亟待解决的技术问题。
技术实现思路
1、鉴于上述问题,本技术提出了一种病历诊断漏写检测方法、装置、设备及可读存储介质。具体方案如下:
2、一种病历诊断漏写检测方法,所述方法包括:
3、确定待检测的病历文本;
4、确定所述病历文本对应的候选漏写诊断;
5、从所述候选漏写诊断中确定目标候选漏写诊断,所述目标候选漏写诊断为与所述病历文本中的已写诊断语义一致的候选漏写诊断,以及,被确定是所述已写诊断的症状的候选漏写诊断;
6、将所述候选漏写诊断中除所述目标候选漏写诊断之外的其他候选漏写诊断确定为漏写诊断。
7、可选地,所述确定所述病历文本对应的候选漏写诊断,包括:
8、生成所述病历文本对应的提示信息,所述提示信息用于指示确定所述病历文本对应的候选漏写诊断;
9、调用生成式模型,将所述病历文本对应的提示信息输入所述生成式模型;
10、基于所述生成式模型的回复,确定所述病历文本对应的候选漏写诊断。
11、可选地,所述生成所述病历文本对应的提示信息,包括:
12、对所述病历文本进行分割,得到多个病历文本片段;
13、针对每个病历文本片段,生成与所述病历文本片段对应的提示信息,所述提示信息用于指示确定所述病历文本片段对应的候选漏写诊断;各个病历文本片段对应的提示信息的组合为所述病历文本对应的提示信息。
14、可选地,所述生成式模型的是通过对已有的医疗领域生成式模型进行微调后得到的;所述对已有的医疗领域生成式模型进行微调的方式包括:
15、获取训练用病历文本、所述训练用病历文本对应的诊断以及所述训练用病历文本中各个诊断的标签,所述训练用病历文本中每个诊断的标签包括第一标签、第二标签和第三标签,所述第一标签用于指示所述诊断是否确诊、所述第二标签用于指示所述诊断的诊断类型、所述第三标签用于指示所述诊断的召回支撑片段;
16、基于所述训练用病历文本、所述训练用病历文本对应的诊断以及所述训练用病历文本中各个诊断的标签,生成多个训练语料,每个所述训练语料中包括输入文本以及预期输出文本;
17、将所述输入文本输入已有的医疗领域生成式模型,以所述已有的医疗领域生成式模型的输出趋近于所述输入文本对应的预期输出文本为目标,对所述已有的医疗领域生成式模型进行微调。
18、可选地,所述从所述候选漏写诊断中确定目标候选漏写诊断,包括:
19、基于所述候选漏写诊断与所述已写诊断,确定多个诊断对,每个诊断对中包括一个所述候选漏写诊断以及一个所述已写诊断;
20、针对每个诊断对,判断所述诊断对中两个诊断的语义是否一致;
21、如果所述诊断对中两个诊断的语义一致,则确定所述诊断对中的候选漏写诊断为目标候选漏写诊断;
22、如果所述诊断对中两个诊断的语义不一致,则将所述诊断对与预设的诊断症状对集合中各个诊断症状对进行对比;
23、如果所述诊断对与所述诊断症状对集合中某个诊断症状对一致,则确定所述候选漏写诊断为目标候选漏写诊断。
24、可选地,所述基于所述候选漏写诊断与所述已写诊断,确定多个诊断对,包括:
25、对所述候选漏写诊断进行规范化处理,得到规范化处理后的候选漏写诊断;
26、对所述已写诊断进行规范化处理,得到规范化处理后的已写诊断;
27、基于所述规范化处理后的候选漏写诊断与所述规范化处理后的已写诊断,确定所述多个诊断对。
28、可选地,所述基于所述候选漏写诊断与所述已写诊断,确定多个诊断对,包括:
29、对所述候选漏写诊断与所述已写诊断进行两两组合形成候选诊断对;每个所述候选诊断对中包括一个所述候选漏写诊断以及一个所述已写诊断;
30、对各个所述候选诊断对进行规范化处理,得到规范化处理后的候选诊断对;
31、对各个所述规范化处理后的候选诊断对进行去重处理,确定所述多个诊断对。
32、可选地,所述预设的诊断症状对集合的确定方式包括:
33、获取参考病历文本、所述参考病历文本对应的候选漏写诊断以及所述参考病历文本对应的已写诊断;
34、对所述参考病历文本对应的已写诊断进行两两组合得到第一诊断对集合,对所述参考病历文本对应的候选漏写诊断以及所述参考病历文本对应的已写诊断进行两两组合,并对所述参考病历文本对应的候选漏写诊断进行两两组合得到第二诊断对集合;
35、计算所述第一诊断对集合中,每个所述第一诊断对的共现概率;
36、基于所述第一诊断对集合中,各个所述第一诊断对的共现概率,从所述第一诊断对集合以及所述第二诊断对集合中确定所述诊断症状对集合。
37、一种病历诊断漏写检测装置,所述装置包括:
38、病历文本确定单元,用于确定待检测的病历文本;
39、候选漏写诊断确定单元,用于确定所述病历文本对应的候选漏写诊断;
40、目标候选漏写诊断确定单元,用于从所述候选漏写诊断中确定目标候选漏写诊断,所述目标候选漏写诊断为与所述病历文本中的已写诊断语义一致的候选漏写诊断,以及,被确定是所述已写诊断的症状的候选漏写诊断;
41、漏写诊断确定单元,用于将所述候选漏写诊断中除所述目标候选漏写诊断之外的其他候选漏写诊断确定为漏写诊断。
42、可选地,所述候选漏写诊断确定单元,包括:
43、提示信息生成子单元,用于生成所述病历文本对应的提示信息,所述提示信息用于指示确定所述病历文本对应的候选漏写诊断;
44、生成式模型调用子单元,用于调用生成式模型,将所述病历文本对应的提示信息输入所述生成式模型;
45、候选漏写诊断确定子单元,用于基于所述生成式模型的回复,确定所述病历文本对应的候选漏写诊断。
46、可选地,所述提示信息生成子单元,具体用于:
47、对所述病历文本进行分割,得到多个病历文本片段;
48、针对每个病历文本片段,生成与所述病历文本片段对应的提示信息,所述提示信息用于指示确定所述病历文本片段对应的候选漏写诊断;各个病历文本片段对应的提示信息的组合为所述病历文本对应的提示信息。
49、可选地,所述生成式模型的是通过对已有的医疗领域生成式模型进行微调后得到的;所述装置包括微调单元,所述微调单元具体用于:
50、获取训练用病历文本、所述训练用病历文本对应的诊断以及所述训练用病历文本中各个诊断的标签,所述训练用病历文本中每个诊断的标签包括第一标签、第二标签和第三标签,所述第一标签用于指示所述诊断是否确诊、所述第二标签用于指示所述诊断的诊断类型、所述第三标签用于指示所述诊断的召回支撑片段;
51、基于所述训练用病历文本、所述训练用病历文本对应的诊断以及所述训练用病历文本中各个诊断的标签,生成多个训练语料,每个所述训练语料中包括输入文本以及预期输出文本;
52、将所述输入文本输入已有的医疗领域生成式模型,以所述已有的医疗领域生成式模型的输出趋近于所述输入文本对应的预期输出文本为目标,对所述已有的医疗领域生成式模型进行微调。
53、可选地,所述目标候选漏写诊断确定单元,包括:
54、诊断对确定单元,用于基于所述候选漏写诊断与所述已写诊断,确定多个诊断对,每个诊断对中包括一个所述候选漏写诊断以及一个所述已写诊断;
55、判断单元,用于针对每个诊断对,判断所述诊断对中两个诊断的语义是否一致;
56、第一处理单元,用于如果所述诊断对中两个诊断的语义一致,则确定所述诊断对中的候选漏写诊断为目标候选漏写诊断;
57、对比单元,用于如果所述诊断对中两个诊断的语义不一致,则将所述诊断对与预设的诊断症状对集合中各个诊断症状对进行对比;
58、第二处理单元,用于如果所述诊断对与所述诊断症状对集合中某个诊断症状对一致,则确定所述候选漏写诊断为目标候选漏写诊断。
59、可选地,所述诊断对确定单元,具体用于:
60、对所述候选漏写诊断进行规范化处理,得到规范化处理后的候选漏写诊断;
61、对所述已写诊断进行规范化处理,得到规范化处理后的已写诊断;
62、基于所述规范化处理后的候选漏写诊断与所述规范化处理后的已写诊断,确定所述多个诊断对。
63、可选地,所述诊断对确定单元,具体用于:
64、对所述候选漏写诊断与所述已写诊断进行两两组合形成候选诊断对;每个所述候选诊断对中包括一个所述候选漏写诊断以及一个所述已写诊断;
65、对各个所述候选诊断对进行规范化处理,得到规范化处理后的候选诊断对;
66、对各个所述规范化处理后的候选诊断对进行去重处理,确定所述多个诊断对。
67、可选地,所述装置还包括诊断症状对集合确定单元,所述诊断症状对集合确定单元,具体用于:
68、获取参考病历文本、所述参考病历文本对应的候选漏写诊断以及所述参考病历文本对应的已写诊断;
69、对所述参考病历文本对应的已写诊断进行两两组合得到第一诊断对集合,对所述参考病历文本对应的候选漏写诊断以及所述参考病历文本对应的已写诊断进行两两组合,并对所述参考病历文本对应的候选漏写诊断进行两两组合得到第二诊断对集合;
70、计算所述第一诊断对集合中,每个所述第一诊断对的共现概率;
71、基于所述第一诊断对集合中,各个所述第一诊断对的共现概率,从所述第一诊断对集合以及所述第二诊断对集合中确定所述诊断症状对集合。
72、一种病历诊断漏写检测设备,包括存储器和处理器;
73、所述存储器,用于存储程序;
74、所述处理器,用于执行所述程序,实现如上所述的病历诊断漏写检测方法的各个步骤。
75、一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的病历诊断漏写检测方法的各个步骤。
76、借由上述技术方案,本技术公开了一种病历诊断漏写检测方法、装置、设备及可读存储介质。本方案中,在确定待检测的病历文本之后,先确定出病历文本对应的候选漏写诊断;然后从候选漏写诊断中确定目标候选漏写诊断,目标候选漏写诊断为与病历文本中的已写诊断语义一致的候选漏写诊断,以及,被确定是已写诊断的症状的候选漏写诊断;最后将候选漏写诊断中除目标候选漏写诊断之外的其他候选漏写诊断确定为漏写诊断,本方案是从诊断语义相似度以及诊断的症状判定两个方面进行病历诊断漏写检测的,当一个候选漏写诊断是一个已写诊断的症状时,即使二者语义一致,仍能够避免该候选漏写诊断被检测为漏写诊断,从而提升病历诊断漏写检测结果准确度。