鉴别诊断生成方法、装置、电子设备及存储介质与流程

文档序号：37942448发布日期：2024-05-11 00:22阅读：15来源：国知局

本发明涉及医疗辅助，特别是涉及一种鉴别诊断生成方法、装置、电子设备及存储介质。

背景技术：

1、在临床医学上，疾病类型是千变万化的，症状表现也是错综复杂的，只有对病情进行综合分析和比较，才能对不同病症出现的相同症状加以鉴别，以探求疾病的本质，确定疾病的诊断结果。因此，鉴别诊断对于正确诊断疾病、制定合理的治疗方案以及预测疾病的预后具有重要意义。

2、目前，针对疾病鉴别自动生成的方法主要基于深度学习的seq2seq实现，seq2seq是编码器-解码器架构，通常编码器采用bilstm，解码器采用lstm，二者均可以使用多层架构，通过构建文本上下文-鉴别诊断对的训练集，训练seq2seq的模型完成鉴别诊断的自动生成。一方面，该方法只能通过文本生成的方式得到鉴别诊断会使得生成的质量难以有效控制。实际上，临床病历文书书写过程中会积累大量的诊断-鉴别诊断库，现有的方法没有很好地利用这些静态知识库，且难以兼顾相似的病历通常具有相似的鉴别诊断这一情况，导致鉴别诊断的生成方式较为单一。另一方面，该方法由于编码器和解码器的模型容量较小，模型对训练数据的理解能力不到位，导致在文本生成的时候，较容易出现生成的文本不连贯、语义重复，进而出现逻辑性错误以及关键信息丢失，导致鉴别诊断的生成效果不符合预期。此外，该方法给定对话流程，在预测时，输入端要经过编码器的编码以及解码器的解码，由于是逐字的生成方式，导致实际应用时的推理效率较低，降低了实用性。

3、综上所述，现有的疾病鉴别自动生成方法鉴别诊断的生成方式较为单一，易导致鉴别诊断的生成效果不符合预期，且鉴别诊断的生成效率较低。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种能够保证鉴别诊断生成的多样性以及鉴别诊断的生成效果，且生成效率较高的鉴别诊断生成方法、装置、电子设备及存储介质。

2、本发明提供了一种鉴别诊断生成方法，所述方法包括：

3、获取历史病程记录信息中的首次病程记录信息，并对所述首次病程记录信息进行预处理，以构建基于所述首次病程记录信息的第一鉴别诊断知识库；

4、基于所述第一鉴别诊断知识库，对当前病程记录信息进行相似度匹配计算，以获取所述第一鉴别诊断知识库中与所述当前病程记录信息之间的相似度超过第一阈值的第一鉴别诊断结果；

5、调用bert模型将所述第一鉴别诊断结果标准化至标准诊断中，以构建第二鉴别诊断知识库，并调用所述bert模型将所述第二鉴别诊断知识库中第二鉴别诊断结果映射至所述标准诊断中；

6、以所述历史病程记录信息作为chatglm-6b大模型的输入，以所述第一鉴别诊断结果和第二鉴别诊断结果作为chatglm-6b大模型的输出，对所述chatglm-6b大模型进行预训练，并通过医疗知识图谱构建训练数据集对预训练后的所述chatglm-6b大模型进行微调，得到医疗大模型；

7、将所述当前病程记录信息作为所述医疗大模型输入，以获取所述医疗大模型的模型输出数据，基于所述模型输出数据构建提示对话框，以根据所述提示对话框中的prompt模板生成第三鉴别诊断结果。

8、在其中一个实施例中，所述获取历史病程记录信息中的首次病程记录信息，并对所述首次病程记录信息进行预处理，以构建基于所述首次病程记录信息的第一鉴别诊断知识库，包括：

9、基于对所述首次病程记录信息进行预处理，将所述首次病程记录信息中的全部字符转化为半角字符；

10、去除所述首次病程记录信息中的无用字符，并将所述首次病程记录信息中的字母信息全部转为符合所述第一鉴别诊断知识库格式要求的字母信息。

11、在其中一个实施例中，所述基于所述第一鉴别诊断知识库，对当前病程记录信息进行相似度匹配计算，以获取所述第一鉴别诊断知识库中与所述当前病程记录信息之间的相似度超过第一阈值的第一鉴别诊断结果，之前包括：

12、调用tf-idf算法计算所述第一鉴别诊断知识库中的每条鉴别诊断数据与所述当前病程记录信息之间的tf-idf值，其中，所述第一鉴别诊断知识库中的每条鉴别诊断数据中包括多个鉴别诊断结果；

13、按照所述tf-idf值对所述每条鉴别诊断数据中的多个鉴别诊断结果进行排序，以获取多个排名不低于第二阈值的鉴别诊断结果；

14、将所述tf-idf值赋予每个所述排名不低于第二阈值的鉴别诊断结果，并将所述多个排名不低于第二阈值的鉴别诊断结果合并为多个鉴别诊断词，得到候选鉴别诊断结果。

15、在其中一个实施例中，所述基于所述第一鉴别诊断知识库，对当前病程记录信息进行相似度匹配计算，以获取所述第一鉴别诊断知识库中与所述当前病程记录信息之间的相似度超过第一阈值的第一鉴别诊断结果，包括：

16、分别对所述当前病程记录信息和第一鉴别诊断知识库中的鉴别诊断数据进行向量化处理，得到第一高维向量化表征和第二高维向量化表征；

17、分别计算所述第一高维向量化表征和第二高维向量化表征对应的第一余弦相似度值和第二余弦相似度值，以表征所述当前病程记录信息和第一鉴别诊断知识库中的鉴别诊断数据之间的相似度。

18、在其中一个实施例中，所述基于所述第一鉴别诊断知识库，对当前病程记录信息进行相似度匹配计算，以获取所述第一鉴别诊断知识库中与所述当前病程记录信息之间的相似度超过第一阈值的第一鉴别诊断结果，还包括：

19、按照所述当前病程记录信息和第一鉴别诊断知识库中的鉴别诊断数据之间的相似度对所述第一鉴别诊断知识库中的鉴别诊断数据进行排序，以获取多个相似度排序不低于第一阈值的鉴别诊断数据；

20、将所述多个相似度排序不低于第一阈值的鉴别诊断数据进行加权计算，得到所述第一鉴别诊断结果，所述第一鉴别诊断结果为所述多个相似度排序不低于第一阈值的鉴别诊断数据对应的鉴别诊断词。

21、在其中一个实施例中，所述以所述历史病程记录信息作为chatglm-6b大模型的输入，以所述第一鉴别诊断结果和第二鉴别诊断结果作为chatglm-6b大模型的输出，对所述chatglm-6b大模型进行预训练，并通过医疗知识图谱构建训练数据集对预训练后的所述chatglm-6b大模型进行微调，得到医疗大模型，包括：

22、获取医疗文本数据，并通过自回归的方式对所述chatglm-6b大模型进行预训练，所述医疗文本数据至少包括所述历史病程记录信息以及临床指南文本；

23、基于所述历史病程记录信息以及临床指南文本构建所述医疗知识图谱，并根据所述医疗知识图谱构建指令数据集，所述指令数据集用于生成所述训练数据集对预训练后的所述chatglm-6b大模型进行微调。

24、在其中一个实施例中，所述方法还包括：

25、基于多个所述第一鉴别诊断结果和第二鉴别诊断结果，构建鉴别诊断候选集，并对所述鉴别诊断候选集中的鉴别诊断数据进行排名，以获取排名不低于第三阈值的鉴别诊断数据；

26、调用所述医疗大模型对所述排名不低于第三阈值的鉴别诊断数据进行处理，以输出所述医疗大模型对所述排名不低于第三阈值的鉴别诊断数据的打分结果，得到所述打分结果不低于第四阈值的鉴别诊断数据。

27、本发明还提供了一种鉴别诊断生成装置，所述装置包括：

28、诊断知识库构建模块，用于获取历史病程记录信息中的首次病程记录信息，并对所述首次病程记录信息进行预处理，以构建基于所述首次病程记录信息的第一鉴别诊断知识库；

29、相似度计算模块，用于基于所述第一鉴别诊断知识库，对当前病程记录信息进行相似度匹配计算，以获取所述第一鉴别诊断知识库中与所述当前病程记录信息之间的相似度超过第一阈值的第一鉴别诊断结果；

30、诊断标准化模块，用于调用bert模型将所述第一鉴别诊断结果标准化至标准诊断中，以构建第二鉴别诊断知识库，并调用所述bert模型将所述第二鉴别诊断知识库中第二鉴别诊断结果映射至所述标准诊断中；

31、大模型微调模块，用于以所述历史病程记录信息作为chatglm-6b大模型的输入，以所述第一鉴别诊断结果和第二鉴别诊断结果作为chatglm-6b大模型的输出，对所述chatglm-6b大模型进行预训练，并通过医疗知识图谱构建训练数据集对预训练后的所述chatglm-6b大模型进行微调，得到医疗大模型；

32、鉴别诊断生成模块，用于将所述当前病程记录信息作为所述医疗大模型输入，以获取所述医疗大模型的模型输出数据，基于所述模型输出数据构建提示对话框，以根据所述提示对话框中的prompt模板生成第三鉴别诊断结果。

33、本发明还提供了一种电子设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如上述任一种所述的鉴别诊断生成方法。

34、本发明还提供了一种计算机存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述的鉴别诊断生成方法。

35、本发明还提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述的鉴别诊断生成方法。

36、上述鉴别诊断生成方法、装置、电子设备及存储介质，通过获取历史病程记录信息中的首次病程记录信息，并对首次病程记录信息进行预处理，以构建基于首次病程记录信息的首次病程记录信息-鉴别诊断知识库。其次，基于首次病程记录信息-鉴别诊断知识库，对当前病程记录信息进行相似度匹配计算，以获取首次病程记录信息-鉴别诊断知识库中与当前病程记录信息之间的相似度超过设定阈值的鉴别诊断结果。随后，调用bert模型将得到的鉴别诊断结果标准化至标准诊断中，以构建诊断-鉴别诊断知识库，并调用bert模型将诊断-鉴别诊断知识库中鉴别诊断结果映射至标准诊断中。然后，以历史病程记录信息作为chatglm-6b大模型的输入，以先前得到的鉴别诊断结果作为chatglm-6b大模型的输出，对chatglm-6b大模型进行预训练，并通过医疗知识图谱构建训练数据集对预训练后的chatglm-6b大模型进行微调，得到医疗大模型。最后，将当前病程记录信息作为医疗大模型输入，以获取医疗大模型的模型输出数据，基于该模型输出数据构建提示对话框，以根据提示对话框中的prompt模板生成最终的鉴别诊断结果。该方法通过海量历史医疗数据对chatglm-6b大模型进行微调，由于大模型的容量较大，因此可以通过海量训练数据的学习提升大模型的表征能力，保证了鉴别诊断生成的多样性以及鉴别诊断的生成效果，且生成效率较高。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王勤勤,王实,张奇
技术所有人：北京惠每云科技有限公司
我是此专利的发明人

上一篇：基于幅度调制的高精度加速度计分辨率测试装置及方法
上一篇：室内局部环境控制方法及系统与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。