一种基于分层多标签模型的医疗建议推荐方法、系统、设备与流程

文档序号:35677098发布日期:2023-10-08 08:02阅读:44来源:国知局
一种基于分层多标签模型的医疗建议推荐方法、系统、设备与流程

本申请涉及智能医疗领域,具体涉及一种基于分层多标签模型的医疗建议推荐方法、系统、设备、计算机可读存储介质。


背景技术:

1、计算机算法的发展为医疗文本领域的应用提供重要的贡献,医学文本数据包含了大量的医疗报告、病历、研究论文等内容,利用自然语言处理技术,可以有效地处理和分析这些复杂的医疗文本数据,为医生、研究人员和患者提供更好的医疗服务和健康管理。但是在处理医学文本时存在一些问题,比如临床笔记嘈杂,语法容易错误,并且句子较短且不完整,其中包含的上下文语义少。其次,传统临床决策支持系统的构建包括端到端、两阶段(先进行命名实体识别和文本提取,再学习专家共识)方法来预测决策类别。事实证明,这些方法可以在某些场景下提高模型性能,但可能会牺牲模型的可解释性。最后,传统算法或者模型在给出最终计算结果(即推荐的临床建议)时,无法给出该结果的计算依据,是一种黑箱模型,使得患者无法真正相信由算法/模型而非人工提供的建议,很难实际应用。


技术实现思路

1、针对上述问题,本发明以端到端的方式构建临床决策系统的角度着手,提出一种基于分层多标签模型的医疗建议推荐方法,该方法使用了多层次、多标签的可解释分类框架,能提高系统可靠性和系统亲和力,具体包括:

2、获取数据样本及样本标签;

3、将所述数据样本及样本标签输至构建好的分层多标签模型中得到分层决策路径;

4、所述分层多标签模型的构建过程包括:

5、获取疾病数据集及分层多标签;

6、将所述疾病数据集及分层多标签输至预训练大模型中进行编码得到编码向量;

7、将所述编码向量输至编码生成器中生成分层多标签,所述分层多标签通过映射至树形结构对应的节点上得到分层决策路径,其中,所述编码生成器通过疾病诊断专家共识判断所述编码向量的活动性。

8、进一步,所述活动性包含下列的一种或几种:活动状态、非活动状态;所述活动状态是在判断标签为真时的状态,所述非活动状态是在判断标签为假时的状态,相关公式如下:

9、= = a(h + )

10、= = a(h + )

11、其中a、是整体模型表征参数。

12、进一步,所述活动状态和所述非活动状态通过评分函数得到真实状态:

13、( (1 -))

14、 = +

15、其中,是在联合空间中处于活动状态的概率,和为参数。

16、所述树形结构是指根据疾病诊断专家共识生成的分层多标签决策树,所述分层多标签决策树的节点标签分为主标签和子标签;所述主标签包括下列的一种或几种:正常、癌症、息肉、肠道准备不足、其他或无法匹配,所述子标签包括:增生性息肉、锯齿状腺瘤、腺瘤性息肉、炎症、外科就诊、消化内科就诊、直肠或乙状结肠、有蒂、数量>10或多发息肉、数量:3-10、数量:1-2、带绒毛或高度异型增生、无绒毛且无高度异型增生、最大直径<10mm且无异型增生、最大直径<10mm、最大直径≥10mm、1年、1-2年、1-3年、2-3年、5-10年。

17、进一步,所述子标签中包括第一子标签、第二子标签、第三子标签、第四子标签、第五子标签,所述第一子标签包括:增生性息肉、锯齿状腺瘤、腺瘤性息肉、炎症、5-10年、外科就诊、消化内科就诊;第二子标签包括:直肠或乙状结肠、有蒂、数量>10或多发息肉、数量:3-10、数量:1-2;第三子标签包括:带绒毛或高度异型增生、无绒毛且无高度异型增生、最大直径<10mm、最大直径<10mm且无异型增生;第四子标签包括:最大直径<10mm、最大直径≥10mm;第五子标签包括:1年、1-2年、1-3年、2-3年、5-10年。

18、所述预训练大模型采用下列的一种或几种:文心一言、通义千问、chatgpt、palm-e、meena、lamda。

19、所述方法还包括使用预测器对所述分层多标签进行预测得到预测标签,所述预测标签通过概念概率向量进行概念解释得到最终的医疗建议。

20、本申请的目的在于提供一种基于分层多标签模型的医疗建议推荐系统,包括:

21、数据获取模块:数据样本及样本标签;

22、疾病辅助诊断模块:将所述数据样本及样本标签输至构建好的分层多标签模型中得到分层决策路径;

23、模型构建模块:所述分层多标签模型的构建过程包括:

24、获取疾病数据集及分层多标签;

25、将所述疾病数据集及分层多标签输至预训练大模型中进行编码得到编码向量;

26、将所述编码向量输至编码生成器中生成分多层标签,所述分层多标签通过映射至树形结构对应的节点上得到分层决策路径,其中,所述编码生成器通过疾病诊断专家共识判断所述编码向量的活动性。

27、本申请的目的在于提供一种基于分层多标签模型的医疗建议推荐设备,包括:

28、存储器和处理器;所述存储器用于存储程序指令;所述处理器用于调用程序指令,当程序指令被执行时实现任意一项上述的基于分层多标签模型的医疗建议推荐方法。

29、本申请的目的在于提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现任意一项上述的基于分层多标签模型的医疗建议推荐方法。

30、本申请的优势:

31、1.本申请采用了分层多标签的模型架构,通过构建分层多标签决策任务树对数据进行分层分类,每一个标签代表一个语义点,作为医学证据评估的节点,使得该模型不仅能在高效准确获得预测结果的同时还给出了预测结果的依据,即决策证据链,这与传统方式完全不同,避免了黑箱问题,提高了模型的可信任度。

32、2.本申请的模型架构中瓶颈输出层的输出是以人类可以理解的语义进行展现的,具有可解释性,为提供医学决策证据链提供重要基础,提高了模型的可靠性。

33、2.本申请采用预训练大模型对分层标签进行编码,该方式能将标签划分为不同等级,捕获标签间的依赖性和分层结构,提高模型的理解和预测能力,同时节约模型训练的时间。

34、4.本申请对模型架构中瓶颈输出层的输出做进一步预测,预测使用的预测器是可解释性预测器,通过预测获得最终的医疗建议,有助于医疗疾病的治疗,为医师的诊断提供参考,具有重要的临床价值。



技术特征:

1.一种基于分层多标签模型的医疗建议推荐方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于分层多标签模型的医疗建议推荐方法,其特征在于,所述活动性包含下列的一种或几种:活动状态、非活动状态;所述活动状态是在判断标签为真时的状态,所述非活动状态是在判断标签为假时的状态,相关公式如下:

3.根据权利要求2所述的基于分层多标签模型的医疗建议推荐方法,其特征在于,所述活动状态和所述非活动状态通过评分函数得到真实状态:

4.根据权利要求1所述的基于分层多标签模型的医疗建议推荐方法,其特征在于,所述树形结构是指根据疾病诊断专家共识生成的分层多标签决策树,所述分层多标签决策树的节点标签分为主标签和子标签;所述主标签包括下列的一种或几种:正常、癌症、息肉、肠道准备不足、其他或无法匹配,所述子标签包括:增生性息肉、锯齿状腺瘤、腺瘤性息肉、炎症、外科就诊、消化内科就诊、直肠或乙状结肠、有蒂、数量>10或多发息肉、数量:3-10、数量:1-2、带绒毛或高度异型增生、无绒毛且无高度异型增生、最大直径<10mm且无异型增生、最大直径<10mm、最大直径≥10mm、1年、1-2年、1-3年、2-3年、5-10年。

5.根据权利要求4所述的基于分层多标签模型的医疗建议推荐方法,其特征在于,所述子标签中包括第一子标签、第二子标签、第三子标签、第四子标签、第五子标签,所述第一子标签包括:增生性息肉、锯齿状腺瘤、腺瘤性息肉、炎症、5-10年、外科就诊、消化内科就诊;第二子标签包括:直肠或乙状结肠、有蒂、数量>10或多发息肉、数量:3-10、数量:1-2;第三子标签包括:带绒毛或高度异型增生、无绒毛且无高度异型增生、最大直径<10mm且无异型增生、最大直径<10mm;第四子标签包括:最大直径<10mm、最大直径≥10mm;第五子标签包括:1年、1-2年、1-3年、2-3年、5-10年。

6.根据权利要求1所述的基于分层多标签模型的医疗建议推荐方法,其特征在于,所述预训练大模型采用下列的一种或几种:文心一言、通义千问、chatgpt、palm-e、meena、lamda。

7.根据权利要求1所述的基于分层多标签模型的医疗建议推荐方法,其特征在于,所述方法还包括使用预测器对所述分层多标签进行预测得到预测标签,所述预测标签通过概念概率向量进行概念解释得到最终的医疗建议。

8.一种基于分层多标签模型的医疗建议推荐系统,其特征在于,包括:

9.一种基于分层多标签模型的医疗建议推荐设备,其特征在于,包括:

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任意一项上述的基于分层多标签模型的医疗建议推荐方法。


技术总结
本申请涉及智能医疗领域,具体涉及一种基于分层多标签模型的医疗建议推荐方法、系统、设备。包括获取数据样本及样本标签;将所述数据样本及样本标签输至构建好的分层多标签模型中得到分层决策路径;所述分层多标签模型的构建过程包括:获取疾病数据集及分层多标签;将所述疾病数据集及分层多标签输至预训练大模型中进行编码得到编码向量;将所述编码向量输至编码生成器中生成分层多标签,所述分层多标签通过映射至树形结构对应的节点上得到分层决策路径,其中,所述编码生成器通过疾病诊断指南判断所述编码向量的活动性。本申请构建的分层多标签模型不仅能获得医疗决策建议同时能够得到决策的依据,为医师提供初步诊断结果,具有很好临床意义。

技术研发人员:吴俊嶺,张瀚文,赵志状,孙刚,王淑芳,栾哲,陈俊,李丛勇,张伟,陈怡,张嘉琪
受保护的技术使用者:中国人民解放军总医院第一医学中心
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1