基于知识图谱增强的自动可解释性疾病自动诊断装置

文档序号:34283683发布日期:2023-05-27 16:04阅读:134来源:国知局
基于知识图谱增强的自动可解释性疾病自动诊断装置

本发明涉及知识图谱,具体涉及一种基于知识图谱增强的自动可解释性疾病自动诊断装置。


背景技术:

1、传统疾病诊断主要依靠医生的经验,诊断结果受到环境与人为等因素的影响;同时,我国医疗资源分布不均匀,广大乡镇居民难以获得充足、优质的医疗服务。为了解决这一问题,合理地将机器学习技术应用至疾病诊断领域是十分必要的。基于人工智能技术的疾病自动诊断方法能够帮助患者及早发现疾病,同时也能够有效辅助医生进行诊断,降低误诊漏诊的概率。

2、对于疾病自动诊断问题,常见的主要有两种方式;一是将其视作疾病分类任务。训练一个诊断模型,它将病人出现的症状等相关信息作为输入,并计算各种疾病发生的概率,最终选取概率最大的疾病作为诊断结果。基于这一思路,目前已有使用cnn、rnn、

3、transformer等结构的多种方法被提出。例如文献(narges razavian."deep ehr:chronic disease prediction using medical notes."machine learning forhealthcare conference.pmlr,

4、2018)中的作者对比了包括cnn、bilstm,以及cnn与lstm组合的多种方法,利用上述结构的模型提取输入信息的特征,再将其输入线性层进行分类,最终实现诊断。由于现实中疾病诊断的过程可以看作是一个以多种信息为依据进行决策的过程,因此另一种方法是将诊断转换为马尔可夫决策过程,这种方法大多基于强化学习方法,通过训练一个智能代理来解决马尔可夫决策问题(liu,siqi,kee yuan ngiam,and mengling feng."deepreinforcement learning for clinical decision support:a brief survey."arxivpreprint arxiv:1907.09475(2019).)。文献(wei,zhongyu,et al."task-orienteddialogue system for automatic diagnosis."proceedings of the 56th annualmeeting of the association for computational linguistics(volume 2:shortpapers).2018.)提出了一个基于强化学习的自动诊断对话系统框架,通过分析与患者的对话实现疾病诊断。xu等人(xu,lin,et al."end-to-end knowledge-routed relationaldialogue system for automatic diagnosis."proceedings of the aaai conferenceon artificial intelligence.vol.33.no.01.2019.)对其进行了改进,并提出了一种名为kr-dqn的方法,该方法能够将丰富的先验医疗知识无缝的融入到诊断过程中。其训练数据收集自互联网,并对其进行了一定程度的简化。

5、但现有方法存在以下几方面的问题:

6、1.在一类将疾病自动诊断视作分类问题的方法中,需要大量高质量训练数据进行训练;即使属于同一疾病,当对其的描述发生变化时,都有可能影响分类结果。同时,在疾病类别增多时,基于分类的方法准确度明显下降。最重要的是,由于深度学习模型的“黑盒”特性,本发明很难解释分类模型的行为,无法对最终的诊断结果做出合理的解释,影响了人们对模型的信心,也极大的限制了基于分类方法的自动诊断模型在医疗领域中的实际应用。

7、2.另一类基于对话的自动诊断方法也存在诸多问题。在现有的基于对话的自动诊断方法中,模型通过与患者进行多轮交互,实现对多个症状数据对提取,最终完成疾病诊断。模型总是倾向于获得更多信息,因此在诊断过程中会产生大量无意义的对话轮次,降低了用户体验。同时,当数据集中待提取的症状数据量较小时,其诊断准确度会大幅下降。在一示例使用的数据集中,大部分疾病表现的症状个数在1至3个,如图1所示,约有75%的疾病最多表现出3种症状。在此种情况下,基于对话的自动诊断方法无法取得良好效果。

8、3.现有方法仍是只依靠标注数据进行训练,没有或只融合了极少的先验医疗知识。如果能够将专业的医学知识纳入自动疾病诊断过程中,准确度会有较大提升。基于对话的诊断模型,自动生成的对话的质量也限制着后续的疾病诊断任务。现有方法使用的对话数据集都是通过机器生成或者经过大量简化的结果,在此基础上训练得到的模型难以推广至真实任务,也严重制约着现有方法的应用。


技术实现思路

1、为解决上述问题,本发明公开了一种基于知识图谱增强的自动可解释性疾病自动诊断装置,将问题定义为一个在医疗知识图谱上的马尔可夫决策问题,希望构建一个基于强化学习的自动诊断模型,输入患者出现的症状和其他补充信息,融合医学知识图谱的先验知识,最终诊断结果并返回一条可解释的决策路径,实现疾病诊断和原因解释两个目的。

2、本发明的技术内容包括:

3、一种基于知识图谱增强的可解释性疾病自动诊断装置,所述装置包括:

4、数据获取模块,用于获取患者的症状和医生对每一症状的补充说明;

5、数据增强模块,用于结合所述补充说明,计算各症状的增强表示;

6、路径推断模块,用于在知识图谱中基于所述增强表示进行路径推断,得到每一症状对应的路径集合;其中,所述知识图谱中的实体包括:疾病、症状、手术、药物、描述、相关疾病和相关症状,所述知识图谱中的关系包括:相关于、手术史有和疾病表现,所述路径集合中的路径是以疾病实体为终点的路径;

7、症状推断模块,用于计算所有路径终点对应的疾病出现概率和/或奖励,以得到所述症状的诊断结果。

8、进一步地,所述结合所述补充说明,计算各症状的增强表示,包括:

9、使用embedding层或医学词典预训练的word2vec模型,分别计算症状m的向量表示vm和所述症状m对应的补充说明ti的向量表示

10、基于所述向量表示vm和所述向量表示得到所述症状m的增强表示v′m。

11、进一步地,所述在知识图谱中进行所述增强表示的路径推断,得到每一症状对应的路径集合,包括:

12、在所述知识图谱中,查找所述症状对应的症状实体em,并将所述增强表示作为所述症状实体em的属性;

13、基于当前路径终点et,生成路径的历史信息h_t与所述症状实体em的属性,计算当前路径终点的状态st;其中,t表示推断步数;

14、根据强化学习智能体,生成所述状态st的全动作空间at;其中,所述强化学习智能体包括:双层全连接神经网络、数值网络和策略网络;

15、对全动作空间at进行剪枝,得到剪枝动作空间

16、对于剪枝动作空间中的动作,使用余弦相似度评分fp选取最佳动作并执行,得到节点et+1,并将该节点加入现有路径中。

17、在达到最大步数t之后,基于剪枝动作空间得到所述症状对应的路径集合。

18、进一步地,训练所述强化学习智能体的步骤,包括:

19、构建训练集;

20、使用所述双层全连接神经网络学习状态st的表示xt;

21、基于所述表示xt,所述策略网络计算存在的下一步动作at;

22、使用一个数值网络根据所述表示xt来学习数值v;

23、所述策略网络根据所述数值v进行参数优化;

24、所述数值网络根据训练数据进行参数更新。

25、进一步地,所述对全动作空间at进行剪枝,得到剪枝动作空间包括:其中,r为关系,e为实体,m为症状,at为全动作空间,fp为症状实体m与当前实体的余弦相似度评分。

26、进一步地,所述余弦相似度评分其中,vm表示所述症状的向量表示,v′m表示所述症状的增强表示,r表示关系,ek表示实体,d表示疾病实体集合。

27、进一步地,所述知识图谱基于transe学习方法构建。

28、进一步地,计算所有路径终点对应的疾病出现概率和/或奖励,以得到所述症状的诊断结果,包括:

29、根据实际需求,在疾病出现概率或奖励中选择一种或多种作为诊断标准;

30、如果选择疾病出现概率,则统计所有路径终点对应的疾病出现次数,并基于各疾病的出现概率,得到所述症状的诊断结果;

31、如果选择奖励,则融合各症状的增强表示,得到融合症状嵌入并通过计算所有路径终点的奖励得到所述症状的诊断结果;其中,为路径终点et的表示,fr表示v′m与的点积;

32、如果选择疾病出现概率和奖励,则结合各疾病的出现概率和所述奖励rt,得到所述症状的诊断结果。

33、与现有技术相比,本发明的积极效果为:

34、1.在本文中,本发明将自动疾病诊断任务定义为疾病知识图上的决策问题,并使用智能代理明确推理知识以做出决策。

35、2.本发明提出了一种基于强化学习的路径推理方法,该方法具有软奖励和动作剪枝策略,用于疾病诊断。

36、3.为了将更多的信息纳入到知识图中,本发明提出了一种增强的嵌入方法。

37、4.实验结果表明,本发明的模型在准确性和互操作性方面都优于所有基线模型。比较本发明提出的模型方法与传统方法的效果比较。实验验证使用同一验证数据,并对多种算法模型进行参数调优以获得当前模型下的最佳效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1