一种基于知识图谱的病状初步诊断及治疗方法与流程

文档序号:31604806发布日期:2022-09-21 10:13阅读:来源:国知局

技术特征:
1.一种基于知识图谱的病状初步诊断及治疗方法,其特征在于,该方法包括以下步骤:s1、采集电子病历构建病历数据集,基于词典的分词算法对病历数据集中的字段进行分词处理,并分析判断疾病或病状的别名;s2、分别基于命名实体识别模型及实体关系抽取模型对处理后的电子病历数据集中的数据进行实体及实体关系标注;s3、构建rdf格式的实体与关系标注数据集,并利用实体与关系标注数据集构建基于疾病诊断的知识图谱;s4、基于疾病症状的纯度及疾病信息熵对疾病病状进行初步诊断,并利用基于疾病诊断的知识图谱结合协同推荐算法得到推荐初步治疗方案。2.根据权利要求1所述的一种基于知识图谱的病状初步诊断及治疗方法,其特征在于,所述s1中采集电子病历构建病历数据集,基于词典的分词算法对病历数据集中的字段进行分词处理之前还包括以下步骤:利用数据处理模块对病历数据集中的病历数据进行清洗与预处理,进行病历分词、剔除空数据、无效数据、剔除无情感意义的文字和重复数据。3.根据权利要求2所述的一种基于知识图谱的病状初步诊断及治疗方法,其特征在于,所述基于词典的分词算法对病历数据集中的字段进行分词处理包括以下步骤:按照预定的策略将预先建立的分词词典中所有词语与病历数据集中的字段逐一进行匹配,识别出字段中包含的属于分词词典的词语,并将识别到的词语作为有用信息返回。4.根据权利要求1所述的一种基于知识图谱的病状初步诊断及治疗方法,其特征在于,所述s2中分别基于命名实体识别模型及实体关系抽取模型对处理后的电子病历数据集中的数据进行实体及实体关系标注包括以下步骤:s21、将分词处理后的病历数据集按照预设比例分为人工病历标注数据集和自动病历标注数据集;s22、医学专家利用专业知识对人工病历标注数据集中的数据进行实体及实体关系标注;s23、将标注后的人工病历标注数据集中的病历数据输入预先构建的命名实体识别模型及实体关系抽取模型进行训练;s24、将自动病历标注数据逐个输入训练好的命名实体识别模型及实体关系抽取模型进行实体识别及实体与实体关系的自动标注。5.根据权利要求1所述的一种基于知识图谱的病状初步诊断及治疗方法,其特征在于,所述实体包括症状、疾病、部位、药品、科室及人群基本实体信息,所述实体关系包括部位症状关系、部位疾病关系、症状疾病关系、疾病科室关系、药品疾病关系、药品症状关系及药品人群关系。6.根据权利要求1所述的一种基于知识图谱的病状初步诊断及治疗方法,其特征在于,所述基于疾病诊断的知识图谱由6个实体及7个实体关系构成,采用有向图g表示,其中g=(v,e),式中,v={v1,v2,

,v
n
}表示一组指向不同实体的顶点,e为一组边,表示实体之间不同类型的关系。7.根据权利要求1所述的一种基于知识图谱的病状初步诊断及治疗方法,其特征在于,所述s4中基于疾病症状的纯度及疾病信息熵对疾病病状进行初步诊断,并利用基于疾病诊
断的知识图谱结合协同推荐算法得到推荐初步治疗方案包括以下步骤:s41、计算知识图谱中每个症状的纯度p及该症状相关疾病的疾病信息熵s,并基于该纯度p及疾病信息熵s分析得到病状;s42、利用基于疾病诊断的知识图谱结合协同推荐算法得到推荐初步治疗方案。8.根据权利要求7所述的一种基于知识图谱的病状初步诊断及治疗方法,其特征在于,所述s41中计算知识图谱中每个症状的纯度p及该症状相关疾病的疾病信息熵s,并基于该纯度p及疾病信息熵s分析得到病状包括以下步骤:s411、计算知识图谱中每个症状的纯度p,并选取纯度最大的症状计算该症状相关疾病的疾病信息熵s,其中,所述纯度p的公式计算如下:所述疾病信息熵s的计算公式如下:式中,n表示疾病的个数,v
i
表示与症状或症状组合相关联疾病量化关系的数值,n2表示与症状或症状组合相关联的疾病个数的平方,v
i’表示症状或症状组合与某个疾病的量化关系数值,v
i”表示所有与该疾病相关联症状的量化关系数值;s412、判断疾病信息熵s是否大于预设阈值或者为最后一个症状,若是则选择疾病信息熵s最大的疾病保存,并在原有所有疾病列表删除该疾病,重复上述步骤,迭代n次结束,获得n个疾病,最后通过疾病对于输入的所有症状计算疾病信息熵实现排序,并依据排序结果分析得到初步病状。9.根据权利要求1所述的一种基于知识图谱的病状初步诊断及治疗方法,其特征在于,所述s42中利用基于疾病诊断的知识图谱结合协同推荐算法得到推荐初步治疗方案包括以下步骤:s421、获取患者的病状信息,并利用基于疾病诊断的知识图谱分析得到第一推荐治疗方案;s422、利用协同推荐算法为患者推荐与之病状信息相似的治疗方案,得到第二推荐治疗方案;s423、结合第一推荐治疗方案及第二推荐治疗方案分析得到推荐初步治疗方案。10.根据权利要求9所述的一种基于知识图谱的病状初步诊断及治疗方法,其特征在于,所述s422中利用协同推荐算法为患者推荐与之病状信息相似的治疗方案,得到第二推荐治疗方案包括以下步骤:s4221、获取患者的症状信息数据,并计算病历数据集中与患者症状信息数据的相似度,其中,相似度的计算公式如下:
式中,sim(u1,u2)为患者u1与u2的相似度,s为症状总数,在单选择情况下相同为1,不同为0,且在多选情况下:s1为多选选项数;s4222、根据上述公式判断相似患者,并选取相似度最近的若干患者进行排序,得到病例组;s4223、计算某个病例组中病例对当前患者病状的治疗方案推荐值,并依据推荐值结果为该患者推荐治疗方案,得到第二推荐治疗方案,其中,治疗方案推荐值的计算公式如下:其中,p表示推荐值,sim(u,u
i
)为患者u和患者u
i
的相似度,r
i
是患者症状i对病例组的平均估值,为患者症状i对病例的平均估值,n表示业务服务的总数量。

技术总结
本发明公开了一种基于知识图谱的病状初步诊断及治疗方法,该方法包括以下步骤:S1、采集电子病历构建病历数据集,进行分词处理,并分析判断疾病或病状的别名;S2、分别基于命名实体识别模型及实体关系抽取模型对处理后的电子病历数据集中的数据进行实体及实体关系标注;S3、构建RDF格式的实体与关系标注数据集,并利用实体与关系标注数据集构建基于疾病诊断的知识图谱;S4、基于疾病症状的纯度及疾病信息熵对疾病病状进行初步诊断,并利用基于疾病诊断的知识图谱结合协同推荐算法得到推荐初步治疗方案。不仅可以实现疾病病状的初步诊断,而且还可以为患者推荐初步治疗方案,同时可以有效地提高推荐治疗方案的准确率。时可以有效地提高推荐治疗方案的准确率。时可以有效地提高推荐治疗方案的准确率。


技术研发人员:刘鹏 张真 高中强 左成婷 张堃
受保护的技术使用者:南京云创大数据科技股份有限公司
技术研发日:2022.07.12
技术公布日:2022/9/20
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1