1.本发明涉及大数据应用技术领域,特别是涉及一种基于大数据的单病种健康管理知识图谱生成方法和装置。
背景技术:2.随着人们生活水平的日益提高,对于医疗健康的关注度逐年上升,如何挖掘医疗病历、诊断结果中包含的医学信息引起了越来越多的关注。使用文本挖掘技术将这些知识加工为结构化信息,能够为医疗知识信息化带来巨大进步。自然语言处理的快速发展,使得从病历中自动抽取医学实体及实体间关系成为可能。抽取到的医学知识可用来构建医学知识图谱,推动医学智能化发展。
3.现有的慢病人群的单病种健康管理知识图谱是采用专家经验汇总由人工进行编制的,因此在实际应用过程中无法很好地适应不同人群或个人的病程情况,导致无法有效地达到对单病种健康管理的支持。
技术实现要素:4.本发明所要解决的技术问题是提供一种基于大数据的单病种健康管理知识图谱生成方法和装置,适应不同人群或个人的病程情况,有效地达到对单病种健康管理的支持。
5.本发明解决其技术问题所采用的技术方案是:提供一种基于大数据的单病种健康管理知识图谱生成方法,包括以下步骤:
6.采集慢病人群的基础数据;
7.对所述基础数据进行预处理;
8.基于所述预处理后的基础数据对单病种慢病并发症的相关数据进行学习,构建单病种慢病并发症发生率预测模型和单病种慢病并发症严重程度预测模型;
9.将初始健康管理知识图谱应用于所述单病种慢病并发症发生率预测模型和单病种慢病并发症严重程度预测模型进行强化深度学习以调整所述初始健康管理知识图谱的应用权重,得到最终健康管理知识图谱;
10.对所述最终健康管理知识图谱进行验证,并在验证通过后进行保存。
11.所述慢病人群的基础数据包括慢病人群的体检数据、就诊数据和生活习惯数据。
12.所述对所述基础数据进行预处理包括:
13.将所述基础数据进行标准化转换;
14.对标准化转换后的基础数据进行脱敏处理。
15.所述基于所述预处理后的基础数据对单病种慢病并发症的相关数据进行学习,构建单病种慢病并发症发生率预测模型和单病种慢病并发症严重程度预测模型具体包括:
16.从所述预处理后的基础数据中找出与单病种慢病并发症的发生率相关的第一数据,并将所述第一数据输入至多维度分布预测模型进行学习,得到单病种慢病并发症发生率预测模型;
17.从所述预处理后的基础数据中找出与单病种慢病并发症的治疗相关的第二数据,并将所述第二数据输入至多维度分布预测模型进行学习,得到单病种慢病并发症严重程度预测模型。
18.所述将初始健康管理知识图谱应用于所述单病种慢病并发症发生率预测模型和单病种慢病并发症严重程度预测模型进行强化深度学习以调整所述初始健康管理知识图谱的应用权重,得到最终健康管理知识图谱具体为:
19.获取初始健康管理知识图谱;
20.对所述单病种慢病并发症发生率预测模型进行强化深度学习,并将所述初始健康管理知识图谱应用于所述单病种慢病并发症发生率预测模型进行参照训练,并根据训练结果调整所述初始健康管理知识图谱的应用权重,得到中期健康管理知识图谱;
21.对所述单病种慢病并发症严重程度预测模型进行强化深度学习,并将所述中期健康管理知识图谱应用于所述单病种慢病并发症严重程度预测模型进行参照训练,并根据训练结果调整所述中期健康管理知识图谱的应用权重,得到最终健康管理知识图谱。
22.本发明解决其技术问题所采用的技术方案是:还提供一种基于大数据的单病种健康管理知识图谱生成装置,包括:
23.采集模块,用于采集慢病人群的基础数据;
24.预处理模块,用于对所述基础数据进行预处理;
25.模型构建模块,用于基于所述预处理后的基础数据对单病种慢病并发症的相关数据进行学习,构建单病种慢病并发症发生率预测模型和单病种慢病并发症严重程度预测模型;
26.知识图谱生成模块,用于将初始健康管理知识图谱应用于所述单病种慢病并发症发生率预测模型和单病种慢病并发症严重程度预测模型进行强化深度学习以调整所述初始健康管理知识图谱的应用权重,得到最终健康管理知识图谱;
27.知识图谱验证模块,用于对所述最终健康管理知识图谱进行验证,并在验证通过后进行保存。
28.所述慢病人群的基础数据包括慢病人群的体检数据、就诊数据和生活习惯数据。
29.所述预处理模块包括:
30.标准化转换单元,用于将所述基础数据进行标准化转换;
31.脱敏单元,用于对标准化转换后的基础数据进行脱敏处理。
32.所述模型构建模块包括:
33.第一模型构建单元,用于从所述预处理后的基础数据中找出与单病种慢病并发症的发生率相关的第一数据,并将所述第一数据输入至多维度分布预测模型进行学习,得到单病种慢病并发症发生率预测模型;
34.第二模型构建单元,用于从所述预处理后的基础数据中找出与单病种慢病并发症的治疗相关的第二数据,并将所述第二数据输入至多维度分布预测模型进行学习,得到单病种慢病并发症严重程度预测模型。
35.所述知识图谱生成模块包括:
36.获取单元,用于获取初始健康管理知识图谱;
37.第一学习单元,用于对所述单病种慢病并发症发生率预测模型进行强化深度学
习,并将所述初始健康管理知识图谱应用于所述单病种慢病并发症发生率预测模型进行参照训练,并根据训练结果调整所述初始健康管理知识图谱的应用权重,得到中期健康管理知识图谱;
38.第二学习单元,用于对所述单病种慢病并发症严重程度预测模型进行强化深度学习,并将所述中期健康管理知识图谱应用于所述单病种慢病并发症严重程度预测模型进行参照训练,并根据训练结果调整所述中期健康管理知识图谱的应用权重,得到最终健康管理知识图谱。
39.有益效果
40.由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明基于慢病人群的体检、就诊、生活习惯等大数据信息的采集,对健康管理与慢病并发症的相关性进行学习,并在传统的慢病健康管理知识图谱的基础上,进一步强化训练出符合单病种健康管理的知识图谱,得到的知识图谱适应不同人群或个人的病程情况,有效地达到对单病种健康管理的支持。
附图说明
41.图1是第一实施方式的流程图。
具体实施方式
42.下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本技术所附权利要求书所限定的范围。
43.本发明的第一实施方式涉及一种基于大数据的单病种健康管理知识图谱生成方法,包括以下步骤:
44.步骤1,采集慢病人群的基础数据,对所述基础数据进行预处理。本步骤中,采集的慢病人群的基础数据包括慢病人群的体检数据、就诊数据和生活习惯数据等。其中,对所述基础数据进行预处理包括:步骤1a,将所述基础数据进行标准化转换,通过标准化转换可以对多种异构数据源进行统一处理,提高数据处理效率;步骤1b,对标准化转换后的基础数据进行脱敏处理,通过脱敏处理可以对敏感隐私数据进行可靠保护。
45.步骤2,单病种慢病并发症的机器学习,即基于所述预处理后的基础数据对单病种慢病并发症的相关数据进行学习,构建单病种慢病并发症发生率预测模型和单病种慢病并发症严重程度预测模型,具体包括:步骤2a,从所述预处理后的基础数据中找出与单病种慢病并发症的发生率相关的第一数据,并将所述第一数据输入至多维度分布预测模型进行学习,得到单病种慢病并发症发生率预测模型;步骤2b,从所述预处理后的基础数据中找出与单病种慢病并发症的治疗相关的第二数据,并将所述第二数据输入至多维度分布预测模型进行学习,得到单病种慢病并发症严重程度预测模型。本实施方式基于慢病人群并发症的发生率及严重程度等大数据信息,对健康管理与慢病并发症的相关性进行学习,为后续强化学习建立基础。
46.步骤3,基于初始健康管理知识图谱完成强化的深度学习迁移,即将初始健康管理
知识图谱应用于所述单病种慢病并发症发生率预测模型和单病种慢病并发症严重程度预测模型进行强化深度学习以调整所述初始健康管理知识图谱的应用权重,得到最终健康管理知识图谱,具体包括:步骤3a,获取初始健康管理知识图谱,并使用上述慢病人群的基础数据作为训练源数据,其中,本实施方式中的初始健康管理知识图谱可以是传统专家经验总结的健康管理知识图谱,也可以是采用本实施方式得到的健康管理知识图谱。步骤3b,对所述单病种慢病并发症发生率预测模型进行强化深度学习,并将所述初始健康管理知识图谱应用于所述单病种慢病并发症发生率预测模型进行参照训练,并根据训练结果调整所述初始健康管理知识图谱的应用权重,得到中期健康管理知识图谱;步骤3c,对所述单病种慢病并发症严重程度预测模型进行强化深度学习,并将所述中期健康管理知识图谱应用于所述单病种慢病并发症严重程度预测模型进行参照训练,并根据训练结果调整所述中期健康管理知识图谱的应用权重,得到最终健康管理知识图谱。本实施方式在传统的慢病健康管理知识图谱的基础上,进一步强化训练出符合单病种健康管理的知识图谱,通过迁移学习的方式提高了训练速度,并且确保了得到的单病种健康管理的知识图谱在适应个人特性上的准确性。
47.步骤4,生成单病种健康管理知识图谱,具体包括:步骤4a,基于步骤3的强化深度学习训练得到的最终健康管理知识图谱形成策略模型;步骤4b,通过使用上述慢病人群的基础数据作为模拟验证源数据,验证策略模型在适应个人特性上的准确性,当验证通过后,即可将最终健康管理知识图谱进行保存,若验证未通过,则返回步骤3并在该健康管理知识图谱基础上重新进行强化的深度学习迁移。
48.本发明的第二实施方式涉及一种基于大数据的单病种健康管理知识图谱生成装置,包括:采集模块,用于采集慢病人群的基础数据;预处理模块,用于对所述基础数据进行预处理;模型构建模块,用于基于所述预处理后的基础数据对单病种慢病并发症的相关数据进行学习,构建单病种慢病并发症发生率预测模型和单病种慢病并发症严重程度预测模型;知识图谱生成模块,用于将初始健康管理知识图谱应用于所述单病种慢病并发症发生率预测模型和单病种慢病并发症严重程度预测模型进行强化深度学习以调整所述初始健康管理知识图谱的应用权重,得到最终健康管理知识图谱;知识图谱验证模块,用于对所述最终健康管理知识图谱进行验证,并在验证通过后进行保存。
49.所述慢病人群的基础数据包括慢病人群的体检数据、就诊数据和生活习惯数据。
50.所述预处理模块包括:标准化转换单元,用于将所述基础数据进行标准化转换;脱敏单元,用于对标准化转换后的基础数据进行脱敏处理。
51.所述模型构建模块包括:第一模型构建单元,用于从所述预处理后的基础数据中找出与单病种慢病并发症的发生率相关的第一数据,并将所述第一数据输入至多维度分布预测模型进行学习,得到单病种慢病并发症发生率预测模型;第二模型构建单元,用于从所述预处理后的基础数据中找出与单病种慢病并发症的治疗相关的第二数据,并将所述第二数据输入至多维度分布预测模型进行学习,得到单病种慢病并发症严重程度预测模型。
52.所述知识图谱生成模块包括:获取单元,用于获取初始健康管理知识图谱;第一学习单元,用于对所述单病种慢病并发症发生率预测模型进行强化深度学习,并将所述初始健康管理知识图谱应用于所述单病种慢病并发症发生率预测模型进行参照训练,并根据训练结果调整所述初始健康管理知识图谱的应用权重,得到中期健康管理知识图谱;第二学
习单元,用于对所述单病种慢病并发症严重程度预测模型进行强化深度学习,并将所述中期健康管理知识图谱应用于所述单病种慢病并发症严重程度预测模型进行参照训练,并根据训练结果调整所述中期健康管理知识图谱的应用权重,得到最终健康管理知识图谱。
53.不难发现,本发明基于慢病人群的体检、就诊、生活习惯等大数据信息的采集,对健康管理与慢病并发症的相关性进行学习,并在传统的慢病健康管理知识图谱的基础上,进一步强化训练出符合单病种健康管理的知识图谱,得到的知识图谱适应不同人群或个人的病程情况,有效地达到对单病种健康管理的支持。