本发明涉及知识图谱,特别涉及基于就诊事件数据的知识图谱构建方法。
背景技术:
1、知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。
2、近年来,对医学上的临床决策支持和辅助诊断系统的需求大幅增加。现有的平台或系统依赖于通过大量专业人员手工编辑的知识库或使用简单的统计数据生成,知识图谱是智能大数据的前沿研究问题,它以独有的技术优势顺应了信息化时代的发展,比如渐增式的数据模式设计;良好的数据集成;现有rdf、owl等标准支持;语义搜索和知识推理能力等。在医学领域,随着区域卫生信息化及医疗信息系统的发展,积累了海量的就诊事件数据。如何从这些数据中提炼信息,并加以管理、共享及应用,是推进医学智能化的关键问题,是医学知识检索、临床诊断、医疗质量管理、电子病历及健康档案智能化处理的基础。
3、因此,有必要提供基于就诊事件数据的知识图谱构建方法解决上述技术问题。
技术实现思路
1、为解决上述技术问题,本发明提供基于就诊事件数据的知识图谱构建方法。
2、本发明提供的基于就诊事件数据的知识图谱构建方法包括:
3、s1、依据多个数据源获取就诊事件数据,并对就诊事件数据进行分类,将就诊事件数据分为结构化数据、非结构化数据和半结构化数据;
4、s2、对非结构化数据和半结构化数据进行信息抽取,对结构化数据进行转化,生成数据集;
5、s3、对信息抽取后的非结构化数据和半结构化数据进行数据处理,并将数据处理后的非结构化数据和半结构化数据与数据集进行数据融合构建数据库;
6、s4、将数据融合后的数据输入图谱树中,生成就诊事件数据的知识图谱,并将知识图谱进行存储;
7、优选的,s3对信息抽取后的非结构化数据和半结构化数据进行数据处理的方法为指代消解和实体消歧。
8、优选的,s1依据多个数据源获取就诊事件数据的数据源可以为医院的诊疗数据库、电子病历和患者的就医数据库。
9、优选的,获取就诊事件数据的数据源还可以为其他医院的诊疗数据库、电子病历、患者的就医数据库以及药典以及词表。
10、需要说明的是,通过药典,可对药物进行解释,便于患者以及医生对药物的信息进行查询,降低药物使用过程中产生的危害,词表为相应的医疗专用的名称。
11、优选的,所述s4中知识图库的存储为三元组库和图数据库,其中三元组库用于存储rdf图数据,图数据库用于存储管理属性图。
12、优选的,s2中对非结构化数据和半结构化数据进行信息抽取,获取就诊事件数据的实体,实体之间关联的实体关系以及实体中的属性和属性值。
13、优选的,s2中将数据处理后的非结构化数据和半结构化数据与数据集进行数据融合构建数据库的方法为实体对齐,将代表相同概念的实体合并。
14、优选的,获取就诊事件数据的实体,实体之间关联的实体关系以及实体中的属性和属性值的方法为:
15、s21、当数据的类型为半结构化数据时,通过知识抽取模板从就诊事件数据中抽取属性名称和属性值,还包括利用半结构化数据抽取上下位知识;
16、s22、数据的类型为非结构化数据时,将所述就诊事件数据转化为句子集合,并依据词表对所述句子集合中的每一句子进行命名实体识别,最后通过知识抽取模板从识别的实体抽取属性名称和属性。
17、与相关技术相比较,本发明提供的基于就诊事件数据的知识图谱构建方法具有如下有益效果:
18、1、本发明通过设置依据多个数据源获取就诊事件数据,并对就诊事件数据进行信息抽取以及数据进行转化,生成数据集,对信息抽取后的非结构化数据和半结构化数据进行数据处理,并将数据处理后的非结构化数据和半结构化数据与数据集进行数据融合构建数据库,将数据融合后的数据输入图谱树中,生成就诊事件数据的知识图谱,并将知识图谱进行存储,可为后续的医学知识检索、临床诊断、医疗质量管理、电子病历及健康档案智能化处理提供数据基础,提高医院就诊的效率,可更好的为患者进行服务。
1.基于就诊事件数据的知识图谱构建方法,其特征在于,包括:
2.根据权利要求1所述的基于就诊事件数据的知识图谱构建方法,其特征在于,s1依据多个数据源获取就诊事件数据的数据源可以为医院的诊疗数据库、电子病历和患者的就医数据库。
3.根据权利要求2所述的基于就诊事件数据的知识图谱构建方法,其特征在于,获取就诊事件数据的数据源还可以为其他医院的诊疗数据库、电子病历、患者的就医数据库以及药典以及词表。
4.根据权利要求1所述的基于就诊事件数据的知识图谱构建方法,其特征在于,s2中对非结构化数据和半结构化数据进行信息抽取,获取就诊事件数据的实体,实体之间关联的实体关系以及实体中的属性和属性值。
5.根据权利要求1所述的基于就诊事件数据的知识图谱构建方法,其特征在于,s2中将数据处理后的非结构化数据和半结构化数据与数据集进行数据融合构建数据库的方法为实体对齐,将代表相同概念的实体合并。
6.根据权利要求4所述的基于就诊事件数据的知识图谱构建方法,其特征在于,获取就诊事件数据的实体,实体之间关联的实体关系以及实体中的属性和属性值的方法为:
7.根据权利要求1所述的基于就诊事件数据的知识图谱构建方法,其特征在于,s3对信息抽取后的非结构化数据和半结构化数据进行数据处理的方法为指代消解和实体消歧。
8.根据权利要求1所述的基于就诊事件数据的知识图谱构建方法,其特征在于,所述s4中知识图库的存储为三元组库和图数据库,其中三元组库用于存储rdf图数据,图数据库用于存储管理属性图。