一种基于LIS的医学检验知识图谱构建方法与流程

文档序号:18267629发布日期:2019-07-27 09:19阅读:1307来源:国知局
一种基于LIS的医学检验知识图谱构建方法与流程

本发明涉及知识图谱创建技术领域,特别是涉及一种基于lis的医学检验知识图谱构建方法。



背景技术:

检验科信息系统(laboratoryinformationsystemlis)实现临床实验室的信息采集、存储、处理、传输、查询,提供分析及诊断支持,协助检验医师对检验申请单及标本进行预处理,检验数据的自动采集或直接录入,检验数据处理等。lis中包含患者的基本信息、各项检验数据和检验诊断结果等,记录着医学实体及其关联,如患者实体、基本信息实体、检验实体、诊断实体等实体及其之间的关系,其中包含着大量的医学检验事实。因此,深入挖掘lis系统中的医学检验事实知识将为医学检验工作效率提升发挥重要作用。知识图谱是一种描述实体及其联系的知识表示方法,旨在描述客观世界的概念、实体、事件及其间的关系,具有知识语义化、数据易关联、易扩充等特性,广泛应用于医学领域,现已出现了多种医学知识图谱。但现有的医学知识图谱大都是从公开的医学文献和医学词典手册来获取知识,并没有涉及到基于lis系统真实检验数据的医学检验知识图谱构建与应用。因此,以检验科实际的lis记录为基础,借助专家的帮助,以及参考国际临床术语,构建医学检验知识图谱,借助知识图谱的良好的知识表示结构、高速的信息查询和深层次的关系推理等优点,将医学检验知识图谱应用于检验查询和合理检验两个方面,可作为医生的辅助查询工具,提高医生的工作效率,也开拓lis系统的应用场景。



技术实现要素:

本发明的目的是提供一种基于lis创建医学检验知识图谱的方法,利用医学检验文献与lis中的真实数据构建医学检验知识图谱,完善通用医学知识图谱,从而有效的辅助医生的工作,提高医生的工作效率,并将其应用于检验查询和合理检查,开拓lis系统的应用场景。

本发明解决其技术问题所采用的技术方案是:

一种基于lis的医学检验知识图谱构建方法,包括以下步骤:

s1:概念层设计

s11:设计医学检验实体e,即lis系统中唯一可标识的医学实体,包含检验患者实体、基本信息实体、预诊断实体和检验实体;

s12:构建实体概念树,以概念树的形式组织医学检验实体所包含的四级实体概念;

s13:定义医学检验实体关系r,将医学检验实体关系表示为检查中不同医学检验实体之间所发生的医疗事实联系即r{ei,ej};其中,ei和ej分别表示两个不同的医学检验实体;s14:定义基于lis系统的医学检验知识图谱g,其中所包含的临床检验信息由元数据组成,形式为<ei,r,ej>;

s2:实例层学习

s21:制定知识抽取规则,其中对于lis系统中非结构化文本数据,在知识抽取规则上,借助自然语言处理技术进行处理;

s22:根据步骤s21制定的知识抽取规则,将lis数据中的实体根据概念层进行实体链接,由此构造出实例层;

s23:将实体、关系和实体三元组加入实例层中。所述实例层是根据概念层进行数据实例化的结果,由医学检验实体与关系的三元组所组成;

s24:将步骤s23得到的三元组存储在neo4j图数据库中,形成医学检验知识图谱。

s3:lis知识图谱的应用s31:将lis知识图谱应用于检验查询,实现基于知识图谱三元组中任一要素搜索其它相关的信息;s32:将lis知识图谱应用于合理检验,通过推理关联发现临床医生所开的多个检验项目是否存在重复,从而进入警示与报错状态。

相较于现有技术,本发明具有以下有益效果:完善通用医学知识图谱,并借助知识图谱的良好的知识表示结构、高速的信息查询和深层次的关系推理等优点,将医学检验知识图谱应用于检验查询和合理检验两个方面,开拓lis系统的应用场景;作为医生的辅助查询工具,提高医生的工作效率。以下结合附图及实施例对本发明作进一步详细说明;但本发明的一种基于lis的医学检验知识图谱构建方法不局限于实施例。

附图说明

图1是基于医学检验知识图谱概念层设计(部分)的示意图;

图2是基于医学检验知识图谱层次结构的示意图;

图3是医学检验知识图谱概念层结构的示意图;

图4是医学检验知识图谱的可视化的示意图;

图5是医学检验知识的查询应用的示意图;

图6是医学检验知识的合理检验应用的示意图。

具体实施方式

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

本实施例,以医学检验中的血常规检查为例,表1为一位患者的lis记录。

表格1患者张三的血常规检验记录

参见图1至图4所示,本发明的一种基于lis的医学检验知识图谱构建方法,包括以下步骤:(1)概念层设计;(2)实例层学习;(3)lis知识图谱的应用。。

步骤1,概念层设计。

在医学检验知识图谱构建模块中,首先要做的就是对其概念层进行设计,从而得到整个图谱上的概念模板,基于此才能进行下一步实例层学习步骤。因此,概念层设计是知识图谱构建中必不可少的第一步。

步骤11:医学检验实体设计

首先给出医学检验实体的形式化定义。

定义1(医学检验实体e):医学检验实体e指的是lis系统中唯一可标识的医学实体。医学检验实体e包括检验患者实体、基本信息实体、预诊断实体和检验实体这四类概念。

用概念树的形式组织医学检验实体所包含的四级实体概念。一级实体概念(即根结点)是医学检验实体,二级实体概念包括基本信息,患者,检验,预诊断实体;三级实体概念是检验类别等,四级实体概念是检验项目等。另外,将其他具体的概念放入对应高层概念的子节点中。如将血常规、肝功等检查类别实体放在检验实体这个高层概念的子结点中。

步骤12:医学检验实体关系设计

首先给出医学检验实体关系的形式化定义。

定义2(医学检验实体的关系r):医学检验事实关系表示该检查中不同医学检验实体之间所发生的医疗事实联系即r{ei,ej},其中ei,ej为医学检验实体。各医学事实关系均有唯一标识的字段。

根据lis系统信息,设计出以下几种临床医学检验事实关系类型,具体包括了:

(1)subclass_of关系:表示实体a和实体b的之间的隶属关系。

(2)instance_of关系:表示实体a与实体b间的实例关系,即实体b是实体a的一个实例。

(3)attribute_of关系:表示实体a是实体b的属性值。

(4)diagnosis关系:表示病人实体a拥有诊断结果实体b。

(5)diseases关系:表示病名实体a与患者实体b之间的存在疾病关系。

(6)detect关系:表示检验实体子类实体a与患者实体b是检测关系。

在定义了上述临床医学检验实体和医学事实关系的基础上,基于lis系统的医学检验知识图谱的形式化定义如下:

定义3(医学检验知识图谱g):医学检验知识图谱包含大量的临床检验信息,这些信息由一条条的<ei,r,ej>形式的元数据所组成。其中ei,ej分别表示两个不同的医学检验实体。

综合以上,本发明创建的医学检验知识图谱概念层包含四级实体概念,概念层结构如图3。

步骤2,实例层学习。

步骤21:制定知识抽取规则

从lis系统记录中的结构化和半结构化数据进行知识抽取,其中对于lis系统中非结构化文本数据,如预诊断结论,由于其格式自由,在知识抽取规则上,借助自然语言处理技术进行处理;

步骤22:构造实例层

根据所制定的知识抽取规则,将lis数据中的实体根据概念层进行实体链接,由此构造出实例层。根据表格1,患者“张三”的lis数据记录可被映射到图1的概念层,实现实例化。比如,患者“张三”病例号属性值“46364062”可被映射到患者实体类,实现患者实体的实例化。同样,“张三”的姓名、性别和年龄可被映射到“基本信息”实体,实现实例化。与此类推,患者“张三”的其它lis数据记录都可以映射到图1的树形概念图中,实现医学检验概念图的一次实例化。

步骤3:构建医学检验知识图谱

将实体、关系和实体三元组加入实例层e中。所述实例层是根据概念层进行数据实例化的结果,由医学检验实体与关系的三元组所组成,并将三元组存储在neo4j图数据库中,形成医学检验知识图谱。

步骤3,lis知识图谱的应用。

构建完一定规模的医学检验知识图谱后,进一步探讨知识图谱的应用场景,并展示医学知识图谱在检验查询和合理检验两方面的应用。

对于检验查询,它能实现基于知识图谱三元组中任一要素搜索其它相关的信息。如图5所示展示了与“食管肿瘤”预诊断实体相关联的检验项目实体和标本实体,并进一步展示了检验项目实体的属性及其值。对于合理检验,它类似于查重与纠错,能发现临床医生所开的多个检验项目是否存在重复。如图6所示展示了,当“wbc”检验项与“plt”检验项同时存在于医生所开的检验项目中,医学检验知识图谱通过推理关联,进入警示与报错状态。

本发明构建的医学检验知识图谱具有良好的知识表示结构、高速的信息查询和深层次的关系推理等优点,作为医生的辅助查询工具,提高医生的工作效率,并开拓了lis系统的应用场景。由于lis数据具有时效性,时间越久,患者就诊记录越多,因此,医学检验知识图谱需要不断地更新与维护,新数据与原数据的融合更新也是本文未来的工作之一。

上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1