本发明涉及数据处理技术领域,尤其涉及一种病历质量评估方法及计算设备。
背景技术:
病历(又称病案),是医务人员对患者疾病的发生、发展、转归进行检查、诊断、治疗等医疗活动过程中所形成的资料的总和。病历质量控制是医疗质量管理的重要组成部分。书写完整、规范的病历可以保证病案的真实性、及时性、客观性以及医疗行为的可追溯性,从而提高医疗管理水平,预防以及减少医疗纠纷。
病历主要包括门(急)诊病历和住院病历两大类,其中,住院病历进一步包括入院记录、病程记录等。在入院记录和首次病程记录中,通常记载有患者的基本信息、主诉、病史、诊疗经过、诊断、鉴别诊断等信息,其中,鉴别诊断指的是根据患者的诊断内容,与其他疾病进行鉴别,并排除其他疾病的可能的诊断。在临床上,疾病是千变万化的,症状表现也是错综复杂的。在做鉴别诊断时,应选择与被鉴别疾病有一定共同点的疾病作为鉴别诊断的疾病,并注明二者的共同点和区别点(即鉴别要点)。
鉴别诊断是医生在临床诊断过程中必须思考的内容,是不断明确、明晰患者健康状态的必要过程,并需要将具体的分析以文字形式书写于病案之中,既是对思考过程的再次提炼,亦是作为医疗质量评价和临床教学分析的重要依据。然而目前,医生在书写鉴别诊断内容时往往套用鉴别诊断模板,将临床科室经常面对的疾病形成标准话术,复制粘贴到病历之中,导致实际记载的鉴别诊断分析与实际情况不符、与患者的实际诊断无法区分、没有针对患者的临床表现具体分析等问题,以至于无法体现临床思维过程,甚至无法确定医生是否对患者进行了必要的鉴别诊断,从而导致医疗质量下降,引发不必要的医疗纠纷甚至医疗事故。同样回顾性分析病历的时候,也无法充分反映诊疗过程中临床医生的思维分析,无法作为提升医疗质量、医学教学的依据和案例。
为了避免出现上述问题,医务人员需要对医生记载于病历中的鉴别诊断分析进行质控,保证鉴别诊断的书写质量。目前,鉴别诊断的质控通常由质控人员人工完成,但鉴别诊断的质控需要全科医学能力和丰富的临床经验,对质控人员的医学水平要求很高。医院的专职的质控人员紧缺、专业能力有限,而专科医生临床工作已然过多,亦不适合对自身的病历进行质控。因此通过人工的方法对种类繁多的鉴别诊断内容进行质控,成本高、质控效率和覆盖率很低,难以对大量患者的病历进行全面质检并准确排查其中的质量问题。并且,随着医疗纠纷预防的要求不断增加,病历质控的需求与时效性也变得非常紧迫。人数有限的质控人员无法消化基数庞大且不断增加的病历,导致鉴别诊断质控覆盖率低,医疗安全、医疗纠纷存在众多隐患,影响医疗质量。此外,人工质控易受疲劳、人情等人为因素影响,标准不统一,难以满足质控要求。
因此,需要提供一种病历质量评估方法,以对病历中的鉴别诊断进行自动化、高效、全面的质控,提高医疗安全与医疗质量监管的效率。
技术实现要素:
为此,本发明提供一种病历质量评估方法及计算设备,以力图解决或至少缓解上面存在的问题。
根据本发明的第一个方面,提供一种病历质量评估方法,在计算设备中执行,包括:获取待进行质量评估的病历文本,所述病历文本包括诊疗事实信息和鉴别诊断信息;对所述诊疗事实信息进行结构化以生成第一诊疗信息,对所述鉴别诊断信息进行结构化以生成第二诊疗信息;将所述第二诊疗信息与所述第一诊疗信息进行比对;当第二诊疗信息中同时存在与所述第一诊疗信息相符和不符的信息内容时,判断所述鉴别诊断信息的质量合格;否则,判断所述鉴别诊断信息存在质量缺陷。
可选地,在根据本发明的病历质量评估方法中,诊疗事实信息包括:主诉、现病史、既往史、家族史、个人史、诊疗经过、体格检查中的至少一种;所述鉴别诊断信息包括:鉴别诊断的疾病名称和依据。
可选地,在根据本发明的病历质量评估方法中,结构化的步骤包括:对待结构化的信息进行分词;对分词后的信息进行命名实体识别,以确定每个词的语义标签;根据所述语义标签来确定词之间的语义关联;以及根据所述语义关联来生成结构化的诊疗信息。
可选地,在根据本发明的病历质量评估方法中,分词、命名实体识别、确定词之间的语义关联的步骤采用预设的自然语言处理模型来实现。
可选地,在根据本发明的病历质量评估方法中,将所述第二诊疗信息与所述第一诊疗信息进行比对的步骤包括:判断第二诊疗信息与第一诊疗信息是否存在相同的信息内容;若存在相同的信息内容,则分别判断每一对相同的信息内容的事实状态是否相同,若事实状态相同,则判断该对相同的信息内容相符;若事实状态不同,则判断该对相同的信息内容不符;若不存在相同的信息内容,则判断第二诊疗信息中不存在与第一诊疗信息相符或不符的信息内容。
可选地,在根据本发明的病历质量评估方法中,信息内容包括症状和检查,所述症状的事实状态包括所述症状是否存在;所述检查的事实状态包括所述检查的检查结果。
可选地,在根据本发明的病历质量评估方法中,还包括步骤:当判断所述鉴别诊断信息存在质量缺陷时,输出所述鉴别诊断信息未结合病历特点的提示消息。
可选地,在根据本发明的病历质量评估方法中,判断所述鉴别诊断信息存在质量缺陷的步骤包括:根据诊断知识图谱来对第二诊疗信息进行补充,以得到第三诊疗信息;将所述第三诊疗信息与所述第一诊疗信息进行比对;当第三诊疗信息中同时存在与所述第一诊疗信息相符和不符的信息内容时,判断鉴别诊断的依据不完整,并输出应补充鉴别诊断依据的提示消息;当第三诊疗信息中的所有信息内容均与所述第一诊疗信息相符时,判断所述鉴别诊断信息有误,并输出不应将其列为鉴别诊断,而应作为诊断的提示消息;当第三诊疗信息中仅存在与所述第一诊疗信息不符的信息内容、或仅存在部分与所述第一诊疗信息相符的信息内容、或既不存在与第一诊疗信息相符的信息内容内容也不存在与第一诊疗信息不符的信息内容时,根据预设的诊断算法来判断所述鉴别诊断信息的质量缺陷。
可选地,在根据本发明的病历质量评估方法中,诊断知识图谱中存储有多个疾病的诊断信息,所述根据诊断知识图谱来对第二诊疗信息进行补充,以得到第三诊疗信息的步骤包括:从诊断知识图谱中获取与鉴别诊断的疾病名称相关的局部知识图谱;将第一诊疗信息中存在且第二诊疗信息中不存在的信息项目作为目标信息项目,将所述局部知识图谱中对应于所述目标信息项目的诊断信息补充至第二诊疗信息中,以得到第三诊疗信息。
可选地,在根据本发明的病历质量评估方法中,根据预设的诊断算法来判断所述鉴别诊断信息的质量缺陷的步骤包括:采用预设的诊断算法来确定所述第一诊疗信息所对应的疾病集合;若所述鉴别诊断信息中的疾病名称属于所述疾病集合,则判断所述鉴别诊断信息缺少问诊和/或体格检查的支撑,并输出所缺少的问诊和/或体格检查的内容;若所述鉴别诊断信息中的疾病名称不属于所述疾病集合,则判断所述鉴别诊断信息有误,并输出所述疾病集合。
可选地,在根据本发明的病历质量评估方法中,还包括步骤:当所述鉴别诊断信息中的疾病名称属于所述疾病集合时,获取与所述疾病名称相关的局部知识图谱,通过对比所述局部知识图谱和所述第一诊疗信息来确定所缺少的问诊和/或体格检查的内容。
根据本发明的第二个方面,提供一种计算设备,包括:至少一个处理器;和存储有程序指令的存储器,当所述程序指令被所述处理器读取并执行时,使得所述计算设备执行上述病历质量评估方法。
根据本发明的第三个方面,提供一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行上述病历质量评估方法。
本发明的技术方案能够对病历中的鉴别诊断信息进行质量评估,判断鉴别诊断信息是否存在质量缺陷,从而保证病历的质量。
进一步地,当判断鉴别诊断信息存在质量缺陷时,输出质量缺陷的类型和原因分析,以便相关人员对鉴别诊断信息进行核查、补充、修改,使之符合质量要求。
本发明的技术方案实现了对鉴别诊断的自动化质控,与人工病历质控方案相比,标准统一,不受疲劳、人情等人为因素的影响,大幅提高了质控效率和覆盖率,降低了质控成本,提高了医疗安全与医疗质量监管的效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的计算设备100的示意图;
图2示出了根据本发明一个实施例的病历质量评估方法200的流程图;
图3示出了根据本发明一个实施例的现病史的分词结果的示意图;
图4示出了根据本发明一个实施例的现病史的命名实体识别结果的示意图;
图5示出了根据本发明一个实施例的现病史的语义关联结果的示意图;
图6示出了根据本发明一个实施例的第一诊疗信息的示意图;
图7示出了根据本发明一个实施例的第二诊疗信息的示意图;
图8示出了根据本发明一个实施例的与心绞痛相关的局部知识图谱的示意图;
图9示出了根据本发明一个实施例的补充后的第三诊疗信息的示意图;
图10示出了根据本发明一个实施例的采用诊断算法来确定疾病集合,以及输出所缺少的问诊和/或体格检查的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
针对现有技术中存在的病历中的鉴别诊断书写不规范的问题,本发明提供一种病历质量评估方法,能够对病历中的鉴别诊断信息进行自动化、高效、全面的质量评估,判断鉴别诊断信息是否存在质量缺陷,从而保证病历的质量,提高医疗安全与医疗质量监管的效率。
本发明的病历质量评估方法在计算设备中执行。计算设备可以是任意具有存储和计算能力的设备,其通常实现为桌面电脑、笔记本电脑等个人配置的计算机。在一些实施例中,计算设备也可以是手机、平板电脑、智能可穿戴设备、物联网设备等终端设备,但不限于此。
图1示出了根据本发明一个实施例的计算设备100的示意图。需要说明的是,图1所示的计算设备100仅为一个示例,在实践中,用于实施本发明的病历质量评估方法的计算设备可以是任意型号的设备,其硬件配置情况可以与图1所示的计算设备100相同,也可以与图1所示的计算设备100不同。实践中用于实施本发明的病历质量评估方法的计算设备可以对图1所示的计算设备100的硬件组件进行增加或删减,本发明对计算设备的具体硬件配置情况不做限制。
如图1所示,在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μp)、微控制器(μc)、数字信息处理器(dsp)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(alu)、浮点数单元(fpu)、数字信号处理核心(dsp核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如ram)、非易失性存储器(诸如rom、闪存等)或者它们的任何组合。计算设备中的物理内存通常指的是易失性存储器ram,磁盘中的数据需要加载至物理内存中才能够被处理器104读取。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上由一个或多个处理器104利用程序数据124执行指令。操作系统120例如可以是linux、windows等,其包括用于处理基本系统服务以及执行依赖于硬件的任务的程序指令。应用122包括用于实现各种用户期望的功能的程序指令,应用122例如可以是浏览器、即时通讯软件、软件开发工具(例如集成开发环境ide、编译器等)等,但不限于此。当应用122被安装到计算设备100中时,可以向操作系统120添加驱动模块。
在计算设备100启动运行时,处理器104会从存储器106中读取操作系统120的程序指令并执行。应用122运行在操作系统120之上,利用操作系统120以及底层硬件提供的接口来实现各种用户期望的功能。当用户启动应用122时,应用122会加载至存储器106中,处理器104从存储器106中读取并执行应用122的程序指令。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个a/v端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个i/o端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(rf)、微波、红外(ir)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
在根据本发明的计算设备100中,应用122包括用于执行本发明的病历质量评估方法200的指令,该指令可以指示处理器104执行本发明的病历质量评估方法200,对病历中的鉴别诊断信息进行自动化、高效、全面的质控。
应当指出,用于执行本发明的病历质量评估方法200的指令例如可以实现为安装于计算设备100中的客户端应用、通过浏览器应用进行访问的网页、浏览器插件等,本发明对用于执行病历质量评估方法200的指令在计算设备100中的存在形式不做限制。
图2示出了根据本发明一个实施例的病历质量评估方法200的流程图。方法200在计算设备(例如前述计算设备100)中执行,用于对病历中的鉴别诊断信息进行自动化、高效、全面的质控。如图2所示,方法200始于步骤s210。
在步骤s210中,获取待进行质量评估的病历文本,病历文本包括诊疗事实信息和鉴别诊断信息。
在本发明的实施例中,病历文本例如可以是包括鉴别诊断信息的入院记录、首次病程记录等。鉴别诊断信息包括鉴别诊断的疾病名称以及将该疾病名称列为鉴别诊断的依据。
除了鉴别诊断信息之外,病历文本中还包括在患者就诊过程中产生的、用于帮助医务人员确定鉴别诊断的基础事实信息,在本发明的实施例中,将这种信息记为诊疗事实信息。诊疗事实信息例如可以包括患者的主诉、现病史、既往史、家族史、个人史、诊疗经过、体格检查等信息,但不限于此。
在一个实施例中,病历文本为入院记录,入院记录中包括现病史、既往史、诊疗经过、体格检查等诊疗事实信息和鉴别诊断信息。其中,现病史和鉴别诊断信息例如如下:
现病史:
患者2年余前无明显诱因下出现胸闷,表现为胸前区持续性闷胀不适感,无胸痛,无气促感,自述胸闷持续存在,与活动无关,无头晕黑朦,无视物旋转,无恶心呕吐。2年来患者未予重视,未寻求诊疗。6天前患者至我院门诊,07-27查心脏多普勒超声示:心脏大小形态结构功能血流未见明显异常;08-02查运动平板试验提示阳性(运动前窦性心律st-t改变,运动后st-tⅱⅲavfv4-6较运动前缺血性压低0.05-0.1mv>2分钟)。为求进一步诊疗,门诊拟“胸闷待查”收住入院。病来患者神志清,精神可,胃纳可,睡眠可,二便无殊,体重无明显变化。
鉴别诊断信息:
1、心绞痛:心绞痛是冠脉供血不足,心肌急剧、暂时缺血,与缺氧所引起的以发作性胸痛或胸部不适为主要表现的临床综合征,特点为前胸阵发性、压榨性疼痛,可伴有其他症状,疼痛主要位于胸骨后,可放射至心前区与左上肢,劳动或情绪激动后常发生,每次发作持续3~5分钟,休息或服用硝酸脂类可缓解。
2、急性心肌梗死:痛部位与心绞痛相仿,但性质更剧烈,持续时间多超过30分钟,可长达数小时,心电图中面向梗死部位的导联st段抬高,及或同时有异常q波。
3、肋间神经痛:疼痛常累及1-2个肋间,但并不一定局限在胸前,为刺痛或灼痛,多为持续性而非发作性,咳、用力呼吸和身体转动可使疼痛加剧,沿神经行径处有压痛,手臂上举活动时局部有牵拉疼痛。
4、胃食管反流:系因胃食管过度接触(或暴露于)胃液而引起的临床胃食管反流症和食管黏膜损伤的疾病,临床常表现为胃灼热感和反酸,吞咽困难和吞咽疼痛,食管ph24小时动态监测或胃镜检查常可确诊。
步骤s210获取到待进行质量评估的病历文本后,执行步骤s220。
在步骤s220中,对诊疗事实信息进行结构化以生成第一诊疗信息,对鉴别诊断信息进行结构化以生成第二诊疗信息。
应当指出,步骤s210中获取到的病历文本通常为非结构化数据,不便于进行分析和处理。因此,在步骤s220中,对病历文本中的诊疗事实信息、鉴别诊断信息分别进行结构化处理,从中提取出多个信息字段及其对应的信息内容,以便于后续对鉴别诊断信息进行质量评估。
根据一种实施例,按照以下步骤s222~s228对诊疗事实信息或鉴别诊断信息进行结构化:
在步骤s222中,对待结构化的信息进行分词。
待结构化的信息即为病历文本中的诊疗事实信息或鉴别诊断信息。步骤s222的执行结果是将文本信息(字序列)拆分成由多个词所组成的词序列。
应当指出,本发明不限制步骤s222所采用的分词算法,任意分词算法均在本发明的保护范围之内。例如,分词算法可以是基于词典(字符串匹配)的方法、基于统计的方法(例如n-gram模型等)、基于规则的方法、基于机器学习模型的方法等,但不限于此。根据一种实施例,为了提高分词的准确性,步骤s222采用预设的自然语言处理模型来实现,该模型由医疗领域的语料(例如大量真实病历、医学教材等)学习生成,以使分词结果更加准确。
例如,对上文给出的现病史进行分词,得到的分词结果如图3所示。在图3中,词与词之间采用空格隔开。
在步骤s222得到分词结果后,执行步骤s224。
在步骤s224中,对分词后的信息进行命名实体识别,以确定每个词的语义标签。
语义标签的数量和种类可以由本领域技术人员结合医疗场景自行设置,本发明对语义标签的具体设置情况不做限制。根据一种实施例,语义标签包括症状、诱因、行为、体征、状态、程度、检查项目、数值、单位、否定词、具体日期、模糊日期等多种。
应当指出,本发明不限制步骤s224所采用的命名实体识别算法,任意命名实体识别算法均在本发明的保护范围之内。根据一种实施例,命名实体识别可以由预设的自然语言处理模型来实现,自然语言处理模型例如可以是基于双向长短期记忆网络(bi-lstm)和条件随机场(crf)的模型、隐马尔科夫模型等,但不限于此。该模型例如可以采用已标注了各个词的语义标签的医疗领域语料训练得出。
例如,基于图3所示的分词结果,对现病史进行命名实体识别,以得到每个词的语义标签,各词的语义标签如图4所示。如图4所示,经过命名实体识别,确定“患者”一词的语义标签为“社会关系”,“2年余前”一词的语义标签为“模糊日期”,“无”一词的语义标签为“否定词”,等。
在步骤s224识别出各个词的语义标签后,执行步骤s226。
在步骤s226中,根据语义标签来确定词之间的语义关联。
步骤s226提取词之间的语义关联性。例如,经过步骤s224,识别出了标签分别为症状、日期、程度、诱因的多个词,步骤s226则用于确定每个症状、日期、程度、诱因之间的对应关系。
应当指出,本发明不限制步骤s226所采用的语义关联提取算法,任意语义关联提取算法均在本发明的保护范围之内。根据一种实施例,词之间的语义关联性可以采用预设的自然语言处理模型来提取,该模型例如可以采用已标注了各词的语义标签以及词之间的语义关联性的医疗领域的语料训练得出。
例如,基于图4所确定的语义标签来提取各词之间的语义关联性,语义关联提取结果如图5所示。由图5可见,经过语义关联提取,确定“2年余前”与“胸闷”存在语义关联,并且“2年余前”为“胸闷”症状发生的模糊日期;“无”与“诱因”存在语义关联,并且“无”否定了“诱因”的存在状态;“明显”与“诱因”存在语义关联,并且“明显”表示“诱因”的程度;等等。
需要说明的是,如上文所述,分词、命名实体识别、语义关联提取的步骤均可以采用预设的自然语言处理模型来实现,但本发明不限制这三个步骤所采用的模型的数量以及结构。例如,分词、命名实体识别、语义关联提取的步骤可以采用三个不同的模型来分别实现,也可以采用一个整体模型来实现。或者,也可以将分词和命名实体识别的步骤采用一个模型来实现,该模型可以采用已分词并且标注了各词的语义标签的医疗领域语料训练得出;语义关联提取的步骤采用另一个模型来实现,该模型可以采用已标注了各词的语义标签以及词之间的语义关联性的医疗领域的语料训练得出。
在步骤s226确定各词的语义关联后,执行步骤s228。
在步骤s228中,根据语义关联来生成结构化的诊疗信息。
基于步骤s226所得到的各词的语义关联性,可以提取出待结构化的信息中出现的各种症状及其存在状态、时间、部位、性质、频率、诱因等属性,以及各种检查项目的检查结果。
例如,按照前述步骤s222~s228,对入院记录(病历文本)中的诊疗事实信息(包括现病史、既往史、家族史、个人史、体格检查等)和“心绞痛”这一鉴别诊断信息分别进行结构化,得到第一诊疗信息和第二诊疗信息,分别如图6和图7所示。
图6示出了对入院记录中的诊疗事实信息进行结构化所得到的第一诊疗信息。其中,虚线框中的诊疗信息为由图3~图5中的现病史内容提取得出,其他信息则分别由既往史、家族史、个人史、体格检查中提取得出。图6中,阳性症状表示存在的症状(例如,患者存在胸闷症状),阴性症状表示不存在的症状(例如,患者不存在胸痛、气促、头晕黑朦等症状)。
图7示出了对入院记录中的“心绞痛”这一鉴别诊断信息进行结构化所得到的第二诊疗信息。
在步骤s220得到结构化的第一诊疗信息和第二诊疗信息后,执行步骤s230。
在步骤s230中,将第二诊疗信息与第一诊疗信息进行比对。
根据一种实施例,将第二诊疗信息与第一诊疗信息进行比对的步骤包括:判断第二诊疗信息与第一诊疗信息是否存在相同的信息内容,若存在相同的信息内容,则分别判断每一对相同的信息内容的事实状态是否相同,若事实状态相同,则判断该对相同的信息内容相符;若事实状态不同,则判断该对相同的信息内容不符;若不存在相同的信息内容,则判断第二诊疗信息中不存在与第一诊疗信息相符或不符的信息内容。
根据一种实施例,诊疗信息中的信息内容包括症状和检查,其中,症状的事实状态包括症状是否存在(即,是阳性症状还是阴性症状);检查的事实状态包括该项检查的检查结果。
经过步骤s230的比对,可以得到以下四种比对结果中的任意一种:
1、第二诊疗信息中同时存在与第一诊疗信息相符和不符的信息内容;
2、第二诊疗信息中仅存在与第一诊疗信息相符的信息内容;
3、第二诊疗信息中仅存在与第一诊疗信息不符的信息内容;
4、第二诊疗信息中既不存在与第一诊疗信息相符的信息内容,也不存在与第一诊疗信息不符的信息内容(即,第二诊疗信息中不存在与第一诊疗信息相同的信息内容)。
例如,图7所示的第二诊疗信息与图6所示的第一诊疗信息仅存在一项相同的信息内容——“胸痛”。但在第一诊疗信息中,“胸痛”为阴性症状,即不存在胸痛;而在第二诊疗信息中,“胸痛”是心绞痛疾病的主要症状,即存在胸痛。因此,第二诊疗信息中的“胸痛”与第一诊疗信息中的“胸痛”不符,第二诊疗信息与第一诊疗信息的比对结果为上述比对结果3,即,第二诊疗信息中仅存在与第一诊疗信息不符的信息内容。
在得到比对结果后,执行步骤s240,根据比对结果来评估鉴别诊断信息的质量。
在步骤s240中,判断第二诊疗信息中是否同时存在与第一诊疗信息相符和不符的信息内容。当第二诊疗信息中同时存在与第一诊疗信息相符和不符的信息内容时,判断鉴别诊断信息质量合格;否则,判断鉴别诊断信息存在质量缺陷。
应当指出,一项合格的鉴别诊断应当与患者的实际诊疗情况既有相符的部分,也有不符的部分。因此,当第二诊疗信息中同时存在与第一诊疗信息相符和不符的信息内容时(对应于上述比对结果1),判断鉴别诊断信息质量合格。否则(对应于上述比对结果2~4),判断鉴别诊断信息存在质量缺陷。
例如,经过步骤s230的比对,得到图7所示的第二诊疗信息中仅存在与图6所示的第一诊疗信息不符的信息内容(即“胸痛”),因此,判断图7对应的鉴别诊断信息,即“心绞痛”这一鉴别诊断存在质量缺陷。
根据一种实施例,当判断鉴别诊断信息存在质量缺陷时,输出鉴别诊断信息未结合病历特点的提示消息,以便相关医务人员核查病历缺陷并及时修改。
根据一种实施例,当判断出鉴别诊断信息存在质量缺陷时,可以进一步执行下述步骤s250~s270,以确定质量缺陷的具体类型和原因分析,以便相关人员对鉴别诊断信息进行核查、补充、修改,使之符合质量要求。
在步骤s250中,根据诊断知识图谱来对第二诊疗信息进行补充,以得到第三诊疗信息。
诊断知识图谱中存储有多个疾病的诊断信息,诊断信息包括疾病的常见症状、体征、致病机理、检查(包括体格检查和辅助检查)等,但不限于此。
根据一种实施例,步骤s250进一步按照以下步骤实施:从诊断知识图谱中获取与鉴别诊断的疾病名称相关的局部知识图谱;将第一诊疗信息中存在且第二诊疗信息中不存在的信息项目作为目标信息项目,将局部知识图谱中对应于目标信息项目的诊断信息补充至第二诊疗信息中,以得到第三诊疗信息。
例如,对于“心绞痛”这一鉴别诊断,从诊断知识图谱中获取与“心绞痛”相关的局部知识图谱,如图8所示。随后,基于图8所示的局部知识图谱,对图7所示的第二诊疗信息进行补充,以得到第三诊疗信息。
应当指出,诊断知识图谱中存储有症状、体征、致病机理、检查等多项诊断信息,本发明对向第二诊疗信息中补入的具体信息项目不做限制。根据一种实施例,为了使补充得到的第三诊疗信息能够尽可能出现与第一诊疗信息相符或不符的信息内容,优选地,根据第一诊疗信息中的信息项目来确定向第二诊疗信息中补入哪些信息。具体地,将第一诊疗信息中存在且第二诊疗信息中不存在的信息项目作为目标信息项目,将局部知识图谱中对应于目标信息项目的诊断信息补充至第二诊疗信息中,以得到第三诊疗信息。
例如,在图6所示的第一诊疗信息中存在“辅助检查”这一信息项目,而图7中不存在这项信息,因此,将局部知识图谱中的与“心绞痛”的辅助检查相关的信息补充至第二诊疗信息中,得到如图9所示的补充后的第三诊疗信息。图9中虚线矩形框中示出的内容为根据局部知识图谱补充的信息内容,包括allen’s试验、运动平板试验、心电图、冠脉ct等心绞痛的辅助检查项及相应的检查结果值。
在对第二诊疗信息进行补充,得到第三诊疗信息后,执行步骤s260。
在步骤s260中,将第三诊疗信息与第一诊疗信息进行比对。
第三诊疗信息与第一诊疗信息的比对过程与前述步骤s230所述的第二诊疗信息与第一诊疗信息的比对过程类似。即,首先判断二者是否存在相同的信息内容,若存在相同的信息内容,再进一步根据信息内容的事实状态来判断信息内容是否相符。
具体比对过程及其实施例可以参考前述步骤s230,此处不再赘述。
经过步骤s260的比对,可以得到以下四种比对结果中的任意一种:
1、第三诊疗信息中同时存在与第一诊疗信息相符和不符的信息内容;
2、第三诊疗信息中仅存在与第一诊疗信息相符的信息内容,这种结果进一步包括2a和2b两种情况:
2a、第三诊疗信息中的全部信息内容均与第一诊疗信息相符;
2b、第三诊疗信息中仅有部分信息内容与第一诊疗信息相符;
3、第三诊疗信息中仅存在与第一诊疗信息不符的信息内容;
4、第三诊疗信息中既不存在与第一诊疗信息相符的信息内容,也不存在与第一诊疗信息不符的信息内容(即,第二诊疗信息中不存在与第一诊疗信息相同的信息内容)。
例如,图9所示的第三诊疗信息与图7所示的第一诊疗信息的相同信息内容包括“胸痛”、“allen’s试验”和“运动平板试验”。对于“胸痛”,第一诊疗信息中“胸痛”为阴性症状,即不存在胸痛;而在第三诊疗信息中,“胸痛”是心绞痛疾病的主要症状,即存在胸痛。因此,第三诊疗信息中的“胸痛”与第一诊疗信息中的“胸痛”不符。对于“allen’s试验”和“运动平板试验”,第一诊疗信息和第三诊疗信息中的试验结果均为阳性,因此,第三诊疗信息中的“allen’s试验”和“运动平板试验”与第一诊疗信息中的“allen’s试验”和“运动平板试验”相符。综上,第三诊疗信息中同时存在与第一诊疗信息相符和不符的信息内容,即第三诊疗信息与第一诊疗信息的比对结果为上述比对结果1。
在得到比对结果后,执行步骤s270,根据比对结果来更细致地评估鉴别诊断信息的质量,确定质量缺陷的类型和可能的原因。
在步骤s270中,根据第三诊疗信息与第一诊疗信息的比对结果来判断鉴别诊断信息的质量缺陷类型:
当第三诊疗信息中同时存在与第一诊疗信息相符和不符的信息内容时(对应于步骤s260中的比对结果1),判断鉴别诊断的依据不完整,并输出应补充鉴别诊断依据的提示消息。
第二诊疗信息中不同时存在与第一诊疗信息相符和不符的信息内容,经过知识图谱补充后的第三诊疗信息中有了与第一诊疗信息相符和不符的信息内容,因此说明原鉴别诊断信息中没有清楚地注明鉴别要点,鉴别诊断信息不全,输出补充鉴别诊断依据的提示消息,以提醒相关人员对鉴别诊断信息进行核查、补充,说明鉴别要点。
例如,图6所示的第二诊疗信息中仅存在于第一诊疗信息不符的信息内容,经过知识图谱补充后,图9的第三诊疗信息中同时存在了与第一诊疗信息相符和不符的信息内容,因此说明鉴别诊断信息不全,输出相应的提示消息以提醒相关医务人员进一步完善鉴别诊断信息。
当第三诊疗信息中的全部信息内容均与第一诊疗信息相符时(对应于步骤s260中的比对结果2a),判断鉴别诊断信息有误,并输出不应将其列为鉴别诊断,而应作为诊断的提示消息。
如果第三诊疗信息中的全部信息内容均与第一诊疗信息相符,则说明当前的鉴别诊断不应当被列为鉴别诊断,而应该是真正的诊断结果。这种情况下,输出不应将其列为鉴别诊断,而应作为诊断的提示消息,以提示相关人员对病历中的诊断和鉴别诊断信息进行核查和修改。
当第三诊疗信息中仅存在部分与第一诊疗信息相符的信息内容、或仅存在与第一诊疗信息不符的信息内容、或既不存在与第一诊疗信息相符的信息内容也不存在与第一诊疗信息不符的信息内容时(对应于步骤s260中的比对结果2b、3、4),根据预设的诊断算法来判断鉴别诊断信息的质量缺陷。
当步骤s260出现上述2b~4的比对结果时,说明可能存在医务人员选择的鉴别诊断有误,或者患者缺少问诊或检查内容的情况。在这种情况下,需要结合预设的诊断算法来判断鉴别诊断信息的质量缺陷。
根据一种实施例,根据预设的诊断算法来判断鉴别诊断信息的质量缺陷的步骤包括:采用预设的诊断算法来确定第一诊疗信息所对应的疾病集合;若鉴别诊断信息中的疾病名称属于疾病集合,则判断鉴别诊断信息缺少问诊和/或体格检查的支撑,并输出可能缺少的问诊和/或体格检查的内容;若鉴别诊断信息中的疾病名称不属于疾病集合,则判断鉴别诊断信息有误,并输出疾病集合。
在本发明的实施例中,预设的诊断算法以第一诊疗信息为输入,适于对第一诊疗信息进行分析处理,输出第一诊疗信息所对应的可能的疾病和各疾病的怀疑程度。需要说明的是,本发明对诊断算法不做限制,只要某种算法可以输出第一诊疗信息所对应的疾病,该算法即在本发明的保护范围之内。
在采用预设的诊断算法确定第一诊疗信息对应的可能的疾病集合后,若鉴别诊断信息中的疾病名称属于该疾病集合,则判断鉴别诊断信息缺少问诊和/或体格检查的支撑,并输出可能缺少的问诊和/或体格检查的内容。根据一种实施例,所缺少的问诊和/或体格检查的内容可以通过结合知识图谱来确定,即:当鉴别诊断信息中的疾病名称属于诊断算法输出的疾病集合时,获取与疾病名称相关的局部知识图谱,通过对比局部知识图谱和第一诊疗信息来确定所缺少的问诊和/或体格检查的内容并输出,以提示相关医务人员应该关注的问诊和/或检查点。
例如,图10示出了诊断算法输出的疾病集合及其怀疑程度,以及所缺少的问诊和/或体格检查的示意图。图10左上角为对病历文本中的诊疗事实信息进行结构化所得到的第一诊疗信息。采用预设的诊断算法对第一诊疗信息进行处理,输出第一诊疗信息对应的可能的疾病(即图10虚线矩形框中的“怀疑诊断”)及其怀疑程度。根据诊断算法所输出的可能的疾病,结合诊断知识图谱,可以得出所缺少的问诊和/或体格检查的内容,如图10右下角所示。
若鉴别诊断信息中的疾病名称不属于诊断算法所输出的疾病集合中,则认为所列出的鉴别诊断信息有误,不再继续对该鉴别诊断进行评估,而输出疾病集合,对当前第一诊疗信息对应的可能的疾病进行提示,以便相关医务人员对鉴别诊断信息进行检查和修改。
本发明的技术方案能够对病历中的鉴别诊断信息进行质量评估,判断鉴别诊断信息是否存在质量缺陷,从而保证病历的质量。进一步地,当判断鉴别诊断信息存在质量缺陷时,输出质量缺陷的类型和原因分析,以便相关人员对鉴别诊断信息进行核查、补充、修改,使之符合质量要求。
本发明的技术方案实现了对鉴别诊断的自动化质控,与人工病历质控方案相比,标准统一,不受疲劳、人情等人为因素的影响,大幅提高了质控效率和覆盖率,降低了质控成本,提高了医疗安全与医疗质量监管的效率。
a9、如a8所述的方法,其中,所述诊断知识图谱中存储有多个疾病的诊断信息,
所述根据诊断知识图谱来对第二诊疗信息进行补充,以得到第三诊疗信息的步骤包括:
从诊断知识图谱中获取与鉴别诊断的疾病名称相关的局部知识图谱;
将第一诊疗信息中存在且第二诊疗信息中不存在的信息项目作为目标信息项目,将所述局部知识图谱中对应于所述目标信息项目的诊断信息补充至第二诊疗信息中,以得到第三诊疗信息。
a10、如a8所述的方法,其中,所述根据预设的诊断算法来判断所述鉴别诊断信息的质量缺陷的步骤包括:
采用预设的诊断算法来确定所述第一诊疗信息所对应的疾病集合;
若所述鉴别诊断信息中的疾病名称属于所述疾病集合,则判断所述鉴别诊断信息缺少问诊和/或体格检查的支撑,并输出所缺少的问诊和/或体格检查的内容;
若所述鉴别诊断信息中的疾病名称不属于所述疾病集合,则判断所述鉴别诊断信息有误,并输出所述疾病集合。
a11、如a10所述的方法,还包括步骤:
当所述鉴别诊断信息中的疾病名称属于所述疾病集合时,获取与所述疾病名称相关的局部知识图谱,通过对比所述局部知识图谱和所述第一诊疗信息来确定所缺少的问诊和/或体格检查的内容。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、u盘、软盘、cd-rom或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的病历质量评估方法。
以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。
在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的而非限制性的,本发明的范围由所附权利要求书限定。