基于GRU-ODE-Bayes脓毒血症模型构建及识别方法、装置及存储介质

文档序号:31949781发布日期:2022-10-26 07:42阅读:197来源:国知局
基于GRU-ODE-Bayes脓毒血症模型构建及识别方法、装置及存储介质
基于gru-ode-bayes脓毒血症模型构建及识别方法、装置及存储介质
技术领域
1.本发明涉及脓毒血症识别技术领域,具体涉及基于gru-ode-bayes脓毒血症模型构建及识别方法、装置及存储介质。


背景技术:

2.脓毒血症是一种病情凶险、死亡率高的疾病,是由细菌等病原微生物感染引起的人体全身炎症反应综合征,由于在重症监护室(icu)内,患者的病情复杂,发病急而隐匿,因此及时的识别与预测患者是否发生脓毒血症是降低患者死亡率的关键。但是在电子病历数据中,icu患者的数据常呈现出高维稀疏的特点,即指标干预的种类繁多,测量时间规律重复,数据的处理量大,而这种数据的处理一直是临床研究中的难点,常涉及缺失值填补以及变量筛选的问题。而目前蓬勃发展的人工智能技术为实现脓毒血症患者的识别提供了可能。


技术实现要素:

3.有鉴于此,本发明的目的在于提供基于gru-ode-bayes脓毒血症模型构建及识别方法、装置及存储介质,以解决现有技术中,脓毒血症患者的识别过程中,数据的处理量大,患者数据呈现出高维稀疏的特点的问题。
4.根据本发明实施例的第一方面,提供基于gru-ode-bayes脓毒血症模型构建方法,包括:从医院的重症监护及医院感染系统的数据库中获取患者数据;对患者数据进行变量以及特征的筛选,获取到包含筛选后的变量或特征的筛选数据;将所述筛选数据输入到搭建好的多个不同参数的gru-ode-bayes模型中,对多个不同参数的gru-ode-bayes模型进行训练,根据多个模型训练的输出结果选取最终的gru-ode-bayes模型。
5.优选地,所述对患者数据进行变量以及特征的筛选包括:在患者数据中,选取包含sepsis-3以及cdc算法中相关变量的数据,纳入筛选数据;对剩下的患者数据,采用统计学方法,判断是否满足正态性;满足正态性的情况下,采用t检验,通过对剩下的患者数据中重复抽样多次,对某特征值进行统计学检验后得到单次pm值,将每次获得的pm值相加后求其平均值,得到p值;再通过某特征的条数总和/患者的全数据条数,得到mr值;不满足正态性的情况下,采用mann whitney检验,得到p值,再通过某特征的条数总和/患者的全数据条数,得到mr值;
当p以及mr值满足预设的条件时,将包含该特征的患者数据纳入到筛选数据中。
6.优选地,所述根据多个模型训练的输出结果选取最终的gru-ode-bayes模型包括:多个模型训练的输出结果为曲线下面积、灵敏度、特异度、阳性预测值、阴性预测值以及f1值,选取曲线下面积、灵敏度、特异度以及阳性预测值综合最高的gru-ode-bayes模型作为最终的gru-ode-bayes模型。
7.优选地,还包括:对筛选数据中的人口学特征不做特殊处理,保留原始值;对筛选数据中的连续性数据进行归一化处理,使得数据值保持在统一水平;对筛选数据中的时序性数据构建标记特征;将处理后的筛选数据输入搭建好的多个不同参数的gru-ode-bayes模型中。
8.优选地,所述当p以及mr值满足预设的条件时,将包含该特征的患者数据纳入到筛选数据中包括:当p小于0.1以及mr小于0.99时,将包含该特征的患者数据纳入到筛选数据中。
9.根据本发明实施例的第二方面,提供基于gru-ode-bayes脓毒血症识别方法,包括:获取患者的数据,对患者数据进行变量以及特征的筛选;将包含筛选后的变量或特征的数据输入到搭建好的gru-ode-bayes脓毒血症模型中;gru-ode-bayes脓毒血症模型输出每一位患者被识别为患脓毒血症的概率p1及非脓毒血症的概率p0;取概率p1以及概率p0中更大的值作为结果,从而将患者分为脓毒血症发病患者或未发病患者。
10.根据本发明实施例的第三方面,提供基于gru-ode-bayes脓毒血症模型构建装置,包括:数据获取模块:用于从医院的重症监护及医院感染系统的数据库中获取患者数据;变量及特征筛选模块:用于对患者数据进行变量以及特征的筛选,获取到包含筛选后的变量或特征的筛选数据;最终gru-ode-bayes模型获取模块:用于将所述筛选数据输入到搭建好的多个不同参数的gru-ode-bayes模型中,对多个不同参数的gru-ode-bayes模型进行训练,根据多个模型训练的输出结果选取最终的gru-ode-bayes模型。
11.根据本发明实施例的第四方面,提供基于gru-ode-bayes脓毒血症识别装置,包括:筛选模块:用于获取患者的数据,对患者数据进行变量以及特征的筛选;输入模块:用于将包含筛选后的变量或特征的数据输入到搭建好的gru-ode-bayes脓毒血症模型中;输出模块:用于通过gru-ode-bayes脓毒血症模型输出每一位患者被识别为患脓毒血症的概率p1及非脓毒血症的概率p0;识别模块:用于取概率p1以及概率p0中更大的值作为结果,从而将患者分为脓毒血症发病患者或未发病患者。
12.根据本发明实施例的第五方面,提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被主控器执行时,实现上述方法中的各个步骤。
13.本发明的实施例提供的技术方案可以包括以下有益效果:本技术通过从医院的重症监护及医院感染系统的数据库中获取患者数据;对患者数据进行变量以及特征的筛选,再将筛选变量或特征的数据输入到搭建好的多个不同参数的gru-ode-bayes模型中,由于对数据进行了特征及变量的筛选,最终输入到gru-ode-bayes模型的数据量明显减少,同时对患者的数据有充分的利用,本技术选用gru-ode-bayes模型来识别脓毒血症,gru-ode-bayes模型是在gru模型的基础上,利用常微分方程(ode)方程解决相邻时点的模型更新问题,利用贝叶斯方法更新对零星观测的模型参数,通过gru-ode-bayes模型,可以在一些稀疏的非规律时序性的医疗数据进行检测或预测研究时,同时保障数据的利用度和对复杂疾病的识别效果。
14.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
15.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
16.图1是根据一示例性实施例示出的基于gru-ode-bayes脓毒血症模型构建方法的流程示意图;图2是根据一示例性实施例示出的特征拓展示意图;图3是根据另一示例性实施例示出的基于gru-ode-bayes脓毒血症识别方法的流程示意图;图4是根据另一示例性实施例示出的基于gru-ode-bayes脓毒血症模型构建装置的系统示意图;图5是根据另一示例性实施例示出的基于gru-ode-bayes脓毒血症识别装置的系统示意图;图6是根据另一示例性实施例示出的gru-ode-bayes模型的结构示意图;图7是根据另一示例性实施例示出的gru-ode-bayes模型的原理示意图;附图中:1-数据获取模块,2-变量及特征筛选模块,3-最终gru-ode-bayes模型获取模块,4-筛选模块,5-输入模块,6-输出模块,7-识别模块。
具体实施方式
17.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
18.实施例一图1是根据一示例性实施例示出的,如图1所示,基于gru-ode-bayes脓毒血症模型构建方法,该方法包括:
s1,从医院的重症监护及医院感染系统的数据库中获取患者数据;s2,对患者数据进行变量以及特征的筛选,获取到包含筛选后的变量或特征的筛选数据;s3,将所述筛选数据输入到搭建好的多个不同参数的gru-ode-bayes模型中,对多个不同参数的gru-ode-bayes模型进行训练,根据多个模型训练的输出结果选取最终的gru-ode-bayes模型;可以理解的是,本技术通过从医院的重症监护及医院感染系统的数据库中获取患者数据,对患者数据进行变量以及特征的筛选,获取到包含筛选后的变量或特征的筛选数据,所有的患者数据中,只有包含与脓毒血症相关变量以及特征的数据是有意义的,对数据进行变量以及特征的筛选可以有效的减少数据的处理量,将所述筛选数据输入到搭建好的多个不同参数的gru-ode-bayes模型中,对多个参数的gru-ode-bayes模型进行训练,根据多个模型训练的输出结果选取最终的gru-ode-bayes模型,值得强调的是,gru (gate recurrent unit)模型是循环神经网络的一种变体,其数据输入与输出的结构与普通的循环神经网络相似,但是其内部是通过控制门来实现对过去时间点的信息利用和模型参数的优化,与长短时间记忆神经网络模型相比,由于gru仅有重置门和更新门,可在保证预测效果的同时减少计算负担,提高计算效率。而gru-ode-bayes-ode-bayes(gate recurrent unit ordinary differential equation bayes)是在gru模型的基础上,利用常微分方程(ode)方程解决相邻时点的模型更新问题,利用贝叶斯方法更新对零星观测的模型参数。通过这种方法框架,可以在一些稀疏的非规律时序性的医疗数据进行检测或预测研究时,同时保障数据的利用度和对复杂疾病的识别效果,尤其是脓毒血症。
19.优选地,所述对患者数据进行变量以及特征的筛选包括:在患者数据中,选取包含sepsis-3以及cdc算法中相关变量的数据,纳入筛选数据;对剩下的患者数据,采用统计学方法,判断是否满足正态性;满足正态性的情况下,采用t检验,通过对剩下的患者数据中重复抽样多次,对某特征值进行统计学检验后得到单次pm值,将每次获得的pm值相加后求其平均值,得到p值;再通过某特征的条数总和/患者的全数据条数,得到mr值;不满足正态性的情况下,采用mann whitney检验,得到p值,再通过某特征的条数总和/患者的全数据条数,得到mr值;当p以及mr值满足预设的条件时,将包含该特征的患者数据纳入到筛选数据中;可以理解的是,对患者数据进行变量以及特征的筛选主要是通过文献法以及统计学方法,文献法指的是,将现有技术中的sepsis-3以及cdc算法中,包含有脓毒血症相关变量的数据,直接纳入到筛选数据中,cdc算法是指美国疾病预防控制中心(cdc)提出的一种基于医院电子病历数据库的监测算法,该算法对患者感染以及器官衰竭的定义以及发生的时间有着严格的定义,虽准确性高,但敏感性低,数据处理过程繁琐。由于过于严格的定义导致大量的脓毒血症患者无法被识别。例如,在我国顶级医疗机构中,该脓毒血症算法的敏感性仅为6%;sepsis-3指的是国际工作者针对感染的失控及宿主反应所致的危及生命的器官功能障碍的疾病定义;
统计学方法则是将文献法筛选之后的患者数据,判断是否满足正态性,对于满足正态性的,采用t检验,亦称student t检验(student's t test),主要用于样本含量较小(例如n 《 30),总体标准差σ未知的正态分布数据,通过对剩下的患者数据中重复抽样多次,对某特征值进行统计学检验后得到单次pm值,将每次获得的pm值相加后求其平均值,得到p值;再通过某特征的条数总和/患者的全数据条数,得到mr值;对于不满足正态性的,采用mann whitney检验方法,直接得到p值,再通过某特征的条数总和/患者的全数据条数,得到mr值,对于满足p和mr满足预设条件的,将其纳入到筛选数据中,实现对患者数据的变量以及特征的筛选,减少后续模型的处理量,提高模型识别的效率。
20.优选地,所述根据多个模型训练的输出结果选取最终的gru-ode-bayes模型包括:多个模型训练的输出结果为曲线下面积、灵敏度、特异度、阳性预测值、阴性预测值以及f1值,选取灵敏度、特异度以及阳性预测值综合最高的gru-ode-bayes模型作为最终的gru-ode-bayes模型;可以理解的是,提前设置多个gru-ode-bayes模型的学习参数以及超参数,将筛选数据输入到多个gru-ode-bayes模型中,对模型进行训练,由于模型的参数不同,输出的结果也不同,gru-ode-bayes模型会输出曲线下面积、灵敏度、特异度、阳性预测值、阴性预测值以及f1值这五项数值,对于脓毒血症识别来说,曲线下面积、灵敏度、特异度以及阳性预测值更为重要,所以本技术在所有模型中,选取曲线下面积、灵敏度、特异度以及阳性预测值这四项综合最高的模型作为最终的gru-ode-bayes模型。
21.优选地,还包括:对筛选数据中的人口学特征不做特殊处理,保留原始值;对筛选数据中的连续性数据进行归一化处理,使得数据值保持在统一水平;对筛选数据中的时序性数据构建标记特征;将处理后的筛选数据输入搭建好的多个不同参数的gru-ode-bayes模型中;可以理解的是,如附图2所示,对获取的包含筛选后的特征以及变量的数据进行特征拓展,对基本的人口学特征不做特殊处理,保留原始值,对实验室检查以及生命监测体征等连续性数据进行归一化处理,即使数据值保持在统一水平,对用药、手术以及是否进行某项检查等时序性数据构建新的标记特征,表达患者是否在某一时刻接受某项治疗或检查的信息。
22.优选地,所述当p以及mr值满足预设的条件时,将包含该特征的患者数据纳入到筛选数据中包括:当p小于0.1以及mr小于0.99时,将包含该特征的患者数据纳入到筛选数据中;可以理解的是,本技术中,对于p以及mr的预设条件为p小于0.1且mr小于0.99,满足预设条件的情况下,排除其中肯定无临床意义的特征,不满足预设条件的情况下,纳入可能有临床意义的特征。
23.实施例二根据本实施例示出的基于gru-ode-bayes脓毒血症模型构建方法,如附图3所示,该方法包括:
s101,获取患者的数据,对患者数据进行变量以及特征的筛选;s201,将包含筛选后的变量或特征的数据输入到搭建好的gru-ode-bayes脓毒血症模型中;s301,gru-ode-bayes脓毒血症模型输出每一位患者被识别为患脓毒血症的概率p1及非脓毒血症的概率p0;s401,取概率p1以及概率p0中更大的值作为结果,从而将患者分为脓毒血症发病患者或未发病患者;可以理解的是,将确定参数的gru-ode-bayes模型应用到全院患者的识别中,将在上述模型构建过程中使用的筛选的变量与特征构建方法在全院数据中重复并获得新的测试数据集,在对全数据集进行预测时,在每一个时刻模型都可以输出一个状态并传导至下一个时刻,在最终时刻即为对患者的预测结果;值得说明的是,如附图6以及附图7所示,患者的预测结果会实时进行更新,其更新的公式如下所示:式中,σ为sigmoid函数,wr是重置门内的权重矩阵,br是重置门的偏置;wz是更新门的权重矩阵,bz是更新门的偏置;wh是指当前输入信息的权重矩阵,bh是当前输入信息的偏置,h
t-1
代表上一个时间点的信息,ur是上一步信息的权重,br表示随机误差,

代表hadamard乘积也就是操作矩阵中相对应的元素相乘, g
t
代表当前时点的记忆内容,h
t
表示当前时点的隐藏状态,其中r
t
代表重置门,z
t
代表更新门,这两个门代表了gru对患者既往时刻包含信息的利用情况,
△ht
指相较于上一时刻状态的变化情况,随后利用常微分方程得到一个较快更新状态的公式,并利用贝叶斯思想补充零散观察值所带来的结果改变;最终通过softmax方法,将预测值转换为针对患者是否患脓毒血症的概率pi,其计算公式如下所示:即将最终获得的状态ht通过多层感知机(multilayer perceptron, mlp)转换为两个标签的预测值xj,再通过softmax过程转换为[0,1]范围内的概率值pi,即通过上述公式计算得到的是否患病签的概率,将最终获得每一位患者最终时刻被识别为患脓毒血症的概率p1及非脓毒血症的概率p0进行比较,取概率更大(max{ p1,p0})的标签作为结果,从而将患者分为脓毒血症发病和未发病患者。
[0024]
实施例三:
本实施例提供基于gru-ode-bayes脓毒血症模型构建装置,如附图4所示,包括:数据获取模块1:用于从医院的重症监护及医院感染系统的数据库中获取患者数据;变量及特征筛选模块2:用于对患者数据进行变量以及特征的筛选,获取到包含筛选后的变量或特征的筛选数据;最终gru-ode-bayes模型获取模块3:用于将所述筛选数据输入到搭建好的多个不同参数的gru-ode-bayes模型中,对多个不同参数的gru-ode-bayes模型进行训练,根据多个模型训练的输出结果选取最终的gru-ode-bayes模型;可以理解的是,本技术通过数据获取模块1从医院的重症监护及医院感染系统的数据库中获取患者数据,通过变量及特征筛选模块2对患者数据进行变量以及特征的筛选,获取到包含筛选后的变量或特征的筛选数据,所有的患者数据中,只有包含与脓毒血症相关变量以及特征的数据是有意义的,对数据进行变量以及特征的筛选可以有效的减少数据的处理量,通过最终gru-ode-bayes模型获取模块3将所述筛选数据输入到搭建好的多个不同参数的gru-ode-bayes模型中,对多个不同参数的gru-ode-bayes模型进行训练,根据多个模型训练的输出结果选取最终的gru-ode-bayes模型。
[0025]
实施例四:本实施例提供基于gru-ode-bayes脓毒血症识别装置,包括:筛选模块4:用于获取患者的数据,对患者数据进行变量以及特征的筛选;输入模块5:用于将包含筛选后的变量或特征的数据输入到搭建好的gru-ode-bayes脓毒血症模型中;输出模块6:用于通过gru-ode-bayes脓毒血症模型输出每一位患者被识别为患脓毒血症的概率p1及非脓毒血症的概率p0;识别模块7:用于取概率p1以及概率p0中更大的值作为结果,从而将患者分为脓毒血症发病患者或未发病患者;可以理解的是,本技术中,通过筛选模块4获取患者的数据,对患者数据进行变量以及特征的筛选,通过输入模块5将包含筛选后的变量或特征的数据输入到搭建好的gru-ode-bayes脓毒血症模型中,输出模块6通过gru-ode-bayes脓毒血症模型输出每一位患者被识别为患脓毒血症的概率p1及非脓毒血症的概率p0,通过识别模块7:用于取概率p1以及概率p0中更大的值作为结果,从而将患者分为脓毒血症发病患者或未发病患者。
[0026]
实施例五:本实施例提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被主控器执行时,实现上述方法中的各个步骤;可以理解的是,上述提到的存储介质可以是只读存储器,磁盘或光盘等可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
[0027]
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
[0028]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部
分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
[0029]
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0030]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0031]
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0032]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0033]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0034]
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1