本发明涉及一种基于药物暴露的重症心力衰竭患者易损期内生存预测模型及其建立方法和应用,属于人工智能。
背景技术:
1、随着全球心力衰竭(heart failure,hf)患病率和入院率的增加,入住icu的hf患者在易损期内的死亡率居高不下。准确预测该类患者出院后的预后,有利于辅助医护人员及时调整诊疗计划,从而改善其生存率。临床预测模型作为精准医学代表之一,在医疗诊断治疗决策、病人预后管理以及公共卫生资源配置等方面的应用极为重要。其中,机器学习(machine learning,ml)和深度学习(deep learning,dl)等人工智能(artificialintelligence,ai)技术作为建立疾病诊断或预后评估模型的可靠手段,已经被推荐作为建立疾病诊断或预后评估模型的可靠手段。
2、由于药物治疗是帮助心衰患者稳定度过易损期的重要手段,其作为预测因子在一定程度上能减小预测误差,也可为临床决策者对出院后患者的用药策略制定提供参考。此外,相较于过度依赖设备的实验室指标或影像学数据,药物治疗信息易于获取、整理,适用范围更广、更容易被使用者接受。
技术实现思路
1、针对先有技术的不足,本发明提供一种基于药物暴露的重症心力衰竭患者易损期内生存预测模型及其建立方法和应用,通过获取方便、实用的药物治疗信息和部分人口学信息从而得到可解释的风险评估模型。
2、为实现上述发明目的,本发明采用了如下的技术方案:
3、第一方面,本发明提供一种基于药物暴露的重症心力衰竭患者易损期内生存预测模型的建立方法,包括以下步骤:
4、(1)从不同医疗中心数据库中收集重症心力衰竭患者住院治疗期间的6类基本临床信息、18类药物治疗信息和预后随访情况,组成构建模型的原始样本集;
5、(2)对原始数据进行初步加工、处理后,根据各个指标的缺失情况进行插补,随后进行归一化处理,去除量纲影响,从而减小数据的误差和偏差;
6、(3)数据划分:预处理完成后的数据集被分为训练集(70%)、内部验证集(30%)和两个外部验证集(a、b);
7、(4)特征选择:为了消除不必要的干扰,提高模型的准确性和稳定性,需要通过变量筛选来选择对目标结局有较大影响的自变量作为预测因子。在排除变量间的强相关性后,分别进行先单后多cox分析和lasso回归分析作为变量纳入参考;
8、(5)模型构建:coxph算法因其计算能力有限,筛选有效的变量进入模型不仅有助于提高模型的准确性与稳定性,还能节省大量的计算资源,故选用筛选后的变量进行构建。rsf和deepsurv算法比常规的算法具有更强的计算能力,可用于拟合高维度、非线性的统计关系,故可使用的全部变量特征均被纳入,并使用随机搜索进行超参数调优,根据auc指标评价结果选择最优参数并建立最优模型;
9、(6)模型验证:在内部和外部验证集中对模型的区分度、校准度、临床决策能力进行验证并可视化30天、60天、90天的预测性能;
10、(7)变量重要性分析:明确变量对结局预测的贡献,对模型合理性进一步确证。
11、本发明的第二目的是采用browser/server(浏览器/服务器)结构进行交互,提供一种基于药物暴露的重症心力衰竭患者易损期内生存预测系统,包括:患者信息的预输入模块、构建的生存预测模型、显示生存预测结果的显示模块。
12、本发明的第三目的是提供一种存储在计算机可读介质上的程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以应用基于药物暴露的重症心力衰竭患者易损期内生存预测系统。
13、本发明的有益效果如下:
14、1、本发明通过真实世界数据库收集患者基本临床信息以及患者在入院期间的抗心衰和辅助治疗药物使用情况等信息作为原始数据,首次利用药物的暴露时长作为预测因子,用于预测重症心衰患者在易损期内的生存状态,以备临床医生对重症心衰患者出院早期的风险进行评估,从而优化管理与治疗,也为后续其他疾病预测模型构建提供新的方向;
15、2、本发明采用browser/server(浏览器/服务器)结构进行交互,网页界面友好,为临床医生评估患者预后提供了简便、快捷的工具;
16、3、所构建的模型整体性能和30天、60天、90天预测性能都经过内部和外部验证,roc曲线、time-auc和brier分数均显示模型具有较好的区分度和校准度,dca曲线也显示该种模型具有临床实用价值;
17、4、对模型进行变量重要性分析分析,通过解释模型的工作机制或决策依据,从而评估变量对预测的贡献程度,进一步佐证模型合理性。
1.一种基于药物暴露的重症心力衰竭患者易损期内生存预测模型的建立方法,其特征在于,包括以下步骤:
2.如权利要求1所述的建立方法,其特征在于,步骤(1)所述的基本临床信息包括6类,分别是患者性别、bmi、年龄、种族、住院时长、住icu时长;所述的药物治疗信息包括18类,分别是:血管紧张素转化酶抑制剂、血管紧张素受体拮抗剂、β受体阻滞剂、强心苷、利尿剂、硝酸酯类、羟甲基戊二酰辅酶a还原酶抑制剂、钙离子拮抗剂、磷酸二酯酶抑制剂、质子泵抑制剂、h2受体拮抗剂、抗菌药物、抗血小板药、胰岛素、肝素、肾上腺素/多巴胺药、糖皮质激素、维生素k拮抗剂,并依据世界卫生组织官方分类系统——解剖学治疗学及化学分类系统进行分类;预后随访情况是重症心力衰竭患者出院后90天内的生存状态。
3.如权利要求1所述的建立方法,其特征在于,步骤(1)所述的药物治疗信息是抗心衰相关药物和辅助治疗药物的院内使用天数,本发明首次使用该类变量作为预测因子,也为后续其他疾病预测模型构建提供新的方向。
4.如权利要求1所述的建立方法,其特征在于,步骤(2)所述的数据预处理包括异常值处理、缺失值填补及归一化,其中使用“盖帽法”对异常值进行处理;使用多重插补法补齐缺失数据;使用最大值最小值归一化方法对部分连续变量(年龄、bmi、住院和住icu时长)进行归一化,为防止出现“0”值,根据以下公式进行处理:
5.如权利要求1所述的建立方法,其特征在于,步骤(4)中所述进行特征选择:1)进行pearson相关性分析,计算特征之间的相关系数:相关系数需小于0.7;2)根据患者生存时间和随访生存状态进行单因素cox分析,为避免遗漏有意义的变量,p<0.1的影响因素均被纳入多因素cox分析,最终计算各变量的风险比和95%置信区间;3)最小绝对收缩和选择算子(least absolute shrinkage and selection operator,lasso)回归通过生成一个惩罚函数对回归模型中的变量系数进行压缩,以实现防止过度拟合,解决严重共线性的问题。参考上述方法最终确定以下10个变量纳入coxph模型:年龄、bmi、住icu时长、血管紧张素转化酶抑制剂、血管紧张素受体拮抗剂、β受体阻滞剂、硝酸酯类、h2受体拮抗剂、抗菌药物、维生素k拮抗剂。
6.如权利要求1所述的建立方法,其特征在于,步骤(5)中所述的模型构建通过python3.7软件实现,coxph模型纳入筛选过的10个变量,机器学习和深度学习模型均纳入24个未经过筛选的变量,并通过随机搜索确定超参数:1)rsf模型:ntree和nodesize;2)deepsurv模型:激活函数为、dropout、lr、优化器。
7.如权利要求1所述的建立方法,其特征在于,步骤(6)中所述的模型预测性能分别在内部和外部数据集a、b中得到验证并可视化30天、60天、90天的预测能力。其中,模型区分度使用受试者工作特征曲线(receiver operating characteristic,roc)和time-auc曲线评判;模型校准度利用brier分数(brier score,bs)和综合brier分数(integrated brierscore,ibs)检验;临床实用性采用临床决策曲线(decision curveanalysis,dca)进行评估。
8.如权利要求1所述的建立方法,其特征在于,步骤(7)中所述的变量重要性分,coxph模型使用wald卡方值-自由度(χ2-df)的分析变量,rsf和deepsurv模型可解释性方法包括:基于排列的特征重要性和shap值,通过衡量变量对结局贡献进一步解释模型合理性。
9.一种基于药物暴露的重症心力衰竭患者易损期内生存预测系统,其特征在于,采用browser/server(浏览器/服务器)软件结构进行交互。包括:患者信息的预输入模块、由权利要求1所述的步骤构建的生存预测模型、显示生存预测结果的显示模块。
10.一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以应用如权利要求9所述基于药物暴露的重症心力衰竭患者易损期内生存预测系统。