新型冠状肺炎与流感肺炎的初筛诊断方法,系统和设备与流程

文档序号:22681919发布日期:2020-10-28 12:44阅读:351来源:国知局
新型冠状肺炎与流感肺炎的初筛诊断方法,系统和设备与流程

本发明涉及医学诊断领域,具体涉及一种新型冠状肺炎与流感肺炎的初筛诊断方法,系统和设备。



背景技术:

covid-19肺炎的主要临床表现与严重急性呼吸综合征(severeacuterespiratorysyndrome,sars)和中东呼吸综合征(middleeastrespiratorysyndrome,mers)类似,为发热、咳嗽和气促等。肺部影像学检查是重要的辅助诊断方式之一,然而肺部影像学表现特点则为典型的病毒性肺炎特点,早期表现主要为双肺胸膜下斑片状磨玻璃影,与季节性流感等病毒性肺炎在影像学上无法区分和鉴别诊断。

与季节性流感相比,covid-19的病死率更高,sars-cov-2病毒的传播力更强,其对人群带来的威胁以及诊疗所需的医疗资源也更高,但covid-19的暴发季与流感季重叠,主要症状和体征、影像学检查结果相似。特别是对于基层或者许多医疗资源欠发达的地区。这些地区,甚至哪怕是发达国家,也会出现医疗资源挤兑,造成核酸检测能力饱和的严峻态势,难以应对covid-19与季节性流感的同时爆发流行的分诊,会极大影响当地医疗资源的合理分配。因此如何在诊疗资源有限的前提下,形成和储备快速的分诊工具和鉴别手段,对于covid-19与季节性流感所致的肺炎进行快速的识别与初筛,从而合理的进行医疗资源分配和采取正确的防控措施极为重要和关键。



技术实现要素:

本发明的目的是提供一种新型冠肺炎用与流感肺炎的初筛诊断方法,装置和设备,可基于简单的个人症状体征和血常规检验指标,构建了能够快速识别和区分新型冠肺炎和甲型流感肺炎的工具。

为了达到上述目的,本发明一方面提供一种新型冠状肺炎与流感肺炎的初筛诊断方法,包括以下步骤:

获取新冠肺炎患者和流感肺炎患者的临床指标数据;

利用logistic回归模型比较两组数据各项指标的or值,识别出存在差异的临床指标;

采用随机森林模型对识别后的临床指标的影响权重进行排序,根据排序结果获取高权重的临床指标作为评估新冠肺炎的风险因素;

将患者按4:1随机分为训练集和测试集,训练集根据所述排序结果选取临床指标用以构建分类回归树模型,所述分类回归树模型基于各临床指标或各临床指标的组合建立了决策树,所述测试集用以验证所述分类回归树模型的输出结果。

进一步的,所述新冠肺炎患者和流感肺炎患者的临床指标数据包括患者的人口学特征、临床症状和体征、血常规以及血生化检查结果。

进一步的,统计临床指标数据并将变量指标进行转换描述,包括:

将临床指标数据中非确定性指标的统计结果与医学参考值进行比较,生成低于参考值,正常和高于参考值三种结果;

将临床指标数据中连续变量指标的统计结果转换为四分位数间距(iqr),并以中位数进行表示;

将临床指标数据中离散变量指标的统计结果转换为概率分布值进行表示。

进一步的,基logistic回归模型和随机森林模型筛选出所述临床指标数据中高权重的临床指标,其中:

临床症状和体征中选取第一天最高体温、呼吸道症状出现频率、咳嗽;

血常规指标中选取嗜酸细胞绝对值、红细胞压积、单核细胞百分比;

血生化指标中选取低密度脂蛋白胆固醇、c反应蛋白、肌酸激酶。

进一步的,建立第一决策树模型,所述第一决策树模型以所述临床指标数据作为节点区分新冠肺炎患者和甲型流感肺炎患者,其中第一节点为低密度脂蛋白胆固醇、第二节点为肌酸激酶、第三节点为呼吸道症状出现频率、第四节点为入院第一天最高体温。

进一步的,建立第二决策树模型,所述第二策树模型以所述临床指标数据作为节点区分新冠肺炎患者和甲型流感肺炎患者,其中第一节点为嗜酸细胞绝对值、第二节点为单核细胞百分比、第三节点为红细胞压积、第四节点为入院第一天最高体温、第五节点为呼吸道症状出现频率。

进一步的,采用混淆矩阵(confusionmatrix)和roc曲线下面积(auc)验证所述第一模型和第二模型,确定新型冠状肺炎与流感肺炎的初筛的最优模型。

另一方面,本发明还提供一种新型冠状肺炎与流感肺炎的初筛诊断系统,包括:

数据获取单元,用以获取新冠肺炎患者和流感肺炎患者的临床指标数据;

临床指标识别单元,用以利用logistic回归模型比较两组数据各项指标的or值,识别出存在差异的临床指标;

临床指标评估单元,用以采用随机森林模型对识别后的临床指标的影响权重进行排序,根据排序结果获取高权重的临床指标作为评估新冠肺炎的风险因素;

诊断模型建立单元,将患者按4:1随机分为训练集和测试集,训练集根据所述排序结果选取临床指标用以构建分类回归树模型,所述分类回归树模型基于各临床指标或各临床指标的组合建立了决策树,所述测试集用以验证所述分类回归树模型的输出结果。

另一方面,本发明还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上述方法的步骤。

另一方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如上述方法的步骤。

本发明提供一种新型冠状肺炎与流感肺炎的初筛方法,装置和系统,基于患者临床症状体征、血常规及血生化检验指标,构建了能够快速识别和区分新型冠状肺炎和甲型流感肺炎的工具,最终根据诊断能力生成最优模型和次优模型,最优模型具备快速精确的初筛能力,次优模型针对欠发达地区医疗资源不能承担血生化检测时,提供基于个人症状体征和血常规构建的初筛识别工具,从而为医疗和公共卫生防控资源的有效投入提供辅助。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一个实施例的新型冠状肺炎与流感肺炎的初筛方法的方法流程图;

图2a和图2b是本发明一个实施例的随机森林模型的变量重要性度量表。

图3是本发明一个实施例的第一决策模型的树状结构图。

图4是本发明一个实施例的第二决策模型的树状结构图。

图5a是本发明一个实施例的第一决策模型的混淆矩阵图。

图5b是本发明一个实施例的第一决策模型的roc曲线下面积图。

图6a是本发明一个实施例的第二决策模型的混淆矩阵图。

图6b是本发明一个实施例的第二决策模型的roc曲线下面积图。

图7是本发明一个实施例的新型冠状肺炎与流感肺炎的初筛系统的系统架构图。

图8是本发明一个实施例的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。

图1是本发明一个实施例的新型冠状肺炎与流感肺炎的初筛方法的方法流程图,如图1所示,本发明的新型冠状肺炎与流感肺炎的初筛方法包括以下步骤:

s1,获取新冠肺炎患者和流感肺炎患者的临床指标数据。

s2,利用logistic回归模型比较两组数据各项指标的or值,识别出存在差异的临床指标。

s3,采用随机森林模型对识别后的临床指标的影响权重进行排序,根据排序结果获取高权重的临床指标作为评估新冠肺炎的风险因素。

s4,将患者按4:1随机分为训练集和测试集,训练集根据所述排序结果选取临床指标用以构建分类回归树模型,所述分类回归树模型基于各临床指标或各临床指标的组合建立了决策树,所述测试集用以验证所述分类回归树模型的输出结果。

在步骤s1中,新冠肺炎患者和流感肺炎患者的临床指标数据包括患者的人口学特征、临床症状和体征、血常规以及血生化检查结果。

在一个具体的实施例中,共纳入306名患者的人口学特征、临床症状和体征、血常规以及血生化检查结果。其中,其中包括151例covid-19成人患者和155例甲型流感成人患者,中位年龄分别为43岁和39岁。

其中人口学特征包括患者的年龄、性别,饮酒与否,吸烟与否,已婚。

临床症状和体征包括患者的入院第一天体温、入院第一天最高体温、入院第二天最高体温、入院第三天最高体温、入院第一至三天最高体温、呼吸道症状出现频率、发热、咳嗽、呼吸困难、气喘、口干、咳痰、咽痛、胸闷、胸痛、腹泻、头疼、头晕、流涕、鼻塞、肌肉酸痛、恶心呕吐、咽痒、乏力、收缩压、舒张压。

血常规指标包括患者的白细胞计数、中性粒细胞百分比、淋巴细胞百分比、单核细胞百分比、嗜酸细胞百分比、噬碱细胞百分比、中性粒细胞绝对值、淋巴细胞绝对值、单核细胞绝对值、嗜酸细胞绝对值、噬碱细胞绝对值、红细胞计数、血红蛋白浓度、红细胞压积、平均红细胞体积、平均红细胞血红蛋白量、平均红细胞血红蛋白浓度、红细胞分布宽度、血小板计数、血小板平均体积、血小板平均宽度、血小板比积。

血生化指标包括患者的总蛋白、白蛋白、前白蛋白、球蛋白、白球比、谷丙转氨酶、谷草转氢酶、谷草谷丙、γ-谷氨酰转肽酶、碱性磷酸酶、血清总胆汁酸、甘胆酸测定、总胆红素、直接胆红素、间接胆红素、尿素氮、肌酐、胱抑素c、尿酸、视黄醇结合蛋白、内生肌酐清除率、葡萄糖、总胆固醇、甘油三脂、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、载脂蛋白a1、载脂蛋白b、脂蛋白a、肌酸激酶、肌酸激酶同工酶、乳酸脱氢酶、α-羟丁酸脱氢酶、同型半胱氨酸、钠、氯、钙、磷、镁、c反应蛋白。

在步骤s2中,获取患者的临床指标数据后,通过logistic回归模型将临床指标数据中非确定性指标的统计结果与医学参考值进行比较,生成低于参考值,正常和高于参考值三种结果;

将临床指标数据中连续变量指标的统计结果转换为四分位数间距(iqr),并以中位数进行表示;

将临床指标数据中离散变量指标的统计结果转换为概率分布值进行表示。

在一个具体的实施例中,经过比较,在人口学特征中,年龄在151例covid-19成人患者和155例甲型流感成人患者之间差异无统计学意义,中位年龄分别为43岁(iqr29-56)和39岁(iqr28-60)。但与甲型流感成人患者相比,成年男性患covid-19的风险更高,是女性的1.9倍。

在临床症状和体征中,虽然两种疾病均会引起患者发热(甲型流感发热患者占比94.2%,covid-19发热患者占比为82.1%),但根据体温数据显示,甲型流感肺炎患者入院第一天体温和前三天每日最高体温均比covid-19患者体温更高。covid-19患者相比甲型流感肺炎患者更容易出现腹泻(or=7.2,95%ci:1.9~46.6),而甲型流感肺炎患者的呼吸道症状出现频率更高(or=0.4,95%ci:0.3~0.5),主要表现为咳嗽、咳痰、流涕、咽痛、胸闷、气喘。

在血常规以及血生化检查中,患者入院时的全血细胞计数显示,covid-19患者更容易引起白细胞计数减少(or=1.3,95%ci:0.7~2.6),淋巴细胞计数减少(or=3.3,95%ci:2.0~5.4),嗜酸性粒细胞计数减少(or=79.0,95%ci:28.2~330.3),红细胞平均血红蛋白浓度升高(or=6.2,95%ci:2.7~16.9)和血小板计数减少(or=5.4,95%ci:2.2~16.4)

大部分患者的肝功能处于正常水平,但出现丙氨酸氨基转氨酶(alt)升高(or=2.5,95%ci:1.2~5.5)和天冬氨酸氨基转移酶(ast)升高(or=2.6,95%ci:1.4~5.3)感染covid-19风险高。而肝代谢指标结果显示,低密度脂蛋白浓度升高是感染covid-19的保护性因素(or=0.2,95%ci:0.1~0.4)。covid-19患者比甲型流感肺炎患者更容易出现心肌酶谱异常,表现为肌酸激酶降低(or=19.8,95%ci:6.9~83.8)和乳酸脱氢酶升高(or=1.7,95%ci:1.1~2.7)。在感染相关的指标中,大多数患者均会引起c-反应蛋白浓度升高(236/291[81.1%]),但甲型流感肺炎患者c-反应蛋白浓度升高(93.8%)风险高于covid-19患者(68.3%)(or=0.1,95%ci=0.0-0.3)。

在步骤s3中,通过logistic回归模型和随机森林模型,对识别后的临床指标的影响权重进行排序,根据排序结果获取高权重的临床指标作为评估新冠肺炎的风险因素。

在具体的一个实施例中,如图2a和图2b所示,经过模型的排序,新冠肺炎患者和甲型流感肺炎患者的临床指标重要度排序通过平均精度下降(meandecreaseaccuracy)和gini指数(meandecreasegini)两种变量重要性度量排序。

经过重要度排序后,在在临床症状和体征中选取入院第一天最高体温(t.day1.max)、呼吸道症状出现频率(res.)、咳嗽(cough);在血常规和血生化指标中选取嗜酸细胞绝对值(eo#)、红细胞压积(hct)、单核细胞百分比(momo%),低密度脂蛋白胆固醇(ldl)、c反应蛋白(cysc)、肌酸激酶(ck),作为建立模型的训练数据。

在步骤s4中,首先将经过重要度排序筛选的临床症状和体征、血常规和血生化指标数据建立训练集和测试集。训练集用以建立决策树(cart)模型对245名患者的临床指标数据进行分类。测试集用以对建立的模型进行验证。

在一个具体的实施例中,本发明从筛选后的临床症状和体征、血常规和血生化指标数据中选取指标建立训练集以训练第一决策树模型,通过对第一决策树模型的验证确定检测效果最好的第一决策树模型作为最优模型。第二模型的训练集从临床症状和体征、血常规指标中选取,通过对第二决策树模型确定检测效果最好的第二决策树模型作为次优模型。此外,本发明还根据临床症状和体征、血常规和血生化指标数据分别建立第三决策树模型、第四决策树模型和第五决策树模型,并建立综合三项临床指标数据的总体决策树模型,以对第一决策树模型和第二决策树模型进行交叉验证。

图3是本发明一个实施例的第一决策模型的树状结构图。如图3所示,该决策树模型的每个节点均包括了患者总数,新冠肺炎患者数(cases),甲型流感患者数(cases)和患者的类别判断(class)。第一决策树模型的根节点node0,包括245个患者,其中121人为新冠肺炎患者124人为甲型流感肺炎患者。

在本实施例中,第一检测模型的第一节点node1和第二节点node2为根节点node0的子节点形成两个决策分支。其中,第一节点node1为患者的低密度脂蛋白胆固醇(ldl)降低,该指标为分类新冠肺炎患者的最优决策指标。第二节点node2为患者的低密度脂蛋白胆固醇(ldl)正常或升高。

在本实施例中,第三节点node3和第四节点node4作为第二节点node2的子节点,形成两个决策分支以分类低密度脂蛋白胆固醇(ldl)正常或升高的患者。第三节点node3为患者的肌酸酶(ck)指标正常,第四节点node4为患者的肌酸酶(ck)指标降低,该指标是分类新冠肺炎患者的次优决策指标。

在本实施例中,第五节点node5和第六节点node6为第三节点node3的子节点,形成两个决策分支以分类肌酸酶(ck)指标正常的患者,第五节点node5为患者的呼吸道症状出现频率(res.)大于等于3次,该指标是分类新冠肺炎患者的第三优选指标,第六节点node6为患者的呼吸道症状出现频率(res.)小于3次。

在本实施例中,第7节点node7和第8节点node8为第六节点node6的子节点,形成两个决策分支以分类呼吸道症状出现频率(res.)小于3次的患者,第7节点node7为入院第一天最高体温(t.day1.max)小于38℃,该指标最终将患者分类为新冠肺炎患者,第8节点node8为入院第一天最高体温(t.day1.max)大于等于38℃,该指标最终将患者分类为甲型流感肺炎患者。

图4是本发明一个实施例的第二决策模型的树状结构图。如图4所示,该第二决策树模型的每个节点均包括了患者总数,新冠肺炎患者数(cases),甲型流感患者数(cases)和患者的类别判断(class)。第二决策树模型的根节点node0包括245个患者,其中121人为新冠肺炎患者124人为甲型流感肺炎患者。

在本实施例中,第一节点node1和第二节点node2为根节点node0的子节点,形成两个决策分支。其中,第一节点node1为患者的嗜酸细胞绝对值(eo#)降低,该指标为分类新冠肺炎患者的最优决策指标。第二节点为患者的嗜酸细胞绝对值(eo#)正常。

在本实施例中,第三节点node3和第四节点node4作为第二节点node2的子节点,形成两个决策分支以分类嗜酸细胞绝对值(eo#)正常的患者。其中,第三节点node3为患者的单核细胞百分比(momo%)正常,第四节点node4为患者的单核细胞百分比(momo%)升高或降低,该指标为分类新冠肺炎患者的次优决策指标。

在本实施例中,第五节点node5和第六节点node6为第三节点node3的子节点,形成两个决策分支以分类单核细胞百分比(momo%)正常的患者。其中,第五节点node5为患者的红细胞压积(hct)降低,该指标为分类新冠肺炎患者的第三优选决策指标。第六节点node6为患者的红细胞压积(hct)正常。

在本实施例中,第7节点node7和第8节点node8为第六节点node6的子节点,形成两个决策分支以分类红细胞压积(hct)正常的患者的。其中,第7节点node7为患者入院第一天最高体温(t.day1.max)大于等于37℃,第8节点node8为患者入院第一天最高体温(t.day1.max)小于37℃,该指标为分类新冠肺炎患者的第四优选决策指标。

在本实施例中,第9节点node9和第10节点node10为第7节点node7的子节点,形成两个决策分支以分类入院第一天最高体温(t.day1.max)大于等于37℃的患者。其中,第9节点node9为患者的呼吸道症状出现频率(res.)小于1次,该指标最终将患者分类为新冠肺炎患者。第10节点node10为患者的呼吸道症状出现频率(res.)大于等于1次,该指标最终将患者分类为甲型流感肺炎患者。

在本发明的一个实施例中,为验证模型的分类效果,采用61名患者的临床检验数据对模型进行验证。

图5a是本发明一个实施例的第一决策模型的混淆矩阵图。图5b是本发明一个实施例的第一决策模型的roc曲线下面积图。如图5a和图6a所示,显示了第一决策模型的对测试集患者的分类结果与真实结果的区别,可见第一决策模型分类全部的新冠肺炎患者,但有4名甲型流感肺炎患者被错分为新冠肺炎患者。第一决策模型的模型灵敏度为1.00,特异度为0.87,阳性预测值为0.88,阴性预测值为1.00。模型a的roc曲线显示,auc值为0.93。

图6a是本发明一个实施例的第二决策模型的混淆矩阵图,图6b是本发明一个实施例的第二决策模型的roc曲线下面积图。如图6a和图6b所示,显示了第二决策模型的对测试集患者的分类结果与真实结果的区别,可见第二决策模型分类了全部的新冠肺炎患者,但8名甲型流感肺炎患者被错分为新冠肺炎患者。模型灵敏度为0.73,特异度为1.00,阳性预测值为1.00,阴性预测值为0.79。roc曲线显示,auc值为0.87。

根据与其他决策模型的对比,第一决策模型对新冠肺炎患者和甲型流感肺炎患者的预测能力最佳,特别是当需要预测该患者为新冠肺炎患者时,能够最大程度减少漏诊,为最优模型。第二决策模型对新冠肺炎患者和甲型流感肺炎患者的预测能力良好,为次优模型。

本方法通过构建基于个人临床体质、血常规指标和血生化指标的新冠肺炎患者和甲型流感肺炎患的初步筛选诊断模型,根据模型分类诊断能力分为最优模型和次优模型。次优模型是考虑到血常规为更经济、普遍的实验室技术,因此更适用于基层和欠发达地区。最优模型分类诊断更准确、灵敏、稳健,可为临床快速分诊提供技术支撑。

图7是本发明一个实施例的新型冠状肺炎与流感肺炎的初筛系统的系统架构图。如图7所示,一种新型冠状肺炎与流感肺炎的初筛诊断系统,该系统实现新型冠状肺炎与流感肺炎的初筛的步骤如上述方法所示,包括:

数据获取单元100,用以获取新冠肺炎患者和流感肺炎患者的临床指标数据;

临床指标识别单元200,用以利用logistic回归模型比较两组数据各项指标的or值,识别出存在差异的临床指标;

临床指标评估单元300,用以采用随机森林模型对识别后的临床指标的影响权重进行排序,根据排序结果获取高权重的临床指标作为评估新冠肺炎的风险因素。

诊断模型建立单元400,将患者按4:1随机分为训练集和测试集,训练集根据所述排序结果选取临床指标用以构建分类回归树模型,所述分类回归树模型基于各临床指标或各临床指标的组合建立了决策树,所述测试集用以验证所述分类回归树模型的输出结果。

图8是本发明一个实施例的一种电子设备的结构示意图。如图8所示,本发明一个实施例的一种电子设备包括一个或多个输入设备1000、一个或多个输出设备1000、一个或多个处理器3000和存储器4000。

在本发明一个实施例中,处理器1000、输入设备2000、输出设备3000和存储器4000可以通过总线或其它方式连接。输入设备2000、输出设备3000可以是标准的有线或无线通信接口。

处理器1000可以是中央处理模块(centralprocessingunit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器4000可以是高速ram存储器,也可为非不稳定的存储器,例如磁盘存储器。存储器4000用于存储一组计算机程序,输入设备2000、输出设备3000和处理器1000可以调用存储器4000中存储的程序代码。

存储器4000存储的计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如上述实施例中所述新型冠状肺炎与流感肺炎的初筛诊断方法的步骤。

本发明的一个实施例还提供一种计算机可读存储介质。该计算机可读存储介质可以是高速ram存储器,也可为非不稳定的存储器,例如磁盘存储器。该计算机可读存储介质可通过外部计算设备或网络进行连接,以读取该计算机可读存储介质所存储的一组计算机程序。该计算机可读存储介质存储的计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如上述实施例中所述新型冠状肺炎与流感肺炎的初筛诊断方法的步骤。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1