一种辅助诊断经典型发热待查患者的病因的系统

文档序号:32743037发布日期:2022-12-30 20:15阅读:144来源:国知局
一种辅助诊断经典型发热待查患者的病因的系统

1.本发明属于诊断系统领域,具体涉及一种辅助诊断经典型发热待查患者的病因的系统。


背景技术:

2.发热待查(fever of unknown origin,fuo),又称不明原因发热,根据涉及人群不同,分为经典型发热待查和特殊人群的发热待查,后者包括住院患者的发热待查、粒细胞缺乏患者的发热待查和hiv感染者的发热待查;两者的诊断与治疗思路差别较大。经典型发热待查是指发热持续3周以上、体温3次高于38.3℃、经过系统全面检查仍无法确认病因的疾病。发热待查患病率约为2.9%,预后较差:57%患者最终确诊为可能致死的严重疾病,出院时仍未明确病因的发热待查患者死亡率可达15%,在不同年龄段儿童中发热待查占死亡原因的8%-17%。病因筛查是经典型发热待查诊疗的关键,然而引起经典型发热待查的病因复杂、超过200种,且有约15%的患者始终不能查明原因,为实施及时有效治疗、改善患者预后带来困难。
3.pet/ct显像能够通过无创的全身性影像学筛查获得隐藏的发热病因线索,为下一步检查明确方向,对于常规辅助检查不能获得明确线索的经典型发热待查诊断具有重要价值,这一应用在近年来被大量临床研究证实并被我国最新专家共识推荐。当pet/ct检查无法提供足够诊断线索时,患者通常需要重复常规辅助检查甚至重复侵入性检查;此外pet/ct检查费用高昂且存在一定的辐射暴露,单次全身显像辐射剂量当量约14msv,为胸片的140倍。
4.因此充分利用pet/ct显像结果,并结合病史与显像前辅助检查结果推断病因,避免侵入性检查和多次重复进行pet/ct显像对患者造成的伤害与经济压力,对于经典型发热待查诊治具有重要意义。
5.申请号为201410514074.7的中国专利申请公开了一种基于pet/ct影像的发热待查计算机辅助诊断方法,通过对pet-ct图像进行处理得到骨扫描指数这一影像学指标,并进一步进行分析诊断。但是该申请仅使用了pet/ct显像中的骨髓组织代谢信息,并未将头颈部、胸部、腹部等多部位多器官组织的信息纳入分析,也不涉及临床特征和实验室检查的各项指标信息,存在信息遗漏,难以实现确切的临床分类诊断。
6.song等人公开了一种临床检测参数与pet/ct联合诊断fuo的方案,但其将所有的连续型变量(如最大标准摄取值、白细胞计数值)均转化为分类型变量代入构建模型,同样存在一定程度的信息丢失。而且,该系统的输出结局是二分类结果(该方案包括2个模型,模型1判断病灶是否为恶性,模型2判断病灶是否为感染性),未包含全部的潜在诊断结局,并无法有效判断经典发热待查患者的具体病因。
7.目前,仍亟需提供一种准确、完整、有效判断fuo患者具体病因的系统。


技术实现要素:

8.本发明的目的在于提供一种准确、完整、有效判断fuo患者具体病因的系统。
9.本发明提供了一种辅助诊断经典型发热待查患者的病因的系统,包括如下模块:
10.数据获取模块:获取患者的临床特征数据、临床检测数据、pet/ct显像结果数据;
11.数据库模块:以经典型发热待查患者样本的临床特征数据、临床检测数据、pet/ct显像结果数据、出院诊断的发热病因构成的数据库;并将患者样本随机拆分为训练集和测试集;
12.数据处理模块:将数据中的连续型变量进行标准化处理,将分类型变量进行独热编码;
13.机器学习模型模块:构建随机森林模型;
14.训练模块:利用训练样本集对构建好的随机森林模型进行训练,获得训练好的随机森林模型;
15.测试模块:利用测试集对训练好的随机森林模型进行验证;
16.结果输出模块:输出发热病因诊断结果。
17.进一步地,上述临床特征数据包括:患者的年龄、性别、病程、最高体温。
18.进一步地,上述临床检测数据包括:白细胞计数、中性粒细胞计数、淋巴细胞计数、嗜酸性粒细胞计数、c反应蛋白、血沉、血红蛋白、血小板计数、红细胞压积、平均红细胞体积。
19.进一步地,上述pet/ct显像结果数据包括:颈部最大标准摄取值、胸部最大标准摄取值、腹部最大标准摄取值、骨骼最大标准摄取值。
20.更进一步地,上述pet/ct显像结果数据是利用自然语言处理技术从pet/ct结果中提取得到的。
21.进一步地,上述数据处理模块所述的连续型变量包括:年龄、最高体温、白细胞计数、中性粒细胞计数、淋巴细胞计数、嗜酸性粒细胞计数、c反应蛋白、血沉、血红蛋白、血小板计数、红细胞压积、平均红细胞体积、颈部最大标准摄取值、胸部最大标准摄取值、腹部最大标准摄取值、骨骼最大标准摄取值;所述分类型变量包括:性别、病程。
22.进一步地,上述随机森林模型单棵树最大深度(max_depth)为5,每棵树使用的最多特征数(max_features)为5,随机森林中树的数目(n_estimators)为6,auc为0.72。
23.进一步地,上述发热病因为:感染性疾病、肿瘤性疾病、非感染性炎症性疾病、其他病因、无法查明病因。
24.本发明还提供了一种介质,其所述介质存储有计算机可执行指令,所述指令在被处理器执行时可用于实现上述的系统,进行如下操作:
25.获取患者的临床特征数据、临床检测数据、pet/ct显像结果数据;
26.以经典型发热待查患者样本的临床特征数据、临床检测数据、pet/ct显像结果数据、出院诊断的发热病因构成的数据库;并将患者样本随机拆分为训练集和测试集;
27.将数据中的连续型变量进行标准化处理,将分类型变量进行独热编码;
28.构建随机森林模型;
29.利用训练样本集对构建好的随机森林模型进行训练,获得训练好的随机森林模型;
30.利用测试集对训练好的随机森林模型进行验证;
31.输出发热病因诊断结果。
32.本发明还提供了一种计算设备,包括处理单元、存储器以及i/o接口;
33.所述存储器,用于存储所述处理单元执行的程序或指令;
34.所述处理单元,用于根据所述存储器存储的程序或指令,执行上述介质所进行的操作;
35.所述i/o接口,用于在所述处理单元的控制下接收或发送数据。
36.本发明的系统具有如下有益效果:
37.(1)充分利用pet/ct显像的信息结果进行分析,避免信息遗漏,避免再次进行pet/ct检查对患者造成经济负担和潜在辐射损害。
38.(2)模型输出结果涵盖了经典型发热待查患者病因的所有诊断可能性(肿瘤、感染、非感染性炎症、其他、无法查明病因),对临床工作具有很高的辅助参考价值。
39.显然,根据本发明的上述内容,按照本领域的普通技术知识和惯用手段,在不脱离本发明上述基本技术思想前提下,还可以做出其它多种形式的修改、替换或变更。
40.以下通过实施例形式的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。凡基于本发明上述内容所实现的技术均属于本发明的范围。
附图说明
41.图1为本发明特征重要性(feature importance)分析结果。图中age表示年龄,gender_his表示性别,duration_num表示病程,temperature表示最高体温,wbc_pet表示白细胞计数,neut_pet表示中性粒细胞计数,lym_pet表示淋巴细胞计数,eos_pet表示嗜酸性粒细胞计数,crp_pet表示c反应蛋白,esr_pet表示血沉,hb_pet表示血红蛋白,plt_pet血小板计数,hct_pet表示红细胞压积,mcv_pet表示平均红细胞体积,neck_suvmax表示颈部最大标准摄取值,chest_suvmax表示胸部最大标准摄取值,abdo_suvmax表示腹部最大标准摄取值,bone_suvmax表示骨骼最大标准摄取值。
具体实施方式
42.本发明所用原料与设备均为已知产品,通过购买市售产品所得。
43.实施例1、本发明辅助诊断经典型发热待查患者的病因系统的建立
44.1、构建诊断模型指标池
45.结合文献复习与专家咨询,形成包括四类指标的指标池。

临床特征:年龄、性别、病程、最高体温。

pet/ct显像前实验室检查结果:白细胞计数、中性粒细胞计数、淋巴细胞计数、嗜酸性粒细胞计数、c反应蛋白、血沉、血红蛋白、血小板计数、红细胞压积、平均红细胞体积。

pet/ct显像结果:使用自然语言处理技术,从pet/ct报告中提取不同部位的病灶最大标准摄取值,包括颈部最大标准摄取值、胸部最大标准摄取值、腹部最大标准摄取值、骨骼最大标准摄取值。
46.2、构建数据库,整理模型指标与结局
47.在案例医院使用患者登记号关联医院pet/ct报告系统、lis系统、his系统和pacs
系统数据,建立经典型发热待查患者pet/ct显像数据库。结合《发热待查专家共识》,共纳入249名同时满足以下条件的患者:

门急诊诊断的icd10编码为“r50.9(未特指的发热)”,

现病史的病程≥21天,

现病史的最高体温≥38.3℃,

在该次住院期间曾在案例医院行pet/ct检查。
48.根据出院诊断,将患者发热病因分为5类:感染性疾病、肿瘤性疾病、非感染性炎症性疾病、其他疾病、无法查明病因。
49.3、模型构建与验证
50.将纳入样本按照8:2随机拆分为训练集和测试集。将连续型变量进行标准化,将分类型变量进行独热编码(one hot encoding)。使用scikit learn机器学习库构建随机森林模型,设置模型中单棵树最大深度(max_depth)为5,每棵树使用的最多特征数(max_features)为5,随机森林中树的数目(n_estimators)为6,得到auc为0.72。
51.4、模型构建
52.模型构建流水线(pipeline)如下:
[0053][0054]
以下通过实验例证明本发明的有益效果。
[0055]
实验例1、特征重要性分析
[0056]
本发明随机森林模型输出的特征重要性结果如图1所示,可以看出,本发明模型构建指标池的各项特征数据:年龄、性别、病程、最高体温、白细胞计数、中性粒细胞计数、淋巴细胞计数、嗜酸性粒细胞计数、c反应蛋白、血沉、血红蛋白、血小板计数、红细胞压积、平均红细胞体积、颈部最大标准摄取值、胸部最大标准摄取值、腹部最大标准摄取值、骨骼最大标准摄取值均具有较高的重要性,说明本发明进行分析诊断的特征参数选择得当,能够全面且恰当地反映经典发热待查的病因。
[0057]
此外,发明人在建模过程中发现,pet/ct现象结果数据之一“脑部最大标准摄取值”的特征重要性value值为0,说明脑部最大标准摄取值这一特征参数与经典发热待查病因间的关系小,因此,在模型实际应用中,并未收集此特征参数作为输入参数特征。
[0058]
综上,本发明提供了一种辅助诊断经典型发热待查病因的系统,能够全面利用pet/ct的检查信息,有效判断fuo患者的病因,具有很高的临床应用价值。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1