1.一种肠癌腹膜转移预测模型,其特征在于,所述预测模型为:
model=32.892+1.51*ct_stage+1.884*tumorlocation+20.447*distantmetastaticsites–19.898*thickenedgreateromentum–20.222*pelvicnodules;
其中,ct_stage为t分期;tumorlocation为肿瘤部位;distantmetastaticsites为远处转移部位;thickenedgreateromentum为大网膜增厚;pelvicnodules为盆腔种植结节。
2.权利要求1所述的肠癌腹膜转移预测模型的构建方法,其特征在于,包括如下步骤:
s1、建模变量选择:选择结直肠癌病例150~200例,随机分成训练集和验证集,分别包含腹膜转移组和无腹膜转移组,腹膜转移癌具体ct图像参数包括13项:肿瘤位置、t分期、邻近器官侵犯、n状态、腹膜斑块阴影、肿瘤增强程度、坏死、穿孔、pc转移部位、远处转移部位、腹水、大网膜增厚、盆腔种植结节;
s2、建模变量筛选:在训练组上,首先利用boruta算法在增强ct的腹膜转移特征中,筛选出与腹膜转移因变量相关的变量集,具体为:
(1)创建阴影特征:对每个真实特征r,随机打乱顺序,得到阴影特征矩阵s,拼接到真实特征后面,构成新的特征矩阵n=[r,s];
(2)用新的特征矩阵n作为输入训练模型,能够输出特征的权重模型,得到真实特征和阴影特征的权重;
(3)取阴影特征的权重的最大值w,真实特征中权重大于w的,记录一次命中;
(4)用(3)中记录的真实特征累计命中,标记特征重要或不重要,在boruta算法中增加fdr校正,用两步法参数切换两种检验方法;
(5)删除不重要的特征,重复1-4,直到所有特征都被标记;
s3、多变量回归模型的构建:对选出的变量集,应用前向逐步回归,根据aic准则进一步筛选,最后得到肿瘤部位、t分期、远处转移部位、大网膜增厚以及盆腔种植结节这5个变量与腹膜转移密切相关;然后,对筛选出的5个变量,采用logistic回归模型建模即得肠癌腹膜转移预测模型。
3.根据权利要求2所述的构建方法,其特征在于,在建模变量筛选前还包括对对连续变量的处理步骤:癌胚抗原水平以5ng/ml为分界点,小于5ng/ml为低水平,大于5ng/ml为高水平;年龄:以50、70为分界点,将其分为年轻(<50)、中年(50-69)、老年(>70)。
4.根据权利要求2所述的构建方法,其特征在于,步骤s2中,权重模型为randomforest、lightgbm或xgboost。