一种用于II期结直肠癌复发预测的预后标记基因及随机生存森林模型的制作方法

文档序号:19932684发布日期:2020-02-14 22:12阅读:来源:国知局

技术特征:

1.一种用于ii期结直肠癌复发预测的预后标记基因,其特征在于所述标记基因包括nvl、acer、jup、plat、junb、igdcc3、ankrd27、nup50、git1、prkcdbp、tdo2、loc100287896、mcmbp、sned1、esm1、marco、fam46c、lmo2、haus8、ttc13、adnp2、rsbn1l、raver2、snora21、pnrc1和pja1。

2.一种权利要求1所述预后标记在构建ii期结直肠癌复发预测模型中的应用。

3.如权利要求2所述的应用,其特征在于所述模型在r语言程序中的表达式:v.obj_2ndscore=pred(v.obj_2nd,data),其中v.obj_2nd为根据ii期结直肠癌患者复发相关的预后标记基因的表达值,采用随机生存森林模型方法构建ii期结直肠癌患者肿瘤复发预测模型,v.obj_2ndscore为肿瘤复发风险评分。

4.如权利要求2所述的应用,其特征在于模型的构建方法包括以下步骤:(1)获取基因表达数据集:获取ii期结直肠癌肿瘤样本,获取各个样本的mrna表达数据,并通过聚类分析检测离群值并排除离群值;(2)鉴定与ii期结直肠癌患者复发相关的公共差异表达基因:采用基因芯片荟萃分析技术,以logrank检验计算每一个数据集中每一个基因的p值;然后,采用minp方法合并每一个数据集中每一个基因的p值,最终得到每一个基因的pminp值;采用benjamini-hochberg方法对每一个基因的pminp值进行校正,得到每一个基因的fdr值,根据fdr<0.1的标准筛选与ii期结直肠癌患者复发相关的公共差异表达基因;(3)差异表达基因的信号通路富集分析:采用metascape数据库对步骤(2)鉴定得到的与ii期结直肠癌患者复发相关的公共差异表达基因进行信号通路富集分析,并以p=0.01作为阈值筛选差异表达基因显著富集的信号通路,即p值小于0.01的信号通路;(4)模型的构建:根据步骤(2)ii期结直肠癌患者复发相关的公共差异表达基因的表达值,采用随机生存森林模型方法构建ii期结直肠癌患者肿瘤复发预测模型v.obj_2nd,

所述模型在r语言程序中的表达式:v.obj_2ndscore=pred(v.obj_2nd,data)。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1