基于免疫相关基因的MSI预测模型构建方法与流程

文档序号:28444056发布日期:2022-01-12 02:59阅读:来源:国知局

技术特征:
1.基于免疫相关基因的msi预测模型构建方法,其特征在于:包括以下步骤:步骤s1:从癌症基因组图谱数据库中收集构建免疫相关msi预测模型irmsis的训练集和验证集;步骤s2:从免疫学数据库中选择免疫相关基因,并从中筛选出差异基因;步骤s3:根据筛选出的差异基因,通过lasso逻辑回归算法构建免疫相关msi预测模型irmsis;步骤s4:使用免疫相关msi预测模型irmsis对预后风险进行验证。2.根据权利要求1所述的基于免疫相关基因的msi预测模型构建方法,其特征在于:所述从癌症基因组图谱数据库中收集构建免疫相关msi预测模型irmsis的训练集和验证集的步骤,包括:从癌症基因组图谱数据库中下载四个癌症队列,四个所述癌症队列包括结肠癌coad、直肠癌read、胃癌stad、食管癌esca的mrna表达谱和临床信息;将结肠癌coad队列作为差异基因的筛选和免疫相关msi预测模型irmsis的训练集,其他队列作为免疫相关msi预测模型irmsis的验证集。3.根据权利要求2所述的基于免疫相关基因的msi预测模型构建方法,其特征在于:所述从免疫学数据库中选择免疫相关基因,并从中筛选出差异基因的步骤,包括:从免疫学数据库中下载n个免疫相关基因,从中选取m个配对基因进行分析,n>m;使用edger软件包筛选结肠癌coad队列中微卫星不稳定性高msi-h的组和微卫星稳定mss的组之间的差异基因,或微卫星不稳定性高msi-h的组和微卫星不稳定性低msi-l的组之间的差异基因,筛选标准为:假发现率fdr<0.05|log2(fold change)| ≥ 1其中fdr为假发现率,其值是针对多次检验调整确定的;fold change表示两组间某基因的测序数据的counts表达量的差异倍数;从而鉴定出m个差异基因,m<m;m个差异基因中包括a个上调基因和b个下调基因,m=a+b。4.根据权利要求3所述的基于免疫相关基因的msi预测模型构建方法,其特征在于:所述根据筛选出的差异基因,通过lasso逻辑回归算法构建免疫相关msi预测模型irmsis的步骤,包括:在结肠癌coad队列中以7:3的比例随机分为训练集和测试集,采用递归特征消除随机森林算法,鉴定出c个鲁棒性基因,c≥5,选择鲁棒性基因最强的前5个基因作为最小绝对收缩算法lasso的输入,进行lasso逻辑回归算法的得分计算;在结肠癌coad队列的测试集、直肠癌read队列、胃癌stad队列、食管癌esca队列中进行免疫相关msi预测模型irmsis的验证;通过roc曲线下的面积auc值来评估免疫相关msi预测模型irmsis的预测效能。5.根据权利要求4所述的基于免疫相关基因的msi预测模型构建方法,其特征在于:所述使用免疫相关msi预测模型irmsis对预后风险进行验证的步骤,包括:在结肠癌coad队列中,根据免疫相关msi预测模型irmsis达到roc值最高yoden指数的临界值,将患者分为irmsis高组和irmsis低组;
根据免疫相关msi预测模型irmsis达到roc值最高yoden指数的中位数,将患者分为微卫星稳定mss、微卫星不稳定性低msi-l中的高组和微卫星稳定mss、微卫星不稳定性低msi-l中的低组;根据roc值最高yoden指数的临界值和roc值最高yoden指数的中位数,将患者分为irmsis高组、irmsis中组和irmsis低组,比较三组患者之间的预后差别。

技术总结
本发明涉及基于免疫相关基因的MSI预测模型构建方法,包括以下步骤:从癌症基因组图谱数据库中收集构建免疫相关MSI预测模型irMSIs的训练集和验证集;从免疫学数据库中选择免疫相关基因,并从中筛选出差异基因;根据筛选出的差异基因,通过LASSO逻辑回归算法构建免疫相关MSI预测模型irMSIs;使用免疫相关MSI预测模型irMSIs对预后风险进行验证。本发明提供了免疫相关基因在MSI状态预测上的应用,结合免疫相关基因,找到了一组可以在消化道肿瘤特别是结肠癌中稳定预测MSI的特征基因,并且能够很好的预测结肠癌预后风险。很好的预测结肠癌预后风险。很好的预测结肠癌预后风险。


技术研发人员:路顺 邓思瑶
受保护的技术使用者:四川省肿瘤医院
技术研发日:2021.12.06
技术公布日:2022/1/11
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1