基于RNAseq的肿瘤免疫微环境预测模型的构建方法与流程

文档序号:17924262发布日期:2019-06-15 00:18阅读:2512来源:国知局

本发明涉及基于rnaseq的肿瘤免疫微环境预测模型的构建方法。



背景技术:

免疫治疗通过激活人体本身的免疫系统,依靠自身的免疫机能杀灭癌细胞。目前已在多种肿瘤如黑色素瘤,非小细胞肺癌、肾癌和前列腺癌等实体瘤的治疗中展示出了强大的抗肿瘤活性。虽然免疫疗法的成功令人振奋,无数患者在它的干预下取得了显著疗效。但仍有一部分患者对免疫疗法没有反应。而随着技术的进步,人们逐渐了解到肿瘤微环境的免疫环境的复杂性和多样性以及它对免疫治疗的重要影响。通过进一步分析和了解肿瘤免疫微环境将有助于免疫治疗反应性的改善。

目前肿瘤微环境主要靠流式细胞实验,但流式细胞仪较贵且患者不一定有样本来进行流式细胞分析。

当前用于预测免疫微环境的方法如cibersort、mcpcounter、timer等都有或多或少的缺点。其中cibersort是基于microarray数据开发的,对于rnaseq数据的效果并不够理想,而mcpcounter和timer本身计算的只是几种免疫细胞的相对丰度。而且当前几种方法预测结果的准确性并不算高,且其本身细胞类型划分对免疫治疗疗效预测不够具有针对性。



技术实现要素:

本发明的目的是提供一种基于rnaseq的肿瘤免疫微环境预测模型的构建方法。

实现本发明目的的技术方案是:基于rnaseq的肿瘤免疫微环境预测模型的构建方法,包括以下步骤:

步骤一:确定24种肿瘤微环境相关的细胞类型;

步骤二:根据上述步骤得到的细胞类型,优选出301个marker基因;

步骤三:使用kallisto软件计算基因表达量tpm,计算其各个细胞类型对应marker基因的平均表达量,然后取log值作为该细胞类型的相对丰度。

所述步骤一具体为:检索现有文献,整合得到32种肿瘤微环境相关细胞,根据其功能和重要性,将每个微环境细胞分配到一个单一的细胞类型,确定24种免疫微环境相关细胞。

所述24种肿瘤微环境相关的细胞类型包括:

bcells

bcellsmemory;

plasmacells;

tcellscd8;

tcellscd4

tcellscd4memoryresting;

tcellscd4memoryactivated;

tcellsfollicularhelper;

tcellsregulatory(tregs);

tcellsgammadelta;

nkcellsresting;

nkcellsactivated;

monocytes;

macrophagesm0;

macrophagesm1;

macrophagesm2;

dendriticcellsresting;

dendriticcellsactivated;

mastcellsresting;

mastcellsactivated;

eosinophils;

neutrophils;

endothelialcells;

fibroblasts;

所述步骤二具体包括以下步骤:

s1,全面查找文献搜集24种肿瘤微环境细胞对应的所有相关潜在marker基因共583个;

s2,使用tcga的rna-seq数据对这些候选marker基因进行聚类分析;

s3,根据聚类结果剔除普遍低表达的,剔除在多个细胞类型之间无差异的相关基因,筛选得到301个marker基因。

所述301个marker基因分别为:abcb4,bcl7a,bend5,braf,il4r,linc00921,mep1a,mical3,nipsnap3b,psg2,sell,tcl1a,ugt1a8,znf286a,aim2,alox5,clca3p,fam65b,ifna10,il7,npipb15,sp140,tnfrsf13b,traf4,zbtb32,abcb9,ampd1,angpt4,atxn8os,c11orf80,ccr10,hist1h2ae,hist1h2bg,ighe,kcna3,kcng2,loc100130100,man1a1,manea,mast1,mroh7,mzb1,pax7,pdk1,rasgrp3,ren,spag4,st6galnac4,tgm5,ugt2b17,zbp1,znf165,crtam,dsc1,klrc3,klrc4,klrf1,map9,ncr3,pik3ip1,trav12-2,ankrd55,cxorf57,epha1,flj13197,gal3st4,galr1,map4k2,sergef,vill,wnt7a,znf204p,znf324,epb41,ets1,fbxl8,pbxip1,rpl10l,trav13-2,trav21,zfp36l2,cdc25a,il17a,il26,il4,il9,orc1,rrp9,ska1,ca8,chi3l2,fzd3,ica1,il21,pask,pdcd1,slc7a10,trib2,tshr,zbtb10,barx2,cd5,cd70,cemp1,clec2d,efna5,foxp3,frmd8,hic1,hmgb3p30,kirrel,lair2,lilra4,loc126987,npas1,ntn3,pcdha5,plch2,ptprg,ryr1,sec31b,sept5,spock2,ssx1,tyr,bfsp1,brsk2,ccr5,cd300a,cdh12,colq,cxcr6,gype,klrg1,krt18p50,lhcgr,magea11,tardbpp1,znf442,azu1,cdhr1,defa4,elane,plekhf1,tep1,ttc38,znf135,apobec3g,ccnd2,cdk6,faslg,kir2dl4,kir2ds4,osm,asgr1,asgr2,bst1,ccr2,cd1d,fcn1,hck,hnmt,hpse,nlrp3,upk3a,bhlhe41,ccl7,col8a2,csf1,cxcl5,dcstamp,gpc4,marco,mmp9,ppbp,apol3,arrb1,cd40,cxcl9,cyp27b1,kiaa0754,slamf1,trpm4,ccl14,ccl23,crybb1,frmd4a,gstt1,hrh1,npl,renbp,wnt5b,c1orf54,cd1a,dhrs11,egr2,flvcr2,hla-dqa1,ppfibp1,arhgap22,birc3,cd80,cd86,chst7,etv3,il12b,map3k13,msc,nr4a3,slco5a1,tnfrsf11a,bmp2k,crisp3,fam124b,fam174b,ltc4s,paqr5,sept8,hoxa1,il1a,il1b,il5,linc00597,march3,tec,bcl2a1,c5ar2,dach1,dapk2,depdc5,emr1,epn2,gipr,gpr183,gpr65,il5ra,lrmp,p2ry10,p2ry2,pde6c,pkd2l2,rrp12,samsn1,smpd3,smpdl3b,trpm6,znf222,btnl8,casp5,ccr3,ceacam3,cxcr1,cxcr2,fam212b,fcgr3b,fpr2,hal,hspa6,mmp25,pglyrp1,steap4,tnfrsf10c,trem1,vnn3,acvrl1,apln,bcl6b,bmp6,bmx,cdh5,clec14a,cxorf36,edn1,eltd1,emcn,esam,esm1,hecw2,hhip,kdr,mmrn1,myct1,palmd,pear1,pgf,plxna2,ptprb,robo4,sdpr,shank3,she,tek,tie1,veph1,vwf,ca4,cyp4f3,kcnj15,megf9,slc25a37,tle3。

所述步骤三中细胞类型的相对丰度的计算公式为:

abundancecell=log2ave(tpmcell)/log2ave(tpmall)。

采用了上述技术方案,本发明具有以下的有益效果:(1)本发明计算其各个细胞类型对应marker基因的平均表达量,即计算的是一组marker基因的平均值,相对于计算单个marker基因,其结果相对更稳定,受相对误差的影响较小。

(2)本发明对细胞类型的划分更合理,使得本方法构建的肿瘤免疫微环境预测模型对肿瘤免疫治疗更加具有针对性。

(3)本发明使用tcga的rna-seq数据对候选的marker基因进行聚类分析,其结果更准确。

具体实施方式

(实施例1)

本实施例的基于rnaseq的肿瘤免疫微环境预测模型的构建方法,包括以下步骤:

步骤一:检索现有文献,整合得到32种肿瘤微环境相关细胞,根据其功能和重要性,将每个微环境细胞分配到一个单一的细胞类型,确定24种免疫微环境相关细胞。

步骤二:全面查找文献搜集24种肿瘤微环境细胞对应的所有相关潜在marker基因共583个;使用tcga的rna-seq数据对这些候选marker基因进行聚类分析;根据聚类结果剔除普遍低表达的,剔除在多个细胞类型之间无差异的相关基因,筛选得到301个marker基因。

步骤三:使用kallisto软件计算基因表达量tpm,计算其各个细胞类型对应marker基因的平均表达量,然后取log值作为该细胞类型的相对丰度,具体公式为:

abundancecell=log2ave(tpmcell)/log2ave(tpmall)。

24种免疫微环境相关细胞如下表所示:

肿瘤微环境细胞类型和相对应的marker基因如下表所示:

本方法对细胞类型的划分更合理,使得本方法构建的肿瘤免疫微环境预测模型对肿瘤免疫治疗更加具有针对性。本方法使用tcga的rna-seq数据对候选的marker基因进行聚类分析,其结果更准确。本方法计算其各个细胞类型对应marker基因的平均表达量,即计算的是一组marker基因的平均值,相对于计算单个marker基因,其结果相对更稳定,受相对误差的影响较小。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有1条留言
  • 150987... 来自[中国] 2020年10月08日 18:04
    垃圾!别下载,骗人!
    0
1