基于肿瘤样本的多组学联合分析方法和系统与流程

文档序号:31540197发布日期:2022-09-16 23:39阅读:来源:国知局

技术特征:
1.基于肿瘤样本的多组学联合分析方法,其特征在于,包括:根据肿瘤样本的转录组学数据构建共表达基因模块;基于肿瘤样本的基因组数据获取scnv基因列表;对所述共表达基因模块中的基因和所述scnv基因列表中的基因进行相关性分析,生成scnv基因列表中基因的评分结果;基于所述评分结果,利用go注释和快速功能注释从所述scnv基因列表中获取肿瘤的致病新发基因;基于肿瘤核心通路变化因子构建肿瘤致病新发基因调控网络;基于所述肿瘤致病新发基因调控网络验证所述肿瘤的致病新发基因。2.如权利要求1所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述根据肿瘤样本的转录组学数据构建共表达基因模块,包括:根据肿瘤样本的转录组学数据生成差异表达基因列表;将所述差异表达基因列表中的差异表达基因进行聚类,得到若干基因簇;基于所述基因簇的软阈值构建基因簇共表达网络;重构所述基因簇共表达网络中的基因,生成共表达基因模块。3.如权利要求2所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述肿瘤样本的转录组学数据为rna-seq的表达量数据。4.如权利要求3所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述rna-seq的表达量数据为rpkm数。5.如权利要求2所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述将所述差异表达基因列表中的差异表达基因进行聚类采用的聚类方法为双向聚类法。6.如权利要求2所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述重构所述基因簇共表达网络中的基因,生成共表达基因模块,包括:利用相异度算法对所述基因簇共表达网络中的基因进行层次聚类;基于所述层次聚类结果,建立分层聚类树;将所述分层聚类树剪切成若干模块并进行模块合并,生成若干个共表达基因模块。7.如权利要求6所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述将所述分层聚类树剪切成若干模块利用动态剪切法。8.如权利要求6所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述进行模块合并具体为,将相关性系数大于0.75的模块进行合并。9.如权利要求1所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述对所述共表达基因模块中的基因和所述scnv基因列表中的基因进行相关性分析,生成scnv基因列表中基因的评分结果,包括:利用决策树分析法对所述共表达基因模块中的基因和所述scnv基因列表中的基因进行相关性分析,生成scnv基因列表中基因的初步评分结果;根据cnv的拷贝类型对scnv扩增基因和scnv缺失基因按照评分进行排序,生成scnv基因列表中基因的评分结果;其中,所述评分结果包括scnv扩增基因评分结果和scnv缺失基因评分结果。10.如权利要求1所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述scnv
基因列表中基因的评分越高,与所述共表达模块中的基因的相关性越高。11.如权利要求1所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述基于所述评分结果,利用go注释和快速功能注释从所述scnv基因列表中获取肿瘤的致病新发基因,包括:利用go注释工具选取第一致病新发基因;将进行标注的所述第一致病新发基因输入icmdb数据库进行快速功能注释,获取肿瘤的致病新发基因。12.如权利要求1所述的基于肿瘤样本的多组学联合分析方法,其特征在于,还包括:结合临床样本的预后及生存数据,对所述肿瘤的致病新发基因进行验证。13.基于肿瘤样本的多组学联合分析系统,其特征在于,包括:基因构建模块,用于根据肿瘤样本的转录组学数据构建共表达基因模块;列表获取模块,用于基于肿瘤样本的基因组数据获取scnv基因列表;评分模块,用于对所述共表达基因模块中的基因和所述scnv基因列表中的基因进行相关性分析,生成scnv基因列表中基因的评分结果;新发基因获取模块,用于基于所述评分结果,利用go注释和快速功能注释从所述scnv基因列表中获取肿瘤的致病新发基因;网络构建模块,用于基于肿瘤核心通路变化因子构建肿瘤致病新发基因调控网络;验证模块,用于基于所述肿瘤致病新发基因调控网络验证所述肿瘤的致病新发基因。14.如权利要求13所述的基于肿瘤样本的多组学联合分析系统,其特征在于,所述基因构建模块,包括:差异列表生成子模块,用于根据肿瘤样本的转录组学数据生成差异表达基因列表;聚类子模块,用于将所述差异表达基因列表中的差异表达基因进行聚类,得到若干基因簇;网络构建子模块,用于基于所述基因簇的软阈值构建基因簇共表达网络;基因构建子模块,用于重构所述基因簇共表达网络中的基因,生成共表达基因模块。15.如权利要求14所述的基于肿瘤样本的多组学联合分析系统,其特征在于,所述肿瘤样本的转录组学数据为rna-seq的表达量数据。16.如权利要求15所述的基于肿瘤样本的多组学联合分析系统,其特征在于,所述rna-seq的表达量数据为rpkm数。17.如权利要求14所述的基于肿瘤样本的多组学联合分析系统,其特征在于,所述将所述差异表达基因列表中的差异表达基因进行聚类采用的聚类方法为双向聚类法。18.如权利要求14所述的基于肿瘤样本的多组学联合分析系统,其特征在于,所述基因构建子模块,包括:聚类单元,用于利用相异度算法对所述基因簇共表达网络中的基因进行层次聚类;聚类树建立单元,用于基于所述层次聚类结果,建立分层聚类树;基因构建单元,用于将所述分层聚类树剪切成若干模块并进行模块合并,生成若干个共表达基因模块。19.如权利要求18所述的基于肿瘤样本的多组学联合分析系统,其特征在于,所述将所述分层聚类树剪切成若干模块利用动态剪切法。
20.如权利要求18所述的基于肿瘤样本的多组学联合分析系统,其特征在于,所述进行模块合并具体为,将相关性系数大于0.75的模块进行合并。21.如权利要求13所述的基于肿瘤样本的多组学联合分析系统,其特征在于,所述评分模块,包括:初步评分子模块,用于利用决策树分析法对所述共表达基因模块中的基因和所述scnv基因列表中的基因进行相关性分析,生成scnv基因列表中基因的初步评分结果;评分子模块,用于根据cnv的拷贝类型对scnv扩增基因和scnv缺失基因按照评分进行排序,生成scnv基因列表中基因的评分结果;其中,所述评分结果包括scnv扩增基因评分结果和scnv缺失基因评分结果。22.如权利要求13所述的基于肿瘤样本的多组学联合分析系统,其特征在于,所述scnv基因列表中基因的评分越高,与所述共表达模块中的基因的相关性越高。23.如权利要求13所述的基于肿瘤样本的多组学联合分析系统,其特征在于,所述新发基因获取模块,包括:第一新发基因获取子模块,用于利用go注释工具选取第一致病新发基因;新发基因获取子模块,用于将进行标注的所述第一致病新发基因输入icmdb数据库进行快速功能注释,获取肿瘤的致病新发基因。24.如权利要求13所述的基于肿瘤样本的多组学联合分析系统,其特征在于,还包括:临床验证模块,用于结合临床样本的预后及生存数据,对所述肿瘤的致病新发基因进行验证。

技术总结
本申请公开了基于肿瘤样本的多组学联合分析方法和系统,涉及肿瘤致病机制分析领域,根据肿瘤样本的转录组学数据构建共表达基因模块;基于肿瘤样本的基因组数据获取SCNV基因列表;对共表达基因模块中的基因和SCNV基因列表中的基因进行相关性分析,生成SCNV基因列表中基因的评分结果,进而利用GO注释和快速功能注释从SCNV基因列表中获取肿瘤的致病新发基因;基于肿瘤核心通路变化因子构建肿瘤致病新发基因调控网络;最后验证肿瘤的致病新发基因。本申请通过基因组数据和转录组数据的联合分析,挖掘了肿瘤致病驱动的候选调控因子,对由转录调控影响变化而造成的疾病进展,疾病发病机制的调控关系,揭示肿瘤的肿瘤新发基因。揭示肿瘤的肿瘤新发基因。揭示肿瘤的肿瘤新发基因。


技术研发人员:安琪儿 赵再戌 闵浩巍 郭栋梁
受保护的技术使用者:神州医疗科技股份有限公司
技术研发日:2022.08.18
技术公布日:2022/9/15
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1