一种基于细胞死亡模式的癌症分型方法

文档序号:40035991发布日期:2024-11-19 14:10阅读:4来源:国知局
一种基于细胞死亡模式的癌症分型方法

本发明属于医疗数据分析,具体涉及一种基于细胞死亡模式的癌症分型方法。


背景技术:

1、癌症的复杂发病机制激发了研究人员对多种靶向特定目标的生物分子治疗方法的探索,对癌症发生的分子机制的正确理解是寻找有效靶向治疗的关键。一些癌症表现出在肿瘤内和肿瘤间的高度异质性,在早期阶段,需要基于分子特征进行精确分类,以便进行精准的医学治疗。研究人员已经证明细胞器相关功能障碍以及pcd机制对恶性肿瘤的发展和扩散至关重要。为了使恶性细胞发展,它们必须克服各种形式的细胞死亡和细胞器相关功能障碍。其中线粒体在为细胞功能提供能量、调节细胞信号通路和控制pcd中起着关键作用。然而对于癌症中线粒体功能障碍与pcd机制之间的相互作用仍然缺乏全面的认识,相关过程在一些癌症中的详细研究也很少,且仅在rna-seq层面上进行分析。单细胞测序技术提供了深入了解个体细胞的转录组、基因组、蛋白质组、表观基因组和代谢组信息的前所未有的机会。利用单细胞rna测序(scrna-seq)数据来识别肿瘤微环境中的免疫表型和新型免疫细胞相关功能生物标志物变得可行且流行。

2、随着高通量测序技术和分子生物学的发展,肿瘤的基因组特征不断被阐明。然而癌症的异质性给临床治疗带来了极大的困难。在构建分子分型模型时,数据的质量和多样性、最佳算法或方法的选择以及对模型的验证和优化是非常重要的。一些研究在构建癌症分型模型时没有充分利用有效数据,采用的样本或算法比较单一,可能导致模型的泛化能力不足,达不到最优的效果。在模型评价时,部分缺乏外部数据集验证或预后评估不完善。


技术实现思路

1、为解决以上现有技术存在的问题,本发明提出了一种基于细胞死亡模式的癌症分型方法,该方法包括:获取目标癌症对象的scrna-seq数据,对scrna-seq数据进行预处理;从预处理后的scrna-seq数据中获取线粒体功能相关基因集,根据线粒体功能相关基因集评估每个细胞类群的线粒体功能活性状态,根据线粒体功能活性状态得到影响线粒体功能活性的差异活性基因;获取目标癌症对象的rna-seq数据,根据差异活性基因确定每个癌症患者的线粒体功能活性评分;获取pcd机制相关基因表达数据,识别与线粒体功能活性评分最相关的pcd基因;基于目标癌症的正常与肿瘤样本识别差异基因,并与差异活性基因以及pcd基因进行交集筛选,最终得到关键基因;对关键基因进行进一步的筛选,得到候选基因;将候选基因输入到综合机器学习模型中,得到细胞死亡特征;根据细胞死亡特征对目标癌症进行分型;根据癌症分型结果进行关键特征的鉴定与分析。

2、本发明的有益效果:

3、本发明结合了scrna-seq数据和rna-seq数据,探索癌症中线粒体功能与pcd机制之间的联系。综合机器学习算法,构建了癌症新分子分型,有助于预测癌症的侵袭性和预后,制定个体化的治疗方案。



技术特征:

1.一种基于细胞死亡模式的癌症分型方法,其特征在于,包括:获取目标癌症对象的scrna-seq数据,对scrna-seq数据进行预处理;从预处理后的scrna-seq数据中获取线粒体功能相关基因集,根据线粒体功能相关基因集评估每个细胞类群的线粒体功能活性状态,根据线粒体功能活性状态得到差异活性基因;获取目标癌症对象的rna-seq数据,根据差异活性基因确定每个癌症患者的线粒体功能活性评分;获取pcd机制相关基因表达数据,识别与线粒体功能活性评分最相关的pcd基因;基于目标癌症的正常与肿瘤样本识别差异基因,并与差异活性基因以及pcd基因进行交集筛选,最终得到关键基因;对关键基因进行进一步的筛选,得到候选基因;将候选基因输入到综合机器学习模型中,得到细胞死亡特征;根据细胞死亡特征对目标癌症进行分型;根据癌症分型结果进行关键特征的鉴定与分析。

2.根据权利要求1所述的一种基于细胞死亡模式的癌症分型方法,其特征在于,对scrna-seq数据进行预处理包括:根据基因数以及线粒体基因比例进行数据质控;利用cca方法对scrna-seq数据进行合并去批次效应;利用rogue方法来计算降维聚类后的细胞分群的纯度;结合cell taxonomy数据库对细胞进行注释。

3.根据权利要求1所述的一种基于细胞死亡模式的癌症分型方法,其特征在于,评估每个细胞类群的线粒体功能活性状态包括:从数据库中获取线粒体相关功能基因;对于每个单细胞,基于线粒体功能相关基因表达水平对所有基因进行排序;计算基因集中基因在排序列表中的累积排名分数,得到auc值;根据中位线粒体功能活性评分值将细胞分为高和低线粒体功能活性组,识别得到差异活性基因。

4.根据权利要求1所述的一种基于细胞死亡模式的癌症分型方法,其特征在于,确定每个癌症患者的线粒体功能活性评分包括:采用单样本基因集富集分析方法对scrna-seq数据中所获得的差异活性基因进行线粒体功能活性评分。

5.根据权利要求1所述的一种基于细胞死亡模式的癌症分型方法,其特征在于,识别与线粒体功能活性评分最相关的pcd基因包括:采用wgcna方法识别rna-seq数据中与线粒体功能活性评分最相关的pcd基因。

6.根据权利要求5所述的一种基于细胞死亡模式的癌症分型方法,其特征在于,pcd基因通过20种不同的pcd机制得到,其中pdc机制包括:细胞凋亡、失巢凋亡、自噬、碱性死亡、铜死亡、双硫死亡、细胞侵入性死亡、内源性细胞死亡、免疫原性细胞死亡、铁死亡、溶酶体依赖性细胞死亡、巨泡式死亡、坏死性凋亡、net驱动死亡、中性粒细胞炎性细胞死亡、氧死亡、细胞焦亡、依赖性细胞死亡、副凋亡和泛凋亡。

7.根据权利要求1所述的一种基于细胞死亡模式的癌症分型方法,其特征在于,对关键基因进行进一步的筛选包括:基于关键基因进行单因素cox回归分析,以p<0.05为标准进行筛选,得到的癌症相关预后基因。

8.根据权利要求1所述的一种基于细胞死亡模式的癌症分型方法,其特征在于,综合机器学习模型由从随机生存森林、弹性网络、最小收缩算子法、岭回归、逐步cox、coxboost、cox偏最小二乘回归、监督主成分、广义增强回归模型和生存支持向量机中随机抽取一种算法或者两种算法的组合,构成综合机器学习模型。


技术总结
本发明属于医疗数据分析领域,涉及一种基于细胞死亡模式的癌症分型方法,包括:获取目标癌症对象的scRNA‑seq数据并进行预处理;从预处理后的数据中获取线粒体功能相关基因集,评估每个细胞类群的线粒体功能活性状态,得到差异活性基因;获取目标癌症对象的RNA‑seq数据,确定每个癌症患者的线粒体功能活性评分;获取PCD机制相关基因表达数据,识别与线粒体功能活性评分相关的PCD基因;基于正常与肿瘤样本识别差异基因与差异活性基因以及PCD基因进行交集筛选,得到关键基因;从关键基因中筛选候选基因;将候选基因输入到综合机器学习模型中,得到细胞死亡特征;根据细胞死亡特征对目标癌症进行分型;本发明能够探索癌症中线粒体功能与PCD机制之间的联系。

技术研发人员:马明月,王珑兴
受保护的技术使用者:重庆邮电大学
技术研发日:
技术公布日:2024/11/18
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1