T细胞亚型鉴定的模型训练方法、装置、设备及存储介质与流程

文档序号:34903454发布日期:2023-07-26 15:53阅读:83来源:国知局
T细胞亚型鉴定的模型训练方法、装置、设备及存储介质与流程

本发明涉及生物,尤其涉及一种t细胞亚型鉴定的模型训练方法、装置、设备及存储介质。


背景技术:

1、肿瘤特异性t细胞是识别和杀伤肿瘤的主要淋巴细胞;此外,肿瘤特异性t细胞的t细胞(抗原)受体(t cell receptor,tcr)的鉴定,还可以提供患者治疗的临床监测生物标志物,用于跟踪抗肿瘤免疫反应的临床疗效,深入研究肿瘤免疫治疗的生物学机制。

2、目前,鉴定肿瘤特异性t细胞的常规方法是离体t细胞功能测试。

3、但是,上述鉴定过程对实验室平台的要求很高,鉴定周期长;并且,会漏掉很大一部分肿瘤特异性t细胞,例如可能遗漏内源性病毒抗原的t细胞或无法在体外激活的最终耗竭的t细胞等,肿瘤特异性t细胞的鉴定准确性低。


技术实现思路

1、本发明提供一种t细胞亚型鉴定的模型训练方法、装置、设备及存储介质,用以解决现有技术中肿瘤特异性t细胞的鉴定对实验室平台的要求很高、鉴定周期长及鉴定准确性低的问题。

2、本发明提供一种t细胞亚型鉴定的模型训练方法,包括:

3、获取预先设置的建立模型的数据集;其中,所述建立模型的数据集至少包括肿瘤特异性t细胞的单细胞测序数据;

4、基于所述建立模型的数据集的测序数据对应的标志marker基因的表达量,从所述建立模型的数据集中提取t细胞的测序数据;

5、在所述t细胞的测序数据对应的细胞支持识别肿瘤的注释信息的情况下,确定所述t细胞的测序数据与肿瘤特异性t细胞之间的第一对应关系;在所述t细胞的测序数据对应的细胞不支持识别肿瘤的注释信息的情况下,确定所述t细胞的测序数据与非肿瘤特异性t细胞之间的第二对应关系;

6、将所述第一对应关系和所述第二对应关系作为训练数据,训练预先设置的待训练模型,得到t细胞亚型鉴定模型。

7、根据本发明提供的一种t细胞亚型鉴定的模型训练方法,所述获取预先设置的建立模型的数据集,包括:

8、获取预先设置的候选数据集;

9、对所述候选数据集的测序数据执行过滤操作后,得到所述建立模型的数据集;

10、其中,所述过滤操作包括以下步骤:

11、从所述候选数据集中,去除基因的检出数量小于第一阈值的测序数据;

12、从所述候选数据集中,去除特异性分子标签umi的数量小于第二阈值的测序数据;

13、从所述候选数据集中,去除umi的线粒体基因表达量比例大于第三阈值的测序数据;

14、从所述候选数据集中,去除双细胞对应的测序数据。

15、根据本发明提供的一种t细胞亚型鉴定的模型训练方法,所述基于所述建立模型的数据集的测序数据对应的标志marker基因的表达量,从所述建立模型的数据集中提取t细胞的测序数据,包括:

16、基于所述建立模型的数据集的测序数据对应的marker基因的表达量,从所述建立模型的数据集中提取第一候选测序数据;

17、从所述第一候选测序数据的高变基因中,去除t细胞受体基因和组织解离诱导基因,得到所述t细胞的测序数据。

18、根据本发明提供的一种t细胞亚型鉴定的模型训练方法,所述从所述第一候选测序数据的高变基因中,去除t细胞受体基因和组织解离诱导基因,得到所述t细胞的测序数据,包括:

19、从所述第一候选测序数据的高变基因中,去除所述t细胞受体基因和组织解离诱导基因,得到第二候选测序数据;

20、通过预先设置的sctransform算法处理所述第二候选测序数据,得到所述t细胞的测序数据。

21、根据本发明提供的一种t细胞亚型鉴定的模型训练方法,所述将所述第一对应关系和所述第二对应关系作为训练数据,训练预先设置的待训练模型,得到t细胞亚型鉴定模型,包括:

22、通过极端梯度提升算法设定预先设置的第一候选模型的参数,得到初步鉴定模型;其中,所述参数包括以下至少一项:树的最大深度、学习率和采样百分比;

23、将预先设置的逻辑回归模型作为分类模型;

24、基于所述初步鉴定模型和所述分类模型,得到所述待训练模型。

25、根据本发明提供的一种t细胞亚型鉴定的模型训练方法,所述基于所述初步鉴定模型和所述分类模型,得到所述待训练模型,包括:

26、基于所述初步鉴定模型和所述分类模型,得到第二候选模型;

27、通过预先设置的10倍交叉验证算法,计算所述第二候选模型的目标超参数,基于所述目标超参数优化所述第二候选模型,得到所述待训练模型。

28、本发明还提供一种t细胞亚型鉴定的模型训练装置,包括:

29、获取模块,用于获取预先设置的建立模型的数据集;其中,所述建立模型的数据集至少包括肿瘤特异性t细胞的单细胞测序数据;

30、提取模块,用于基于所述建立模型的数据集的测序数据对应的标志marker基因的表达量,从所述建立模型的数据集中提取t细胞的测序数据;

31、确定模块,用于在所述t细胞的测序数据对应的细胞支持识别肿瘤的注释信息的情况下,确定所述t细胞的测序数据与肿瘤特异性t细胞之间的第一对应关系;在所述t细胞的测序数据对应的细胞不支持识别肿瘤的注释信息的情况下,确定所述t细胞的测序数据与非肿瘤特异性t细胞之间的第二对应关系;

32、训练模块,用于将所述第一对应关系和所述第二对应关系作为训练数据,训练预先设置的待训练模型,得到t细胞亚型鉴定模型。

33、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述t细胞亚型鉴定的模型训练方法。

34、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述t细胞亚型鉴定的模型训练方法。

35、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述t细胞亚型鉴定的模型训练方法。

36、本发明提供的t细胞亚型鉴定的模型训练方法、装置、设备及存储介质,相较于相关技术中通过离体t细胞功能测试来鉴定肿瘤特异性t细胞,存在对实验室平台的要求很高、鉴定周期长和鉴定准确性低的问题,通过本发明实施例训练得到的t细胞亚型鉴定模型鉴定肿瘤特异性t细胞,操作简单,分析效率高,有效降低了鉴定周期,并提高了肿瘤特异性t细胞的鉴定准确性。



技术特征:

1.一种t细胞亚型鉴定的模型训练方法,其特征在于,包括:

2.根据权利要求1所述的t细胞亚型鉴定的模型训练方法,其特征在于,所述获取预先设置的建立模型的数据集,包括:

3.根据权利要求1所述的t细胞亚型鉴定的模型训练方法,其特征在于,所述基于所述建立模型的数据集的测序数据对应的标志marker基因的表达量,从所述建立模型的数据集中提取t细胞的测序数据,包括:

4.根据权利要求3所述的t细胞亚型鉴定的模型训练方法,其特征在于,所述从所述第一候选测序数据的高变基因中,去除t细胞受体基因和组织解离诱导基因,得到所述t细胞的测序数据,包括:

5.根据权利要求1所述的t细胞亚型鉴定的模型训练方法,其特征在于,所述将所述第一对应关系和所述第二对应关系作为训练数据,训练预先设置的待训练模型,得到t细胞亚型鉴定模型,包括:

6.根据权利要求5所述的t细胞亚型鉴定的模型训练方法,其特征在于,所述基于所述初步鉴定模型和所述分类模型,得到所述待训练模型,包括:

7.一种t细胞亚型鉴定的模型训练装置,其特征在于,包括:

8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述t细胞亚型鉴定的模型训练方法。

9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述t细胞亚型鉴定的模型训练方法。


技术总结
本发明提供一种T细胞亚型鉴定的模型训练方法、装置、设备及存储介质,涉及生物技术领域,方法包括:获取预先设置的建立模型的数据集;基于建立模型的数据集的测序数据对应的Marker基因的表达量,从建立模型的数据集中提取T细胞的测序数据;在T细胞的测序数据对应的细胞支持识别肿瘤的注释信息的情况下,确定T细胞的测序数据与肿瘤特异性T细胞之间的第一对应关系;在T细胞的测序数据对应的细胞不支持识别肿瘤的注释信息的情况下,确定T细胞的测序数据与非肿瘤特异性T细胞之间的第二对应关系;将第一对应关系和第二对应关系作为训练数据,训练预先设置的待训练模型,得到T细胞亚型鉴定模型。

技术研发人员:史植文
受保护的技术使用者:北京智因东方转化医学研究中心有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1