基于二氢胸腺嘧啶代谢物的组合在结直肠癌诊断及预后预测中的应用的制作方法

文档序号:17331708发布日期:2019-04-05 22:07阅读:264来源:国知局
基于二氢胸腺嘧啶代谢物的组合在结直肠癌诊断及预后预测中的应用的制作方法
本发明涉及生物领域,具体地,本发明涉及基于二氢胸腺嘧啶代谢物的组合在结直肠癌诊断及预后预测中的应用。
背景技术
:结直肠癌(crc)是全世界最常见的癌症之一,具有高发病率和死亡率。通过临床早期筛查,如使用结肠镜检测在结肠或直肠中的癌前息肉,并及时手术切除癌前息肉,能够有效地防止结直肠癌的发生。美国国家健康访谈调查(nhis)最近的一项调查显示,在2000年至2013年期间,由于结肠镜检查的应用的推广和普及,美国50岁及以上成年人的结直肠癌发病率从~100/100,000减少到<70/100,000,减少了32%。早期筛查也可以及时发现早期阶段的结直肠癌患者,及时进行手术治疗可以获得较理想的预后。对于在局部病灶阶段就得到明确诊断的早期结直肠癌患者,手术切除肿瘤和附近的淋巴结,其5年生存率显著提高,可高达90%。相反,在晚期诊断(例如,发生局部或远处转移)的结直肠癌患者,其5年生存率低于70%。临床结直肠癌筛查的传统方法包括肠镜检查和粪便检查,具有显著的局限性。肠镜等侵入性的筛查方法不够方便且成本较高,患者依从性差。而非侵入性筛查方法,如基于愈创木脂的粪便潜血试验(fobt),粪便免疫化学试验(fit),双对比钡灌肠(dcbe)和粪便dna试验等,其灵敏度、特异性和检出率低,不能非常有效地发现结直肠癌。因此,开发一种具有高精度、微创和低成本的结直肠癌筛查和早期诊断的方法迫在眉睫。技术实现要素:组织代谢物或生物流体样品(即血浆,血清,尿液等)中的代谢物改变与疾病表型密切相关,因此,代谢物生物标志物可提供一种有前景的,具有高灵敏度和特异性的临床结直肠癌诊断方法。然而,生物流体样品中的代谢波动极易受到环境混杂因素的影响,这些混杂因素往往会导致偏倚的研究结果,也就是说在生物流体样品中发现的代谢物生物标志物并不一定能直接反映肿瘤组织的病理状态。例如,cheng等研究者和leichtle等研究者发现结直肠癌患者尿液和血清中丙氨酸含量下降,但qiu等研究者报道结直肠癌肿瘤组织中丙氨酸显著增加。sreekumar等研究者揭示了肌氨酸在肿瘤组织中对前列腺癌(pca)病理进展的潜在作用,但他们没有发现前列腺癌患者血浆和尿样中肌氨酸的任何显着变化。这种代谢物从组织到生物流体的复杂变化,对代谢物生物标志物的临床应用提出了巨大挑战。在本发明中,发明人收集了结直肠癌患者在手术期间的成对的结直肠癌和邻近的正常组织(n=68),同时也分别在手术前一天和手术后第7天收集了来自相同患者术前和术后血浆样本(n=68)。然后,发明人对组织和血浆样品进行了非靶向代谢组学分析。特别地,发明人开发了相关性分析策略以发现结直肠癌患者血浆中的肿瘤组织衍生的代谢物。为了证明潜在的临床应用价值,发明人将来自73名结直肠癌患者和73名性别匹配的息肉对照的血浆样品分别用作训练集和独立验证集,以发现肿瘤组织衍生的代谢物生物标志物。发明人发现了结直肠癌病人血浆中的四种潜在的代谢物生物标志物,并证明其具有高灵敏度和高选择性,能够用于结直肠癌诊断和预后评价。发明人发现的四种代谢物生物标志物(鹅去氧胆酸、二氢胸腺嘧啶、l-酪氨酸、黄嘌呤)在预测手术后结直肠癌患者的预后方面(包括总体生存期和无进展生存期)表现良好。并且,发明人提出的基于这四种生物标志物的评分方法,可对结直肠癌患者进行准确诊断和预后效果评估。在本发明的第一方面,本发明提出了二氢胸腺嘧啶作为结直肠癌标志物的用途。发明人通过实验首次发现,结直肠癌病人血浆中的二氢胸腺嘧啶的含量相对于正常人群的血浆中二氢胸腺嘧啶的含量升高。因此,血浆中二氢胸腺嘧啶的含量可作为结直肠癌标志物,可用于结直肠癌诊断,判断药物治疗结直肠癌患者的是否有效或判断结直肠癌患者的预后情况。根据本发明的实施例,上述用途还可以进一步包括如下附加技术特征至少之一:根据本发明的实施例,所述标志物进一步包括鹅去氧胆酸、l-酪氨酸以及黄嘌呤的至少之一。发明人通过实验还发现,结直肠癌病人血浆中的鹅去氧胆酸、l-酪氨酸以及黄嘌呤的含量相对于正常人群的血浆中鹅去氧胆酸、l-酪氨酸以及黄嘌呤的含量均下降。进而,二氢胸腺嘧啶与鹅去氧胆酸、l-酪氨酸以及黄嘌呤的至少之一共同作为结直肠癌的标志物,检测结果的准确性高、灵敏度高。根据本发明的实施例,所述标志物进一步包括鹅去氧胆酸、l-酪氨酸以及黄嘌呤。进而,二氢胸腺嘧啶与鹅去氧胆酸、l-酪氨酸以及黄嘌呤共同作为结直肠癌的标志物,检测结果的准确性更高、灵敏度更高。在本发明的第二方面,本发明提出了一种试剂盒。根据本发明的实施例,所述试剂盒包括:试剂,所述试剂用于检测二氢胸腺嘧啶。如前所述,发明人通过实验首次发现,结直肠癌病人血浆中的二氢胸腺嘧啶的含量相对于正常人群的血浆中二氢胸腺嘧啶的含量升高,二氢胸腺嘧啶可作为结直肠癌的生物标志物。根据本发明实施例的试剂盒可通过检测样品血浆中二氢胸腺嘧啶的含量,准确判断待测样品是否来源于结直肠患者。根据本发明的实施例,一方面,包含检测二氢胸腺嘧啶试剂的试剂盒能用于检测样本是否患有结直肠癌,如果利用所述试剂盒检测到样本中二氢胸腺嘧啶的水平相比于正常人群中二氢胸腺嘧啶的水平上升的差异有显著的统计学差异,则样本患有结直肠癌;另一方面,包含检测二氢胸腺嘧啶试剂的试剂盒能用于判断药物治疗结直肠癌是否有效,如果利用所述试剂盒检测到接受药物治疗后的样本中二氢胸腺嘧啶的水平相比于正常人群中二氢胸腺嘧啶的水平的差异没有显著的统计学差异,则药物能够有效治疗结直肠癌;再一方面,包含检测二氢胸腺嘧啶试剂的试剂盒能用于判断结直肠癌患者的预后水平,如果利用所述试剂盒检测到治愈后的结直肠癌患者中二氢胸腺嘧啶的水平相比于正常人群中二氢胸腺嘧啶的水平的差异没有显著的统计学差异,则该结直肠癌患者的预后良好。进而,根据本发明实施例的试剂盒能够有效地检测出样本是否患有结直肠癌、检测出治疗结直肠癌患者药物的有效性以及检测出结直肠癌患者的预后情况。根据本发明的实施例,上述试剂盒还可以进一步包括如下附加技术特征至少之一:根据本发明的实施例,所述试剂盒进一步包括用于检测鹅去氧胆酸、l-酪氨酸以及黄嘌呤的至少之一的试剂。如前所述,发明人通过实验还发现,结直肠癌病人血浆中的鹅去氧胆酸、l-酪氨酸以及黄嘌呤的含量相对于正常人群的血浆中鹅去氧胆酸、l-酪氨酸以及黄嘌呤的含量均下降。进而,包含进一步检测鹅去氧胆酸、l-酪氨酸以及黄嘌呤的至少之一的试剂的试剂盒检测出样本是否患有结直肠癌、检测治疗结直肠癌患者药物的有效性以及检测结直肠癌患者的预后情况的准确度高、灵敏度高。根据本发明的实施例,所述试剂盒进一步包括用于检测鹅去氧胆酸、l-酪氨酸以及黄嘌呤的试剂。进而,包含进一步检测鹅去氧胆酸、l-酪氨酸以及黄嘌呤的试剂的试剂盒检测出样本是否患有结直肠癌、检测治疗结直肠癌患者药物的有效性以及检测结直肠癌患者的预后情况的准确度更高、灵敏度更高。在本发明的第三方面,本发明提出了试剂在制备试剂盒中的用途,所述试剂用于检测二氢胸腺嘧啶,所述试剂盒用于诊断结直肠癌、判断药物治疗结直肠癌有效性或判断结直肠癌患者预后效果。如前所述,利用检测二氢胸腺嘧啶的试剂制备获得的试剂盒能用于诊断结直肠癌、判断药物治疗结直肠癌有效性或判断结直肠癌患者预后效果,且诊断结直肠癌、判断药物治疗结直肠癌有效性或判断结直肠癌患者预后效果的准确度高、灵敏度高。根据本发明的实施例,上述用途还可以进一步包括如下附加技术特征至少之一:根据本发明的实施例,所述试剂进一步用于检测鹅去氧胆酸、l-酪氨酸以及黄嘌呤的至少之一。如前所述,利用能进一步检测鹅去氧胆酸、l-酪氨酸以及黄嘌呤的至少之一的试剂所制备的试剂盒检测出样本是否患有结直肠癌、判断治疗结直肠癌患者药物的有效性以及判断结直肠癌患者的预后情况的准确度高、灵敏度高。根据本发明的实施例,所述试剂进一步用于检测鹅去氧胆酸、l-酪氨酸以及黄嘌呤。如前所述,利用能进一步检测鹅去氧胆酸、l-酪氨酸以及黄嘌呤的至少之一的试剂所制备的试剂盒检测出样本是否患有结直肠癌、判断治疗结直肠癌患者药物的有效性以及判断结直肠癌患者的预后情况的准确度更高、灵敏度更高。在本发明的第四方面,本发明提出了一种筛选药物的方法。根据本发明的实施例,所述药物用于治疗结直肠癌,包括:将结直肠癌模型与候选药物接触,比较接触前后,所述结直肠癌模型中二氢胸腺嘧啶水平,判断所述候选药物是否为目标药物。如前所述,发明人通过实验首次发现,结直肠癌病人血浆中的二氢胸腺嘧啶可作为结直肠的生物标志物。进而,通过比较接触前后,所述结直肠癌模型中二氢胸腺嘧啶水平,可有效判断所述候选药物是否为目标药物。根据本发明的实施例,上述方法还可以进一步包括如下附加技术特征至少之一:根据本发明的实施例,接触后相比于接触前,结直肠癌模型中所述二氢胸腺嘧啶水平降低,是所述候选药物为目标药物的指示。如前所述,结直肠癌病人血浆中的二氢胸腺嘧啶的含量相对于正常人群的血浆中二氢胸腺嘧啶的含量升高。如果结直肠癌模型与候选药物接触后,样本中二氢胸腺嘧啶的水平相比于接触前二氢胸腺嘧啶的水平的降低,则说明候选药物能有效治疗结直肠癌。根据本发明的实施例,所述方法进一步包括比较接触前后,所述结直肠癌模型中所述鹅去氧胆酸、l-酪氨酸以及黄嘌呤至少之一的水平,判断所述候选药物是否为目标药物。如前所述,结直肠癌病人血浆中的鹅去氧胆酸、l-酪氨酸以及黄嘌呤的含量相对于正常人群的血浆中鹅去氧胆酸、l-酪氨酸以及黄嘌呤的含量均下降。如果结直肠癌模型与候选药物接触后,样本中鹅去氧胆酸、l-酪氨酸以及黄嘌呤至少之一的水平相比于接触前相应的水平的升高,则说明候选药物能有效治疗结直肠癌。根据本发明的实施例,接触后相比于接触前,结直肠癌模型中所述鹅去氧胆酸、l-酪氨酸以及黄嘌呤至少之一的水平升高,是所述候选药物为目标药物的指示。候选药物如果可以进一步升高结直肠癌模型中所述鹅去氧胆酸、l-酪氨酸以及黄嘌呤至少之一的水平,则候选药物作为目标药物的可信度更高。根据本发明的实施例,进一步包括比较接触前后,所述结直肠癌模型中所述鹅去氧胆酸、l-酪氨酸以及黄嘌呤的水平,判断所述候选药物是否为目标药物,其中,接触后相比于接触前,结直肠癌模型中所述鹅去氧胆酸、l-酪氨酸以及黄嘌呤的水平升高,是所述候选药物为目标药物的指示。候选药物如果可以进一步升高结直肠癌模型中所述鹅去氧胆酸、l-酪氨酸以及黄嘌呤的水平,则候选药物作为目标药物的可信度进一步提高。根据本发明的实施例,所述方法进一步包括:比较接触前后预测评分,所述接触前的预测评分为0.455~1,以及所述接触后的预测评分不在0.455~1的范围内,是所述候选药物为目标药物的指示,其中,所述预测评分是基于如下公式获得的:3.178-1.27*10-6mcdca+4.01*10-5mdihydrothymine-3.66*10-7mtyrosine-1.27*10-6mxanthine,其中,所述结直肠癌模型为动物模型,mcdca为鹅去氧胆酸在所述动物模型血浆中的浓度,mdihydrothymine为二氢胸腺嘧啶在所述动物模型血浆中的浓度,mtyrosine为l-酪氨酸在所述动物模型血浆中的浓度,mxanthine为黄嘌呤在所述动物模型血浆中的浓度。发明人在实验过程中,为了评估代谢物生物标志物的临床表现,在血浆训练集中构建了lasso判别模型(如上述所述公式)并应用于血浆外部验证集,并将预测评分的诊断标准(或称为“lasso风险评分”)设定为0.455。所述接触后预测评分低于设定值0.455,则可认为候选药物为目标药物。根据本发明实施例的方法采用上述评估方式,所筛选出的目标药物的可信度更高。在本发明的第五方面,本发明提出了一种结直肠癌动物模型。根据本发明的实施例,与非癌动物相比,所述动物模型血浆中二氢胸腺嘧啶水平高。根据本发明的实施例,上述结直肠癌动物模型还可以进一步包括如下附加技术特征至少之一:根据本发明的实施例,进一步包括,与非癌动物相比,所述动物模型血浆中鹅去氧胆酸、l-酪氨酸以及黄嘌呤至少之一的水平低。其中,“非癌动物”是指不患任何癌症的动物。根据本发明的实施例,进一步包括,与非癌动物相比,所述动物模型血浆中鹅去氧胆酸、l-酪氨酸以及黄嘌呤的水平低。在本发明的第六方面,本发明提出了一种计算机可读介质。根据本发明的实施例,所述计算机可读介质中存储有指令,所述指令被适于处理执行以便通过下列步骤确定样本是否患有结直肠癌或结直肠癌患者的预后效果,(1)获得所述样本血浆中鹅去氧胆酸的浓度,二氢胸腺嘧啶的浓度,l-酪氨酸的浓度以及黄嘌呤的浓度;(2)基于公式获得预测评分,所述公式如下所示:3.178-1.27*10-6mcdca+4.01*10-5mdihydrothymine-3.66*10-7mtyrosine-1.27*10-6mxanthine,其中,mcdca为鹅去氧胆酸的浓度,mdihydrothymine为二氢胸腺嘧啶的浓度,mtyrosine为l-酪氨酸的浓度,mxanthine为黄嘌呤的浓度;以及(3)基于预测评分,判断样品是否患有结直肠癌或结直肠癌患者的预后效果。如前所述,发明人发现了血浆中二氢胸腺嘧啶、鹅去氧胆酸、l-酪氨酸以及黄嘌呤可作为结直肠癌的生物标志物,发明人依此构建了lasso判别模型(如上述公式所示),以此模型计算预测评分来判断样品是否患有结直肠癌或者结直肠癌患者的预后效果。根据本发明实施例的计算机可读介质能快速、准确地判断出样品是否患有结直肠癌或者结直肠癌患者的预后效果。根据本发明的实施例,上述计算机可读介质还可以进一步包括如下附加技术特征至少之一:根据本发明的实施例,所述预测得分为0.455~1,是样品患有结直肠癌的指示,或预测得分不在0.455~1的范围内,是结直肠癌患者的预后效果良好的指示。在本发明的第七方面,本发明提出了一种用于诊断是否患有结直肠癌或判断结直肠癌患者的预后效果的系统。根据本发明的实施例,所述系统包括:获得装置,所述获得装置用于获得所述样本血浆中鹅去氧胆酸的浓度,二氢胸腺嘧啶的浓度,l-酪氨酸的浓度以及黄嘌呤的浓度;评分装置,所述评分装置与所述获得装置相连,所述评分装置用于基于公式获得预测评分,所述公式如下所示:3.178-1.27*10-6mcdca+4.01*10-5mdihydrothymine-3.66*10-7mtyrosine-1.27*10-6mxanthine,其中,mcdca为鹅去氧胆酸的浓度,mdihydrothymine为二氢胸腺嘧啶的浓度,mtyrosine为l-酪氨酸的浓度,mxanthine为黄嘌呤的浓度;以及判断装置,所述判断装置与所述评分装置相连,所述评分装置用于基于预测评分,判断样品是否患有结直肠癌或结直肠癌患者的预后效果。如前所述,发明人发现了血浆中二氢胸腺嘧啶、鹅去氧胆酸、l-酪氨酸以及黄嘌呤与结直肠癌密切相关,可作为结直肠癌的生物标志物,发明人依此四个生物标志,构建了lasso判别模型,进而获得预测评分,通过预测评分来判断样品是否患有结直肠癌或者结直肠癌患者的预后效果。根据本发明实施例的系统能快速、准确地判断出样品是否患有结直肠癌或者结直肠癌患者的预后效果。根据本发明的实施例,所述预测得分为0.455~1,是样品患有结直肠癌的指示,或预测得分不在0.455~1的范围内,是结直肠癌患者的预后效果良好的指示。附图说明图1是根据本发明实施例的用于诊断是否患有结直肠癌或判断结直肠癌患者的预后效果的系统的示意图;图2是根据本发明实施例的结直肠癌生物样品代谢数据采集情况,其中,(a)结直肠癌患者组织样品代谢数据情况的主成分分析(pca)图,质控(qc)样品分布集中代表数据采集质量稳定可靠,(b)结直肠癌患者血浆样品代谢数据情况的主成分分析(pca)图,质控样品分布集中代表数据采集质量稳定可靠;图3是根据本发明实施例的结直肠癌组织和血浆样本中的代谢失调结果图,其中,(a)结直肠癌组织及血浆代谢物检测总量的条形图,(b)利用有监督的正交偏最小二乘判别分析(opls-da)对结直肠癌组织和癌旁组织样品分类的得分图,(c)利用有监督的正交偏最小二乘判别分析(opls-da)对结直肠癌术前和术后血浆样品分类的得分图,(d)韦恩图展示了结直肠癌组织和血浆中变化代谢物的重合情况,(e)饼图形式将组织血浆共有的代谢物变化情况分成了四部分展示,(f)韦恩图展示了结直肠癌组织和血浆中变化代谢通路的重合情况,(g)热图形式展示了结直肠癌组织和血浆中共有代谢通路的变化情况,红色代表代谢通路表达上调,蓝色代表下调;图4是根据本发明实施例的基于正交偏最小二乘判别分析(opls-da)建立的诊断模型的置换检验结果,结果说明组织和血浆的判别模型均未过拟合,患病组和对照组存在真实的代谢差异;图5是根据本发明实施例的发现肿瘤组织衍生代谢物的分析策略,随后发现血浆中的代谢物生物标志物用于结直肠癌诊断和预后的流程图;图6是根据本发明实施例的发现结直肠癌血浆中肿瘤组织衍生代谢物的相关分析策略的结果图,其中,(a)发现肿瘤组织衍生的血浆差异代谢物的分析策略,(b)筛选出的肿瘤组织衍生的血浆差异代谢物拟合效果的分布情况,红色代表上调的代谢物,绿色代表下调,灰色代表没有进入筛选结果,(c)热图展示了239个肿瘤组织衍生的血浆差异代谢物对于术前术后血浆样品的分类效果,(d)肿瘤组织差异代谢物及肿瘤组织衍生的血浆差异代谢物对于结直肠癌患者分期的分类能力一致性很高;图7是根据本发明实施例的发现结直肠癌的潜在代谢物生物标志物的结果图,其中,(a)10折交叉验证用于拟合lasso回归模型并进行最优生物标志物的筛选,(b)最终四个代谢生物标志物在结直肠癌患者和息肉患者中表达变化的箱式图,(c)肿瘤组织中调节四个血浆代谢生物标志物的重要通路网络图;图8是根据本发明实施例的四种代谢物的确认结果图;图9是根据本发明实施例的用于结直肠癌诊断和预后的潜在代谢物生物标志物的临床验证的结果图,其中,(a)最终四个代谢生物标志物组合的诊断评分模型的效果roc曲线,包括训练集诊断效果及验证集诊断效果,诊断灵敏度均>90%,(b)四个代谢生物标志物组合对于各分期患者的评分情况,(c,d)以四个代谢生物标志物组合风险评分的中位数0.617作为分组标准,评分为高风险的37个患者与低风险36个的患者预后情况,c为总生存曲线图,d为无疾病进展生存曲线图。附图标示:100用于诊断是否患有结直肠癌或判断结直肠癌患者的预后效果的系统,101:获得装置,102:评分装置,103:判断装置。具体实施方式下面详细描述本发明的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。本发明提出了一种用于诊断是否患有结直肠癌或判断结直肠癌患者的预后效果的系统。根据本发明的具体实施例,参考图1,所述系统100包括:获得装置101,所述获得装置101用于获得所述样本血浆中鹅去氧胆酸的浓度,二氢胸腺嘧啶的浓度,l-酪氨酸的浓度以及黄嘌呤的浓度;评分装置102,所述评分装置102与所述获得装置101相连,所述评分装置102用于基于公式获得预测评分,所述公式如下所示:3.178-1.27*10-6mcdca+4.01*10-5mdihydrothymine-3.66*10-7mtyrosine-1.27*10-6mxanthine,其中,mcdca为鹅去氧胆酸的浓度,mdihydrothymine为二氢胸腺嘧啶的浓度,mtyrosine为l-酪氨酸的浓度,mxanthine为黄嘌呤的浓度;以及判断装置103,所述判断装置103与所述评分装置102相连,所述评分装置103用于基于预测评分,判断样品是否患有结直肠癌或结直肠癌患者的预后效果。发明人发现了血浆中二氢胸腺嘧啶、鹅去氧胆酸、l-酪氨酸以及黄嘌呤的含量可作为结肠癌的可靠的代谢生物标志物,发明人依此四个生物标志物,构建了lasso判别模型,即上述公式,进而获得预测评分,通过预测评分可准确判断样品是否患有结直肠癌或者结直肠癌患者的预后效果。根据本发明实施例的系统能快速、准确地判断出样品是否患有结直肠癌或者结直肠癌患者的预后效果。根据本发明的实施例,所述预测得分为0.455~1,是样品患有结直肠癌的指示,或预测得分不在0.455~1的范围内,是结直肠癌患者的预后效果良好的指示。以下详细介绍本发明的实施例。实施例1一、材料与方法1.患者纳入标准纳入本发明研究的全部结直肠癌患者及息肉对照人群均来自哈尔滨医科大学附属肿瘤医院结直肠外科,招募于2015年4月至2016年6月。具体的纳入标准如下:1)所有的入选人员在入院前均未接受过其他治疗;2)均未诊断患有其他代谢相关疾病,例如肾病、肝病及其他类型的肿瘤等;3)所有结直肠癌患者均经过明确的病理诊断,并确定了病理分期。病理分期标准,参照国际癌症控制联盟(uicc)2016年第八次修订的tnm分期指南。本发明研究经过了哈尔滨医科大学附属肿瘤医院伦理委员会的批准。全部入选研究对象均签署了知情同意书。2.质谱数据采集平台。超高效液相系统(安捷伦1290系列)与四联飞行时间质谱系统(安捷伦6550系列ifunnelq-tof)串联使用。二、分析结果1.结直肠癌患者肿瘤组织及血浆中的代谢变化发明人首先采用基于色谱质朴联用平台的非靶向代谢组学技术,分析了34例结直肠癌患者的成对组织样品及血浆样品(肿瘤组织vs.癌旁组织;术前血浆vs.术后血浆),从而得到结直肠癌对于集体代谢水平的整体影响情况。患者的临床基线信息见表1的血浆训练集癌症患者部分。为了提高非靶向代谢组学的数据采集覆盖范围,发明人同期采集了全部样品在两个色谱柱(酰胺柱和t3柱)正负离子模式下的代谢数据,可以保证同时覆盖极性和非极性的代谢物。图2主成分分析结果显示,质控样品的数据紧密聚集在一起,表明实验数据采集的质量稳定可靠。实验数据结果显示,结直肠癌组织样品共检测到68020个离子峰,血浆样品检测到34347个离子峰。其中,组织和血浆中发生显著变化(fdr<0.05)的离子峰,分别有18118和10398个(图3a)。图3b显示,正交偏最小二乘判别分析可以将结直肠癌肿瘤组织和癌旁组织区分开,说明肿瘤组织和癌旁组织的代谢水平存在显著差异,图3c显示术前血浆样品和手术切除肿瘤组织后术后血浆的代谢水平也存在差异。200次置换检验检验结果证明正交偏最小二乘判别模型没有过拟合(图4)。这些结果说明结直肠癌对患者的代谢水平影响很大,尤其是在肿瘤组织样品中,代谢水平的变化比血浆更大。发明人进一步比较了结直肠癌组织样品和血浆样品中代谢水平变化的异同。图3d显示,只有不到10%的差异代谢物是同时在肿瘤组织和血浆中都发生了显著变化,且这部分代谢物在肿瘤组织和血浆中的变化方向也不完全相同(图3e)。在通路水平,通过kegg代谢网络富集分析,肿瘤组织和血浆中分别有22个和16个代谢通路发生了显著变化(图3f)。图3g显示共有9个代谢通路在组织和血浆中同时发生了显著变化,其中5个代谢通路在肿瘤组织和术前血浆中均上调,甘氨酸、丝氨酸和苏氨酸代谢则是在肿瘤组织和术前血浆中均下调,而剩余3个代谢通路在肿瘤组织和术前血浆中的变化趋势完全相反。这些结果说明结直肠癌引起的代谢水平变化在肿瘤组织和血浆水平是有很大差异的,利用不同的生物样品研究很可能会得到不同的结论。发现肿瘤组织衍生的血浆代谢物作为结直肠癌诊断的生物标志物存在巨大的挑战。表1.纳入发明研究的结直肠癌患者及息肉对照人群的临床基线资料信息其中,acea:癌胚抗原;bca199:糖抗原199;cca125:糖抗原125;dca724:糖抗原724;eafp:甲胎蛋白;*一些患者没有接受该检查导致数据存在缺失值;#这部分结直肠癌患者的组织和血浆样品首先被用于发现肿瘤组织衍生代谢物。2.发现结直肠癌肿瘤组织衍生的血浆失调代谢物在本发明中,发明人发展了一种新的相关性分析策略用于发现血浆样品中肿瘤组织衍生的代谢物,并从这些代谢物中进一步筛选出了一组代谢生物标志物用于结直肠癌的临床诊断和预后评价(具体研究流程见图5,图6a是相关性分析策略示意图)。34个结直肠癌患者自身配对的组织和血浆样品分别作为组织发现集和血浆发现集,用于肿瘤组织衍生代谢物的发现。首先,结直肠癌组织样品和血浆样品经过单因素差异性分析结合fdr校正后p<0.05,且多因素分析的vip>1的差异代谢物被列入候选,其中组织样品筛选到898个代谢物,血浆样品为689个代谢物。然后,使用spearman秩相关分析方法对689个血浆失调代谢物中的每一个都与898个组织失调代谢物依次进行相关性分析,并筛选出具有统计学意义相关的组织血浆成对代谢物(p<0.05)。接下来,对于每一个血浆失调代谢物,都用与其相关的组织失调代谢物建立随机森林(rf)多因素回归预测模型,用组织代谢物的水平来预测血浆代谢物的水平。其中,回归模型的决定系数r2用来评价模型的拟合效果。在预测的过程中,由同一个患者的组织样品和血浆样品数据建立的预测模型用来产生真实的r2结果,而由来自不同患者的组织样品和血浆样品数据用来建立随机预测模型(置换检验),置换检验进行500次,得到的r2结果用于估计随机效应带来的假阳性结果。累积假阳性比例1%对应的r2值作为定义真实肿瘤组织衍生代谢物的标准。最终,在血浆样品的689个失调代谢物中,有239个代谢物被定义为肿瘤组织衍生代谢物(r2>0.177)。其中,图6b显示171个代谢物在结直肠癌患者血浆中呈现上调趋势,而另外68个代谢物为下调。进一步用层次聚类的方法对这239个肿瘤组织衍生代谢物的分类效果进行评价,图6c显示对术前血浆样品和术后血浆样品的分类效果很好,>90%的血浆样品能够完全分开。同时,发明人分别用同一组34个结直肠癌患者血浆中的肿瘤组织衍生代谢物及肿瘤组织中的失调代谢物对患者的肿瘤临床分期进行预测,分别建立了两个独立的rf回归模型,图6d的结果显示血浆中的239个肿瘤组织衍生代谢物与肿瘤组织中的898个失调代谢物对于患者的临床分期预测都十分准确,更重要的是这两个预测模型的评分具有非常强的相关性(相关系数(r=0.980,p<0.001)。因此,可以认为血浆中的这239个肿瘤组织衍生代谢物能够准确反映结直肠癌患者的肿瘤状态,并具有很大的临床诊断潜力。3.筛选有潜力应用于结直肠癌临床诊断及预后评价的代谢生物标志物由于绝大部分的结直肠癌都是由癌前息肉等良性病变发展而来,所以探索结直肠癌从良性病变发展到癌症代谢变化对于结直肠癌的筛查和预防非常关键。因此,发明人纳入了73名结直肠癌患者及73名性别匹配的息肉对照作为研究对象,用于从239个肿瘤组织衍生代谢物中筛选有临床应用潜力的结直肠癌诊断及预后评价标志物。其中,34名已分析过的结直肠癌患者与性别匹配的34名息肉对照作为血浆训练集,剩余的39名结直肠癌患者及39名性别匹配的息肉对照作为血浆外部验证集。详细的临床基线信息见表1。为了筛选出最优的代谢物组合作为生物标志物,发明人首先建立了lasso回归筛选模型,并利用10折交叉验证的方式确定lasso模型的最优参数,以此作为最优标志物组合的筛选标准(图7a)。最优标志物筛选的这个过程重复了20次,以确保筛选结果的稳定性。最终,在20次筛选过程中均纳入了最优组合的4个代谢物(鹅去氧胆酸,二氢胸腺嘧啶,l-酪氨酸以及黄嘌呤)被确定为结直肠癌的潜在血浆代谢生物标志物,所有4个代谢物的鉴定结果都经过了标准品的比对确认(图8)。单因素分析结果显示这4个代谢物在结直肠癌患者血浆中都发生了显著的代谢异常(图7b)。其中,二氢胸腺嘧啶在结直肠癌患者的血浆中显著上调,而鹅去氧胆酸,l-酪氨酸以及黄嘌呤显著下调(表2)。在相关性分析的阶段,有27个肿瘤组织失调代谢物与筛选出的这4个血浆代谢生物标志物密切相关。这27个肿瘤组织失调代谢物主要存在与以下6个重要代谢通路中:精氨酸与脯氨酸代谢通路,半胱氨酸和蛋氨酸代谢通路,甘油磷脂代谢通路,乙醛酸盐和二羧酸代谢通路,嘌呤代谢通路以及嘧啶代谢通路中(图7c)。表2.纳入最优结直肠癌诊断及预后评价代谢生物标志物的4个血浆代谢物信息色谱柱/离子模式鉴定结果质荷比(da)保留时间(秒)p值a倍数比b酰胺柱/负离子鹅去氧胆酸391.28575.2340.003-1.743酰胺柱/负离子二氢胸腺嘧啶127.051214.7670.0011.608t3/正离子l-酪氨酸182.082120.3140.001-1.215酰胺柱/正离子黄嘌呤115.087194.1260.005-1.133其中,awilcoxon秩和检验结果;b结直肠癌患者与息肉对照人群血浆代谢水平的中位数比值;正值表示在结直肠癌中上调,负值表示在结直肠癌中下调。4.筛选出的代谢生物标志物组合在结直肠癌临床诊断及预后评价的应用为了进一步评价筛选出的4个代谢生物标志物的临床应用潜力,发明人利用血浆训练集的数据拟合了一个最优的lasso判别模型,并直接在血浆外部验证集中进行了效果评价。lasso诊断评分风险模型的具体参数见公式:结直肠癌风险评分=3.718-1.27×10-6mcdca+4.01×10-5mdihydrothymine-3.66×10-7mtyrosine-1.27×10-6mxanthine其中,mcdca为鹅去氧胆酸的浓度,mdihydrothymine为二氢胸腺嘧啶的浓度,mtyrosine为l-酪氨酸的浓度,mxanthine为黄嘌呤的浓度。受试者工作特征曲线(roc曲线,图9a)展示了4个代谢生物标志物建立的lasso诊断评分风险模型在血浆训练集和血浆外部验证集均取得了优异的判别效果(血浆训练集:曲线下面积(auc)=0.868,95%置信区间:0.780~0.955;血浆外部验证集,auc=0.803,95%ci:0.705~0.902)。最佳的诊断风险评分界值为0.455,即大于此界值者可判断为具有较高的结直肠癌患病风险。图9b结果显示,利用此lasso诊断风险评分模型对结直肠癌的诊断效果明显优于利用传统肿瘤标志物cea(以5ng/ml作为诊断标准)。以上结果证明了,本发明筛选出的4个结直肠癌患者血浆中的代谢生物标志物在结直肠癌的早期诊断方面,具有很大的临床应用潜力。发明人进一步将73个结直肠癌患者,按照lasso诊断风险评分的中位数0.617平均分成了低风险组和高风险组,以评价风险评分对于结直肠癌患者预后情况的评估能力。其中,36名患者被定义为低风险组(lowerriskgroup),另外37名患者被定义为高风险组(higherriskgroup)。截止到本发明研究结束,共有7名低风险患者失访,5名高风险患者失访。经kaplan–meier生存分析,两组的总生存时间(os)和无疾病进展生存时间(pfs)均存在显著性差异(图9c,d)。其中,低风险组的中位总生存时间39.09个月(90%置信区间:37.34~40.85)明显长于高风险组的33.96个月(95%置信区间:30.15~37.76,p=0.019);同样的,低风险组的中位总无疾病进展生存时间39.09个月(90%置信区间:37.34~40.85)也明显长于高风险组的30.74个月(95%置信区间:26.35~35.13,p=0.001)。分析结果进一步说明了,结直肠癌血浆样品中的这4个代谢生物标志物在患者的预后评价中也有非常优异的临床应用价值。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1