1.本发明涉及一种代谢标志物,尤其涉及一种代谢标志物在口腔癌诊断试剂盒制备中的应用。
背景技术:2.代谢组学(metabonomics)是继基因组学、转录组学和蛋白质组学之后,系统生物学的重要组成部分,也是目前组学领域研究热点之一。英国nicholson研究组从毒理学角度分析大鼠尿液成分时提出了代谢组学的概念,认为代谢组是通过考察生物体系受扰动或刺激后(如某个特定基因变异或环境变化后),其代谢产物的变化或代谢产物随时间变化来研究生物体系的代谢途径的一种技术。
3.与传统的代谢研究相比,代谢组学融合了物理学、生物学及分析化学等多学科知识,利用现代化的先进仪器联用分析技术对机体在特定条件下整个代谢产物谱的变化进行检测,并通过特殊的多元统计分析方法研究整体的生物学功能状况。由于代谢组学的研究对象是生物体所有代谢产物,而这些代谢物的产生都是由机体内源性物质发生反应生成的,因此,代谢物的变化也就揭示了内源性物质或是基因水平的变化,这使研究对象从微观基因变为宏观的代谢物、宏观代谢表型的研究使得研究对象更为直观。代谢组学的优势主要有以下5个方面:1.基因组学和蛋白质组学分别从基因和蛋白质层面分析生物活动,而实际上细胞内许多生命活动是发生在代谢物层面的,如细胞信号释放,能量传递,细胞间通信等都是受代谢物调控的;2.与转录组学和蛋白质组学比较,代谢组学专门研究生物体由于基因修饰或外界环境改变引起代谢物的变化,是最接近表型的组学,也是生物体系整体功能或状态的最终体现;3.基因和蛋白表达的有效的微小变化会在蛋白级联反应生成代谢物的过程中得到放大,从而使检测更容易;4.代谢组不需建立序列标签(est)数据库;5.代谢产物和代谢途径在不同的生物体内具有相似性,可进行映射分析。
4.液相色谱-质谱(lc-ms)联用技术虽然起步较晚,但相比其他代谢组学技术具有明显优势。lc-ms适用于分析难挥发或热稳定性差的代谢产物,具有高通量、高分辨率、高灵敏度的特点。超高压液相色谱或超高效液相色谱(uplc)通过采用更小粒径的色谱填料配合更高的压力,实现了更好的分离,具体包括更高的分离能力、更快的分离速度以及更好的灵敏度;串联质谱仪在ms扫描模式下,可实现高低碰撞能量快速切换,同时采集代谢物的一二级质谱信息,结合代谢组学数据处理软件progenesis qi v2.3对质谱信息的解析,在单次分析中可检测和鉴定几百至几千种代谢物。代谢组学流程包括:样品预处理、代谢物提取、lc-ms全扫描检测、数据预处理及统计分析等。
5.口腔癌是发生在口腔的恶性肿瘤的总称,是最常见的恶性肿瘤性疾病之一,治疗方法采用以手术为主的综合治疗,如果手术切除不彻底,术后易复发,且早期口腔癌治疗的预后较好,而中晚期预后则较差,因此口腔癌组织的术中快速识别与鉴定,以及口腔癌的早期诊断是获得良好预后的关键因素。代谢组学检测为口腔癌的快速诊断提供了方便可行的手段。
技术实现要素:6.为了便于口腔癌及癌旁组织的快速识别与鉴定,本发明提供了一种代谢标志物在口腔癌诊断试剂盒制备中的应用,所述代谢标志物选自鞘氨醇、o-磷酸乙醇胺、二氢鞘氨醇、3-脱氢二氢鞘氨醇、d-麦芽糖、糊精、l-犬尿氨酸、5-羟基色氨酸、l-谷氨酸、谷胱甘肽、γ-谷氨酰半胱氨酸、l-天冬氨酸、l-精氨酸、n-乙酰-l-谷氨酸5-半醛、精氨基琥珀酸、pc(18:1(11z)/16:1(9z))和12,13-dhome中的一种或多种。
7.优选地,所述代谢标志物选自鞘氨醇、o-磷酸乙醇胺、二氢鞘氨醇、3-脱氢二氢鞘氨醇、d-麦芽糖、糊精、l-犬尿氨酸、5-羟基色氨酸、l-谷氨酸、γ-谷氨酰半胱氨酸、l-天冬氨酸、l-精氨酸、n-乙酰-l-谷氨酸5-半醛、精氨基琥珀酸和pc(18:1(11z)/16:1(9z))中的一种或多种。
8.进一步优选地,所述代谢标志物选自3-脱氢二氢鞘氨醇、d-麦芽糖、糊精、l-犬尿氨酸、l-谷氨酸、l-天冬氨酸和n-乙酰-l-谷氨酸5-半醛中的一种或多种。
9.优选地,所述代谢标志物包括上述化合物中的至少两种。
10.优选地,所述代谢标志物来自于组织样本,包括癌组织和正常组织样本。
11.在本发明的一种实施方式中,所述代谢标志物包括鞘氨醇、o-磷酸乙醇胺、二氢鞘氨醇和3-脱氢二氢鞘氨醇。
12.在本发明的一种实施方式中,所述代谢标志物包括d-麦芽糖和糊精。
13.在本发明的一种实施方式中,所述代谢标志物包括l-犬尿氨酸和5-羟基色氨酸。
14.在本发明的一种实施方式中,所述代谢标志物包括l-谷氨酸、谷胱甘肽和γ-谷氨酰半胱氨酸。
15.在本发明的一种实施方式中,所述代谢标志物包括l-谷氨酸、l-天冬氨酸、l-精氨酸、n-乙酰-l-谷氨酸5-半醛和精氨基琥珀酸。
16.在本发明的一种实施方式中,所述代谢标志物包括pc(18:1(11z)/16:1(9z))和12,13-dhome。
17.进一步,本发明提供了一种口腔癌诊断试剂盒,所述试剂盒包括用于上述代谢标志物的液相色谱-质谱联合检测所需试剂,如甲醇、甲酸、水、乙腈、内标等。
18.优选地,所述口腔癌诊断试剂盒还包括用于上述代谢标志物的液相色谱-质谱联合检测所需耗材,如色谱柱等。
19.优选地,所述口腔癌诊断试剂盒的检测样本为组织样本。
20.优选地,所述试剂盒为鞘脂代谢通路联合指标口腔癌诊断试剂盒,其中代谢标志物包括鞘氨醇、o-磷酸乙醇胺、二氢鞘氨醇和3-脱氢二氢鞘氨醇。
21.优选地,所述试剂盒为淀粉与蔗糖代谢通路联合指标口腔癌诊断试剂盒,其中代谢标志物包括d-麦芽糖和糊精。
22.优选地,所述试剂盒为犬尿氨酸代谢通路联合指标口腔癌诊断试剂盒,其中代谢标志物包括l-犬尿氨酸和5-羟基色氨酸。
23.优选地,所述试剂盒为铁死亡通路联合指标口腔癌诊断试剂盒,其中代谢标志物包括l-谷氨酸、谷胱甘肽和γ-谷氨酰半胱氨酸。
24.优选地,所述试剂盒为精氨酸代谢通路联合指标口腔癌诊断试剂盒,其中代谢标志物包括l-谷氨酸、l-天冬氨酸、l-精氨酸、n-乙酰-l-谷氨酸5-半醛和精氨基琥珀酸。
25.优选地,所述试剂盒为亚油酸代谢通路联合指标口腔癌诊断试剂盒,其中代谢标志物包括pc(18:1(11z)/16:1(9z))和12,13-dhome。
26.本发明提供了一组可用于口腔癌及癌旁组织识别与鉴定的代谢标志物,这些标志物在口腔癌组织和癌旁组织(正常组织)中的含量具有显著差异,通过lc-ms检测这些标志物的含量可快速识别出癌组织和正常组织,该方法非常适用于术中或术后快速识别外科切缘,有助于肿瘤组织的彻底切除,此外该方法也可用于辅助口腔癌的早期诊断,以便获得良好的预后。
27.根据上述方法设计的口腔癌诊断试剂盒可进一步提高代谢标志物检测的效率,加快癌组织的术中识别。肿瘤往往具有多个代谢通路的改变,本发明将上述代谢标志物分组,设计出了针对不同通路的检测试剂盒,可在肿瘤筛查或者测定前,根据需要选用不同的代谢物检测试剂盒进行检测。
28.以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
29.图1是本发明实施例中经7次循环交叉验证得到的pca模型图;
30.图2是本发明实施例中p值、vip倍数变化值可视化的火山图;
31.图3是本发明实施例中差异代谢产物鞘氨醇的roc曲线图;
32.图4是本发明实施例中差异代谢产物o-磷酸乙醇胺的roc曲线图;
33.图5是本发明实施例中差异代谢产物二氢鞘胺醇的roc曲线图;
34.图6是本发明实施例中差异代谢产物3-脱氢二氢鞘氨醇的roc曲线图;
35.图7是本发明实施例中差异代谢产物d-麦芽糖的roc曲线图;
36.图8是本发明实施例中差异代谢产物糊精的roc曲线图;
37.图9是本发明实施例中差异代谢产物l-犬尿氨酸的roc曲线图;
38.图10是本发明实施例中差异代谢产物5-羟基色氨酸的roc曲线图;
39.图11是本发明实施例中差异代谢产物l-谷氨酸的roc曲线图;
40.图12是本发明实施例中差异代谢产物谷胱甘肽的roc曲线图;
41.图13是本发明实施例中差异代谢产物γ-谷氨酰半胱氨酸的roc曲线图;
42.图14是本发明实施例中差异代谢产物l-天冬氨酸的roc曲线图;
43.图15是本发明实施例中差异代谢产物l-精氨酸的roc曲线图;
44.图16是本发明实施例中差异代谢产物n-乙酰-l-谷氨酸5-半醛的roc曲线图;
45.图17是本发明实施例中差异代谢产物精氨基琥珀酸的roc曲线图;
46.图18是本发明实施例中差异代谢产物pc(18:1(11z)/16:1(9z))的roc曲线图;
47.图19是本发明实施例中差异代谢产物12,13-dhome的roc曲线图;
48.图20是本发明实施例中鞘脂代谢通路联合指标的roc曲线图;
49.图21是本发明实施例中淀粉与蔗糖代谢通路联合指标的roc曲线图;
50.图22是本发明实施例中犬尿氨酸代谢通路联合指标的roc曲线图;
51.图23是本发明实施例中铁死亡通路联合指标的roc曲线图;
52.图24是本发明实施例中精氨酸代谢通路联合指标的roc曲线图;
53.图25是本发明实施例中亚油酸代谢通路联合指标的roc曲线图。
具体实施方式
54.实施例1组织样本的lc-ms定量检测
55.本实施例采集了69名口腔癌患者手术切除的组织样本,经病理诊断后,将这些样本分为癌组织样本(t组)和对应的癌旁组织样本(n组),并对这138个样本进行了lc-ms定量检测。
56.试剂:甲醇、甲酸、水、乙腈均购自thermo公司,l-2-氯苯丙氨酸购自上海恒创生物科技有限公司。所有化学药品和溶剂均为分析纯或色谱级。
57.仪器:全自动样品快速研磨仪(jxfstprp-24/32)购自上海净信实业发展有限公司,超声波清洗机(f-060sd)购自深圳福洋科技集团有限公司,台式高速冷冻离心机(tgl-16ms)购自上海卢湘仪离心机仪器有限公司,高分辨质谱仪(qe plus)和高效液相色谱仪(dionex u3000 uhplc)购自赛默飞世尔科技公司,acquity uplc hss t3(100mm
×
2.1mm,1.8um)色谱柱购自waters公司。
58.方法:
59.一、前处理
60.1.称取30mg组织样本到1.5ml ep管中,加入内标(l-2-氯苯丙氨酸,0.3mg/ml,甲醇配制)20μl,加入600μl甲醇-水(v:v=4:1);
61.2.加入两个小钢珠,在-20℃冰箱中预冷2min后,放入研磨机中研磨(60hz,2min);
62.3.-20℃下静置2小时;
63.4.离心10min(13000rpm,4℃),用注射器吸取150μl的上清液,使用0.22μm的有机相针孔过滤器过滤后,转移到lc进样小瓶,-80℃下保存,直到进行lc-ms分析;
64.5.质控样本(qc)由癌样本组及癌旁样本组内所有样本的提取液等体积混合制备而成,qc的体积与样本相同。质谱上机过程中,在样本间穿插qc样本,qc样本用于评价整个实验过程中系统质谱平台的稳定性。
65.备注:所有提取试剂使用前均在-20℃进行预冷。
66.二、液相色谱-质谱分析条件
67.本次实验的分析仪器为dionex u3000 uhplc超高效液相串联qe plus高分辨质谱仪组成的液质联用系统。
68.色谱条件:色谱柱:acquity uplc hss t3(100mm
×
2.1mm,1.8um);柱温:45℃;流动相:a-水(含0.1%甲酸),b-乙腈(含0.1%甲酸);流速:0.35ml/min;进样体积:2μl。
69.洗脱梯度:
70.时间(min)a%b%095529554703085050102080140100
15010015.195516955
71.质谱条件:离子源:esi;样品质谱信号采集分别采用正负离子扫描模式。
72.质谱参数:
[0073][0074][0075]
实施例2数据分析及差异代谢物筛选
[0076]
1.基峰图
[0077]
bpc(base peak chromatogram,基峰图)是将每个时间点质谱图中最强的离子的强度连续描绘得到的图谱,根据bpc中各种代谢物与内标化合物离子强度的比例可计算出各种代谢物在不同样本中的含量。
[0078]
2.qc样本质控
[0079]
qc样本在样本检测前用于平衡“色谱-质谱”系统,在样本检测过程中用于评价质谱系统的稳定性。
[0080]
(1)qc样本的rsd筛选
[0081]
删除qc组rsd》0.4的离子峰。相对标准偏差(relative standard deviation,rsd)是标准偏差与测量结果算术平均值的比值,一种量度数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,反之亦然。
[0082]
(2)qc样本主成分分析
[0083]
主成分分析法(principle component analysis)是一种非监督数据分析方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,使他们尽可能多的反映原有的变量信息,以此达到降维目的。同时对系统稳定性进行评价,如图1所示为经7-fold cross-validation(7次循环交叉验证)得到的pca模型图,其中浅色三角形为癌组织(t)样本,深色正方形为癌旁组织(n)样本,从图中可以看出qc样本紧密聚集在一起,表明此实验过程中仪器检测稳定性较好。
[0084]
3.数据预处理
[0085]
(1)progenesis qi v2.3的定性分析:
[0086]
数据预处理在进行模式识别之前,原始数据经代谢组学处理软件progenesis qi v2.3软件(nonlinear dynamics,newcastle,uk)进行基线过滤、峰识别、积分、保留时间校正、峰对齐和归一化,其主要参数为:
[0087]
precursor tolerance:5ppm;product tolerance:10ppm;product ion threshold:5%。
[0088]
化合物的鉴定基于精确质量数、二级碎片以及同位素分布,使用emdb数据库进行定性。emdb数据库针对人、动物建立专属代谢物数据库,数据库包含3600+代谢物,其中涵盖氨基酸、脂质、核苷酸、碳水化合物、维生素和辅助因子、激素等,包含代谢物结构、质谱数据等,旨在更专业的通过代谢组学解决生物学问题。
[0089]
(2)定性定量结果
[0090]
对提取到的数据,删除组内缺失值均(0值)》50%的离子峰,并将0值以最小值的一半替换,并根据化合物定性结果打分(score)对定性得到的化合物进行筛选,筛选标准为36分(满分60分),36分以下视为定性结果不准确并删除。最后将正负离子数据合并成一个数据矩阵表,该矩阵包含了原始数据提取到的所有可以用于分析的信息,后续分析均以此为基础。
[0091]
4.差异代谢物筛选
[0092]
(1)采用多维分析和单维分析相结合的办法来筛选组间差异代谢产物。opls-da分析中,变量权重值(variable important in projection,vip)可用来衡量各代谢物的表达模式对各组样本分类判别的影响强度和解释能力,挖掘具有生物意义的差异代谢物,vip越大说明该变量对分组的贡献越大,进一步利用t检验验证组间差异代谢物是否具有显著性。筛选的标准为opls-da模型第一主成分的vip值》1,t检验的p-value值《0.05。
[0093]
(2)qc样本层次聚类
[0094]
为了更直观的展示qc样本与其他样本之间的关系及qc样本间的稳定性,我们对所有代谢物表达量进行层次聚类(hierarchical clustering)。
[0095]
(3)vip及fold change值可视化
[0096]
利用火山图可以对p值、vip和倍数变化(fold change)值进行可视化,有利于筛选差异代谢产物。如图2所示,其中深灰色原点代表在实验组中显著上调的差异代谢产物,黑色原点代表显著下调的差异代谢产物,浅灰色点代表不显著的差异代谢产物。
[0097]
本实施例筛选出的差异代谢产物包括:鞘氨醇、o-磷酸乙醇胺、二氢鞘氨醇、3-脱氢二氢鞘氨醇、d-麦芽糖、糊精、l-犬尿氨酸、5-羟基色氨酸、谷氨酸、谷胱甘肽、γ-谷氨酰半胱氨酸、l-天冬氨酸、精氨酸、n-乙酰-l-谷氨酸5-半醛、精氨基琥珀酸、pc(18:1(11z)/16:1(9z))和12,13-dhome。
[0098]
上述差异代谢产物的单个指标检测效能(auc值)如下表所示:
[0099][0100][0101]
本发明附图中的术语“灵敏度”、“特异度”的含义是本领域已知的,auc值为代谢物roc曲线下的面积,理论上auc值在0.5到1之间,其值越接近1诊断价值越大,从上表中的数据可以看出这些代谢物的预测价值均较高,其中auc值超过0.7的代谢物的预测价值更高,尤其是auc值超过0.85为最佳。
[0102]
5.代谢通路富集分析
[0103]
差异代谢物通路富集分析有助于理解在差异样品中代谢途径变化机制。基于kegg数据库对差异代谢物进行代谢通路富集分析。kegg(https://www.kegg.jp/)数据库的构建旨在了解生物系统(如细胞、组织等)中基因、蛋白及代谢物的功能及相互作用关系。可以查询到与代谢物相关的代谢通路、人类疾病及药物研发等信息。
[0104]
本实施例通过对上述差异代谢物的通路富集分析,发现了几组通路的联合代谢物指标,如下表所示:
[0105][0106][0107]
从上表可知,各通路联合指标的auc值均大于组中单一指标的auc值,上述各通路的联合auc值均大于0.85,它们可作为联合检测标志物应用于口腔癌诊断中,特别是口腔癌及癌旁组织的快速识别与鉴定中。
[0108]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。