一种代谢组学数据随机误差的筛选和校正方法

文档序号:9665950阅读:1514来源:国知局
一种代谢组学数据随机误差的筛选和校正方法
【技术领域】
[0001] 本发明涉及分析化学和代谢组学领域。是一种筛选和校正代谢组学数据随机误差 的方法。
【背景技术】
[0002] 代谢组学是研究生物体内源性小分子代谢物动态变化的一门学科,是继基因组 学、转录组学、蛋白质组学后,系统生物学的又一重要分支。代谢物是基因调控的最终产物, 是联系基因型和生物表型的纽带,通过对小分子代谢物的定性和定量分析可直接反映机体 当前的生理状态。近年来,随着分析技术的发展,代谢组学应用已拓展至疾病的早期诊断和 治疗、临床标记物的发现、药物筛选和毒性评价、药物质量控制、功能基因组学、植物学等多 个生命科学研究领域。
[0003] 代谢组学数据质量会直接影响分析结果的可靠性和准确性。但是由于分析过程中 多种不稳定随机因素的影响,如室温、相对湿度和气压等环境条件的变化,分析人员操作 的微小差异以及仪器的不稳定等,都会造成随机误差的存在,从而干扰实验结果。因此需要 发展一种筛选和校正代谢组数据随机误差的分析方法,提高数据质量,保证分析结果的可 靠性。
[0004] 本发明通过计算相邻两个QC样本中代谢物响应强度的比值,将其从小到大排序 后,筛选总比值个数的5%作为离散点,将这5%的离散点平均分配到排序后比值的两端, 从而筛选出代谢组数据中的随机误差。然后利用比值的线性拟合模型对随机误差进行校 正。通过对上述过程的集成化处理,可以准确、高效、高通量的筛选和校正代谢组数据的随 机误差,改善代谢组学数据的质量。

【发明内容】

[0005] 本发明的目的在于建立一种筛选和校正代谢组数据随机误差的分析方法。该方法 的核心技术为利用代谢物的比值构建模型去筛选和校正随机误差。该方法具有筛选和校正 过程简单、结果准确、通路高等特点,适于大规模样品的随机误差的筛选和校正,可广泛地 应用于大规模代谢组学分析。
[0006] 为实现上述目的,本发明采用的技术方案如下:
[0007] -种用于筛选和校正代谢组学数据随机误差的方法,通过计算相邻两个QC样本 中代谢物响应强度的比值,建立模型筛选随机误差,然后利用线性拟合模型对随机误差进 行校正。
[0008] 具体步骤如下:
[0009] 1)QC样本的制作:分别从所有将进行化学轮廓分析的样本中准确称量或移取等 量样本并均匀混合成一个大的样本,即QC样本;
[0010] 2)代谢组学数据的获取:每5-20个待测样本插入一个QC样本,QC样本和待测样 本按照完全相同条件进行样本预处理和基于色谱-质谱方法的代谢组学分析;
[0011] 3)相邻两个QC样品中代谢组数据比值的获取:计算代谢物在相邻两个QC样品中 的响应强度的比值;
[0012] 4)构建模型筛选随机误差:将相邻两个QC样品中代谢物的比值从小到大排序后, 筛选总比值个数的5%作为离散点,将这5%的离散点平均分配到排序后比值的两端,从而 筛选出随机误差;
[0013] 5)两个相邻QC样品中正常比值的获取:筛选到随机误差后,去除含有随机误差的 代谢特征,计算不含有随机误差的正常代谢特征在相邻两个QC样品中的比值;
[0014] 6)线性拟合模型的构建:将正常代谢特征在两个相邻QC样本中的比值,进行从小 到大排序,并进行线性拟合,获得线性拟合模型的公式,将含有随机误差的代谢特征j带入 线性拟合模型的公式中,获得校正因亍
,其中AQCn#AQC、n1},分别代表特征j 在…中未校正的响应值和在QCυ中校正后的响应值;
[0015] 7)校正随机误差:某一含有随机误差的代谢物j在QCn中响应值为AQnj,其校正后 的响应值AQC'nj的可以通过如下公式获得;
[0016]
[0017] 8)利用所建立的筛选和校正代谢组学数据随机误差的方法对所有的QC样本进行 随机误差的筛选和校正;
[0018] 本发明可以有效、准确地筛选和校正代谢组学数据中的随机误差,该数据处理过 程简单方便、通量高、校正效果明显,可以显著地改善代谢组数据的质量。
【附图说明】
[0019] 图1是实施例中筛选随机误差的示意图。
[0020] 图2是实施列中我们建立的筛选和校正随机误差的方法与传统的箱图方法比较 的结果。其中(A)PCA分析中QC样品的欧式距离和皮尔森相关系数,(B)QC样本的RSD分 布图;R和Box分别代表我们建立的筛选和校正随机误差的方法和箱图方法。
【具体实施方式】
[0021] 下面通过实例进一步阐释本发明,实例仅限于说明本发明以便于理解,而非对本 发明的限定。
[0022] 实施例
[0023] 1样品
[0024] 本例以新鲜烟叶为样品,采集河南、云南和贵州三个产地的新鲜烟叶共447 个,-196Γ液氮中保存,运输,液氮条件下研磨,低温冻干,_80°C冰箱储存。每个烟末样本中 分别称量〇.5g,均匀混合,生成一个新的样本,即质量控制(QC)样本。QC样本可以用于建 立气相色谱质谱联用(GC-MS)拟靶标代谢组学方法、评价分析方法的重复性及校正实际样 本代谢组数据的误差。
[0025] 2.随机误差的筛选和校正方法:
[0026] 2. 1GC-MS代谢组学分析
[0027] (1)样品预处理:烟草鲜叶样本从-80°C冰箱中取出,4°C冰箱过夜放置后,室温下 放置1小时。准确称取l〇mg烟草鲜叶样本,加入1. 5mL乙腈/异丙醇/水(3/3/2,v/v/v), 涡旋振荡提取4分钟后,14000rpm离心10分钟,取0. 5mL上清,低温减压干燥。衍生采用肟 化反应和硅烷化反应两步法,第一步加入100μL甲氧胺盐酸盐-吡啶溶液(20mg/mL),37°C 水浴衍生90分钟;第二步加入80mLN-甲基-N-(三甲基硅基)三氟乙酰胺进行硅烷化反 应,反应时间60分钟。取上清lyL用于进样。
[0028] (2)GC-MS分析条件:气相色谱质谱联用的分析在岛津QP2010
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1