一种代谢组学数据随机误差的筛选和校正方法

文档序号：9665950阅读：1540来源：国知局

一种代谢组学数据随机误差的筛选和校正方法
【技术领域】
[0001] 本发明涉及分析化学和代谢组学领域。是一种筛选和校正代谢组学数据随机误差的方法。
【背景技术】
[0002] 代谢组学是研究生物体内源性小分子代谢物动态变化的一门学科，是继基因组学、转录组学、蛋白质组学后，系统生物学的又一重要分支。代谢物是基因调控的最终产物，是联系基因型和生物表型的纽带，通过对小分子代谢物的定性和定量分析可直接反映机体当前的生理状态。近年来，随着分析技术的发展，代谢组学应用已拓展至疾病的早期诊断和治疗、临床标记物的发现、药物筛选和毒性评价、药物质量控制、功能基因组学、植物学等多个生命科学研究领域。
[0003] 代谢组学数据质量会直接影响分析结果的可靠性和准确性。但是由于分析过程中多种不稳定随机因素的影响，如室温、相对湿度和气压等环境条件的变化，分析人员操作的微小差异以及仪器的不稳定等，都会造成随机误差的存在，从而干扰实验结果。因此需要发展一种筛选和校正代谢组数据随机误差的分析方法，提高数据质量，保证分析结果的可靠性。
[0004] 本发明通过计算相邻两个QC样本中代谢物响应强度的比值，将其从小到大排序后，筛选总比值个数的5%作为离散点，将这5%的离散点平均分配到排序后比值的两端，从而筛选出代谢组数据中的随机误差。然后利用比值的线性拟合模型对随机误差进行校正。通过对上述过程的集成化处理，可以准确、高效、高通量的筛选和校正代谢组数据的随机误差，改善代谢组学数据的质量。

【发明内容】

[0005] 本发明的目的在于建立一种筛选和校正代谢组数据随机误差的分析方法。该方法的核心技术为利用代谢物的比值构建模型去筛选和校正随机误差。该方法具有筛选和校正过程简单、结果准确、通路高等特点，适于大规模样品的随机误差的筛选和校正，可广泛地应用于大规模代谢组学分析。
[0006] 为实现上述目的，本发明采用的技术方案如下：
[0007] -种用于筛选和校正代谢组学数据随机误差的方法，通过计算相邻两个QC样本中代谢物响应强度的比值，建立模型筛选随机误差，然后利用线性拟合模型对随机误差进行校正。
[0008] 具体步骤如下：
[0009] 1)QC样本的制作：分别从所有将进行化学轮廓分析的样本中准确称量或移取等量样本并均匀混合成一个大的样本，即QC样本；
[0010] 2)代谢组学数据的获取：每5-20个待测样本插入一个QC样本，QC样本和待测样本按照完全相同条件进行样本预处理和基于色谱-质谱方法的代谢组学分析；
[0011] 3)相邻两个QC样品中代谢组数据比值的获取：计算代谢物在相邻两个QC样品中的响应强度的比值；
[0012] 4)构建模型筛选随机误差：将相邻两个QC样品中代谢物的比值从小到大排序后，筛选总比值个数的5%作为离散点，将这5%的离散点平均分配到排序后比值的两端，从而筛选出随机误差；
[0013] 5)两个相邻QC样品中正常比值的获取：筛选到随机误差后，去除含有随机误差的代谢特征，计算不含有随机误差的正常代谢特征在相邻两个QC样品中的比值；
[0014] 6)线性拟合模型的构建：将正常代谢特征在两个相邻QC样本中的比值，进行从小到大排序，并进行线性拟合，获得线性拟合模型的公式，将含有随机误差的代谢特征j带入线性拟合模型的公式中，获得校正因亍
，其中AQCn#AQC、n1},分别代表特征j 在…中未校正的响应值和在QCυ中校正后的响应值；
[0015] 7)校正随机误差：某一含有随机误差的代谢物j在QCn中响应值为AQnj，其校正后的响应值AQC'nj的可以通过如下公式获得；
[0016]
[0017] 8)利用所建立的筛选和校正代谢组学数据随机误差的方法对所有的QC样本进行随机误差的筛选和校正；
[0018] 本发明可以有效、准确地筛选和校正代谢组学数据中的随机误差，该数据处理过程简单方便、通量高、校正效果明显，可以显著地改善代谢组数据的质量。
【附图说明】
[0019] 图1是实施例中筛选随机误差的示意图。
[0020] 图2是实施列中我们建立的筛选和校正随机误差的方法与传统的箱图方法比较的结果。其中（A)PCA分析中QC样品的欧式距离和皮尔森相关系数，（B)QC样本的RSD分布图；R和Box分别代表我们建立的筛选和校正随机误差的方法和箱图方法。
【具体实施方式】
[0021] 下面通过实例进一步阐释本发明，实例仅限于说明本发明以便于理解，而非对本发明的限定。
[0022] 实施例
[0023] 1样品
[0024] 本例以新鲜烟叶为样品，采集河南、云南和贵州三个产地的新鲜烟叶共447 个，-196Γ液氮中保存，运输，液氮条件下研磨，低温冻干，_80°C冰箱储存。每个烟末样本中分别称量〇.5g，均匀混合，生成一个新的样本，即质量控制（QC)样本。QC样本可以用于建立气相色谱质谱联用（GC-MS)拟靶标代谢组学方法、评价分析方法的重复性及校正实际样本代谢组数据的误差。
[0025] 2.随机误差的筛选和校正方法：
[0026] 2. 1GC-MS代谢组学分析
[0027] (1)样品预处理：烟草鲜叶样本从-80°C冰箱中取出，4°C冰箱过夜放置后，室温下放置1小时。准确称取l〇mg烟草鲜叶样本，加入1. 5mL乙腈/异丙醇/水（3/3/2,v/v/v)，涡旋振荡提取4分钟后，14000rpm离心10分钟，取0. 5mL上清，低温减压干燥。衍生采用肟化反应和硅烷化反应两步法，第一步加入100μL甲氧胺盐酸盐-吡啶溶液（20mg/mL)，37°C 水浴衍生90分钟；第二步加入80mLN-甲基-N-(三甲基硅基）三氟乙酰胺进行硅烷化反应，反应时间60分钟。取上清lyL用于进样。
[0028] (2)GC-MS分析条件：气相色谱质谱联用的分析在岛津QP2010

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：林晓惠;郝志强;赵燕妮;许国旺;路鑫;
技术所有人：大连理工大学;
我是此专利的发明人

上一篇：检测左卡尼汀中对映异构体含量的方法
上一篇：一种水果中类胡萝卜素合成能力的检测方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、邢老师：1.机械设计及理论 2.生物医学材料及器械 3.声发射检测技术。
2、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
3、王老师：1.机器人 2.嵌入式控制系统开发
4、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。