生成用于靶向质谱分析的包含列表的方法与流程

文档序号:15228767发布日期:2018-08-21 19:05阅读:417来源:国知局

本发明涉及基于定量的质谱法。更具体地说,本发明涉及使用对应的同量异位标记肽的分析结果来生成用于靶向质谱分析的包含列表。



背景技术:

使用质谱法的蛋白质定量需要样品制备、仪器操作和软件的集成。用以改进敏感度和全面性的策略一般需要大量样品和多维分馏,这牺牲了处理量。替代地,努力改进蛋白质定量的敏感度和处理量必然限制了可监测到的特征数目。出于此原因,蛋白质组学研究通常划分成两个类别:探索和靶向蛋白质组学。

探索蛋白质组学实验打算在较广动态范围内鉴别尽可能多的蛋白质。这通常需要消耗极大量的蛋白质、富集相关馏分和分馏以降低样品复杂度。

定量探索蛋白质组学实验通常利用同位素标记法,例如用同量异位标签和同位素编码亲和标签(icat)进行标记以对蛋白质定量。可以串联质量标签(tmt)试剂(由赛默飞世尔科技(thermofisherscientific)出售)形式商购的同量异位标签以及用于相对和绝对定量(itraq)试剂(由爱博才思(absciex)出售)的同量异位标签已经被反复证明是在小规模和大规模蛋白质组学研究两者中获得相对蛋白质定量并且提供同时比较多达十种不同的处理、时间点或样品的强大能力的便捷方式。这些蛋白质标记策略将同位素并入蛋白质和肽中,从而产生不同的质量偏移但其它方面相同(在标记有试剂组的不同同位素的肽之间)的化学属性。这允许在处理和液相色谱-串联质谱(lc-ms/ms)分析之前标记并组合数个样品。此多元化降低了样品处理可变性,通过根据每种条件同时对蛋白质定量改进了特异性,并且需要更少的液相色谱-质谱(lc-ms)和数据分析时间。

虽然存在与质量标注盒相关的一些成本,但可以高效多元化方式用单个lcms实验在多个样品上对数万蛋白质(表示例如不同疾病病况)进行鉴别和定量。许多很重要并显著调节的感兴趣蛋白质靶通常在这些研究中出现,并且变成使用高度敏感并稳固的靶向技术的未来常规分析的对象,而没有额外的费用或同量异位标记步骤。

靶向蛋白质组学实验通常被设计成定量具有极高精确度、敏感度、特异性和处理量的少于一百种蛋白质。靶向ms定量策略使用专门的工作流程和仪器来改进数百或数千样品上有限数目的特征的特异性和定量。这些方法通常使样品制备的量最小化来改进精确度和处理量。

靶向定量蛋白质组工作流程通常涉及在对质谱仪仪器进行lc-ms/ms分析之前进行蛋白质变性、还原、烷化、消化和脱盐,所述质谱仪仪器能够通过监测感兴趣肽的比质量窗口来对肽定量,使隔离的肽碎片化,并且接着对特异于感兴趣肽的数个碎片离子定量。此获取策略的选择反应监测(srm)是常见实例,所述获取策略与色谱保留时间信息一起提供极高敏感度、特异性、动态范围和处理量。

不幸的是,当前工作流程使得重要的肽的同量异位标记探索定量与常规靶向无标记定量之间存在严重脱节。因为同量异位标记不仅更改了肽的质量,而且还更改了其电荷(在离子化时)和疏水性,所以靶向来自同量异位实验的高度调节肽并不简单。然而,当靶向肽列表长时间生长时,使用分析物的保留时间对分析物进行时序安排对于可再生的定量很重要。这通常需要使用例如基于探索定量的数据独立获取(dia)或ms1等无标记定量技术来进行中间验证步骤,所述无标记定量技术可能在性能、样品、仪器时间和试剂方面成本较高。虽然有可能使用无标记探索蛋白质组学并且接着直接转换成关键的肽的靶向常规定量,但必须执行多个连续分析以递送在单个多元化同量异位标记实验中获取的相同信息。

需要用于从多元化同量异位标记探索定量直接转变成常规无标记靶向定量而没有中间验证步骤的方法和系统。



技术实现要素:

本文中公开的用于将同量异位标记实验的结果转变成用于靶向质谱定量的包含列表的方法和系统。根据本发明的一个实施例,公开一种生成用于靶向质谱分析的包含列表的方法。所述方法包含在计算机处接收多种感兴趣的同量异位标记肽的以实验方式获取的数据。数据包含同量异位标记肽中的每一种的质荷比(m/z)、电荷状态和色谱保留时间。方法还包含对于同量异位标记肽中的每一种,通过计算机确定对应未标记肽的预测属性。预测属性包含预测m/z、预测电荷状态和预测色谱保留时间。方法进一步包含将每种对应未标记肽的预测属性存储到包含列表。基于同量异位标记肽和对应未标记肽的疏水性指数以及靶向质谱分析的色谱条件而确定对应未标记肽的预测色谱保留时间。

在一个实施例中,预测属性进一步包含预测碎片离子m/z。

以实验方式获取的数据还可包含每种肽的氨基酸序列。

在一个实施例中,基于对应未标记肽的预测色谱保留时间与参照肽的以实验方式获取的色谱保留时间的关系而确定对应未标记肽的预测色谱保留时间。参照肽可以是但不限于肽保留时间校准(prtc)混合物中的至少一种肽。

同量异位标记肽可以是但不限于串联质量标签(tmt)标记肽、用于相对和绝对定量(itraq)标记肽的同量异位标签、组合性同量异位质量标签(cmt),或n,n-二甲基化亮氨酸(dileu)同量异位标签。

在一个实施例中,靶向质谱分析包括msn定量。msn定量可以是但不限于并行反应监测(prm)、选择反应监测(srm)或同步前体选择(sps)。

在一个实施例中,使用序列特异性保留时间计算工具来计算对应未标记肽的疏水性指数。

在本发明的另一实施例中,提供一种生成用于靶向质谱分析的包含列表的方法。所述方法包含在计算机处接收多种感兴趣的同量异位标记肽的以实验方式获取的数据。数据包含同量异位标记肽中的每一种的m/z、电荷状态和色谱保留时间。方法还包含对于同量异位标记肽中的每一种,通过计算机确定对应未标记肽的预测属性。预测属性包含预测m/z、预测电荷状态、预测碎片离子m/z和预测色谱保留时间。方法进一步包含将每种对应未标记肽的预测属性存储到包含列表。基于同量异位标记肽和对应未标记肽的疏水性指数以及靶向质谱分析的色谱条件,并且基于对应未标记肽的预测色谱保留时间与参照肽的以实验方式获取的色谱保留时间的关系而确定对应未标记肽的预测色谱保留时间。

在本发明的另一实施例中,提供一种从多元化同量异位标记定量直接转变成未标记靶向定量的方法。方法包含获取多种感兴趣同量异位标记肽的保留时间、电荷状态和m/z。方法还包含基于所获取的保留时间而计算同量异位标记肽的疏水性指数。方法进一步包含基于同量异位标记肽的疏水性指数而计算对应无标记形式的肽的疏水性指数。方法还包含基于无标记形式的肽的所计算疏水性指数而确定无标记肽的预测保留时间、m/z值和电荷状态。

附图说明

图1展示根据本发明的一个实施例的生成用于靶向质谱分析的包含列表的过程的广泛概述。

图2是说明根据本发明的一个实施例的涉及生成用于靶向质谱分析的包含列表的工作流程的图式。

图3a到3c是展示根据本发明的一个实施例的生成用于靶向质谱分析的包含列表的方法的一系列图表。

图4是说明根据本发明的一个实施例的生成用于靶向质谱分析的包含的方法的流程图。

图5展示用于生成包含列表的数据,所述包含列表从感兴趣的tmt标记肽的定量结果开始,直到对应无标记预测属性的列表。无标记肽的实验保留时间展示在表中最右列上。

具体实施方式

本发明的实施例涉及将同量异位标记实验的结果直接转变成用于无标记靶向质谱分析或定量的包含列表的系统和方法。

如本文中所使用,术语“保留时间”指代首先将样品引入到色谱柱中并从色谱柱中洗脱所经过的时间。

图1展示根据本发明的一个实施例的生成用于靶向质谱分析的包含列表的过程的广泛概述。第一步骤涉及接收在同量异位多元化探索定量研究中所生成的数据。一般来说,同量异位多元化探索定量实验涉及:分别制备数个样品;对样品进行酶消化以产生断裂的肽;将来自同量异位标记试剂组的不同试剂添加到样品中的每一个,以标记其中所含的肽;组合标记样品;以及接着通过串联或msn质谱法来分析组合样品。共洗脱标记肽的碎片化产生特征性的低质量报告体离子,其中每种报告体离子物种对应于组合样品中的不同样品。可使用产物离子谱的报告体离子强度来确定样品中的特异性肽的相对量。在一个说明性实例中,样品包含从患病动物/人类的生物组织或流体中提取的第一组样品,和从健康(对照组)动物/人类的生物组织或流体中提取的第二组样品,并且实验意图鉴别一个组中相对于另一组有差异地表达(即,以较高或较低量存在)的肽;所鉴别的肽可作为生物标志物候选物而得以进一步研究。通过数据分析软件(例如来自赛默飞世尔科技的proteomediscoverer软件)来处理由质谱仪生成的谱数据,以提供在样品中所鉴别的标记肽和各样品上标记肽的相对量的列表。列表将进一步包含每种标记肽的保留时间、前体离子质荷比(m/z)和电荷状态。可以自动、半自动或完全人工的方式处理此列表,以选择感兴趣的一组肽(例如展示疾病与对照组样品之间的高度区分的肽)来进行无标记靶向分析。

应认识到,虽然前述实例描述了标记通过蛋白水解消化产生的肽,但其它实施方案可放弃消化并替代地标记样品中所含有的完整蛋白质。

如上文所描述,通过执行多元化探索定量实验并从结果中选择感兴趣肽而导出的肽列表包含针对标记版本的感兴趣肽,即键结到标记部分的肽而测得的属性(保留时间、m/z、电荷状态)。为了设定用以测量无标记肽的靶向定量实验,需要确定无标记版本的感兴趣肽的属性。本发明的实施例不需要使用例如基于探索定量的dia或ms1等无标记定量技术的中间验证步骤,所述无标记定量技术可能在性能、样品、仪器时间和试剂方面成本较高,并且本发明的实施例准许从多元化探索定量直接转变成常规无标记靶向定量。

图2是说明根据本发明的一个实施例的涉及生成用于靶向质谱分析的包含列表的工作流程的图式。使用同量异位标记样品的多元化探索实验10输出同量异位标记探索定量结果15。这些结果包括但不限于针对标记版本的肽而确定的所鉴别肽和对应属性(m/z值、电荷状态和保留时间)的列表,所述肽可以下文所论述的方法来使用以计算待用于无标记靶向定量的属性。

当执行靶向实验以对无标记肽定量时,极其有利的是可靠地预测靶向分析物的保留时间,使得可操作仪器以仅监测预期在特定色谱时间点处从色谱柱中洗脱的那些分析物。此操作避免了由于监测对应于预期不存在的分析物的转换而导致浪费仪器时间。

作为半经验度量的疏水性指数是一种类型的保留时间预测指数。可针对每种肽,基于肽m/z、电荷状态和色谱保留时间而计算疏水性指数的值。已发现在反相高压液体色谱仪中观察到的肽保留时间取决于肽疏水性,并且可关于疏水性指数模型化。

在一个实施例中,可使用序列特异性保留时间计算器工具来计算每种所鉴别并定量的感兴趣肽序列的疏水性指数,所述序列特异性保留时间计算器工具根据氨基酸组合物和肽的序列来估计保留时间(例如krokhin的“sequence-specificretentioncalculator.algorithmforpeptideretentionpredictioninion-pairrp-hplc:applicationto300-and100-aporesizec18sorbents,analyticalchemistry,第78卷,第22号,第7785-95页(2006)中所描述的ssrcalc算法,所述算法以引用的方式并入本文中)。还可使用用于转换这些肽或使其碎片化的仅含有先前观测到的电荷状态的任选外部库20来确定其预测保留时间25,但外部库20并非必需的。供应具有肽亲本m/z、电荷状态和保留时间的包含列表30以执行靶向定量实验35。

如上文所提及,包含列表是对已针对ms/ms或msn分析而鉴别并选择的一种或多种肽、m/z值、电荷状态和保留时间的编译或列举。在msn扫描中,选择在调查扫描中检测到的特异性离子以进入碰撞室。msn通过包含列表定义离子的能力允许针对特异性前体获取数据。接着通过质谱法再次分析在碰撞室中生成的一系列碎片,并且记录所得质谱,并且可使用所述质谱来鉴别特定肽的氨基酸序列。可接着使用此序列以及例如肽质量等其它信息来鉴别蛋白质。经受msn循环的离子可以由用户定义,或可通过光谱仪自动地确定。

图3a到3c是展示根据本发明的一个实施例的生成用于靶向质谱分析的包含列表的方法的一系列图表。

图3a是展示同量异位标记肽的实验保留时间对疏水性指数(hi)的图式。在此实例中,通过使用用于使tmt标记肽的hi和其保留时间线性化的方程来确定同量异位标记肽-tmt标记肽的hi。在一个实施例中,用于将hi线性拟合或线性化的方程提供在图3a的左上方部分上。

图3b是展示同量异位标记肽的实验hi值对实验保留时间的图式。使用图3a中用于线性化的方程来计算同量异位标记肽的实验hi值(“tmt-hi”)。“δhi”是每种tmt标记肽的单独调整的hi指数,所述δhi针对未标记对应部分肽产生hi指数(“未标记-hi”)。

图3c是未标记肽的预测保留时间对hi的图表。使用如先前在图3a中所确定的用于线性化的方程来计算未标记肽的预测保留时间。

在结合图3a到3c所描述的方法的示范性应用中,根据探索定量ms数据所鉴别并且已经确定为感兴趣的例如ivavtgaeaqk的tmt标记肽(或其它以适合方式标记的肽)由于其相对定量值而被选择用于后续靶向定量。

首先,根据对应未标记肽的序列(ivavtgaeaqk)来计算对应未标记肽的完整质量。可在任何化学表格中发现序列中每种氨基酸(i、v、a、v、t、g、a、e、a、q、g)的分子量。n种氨基酸的分子量的总和减去n-1个水分子,合计达未标记肽的完整质量。接着,基于未标记形式的肽的序列而预测未标记形式的肽的电荷状态,或通过参照外部数据库或例如nist/epa/nih质谱库、肽存储库(例如可在http://www.peptideatlas.org处访问的peptideatlas)等库,或通过工具类ssrcalc(http://hs2.proteome.ca/ssrcalc/ssrcalc.html)来提供所述电荷状态。可用完整质量和预期电荷状态值来轻松计算未标记肽的m/z值。

随后,可使用图3a到3c中所概述的保留时间预测来确定未标记版本的肽的预测保留时间。简单来说,对照在探索定量实验中所鉴别的所有tmt标记肽的所计算疏水性指数(hi)值(表达为%acn)标绘所述tmt标记肽的观测到的保留时间。如图3a中所展示,使这些值线性化并且接着对其调整以得到未标记对应物肽的hi值,所述hi值小于标记(tmt)肽的hi值,如图3b中所见。可根据未标记肽的这些hi值(以%acn表达)来预测所述未标记肽在给定梯度上的保留时间。在图3c中,使用与先前确定的tmt标记肽相同的方程来使这些值线性化以得到相同梯度上的预测保留时间。存在用以构建靶向包含列表从而通过例如prm的技术对这些肽定量的大量信息以及m/z值和电荷状态。

借助于实例,在本发明的一个实施例中,通过使用用于使tmt标记肽的hi线性化的方程(y=5.2042x+0.4274)和针对图4中的tmt标记序列的实验保留时间,ivavtgaeaqk的标记hi计算大约为11.45%acn。根据图3b,调整标记hi的凭经验调整的hi以得到未标记对应物肽的hi,所述hi大约为5.1210%acn。根据凭经验导出tmt的tmp实验应用梯度上方凭经验导出的经线性化方程:y=5.2042x+0.4274,其中y是预测保留时间(以分钟为单位),x=hi%acn未标记肽,5.2042是斜率(保留时间经验/%acn),并且0.4274是延迟(以分钟为单位),预测保留时间=5.2042(5.1210)+0.4274,其大约等于27.078。

下文说明用于预测保留时间的本发明的另一实例,在所述实例中,当梯度不同时,不使用tmt经线性化方程。在此实例中,梯度时间为60分钟(δy=60分钟),并且acn的初始浓度和最终浓度分别为1%和31%(即,δx=30%acn)。斜率=δy/δx=60分钟/30%acn=2分钟/%can。使用通用方程y=mx+b,其中y是预测保留时间,m是斜率或截距,x是未标记肽的hi值,并且b在此实例中是以分钟为单位的延迟或调整的0.5分钟,预测保留时间(y)=(2分钟/%acn)*5.1210%acn+0.5分钟,其大约为10.74分钟。

在ivavtgaeaqk的实例中,未标记肽的电荷状态预测为+2,在此状况下等于tmt标记对应物,使得未标记肽的m/z值仅反映n端和赖氨酸上的tmt标记的质量差。相比之下,针对未标记肽预测大约35分钟的保留时间的显著改变,并且观测到的保留时间(针对无标记实验针对未标记肽)在此预测的90秒内,如图5的序列数据中所展示。

同样重要的是供应关于溶剂体系(例如acn、甲醇、水或例如tfa或fa等离子对试剂),尤其是流动相组合物的信息以确保hi计算准确。

图4是说明根据本发明的一个实施例的生成用于靶向质谱分析的包含列表的方法的流程图400,所述方法展示在图3a到3c的图表中。在步骤410中,计算tmt标记肽的hi,并且在步骤420中,通过对以实验方式获取的保留时间应用线性拟合来使所述hi线性化。在步骤430中,调整tmt标记肽的hi以考虑不存在tmt标记的情况。换句话说,单独调整每种tmt标记肽的hi指数以产生对应未标记对应物肽的hi。在步骤440中,使用如先前确定的用于线性拟合的方程来预测对应未标记肽的保留时间。因此,这些保留时间独立于梯度长度,而仅取决于hi和溶剂组合物。为了进一步适应标记与未标记实验之间的可能不同的色谱条件,可采用参照肽(例如prtc)作为保留时间标志以精简不同梯度的预测保留时间。

可通过与参照肽的以实验方式获取的色谱保留时间相关来获得对应未标记肽的色谱保留时间的额外预测能力。参照肽可以是但不限于肽保留时间校准(prtc)混合物中的至少一种肽。prtc混合物含有以等摩尔比混合的在整个色谱梯度上洗脱的15种合成重肽。可使用这些参照肽的观测到的保留时间和疏水性指数来精简未标记靶向肽的预测保留时间,特别是在采用例如柱和梯度长度等不同色谱条件的情况下。

可使用数据获取技术在多种质谱仪仪器上执行靶向定量实验,所述质谱仪仪器例如但不限于三重四极杆、线性离子阱、轨道阱或飞行时间质谱仪,所述数据获取技术可包含单离子监测(sim)、选择反应监测(srm)、并行反应监测(prm)、同步前体选择(sps)或任何此类多元化msn定量技术。

图5展示用于生成包含列表的数据,所述包含列表从感兴趣的tmt标记肽40的定量结果开始,包含m/z值、电荷状态和以实验方式观测到的保留时间,直到对应预测属性50的列表。预测50与实验55结果之间的比较展示,本发明的方法提供高度准确的保留时间值以实现无标记靶向定量。proteomediscoverer或相似软件中的tmt探索定量实验的结果提供生成包含列表所必需的信息,包括但不限于肽序列、亲本m/z值和电荷状态。结合根据上文所描述的方法而调整的保留时间值,并且任选地补充有关于获得自含有几乎所有人类肽的全球公开可用数据库的电荷状态的信息,自动地产生完整的包含列表。

在开始prm、mrm或sim型实验之前,必须将至少包括m/z值和电荷状态但通常还包括保留型靶向肽的包含列表供应到质谱仪。根据肽的保留时间对获取进行时序安排实现了显著较多靶的定量。通过本发明的方法自动地生成仪器特异性包含列表。对于基于mrm的定量,包含列表还必须包含碎片信息,并且可能需要额外检验步骤以确定肽特异性转换,因为碎片化图案可以是标记特异性的。

本发明的优点包含使用同量异位标记多元化探索定量作为模板以构建用于常规和高度敏感的靶向定量而不需要额外的加强验证步骤或含有碎片化数据的复杂库的方法。不仅本文中所描述的方法独立于仪器,本发明还允许使用变化的色谱作为通常在较长梯度(例如,4小时)上执行的同量异位标记,同时典型的无标记靶向实验使用短得多的梯度(例如,60分钟)。本发明还能够调整这些不同的梯度长度和或分馏的使用,从而允许从多元化探索定量容易并有效地转变成常规无标记靶向定量。

本发明已经关于具体实施例结合细节进行了描述以促进理解本发明的构造和操作的原理。由此,本文中对具体实施例和其细节的参考并不意图限制在此所附权利要求书的范围。所属领域的技术人员将显而易见,在不脱离本发明的精神和范围的情况下可在出于说明目的而选择的实施例中进行修改。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1