一种蛋白酶解液中O-GalNAc糖基化修饰肽段的质谱鉴定方法

文档序号:40150882发布日期:2024-11-29 15:38阅读:13来源:国知局
一种蛋白酶解液中O-GalNAc糖基化修饰肽段的质谱鉴定方法

本发明涉及人血清中o-galnac完整糖基化肽段的鉴定,特别涉及疾病标志物研究中,运用液相色谱-多串联质谱自动快速的鉴定高灵敏度o-galnac完整糖基化肽段的方法。


背景技术:

1、蛋白质糖基化是结构最复杂的蛋白质翻译后修饰之一(文献2.hart,g.w.;copeland,r.j.2010.glycomics hits the big time.cell 143:672–676.)。其中,发生在天冬酰胺上的n-糖基化和发生在丝氨酸、苏氨酸或酪氨酸上的o糖基化是最为常见的两种类型。蛋白质的糖基化和生理过程密切相关,使得糖基化修饰的蛋白质具有成为疾病标志物的潜力。和n-糖基化的五糖核心结构不同,o-糖基化具有更多种的核心结构且常在同一条肽段上有多个修饰位点(文献3.varki,a.;cummings,r.d.;esko,j.d.;stanley,p.;hart,g.w.;aebi,m.;et al.2015.essentials of glycobiology.in:varki,a.;cummings,r.d.;esko,j.d.;stanley,p.;hart,g.w.;aebi,m.;et al.(eds.)3rd ed.cold springharbor laboratory press,cold spring harbor(ny).),这使得o-糖基化肽段的分析更加困难。

2、在传统方法中,鉴定o-糖基化肽段的质谱数据是通过在数据库检索中将o-糖基化修饰设为可变修饰来检索的。然而,这种方法考虑的糖基化修饰种类和位点数目的增加会大大增大检索空间,导致检索时间增加,灵敏度和可信度下降。在2019年开发的o-search方法(文献4.mao,j.;you,x.;qin,h.;wang,c.;wang,l.;ye,m.2019.a new searchingstrategy for the identification of o-linked glycopeptides.analyticalchemistry 91:3852–3859.)通过忽略由质谱高能碰撞解离(hcd)模式得到的谱图中不可靠的位点信息,将糖基化肽段上所带有的所有糖基化修饰视为一个肽段水平上的质量标签(delta mass),从而大大简化了数据库检索时需要考虑的信息。这种检索方法后来被集成到我们开发的蛋白质质谱数据库检索软件ms-decipher(文献1.mao,j.;zhu,h.;liu,l.;fang,z.;dong,m.;qin,h.;et al.2022.ms-decipher:a user-friendly proteomedatabase search software with an emphasis on deciphering the spectra of o-linked glycopeptides.bioinformatics 38:1911–1919.)中。之后也有一些软件利用了相似的方法进行o-糖肽检索,例如msfragger-glyco(文献5.polasky,d.a.;teo,g.c.;nesvizhskii,a.i.2020.fast and comprehensive n-and o-glycoproteomics analysiswith msfragger-glyco.nature methods.)、metamorpheus(文献6.lu,l.;riley,n.m.;shortreed,m.r.;bertozzi,c.r.;smith,l.m.2020.o-pair search with metamorpheusfor o-glycopeptide characterization.nature methods 17:1133–1138.)和pglyco3(文献7.zeng,w.-f.;cao,w.-q.;liu,m.-q.;he,s.-m.;yang,p.-y.2021.precise,fast andcomprehensive analysis of intact glycopeptides and modified glycans withpglyco3.nature methods 18:1515–1523.)。

3、之后,我们的工作集中于研究如何进一步简化检索糖基化修饰类型的种类。之前的o-search方法只利用了谱图中的肽段骨架碎片离子进行鉴定,而忽略了其他离子提供的信息,例如y离子(连有部分糖基化修饰的完整肽段离子)。n-糖基化肽段的糖基化修饰类型可以通过匹配谱图中的n-糖基化五糖核心峰,计算核心峰之一的y1峰(连有一个hexnac糖修饰的肽段离子)与母离子的质量差后,将质量差与需要检索的糖基化修饰数据库中的修饰质量进行比较得到。和n-糖基化修饰不同,o-糖基化修饰的核心结构更为复杂,且同一条糖肽上可能发生多个糖基化修饰;这使得o-糖肽的谱图中y离子的出现和分布情况相比n-糖肽来说规律性不强。

4、但是o-糖肽的谱图中的y离子仍然可以为鉴定提供信息。虽然o-糖基化修饰具有更复杂的核心结构和更多的位点,对于某一种特定的修饰,其可能出现的y离子仍然可以通过枚举有限种情况得到。将这些可能出现的y离子进行排列组合,形成由几种y离子组成的,类似n-糖肽的五糖核心峰的“出现模式(y-ion pattern)”,进而利用鉴定n-糖肽的方法在o-糖肽谱图中进行匹配和检索,可以一定程度上减小糖基化修饰的检索空间,提高灵敏度。

5、我们开发了基于上述方法进行o-糖肽谱图检索的数据库检索方法,并集成在我们的数据库检索软件ms-decipher中。通过在人血清o-糖肽数据集上进行性能测试和与其他软件对比,本方法的高灵敏度和高可信度优势得以显现,可以应用于复杂生物样本中o-糖基化蛋白质组学的研究。


技术实现思路

1、本发明的目的在于提供一种高灵敏度且高可信度的o-糖基化蛋白质质谱数据鉴定方法。本发明利用了o-糖肽质谱谱图中y离子提供的信息,通过匹配出现的y离子,简化o-糖基化修饰检索种类,提高鉴定的灵敏度和可信度。该方法灵敏度高,可信度高,能够应用于o-galnac糖基化蛋白质的组学研究。

2、本发明采用如下技术方案:

3、1)使用o-糖肽富集分析方法(文献1.mao,j.;zhu,h.;liu,l.;fang,z.;dong,m.;qin,h.;et al.2022.ms-decipher:a user-friendly proteome database searchsoftware with an emphasis on deciphering the spectra of o-linkedglycopeptides.bioinformatics 38:1911–1919.)得到o-糖肽的色谱和质谱数据;不同点在于:质谱仪使用q-exactive型号(thermo fisher scientific fic公司,美国),样品加载至色谱柱后,使用流动相浓度为0.1%的甲酸作为a相溶液,浓度为80%乙腈/0.1%三氟乙酸作为b相溶液;所述的实验方法中,在110分钟的梯度洗脱过程中,首先将流动相的质量浓度维持在4%保持10分钟,然后在78分钟内逐渐增加浓度从4%到45%,再在2分钟内逐渐增加浓度从45%到90%,保持90%浓度10分钟,最后在10分钟内逐渐降至4%;质谱分析,能量碎裂采用阶梯归一化的hcd碎裂能量20,30,40。

4、大致步骤为:以人血清中蛋白酶解液为上样样品,使用pngase f将糖基化修饰肽段上连有的n-糖基化修饰去除后,使用亲水作用色谱柱富集,然后使用液相色谱串联二级质谱进行分析,获得色谱和色谱数据;

5、2)谱图筛选及预处理:首先利用两种在o糖肽中常见的氧鎓离子(hex+,质荷比138.054;hexnac+,质荷比204.087)筛选存在这两种离子之一,且信号强度排名在前10%的质谱谱图。然后将这些谱图中的所有氧鎓离子峰匹配并移除,以减小对后续数据处理的干扰;

6、3)基于人为设定的用于检索的o-galnac糖基化修饰数据库,进行每种糖基化修饰可能出现的yn(n为肽段上带有糖基化修饰中糖单元的个数)离子种类的枚举;之后将这些y离子进行排列组合,以三个n值不同的yn离子为一组,且必须有y0离子(完整肽段骨架离子),形成y离子的组合出现模式(y-ion pattern);这些模式以质量差的形式存在;

7、o-galnac糖基化是通过一个hexnac连在肽段上的,对于所有的o-galnac糖基化肽段,谱图中出现的y1离子只可能是“肽段离子+hexnac(1)”这种形式,对于所有o-galnac糖基化修饰的肽段,其谱图中都有可能出现这种离子(因为糖基化修饰的糖基化单元个数最少为1);而对于y2和y3离子,其结构只可能分别是“肽段离子+hexnac(1)+一个糖基化单元”和“肽段离子+hexnac(1)+两个糖基化单元”;例如对于糖基化修饰hex(1)hexnac(1)neuac(1),其y1离子只有“肽段离子+hexnac(1)”一种形式,y2离子有“肽段离子+hex(1)hexnac(1)”和“肽段离子+hexnac(1)neuac(1)”两种形式,y3离子只有“肽段离子+hex(1)hexnac(1)neuac(1)”一种形式;

8、对于o-糖基化修饰hex(1)hexnac(1),连有该糖基化的糖肽的二级谱图中可能出现的y1离子为连有hexnac(1)的肽段离子,质量为“肽段离子质量(y0质量)+hexnac(1)的质量”;可能出现的y2离子为连有hex(1)hexnac(1),质量为“肽段离子质量+hex(1)hexnac(1)的质量”;则对于该糖基化修饰,“y离子出现模式”指由【o-糖肽的完整肽段骨架离子(y0离子),y1离子,y2离子】三个离子组成的出现模式;对于其他的糖基化修饰,y1和y2离子的质量可能不同,且对于含有三个及以上的糖基化单元的糖基化修饰,可能存在y3离子(连有三个糖基化单元的肽段离子,如“肽段离子+hex(1)hexnac(1)neuac(1)”),也可能形成【y0离子,y1离子,y3离子】和【y0离子,y2离子,y3离子】的出现模式;

9、本专利描述的方法中,“出现模式”中列出的离子只是离子种类,例如“y2离子”仅指带有两个糖单元的完整肽段离子,而其具体结构可能有多种情况,例如对于带有糖基化修饰hex(1)hexnac(1)neuac(1)的肽段,可能出现的y2离子有两种,分别是“肽段离子+hex(1)hexnac(1)”和“肽段离子+hexnac(1)neuac(1)”;

10、本专利描述的方法研究的是含有糖基化单元个数大于等于2的o-糖基化修饰的o-糖肽中出现的y离子的出现模式;只含有一个糖基化单元的o-糖基化修饰(如hexnac(1)),不在本方法的研究范围之内,因为这种糖基化修饰的糖肽谱图中无法出现n大于等于2的yn离子;本专利描述的方法中研究的y离子出现模式中,yn离子中的n最大取3,对于肽段上只含有两个糖基化单元的o-糖基化修饰,如hex(1)hexnac(1),只考虑【y0离子,y1离子,y2离子】这一种出现模式;而对于肽段上含有三个及以上糖基化单元的o-糖基化修饰,考虑【y0离子,y1离子,y2离子】,【y0离子,y1离子,y3离子】和【y0离子,y2离子,y3离子】这三种出现模式;

11、4)在筛选出的o糖肽谱图中匹配y离子出现模式,当匹配到有三个谱峰与y离子的组合出现模式相符时,计算最小质量的峰与谱图母离子的质量差,与糖基化修饰数据库中的糖基化修饰质量比较;若相等,将该糖基化修饰放入候选中;

12、5)基于候选的糖基化修饰,使用我们开发的ms-decipher软件对这些o糖肽谱图进行数据库检索;对于无法得到结果的o-糖肽谱图,以及在步骤4)中没有匹配到y离子出现模式的谱图,使用o-糖基化修饰数据库中的所有o-糖基化修饰进行数据库检索;

13、6)合并上一步骤中的所有数据库检索结果,并使用percolator软件计算结果的假阳性率;

14、7)得到假阳性率≤1%的o糖肽谱图鉴定结果;

15、方案补充说明:

16、a.步骤1)所述的实验方法与我们之前发表的论文(文献1.varki,a.;cummings,r.d.;esko,j.d.;stanley,p.;hart,g.w.;aebi,m.;et al.2015.essentials ofglycobiology.in:varki,a.;cummings,r.d.;esko,j.d.;stanley,p.;hart,g.w.;aebi,m.;et al.(eds.)3rd ed.coldspring harbor laboratory press,cold spring harbor(ny).)中使用的方法基本相似,不同点在于:质谱仪使用q-exactive型号(thermo fisherscientific fic公司,美国),样品加载至色谱柱后,使用流动相浓度为0.1%的甲酸作为a相溶液,浓度为80%乙腈/0.1%三氟乙酸作为b相溶液;

17、b.步骤1)所述的实验方法中,在110分钟的梯度洗脱过程中,首先将流动相的质量浓度维持在4%保持10分钟,然后在78分钟内逐渐增加浓度从4%到45%,再在2分钟内逐渐增加浓度从45%到90%,保持90%浓度10分钟,最后在10分钟内逐渐降至4%;

18、c.步骤1)质谱分析,能量碎裂采用阶梯归一化的hcd碎裂能量20,30,40。

19、d.步骤3)所述的yn离子中n的值最大为3;

20、e.步骤3)所述的yn离子价态最高为母离子价态;

21、f.步骤5)所述ms-decipher软件版本为1.0.1,可在https://github.com/dicp-1809/ms-decipher获取;

22、g.步骤6)所述percolator软件版本为3.6,为免费软件,在https://github.com/percolator/percolator/releases获取;

23、h.步骤7)所述通过筛选具有percolator软件计算出的q-value和peptide q-value均小于等于0.01,且具有ms-decipher软件计算出的rank score大于等于20的psm结果得到;

24、本发明的优点:

25、该方法利用了目前常见o-糖肽检索方法极少利用的谱图中y离子的信息进行候选糖基化修饰的筛选,减小了糖基化修饰的检索空间,提高了检索的灵敏度。该方法能够应用于复杂生物样本的o-糖基化蛋白质组学的研究,并有发现新型o-糖肽的巨大潜力。

26、本发明为一种基于匹配质谱谱图中连有部分糖链修饰的完整肽段离子(y离子)的出现模式进行o-galnac完整糖基化修饰肽段的质谱数据鉴定方法,用于高效且可信地从高效液相色谱-多级串联质谱数据中鉴定o-galnac完整糖基化修饰肽段的谱图信息。该方法通过枚举o-galnac糖基化修饰的肽段上可能出现的y离子,并将这些离子以三个一组的形式组合成y离子的出现模式,在质谱谱图中匹配这些出现模式以减少检索的候选糖基化修饰的搜索空间。与目前常见的o-完整糖基化修饰肽段的鉴定软件相比,本发明的优点是可以得到高灵敏度,高可信度的o-galnac完整糖基化修饰肽段的鉴定结果,适合于大通量分析和大规模鉴定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1