技术特征:
1.一种基于碎片树的现场质谱目标物识别以及衍生物预测方法,其特征在于,包括如下步骤:s1、对目标物的多级电压碎裂谱图进行峰形校准;s2、对步骤s1处理后的多张谱图进行合并,生成一张包含母离子和所有碎片的谱图;s3、对每个碎片峰进行候选分子式预测,通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成三层筛选,得到最终的候选分子式,再根据中性丢失和峰值相似度对节点和边赋值权重,生成候选分子碎片图;s4、计算最大得分的彩色碎片树;s5、通过碎片树对齐来进行聚类。2.如权利要求1所述的方法,其特征在于,步骤s1包括:s11、对质量轴进行分段,通过分段处理的方式,将每一段近似线性误差进行处理;s12、计算目标物的理论谱图;其中,同位素的分布可通过将某一特定原子的同位素比值信息逐步加到整个分子中计算得到;可以将原子的同位素函数表示为δ函数,将其与卷积相联系,即将某一特定原子的同位素函数逐步卷积到整个分子中计算得到;s13、通过解卷积求得校准滤波器;s14、通过将所述校准滤波器和目标物原始信号卷积,对原始谱图的信号峰形进行校准。3.如权利要求1或2所述的方法,其特征在于,步骤s13包括:质谱仪实际测量的数据可表示为理论同位素分布y0和实际峰值函数p之间的卷积操作,如式(1)所示:实际的峰形函数p通过与滤波器函数f的卷积转换成数学上可定义的函数d,如式(2)所示:式中,y表示实际质谱,y0表示理论质谱,p表示实际峰形,d表示理论峰形,f表示校准滤波器;对式(1)和(2)整理得式(3)通过rl解卷积算法求得校准滤波器f。4.如权利要求1至3任一项所述的方法,其特征在于,步骤s2包括:s21、将不同碎裂能量的质谱峰归一化后进行排序,保留峰值强度最大的10个峰;s22、根据质谱仪的质量精度设置阈值,并判断满足阈值条件的峰是否处于相邻碰撞能量的谱图中,在同时满足上述两个条件的情况下合并峰。5.如权利要求1至4任一项所述的方法,其特征在于,步骤s3包括:s31、识别分子式:根据每个峰值对应的质量,在质量偏差范围内求取符合该质量的分子式;s32、分子式筛选:通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形
成,从元素个数或元素个数比值对候选分子式进行筛选;s33、判断子分子:根据各个元素个数的大小判断每个峰所对应候选分子式的子分子,并用有向线段进行连接,由此,生成以各个峰的候选分子式为节点通过有向线段进行连接的碎片图;s34、设置节点、边权重:根据各个候选分子式的理论质量和实验质谱的质量的差值大小赋予每个节点不同的权重;根据中性丢失、不可能中性丢失、自由基丢失对实际的中性丢失,对前体离子到子离子的边进行权重计算。6.如权利要求1至5任一项所述的方法,其特征在于,步骤s4包括:在碎片图中寻找权值和最大的彩色子树,保证每个颜色只保留一个分子,即每个峰只有一个解释。7.如权利要求6所述的方法,其特征在于,步骤s4包括:利用改进的prim算法,从任意一个顶点开始,将这个顶点作为最初的最小生成树的子树,通过逐步地为当前的子树添加新边来生成最终的最小生成树,添加的策略是,每次只添加从外部连接到该子树的所有边中的最短边;其中,选择权值最小、且弧头y在子图t中入度为0的有向边<x,y>,将x和y中不属于u的顶点加入到集合u中。8.如权利要求1至7任一项所述的方法,其特征在于,步骤s5包括:通过计算两个碎片树之间的对齐距离来对碎片树之间的相似度进行衡量。9.如权利要求8所述的方法,其特征在于,步骤s5包括:s51、插入空节点和空路径,使其在没有标签的情况下,结构相似。s52、然后根据碎片和中性丢失两个维度,对两棵树的相似度进行打分。10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序由处理器执行时,实现如权利要求1至9任一项所述的步骤s1至s5。
技术总结
一种基于碎片树的现场质谱目标物识别以及衍生物预测方法,包括如下步骤:S1、对目标物的多级电压碎裂谱图进行峰形校准;S2、合并处理后的多张谱图,生成一张包含母离子和所有碎片的谱图;S3、对每个碎片峰进行候选分子式预测,通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成三层筛选,得到最终的候选分子式,再根据中性丢失和峰值相似度对节点和边赋值权重,生成候选分子碎片图;S4、计算最大得分的彩色碎片树;S5、通过碎片树对齐来进行聚类。该方法能够提取衍生物的一级二级质谱特征,训练出分类模型,进而实现对衍生物的鉴定归类。该方法大大弥补了传统现场质谱技术在质谱信号预测上的不足,尤其适于小质谱平台的应用。的应用。的应用。
技术研发人员:钱翔 杨淑媛 霍新明 余泉 倪凯 王晓浩
受保护的技术使用者:清华大学深圳国际研究生院
技术研发日:2021.08.26
技术公布日:2021/12/6