一种基于Hopfield模型的三重四极杆质谱仪谱图分类方法与流程

文档序号:27907848发布日期:2021-12-11 06:27阅读:170来源:国知局
一种基于Hopfield模型的三重四极杆质谱仪谱图分类方法与流程
一种基于hopfield模型的三重四极杆质谱仪谱图分类方法
技术领域
1.本发明属于质谱仪技术领域,尤其是涉及一种基于hopfield模型的三重四极杆质谱仪谱图分类方法。


背景技术:

2.质谱仪是目前化合物定性与定量分析的重要工具,其种类众多,广泛应用于学校实验室、医院、研究院和制药公司等。三重四极杆质谱仪也是其中一种,三重四极杆质谱仪提供了串级功能,加强了质谱的定性能力。除此之外,其定量能力佳,mrm信噪比高,除一般子离子扫描功能外,子离子扫描、母离子扫描、中性丢失(neutral loss)等模式。三重四极杆质谱仪功能强大,然而参数众多,调谐难度大,尤其在自动调谐中,需要识别和区分目标峰和杂峰,这也成为了自动调谐中的难点之一。
3.以ab sciex公司的api 4000型三重四极杆质谱仪为例,通常要求单位质量分辨为:0.6~0.8amu(fwhm)。图1是分辨为0.7amu(fwhm)的质谱图,这是调谐完成后的正确谱图。
4.然而在调谐液中存在许多其他的化合物,这就导致存在其他种类的质谱图。图1中8个质量段的谱图各异,调谐的过程恰好是:从众多的谱峰中识别出这8个目标峰(也称特征峰),再由这8个目标峰校对质量轴和分辨率。可见调谐的焦点在于如何识别这8个目标峰。人工调谐时,要想识别出目标峰往往需要丰富的实验经验,容易出错。如果出错往往会导致实验结果异常,更有甚者,造成一定损失。


技术实现要素:

5.有鉴于此,为克服上述缺陷,本发明旨在提出一种基于hopfield模型的三重四极杆质谱仪谱图分类方法。
6.为达到上述目的,本发明的技术方案是这样实现的:
7.一种基于hopfield模型的三重四极杆质谱仪谱图分类方法,括如下步骤:
8.s1、基于各类目标峰特征信息,改进hopfield模型;
9.s2、提取目标峰最高点左右两侧一定距离范围内的点,经归一化处理后作为改进后的hopfield模型的初始状态向量;
10.s3、基于先验训练集合生成hopfield模型的吸引子和吸引盆,当待识别峰的数据落入相应吸引子的吸引盆中时,随着递归计算将最终收敛到吸引子,该吸引子就是待测峰的类型标识。
11.进一步的,步骤s1中,设先验训练集合为包含各类目标峰特征信息的n维向量集合,改进后的hopfield模型的权重矩阵元素计算公式为:
[0012][0013]
其中ξ
u,i
为先验训练集合中第u个训练向量的第j个元素,w
ji
为改进后的hopfield模型权重矩阵的第j行,第i列的元素,n为训练向量ξ
u
的长度。
[0014]
进一步的,
[0015]
hopfield模型的激活函数为:
[0016][0017]
其中,a
i
被称为神经元i的增益,默认的a
i
=1,x则是神经元i在当前时刻的输出,v称之为中间变量,是激活函数的输入,中间变量的计算公式如下所示:
[0018][0019]
其中,v
j
作为神经元j激活函数的输入(即中间变量),w
ji
为改进后的hopfield模型权重矩阵的第j行,第i列的元素,x
i
为上一时刻状态向量的第i个元素,默认偏置参数b
j
=0,hopfield模型的训练集合为
[0020]
权重计算公式的矩阵形式为:
[0021][0022]
其中,表示以作为主对角线元素的对角方阵。w为改进后hopfield模型的权重矩阵,n为训练向量ξ
u
的长度。
[0023]
进一步的,步骤s2的具体方法如下:
[0024]
提取峰最高点左右两侧2.5u范围内的点作为模型的初始状态向量,此时该向量的长度为51。
[0025]
相对于现有技术,本发明所述的基于hopfield模型的三重四极杆质谱仪谱图分类方法具有以下优势:
[0026]
(1)本发明基于hopfield模型的三重四极杆质谱仪谱图分类方法,将hopfield模型应用于三重四极杆质谱仪的谱图分类应用中,这是一种非线性递归神经网络,同支持向量机等方法相比,计算复杂度低,无需特别关注目标峰的特征,易于实现;同时本专利中hopfield模型神经元数目可以灵活调整,从而应对不同步长的扫描场景。
[0027]
(2)结合连续hopfield模型对离散hopfield模型进行改进,将激活函数设定为双曲面正切函数,这使得模型实现成为可能,同时,这样做也降低了模型的计算复杂度。
附图说明
[0028]
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实
施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0029]
图1为本发明实施例所述的分辨是0.7amu(fwhm)的质谱图示意图;
[0030]
图2为本发明实施例所述的提取待识别质谱峰数据示意图;
[0031]
图3为本发明实施例所述的hopfield模型框图;
[0032]
图4为本发明实施例所述的吸引子和吸引盆示意图。
具体实施方式
[0033]
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
[0034]
下面将参考附图并结合实施例来详细说明本发明。
[0035]
本专利提出了一种三重四极杆质谱仪的质谱峰分类方法。该方法主要基于改进型的hopfield模型实现。这种谱图分类方法可以识别调谐过程中各种类型的峰,从而正确寻找到目标峰,以便能够校对质量轴和分辨率;另一方面,该方法也可以用来判断目标化合物扫描时的峰形是否合理。该方法的初始输入为提取待识别峰的数据,经过非线性递归计算后,最终收敛到由先验知识定义的类型标识,基于此可以标记出待识别峰的类型标识。提取待识别质谱峰数据示意图如图2所示。
[0036]
在扫描步长等于0.1u且半峰宽达到0.7u附近时,提取峰最高点左右两侧2.5u范围内的点作为模型的初始状态向量,此时该向量的长度为51。选择以2.5u作为选取半径的理由在于至少能够覆盖两个副峰,使得该目标峰包含足够多的特征信息。由此确定了模型状态向量的长度n=51,从待识别谱峰中提取的向量作为模型的初始状态向量,记作x(0)=[x1(0),

,x
n
(0)]
t
,模型的第n时刻的状态记作x(n)=[x1(n),

,x
n
(n)]
t

[0037]
hopfield模型框图如图3所示。hopfield模型是一种非线性递归神经网络。
[0038]
其中激活函数是非线性的,在本专利中,hopfield模型的激活函数的形式为:
[0039][0040]
其中,a
i
被称为神经元i的增益,默认的a
i
=1,x则是神经元i在当前时刻的输出,v称之为中间变量,是激活函数的输入。中间变量的计算公式如下所示:
[0041][0042]
其中,v
j
作为神经元j激活函数的输入(即中间变量),w
ji
为改进后的hopfield模型权重矩阵的第j行,第i列的元素,x
i
为上一时刻状态向量的第i个元素,默认偏置参数b
j
=0,hopfield模型的训练集合为
[0043]
hopfield模型的权重计算公式为:
[0044]
and w
ii
=0
ꢀꢀꢀ
(3)
[0045]
式(3)的矩阵形式为:
[0046][0047]
其中表示以作为主对角线元素的对角方阵。w为改进后hopfield模型的权重矩阵,n为训练向量ξ
u
的长度。
[0048]
先验的训练集合包含了各类目标峰的特征信息,先验训练集合将生成hopfield模型的吸引子和吸引盆,如图4所示,一旦待识别峰的数据落入相应吸引子的吸引盆中,随着递归计算将最终收敛到吸引子,而这个吸引子就是所谓的类型标识。
[0049]
三重四极质谱仪谱图分类方法的步骤如下:
[0050]
步骤1:权重矩阵的学习。假设训练集合为包含各类目标峰特征信息的n维向量集合,其模型的权重矩阵元素计算公式为:
[0051][0052]
步骤2:初始化过程。提取峰最高点左右两侧2.5u范围内的点,归一化后作为模型的初始状态向量,此时该向量的长度为51,记作x(0)=[x1(0),

,x
n
(0)]
t

[0053]
步骤3:状态向量迭代过程。状态向量迭代过程如下式所示,其中激活函数参见公式(1)。
[0054][0055]
步骤4:输出。步骤3的计算结果满足下式:
[0056]
x(n+1)=x(n)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0057]
则算法终止,否则返回步骤3。
[0058]
下面我们以htq

2020三重四极质谱仪为例,对本专利的谱图分类方法进行简单说明。其调谐过程中的目标峰形状如图1所示,我们对已知的正确的目标峰输入模型,依据步骤1中的式(5)进行学习,以获取模型的权重系数(矩阵)。然后基于该权重矩阵分别输入8个目标峰的标准形数据,经过迭代后模型将得到8个稳定的吸引子,至此hopfield模型训练完成。此后将落入扫描范围的峰数据输入hopfield模型,将输出与8个吸引子对比,如果不等于8个吸引子中的任何一个,则不是我们所需的目标峰;如果等于其中的一个吸引子,那么这个峰就属于该吸引子对应的峰类型。一旦识别到了目标峰,就可以对其进行质量轴校对和半峰宽的调节。
[0059]
1)在本发明中,在本专利中,将hopfield模型应用于三重四极杆质谱仪的谱图分类应用中,这是一种非线性递归神经网络,计算复杂度低,易于实现。
[0060]
2)本发明针对三重四极质谱仪的谱图分类对传统的离散hopfield模型进行改进。激活函数使用双曲面正切函数,这样做的好处在于降低了模型计算的难度,能够更快的进行递归计算。
[0061]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0062]
在本技术所提供的几个实施例中,应该理解到,所揭露的方法和系统,可以通过其它的方式实现。例如,以上所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。上述单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
[0063]
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
[0064]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1