1.本发明属于质谱仪技术领域,尤其是涉及一种基于径向基函数网络的质谱仪透镜参数拟合方法。
背景技术:2.三重四极杆质谱仪是目前从事分析工作者对目标化合物进行定性定量分析的一个重要仪器。其由四根平行排列的金属棒组成,施加在棒上的直流电压和射频电压产生磁场,使离子沿着金属棒之间的轴呈螺旋轨道运动。根据施加在电极上的电压,特定m/z值的离子将通过四极杆,其他m/z值更大或更小的离子将向外飞行,无法通过四极杆。
3.在使用质谱仪之前我们需要获得待测化合物的最优质谱仪透镜参数,目前获取质谱最优透镜参数有两种方式。一种是手动获取,这需要调试人员或实验人员手动调谐,缺陷是需要耗费一定的人力,牵扯了实验人员的精力,降低了实验效率,同时透镜参数的寻优对调试人员有一定门槛,而且不容易找到全局最优解。另一种是自动寻优,自动寻优一般采用改变单一参数固定其余透镜参数的方式进行参数寻优,这是一种控制变量法的体现。自动寻优有两个缺点,一是寻优时间通常比较长,因为需要多次迭代寻优;二是自动寻优算法确定的最优透镜参数往往不是全局最优的。综上所述,当前的透镜参数寻优方法具有寻优时间较长、效率低、不容易收敛到全局最优解的缺陷。
技术实现要素:4.有鉴于此,为克服上述缺陷,本发明旨在提出一种基于径向基函数网络的质谱仪透镜参数拟合方法。
5.为达到上述目的,本发明的技术方案是这样实现的:
6.一种基于径向基函数网络的质谱仪透镜参数拟合方法,利用径向基函数网络结合先验信息集合得到透镜参数与峰强度的拟合曲面,根据拟合曲面得出峰强度最高时对应的透镜参数。
7.进一步的,具体方法如下:
8.s1、利用权重向量训练器结合先验集合计算径向基函数网络的权重向量;
9.s2、选择径向基函数网络的激活函数;
10.s3、根据权重向量和激活函数,得出径向基函数网络的输入
‑
输出显式表达式。
11.进一步的,在计算步骤s1中的权重向量时,需要结合损失函数,损失函数的公式如下:
[0012][0013]
其中,w为径向基函数网络的权重向量,d(i)为测试集元素,表示测试中实际的谱图强度,参数i=1,
…
,n,λ为学习率参数,以防止出现过拟合的情况,
中,是以μ
k
为中心的激活函数,x
i
为测试集中第i个元素d(i)的输入参数;令损失函数ε
av
(w)最小化的权重向量就是最终期望的权重向量。
[0014]
进一步的,利用迭代算法获取令上述损失函数最小化的权重向量,具体如下:
[0015]
步骤1:初始化权重向量和中间矩阵,初始化如下式所示:
[0016]
w(0)=0 and p(0)=λ
‑1i
[0017]
初始情况下,径向基函数网络的权重向量w(0)为零向量,中间矩阵p(0)为一对角阵。
[0018]
步骤2:计算第n次迭代的中间矩阵p(n);
[0019][0020]
其中,p(n)为计算过程中第n次迭代的中间矩阵,p(n
‑
1)为计算过程中第n
‑
1次迭代的中间矩阵,为径向基函数向量,为以μ1为中心的激活函数,x
n
表示第n次迭代过程中的输入透镜参数。
[0021]
步骤3:计算梯度向量g(n)和梯度系数α(n),其计算的公式为:
[0022]
g(n)=p(n)φ(n)
[0023]
α(n)=d(n)
‑
w
t
(n
‑
1)φ(n)
[0024]
其中,p(n)为上一步中计算得到的中间矩阵,φ(n)为径向基函数向量,如上一步中所介绍的。w
t
(n
‑
1)为上一次迭代中计算的权重向量,d(n)为测试集中的信号强度。
[0025]
步骤4:计算第n次迭代的径向基函数网络权重向量w(n),迭代如下所示:
[0026]
w(n)=w(n
‑
1)+g(n)α(n)
[0027]
其中,g(n)表示梯度向量,α(n)表示梯度系数;
[0028]
当n<n时,更新迭代次数n=n+1,然后返回步骤2;当n≥n时,则算法结束,第n次迭代的输出w(n)即为最终的权重向量。
[0029]
进一步的,步骤s2中,激活函数采用高斯函数或者inverse multiquadrics函数。
[0030]
进一步的,径向基函数网络的输入
‑
输出显式表达式为:
[0031][0032]
其中y为输入透镜参数x情况下的谱图信号强度,w
n
为权重向量w的第n个元素,为激活函数。
[0033]
相对于现有技术,本发明所述的基于径向基函数网络的质谱仪透镜参数拟合方法具有以下优势:
[0034]
(1)本发明基于径向基函数网络的质谱仪透镜参数拟合方法,对质谱仪透镜参数
‑
峰强度曲面进行拟合,而不必实际遍历所有的质谱仪透镜参数
‑
峰强度对;在曲面拟合完成后,就可以根据输入
‑
输出的显式表达式获得峰强度的最大值,依据此得到最佳的透镜参数,这样做的好处在于能够快速得到最佳的透镜参数组合。
[0035]
(2)质谱仪透镜参数
‑
峰强度曲面拟合采用径向基函数网络方法,使用径向基函数网络能够避免传统拟合方法带来的边缘效应,而且在使用过程中,可以根据质谱仪特性灵活选择不同的激活函数,因此基于径向基函数网络的拟合方法使用更灵活,精度更高。
附图说明
[0036]
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0037]
图1为质谱仪透镜参数
‑
峰强度曲面拟合方法实现框图;
[0038]
图2为径向基函数网络的基本结构图;
[0039]
图3为本发明实施例所述的输入
‑
输出映射关系三维图。
具体实施方式
[0040]
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
[0041]
下面将参考附图并结合实施例来详细说明本发明。
[0042]
本专利提出了一种基于径向基函数网络的质谱仪透镜参数拟合方法,这是一种质谱仪透镜参数拟合的快速方法,可以在极少先验信息的情况下快速得到透镜参数
‑
峰强度的拟合曲面,在得到这条拟合曲面后,就可以轻易得出峰强度最高时对应的透镜参数。
[0043]
质谱仪透镜参数的以下特性是该拟合算法推导和使用的先决条件,也进一步说明了本技术采用拟合算法的合理性。
[0044]
1)调节透镜参数时对质谱仪的分辨和质量轴的影响微乎其微;
[0045]
2)透镜参数的微小改变不会引发质谱仪峰强度的突变;
[0046]
3)固定透镜参数时,多次扫描谱图,这个过程为一平稳随机过程;
[0047]
本技术以径向基函数网络为基础,图1所示,径向基函数(rbf)网络有三个要素:激活函数、权重向量和输入向量。其中rbf网络权重向量训练器从提供的先验集合数据中训练出rbf的权重向量。激活函数采用但不限于常用的高斯函数和inverse multiquadrics函数,激活函数可以根据系统的特性灵活选择,这也是rbf网络的优势之一。在激活函数和权重向量确定后,rbf网络也就确定了,输入向量进入网络后生成相应的输出。
[0048]
图2为径向基函数网络的基本结构,其中μ1,μ2,
…
,μ
k
为激活函数的中心值。
[0049]
径向基函数网络的输入
‑
输出显式表达式如下所示:
[0050][0051]
其中y为输入透镜参数x情况下的谱图信号强度,w
n
为权重向量w的第n个元素,为激活函数;
[0052]
定义向量在计算权重向量时,定义评价径向基函数网络的损失函数为:
[0053][0054]
其中,w为径向基函数网络的权重向量,d(i)为测试集元素,表示测试中实际的谱图强度,参数i=1,
…
,n,λ为学习率参数,以防止出现过拟合的情况,中,是以μ
k
为中心的激活函数,x
i
为测试集中第i个元素d(i)的输入参数;令损失函数ε
av
(w)最小化的权重向量就是最终期望的权重向量。
[0055]
步骤1:初始化权重向量和中间矩阵,初始化如下式所示:
[0056]
w(0)=0 and p(0)=λ
‑1i
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0057]
初始情况下,径向基函数网络的权重向量w(0)为零向量,中间矩阵p(0)为一对角阵。
[0058]
步骤2:计算第n次迭代的中间矩阵p(n)
[0059][0060]
p(n)为计算过程中第n次迭代的中间矩阵,p(n
‑
1)为计算过程中第n
‑
1次迭代的中间矩阵,为径向基函数向量,为以μ1为中心的激活函数,x
n
表示第n次迭代过程中的输入透镜参数。
[0061]
步骤3:计算梯度向量g(n)和梯度系数α(n),其计算的公式为:
[0062]
g(n)=p(n)φ(n)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0063]
α(n)=d(n)
‑
w
t
(n
‑
1)φ(n)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0064]
p(n)为上一步中计算得到的中间矩阵,φ(n)为径向基函数向量,如上一步中所介绍的。w
t
(n
‑
1)为上一次迭代中计算的权重向量,d(n)为测试集中的信号强度。
[0065]
步骤4:计算第n次迭代的径向基函数网络权重向量w(n),迭代如下所示:
[0066]
w(n)=w(n
‑
1)+g(n)α(n)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0067]
步骤4为权重向量的更新过程,g(n)表示梯度向量,α(n)表示梯度系数。
[0068]
当n<n时,更新迭代次数n=n+1,然后返回步骤2;当n≥n时,则算法结束,第n次迭代的输出w(n)即为最终的权重向量。
[0069]
在使用上述迭代算法计算得到权重向量后,式(1)的显式关系也就确定了。这样实质上对应的拟合关系式就确定了。
[0070]
下面以htq
‑
2020型三重四极质谱仪的q1 pos模式为例进行说明,定义网络输入向量x=[a
dp
,a
ep
]
t
(表示q1pos模式下的两个透镜参数),输出为峰强度i(x=[a
dp
,a
ep
]
t
),于是需要拟合的映射实际应为首先我们在质谱仪上用很短的时间得到12组训练样本,将之输入权重向量迭代算法中,计算得到网络的权重向量。在得到权重向量后,则将所有的可能输入进入径向基函数网络,计算峰强度,得出相关的映射。此时可以得到我们所需要的映射如图3所示,之后就可以通过输入
‑
输出映射关系找到曲面i(x=[a
dp
,a
ep
]
t
)的
最大值,这个最大值i
max
([a
dp
‑
op
,a
ep
‑
op
]
t
)的具体含义可以表述为:在透镜参数组合[a
dp
‑
op
,a
ep
‑
op
]
t
下,该化合物在q1 pos模式下的峰强度最高。
[0071]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0072]
在本技术所提供的几个实施例中,应该理解到,所揭露的方法和系统,可以通过其它的方式实现。例如,以上所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。上述单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
[0073]
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
[0074]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。