色谱谱图的检测分析方法及电子设备与流程

文档序号:27133241发布日期:2021-10-29 22:20阅读:507来源:国知局
色谱谱图的检测分析方法及电子设备与流程

1.本技术属于色谱分析技术领域,具体涉及一种色谱谱图的检测分析方法及电子设备。


背景技术:

2.相关技术中,在色谱分析中需利用计算机对色谱谱图进行定性和定量分析,其中分析的重要基础是识别出色谱峰,色谱峰的峰型复杂多样,包括重叠峰、前肩峰、后肩峰、拖尾峰以及负峰等。
3.目前色谱峰的检测辨识一般采用时间窗法和导数法。时间窗法通过在成分的保留时间范围内找极值来获得色谱峰位;导数法通过对原始色谱数据求导数来获得一系列极值,然后也是根据成分的保留时间范围找到色谱峰位。
4.在时间窗法和导数法的实现过程中,都需要结合幅值阈值来判断是否为真实的色谱峰,因此阈值的设定是否合理很关键,若设得太大则可能把真实的色谱峰漏掉,降低了色谱成分的分辨率,而若设得太小则会把一些噪声形成的小峰认为是色谱峰,会导致误判。且时间窗法和导数都需要成分的保留时间范围来查找色谱峰位,因此若出现峰漂移出这个范围的情况,就会导致找到的色谱峰不正确或者成分误判的问题。此外,使用一阶导数二阶导数相结合的方法寻找色谱峰对单峰识别率比较高,但是对于多峰重叠的情况,特别是肩峰出现的情况时,识别率会大大减小。
5.相关技术中,还有基于模式匹配来识别色谱峰的方法,该方法在识别峰时与色谱成分的保留时间无关,对噪声和色谱峰宽、幅值的变化不敏感,但该算法由于是采用相关系数这个统计的方法来计算匹配波形与色谱曲线的相似性,因此相关度的阈值设置很重要,这会导致模式匹配的方法的泛用性不强。
6.上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。


技术实现要素:

7.为至少在一定程度上克服相关技术中存在的问题,本技术提供一种色谱谱图的检测分析方法及电子设备,基于模式匹配并结合色谱曲线的斜率来检测色谱峰,并基于检测出的色谱峰进行分析,该方式有助于弥补现有技术中的不足,实现综合性能更佳的谱图检测分析。
8.为实现以上目的,本技术采用如下技术方案:
9.第一方面,
10.本技术提供一种色谱谱图的检测分析方法,该方法包括:
11.获取待处理的原始谱图数据;
12.针对所述原始谱图数据,采用预设大小时间窗口从色谱曲线起点开始依次滑动来进行色谱峰的检测处理,直至所述原始谱图数据处理完毕,检测出曲线中的所有色谱峰,并
基于检测出的色谱峰生成检测结果;其中,在每一个色谱峰的检测处理过程中,包括:
13.将色谱曲线上各点的斜率与阈值的进行比较,基于比较结果确定色谱峰的参考点,其中,所述参考点包括峰起点参考点、临时峰顶点参考点和峰终点参考点,所述阈值基于对生成所述原始谱图数据的色谱仪器的空载输出信号的计算分析而确定;
14.基于所述参考点所表征的色谱峰在色谱曲线上的位置,以高斯波为匹配波对所述位置处附近的色谱曲线进行模式识别检测,并将识别检测结果中的峰顶点作为峰顶点校正点;
15.根据所述峰顶点校正点对临时峰顶点参考点进行校正处理,将校正后的点作为峰顶点参考点;
16.将所述峰起点参考点、所述峰终点参考点以及所述峰顶点参考点所表征的色谱峰确定为检测出的色谱峰。
17.可选地,所述将色谱曲线上各点的斜率与阈值进行比较,基于比较结果确定色谱峰的参考点,包括:
18.实时计算时间窗口滑动过程中色谱曲线上点的斜率,
19.将计算出的斜率与预先确定的第一阈值进行比较,当连续两点的斜率大于所述第一阈值时,比较该两点的纵坐标值,将纵坐标值较小的点确定为所述峰起点参考点,以及
20.对所述峰起点参考点之后的点的斜率的正负变化进行解析判断,当一点的斜率为负且该点前一点的斜率为正时,比较该两点的纵坐标值,将纵坐标值较大的点确定为所述临时峰顶点参考点,以及
21.将所述临时峰顶点参考点之后的点的斜率与预先确定的第二阈值进行比较,当连续两点的斜率小于所述第二阈值时,比较该两点的纵坐标值,将纵坐标值较小的点确定为峰终点参考点。
22.可选地,所述对生成所述原始谱图数据的色谱仪器的空载输出信号的计算分析过程包括:
23.对色谱仪器空载时输出基线的斜率变化进行统计分析,计算确定斜率变化的方差,并进而确定斜率变化的标准差;
24.将三倍的所述斜率变化的标准差作为所述第一阈值,将负三倍的所述斜率变化的标准差作为所述第二阈值。
25.可选地,所述根据所述峰顶点校正点对临时峰顶点参考点进行校正处理,将校正的点作为峰顶点参考点,具体为:
26.比较所述峰顶点校正点和所述临时峰顶点参考点的纵坐标值,将纵坐标值较大的点确定为峰顶点参考点。
27.可选地,所述以高斯波为匹配波对所述位置处附近的色谱曲线进行模式识别检测,并将识别检测结果中的峰顶点作为峰顶点校正点,包括:
28.以所述位置处附近的色谱曲线作为待检测曲线,将高斯波的波形在所述待检测曲线上从左端点向右端点滑动并同时进行两者相关系数的计算,基于计算结果得到所述待检测曲线的色谱数据相对高斯波的相关系数组;
29.将所述相关系数组中各相关系数与预定值进行比较分析,基于系数值大于预定值的相关系数确定高斯波峰位位置,将所述待检测曲线上该位置处的点确定为所述峰顶点校
正点。
30.可选地,所述基于检测出的色谱峰生成检测结果,包括:
31.对检测出来的色谱峰进行积分,计算确定色谱峰的面积和高度。
32.可选地,还包括,
33.针对所述原始谱图数据采用参考色谱谱图检测算法进行检测处理,得到参考检测结果;
34.将所述检测结果与所述参考检测结果进行比对分析,生成检测评价报告并显示输出。
35.可选地,所述将所述检测结果与所述参考检测结果进行比对分析,包括:
36.将所述检测结果及所述参考检测结果中检测出的色谱峰进行匹配,确定匹配的色谱峰,基于匹配的色谱峰在检测出的色谱峰中的占比,以及匹配的色谱峰的差异生成检测评价报告。
37.第二方面,
38.本技术提供一种电子设备,包括:
39.存储器,其上存储有可执行程序;
40.处理器,用于执行所述存储器中的所述可执行程序,以实现上述所述方法的步骤。
41.本技术采用以上技术方案,至少具备以下有益效果:
42.本技术的技术方案,基于模式匹配并结合色谱曲线的斜率来实际具体检测液相和气相色谱谱图,整体上提高了检测的可靠性。且方法中斜率检测方式中的阈值是基于仪器自身信号来自动计算确定的,模式匹配检测出的峰特征点只是作为参考点来校正基于斜率检测得到峰特征点,这也同时弥补了现有技术中两种方式所存在的缺陷。
43.本发明的其他优点、目标,和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书,权利要求书,以及附图中所特别指出的结构来实现和获得。
附图说明
44.附图用来提供对本技术的技术方案或现有技术的进一步理解,并且构成说明书的一部分。其中,表达本技术实施例的附图与本技术的实施例一起用于解释本技术的技术方案,但并不构成对本技术技术方案的限制。
45.图1为本技术一个实施例提供的色谱谱图的检测分析方法的流程示意说明图;
46.图2为图1所示实施例中某一色谱峰检测的流程示意说明图;
47.图3为本技术一个实施例中不同检测结果之间进行色谱峰匹配的实现流程示意说明图;
48.图4为本技术一个实施例中检测评价报告显示输出的实现流程示意说明图;
49.图5为本技术一个实施例提供的电子设备的结构示意图。
具体实施方式
50.为使本技术的目的、技术方案和优点更加清楚,下面将对本技术的技术方案进行
详细的描述。显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本技术所保护的范围。
51.如背景技术中所述,在现有对色谱谱图进行检测分析的相关技术中,时间窗法、导数法及模式匹配等方法存在对多峰重叠识别好或泛用性不强等缺陷。
52.针对于此,本技术提出一种色谱谱图的检测分析方法,基于模式匹配并结合色谱曲线的斜率来检测色谱峰,该方式有助于弥补现有技术中的不足,实现综合性能更佳的谱图检测分析。
53.如图1和图2所示,在一实施例中,本技术提出的色谱谱图的检测分析方法,包括:
54.步骤s110,获取待处理的原始谱图数据;
55.步骤s120,针对原始谱图数据,采用预设大小时间窗口(窗口大小基于仪器的标准保留时间参数来设定,如为标准保留时间参数的10%)从色谱曲线起点开始依次滑动来进行色谱峰的检测处理,直至原始谱图数据处理完毕,检测出曲线中的所有色谱峰,并基于检测出的色谱峰生成检测结果;
56.容易理解的是,对于某一完整的谱图数据而言,一般是存在多个色谱峰的,换言之,步骤s120的检测过程中,是随时间窗口滑动,来依次检测出各个色谱峰的。具体的,如图2所示,步骤s120中,在每一个色谱峰的检测处理过程中,包括:
57.步骤s121,将色谱曲线上各点的斜率与阈值进行比较,基于比较结果确定色谱峰的参考点,其中,参考点包括峰起点参考点、临时峰顶点参考点和峰终点参考点,这里的阈值基于对生成原始谱图数据的色谱仪器的空载输出信号的计算分析而确定;
58.步骤s121中,不同于现有技术,在基于斜率进行检测的过程中,阈值不是人工设定的,而是基于对生成原始谱图数据的色谱仪器的空载输出信号的计算分析而确定的,采用这种方式相比人为设置阈值的方式,其可靠性更高,有利于保证识别的分辨率及提高识别正确率。
59.步骤s122,基于参考点所表征的色谱峰在色谱曲线上的位置,以高斯波为匹配波对位置处附近的色谱曲线进行模式识别检测,并将识别检测结果中的峰顶点作为峰顶点校正点;
60.步骤s123,根据峰顶点校正点对临时峰顶点参考点进行校正处理,将校正后的点作为峰顶点参考点;
61.具体的,该步骤中,通过比较峰顶点校正点和临时峰顶点参考点的纵坐标值,将纵坐标值较大的点确定为峰顶点参考点。
62.步骤s124,将峰起点参考点、峰终点参考点以及峰顶点参考点所表征的色谱峰确定为检测出的色谱峰。
63.在步骤s120中,随时间窗口滑动,在每一色谱峰检测过程中,重复进行s121

s124步骤,直至处理完所有原始谱图数据。
64.本技术的技术方案,基于模式匹配并结合色谱曲线的斜率来实际具体检测液相和气相色谱谱图,整体上提高了检测的可靠性。且方法中斜率检测方式中的阈值是基于仪器自身信号来自动计算确定的,模式匹配检测出的峰特征点只是作为参考点来校正基于斜率检测得到峰特征点,这也同时弥补了现有技术中两种方式所存在的缺陷。
65.为便于理解本技术的技术方案,下面以另一实施例对本技术的技术方案进行介绍说明。
66.该实施例中,同样的,首先进行步骤s210,获取待处理的原始谱图数据。
67.之后进行步骤s220,针对原始谱图数据,采用预设大小时间窗口从色谱曲线起点开始依次滑动来进行色谱峰的检测处理,直至原始谱图数据处理完毕,检测出曲线中的所有色谱峰,并基于检测出的色谱峰生成检测结果;
68.举例而言,这里基于检测出的色谱峰生成检测结果包括对检测出来的色谱峰进行积分,计算确定色谱峰的面积和高度。
69.类似的,该实施例中,步骤s220中,在每一个色谱峰的检测处理过程中,包括:
70.步骤s221,将色谱曲线上各点的斜率与阈值进行比较,基于比较结果确定色谱峰的参考点,其中,参考点包括峰起点参考点、临时峰顶点参考点和峰终点参考点,这里的阈值基于对生成原始谱图数据的色谱仪器的空载输出信号的计算分析而确定;
71.具体的,将色谱曲线上各点的斜率与阈值进行比较,基于比较结果确定色谱峰的参考点包括:
72.实时计算时间窗口滑动过程中色谱曲线上点i的斜率g
i

73.将计算出的斜率g
i
与预先确定的第一阈值t
thre
进行比较,当连续两点的斜率大于第一阈值时t
thre
,即g
i
>t
thre
,g
i
‑1>t
thre
,比较该两点的纵坐标值,将纵坐标值较小的点确定为峰起点参考点,以及
74.对峰起点参考点之后的点的斜率的正负变化进行解析判断,当一点的斜率为负且该点前一点的斜率为正时,即如g
i
‑1>0,g
i
<0,比较该两点的纵坐标值,将纵坐标值较大的点确定为临时峰顶点参考点,以及
75.将临时峰顶点参考点之后的点的斜率与预先确定的第二阈值t`
thre
进行比较,当连续两点的斜率小于第二阈值t`
thre
时,即g
i
<t`
thre
,g
i
‑1<t`
thre
,比较该两点的纵坐标值,将纵坐标值较小的点确定为峰终点参考点。
76.步骤s221中第一阈值t
thre
及第二阈值t`
thre
是基于对生成原始谱图数据的色谱仪器的空载输出信号的计算分析而确定的,确定具体过程为:
77.对色谱仪器空载时输出基线的斜率变化进行统计分析,计算确定斜率变化的方差,并进而确定斜率变化的标准差;
78.在分析仪器技术领域,一般认为随机噪声和基线漂移的斜率变化是服从正态分布的,且具有零均值的,因此,这里只需基于以下表达式(1)求其方差,
[0079][0080]
表达式(1)中,e2表示方差,e表示标准差,f
i
表示样本与均值的差,样本数量n一般大于100。
[0081]
之后基于正态分布的统计特性(3e可保证97.3%的基线的斜率落在零斜率区间内),将三倍的斜率变化的标准差作为第一阈值,将负三倍的斜率变化的标准差作为第二阈值,即第一阈值t
thre
=3e,第二阈值t`
thre


3e。
[0082]
步骤s221之后,进行步骤s222,基于参考点所表征的色谱峰在色谱曲线上的位置,以高斯波为匹配波对位置处附近的色谱曲线进行模式识别检测,并将识别检测结果中的峰
顶点作为峰顶点校正点;
[0083]
具体的,步骤s222中,与现有技术相似,首先,以该位置处附近的色谱曲线作为待检测曲线,将高斯波的波形在待检测曲线上从左端点向右端点滑动并同时进行两者相关系数的计算,基于计算结果得到所述待检测曲线的色谱数据相对高斯波的相关系数组,其计算过程的公式表达为,
[0084][0085]
表达式(2)中,r表示相关系数,x
i
,y
i
分别表示当前计算相关度的色谱峰数据和匹配波数据,分别表示两组数据的平均值。
[0086]
之后,将相关系数组中各相关系数与预定值进行比较分析,基于系数值大于预定值的相关系数确定高斯波峰位位置,将待检测曲线上该位置处的点确定为峰顶点校正点。
[0087]
举例而言,这里的预定值为0.8,当相关系数大于0.8表示两者强相关,确定高斯波峰位位置的过程与现有技术相同,本技术这里就不进行详述了。
[0088]
在步骤s222之后,进行步骤s223,通过比较峰顶点校正点和临时峰顶点参考点的纵坐标值,将纵坐标值较大的点确定为峰顶点参考点。
[0089]
该实施例中,最后进行步骤s224,将峰起点参考点、峰终点参考点以及峰顶点参考点所表征的色谱峰确定为检测出的色谱峰。
[0090]
该实施例中,步骤s220中,随时间窗口滑动,在每一色谱峰检测过程中,重复进行s221

s224步骤,直至处理完所有原始谱图数据。
[0091]
本技术的技术方案,基于模式匹配并结合色谱曲线的斜率来实际具体检测液相和气相色谱谱图,结合了两种方式的优点(如模式识别对于噪声、色谱峰宽、幅值的变化不敏感,具有非常好的抗干扰性、容错性和鲁棒性),整体上提高了检测的可靠性。且该分析方法中基于时间窗口滑动的方式进行谱图数据识别,可实现在谱图数据输出的同时就进行检测分析处理,从而更快的输出检测分析结果。
[0092]
此外,方法中斜率检测方式中的阈值是基于仪器自身信号来自动计算确定的,模式匹配检测出的峰特征点只是作为参考点来校正基于斜率检测得到峰特征点,这也同时弥补了现有技术中两种方式所存在的缺陷。
[0093]
此外,为方便用户能快速地了解及评估本技术检测分析方法的性能,在具体的应用场景下,在以上实施例的基础上,本技术的技术方案还包括:
[0094]
针对原始谱图数据采用参考色谱谱图检测算法进行检测处理,得到参考检测结果;将检测结果与参考检测结果进行比对分析,生成检测评价报告并显示输出;这里的参考色谱谱图检测算法是指,除本技术检测分析方法之外的、实现功能目的与本技术方法相同的其他检测分析方法。
[0095]
上述将检测结果与参考检测结果进行比对分析,包括:将检测结果及参考检测结果中检测出的色谱峰进行匹配,确定匹配的色谱峰(流程过程如图3所示),基于匹配的色谱峰在检测出的色谱峰中的占比,以及匹配的色谱峰的差异生成检测评价报告(流程过程如图4所示)。
[0096]
换言之,本技术的评价分析过程,不是从时间序列上将结果进行一一对应进行比
较,而是首先将检测出来的峰的结果按照峰高进行降序排列,其中峰的结果包括峰的起点、终点、峰高、面积、保留时间(峰顶点的对应的时间)、基线的起点、基线的终点,接着对排序后的结果进行比较匹配(一个峰结果对应一条数据,整条数据会随着峰高顺序的变动而变动)。
[0097]
如图3所示,该实现中,首先考虑结合峰高和保留时间双重条件进行对比匹配。首先对峰高进行对比,若对比算法的峰高差值在一定范围内,则进行保留时间的对比,若其差值也在一定的范围内,则表示对比算法的这个对应的峰能对应匹配上,将对比结果进行保存用于后续计算它们指标值。
[0098]
若不满足其中两个任何一个条件则认为当前的对比的数据没有匹配上,则一方索引固定,另一结果索引往后移动,直到找到能匹配上的数据或者另一方数据索引移动到最后一条。值得说明的是,不同的算法对同一个色谱数据的同一个峰的计算结果不一定是一模一样的,由于算法的差异,得出结果也存在着一定的差异,但是相差值不会很大,因此差值在某个范围内即可。当然,同一个色谱数据中可能存在峰高类似的情况。因此在结果对比时,本技术还会根据相应的情况增加保留时间的对比来确保结果的准确性。
[0099]
匹配过程完成后,将匹配上的峰结果信息一一对应保存,然后根据每个峰结果信息来计算相应的指标,进入图4所示的检测评价报告可视化输出阶段,具体在该阶段中检测评价报告,包括:
[0100]
a、查看大致的匹配结果
[0101]
将匹配上和未匹配上峰的个数作图进行可视化的展示,如采用bar图进行展示,假设method1(本技术的检测分析方法)检测出来的峰个数为n,method2(参考色谱谱图检测算法)检测出来的峰个数为m,匹配上的峰的个数为s,其中s<min(n,m)。一个柱状图包含三个部分,下面method1是未匹配上峰的个数n

s,中间是两个算法匹配上峰的个数s,上面部分是method2未匹配上峰的个数m

s。如果中间部分所占比例比较大,说明两个算法的检测出来的峰的个数比较多,检测性能比较接近。
[0102]
b、大多数情况下,色谱数据由于仪器和实验的条件都会产生一定的噪声,不同的算法对于噪声的敏感程度不一样。在匹配时,小峰时常会出现没有匹配上的情况,然而这种情况在一定程度上会误导上述a中得出的结果。因此这里添加了一个匹配上峰面积总和占所有峰总面积的百分比的对比bar图。如果两个百分结果很接近且数值都比较大,则认为这两组结果大峰都匹配上了,这就从另一个指标来验证了两个算法的检测性能的差别。
[0103]
c、查看匹配结果是否出现异常
[0104]
具体的,举例而言,分别计算匹配上峰的起终点差值的std(均方根误差)。峰面积差值的std,如果std在某个范围内浮动,这时认为两个对比算法匹配上的峰在起终点上没有比较突出的异常。否则,则认为出现了异常点,此后则可根据出现异常的数据来排查检测算法出现了何种异常。
[0105]
此外进一步的,容易理解的是,针对不同的原始数据,基于相应结果对算法进行对比分析,一个数据就可对应一个评价报告,根据这些报告对整体的数据结果形成一个全面的评价,来综合评价算法性能。
[0106]
图5为本技术一个实施例提供的电子设备的结构示意图,如图5所示,该电子设备400包括:
[0107]
存储器401,其上存储有可执行程序;
[0108]
处理器402,用于执行存储器401中的可执行程序,以实现上述方法的步骤。
[0109]
关于上述实施例中的电子设备400,其处理器402执行存储器401中的程序的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0110]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人员在本发明所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1