一种基于移动最小二乘法的谱图基础维度校正及差示分析方法与流程

文档序号:17350664发布日期:2019-04-09 21:09阅读:241来源:国知局
一种基于移动最小二乘法的谱图基础维度校正及差示分析方法与流程

本发明属于计量学领域,更具体地,涉及一种基于移动最小二乘法的谱图基础维度校正及差示分析方法。



背景技术:

谱图分析是当代科学研究中不可或缺的技术。在基础学科——化学中,逐渐发展出了以四大谱——质谱、核磁共振、振动光谱如红外光谱、电子跃迁如紫外可见为中心,联用谱如热分析-红外、气相色谱-质谱等作为进阶方法的一系列谱图表征方法。

传统的谱图分析方法在化学学科中多对局部信息进行捕捉和分析,如核磁共振中进行裂分峰耦合分析、紫外-可见中进行导数光谱峰分析、红外光谱中进行主成分分析等。这样的方法要求研究人(1)具备一定的化学素养来归属化学结构、性质与谱图表现;(2)解析不同谱图时可能要切换不同的分析软件,如核磁常用的mestanova,红外和紫外常用的ezomic;(3)单谱解析耗时较长,调用数据库比对时需要人工进行分别甄别、解析和比对;(4)对于非单一组分样品、非恒定组成比样品往往分析周期较长、工作量较大且效果欠佳。

随着计算机科学、统计学、控制学等学科发展出了越来越深入的学科理论和越来越广泛的应用示例,这为计量学中尤其是化学计量学、谱图领域的发展奠定了良好的基础。常用对谱图的解析手段往往依赖于一些软件内嵌的峰面积计算、峰型归属等方法,或是对样品的流出时间进行定性,依赖高阶优势进行谱图降噪后再归属分析等。实际上,随着研究对象的结构、组成及其比例日渐复杂,仪器的检出信息越来越多,谱图信息也越来越丰富、越来越难解析。部分天然提取物,尤其是含有几十甚至成百上千种组分的动植物提取物,我们难以全解析谱图中每一个峰的归属或每个数据点所代表的意义时,使用传统的谱图分析方法就存在有一定的使用局限性和操作上的困难。因此进行样品鉴定和质量控制时,建立一套简明、完整、非本专业的理论技术人员仍可直观理解、易于实施的标准管控技术及其流程就成为了一项富有挑战也极具实际意义的工作。



技术实现要素:

针对现有技术的以上缺陷或改进需求,本发明提供了一种基于移动最小二乘法的谱图基础维度校正及差示分析的方法,其目的在于进行谱图的基础维度进行归整修正后,充分发挥计算机运算的优势和数据(库)标准的建立策略,由此优选地进行差示谱图分析、质量(系列)库的建立与管理、样品的鉴定与鉴定报告生成的技术问题。

为实现上述目的,按照本发明的一个方面,提供了一种基于移动最小二乘法的谱图基础维度校正方法,包括以下步骤:

步骤1,选取待校正目标谱图段,获得所述待校正目标谱图段的原始数据并建立基组坐标,包括目标谱图段的自变量坐标和因变量坐标;

步骤2,以最小化原位拟合误差为目的,对导入的目标谱图段的原始数据利用移动最小二乘法进行拟合,获得拟合函数;

步骤3,将目标谱图段的校正自变量坐标代入所述拟合函数中进行计算,获得目标谱图段的校正因变量坐标。

按照本发明的另一个方面,提供了一种基于所述的基础维度校正方法的差示分析物质鉴定方法,包括以下步骤:

步骤1,对选择的若干个已知标准物质的谱图分别采用所述的基础维度校正方法进行基础维度校正,使得该若干个已知标准物质谱图校正后具有相同的校正自变量坐标数列,即获得已知标准物质的校正谱图;

步骤2,对所述已知标准物质的校正谱图间进行两两做差,具体为:将所述已知标准物质中任意两种已知标准物质校正后的谱图的自变量坐标数列对齐,然后对每一个校正自变量坐标对应的两种已知标准物质的校正因变量坐标进行做差并取绝对差值,对获得的所有校正因变量坐标的差值进行求和,即为差示值;对若干个已知标准物质校正谱图进行做差并求取其对应的差示值,将所得差示值中的最大值作为系统最大安全阈;

步骤3,对选择的若干个已知非标准物质的谱图分别采用所述的基础维度校正方法进行基础维度校正,使得该若干个非标准物质谱图校正后具有相同的校正自变量坐标数列,即获得已知非标准物质的校正谱图;

步骤4,对所述已知标准物质和非标准物质的校正谱图进行两两做差,具体为:将任意一种已知标准物质校正后的谱图与所述任意一种已知非标准物质校正后的谱图的自变量坐标数列对齐,然后对每一个校正自变量坐标对应的已知标准物质和已知非标准物质的校正因变量坐标进行两两做差,对获得的所有两两校正因变量坐标的差值进行求和,即为差示值;对若干个已知标准物质和若干个已知非标准物质校正谱图按照上述方法进行做差并求取其对应的差示值,将所得求和中的最小值作为系统最小示警阈;且所述最小示警阈在数值上大于所述最大安全阈;

步骤5,对未知样的谱图采用如权利要求1所述的基础维度校正方法进行基础维度校正,使得该未知样谱图校正后与已知标准物质具有相同的校正自变量坐标数列,即获得未知样的校正谱图;

步骤6,对所述未知样和已知标准物质的校正谱图进行两两做差,具体为:将未知样校正后的谱图与所述任意一种已知标准物质校正后的谱图的自变量坐标数列对齐,然后对每一个校正自变量坐标对应的未知样和已知标准物质的校正因变量坐标进行做差,对获得的所有校正因变量坐标的差值进行求和,即为此时的差示值;根据差示结果判断该未知样是否为标准物质。

优选地,根据未知样的差示结果判断该未知样是否为标准物质,具体判断方法为:

如果该未知样的差示结果比最大安全阈要小,则可置信该未知样的谱图为标准谱图,该未知样属于标准物质;

如果该未知样的差示结果比最小示警阈要大,则可置信该未知样谱图为非标准谱图,该未知样不属于标准物质。

优选地,步骤6所述的未知样的差示结果不处于所述最小示警阈和最大安全阈之间。

优选地,所述做差的方法为计算欧几里得差值、曼哈顿差值、切比雪夫差值,或对维度进行加权求差或梯度求差。

总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:

(1)本方案采用了部署在计算机编译器中的一种基于移动最小二乘法的快速优化算法进行基础维度校正。这一校正使原本未修正对齐的自变量在校正重构后得以实现适应整齐化,即在维度的目标段上具有全同的性质。该方法是数学方法在计算机再部署之后的实现,既完好地保留了数学运算的结构特征,又利用了强大的计算机技术使技术变得自动化和智能化。

(2)本发明将该校正后的谱图用于差示全谱图分析及标准的建立。差示谱图分析法中的应用可以为现有标准谱图的比对方法提供新思路,为标准谱图数据(库)的重构和再发展提供可靠的新方案。由于差示分析方法是基于研究谱图的基维上数据全同(全对正)之后进行的差示比较方法,故而基于移动最小二乘法的基础维度校正就发挥了其散点谱的适应性。

(3)提供了一种利用差示全谱图分析进行样品鉴定的方法,该方案在检测人尚不具备十分专业的学科背景的扎实理论功底亦可进行判定。检测人只需进行谱图之间的差值求取及相关最大最小值的判定即可生成鉴定报告。本方法的另一优点在于,对相同数据进行相同支撑函数及其参数选择后,比较可得到唯一解、正确率高而特征稳定,相对于传统的主成分解析耗时大大减少,且具备强大的分辨能力,对所获得谱图的细节捕捉十分灵敏。

附图说明

图1是本发明的方法全流程简图;

图2是本发明中基于移动最小二乘法的基础维度校正的方法示意图;

图3是本发明实例中一种差示全谱图分析的方法流程图;

图4是本发明实例中一种利用差示全谱图分析进行样品鉴定的方法流程图;

图5是本发明实例中在bruker-vertex70型红外光谱仪中检测对甲氧基苯胺的采样光谱选段;

图6是本发明实例基于bruker-vertex70型红外光谱仪中检测的对甲氧基苯胺采样光谱,进行的x轴原位对正快速优化移动最小二乘法拟合结果。

图7是本发明实例基于bruker-vertex70型红外光谱仪中检测对甲氧基苯胺的采样光谱,进行的参数选段快速优化移动最小二乘法拟合结果。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

通常情况下,红外光谱的采样光谱中都存在有“数位不对正”的情况。所谓“数位不对正”指的是对于同一个或同一个系列的样品,通过仪器测得的光谱在采样中虽然在实验初始值设定时选择的是同样的波段和同样的分辨率,但在具体的位置上常常存在有一定的随机偏移。比如,同样设置为从648cm-1至3500cm-1,以2cm-1为分辨率的选段,第一个点则可能采样在648.51cm-1,也有可能采样在649.23cm-1。这一情况广泛存在于计量学和谱图领域当中,使得现有的精准谱图分析或停留在对单一谱图的主成分分析,或者通过线性连接散点等进行拟合给出趋势线分析等。本方案即实现了一种“谱图位置校正”,使所有的数据点归正到我们所想要研究的目标选段的选定位置上,以便于进一步利用该校正方法实现对样品的鉴定,比如判断未知样品是否与标准样品属于同一种物质。

传统地,在移动最小二乘法的有关研究中,多将该算法用于图像分割、拟合曲面的建立、拟合效果的研究等方面,如李淑玲等在《重庆师范大学学报(自然科学版)》中有发表《移动最小二乘近似在图像分割中的应用》、韦益夫等在《上海交通大学学报》中有报道了《改进移动最小二乘法及其在结构可靠性分析中的应用》。目前还没有将这一算法专门针对于谱图学领域及其研究的有关报告。

本发明涉及一种基于移动最小二乘法的谱图基础维度校正及差示分析方法。该方法为:利用移动最小二乘法对已知标准物质(系列)进行已获得的谱图进行基础维度校正;利用校正后的谱图进行差示分析,具体为:利用已知标准物质(系列)中获取的多次谱图中进行循环做差,得到系统最大安全阈;利用已知非标准物质(系列)与已知标准物质(系列)间进行多谱图循环做差,得到系统最小示警阈;将未知样谱图与已知标准物质(系列)谱图亦进行循环做差,与最大安全阈和最小安全阈比较后即可给出谱图分析结果。

本发明提供的基于移动最小二乘法的谱图基础维度校正方法,包括以下步骤:

步骤1,选取待校正目标谱图段,获得所述待校正目标谱图段的原始数据并建立基组坐标,包括目标谱图段的自变量坐标和因变量坐标。

步骤2,以最小化原位拟合误差为目的,对导入的目标谱图段的原始数据利用部署在计算机编译器中的移动最小二乘法进行原位拟合,选取目标谱图段的紧支撑权函数,获得拟合函数。紧支撑函数是具有紧支集特性的函数,具有该特性的函数种类很多,可部署在计算机中后调用。

步骤3,将目标谱图段的校正自变量坐标代入所述紧支撑权函数以及拟合函数中进行计算,获得目标谱图段的校正因变量坐标。

以下为实施例:在本实例中,我们将移动最小二乘法在anaconda的python编译器中进行部署调用,对二维的采样谱图进行校正,最小化拟合误差。拟合函数如下:

其中,本实施例采用线性基,其数学表达如下

pt(x)=[1,x]

b(x)=[w1(x)p(x1)w2(x)p(x2)...wn(x)p(xn)]

f=[f(x1),f(x2),...,f(xn)]t

上式中,xi为采样谱图点的横坐标,f(xi)为采样谱图点的纵坐标,i为谱图上的第i个数据点,n为数据点的个数,wi(x)为紧支撑权函数;x为校正后的谱图点的横坐标,为校正后的谱图点的纵坐标。

上述数学过程可以基于多种计算机语言,部署在办公计算机的编译器中实现。

将目标谱图段的校正横坐标代入上述紧支撑权函数以及拟合函数中进行计算,获得目标谱图段的校正纵坐标。对同一样品的多次测量谱图或多个样品的多个谱图按照上述方法进行基础维度的校正,可以使得上所述谱图的横坐标相同,即实现了一种“谱图位置校正”,使所有的数据点归正到我们所想要研究的目标选段的选定位置上。

比如,某一实施例中,目标谱图段选择为对从648cm-1至4000cm-1扫描128次、分辨率为4cm-1的谱图按照上述方法进行校正参数设置。校正完毕后进行制表,表1中列出了原采样光谱、原位计算光谱和基础维度校正后的光谱。测试样品为对甲氧基苯胺。其中原位计算光谱为与原采样光谱横坐标相同,输入拟合函数获得的相应的纵坐标数据集。

所有数据的可视化散点图已在附图说明的图5、图6、图7中体现。图5是本发明实例中在bruker-vertex70型红外光谱仪中检测对甲氧基苯胺的采样光谱选段;图6是本发明实例基于bruker-vertex70型红外光谱仪中检测的对甲氧基苯胺采样光谱,进行的x轴原位对正快速优化移动最小二乘法拟合结果。图7是本发明实例基于bruker-vertex70型红外光谱仪中检测对甲氧基苯胺的采样光谱,进行的参数选段快速优化移动最小二乘法拟合结果。散点图中的横轴为波数λ,以cm-1为单位;纵轴则为吸收强度abs。

为了展示方便,仅仅给出了从1550cm-1至1440cm-1的光谱数据表格。其中表格的奇数列是波数λ,以cm-1为单位;表格中的偶数列是吸收强度abs。

表1

一个实施例中,某一待鉴定样品为从某商家购买商品,疑似为标准品,但不确定其是否为与标准品,于是采用本发明基于上述基础维度校正方法进行样品差示分析。具体包括如下步骤:

步骤1,对选择的若干个已知标准物质的谱图分别采用所述的基础维度校正方法进行基础维度校正,使得该若干个已知标准物质谱图校正后具有相同的校正自变量坐标数列,即获得已知标准物质的校正谱图;

步骤2,对所述已知标准物质的校正谱图进行两两做差,具体为:将所述已知标准物质中任意两种已知标准物质校正后的谱图的自变量坐标数列对齐,然后对每一个校正自变量坐标对应的两种已知标准物质的校正因变量坐标进行做差,对获得的所有校正因变量坐标的单点差值进行求和,即为差示值。对若干个已知标准物质校正谱图进行单点做差并求取其差示值,将若干个已知标准物质差值差示值中的最大值作为系统最大安全阈;

步骤3,对选择的若干个已知标准物质和若干个已知非标准物质的谱图分别采用所述的基础维度校正方法进行基础维度校正,使得该若干个已知标准物质和若干个非标准物质谱图校正后具有相同的校正自变量坐标数列,即获得已知标准物质和非标准物质的校正谱图;

步骤4,对所述已知标准物质和非标准物质的校正谱图进行两两做差,具体为:将任意一种已知标准物质校正后的谱图与所述任意一种已知非标准物质校正后的谱图的自变量坐标数列对齐,然后对每一个校正自变量坐标对应的已知标准物质和已知非标准物质的校正因变量坐标进行两两做差,对获得的所有两两校正因变量坐标的单点差值进行求和,即为差示值。对若干个已知标准物质和若干个已知非标准物质校正谱图按照上述方法进行单点做差并求取其差示值,将所得差示值中的最小值作为系统最小示警阈;且最小示警阈在数值上大于所述最大安全阈;

步骤5,对未知样的谱图采用所述的基础维度校正方法进行基础维度校正,使得该未知样谱图校正后与已知标准物质具有相同的校正自变量坐标数列,即获得未知样的校正谱图;

步骤6,对所述未知样和已知标准物质的校正谱图进行两两做差,具体为:将未知样校正后的谱图与所述任意一种已知标准物质校正后的谱图的自变量坐标数列对齐,然后对每一个校正自变量坐标对应的未知样和已知标准物质的校正因变量坐标进行做差,对获得的所有校正因变量坐标的单点差值进行求和,即为未知样的差示值。根据这一差示结果获得是否为标准物质的鉴定结果;具体为:如果未知样的差示结果比最大安全阈要小,则可置信该未知样的谱图为标准谱图,该未知样属于标准物质;如果未知样的差示结果比最小示警阈要大,则可置信该未知样谱图为非标准谱图,该未知样不属于标准物质。

需要通过选择合适的已知标准物质和已知非标准物质,优选使得步骤6所述的未知样和已知标准物质之间的差示结果不处于所述最小示警阈和最大安全阈之间。在对已知标准物质和已知非标准物质的种类进行选择时,标准物质种类与待测样品越接近,其检测准确度越高,而非标准物质种类的选择相对不那么严格,因此最小示警阈可能比最大安全阈高出很多。但是为了提高对未知待鉴定样品的鉴定准确性,应尽可能选择与待鉴定样品比较接近的物质种类作为标准或非标准物质,最小示警阈和最大安全阈较为接近为宜。

上述鉴定方法中,所述做差的方法可以为多种,比如计算欧几里得差值、曼哈顿差值、切比雪夫差值或对维度等其他数学特征进行加权求差或梯度求差。

该实施例中,选用几种取代苯胺类的化合物进行光谱扫描,他们分别是:3,5-二氯苯胺、邻溴苯胺、间溴苯胺和对溴苯胺。机器选用bruker-vertex70型红外光谱仪,从648至4000cm-1扫描128次后得出的平均结果。

选用3,5-二氯苯胺作为标准物质系列(即下文中的标准合格样品),选用邻溴苯胺和对溴苯胺作为非标准物质系列(即下文中的非标准合格样品)。待鉴定样品原为已知药品——间溴苯胺,我们去掉其原有标记,设定为疑似卤代苯胺的待鉴定样品。

本差示分析实例中以各物质的红外光谱数据进行校正和分析,首先采用上面所述的方法对每一种物质的谱图在目标谱图段进行校正,使它们的横坐标对齐。由于红外光谱是一个二维谱,即a(吸收值)-λ(波数cm-1)之间的一张二维谱图,故而校正中选用的函数、参数均同上一校正实施例。

我们采用如下公式对标准合格样之间、非标准合格样之间进行上述数据求差并进行求和,获得差示值,

其中,i表示第i个数据点,n为数据点的个数,a研究光谱i表示该被研究光谱第i个数据点的对应的纵坐标吸收值,a标准光谱i表示该标准光谱第i个数据点的对应的纵坐标吸收值;由此获得示差表,见表2:

表2

其中1-10系列表示3,5-二氯苯胺(标准合格样品)的多样品测量结果,1-100-19表示邻溴苯胺(非标准样品)、1-200-4表示间溴苯胺(待鉴定样品)、1-300-9表示对溴苯胺(非标准样品)。“.0”和“-star”只起到尾标作用。根据表2可以看出,三个标准合格样谱图间最大的差值结果为0.323498152902554,由标准合格样与非标准样之间的差值可以会的其最小光谱差值为20.9238814454843。所以这两个值就分别对应着上述步骤4中的最大安全阈和最小示警阈。

样品的鉴定即同理代入差示全谱法当中,与已知标准谱图进行比对从而求得其差值。本示例中,将待测样品与标准合格样品库中的所有谱图(即1-10.0-star-、1-10-1.0-star-、1-10-2.0-star-三个3,5-二氯苯胺的谱图)进行做差分析,获得的散点的差值进行求和分别为27.89536933、27.91447388、27.90450665。

将待测样与标准图的谱图差示结果与最小示警阈和最大安全阈比较,在最大安全阈以内的即可置信此为与标准品相同的样品,在最小示警阈以外的即可置信此为非标准的样品。所以对于本例,待鉴定样品的所有差示结果都比最小示警阈要大,可以置信该待鉴定样品为相对于标准样品(3,5-二氯苯胺)为非标准样品。这一结果与其原归属为间溴苯胺是相符合的。

图1是本发明的方法全流程简图;具体为:本发明的方法具体展开分为基于移动最小二乘法进行基础维度校正和校正后的差示分析两方面;

图2是本发明中基于移动最小二乘法的基础维度校正的方法示意图;具体为:应用本方法校正时应首先选择校正坐标,然后对原谱图进行校正生成,从而得到结果。

图3是本发明实例中一种差示全谱图分析的方法流程图;具体为首先进行谱图有关性质(是否为可以利用的散点图、自变量的维数和因变量的维数等)的确定,然后对应地进行谱图校正;紧接着,对于选段中每一个自变量点上的因变量进行差值求取和全谱求和后得到差示值,最后在标准样品之间、标准样品与非标准样品之间确定出最大安全阈和最小示警阈。本发明所涉及的谱图包括以四大谱—质谱、核磁共振、振动光谱如红外光谱、电子跃迁如紫外可见为中心,以及联用谱中如热分析-红外、气相色谱-质谱等作为进阶方法的一系列谱图。

图4是本发明实例中一种利用差示全谱图分析进行样品鉴定的方法流程图;具体为:首先利用上述差示全谱图分析的方法获得两个阈值,对待鉴定样品进行与之前所分析的同类谱图获得,并进行相同过程下的校正。然后,对该待鉴定样品与每一个标准样品分别进行差示分析。最后将得到的差示值与最大安全阈和最小示警阈进行比较,从而得到置信结果。

本发明提出了将移动最小二乘法运用于谱图基础维度校正的新思路,并将此用于谱图的差示分析,由此可以快速、稳定、可靠地进行被测物的谱图校正及分析,进而对未知样进行是否为标准物质或非标准物质的鉴定。

本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1