一种基于多传感器光谱数据的加权预测方法与流程

文档序号:30663507发布日期:2022-07-06 02:14阅读:96来源:国知局
一种基于多传感器光谱数据的加权预测方法与流程

1.本发明涉及近红外光谱分析技术,具体涉及一种基于多传感器光谱数据的加权预测方法。


背景技术:

2.近年来,近红外光谱分析技术发展十分迅速,已在化工,制药,军工,食品等多个领域都获得了应用。近红外光谱技术属于分子光谱技术,可以在分子水平上表明物质成分和性质信息,不论对经济还是社会影响来说,都取得了非常高的效益,极具发展潜力。
3.然而,目前大多数物质成分和性质信息检测主要使用大型实验室近红外光谱仪器进行,这些方法虽然定量准确灵敏度高,但所需设备体积庞大,设备费用昂贵,样品制备时间长且样品制作方法严格,检测设备和样品制备需要专业人员操作,检测环境固定,且分析时间长,不适用于现场检测,不便于推广使用。
4.伴随着便携式近红外光谱技术的发展,市场主流的大型近红外光谱仪设备都朝着体积小巧,价格低廉的便携式方向发展。但是便携式近红外光谱仪受到传感器技术的限制,单传感器便携式近红外设备涵盖的波段范围十分有限,采集得到的光谱数据稳定性较差,光谱数据容易发生偏移,进而容易造成预测效果不稳定,准确率低的问题。
5.为了增大传感器波段涵盖范围,提升便携式近红外光谱仪的应用场景,多传感器便携式近红外光谱仪应运而生,由于多传感器便携式近红外光谱仪中各个传感器采集获取光谱数据量级并不相同,采用常规的光谱数据处理方法进行预测分析容易造成光谱数据权重存在差异,进而影响光谱模型的预测准确率;同时由于传感器数量增加,光谱数据量也得到了极大的增加,超大的数据量会降低携式近红外光谱分析技术的效率。


技术实现要素:

6.本发明所要解决的技术问题是:提出一种基于多传感器光谱数据的加权预测方法,提高多传感器光谱数据预测分析的准确性、稳定性以及预测效率。
7.本发明解决上述技术问题采用的技术方案是:
8.一种基于多传感器光谱数据的加权预测方法,包括以下步骤:
9.s1、导入原始多传感器光谱数据,并对光谱数据按照传感器型号进行数据划分,相同型号的传感器光谱数据划分为同类数据;
10.s2、对同类数据进行偏最小二乘法建模,获取各个模型的均方根误差及模型决定系数;
11.s3、结合均方根误差及模型决定系数计算光谱数据权重系数,然后对同类数据进行权值化处理;
12.s4、将权值化之后的光谱数据再按照传感器型号再次进行数据划分,不同型号的传感器光谱数据划分为异类数据;
13.s5、分别对异类数据进行偏最小二乘法建模,获取各个模型的均方根误差及模型
决定系数;
14.s6、结合均方根误差及模型决定系数计算预测值的权重系数,然后对异类数据的预测结果进行权值化处理,获得最终单一预测值。
15.进一步的,步骤s2中,所述均方根误差采用留一法进行交叉验证生成,表达式为:
[0016][0017]
其中,m为原始样本个数,yi为样本xi的标定值,为样本xi的预测值。
[0018]
进一步的,步骤s2中,所述模型决定系数r2的计算方式为:
[0019][0020]
其中,y
i,act
为第i个样本的标定值,y
i,pre
为模型内预测第i个样本的预测值,y
i,ave
为m个样本所有标定值的平均值。
[0021]
进一步的,步骤s3中,所述结合均方根误差及模型决定系数计算光谱数据权重系数,具体包括:
[0022][0023]
其中,αi为相同型号的传感器中的第i个传感器光谱数据权重系数,n为相同型号的传感器的个数,ai为相同型号的传感器中的第i个传感器光谱数据模型的均方根误差rmescv值,bi为相同型号的传感器中的第i个传感器光谱数据模型的模型决定系数r2值。
[0024]
进一步的,步骤s3中,所述对同类数据进行权值化处理,具体包括:
[0025]k权
=α1*k1+α2*k2+...αn*kn[0026]
其中,k

为同类传感器的光谱数据权值化处理后的数据,αn为相同型号的传感器中的第n个传感器光谱数据权重系数,kn为相同型号的传感器中的第n个传感器的原始光谱数据,n为相同型号的传感器的个数。
[0027]
进一步的,步骤s6中,所述结合均方根误差及模型决定系数计算预测值的权重系数,具体包括:
[0028][0029]
其中,αj′
为第j组异类数据的权重系数,aj′
为第j组异类数据建立的模型的均方根误差rmescv值,bj′
为第j组异类数据建立的模型的模型决定系数r2值,m为异类数据的组数。
[0030]
进一步的,步骤s6中,所述对异类数据的预测结果进行权值化处理,获得最终单一预测值,具体包括:
[0031]
h=α1′
*h1+α2′
*h2+...αm′
*hm[0032]
其中,h为最终单一预测值,αm′
为第m组异类数据的权重系数,hm为第m组异类数据建立的模型对未知样本的预测值。
[0033]
本发明的有益效果是:
[0034]
该方法通过引入模型均方根误差及模型决定系数来计算权重系数,针对同一类型
传感器,通过模型权重系数对光谱数据进行权值化处理,提升光谱数据样品表征性的同时减小光谱数据量,从而提高了光谱分析预测效率;针对不同类型的传感器,通过对预测结果进行权值化处理,解决多传感器光谱数据量级不同的问题,提升预测稳定性及准确率。
附图说明
[0035]
图1是本发明实施例中的基于多传感器光谱数据的加权预测方法流程图;
[0036]
图2是本发明实施例中的便携式多传感器近红外光谱仪各个传感器的排布示意图。
具体实施方式
[0037]
本发明旨在提出一种基于多传感器光谱数据的加权预测方法,该方法通过引入模型均方根误差及模型决定系数来计算权重系数,针对同一类型传感器,通过模型权重系数对光谱数据进行权值化处理,提升光谱数据样品表征性的同时减小光谱数据量,从而提高了光谱分析预测效率;针对不同类型的传感器,通过对预测结果进行权值化处理,解决多传感器光谱数据量级不同的问题,提升预测稳定性及准确率。
[0038]
实施例:
[0039]
如图1所示,本实施例中的一种基于多传感器光谱数据的加权预测方法,包括以下步骤:
[0040]
步骤101、导入原始多传感器光谱数据,并对光谱数据按照传感器型号进行数据划分,相同型号的传感器光谱数据划分为同类数据;
[0041]
本步骤中,由于相同型号的传感器波段范围相同,采集得到的光谱数据量级也相同,在数据划分时将此类光谱数据划分为同类数据进行相应数据处理,保留光谱特征的同时减小光谱数据量,提升光谱分析效率。
[0042]
作为一种具体示例,如图2所示,在该示例中,采用的便携式多传感器近红外光谱仪包含两种不同型号传感器,同一种型号的传感器为3个,总计为6个传感器。其中两种不同型号的传感器的波段范围分别为1255nm~1550nm,1555nm~1850nm,分辨率为5nm,波长点的分布方式为波长均分式。参照图2,传感器1/2/3是同一类型传感器,波段范围为1255nm~1550nm,包含的波长点个数分别为m1=1+(1550-1255)/5=60个;传感器4/5/6是同一类型传感器,波段范围为1555nm~1850nm,包含的波长点个数分别为m2=1+(1850-1555)/5=60个。由以上可知,多传感器光谱仪的原始光谱数据由6段光谱数据拼接而成,具体波长范围为1255nm~1850nm,总计包含360个波长点。对原始多传感器光谱数据进行数据划分,相同型号的传感器光谱数据划分为同类数据,由此,传感器1/2/3、传感器4/5/6的光谱数据分别为一组同类数据。
[0043]
步骤102、对同类数据进行偏最小二乘法建模,获取各个模型的均方根误差及模型决定系数;
[0044]
本步骤中,偏最小二乘法为光谱分析中最常用、效果优异的线性拟合方法;均方根误差及模型决定系数均为光谱建模分析过程中最常用的模型指标,该两个指标从不同维度表征了各个光谱模型性能的好坏。
[0045]
以传感器1/2/3同类数据为例,分别对传感器1、传感器2、传感器3的光谱数据进行
偏最小二乘法建模,并进一步计算获得3个模型的均方根误差值及模型决定系数值,其中均方根误差(rmescv)实际反应模型内预测标定值与预测值之间的偏差量关系,采用留一法进行交叉验证生成的,表达式如下所示:
[0046][0047]
假定原始光谱数据有m条,则与之对应的原始样本有m个,每次从中取出一个样本xi(第i个样本,i=1,2,
……
,m),用余下(m-1)个光谱样本数据进行建模,用建好的模型去预测被取出来的样本xi的yi值(标定值),得到样本的预测值进而对产生的所有预测值计算均方根误差,得到rmsecv值,由于留一法遍历了原始光谱数据的所有样本,故rmsecv指标对模型筛选的准确率较传统的mse、mae指标更高,更稳定,更适用。
[0048]
模型决定系数r2的计算方式为:模型决定系数表征因变量的变异中有多少百分比可由控制的自变量来解释,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高,即模型决定系数越高,模型效果越好,光谱预测的效果越好。对于原始m条光谱数据进行光谱建模,模型决定系数r2的具体计算公式如下:
[0049][0050]
其中,y
i,act
为第i个样品的标定值,y
i,pre
为模型内预测第i个样品的预测值,y
i,ave
为m个样品所有标定值的平均值。
[0051]
步骤103、结合均方根误差及模型决定系数计算光谱数据权重系数,然后对同类数据进行权值化处理;
[0052]
本步骤中,同类数据即使波段范围相同,数据量级也相同,但由于其装配位置的差异,采集获取样品的光谱数据存在较大差异,进一步在表征样品特性的能力上也存在相应差异,如果对同类数据进行简单的均值化处理,由于每个同类数据传感器的表征能力不同,容易造成最终预测值不稳定,与实际标定值差距过大的问题,通过结合同类数据中每个模型自身系数进行光谱数据权重系数计算,再进一步对同类数据进行权值化处理则可以有效解决该问题。
[0053]
以传感器1/2/3同类数据为例,设定传感器1的原始光谱数据为k1=(p1,p2……
,p
60
),权重系数为α1,光谱数据建立光谱模型的rmescv值为a1,r2值为b1,传感器2的原始光谱数据为k2=(q1,q2……
,q
60
),权重系数为α2,光谱数据建立光谱模型的rmescv值为a2,r2值为b2,传感器3的原始光谱数据为k3=(o1,o2……
,o
60
),权重系数为α3,光谱数据建立光谱模型的rmescv值为a3,r2值为b3。因为rmescv与r2两个指标从不同的维度表征了光谱模型性能的好坏,本发明在计算同类数据权重系数时,将两个指标均引入计算进而最大程度的保证数据稳定性及准确性,同时,由于在表征光谱模型性能时,rmescv值越小越好,即光谱模型rmescv值越小的光谱数据,其权重系数越高,而r2值越大越好,即光谱模型r2值越大的光谱数据,其权重系数越高,进一步获得权重系数的具体计算公式为:
[0054][0055]
再进一步对同类数据进行权值化处理,使得原本包含180个光强点传感器1/2/3同类数据缩减为仅包含60个光强点,具体的权值化计算公式如下:
[0056]
k4=α1*k1+α2*k2+α3*k3=
[0057]
(α1*p1+α2*q1+α3*o1,α1*p2+α2*q2+α3*o2……
,α1*p
60
+α2*q
60
+α3*o
60
)
[0058]
其中k4为传感器1/2/3同类数据权值化之后的光谱数据。
[0059]
同理,对传感器4/5/6同类数据进行相同的权值化处理,获得对应的权值化光谱数据k5,相同型号的3个传感器光谱数据在经过权值化处理后,不仅将光谱数据量简化为原始数据量的1/3,同时结合权重系数保留了各个传感器的不同表征能力,有效提升光谱数据的稳定性及预测准确性。
[0060]
步骤104、将权值化之后的光谱数据再按照传感器型号再次进行数据划分,不同型号的传感器光谱数据划分为异类数据;
[0061]
本步骤中,不同型号传感器所采集到的光谱数据量级不同,波段范围也不相同,采用常规光谱分析方法对其进行建模分析,不仅预测能力弱且模型稳定性也较差,在对原始数据进行同类数据权值化后再按照不同型号传感器进行划分,针对某一个特定型号的传感器,其波段范围以及数据量级均为固定的,建立光谱模型效果较好的同时稳定性也有极大提升。
[0062]
针对图2中的示例,假设权值化后的多传感器光谱数据表示为(k4,k5),光谱数据量缩减为原始光谱数据量的1/3,即权值化后多传感器光谱数据仅包含120个波长点,在波段范围1255nm~1550nm、1555nm~1850nm分别包含60个波长点,包含2个型号传感器的光谱数据,按照不同型号传感器对光谱数据进行二次划分为2组异类数据,该2组异类数据分别为k4,k5。
[0063]
步骤105、分别对异类数据进行偏最小二乘法建模,获取各个模型的均方根误差及模型决定系数;
[0064]
本步骤中,由于异类数据实际表示为各个不同型号传感器光谱数据的分段集合,采用常规的光谱分析方法即可对异类数据进行建模分析,进一步便可获取各个模型的均方根误差及模型决定系数。
[0065]
针对图2的示例,分别对异类数据k4,k5进行偏最小二乘法建模,分别获取1255nm~1550nm、1555nm~1850nm波段范围的光谱模型,进一步计算获取2个光谱模型的均方根误差及模型决定系数。
[0066]
步骤106、结合均方根误差及模型决定系数计算预测值的权重系数,然后对异类数据的预测结果进行权值化处理,获得最终单一预测值。
[0067]
本步骤中,由于各个异类数据的波段范围不同、数量级不同、表征样品的能力也不相同,使得各个异类数据建模分析得到的预测值也不尽相同,如若将某个波段范围的异类
数据预测值当做最终预测值,该值具有较大的随机性,容易造成预测效果不稳定,准确率低的问题。将各个波段范围异类数据不同预测结果进行权值化处理获得最终单一预测值,不仅使得输出结果稳定,且准确率也能得到较大提升。
[0068]
针对图2的示例,设定2组异类数据建立光谱模型的rmescv值分别为(a4,a5),r2值分别为(b4,b5),权重系数分别为(α4,α5),在对未知样本进行预测时,未知样本的多传感器光谱数据进行与原始多传感器光谱数据相同的权值化处理,进一步使用2个异类数据光谱模型对未知样本预测获得预测值分别为(h1,h2),则可以计算出权重系数为:
[0069][0070]
再进一步对异类数据的预测结果进行权值化处理,获得最终单一预测值h为:
[0071]
h=α4*h1+α5*h2[0072]
上述最终单一预测值即本专利基于多传感器光谱数据的加权预测方法对未知样本进行光谱分析获取的预测值。
[0073]
最后应当说明的是,上述实施例仅是优选实施方式,并不用以限制本发明。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可以做出若干修改,等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1