对核函数参数g和惩罚参数c进行 优化。
[0049]我们采用5折交互验证法选取最佳惩罚参数c和核函数参数g。其基本过程为,让c 和g都在2_1()到21()之间离散取值(其取值变化为2_1(),2_ 9·5,2_9,…,29,29· 5,21()),对于取定的c 和g把校正集作为原始数据集利用5折交互验证(5fold-CV)方法得到在此组c和g下校正集 验证均方误差(MSE),最终取使得校正集验证MSE最小的那组c和g作为最佳参数。如果有多 组C和g对应最小的验证均方误差,则选取参数C最小的那组为最佳参数;如果对应最小的C 有多组g,就选取搜索到的第一组C和g作为最佳参数。这样做的原因是过高的C会导致学习 状态发生,即校正集MSE很低而验证集MSE很高(分类器的泛化能力降低)。
[0050] ③建立回归模型、数据反归一化、预测。利用网格搜寻法,通过上述的5折交互验证 法确定最佳径向基核函数参数c和g后,以校正集中的红外光谱作为自变量,以δ 13(:值为因变 量,将二者都映射到高维空间中,建立土壤近红外光谱与S13C值间的支持向量机回归模型。 并将独立验证集的光谱信息代入该模型计算S 13C值,数据反归一化处理后通过与验证集中 实测δ13(:值比较,检验模型预测精度。
[0051] 以预测相关系数(Correlation coefficient in prediction,!?)、预测均方根误 差(Root mean square error in prediction,RMSEP)为指标考察模型性能,好的模型应当 具备系数高和误差低的特点。此外,使用预测相对分析误差(Residual predictive deviation,RPD)对模型进行深入评价;当RH)值大于3时认为模型具有较好的预测能力,可 以进行指标的定量控制。模型建立好之后即可将未知、性质相似的土壤的近红外漫反射信 息代入该模型中,计算出其S 13C值。
[0052]本发明采集栓皮栎森林土壤(来自不同地方和深度)的近红外光谱图,对原始数据 进行一系列预处理后,结合化学计量学中的SVM,可准确、快速、简便、低成本地检测各种土 壤中的S13c值。
[0053]本发明的优点是:
[0054] (1)准确。预测相关系数R大于0.96,预测均方根误差小于0.68,Rro大于3。
[0055] (2)快速。一个样品采集只需3min,一天可采集至少200张红外谱图,后续的数据处 理可在lh内完成。
[0056] (3)操作简单。样品前处理简单,仪器操作简单。
[0057] (4)测试成本低。相比稳定同位素比例质谱仪,红外光谱仪价格便宜。
[0058] (5)普及性强,易于推广。仪器操作简单,价格相对便宜。
[0059] (6)适用范围广,不仅可用于森林土壤的检测,也可用于农田、草原等其它生态系 统。
[0060] 实施例1包括0e和0a在内的土壤
[00611 (1)制备待检土样。将矿质层土壤去杂、风干、粉碎,过60目筛,干燥器保存备用;将 0e和0a层土壤于60°C烘48h以除尽水分,粉碎,过60目筛,干燥器保存备用。共199个样品来 自于七个不同地区(平谷、洪崖山、白岸、皇藏峪、信阳、黄山、云山)的栓皮栎森林中不同深 度(06、(^、0-2、2-5、5-10、10-20011)的土壤样品,其中矿质层土壤139个,06和03层土壤共60 个。
[0062]由表1采用多元散射校正预处理后光谱模型精度并未得到提高,证明样品制备得 较好,尽可能减小了颗粒散射效应对光谱采集造成的影响。
[0063] (2)利用稳定同位素比例质谱法测得待检土样的δ13(:值。
[0064] (3)光谱采集。称取200mg 土样,置于11mm的横截面为环形的不锈钢柱体内,底部为 低羟基石英玻璃,样品顶部压平。采集近红外波段的漫反射谱图,仪器配置为:傅立叶变换 红外光谱仪,附件为近红外积分球,白光光源,CaF2分束器,InGaAs检测器;采集参数为:以 金镜为背景,扫描范围10000-4000(^ 1,分辨率4CHT1,扫描64次。以样地平谷为例,附图1显 示了 6个土壤深度的近红外谱图。
[0065] (4)数据预处理。用仪器自带软件Omnic 8.2将原始谱图全部波段(即10000- ^OOcnf1)进行大气背景抑制,转成吸收光谱,再进行自动基线校正。将199个样本的光谱数 据导入软件matlab7.8后,用Norris法进行7点平滑、一阶导数等处理。
[0066]该实施例对土壤样品的近红外光谱尝试了 4种常见的预处理:①Norris-阶导数 滤波平滑+SPXY法划分校正集和验证集;②多元散射校正+Norris-阶导数滤波平滑+SPXY 法划分校正集和验证集;③Norris二阶导数滤波平滑+SPXY法划分校正集和验证集;④ Norris-阶导数滤波平滑+K-S法划分校正集和验证集,再应用支持向量机(SVM)法建立土 壤S 13C值的定量估测模型。结果(表1)显示,不同预处理方法对所建土壤δ13(:值估测模型的 预测精度有一定影响,本专利所采用的预处理方法(Norris-阶导数滤波平滑+SPXY法划分 校正集和验证集)的光谱建模精度很高,仅略低于第②种预处理方法的光谱建模精度。 [0067]表1本模型光谱预处理方法与常见预处理方法预测土壤δ 13(:(包括0e和0a)的精度 比较
[0069] (5)采用支持向量机法建立土壤近红外光谱与δ13(:值间的定量关系。将对应的199 个土壤δ13(:值也导入matlab软件中。用SPXY算法将试验样本按3:1的比例分别将光谱信息和 S13C值划分为校正集和验证集,校正集含150个样本,验证集含49个样本。数据进行[_1,1]归 一化处理后,基于校正集,在5折交互验证过程中利用网格搜寻法选取径向基核函数最佳c 为1.4,最佳g为9.77 X 10-4。再用选取的最佳c、g在全波谱范围内用校正集建立土壤近红外 光谱与δ13(:值间的回归模型,并将独立验证集的光谱信息代入该模型计算δ 13(:值,数据反归 一化处理后通过与验证集中实测S13C值比较,检验模型预测精度。预测相关系数(R)为 0.9573(附图2),预测均方根误差(RMSEP)为0.6756,预测相对分析误差(RPD)为3.30。
[0070] 该结果表明,该方法适合于森林土壤不同深度(0e、0a、0-2cm、2-5cm、5-10cm、10-20cm)中δ13(:值的检测,可在较短时间内快速检测土壤δ 13(:值,而且能达到满意的检测精度。 该实施例通过自制的样品台采集了近红外波段建模,取得了非常好的效果。在结合化学计 量学建立校正模型时,不同于传统的线性校正方法(如PLS),采用一种非线性校正模型SVM, 同样取得非常好的效果。同时,Norris-阶导数滤波平滑和SPXY法划分数据集等预处理方 法在利用近红外漫反射技术结合SVM方法无损定量检测土壤δ 13(:起重要作用。试验模型中的 近200个样本来自跨越两个气候带和五个省份的栓皮栎森林土壤,不同的气候条件和土壤 性质均会对光谱产生影响。但正是在这样的复杂条件下建立的模型才有更广的适用范围, 因此,基于支持向量机法的近红外光谱技术是适合土壤S 13C检测的高效检测技术。
[0071]实施例2不包括0e和0a在内的矿质层土壤
[0072] (1)制备待检土样。将矿质层土壤去杂、风干、粉碎,过60目筛,干燥器保存备用。共 139个样品来自于七个不同地区(平谷、洪崖山、白岸、皇藏峪、信阳、黄山、云山)的栓皮栎森 林中不同深度(0-2、2-5、5-10、10_20cm)的矿质层土壤样品。
[0073]由表2采用多元散射校正预处理后光谱模型精度并未得到