专利名称:基于支持向量回归的鱼丸多组分含量检测的近红外光谱法的制作方法
基于支持向量回归的鱼丸多组分含量检测的近红外光谱法技术领域:
本发明涉及一种水分、蛋白质、淀粉含量同时快速检测的方法,具体的说是涉及一种基于支持向量回归的近红外光谱技术用于鱼丸中水分、蛋白质、淀粉含量的测定。
背景技术:
鱼丸是我国主要的水产加工食品之一,具有高蛋白、低脂肪,食用方便,美味营养等特点,其产量和消费量日益扩增,深受消费者喜爱。为了保障鱼丸品质,《NY/T 1327-2007 绿色食品鱼糜制品》中对其理化指标和微生物指标制定了相关的行业标准。其中水分和淀粉含量是主要的理化检测指标。而蛋白质含量是衡量鱼丸营养价值最重要的指标之一,也非常有必要对其进行检测。现行对这三项指标的检测方法直接干燥法、凯氏定氮法、酸水解法存在步骤繁琐、耗时、耗力等问题。因此急需建立一种快速、简便、准确的检测方法为广大厂商所用。近红外光谱技术(Near-Infrared Spectroscopy, NIRS)是20世纪80年代迅速发展起来一种绿色分析技术,具有快速、方便、无损、多组分同时检测等优点。近红外光主要是对物质中含氢基团X-H(C-H、N-H、0-H)的倍频合频吸收,通过物质的近红外光谱信息结合化学计量学方法做出相应的定性定量分析。目前,该技术已广泛应用于农业、医药、化工、烟草等领域。近年来,在粮油和饲料检测中,我国已经把该技术作为一种标准的检测方法。通过申请人探索、研究发现,该技术也可实现鱼丸中水分、蛋白质、淀粉含量的快速检测。
发明内容本发明针对现有的检测鱼丸中水分、蛋白质、淀粉含量方法操作繁琐、费时、费力等不足,提供一种基于支持向量回归的鱼丸水分、蛋白质、淀粉含量快速同时检测的近红外光谱方法。一种基于支持向量回归的用于鱼丸多组分含量检测的近红外光谱方法,采用傅里叶变换近红外光谱仪和计算机等相关设备,将鱼丸近红外光谱数据和其成分含量数据相关联,通过支持向量回归算法,建立定标模型;并据此模型进行未知样品的定量分析。在本发明的基础上,可进一步用于实现鱼丸生产过程中关键环节的在线监测。本发明的具体方法如下(1)收集样品,收集不同品种不同批次的鱼丸样品;(2)测定含量,采用国标的方法测定每个样品中的水分、蛋白质、淀粉含量;(3)采集光谱,利用近红外光谱仪采集样品的近红外漫反射光谱图;(4)建立模型,将鱼丸样品的近红外光谱图与相应的水分、蛋白质、淀粉含量相关联,利用化学计量学软件进行拟合,分别建立水分定标模型、蛋白质定标模型、淀粉定标模型;(5)模型的评估与验证;(6)未知样品水分、蛋白质、淀粉含量的测定。
所述步骤(1)收集的样品应具代表性,数量在30个以上,包含不同品种不同批次的样品。所述步骤( 水分、蛋白质、淀粉含量的测定分别采用GB5009. 3-2010直接干燥法、GB5009. 5-2010 凯氏定氮法、GB/T5009. 9-2003 酸水解法。所述步骤(3)采集光谱,利用傅里叶变换近红外光谱仪采集样品的漫反射光谱图,扫描波数范围为^OO-lOOOOcnT1,扫描次数为32次,分辨率为8CHT1,以Spectralon为参照背景,每4cm—1采集一个数据点,每张光谱图共1501个点。所述步骤(4)建立模型,在建模前,首先对原始光谱进行预处理,以消除噪音、基线偏移、光散射等影响。水分模型的光谱经标准正态变换(SNV)处理,蛋白质模型的光谱经一阶导数(dbl)和多元散射校正(mf)处理,淀粉模型的光谱经间隔为2的9点平滑(sg9g2) 和一阶导数(dbl)处理。然后采用偏最小二乘投影法对光谱数据进行降维处理,取前15个偏最小二乘投影变量为主因子数。分别以水分、蛋白质、淀粉含量为因变量,通过支持向量回归(SVR)算法分别建立水分、蛋白质、淀粉定标模型。支持向量回归(SVR)的参数为线性核函数,惩罚参数C为10,不敏感函数ε值设为0.15,最大训练次数10000次。所述步骤(4)水分、蛋白质、淀粉的定标模型其含量分布范围分别为 63. 41% -79. 83%,5. 09% -16. 17%,0. 81% -19. 63%。以上所述含量均为质量百分数。所述步骤( 模型的评估与验证,包括模型的内部验证,模型内部验证采用留一法交叉验证(L00CV)考察鱼丸水分、蛋白质、淀粉的支持向量回归模型的泛化能力。所述步骤( 模型的评估标准为近红外预测值与化学值的相关系数R最大且交叉验证标准偏差RMSECV最小。所述步骤( 还包括模型的外部验证,具体步骤为采集鱼丸样品并扫描其光谱, 鱼丸样品数量大于建模集样品数的10% ;根据所述定标模型,采用近红外光谱法分析鱼丸样品的近红外光谱图得到近红外预测值;采用国标方法检测,获得相应的化学测量值;将近红外预测值与化学值进行配对T检验。所述步骤(6)未知样品的测定,是调用所建立的水分、蛋白质、淀粉含量的定标模型对未知样品的近红外光谱图进行分析,得到水分、蛋白质、淀粉含量的分析结果。与现有技术相比,本发明基于支持向量回归算法,采用近红外光谱分析技术,通过建立定标模型对鱼丸水分、蛋白质、淀粉含量进行分析,无需样品前处理,测试过程中不消耗其他化学试剂,测试时间只需要2-3分钟,批量测试时结果准确、重现性好,大大提高检测效率。本方法可在大中型鱼丸生产厂家推广使用。
图1为基于支持向量回归的鱼丸多组分含量检测的近红外光谱法中定标模型建立的流程2为鱼丸的近红外原始光谱3为经标准正态变换(SNV)处理后的鱼丸近红外漫反射光谱4为经一阶导数(dbl)和多元散射校正(mf)处理后的鱼丸近红外漫反射光谱5为经间隔为2的9点平滑(sg9g2)和一阶导数(dbl)处理后的鱼丸近红外漫反射光谱6为鱼丸水分含量定标模型的近红外预测值与化学值的相关7为鱼丸蛋白质含量定标模型的近红外预测值与化学值的相关8为鱼丸淀粉含量定标模型的近红外预测值与化学值的相关图
具体实施方式本发明提供了一种基于支持向量回归的鱼丸水分、蛋白质、淀粉含量同时检测的近红外光谱方法。下面结合附图1到附图8以及实施例对本发明作进一步说明。实施例1基于支持向量回归的鱼丸多组分含量检测的近红外光谱法,包括以下步骤(1)收集样品,收集不同品种不同批次的鱼丸样品;作为建立定标模型的鱼丸样品应具代表性,时间和空间分布范围广、浓度分布均勻且跨度大。所述样品数量为130份,包含带鱼丸、鳕鱼丸、鲷鱼丸、草鱼丸、鲢鱼丸和混合鱼丸六个品种多个批次的样品。(2)测定含量,采用国标的方法测定每个样品中的水分、蛋白质、淀粉含量;水分、蛋白质、淀粉含量的测定分别采用GB5009. 3-2010直接干燥法、 GB5009. 5-2010凯氏定氮法、GB/T5009. 9-2003酸水解法。水分、蛋白质、淀粉定标模型的含量分布范围分别为=63.41% -79. 83%, 5. 09% -16. 17%,0.81% -19.63%。以上所述含量
均为质量百分数。(3)采集光谱,利用近红外光谱仪采集样品的近红外漫反射光谱图;光谱数据的采集,使用BUCHI公司的NIRFlex N500型近红外光谱仪,以及固体测量配件XL。将鱼丸平均切成两半,将切面置于放样圈池上,使样品旋转扫描。光谱采集方式和采集条件为使用漫反射采集近红外光谱,扫描波数范围为^OO-lOOOOcnT1,扫描次数为 32次,分辨率为ScnT1,以Spectralon为参照背景,每km 1采集一个数据点,每个样品共采集1501个点。扫描范围控制在20-25°C之间。每个样品平行扫描三次,取平均值作为样品的近红外光谱数据。采集到的鱼丸样品的原始光谱图参见图2。(4)建立模型,将鱼丸样品的近红外光谱图与相应的水分、蛋白质、淀粉含量相关联,利用化学计量学软件进行拟合,分别建立水分定标模型、蛋白质定标模型、淀粉定标模型;使用上海恒阳数据技术有限公司的数据挖掘软件I0S。在建模前,首先对原始光谱进行预处理,以消除噪音、基线偏移、光散射等影响。水分模型的光谱经标准正态变换(SNV) 处理,蛋白质模型的光谱经一阶导数(dbl)和多元散射校正(mf)处理,淀粉模型的光谱经间隔为2的9点平滑(sg9g2)和一阶导数(dbl)处理,分别参见图3、图4、图5。然后采用偏最小二乘投影法对光谱数据进行降维处理,取前15个偏最小二乘投影变量为主因子数。 分别以水分、蛋白质、淀粉含量为因变量,通过支持向量回归(SVR)算法分别建立水分、蛋白质、淀粉定标模型。支持向量回归(SVR)的参数为线性核函数,惩罚参数C为10,不敏感函数ε值设为0.15,最大训练次数10000次。(5)模型的评估与验证;模型的评估与验证,包括模型的内部验证和外部验证,模型内部验证采用留一法交叉验证(LOOCV)考察鱼丸水分、蛋白质、淀粉的支持向量回归模型的泛化能力。模型的评估标准为近红外预测值与化学值的相关系数R最大且交叉验证标准偏差RMSECV最小。鱼丸水分模型的近红外预测值和化学值的相关系数R = O. 91,交叉验证标准偏差RMSECV = 0. 82 ;蛋白质模型的相关系数R = 0. 98,交叉验证标准偏差RMSECV = 0. 56 ;淀粉模型的相关系数R = 0. 94,交叉验证标准偏差RMSECV = 0. 75。模型的外部验证,另取20个鱼丸样品作为外部验证样品,用上述近红外光谱仪及其条件采集样品的近红外光谱图,然后根据所述定标模型,采用近红外光谱法分析得到样品近红外预测值,结果见表1 ;采用国标方法检测,获得相应的化学测量值,结果见表1 ;利用统计软件SPSS13. 0对近红外预测值与化学值进行配对T检验。设定置信度为95%,双边临界值t0. 05(19) = 2. 09,本实施例中水分模型的近红外预测值与化学值的配对|t| = 1.03,p = 0. 32 ;蛋白质模型 |t| = 0. 23,p = 0. 82 ;淀粉模型 |t| = 0. 24,ρ = 0. 81。t 值均小于临界值,P均大于0.05。结果显示,本实施例中,基于支持向量回归的近红外光谱法预测鱼丸中水分、蛋白质、淀粉含量的结果与国标方法检测结果无显著性差异。所述模型用于鱼丸水分、蛋白质、淀粉含量的检测是准确可靠的。表1鱼丸水分、蛋白质、淀粉含量的近红外预测值与化学值结果比较(单位%)
权利要求
1.一种基于支持向量回归的鱼丸多组分含量的近红外光谱检测方法,是利用鱼丸样品的近红外光谱图结合定标模型同时预测其水分、蛋白质、淀粉含量三项指标,其特征在于, 包括以下步骤(1)收集样品,收集不同品种不同批次的鱼丸样品;(2)测定含量,采用国标的方法测定每个样品中的水分、蛋白质、粉含量;(3)采集光谱,利用近红外光谱仪采集样品的近红外漫反射光谱图;(4)建立模型,将鱼丸样品的近红外光谱图与相应的水分、蛋白质、淀粉含量相关联,利用化学计量学软件进行拟合,分别建立水分定标模型、蛋白质定标模型、淀粉定标模型;(5)模型的评估与验证;(6)未知样品水分、蛋白质、淀粉含量的测定。
2.如权利要求1所述的基于支持向量回归的鱼丸多组分含量的近红外光谱检测方法, 其特征在于,所述步骤O)中水分、蛋白质、淀粉的含量测定分别采用直接干燥法、凯氏定氮法、酸水解法。
3.如权利要求1所述的基于支持向量回归的鱼丸多组分含量的近红外光谱检测方法, 其特征在于,所述步骤(3)中近红外光谱仪的扫描波数范围为^OO-lOOOOcnT1,扫描次数为 >32次,分辨率为ScnT1,以Spectralon为参照背景,采集样品的漫反射光谱图。
4.如权利要求1所述的基于支持向量回归的鱼丸多组分含量的近红外光谱检测方法, 其特征在于,所述步骤(4)中在建模前,首先对原始光谱进行预处理。水分模型的光谱经标准正态变换(SNV)处理,蛋白质模型的光谱经一阶导数(dbl)和多元散射校正(mf)处理, 淀粉模型的光谱经间隔为2的9点平滑(sg9g2)和一阶导数(dbl)处理。然后采用偏最
5.如权利要求1所述的基于支持向量回归的鱼丸多组分含量的近红外光谱检测方法, 其特征在于,所述步骤( 模型的评估与验证,包括内部验证和外部验证。内部验证采用留一法交叉验证(LOOCV),以近红外预测值与化学值的相关系数R最大且交叉验证标准偏差 RMSECV最小为评估标准。
6.如权利要求5所述的模型外部验证,具体为采集样品并扫描其光谱;根据所述定标模型,采用近红外光谱法获得样品的近红外预测值;采用国标方法检测,获得相应的化学值;将近红外预测值与化学值进行配对T检验。
7.如权利要求1所述的基于支持向量回归的鱼丸多组分含量的近红外光谱检测方法,其特征在于,所述步骤中水分、蛋白质、淀粉的校正模型其含量分布范围分别为 63. 41% -79. 83%,5. 09% -16. 17%,0. 81% -19. 63%。以上所述含量均为质量百分数。
全文摘要
本发明涉及一种基于支持向量回归算法和近红外光谱技术的鱼丸水分、蛋白质和淀粉含量同时检测的方法,包括以下步骤(1)收集具有代表性的鱼丸样品;(2)依据国标的方法对样品中的水分、蛋白质和淀粉含量进行测定;(3)光谱扫描,利用近红外光谱仪采集样品的近红外漫反射光谱数据;(4)建立模型,将近红外光谱数据与对应指标相关联,通过支持向量回归建立定标模型;(5)模型的评估与验证;(6)利用所建立的模型对未知鱼丸样品水分、蛋白质和淀粉含量的测定。本发明提供的检测方法能够在2-3分钟之内完成用现有标准方法需要一个小时以上的样品分析任务,且结果准确、操作简便、多组分同时检测以及可实现在线检测等,适用于大中型鱼丸生产企业。
文档编号G01N21/35GK102393376SQ201110312830
公开日2012年3月28日 申请日期2011年10月14日 优先权日2011年10月14日
发明者刘源, 王小燕, 王锡昌, 罗阳, 陆烨 申请人:上海海洋大学