专利名称:基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法
技术领域:
本发明涉及一种基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法。具体涉及采用近红外光谱和化学计量学多元校正技术对整粒棉籽营养品质蛋白质和油分含量进行快速无损分析的方法。
背景技术:
棉籽是棉花生产中产生的最为重要的副产品,其每年生产的棉籽数量巨大。据统计,每生产Ikg的棉花纤维,就会产生1. 65kg的棉籽。棉籽中含有丰富的蛋白质27. 83% 45. 6%和油分28. 24% 44. 05%,是巨大的食用油和潜在的植物蛋白资源。棉籽蛋白质氨基酸组成合理,除蛋氨酸含量稍低外,棉籽蛋白质中的其他必需氨基酸均达到联合国粮农组织FAO的推荐标准。棉籽中还富含多种不饱和脂肪酸,包括维持人体正常身体健康的必需脂肪酸——亚油酸,这些不饱和脂肪酸具有降血脂、降血压等作用。因此棉籽在农业、食品、 医药、保健品等领域具有广阔的开发应用前景。而目前这些品质指标的检测以常规的化学方法为主,如蛋白质含量检测的凯氏定氮法,油分含量检测的索氏提取法,这些传统的分析方法灵敏度和精确度高,但均存在样品准备繁琐、分析时间长、检测成本高、大量消耗化学试剂等问题。近红外光谱技术结合化学计量学多元校正方法,有效地解决了上述问题,为整粒棉籽营养品质的检测提供了一种快速、便捷、高效的无损分析方法。
发明内容
本发明的目的是针对现有化学分析技术中存在的不足,提供一种基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法。基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法的步骤如下
1)选用具有代表性的多品种、多年份、多地点种植的整粒棉籽材料作为整粒棉籽的校正样品集和整粒棉籽的预测样品集;
2)使用近红外光谱仪在相同环境条件下,对样品进行多次扫描采集,取平均值作为整粒棉籽的校正样品集的近红外光谱数据和预测样品集的近红外光谱数据;
3)整粒棉籽经光谱采集后,进行剥壳、磨粉处理得到棉仁粉末,采用GB/T 14489. 2-2008国标方法测定棉籽中的蛋白质含量,采用GB/T 14488. 1-2008国标方法测定棉籽中的油分含量;
4)对整粒棉籽的校正样品集的近红外光谱数据和预测样品集的近红外光谱数据进行预处理,消除非目标因素的干扰,提高信噪比;
5)对步骤4)中预处理后的整粒棉籽的校正样品集的近红外光谱数据进行变量选择, 消除无信息变量;
6)根据步骤幻中变量选择后的近红外光谱数据,应用多元校正方法,建立整粒棉籽的校正样品集的近红外光谱与整粒棉籽的营养成分含量之间的校正模型;7)采用步骤4)中预处理后的整粒棉籽的预测样品集的近红外光谱数据对步骤6)的校正模型进行性能评价;
8)采集待测的整粒棉籽样品的近红外光谱数据,运用与步骤4)中相同的预处理方法对待测的整粒棉籽样品的近红外光谱数据进行预处理后,用步骤6)所构建的校正模型预测待测的整粒棉籽样品的营养品质。所述的近红外光谱仪的近红外光谱扫描范围为800 2500nm。所述的对整粒棉籽的校正样品集的近红外光谱数据和预测样品集的近红外光谱数据进行预处理方法为多元散射校正、标准正态变换、Savitzky-Golay平滑、一阶或二阶导数中的一种或多种。所述的对步骤4)中预处理后的整粒棉籽的校正样品集的近红外光谱数据进行变量选择的方法为蒙特卡罗的无信息变量消除法和连续投影法。本发明适用于整粒棉籽营养品质的快速无损分析,与常规的化学分析方法相比, 检测速度快、不破坏样品、无需样品预处理、不使用化学试剂、分析精度高,可同时检测多种化学成分,是一种方便、快速、可靠的绿色分析技术,能满足棉花育种工作和新品种筛选培育中棉籽营养成分快速分析的需要。
图1是整粒棉籽的原始的近红外光谱数据;
图2是整粒棉籽的蛋白质含量的化学测定值与近红外光谱预测值的关系图; 图3是整粒棉籽的油分含量的化学测定值与近红外光谱预测值的关系图。
具体实施例方式基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法的步骤如下
1)选用具有代表性的多品种、多年份、多地点种植的整粒棉籽材料作为整粒棉籽的校正样品集和整粒棉籽的预测样品集;
2)使用近红外光谱仪在相同环境条件下,对样品进行多次扫描采集,取平均值作为整粒棉籽的校正样品集的近红外光谱数据和预测样品集的近红外光谱数据;
3)整粒棉籽经光谱采集后,进行剥壳、磨粉处理得到棉仁粉末,采用GB/T 14489. 2-2008国标方法测定棉籽中的蛋白质含量,采用GB/T 14488. 1-2008国标方法测定棉籽中的油分含量;
4)对整粒棉籽的校正样品集的近红外光谱数据和预测样品集的近红外光谱数据进行预处理,消除非目标因素的干扰,提高信噪比;
5)对步骤4)中预处理后的整粒棉籽的校正样品集的近红外光谱数据进行变量选择, 消除无信息变量;
6)根据步骤幻中变量选择后的近红外光谱数据,应用多元校正方法,建立整粒棉籽的校正样品集的近红外光谱与整粒棉籽的营养成分含量之间的校正模型;
7)采用步骤4)中预处理后的整粒棉籽的预测样品集的近红外光谱数据对步骤6)的校正模型进行性能评价;
8)采集待测的整粒棉籽样品的近红外光谱数据,运用与步骤4)中相同的预处理方法对待测的整粒棉籽样品的近红外光谱数据进行预处理后,用步骤6)所构建的校正模型预测待测的整粒棉籽样品的营养品质。所述的近红外光谱仪的近红外光谱扫描范围为800 2500nm。所述的对整粒棉籽的校正样品集的近红外光谱数据和预测样品集的近红外光谱数据进行预处理方法为多元散射校正、标准正态变换、Savitzky-Golay平滑、一阶或二阶导数。这些预处理方法可以单一进行,也可以多种预处理方法联合使用,以达到最佳的预处理效果。待测的整粒棉籽样品的光谱数据预处理方法应与校正模型构建时所采用的预处理方法保持一致。所述的对步骤4)中预处理后的整粒棉籽的校正样品集的近红外光谱数据进行变量选择的方法为蒙特卡罗的无信息变量消除法和连续投影法。所述的步骤6)中的多元校正方法包括但不限于线性的偏最小二乘法、主成分回归法、多元线性回归法,以及非线性的人工神经网络法、支持向量机、最小二乘支持向量机、 加权最小二乘支持向量机等。经过各校正模型的预测性能比较,确定适合每一营养品质成分的最佳校正方法。其中,光谱数据的采集使用仪器相应的“WinlSI II”软件,数据的预处理采用 "UnscrambIer"软件,多元校正模型的构建在“MATLAB”软件中完成。
实施例1、选用385份具有代表性的棉籽材料作为实验样品集,分别于2008年和2009年种植于海南三亚、浙江杭州、浙江金华等多个生态种植区;选择230份作为整粒棉籽的校正样品集用来进行整粒棉籽的校正模型的构建,剩下的巧5份作为整粒棉籽的预测样品集对构建的整粒棉籽的校正模型进行性能评价;
2、在波长为800 2500nm的光谱区间,应用近红外分析仪扫描整粒棉籽样品,每隔2nm 采集近红外反射光谱强度,每份样品重复扫描四次,取平均光谱,作为整粒棉籽的校正样品集的近红外光谱数据和整粒棉籽的预测样品集的近红外光谱数据,图1 ;
3、扫描后的整粒棉籽经剥壳、磨粉后得到棉仁粉末,采用GB/T14489. 2-2008国标方法测定棉籽中的蛋白质含量,采用GB/T 14488. 1-2008国标方法测定棉籽中的油分含量;
4、结合标准正态变换、Savitzky-Golay平滑、二阶导数方法对对整粒棉籽的校正样品集的近红外光谱数据和预测样品集的近红外光谱数据进行预处理,消除非目标因素的干扰;
5、运用蒙特卡罗无信息变量消除法对上述预处理后的整粒棉籽的校正样品集的近红外光谱数据进行变量选择,消除冗余的无效变量,减少光谱变量,有效简化运算,并作为校正模型的数据输入;
6、应用多元校正方法最小二乘支持向量机,建立整粒棉籽的校正样品集的近红外光谱与整粒棉籽的营养成分含量之间的校正模型;
7、运用上述预处理后的整粒棉籽的预测样品集的近红外光谱数据,对所构建的校正模型进行性能评价,见图2和图3;
表1整粒棉籽蛋白质、油分含量校正模型的性能指标
权利要求
1.一种基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法,其特征在于它的步骤如下1)选用具有代表性的多品种、多年份、多地点种植的整粒棉籽材料作为整粒棉籽的校正样品集和整粒棉籽的预测样品集;2)使用近红外光谱仪在相同环境条件下,对实验样品进行多次扫描采集,取平均值作为整粒棉籽的校正样品集的近红外光谱数据和预测样品集的近红外光谱数据;3)整粒棉籽经光谱采集后,进行剥壳、磨粉处理得到棉仁粉末,采用GB/T 14489. 2-2008国标方法测定棉籽中的蛋白质含量,采用GB/T 14488. 1-2008国标方法测定棉籽中的油分含量;4)对整粒棉籽的校正样品集的近红外光谱数据和预测样品集的近红外光谱数据进行预处理,消除非目标因素的干扰,提高信噪比;5)对步骤4)中预处理后的整粒棉籽的校正样品集的近红外光谱数据进行变量选择, 消除无信息变量;6)根据步骤幻中变量选择后的近红外光谱数据,应用多元校正方法,建立整粒棉籽的校正样品集的近红外光谱与整粒棉籽的营养成分含量之间的校正模型;7)采用步骤4)中预处理后的整粒棉籽的预测样品集的近红外光谱数据对步骤6)的校正模型进行性能评价;8)采集待测的整粒棉籽样品的近红外光谱数据,运用与步骤4)中相同的预处理方法对待测的整粒棉籽样品的近红外光谱数据进行预处理后,用步骤6)所构建的校正模型预测待测的整粒棉籽样品的营养品质。
2.根据权利要求1所述的一种基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法,其特征在于所述的近红外光谱仪的近红外光谱扫描范围为800 2500nm。
3.根据权利要求1所述的一种基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法,其特征在于所述的对整粒棉籽的校正样品集的近红外光谱数据和预测样品集的近红外光谱数据进行预处理方法为多元散射校正、标准正态变换、Savitzky-Golay平滑、一阶或二阶导数中的一种或多种。
4.根据权利要求1所述的一种基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法,其特征在于所述的对步骤4)中预处理后的整粒棉籽的校正样品集的近红外光谱数据进行变量选择的方法为蒙特卡罗的无信息变量消除法和连续投影法。
全文摘要
本发明提供了一种新型的棉籽营养品质的快速无损分析方法。包括以下步骤1)选用具有代表性的棉花品种的整粒棉籽作为实验样品;2)使用近红外光谱仪采集整粒棉籽的近红外光谱数据,光谱扫描范围为800~2500nm;3)用国标方法精确分析棉籽中的营养品质;4)对近红外光谱数据进行预处理;5)光谱变量选择,消除无信息变量;6)使用多元校正方法,建立整粒棉籽的近红外光谱与整粒棉籽营养成分含量的校正模型;7)校正模型的性能评价;8)采集待测的整粒棉籽的近红外光谱数据,光谱数据预处理后用所构建的校正模型预测其营养品质。本发明分析速度快、不破坏样品、无需样品预处理、检测精度高、可同时分析棉籽中的多种营养品质成分,为棉花育种和棉花种子检验提供了方便、快捷、高效的分析方法。
文档编号G01N21/35GK102279168SQ201110203679
公开日2011年12月14日 申请日期2011年7月20日 优先权日2011年7月20日
发明者何秋伶, 刘海英, 祝水金, 陈进红, 黄庄荣 申请人:浙江大学