一种假高粱及其近似物种的快速检测方法

文档序号:6217706阅读:259来源:国知局
一种假高粱及其近似物种的快速检测方法
【专利摘要】本发明公开了一种基于近红外光谱的假高粱及其近似物种的快速检测方法,包括以下步骤:采用近红外光谱获取高粱、假高粱、苏丹草三种高粱属种子在325-1075nm之间的光谱反射特征曲线,采用偏最小二乘法进行模式特征分析,经过交互验证法判别,确定最佳主成分数为9。完成特征提取后,将9种主成分作为神经网络的输入变量,建立了三层BP神经网络,计算各种子所属类别。本发明通过红外光谱分析结合化学计量学的方法快速准确判别三种高粱属种子所属类别,大大缩短了检测的时间,提高了检测效率,降低了检测成本。
【专利说明】一种假高粱及其近似物种的快速检测方法
【技术领域】
[0001]本发明涉及出入境检验检疫领域,特别涉及一种假高粱及其近似物种的快速检测方法。
【背景技术】
[0002]高粱属(Sorghum)有多种植物作为粮食、饲料和工业用原料在世界各个干旱地区被广泛种植。但是高粱属中也有相当一部分属于入侵植物或具有入侵性的种类,其中最具代表性的有假高粱(S.halepenSe(L.Pers))。假高梁是世界十大恶性杂草之一,它能以根状茎和种子共同繁殖,破坏我国植被多样性能力强,其危害大、繁殖快、难防治,是我国进境植物检疫性有害生物。假高粱原仅在福建、广东、台湾地区有引种分布,但随着粮食进口数量的不断增大,在海南、广西等10多个省及直辖市报道曾有假高粱的分布。高粱(Sorghumbicolor)、黑高梁(S.almum)及苏丹草(S.sudanense)是假高粱的近缘种,在形态上与假高粱十分相似,虽然形态近似,但检疫地位却不尽相同,黑高梁属于入侵性种类,而高梁和苏丹草则属于栽培经济作物可作为牧草,没有表现出人侵性。因此,正确鉴定高粱属植物,在口岸检疫上具有重要应用价值。现有的针对高粱属植物的鉴定分类方法是基于细胞学方法及DNA检测进行区别,这些方法耗时长,操作过程复杂。本发明提供一种快速简便无损的分析方法对高粱属的植物进行鉴别。
[0003]红外光谱技术以其具有的“指纹”特性,近年来越来越受到人们的重视。红外光谱法是一种快速简便无损的分析方法,可以反映物质内部的有机成分,特别是C-H、0-H、N-H等基闭的倍频和合频吸收,可用于定量测定物质有机物质的含量。红外光谱法已被广泛应用于农业、食品、饲料、医药、石油化工等行业。国内外很多学者利用近红外光谱技术进行物质品种鉴别。在高粱属种子快速检测研究中具有广泛的应用潜力。

【发明内容】

[0004]为了解决现有口岸检疫检测技术存在的问题,本发明提供一种快速简便无损的分类鉴定方法对相类似的高粱属种子进行鉴别,该发明在口岸检疫上具有重要应用价值。
[0005]一种基于近红外光谱的假高粱及其近似物种的快速检测方法,包括如下步骤:
[0006]I)利用近红外光谱仪采集已知样本的原始光谱数据,并对采集到的原始光谱数据预处理;
[0007]2)运用遗传算法抽取原始光谱数据的15个特征波长的原始光谱数据;
[0008]3)对步骤(2)抽取的15个特征波长的原始光谱数据依次运用偏最小二乘法进行模式特征分析、再经过交互验证判别法完成特征提取、最后建立三层BP神经网络;
[0009]4)采用步骤(3)建立的三层BP神经网络对未知样本进行预测。
[0010]所述采集原始光谱数据的波长范围为325-1075nm。
[0011]所述已知样本均用直径为40-50mm,高度8_10mm的培养皿盛装,每个培养皿装满作为一个实验样本。[0012]所述近红外光谱仪置于已知样本的正上方,距已知样本表面90_100mm ;分析谱区采用了部分的扫描区间进行分析,采用500-750nm范围的数据,间隔点为3,即在500_750nm区间每三个波长点选取一个数据点。
[0013]所述原始光谱数据预处理的方法依次为:先对原始光谱数据进行SavitzkyGolayDerivatives处理;再采用Savitzky-Golay平滑法对原始光谱数据进行处理,选用平滑点数为9 ;最后对原始光谱数据进行SNV处理。运用遗传算法抽取15个特征波长分别是:543nm, 378nm, 747nm, 817nm, 730nm, 545nm, 610nm, 663nm, 915nm, 676nm, 582nm,506nm,756nm,459nm,446nm。
[0014]所述BP神经网络为误差反向传播网络,建立BP神经网络的方法如下:首先采用主成分分析对抽取的15个特征波长的原始光谱数据进行压缩和降维,得到的主成分作为BP神经网络输入;BP神经网络分3层即输入层、隐含层和输出层,采用sigmoid激发函数,并运用改进的BP算法-LevenberMarquardt方法。
[0015]所述网络输入层、隐含层、输出层节点数分别为7、7、1,其中输入层的7个节点来自PLS分析得到的主成分;最小训练速率为0.1,训练迭代次数为1000次。
[0016]与现有技术相比,本发明的有益效果是:现有的针对高粱属植物的鉴定分类方法是基于细胞学方法及DNA检测进行区别,这些方法耗时长,操作过程复杂。本发明应用近红外光谱技术结合特征波长提取方法提取15个特征波长,提取的特征波长分别是:543nm,378nm,747nm,817nm,730nm,545nm,610nm,663nm,915nm,676nm,582nm,506nm,756nm,459nm,446nm,建立了高粱属种子类别鉴别的模型,该模型对未知样品的预测相对误差均在4%以下,识别精度高,该模型的预测效果能够满足实际应用要求。说明运用近红外光谱可以快速、准确对高粱属种子类别进行鉴别。
【专利附图】

【附图说明】
[0017]图1是本发明的系统框图;
[0018]图2是本发明建模集样本分类结果散点分布图。
【具体实施方式】
[0019]如图1所示,本发明一种基于近红外光谱的假高粱及其近似物种的快速检测方法,包括如下步骤:
[0020]I)利用近红外光谱仪采集已知样本的原始光谱数据,并对采集到的原始光谱数据预处理;
[0021]2)运用遗传算法抽取原始光谱数据的15个特征波长的原始光谱数据;
[0022]3)对步骤(2)抽取的15个特征波长的原始光谱数据依次运用偏最小二乘法进行模式特征分析、再经过交互验证判别法完成特征提取、最后建立三层BP神经网络;
[0023]4)采用步骤(3)建立的三层BP神经网络对未知样本进行预测。
[0024]所述采集原始光谱数据的波长范围为325_1075nm。
[0025]所述已知样本均用直径为40-50mm,高度8_10mm的培养皿盛装,每个培养皿装满作为一个实验样本。
[0026]所述近红外光谱仪置于已知样本的正上方,距已知样本表面90_100mm ;分析谱区采用了部分的扫描区间进行分析,采用500-750nm范围的数据,间隔点为3,即在500_750nm区间每三个波长点选取一个数据点。
[0027]所述原始光谱数据预处理的方法依次为:先对原始光谱数据进行SavitzkyGolayDerivatives处理;再采用Savitzky-Golay平滑法对原始光谱数据进行处理,选用平滑点数为9 ;最后对原始光谱数据进行SNV处理。
[0028]运用遗传算法抽取15个特征波长分别是:543nm,378nm,747nm,817nm,730nm,545nm,610nm,663nm,915nm,676nm,582nm,506nm,756nm,459nm,446nm。
[0029]所述BP神经网络为误差反向传播网络,建立BP神经网络的方法如下:首先采用主成分分析对抽取的15个特征波长的原始光谱数据进行压缩和降维,得到的主成分作为BP神经网络输入;BP神经网络分3层即输入层、隐含层和输出层,采用sigmoid激发函数,并运用改进的BP算法-LevenberMarquardt方法。
[0030]所述网络输入层、隐含层、输出层节点数分别为7、7、1,其中输入层的7个节点来自PLS分析得到的主成分;最小训练速率为0.1,训练迭代次数为1000次。
[0031]实施例
[0032]采集对象为高粱、假高粱、苏丹草三种高粱属种子。该检测方法也适用于高粱属其它种子。
[0033]采集范围在325-1075nm之间的光谱数据,光谱采样间隔为1.5nm,扫描次数30次,探头视场角为20度。光源采用与光谱仪配套的14.5V卤素灯。
[0034]三种高粱属种子共120个样本(每个品种40个)。各种样本均用直径为40_50mm,高度8-lOmm的培养皿盛装。为了减小实验误差保证被测物体与仪器等距,将每个培养皿装满作为一个实验样本。每个品种各做40个样本,共计120个样本。全部实验样本随机分成建模集和预测集,建模集有90个样本(每个品种30个),预测集有30个样本(每个品种10个)。光谱仪经白板校准后进行测试。光谱仪置于样本的上方,距大米表面90-100mm,对每一个样本扫描20次,取平均值。
[0035]为了去除随机噪音、基线漂移、光散射、样本不均匀等影响,需要对采集到的光谱数据进行预处理。先对数据进行SavitzkyGolayDerivatives —阶微分处理,平滑点数设置为6,用以去除同波长无关的漂移。再采用MovingAverageSmoothing平滑法,平滑点数设置为9,用以提高分析信号的信噪比,有效地滤除各种因素产生的高频噪音。最后对数据进行多元散射校正处理,MSC可以去除近红外漫反射光谱中样品的镜面反射及不均匀性造成的噪声,消除漫反射光谱的基线及光谱的不重复性。处理后的光谱数据作为遗传算法的输入。
[0036]遗传算法控制参数设定:初始群体100,遗传迭代次数50,交叉概率0.8,变异概率
0.1。将预处理后的光谱数据用GA进行波长筛选,共提取15个特征波长作为PLS输入变量。经过主成分分析得出的前面7个主成分已经包含了大部分光谱信息。因此,将这7个特征变量作为BP神经网络的输入变量,即网络输入层、隐含层、输出层节点数分别为7、7、
1。最小训练速率为0.1,设定训练迭代次数为1000次,对输入样本进行标准化处理。训练集和预测集样本数为90和30。对30个未知样本的预测结果表明这3个品种,拟和残差为
0.0013,30个样本的预测相对偏差均在4%以下,即预测的正确率可以满足实际要求。
[0037]如图2所示,应用近红外光谱技术建立了高粱属种子类别鉴别的模型,该模型的预测效果能够满足实际应用要求,对未知样品的预测相对误差均在4%以下,识别精度高。说明运用近红外光谱可以快速、准确对高粱属种子类别进行鉴别。采用遗传算法对特征波长进行提取,并用偏最小二乘法进行主成分分析,最后结合BP神经网络对预测样本进行预测,识别精度得到了很大提高。采用从PLS分析中得到的主成分作为BP神经网络的输入,不但减少了计算量,加快了训练速率,同时因为去除了光谱干扰信息,也提高了预测的正确率。因此,应用遗传算法、偏最小二乘法结合BP神经网络的模式识别方法和近红外光谱技术可以对高粱属种子类别进行快速准确鉴别。
【权利要求】
1.一种基于近红外光谱的假高粱及其近似物种的快速检测方法,其特征包括如下步骤: 1)利用近红外光谱仪采集已知样本的原始光谱数据,并对采集到的原始光谱数据预处理; 2)运用遗传算法抽取原始光谱数据的15个特征波长的原始光谱数据; 3)对步骤(2)抽取的15个特征波长的原始光谱数据依次运用偏最小二乘法进行模式特征分析、再经过交互验证判别法完成特征提取、最后建立三层BP神经网络; 4)采用步骤(3)建立的三层BP神经网络对未知样本进行预测。
2.根据权利要求1所述的一种基于近红外光谱的假高粱及其近似物种的快速检测方法,其特征在于:所述采集原始光谱数据的波长范围为325-1075nm。
3.根据权利要求1所述的一种基于近红外光谱的假高粱及其近似物种的快速检测方法,其特征在于:所述已知样本均用直径为40-50mm,高度8_10mm的培养皿盛装,每个培养皿装满作为一个实验样本。
4.根据权利要求1所述的一种基于近红外光谱的假高粱及其近似物种的快速检测方法,其特征在于:所述近红外光谱仪置于已知样本的正上方,距已知样本表面90-100mm;分析谱区采用了部分的扫描区间进行分析,采用500-750nm范围的数据,间隔点为3,即在500-750nm区间每三个波长点选取一个数据点。
5.根据权利要求1所述的一种基于近红外光谱的假高粱及其近似物种的快速检测方法,其特征在于:所述原始光谱数据预处理的方法依次为:先对原始光谱数据进行SavitzkyGolayDerivatives处理;再采用Savitzky-Golay平滑法对原始光谱数据进行处理,选用平滑点数为9 ;最后对原始光谱数据进行SNV处理。
6.根据权利要求1所述的一种基于近红外光谱的假高粱及其近似物种的快速检测方法,其特征在于:运用遗传算法抽取15个特征波长分别是:543nm,378nm,747nm,817nm,730nm,545nm,610nm,663nm,915nm,676nm,582nm,506nm,756nm,459nm,446nm。
7.根据权利要求1所述的一种基于近红外光谱的假高粱及其近似物种的快速检测方法,其特征在于:所述BP神经网络为误差反向传播网络,建立BP神经网络的方法如下:首先采用主成分分析对抽取的15个特征波长的原始光谱数据进行压缩和降维,得到的主成分作为BP神经网络输入;BP神经网络分3层即输入层、隐含层和输出层,采用sigmoid激发函数,并运用改进的BP算法-LevenberMarquardt方法。
8.根据权利要求7所述的一种基于近红外光谱的假高粱及其近似物种的快速检测方法,其特征在于:所述网络输入层、隐含层、输出层节点数分别为7、7、1,其中输入层的7个节点来自PLS分析得到的主成分;最小训练速率为0.1,训练迭代次数为1000次。
【文档编号】G01N21/359GK103743705SQ201410042766
【公开日】2014年4月23日 申请日期:2014年1月28日 优先权日:2014年1月28日
【发明者】林萍, 陈永明, 胡国文 申请人:盐城工学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1