一种基于近红外高光谱的单粒玉米种子水分含量检测方法与流程

文档序号:25661145发布日期:2021-06-29 23:25阅读:443来源:国知局
一种基于近红外高光谱的单粒玉米种子水分含量检测方法与流程

1.本发明涉及玉米种子水分检测领域,特别是一种基于近红外高光谱的单粒玉米种子水分含量检测方法。


背景技术:

2.玉米是目前我国种植面积最广、产量第一的农作物,不仅是“饲料之王”,还是重要的工业原料。近年来随着由于美国先锋公司“单粒播”玉米种子的推出,以及欧美等发达国家的玉米机械化单粒精量播种技术的引入,我国传统玉米播种模式发生了深刻的改变。单粒精量播种技术较传统播种模式更有利于机械化操作,省工、省种、高产,但是对每颗种子都提出了更高的检测需求,其中对单粒播种的玉米种子水分要求不能高于14%,否则会导致种子呼吸增大、消耗养分、活力下降。根据我国国标gb4404.1

2008,水分是我国农作物种子质量四大必检项目之一。因此单粒玉米种子水分的快速、高通量、无损检测对于单粒精量播种具有重要的现实意义。
3.农作物种子检验规程水分测定(gb/t 3543.6

1995)中规定了种子水分测量方法有低恒温烘干法、高温烘干法、高水分预先烘干法,上述传统检测方法虽然发展早,但普遍存在试样破坏性、耗时长、无法单颗测定等问题,无法满足当前种业市场快速发展的需求,因此急需建立一种快速、无损、稳健、高精度的检测方法。
4.近年来近红外高光谱技术以其快速、无损、绿色分析特点在种子水分检测领域表现出极大的应用潜力[20

25]。我国在2010年发布了玉米水分含量近红外法测定国标gb/t 24900

2010[12]用于玉米种子批水分测定,表明近红外光谱技术在玉米种子批水分检测领域具有实际应用可行性,但是目前尚无针对单粒种子水分近红外高光谱检测的方法或标准等。


技术实现要素:

[0005]
本发明的目的就是提供一种基于近红外高光谱的单粒玉米种子水分含量检测方法,它可以用于单粒玉米种子水分含量的检测。
[0006]
本发明的目的是通过这样的技术方案实现的,具体步骤如下:
[0007]
1)数据采集:同批次采集不同水分含量的玉米种子样本,去掉虫蛀孔洞颗粒、霉变颗粒、破损颗粒获得n个玉米种子样本,对n个玉米种子样本进行水分测定,得到水分含量数据y
i
,利用高光谱成像系统采集玉米种子样本的高光谱图像数据x
i

[0008]
2)数据处理:采用多元散射校正msc方法消除步骤1)中高光谱图像数据x
i
的光散射、基线漂移和光程变化的干扰,得到预处理光谱图像数据x

i

[0009]
3)特征提取:采用去噪自编码器dae提取步骤2)中预处理光谱图像数据x

i
的特征光谱,采用灰度共生矩阵提取特征波长下的高光谱图像数据x
i
的纹理特征,所述纹理特征包括对比度、能量、熵、逆方差、相关性;将提取出的特征光谱和纹理特征拼接进行特征层融合,得到光谱图像融合矩阵p
i

[0010]
4)构建模型:采用spxy算法及玉米种子样本的光谱图像融合矩阵p
i
、水分含量数据y
i
将玉米种子样本集划分为训练集与测试集,利用基于集成策略的随机森林算法构建水分预测模型;
[0011]
5)待测样本预测:根据步骤4)中构建的随机森林模型对待测样本的水分含量进行自适应加权预测。
[0012]
进一步,步骤1)中数据采集的具体步骤为:
[0013]1‑
1)同批次采集不同水分含量的玉米种子样本,对种子进行初步的筛选去掉虫蛀孔洞颗粒、霉变颗粒、破损颗粒获得n个玉米种子样本;
[0014]1‑
2)利用高光谱成像系统,将n个玉米种子样本排列整齐,胚朝上、胚朝下各扫描一次,采集高光谱图像数据x
i
,并进行黑白板校正,采用主成分分析确定感兴趣区域;
[0015]1‑
3)对n个玉米种子样本进行水分测定。
[0016]
进一步,步骤3)特征提取的具体步骤如下:
[0017]3‑
1)采用去噪自编码器dae提取步骤2)中预处理光谱图像数据x

i
的特征光谱;
[0018]3‑
2)提取特征波长下的高光谱图像数据x
i
的灰度图像,将灰度图像进行直方图均衡化的处理,计算图像特征值的步距和方向,步距选择d=1,将中心像素与其相邻像素点心与其相邻像素点直接做比较运算,灰度共生矩阵的方向选择为为0
°
、45
°
、90
°
、135
°
四个方向,并求出这四个方向特征值的平均值作为最终特征值的共生矩阵,将共生矩阵归一化后,通过计算对比度、能量、熵、逆方差、相关性参数来表征图像纹理特征;
[0019]3‑
3)将提取出的特征光谱和纹理特征拼接进行特征层融合,得到光谱图像融合矩阵p
i

[0020]
进一步,步骤4)中构建模型的具体步骤为:
[0021]4‑
1)采用spxy算法及玉米种子样本的光谱图像融合矩阵p
i
、水分含量数据y
i
将玉米种子样本按照3:1的比例划分为训练集与测试集;
[0022]4‑
2)对于训练集d={(y1,p1),(y2,p2),...,(y
i
,p
i
)},利用bootstrap方法从训练集中采取随机有放回的抽取n个子训练集,抽取的子训练集个数与随机森林中树模型数量相同;
[0023]4‑
3)对单个子训练集应用决策树的计算方法,即从数据的n维特征波长中无放回的随机抽取mtry维特征波长,即用于二叉树的特征波长个数;
[0024]4‑
4)对于一个特征值序列进行各个点位的二分,计算每一次二分之后的两个点位的残差平方和:
[0025][0026]
式(1)中,j为特征波长,s为分割点,c1和c2为叶子节点的样本值,r1和r2为分割后的子区域,x
i
为样本在每个特征波长下的吸光度,y
i
为样本的水分值;
[0027]
选择最小的那个特征值作为候选分割点,在针对候选的分割点的选出残差平方和最小的作为二叉树当前层的节点,然后提出到选定的特征,再从两个子区域中继续该操作分别获得新的子节点,继续分割,直至满足预设停止条件;
[0028]4‑
5)重复步骤4

3)至步骤4

4),最后将输入空间划分为m个区域r
1 r2…
r
m
,生成n
棵决策树,构成随机森林预测模型:
[0029][0030]
式(2)中,为所在区域的输出值的平均值,i为指示函数,
[0031]
进一步,步骤5)中对待测样本进行预测的具体步骤如下:
[0032]5‑
1)首先根据欧式距离公式计算待测样本与随机森林模型中第i棵决策树样本集中心的距离d
i

[0033][0034]
式(3)中,p
x
为待测样本的光谱图像融合信息,为第i棵决策树中新样本集的平均光谱的光谱图像融合信息;
[0035]5‑
2)根据步骤5

1)中的欧式距离确定在待测样本时每棵决策树的权重;第i棵决策树的权重a
i

[0036][0037]
式(4)中,i∈n;
[0038]5‑
3)对步骤5

2)的每棵决策树的权重进行加权,输出待预测样本水分的预测值y:
[0039][0040]
由于采用了上述技术方案,本发明具有如下的优点:
[0041]
1、本发明利用近红外高光谱技术,将光谱和图像数据融合,构建基于集成策略的自适应权重的随机森林算法的水分预测模型,对于玉米精量播种技术的应用具有重要意义;2、通过本发明中的制备不同水分含量的样本,增大了样本水分梯度范围,提高了模型的泛化能力;3、光谱预处理减少了非线性因素的影响,提高了信噪比;光谱降维大大降低了数据冗余性,减少模型的输入变量,提高了单粒玉米种子水分检测的效率;4、通过特征层融合方法,将提取出的特征波长作为光谱特征和提取出的图像特征进行融合建模,高光谱的光谱信息可以提供不同品种、不同水分含量的玉米种子的内部差异,高光谱的图像信息可以提供不同品种、不同水分含量的玉米种子的外部属性之间的差异,融合高光谱的光谱信息和图像信息可以更有效的检测玉米种子水分含量;5、本发明基于自适应权重策略,在预测阶段对不同训练样本集赋予不同的权重进行预测,提高了预测精度。
[0042]
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书和权利要求书来实现和获得。
附图说明
[0043]
本发明的附图说明如下。
[0044]
图1为本发明的方法流程图。
具体实施方式
[0045]
下面结合附图和实施例对本发明作进一步说明。
[0046]
如图1所示的一种基于近红外高光谱的单粒玉米种子水分含量检测方法,其特征在于,具体步骤如下:
[0047]
1)数据采集:同批次采集不同水分含量的玉米种子样本,去掉虫蛀孔洞颗粒、霉变颗粒、破损颗粒获得n个玉米种子样本,对n个玉米种子样本进行水分测定,得到水分含量数据y
i
,利用高光谱成像系统采集玉米种子样本的高光谱图像数据x
i
,具体步骤为:
[0048]1‑
1)同批次采集不同水分含量的玉米种子样本,对种子进行初步的筛选去掉虫蛀孔洞颗粒、霉变颗粒、破损颗粒获得n个玉米种子样本;
[0049]1‑
2)利用高光谱成像系统,将n个玉米种子样本排列整齐,胚朝上、胚朝下各扫描一次,采集高光谱图像数据x
i
,并进行黑白板校正,采用主成分分析确定感兴趣区域;
[0050]1‑
3)依据《gb/t 10362

2008.粮油检验玉米水分测定》中“整粒试样”测定方法对样本进行水分测定。
[0051]
2)数据处理:采用多元散射校正msc方法消除步骤1)中高光谱图像数据x
i
的光散射、基线漂移和光程变化的干扰,得到预处理光谱图像数据x

i

[0052]
在发明实例中,由于复杂样本光谱信号往往会受到杂散光、噪声、基线漂移等因素的干扰,样本粒径是影响光谱测量的一个重要参数,随着样本粒径的增加,所测光谱的重现性变差,光谱的变动性随粒径的增加呈指数形式增加;每颗玉米籽粒形状、直径都不相同,所测光谱差异性变大,造成测量误差无法消除,从而影响最终的定量分析结果;多元散射校正可以有效消除近红外漫反射光谱中由于样品的镜面反射及不均匀造成的噪声,消除光谱的基线漂移现象及光谱的不重复性,多元散射校正方法是现阶段多波长标定建模常用的一种数据处理方法,经过散射校正后得到的光谱数据可以有效地消除散射的影响,增强了与成分含量相关的光谱吸收信息,因此基于多元散射校正相对其他预处理方法而言,建立的单粒种子水分模型性能较好。
[0053]
3)特征提取:采用去噪自编码器dae提取步骤2)中预处理光谱图像数据x

i
的特征光谱,采用灰度共生矩阵提取特征波长下的高光谱图像数据x
i
的纹理特征,所述纹理特征包括对比度、能量、熵、逆方差、相关性;将提取出的特征光谱和纹理特征拼接进行特征层融合,得到光谱图像融合矩阵p
i
;具体步骤如下:
[0054]3‑
1)采用去噪自编码器dae提取步骤2)中预处理光谱图像数据x

i
的特征光谱;
[0055]3‑
2)提取特征波长下的高光谱图像数据x
i
的灰度图像,将灰度图像进行直方图均衡化的处理,计算图像特征值的步距和方向,步距选择d=1,将中心像素与其相邻像素点心与其相邻像素点直接做比较运算,灰度共生矩阵的方向选择为为0
°
、45
°
、90
°
、135
°
四个方向,并求出这四个方向特征值的平均值作为最终特征值的共生矩阵,将共生矩阵归一化后,通过计算对比度、能量、熵、逆方差、相关性参数来表征图像纹理特征;
[0056]3‑
3)将提取出的特征光谱和纹理特征拼接进行特征层融合,得到光谱图像融合矩阵p
i

[0057]
在本发明实例中,不同水分含量、不同品种的玉米种子的纹理、饱满度等外部属性
可能因为内部化学成分含量的微小区别呈现变化,而这些变化仅从个人感官无法发现。通过高光谱的图像信息可以表征一定差异性,在近红外波段下,成分不同对光谱吸收也不同,在某个特定波长下的图像对某个缺陷会有较显著的反映,可以有效地快速检测出玉米种子的外部属性如尺寸、形状、颜色、纹理和缺陷,充分利用高光谱的图像信息;通过特征层融合方法,将提取出的特征波长作为光谱特征和提取出的图像特征进行融合建模,高光谱的光谱信息可以提供不同品种、不同水分含量的玉米种子的内部差异,高光谱的图像信息可以提供不同品种、不同水分含量的玉米种子的外部属性之间的差异,因此融合高光谱的光谱信息和图像信息可以更有效的检测玉米种子水分含量。
[0058]
4)构建模型:采用spxy算法及玉米种子样本的光谱图像融合矩阵p
i
、水分含量数据y
i
将玉米种子样本集划分为训练集与测试集,利用基于集成策略的随机森林算法构建水分预测模型,具体步骤为:
[0059]4‑
1)采用spxy算法及玉米种子样本的光谱图像融合矩阵p
i
、水分含量数据y
i
将玉米种子样本按照3:1的比例划分为训练集与测试集;
[0060]4‑
2)对于训练集d={(y1,p1),(y2,p2),...,(y
i
,p
i
)},利用bootstrap方法从训练集中采取随机有放回的抽取n个子训练集,抽取的子训练集个数与随机森林中树模型数量相同;
[0061]4‑
3)对单个子训练集应用决策树的计算方法,即从数据的n维特征波长中无放回的随机抽取mtry维特征波长,即用于二叉树的特征波长个数;
[0062]4‑
4)对于一个特征值序列进行各个点位的二分,计算每一次二分之后的两个点位的残差平方和:
[0063][0064]
式(1)中,j为特征波长,s为分割点,c1和c2为叶子节点的样本值,r1和r2为分割后的子区域,x
i
为样本在每个特征波长下的吸光度,y
i
为样本的水分值;
[0065]
选择最小的那个特征值作为候选分割点,在针对候选的分割点的选出残差平方和最小的作为二叉树当前层的节点,然后提出到选定的特征,再从两个子区域中继续该操作分别获得新的子节点,继续分割,直至满足预设停止条件;
[0066]4‑
5)重复步骤4

3)至步骤4

4),最后将输入空间划分为m个区域r
1 r2…
r
m
,生成n棵决策树,构成随机森林预测模型:
[0067][0068]
式(2)中,为所在区域的输出值的平均值,i为指示函数,
[0069]
5)待测样本预测:根据步骤4)中构建的随机森林模型对待测样本的水分含量进行自适应加权预测,具体步骤如下:
[0070]5‑
1)首先根据欧式距离公式计算待测样本与随机森林模型中第i棵决策树样本集中心的距离d
i

[0071]
[0072]
式(3)中,p
x
为待测样本的光谱图像融合信息,为第i棵决策树中新样本集的平均光谱的光谱图像融合信息;
[0073]5‑
2)根据步骤5

1)中的欧式距离确定在待测样本时每棵决策树的权重;第i棵决策树的权重a
i

[0074][0075]
式(4)中,i∈n;
[0076]5‑
3)对步骤5

2)的每棵决策树的权重进行加权,输出待预测样本水分的预测值y:
[0077][0078]
在本发明实例中,由于在训练集中类别不平衡的情况下,对某些贡献度较大的样本数据,通常需要有小的训练误差。因此当预测未知样本x的水分y时,基于自适应权重策略,对不同训练样本集赋予不同的权重进行预测。
[0079]
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。
[0080]
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0081]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0082]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0083]
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1