一种基于小样本的设施温室温度预测方法

文档序号:33483416发布日期:2023-03-15 13:25阅读:210来源:国知局
一种基于小样本的设施温室温度预测方法

1.本发明属于农业物联网以及农业服务技术领域,涉及温室技术,特别涉及一种基于小样本的设施温室温度预测方法。


背景技术:

2.温度是影响设施温室内农作物产量和品质的重要参数之一,过高或过低均会对农作物生长发育产生危害。研究证明,有效地控制温度对设施农业的增产具有重要意义。目前,设施农业的生产调控大多依靠生产者相关经验,仅通过对数据采集分析,进行调控决策,这种方法会造成反馈控制存在滞后性,影响作物生长。因此,融合多环境因子构建设施温度时序预测模型,是设施温室温度精准高效控制的重要前提。
3.研究发现,设施温室温度不仅是具有时变性、非线性、周期性等特征的连续时间序列,还与设施温室内外各种环境因子存在复杂的耦合关系。影响温室内温度的因素包括室内外空气温度、室内外空气相对湿度、室外风速、室外风向、室内外土壤温度、室内外光照强度、室内外co2浓度及室内外土壤水分等相互独立的时间序列特征以及环境分布特征、通风特征、加湿特征等非时序性特征。因此,为耦合这些影响温室温度的特征信息,充分挖掘这些特征的内部潜在联系,设施温室温度预测模型必须要综合考虑多种环境因子对温室温度的影响,这是设施温室精准化预测温度的关键。
4.近年来,国内外学者运用多种方法对设施温室温度预测进行了大量研究。其中,左志宇等(2010)针对现有温室环境控制系统无法对下一时段温室温度进行精确预测的问题,提出采用时序分析法建立温度预测模型的方法;刘志鹏等(2017)选取影响温室内温度变化的相关气象因子,通过逐步回归分析方法建立温室内温度预测模型;li x等(2020)基于bp神经网络算法,提出了一种三维日光温室温度预测模型;田东等(2020)利用arimai和svr组合方法提高了在不同环境条件影响下的食用菌温室温度近似模拟能力。随着人工智能技术的发展,越来越多的学者将深度学习算法融入设施温室温度的预测中。其中,卷积神经网络特殊的网络结构可提取反映温度复杂动态变化的高维特征,并将所提特征向量构造为时间序列形式作为循环神经网络的输入,学习特征内部动态变化规律。而循环神经网络(rnn)、门控循环单元神经网络(gru)和长短期神经网络(lstm)通过结合卷积神经网络的方式也被应用于温度预测领域。例如赵全明等(2020)提出了基于cnn-gru的菇房多点温湿度预测方法,挖掘了深层次的有效信息,使gru模型能更好地学习cnn提取的高维时间序列特征;elmaz f等(2021)提出了一种用于预测室内温度建模的cnn-lstm体系结构,解决了温度非线性和滞后性问题,并取得不错的效果。以上方法在提高预测精度的同时还兼顾了运行效率,提升了整个模型的性能,可为温度精准化预测提供了理论基础。
5.然而,目前相关研究多聚焦于同地点或同气候温室温度建模,鲜少考虑在面向多种不同温室条件下的温度建模情况,一直存在以下两方面缺陷:一是在面向多种不同温室条件下,模型不具有普适性。由于大部分研究仅针对同地点或同气候温室温度建模,造成一类的温室模型无法迁移到另一类的温室模型上,要根据不同条件温室训练不同的模型,增
加了计算成本。二是在计算机科学中,为避免深度学习出现过拟合现象,通常需要充足的训练数据,然而每年有大量的新建、扩容、改造的温室,由于运行时间短,未积累足够的历史数据,难以建立高精度的预测模型,所以亟需探索一种适用于该温室的快速有效建模方法。


技术实现要素:

6.为了克服上述现有技术的缺点,本发明的目的在于提供一种基于小样本的设施温室温度预测方法,以期将具有大量数据的一类温室温度预测模型通过迁移学习法,在面向多种不同的设施温室条件下,快速有效地构建多种预测模型,对温度进行连续高效精准的预测。
7.为了实现上述目的,本发明采用的技术方案是:
8.一种基于小样本的设施温室温度预测方法,包括:
9.步骤1,采集环境因子作为特征,构建数据集,所述环境因子包括:室内温度、室内空气相对湿度、室内土壤温度、室内光照强度、室外空气温度、室外空气相对湿度及室外土壤温度;
10.步骤2,基于1d cnn-gru深度神经网络,构建通用的温室温度预测模型;
11.所述1d cnn-gru深度神经网络由依次的输入层、卷积层、循环层和输出层组成;其中,输入层x
t+j,i
为二维矩阵;x
t,i~
x
t+j,i
表示第t时刻到第t+j时刻输入样本的第i个特征数据;x
t,1
~x
t,i
表示t时刻样本数据共有1~i个特征;卷积层采用一维卷积滤波器提取数据中蕴含的二维特征;循环层选择两层gru网络,将提取的二维特征构造为时间序列输入第一层gru网络,第一层gru网络返回每个时间步输出的完整序列,第二层gru网络返回每个输入序列的最终输出;所述输出层为全连接层,输出目标时刻的预测值;
12.步骤3,训练所述通用的温室温度预测模型,得到最优预测结果对应的网络参数,获得通用的最优模型;
13.步骤4,根据所述最优模型,基于迁移学习以预训练及微调方式在小样本数据集中调整其网络参数,构建面向不同地点和/或不同气候的设施温室条件下的温室温度预测模型,其中所述小样本数据集中的环境因子类型与步骤1的环境因子一致,但数据量远小于步骤1所构建数据集的数据量。
14.在一个实施例中,所述步骤1,数据集中的数据,根据设定的间隔时间t,每日连续采集,且连续时间不少于一个月。
15.在一个实施例中,所述步骤2,模型以室内温度、室内空气相对湿度、室内土壤温度、室内光照强度、室外空气温度、室外空气相对湿度及室外土壤温度为输入,时间步长为6,即输入矩阵大小为6
×
7,以t时间后的温度为输出,设定输出步长d,以用于预测t
×
d时间内的温度变化。
16.在一个实施例中,所述步骤3,先对所有的数据进行归一化处理缩放至[0,1]之间;然后将归一化处理的数据划分为训练集和测试集,以训练集数据训练模型,测试集数据验证模型的泛化能力及精度。
[0017]
在一个实施例中,所述步骤3,卷积层滤波器的尺寸设置为3,步长为1,卷积核数目为64,循环层输出节点数均为128,输出层输出节点数为1;卷积层将t时刻的输入样本数据s
t
与一维卷积核执行卷积操作后,加以偏置b
cnn
通过激活函数进入循环层,在循环层中,其
样本数据x
t
通过重置门r、更新门z及t时刻提供临时单元状态c进行点乘运算,输出至全连接层。
[0018]
在一个实施例中,所述步骤2,输入层、卷积层、循环层及输出层均采用线性整流函数(rectified linear unit,relu)作为激活函数,均方差函数(mean square error,mse)为损失函数,同时利用adam优化算法更新神经网络权重,使模型性能达到最佳;当模型完成规定的训练轮数后,判断其输出结果是否满足模型精度,若不满足则重新调整参数值,继续训练直到达到模型精度;若满足则输出结果。
[0019]
在一个实施例中,所述步骤3,以测试集温度为实际值,模型输出值为预测值,先对二者反归一化,恢复原有量纲级别,再以决定系数r2和均方误差mse为评价指标,对模型精度及泛化能力进行评估。
[0020]
在一个实施例中,所述步骤4,以所述通用的最优模型的网络为预训练网络,将源域网络依次冻结卷积层、冻结卷积层与顶端循环层及冻结卷积层与两层循环层,其余部分的网络参数重新训练时,利用目标域数据选取进行验证,构建面向不同地点和/或不同气候的设施温室条件下的温室温度预测模型,实现设施温室温度精准化预测。
[0021]
与现有技术相比,本发明综合考虑多种温室内外环境因子对温室内温度的影响,面向多种不同类型温室条件下,将精准高效地预测温度作为目标,提出了基于深度学习的设施温室温度预测模型,并在不同时间(即不同天气条件)、不同地点对模型的预测效果进行验证。本发明的有益效果主要体现在:
[0022]
(1)基于循环神经网络构建通用的设施温室温度模型。充分考虑了温度的时序性、非线性、高波动性及强耦合性特点,通过卷积神经网络挖掘环境数据中蕴含的有效信息;对提取的高维特征进行降维,将其提取的深层次抽象特征转换为全局特征向量作为循环层的输入,进行有效的动态时间序列数据建模。兼顾了模型的运行效率和预测性能,为面向多种不同类型温室条件下精准高效地预测温度提供理论基础。
[0023]
(2)基于迁移学习构建小样本数据下的温度预测模型。在面向同类型条件下及不同类型条件下,基于具有大量数据的一类温室温度预测模型进行预训练,以微调方式在小数据集中调整网络参数,快速有效地构建多种预测模型。该技术在防止模型过拟合的同时,尽可能地减少了计算成本,为设施温室环境精准调控奠定基础。
附图说明
[0024]
图1为温室内外监测平台结构示意图。
[0025]
图2为1d cnn工作原理示意图。
[0026]
图3为门控循环单元结构示意图。
[0027]
图4为1d cnn-gru网络结构示意图。
[0028]
图5为温度预测模型建立流程图。
[0029]
图6为本发明实施例冬季预测模型拟合效果示意图。
[0030]
图7为模型迁移过程示意图。
具体实施方式
[0031]
下面结合附图和实施例详细说明本发明的实施方式。
[0032]
本发明提供了一种基于小样本的设施温室温度预测方法,首先根据当前温室内外环境信息获取大量数据集作为源域,通过卷积神经网络挖掘提取源域数据中蕴含的二维特征;其次将提取的特征向量构造为时间序列输入循环神经网络提取其时间特征,预测未来温室温度,建立面向温室温度预测通用的最优模型;最后基于迁移学习以预训练及微调方式在小数据集中调整网络参数,构建面向不同地点和/或不同气候的设施温室条件下的温室温度预测模型,为实现各类设施温室温度的高效精准预测及环境精准调控奠定基础。
[0033]
本发明的预测方法具体可描述如下:
[0034]
步骤1,采集环境因子作为特征,构建数据集,其中的环境因子包括:室内温度、室内空气相对湿度、室内土壤温度、室内光照强度、室外空气温度、室外空气相对湿度及室外土壤温度。
[0035]
在本发明的一个实施例中,试验于2019年8月13日至2019年9月11日(夏季)、2019年12月2日至2019年12月31日(冬季)及2020年12月11日至2020年12月30日西北农林科技大学泾阳蔬菜试验示范站东5号和东3号内进行,地点位于北纬34
°
53

、东经108
°
84

,海拔404m,属于暖温带大陆性季风气候,年均温度13℃。源域温室为单栋单坡面式,骨架采用轻钢结构,后坡采用pc版和丝绵棉被覆盖,东侧、西侧与北侧是墙体部分,均采用黏土建造。其方向坐北朝南,其长50m,宽10m,后墙高3m,脊高1.6m,具有天窗、风机、卷帘机、遮阳网、湿帘以及喷淋器等设备。其中,风机通过加快温室内的空气流动对温室内空气温度进行调节,使温室各处温度数值均匀变化。
[0036]
试验期间,2019年12月2日至2019年12月31日共包括晴、晴转多云、多云、阴、霾及霾转多云六种天气。为进一步分析不同天气条件下温度的预测效果,以清晰度指数k
t
对上述天气进行分类。k
t
是表征太阳辐射经过大气层时衰减程度,与当时的天气状况密切相关。如表1所示,根据清晰度指数对应的天气现象,冬季天气分为三类。其中,k
t
≥0.5共15天、0.5>k
t
≥0.2共5天、0.2>k
t
≥0.1共10天、k
t
<0.1共0天。
[0037]
表1清晰度指数对应的天气现象
[0038][0039][0040]
夏季温室室内不栽培作物,试验期间进行杀菌闷棚处理;冬季温室室内栽培作物为番茄,以滴灌方式培育,试验期间每日于8:00~8:30揭盖保温被,当k
t
≥0.5及0.5>k
t
≥0.2时温室于10:00~10:30开窗换气通风;当0.2>k
t
≥0.1时根据实际情况适当延后温室开窗时间。
[0041]
参考图1,为实现环境因子采集,构建了温室内外监测平台,其主要由信息监测模块、信息传输模块及农业生产物联网监测平台组成。数据集中的数据,根据设定的间隔时间t,每日连续采集,且连续时间不少于一个月。
[0042]
在本实施例中,设定每日于0:00~24:00连续采集,采样的间隔时间t为20分钟,采集的环境因子包括室内光照强度(qy-150a光照强度传感器,量程:0~200klux,精度:
±
1lux)、室内温度与室外空气温度(pt1000温度传感器,量程:-200℃~+200℃,精度:
±
0.1℃)、室内外空气相对湿度(dht11湿度传感器,量程:20%~90%,精度:
±
5%)、室内外土壤温度(pt1000温度传感器,量程:-200℃~+200℃,精度:
±
0.1℃),试验将传感器放置于温室中部,离地面高1.2m,各采集30天,每季共获取2160组样本数据。信息传输模块是将感知信息通过zigbee网络发送至网关节点对其进行数据处理,随后通过gprs网络传输至移动基站并利用web服务器实现远程连接与数据交互,将获取的数据上传至农业生产物联网监测平台。
[0043]
步骤2,构建通用的温室温度预测模型。
[0044]
在上述获取的试验数据基础上,为面向不同地点和/或不同气候设施温室快速有效地构建多种预测模型,需建立面向温室温度预测通用的最优模型,为实现各类设施温室温度的高效精准预测及环境精准调控奠定基础。
[0045]
本发明使用改进一维卷积网络(1d cnn)和门控循环单元(gru)算法构建温度预测模型。其中,1d cnn是深度学习中的一种有效学习框架,通过卷积运算模拟人脑从局部图中提取特征,在计算机视觉方面取得了较好的效果。同时在序列问题中,1d cnn可通过卷积层的滤波器捕捉输入数据间的相互关系,并将其组合成更短的特征序列输入至下一层网络中进行预测。例如,当卷积滑动窗口为5时,1d cnn通过窗口滑动依次从序列中提取局部一维序列段与权重做点积,如图2所示。
[0046]
门控循环单元gru是一种基于循环神经网络的优化网络,通过引入“门”的概念,优化了神经元内部结构,有选择性地传递信息,解决了循环神经网络难以学习序列中长距离依赖关系问题。在隐层中,各神经元相互连接,输入不仅与输入层输入有关,还与上一时刻隐层输出有关。如图3中a所示,x为总输入,h为隐层输出,o为总输出。如图3中b所示,gru“门”包括重置门r和更新门z,重置门r融合输入x
t
与前一时刻的历史数据h
t-1
,并丢弃与时间无关的历史数据,保留短序列数据间的依赖关系;更新门z通过存储上一时刻记忆h
t-1
,选择性地记忆信息,不断更新其值来捕捉长序列数据间的依赖关系。
[0047]
本发明基于上述网络结构,搭建了1d cnn-gru深度神经网络,其具体结构如图4所示,整体结构采用逐个堆叠方式连接,由依次的输入层、卷积层、循环层和输出层组成。其中,输入层x
t+j,i
为二维矩阵,i为特征个数,j为时间步长;x
t,i~
x
t+j,i
表示第t时刻到第t+j时刻输入样本的第i个特征数据;x
t,1
~x
t,i
表示t时刻样本数据共有1~i个特征。卷积层采用一维卷积滤波器提取数据中蕴含的二维特征,因样本数据维度较少,不添加池化层。循环层选择两层gru网络,将提取的二维特征构造为时间序列输入第一层gru网络,第一层gru网络返回每个时间步输出的完整序列,第二层gru网络返回每个输入序列的最终输出。输出层为全连接层,输出目标时刻的预测值。
[0048]
在本发明的实施例中,冬季模型以室内温度、室内空气相对湿度、室内土壤温度、室内光照强度、室外空气温度、室外空气相对湿度及室外土壤温度为输入,时间步长为6,即输入矩阵大小为6
×
7。以t时间后的温度为输出,输出步长为d,预测t
×
d时间内的温度变化,其具体流程图如图5所示。本实施例中,t取20分钟,设定输出步长9,则模型用于预测三小时内的温度变化。
[0049]
步骤3,训练该通用的温室温度预测模型,得到最优预测结果对应的网络参数,获得通用的最优模型。
[0050]
本发明的训练过程具体如下:
[0051]
(1)由于不同样本数据间数值范围存在较大差异,量纲也有所不同,为加快神经网络拟合速度并提高模型预测精度,故对所有的样本数据采用归一化处理缩放至[0,1]之间,所用计算式为
[0052][0053]
式中x
min
为每维数据中的最小值,x
max
为每维数据中的最大值,x
nor
为归一化后的数据。
[0054]
(2)将归一化处理的数据划分为训练集和测试集,以训练集数据训练模型,测试集数据验证模型的泛化能力及精度。
[0055]
本实施例中,在归一化后的2160组数据中,选取1512组数据(占样本总数据70%)作为训练集,其余648组数据(占样本总数据30%)作为测试集。
[0056]
(3)为保持网络稳定充分挖掘数据间局部有效信息,本发明将卷积层滤波器尺寸设置为3,步长为1,卷积核数目为64,循环层输出节点数均为128,输出层输出节点数为1。
[0057]
(4)卷积层将t时刻的输入样本数据s
t
与一维卷积核执行卷积操作后,加以偏置b
cnn
通过激活函数进入循环层,如下式所示。
[0058]yt
=f(w
cnn
*s
t
+b
cnn
)
[0059]
在循环层中,其样本数据x
t
通过重置门r、更新门z及t时刻提供临时单元状态c进行点乘运算,输出至全连接层,具体计算过程见下式。
[0060]
z=sigmoid(w
zht-1
+uzx
t
)
[0061]
r=sigmoid(w
rht-1
+urx
t
)
[0062][0063][0064]
式中f为激活函数,w
cnn
为输入层到卷积层对应的权值矩阵,s
t
为t时刻的输入样本数据,b
cnn
为输入层到卷积层对应的偏置矩阵,y
t
为卷积层输出数据,在y
t
基础上提取一个二维矩阵,可得x
t
。wz、wr、wc、uz、ur、uc为更新门、重置门和临时输出的权值矩阵。
[0065]
(5)每层网络(即输入层、卷积层、循环层及输出层)均采用线性整流函数(rectified linear unit,relu)作为激活函数,均方差函数(mean square error,mse)为损失函数,同时为实现神经网络权重w、u、v的更新,利用adam优化算法更新神经网络权重,使模型性能达到最佳。当模型完成规定的训练轮数后,判断其输出结果是否满足模型精度,若不满足则重新调整参数值,继续训练直到达到模型精度;若满足则输出结果。
[0066]
(6)以测试集温度为实际值,模型输出值为预测值,先对二者反归一化,恢复原有量纲级别,再以决定系数r2和均方误差mse为评价指标,对模型精度及泛化能力进行评估。
[0067]
为验证本步骤构建的冬季日光温室温度预测模型的泛化能力和预测性能,以20分钟后温度测试集的648组样本数据对其进行验证。验证结果表明,模型训练集决定系数为0.998,均方误差为0.101℃,平均误差为0.199℃;测试集决定系数为0.998,均方误差为0.085℃,平均误差为0.185℃。如图6所示,其拟合直线拟合系数为1.001,几乎接近于1,截
距为-0.009,几乎接近于0,说明该模型预测值和实际值几乎在直线y=x两侧,二者存在较强相关性,模型达到理想预测精度。
[0068]
在此基础上,为进一步验证冬季模型预测20分钟后、40分钟后、1个小时后、1个小时20分钟后、1个小时40分钟后、2个小时后、2个小时20分钟后、2个小时40分钟后及3小时后温度预测精度变化情况,以决定系数r2、均方误差mse和平均绝对误差mae这三项为评价指标,具体结果如表4所示。
[0069]
表4冬季模型多步预测时长结果
[0070][0071]
由表4可知,冬季模型随着步长的增加,精度逐步降低。模型均可对前9步长的温度精准化预测,即20分钟至3个小时后的温度,其前9步下模型决定系数变化范围为0.964~0.998,均方误差变化范围为0.085℃~2.276℃,平均绝对误差变化范围为0.185℃~0.927℃,满足农业生产调控精度要求,农户可根据自身需求,选择适宜的步长来预测未来温室温度的变化趋势。
[0072]
为验证本发明算法的预测性能,以20分钟后的模型精度为例,采用以决定系数r2、均方误差mse和平均绝对误差mae这三项为评价指标,选取多元线性回归法(mlr)、时序分析法(ar)、bp神经网络算法、支持向量机回归(svr)与一维卷积门控循环单元网络(1d cnn-gru)在参数优化后进行建模对比,5种模型预测结果如表5所示。
[0073]
表5不同算法对比结果
[0074]
[0075][0076]
由表5可知,一维卷积门控循环单元算法显著优于以多元线性回归法、时序分析法为代表的统计学法和以bp神经网络算法、支持向量机回归为代表的浅层神经网络法。这是由于统计学法以线性数学方程为基础难以建立准确数学模型;浅层神经网络法对多维时序数据处理能力有限且难以精准预测大规模样本数据。在一维卷积门控循环单元中,由于一维卷积可获取多维数据中相互联系的有效特征,同时门控循环单元网络能更好地学习时间序列特征,因此该算法能够大大提高温度预测精度。
[0077]
综上所述,以一维卷积门控循环单元网络建立的模型均在温度时序数据预测方面显著优于上述4组对照模型,从而验证了该算法的优越性。
[0078]
同时,为验证冬季模型在不同k
t
下适用性,以2019年12月23日至2019年12月31日中的三类天气检验模型预测效果。其中,12月26日(晴)、12月27日(晴转多云)、12月28日(晴)、12月30日(晴)及12月31日(晴)为k
t
≥0.5;12月25日(多云)为0.5>k
t
≥0.2;12月23日(霾)、12月24日(霾)及12月29日(霾转多云)为0.2>k
t
≥0.1。根据上述构建的模型,以mlr模型、bp模型为例与1d cnn-gru模型对比,三种模型在不同k
t
下的预测结果如表6所示。
[0079]
表6冬季不同k
t
下多种模型验证结果
[0080][0081][0082]
如表6所示,在三类k
t
下1d cnn-gru模型预测效果均最好,mlr模型预测效果均最差。当k
t
≥0.5时,由于陕西地区冬季晴天少云造成室内几乎不受云层影响,光照度值波动较小,因此1d cnn-gru模型预测效果较0.5>k
t
≥0.2及0.2>k
t
≥0.1最好。当0.5>k
t
≥0.2时,3种模型虽然预测误差波动较小,但预测值和实际值拟合度较低,这是由于多云天温室受多云层移动影响,其移动速度快且厚度不断变化,导致室内光照强度存在较大起伏,模型出现一定程度的预测误差。当0.2>k
t
≥0.1时,霾天气中的颗粒会影响室内受到的光照强度,所以1d cnn-gru模型预测效果不如晴天。综合考虑,冬季日光温室温度预测模型在k
t

0.5(晴)时预测效果最好,且在三类k
t
下模型预测效果虽然各不相同,但其决定系数均在0.984以上,均方误差均在0.115℃以下,平均绝对误差均在0.218℃以下,在各k
t
下模型均表现出较高准确性,说明此方法具有适用性,均可应用于实际生产,在冬季室内太阳辐射较弱时,可通过该模型提前预知温度,利用加温设备为温室补充加温,为作物优质生产提供可靠性依据。
[0083]
步骤4,根据得到的最优模型,基于迁移学习以预训练及微调方式在小样本数据集中调整其网络参数,构建面向不同地点和/或不同气候的设施温室条件下的温室温度预测模型。其中小样本数据集中的环境因子类型与步骤1的环境因子一致,但数据量往往远小于步骤1所构建数据集的数据量。
[0084]
迁移学习是将一个预训练的模型重新用在另一个任务中的机器学习方法。相比于传统的方法可有效避免训练样本不足的问题,并且提升模型泛化能力,进而提升训练集不充分的模型预测精度。hu q等(2016)和huang x等(2020)分别将迁移学习方法应用到风速预测和天气预报的处理,通过对大量样本的预学习,并在少量样本进行知识迁移,进而解决少量样本过拟合的问题,提高预测精度。迁移学习与传统机器学习方法的基本假设不同,即训练和测试数据从相同的特征空间提取并满足相似的数据分布。它的目标是将某个领域或任务上学习到的知识或模式应用到不同但相关的领域或问题中,是小样本预测的一种有效策略,包括基于实例的迁移、基于特征的迁移以及基于模型共享参数的迁移等。其中,基于模型共享参数的迁移学习方法可将在大规模数据集中预训练好的网络模型嵌入其他任务模型中作为特征提取器,从而有效提取小样本数据的深度特征信息,以进行预测。
[0085]
迁移学习主要包含域和任务两个概念,域即是数据的类型与组成,代表了基础属性;任务就是使用数据完成的属性,在本发明中就是预测任务。通常域由两个部分组成,可以表示为d={z,p(z)},即特征空间z和特征空间的边缘分布p(z)。其中特征空间z可以表示为z={z|zi∈z,i=1,2....n}。在给定一个域d={z,p(z)}的情况下,一个任务可以表示为t={y,f(
·
)},即标签控件y和一个目标预测函数f(
·
)。
[0086]
现有迁移学习大多仅考虑存在一个源域ds和一个目标域d
t
的情况,称为单源域迁移学习。设源域ds={(z
s,1
,y
s,1
),(z
s,2
,y
s,2
),...,(z
s,n
,y
s,n
)},z
(s,j)
∈zs表示源域的观测样本,y
(s,j)
∈ys表示源域观测样本z
(s,j)
对应的标签。目标域d
t
={(z
t,1
,y
t,1
),(z
t,2
,y
t,2
),...,(z
t,n
,y
t,n
)},z
(t,j)
∈z
t
表示目标域观测样本,y
(t,j)
∈y
t
表示目标域样本z
(t,j)
对应的输出。基于以上的符号定义,迁移学习的目的是:在给定源域ds和源域学习任务ts、目标域d
t
和目标域任务t
t
,且满足d
t
≠ds和t
t
≠ts的情况下,通过使用源域ds和ts中的知识,提升目标域d
t
中目标预测函数f(
·
)的学习效果。
[0087]
在此基础上,为解决在数据不足情况下的温室温度预测精度低及过拟合的问题,本发明基于迁移学习构建多种不同类型的温室温度预测模型,通过获取本发明建立的温室温度预测通用的最优模型,采用微调方式在小数据集中调整网络参数。具体地,以最优模型的网络为预训练网络,将源域网络依次冻结卷积层、冻结卷积层与顶端循环层及冻结卷积层与两层循环层,其余部分的网络参数重新训练时,用目标域数据进行验证,来构建面向不同地点和/或不同气候的设施温室条件下的温室温度预测模型,实现设施温室温度精准化预测。迁移学习与特征提取互为补充,对于用于特征提取的冻结的模型基,将其顶部的几层“解冻”,并将这解冻的几层和新增加的部分联合训练,具体迁移过程如图7所示。
[0088]
由于同一类型温室会因地理位置及作物生长等因素造成温度的变化趋势不同,对于同一类型温室,若能将训练好的某一地点的温室温度预测模型应用到其他地点的温室中,则可很大程度节省时间成本。因此选择东5号日光温室2019年12月2日至2019年12月31日的数据作为算例初始源域;选择东3号日光温室2020年12月11日至2020年12月30日的数据作为目标域。
[0089]
以本发明建立的东5号冬季温度预测模型的网络为预训练网络,当源域网络冻结卷积层,其余网络参数重新训练时,目标域选取东3号日光温室2020年12月11日至2020年12月24日的数据(共14天)及2020年12月11日至2020年12月19日的数据(共9天)作为训练集训练模型;当源域网络冻结卷积层与顶端循环层,其余网络参数重新训练时,目标域仍选取东3号日光温室2020年12月11日至2020年12月24日的数据(共14天)及2020年12月11日至2020年12月19日的数据(共9天)作为训练集训练模型;当源域网络冻结卷积层与两层循环层,其余网络参数重新训练时,目标域选取东3号日光温室2020年12月11日至2020年12月16日的数据(共6天)及2020年12月11日至2020年12月13日的数据(共3天)作为训练集训练模型。上述模型均以2020年12月25日至2020年12月30日的数据(共6天)作为测试集验证模型的泛化能力及精度。模型具体结果如表7所示。
[0090]
表7预测时长为20分钟
[0091][0092]
由表7可知,冻结层数为1层至3层所建模型在各项评价指标中均表现较优,且冻结层数越少所建模型精度越高。同时当冻结层数为1层时,训练集14天的模型较9天的模型在测试集上预测效果更好,且训练集mse为0.265℃,测试集mse为0.172℃,两集之间的结果相差较小,表明泛化能力较9天模型更好。除此之外,当冻结层数为2至3层时训练集天数14天较9天与6天较3天在测试集上差距并不明显,这说明在冻结层数较多时,基于小样本数据构建预测模型可以达到两倍小样本数据的预测效果。
[0093]
同样,为验证多步长下对于该方法的适用性,以预测时长为40分钟与1小时进行对比验证如表8、表9所示。
[0094]
表8预测时长为40分钟
[0095][0096]
表9预测时长为1小时
[0097][0098]
表8与表9结果表明,三种冻结效果在不同预测时长的建模上也表现出了相似的特征,在网络冻结一层时,模型精度最高、拟合效果最好,且14天所建立的模型较9天精度更高,表明样本数据越多其模型在测试集表现效果越好;在网络冻结层数变多时,模型随着层数变多精度逐层降低,且样本数据量并不存在明显优势。同时,由上述三表可知,随着时间步长的增加所建立的模型精度降低,但仍满足农业实际生产要求。
[0099]
同样,由于温室温度在不同季节内变化趋势不同,所以面向冬夏两季分别构建两种温度模型。但是对于同一类型温室,若能将训练好的一个季节温室温度预测模型应用到其他季节的模型中,则可很大程度节省时间成本。因此,选择冬季模型为源域模型时,以东5号日光温室2019年8月13日至2019年9月11日(夏季)的部分数据作为目标域。
[0100]
以本发明建立的冬季温度预测模型的网络为预训练网络,当源域网络冻结卷积层,其余网络参数重新训练时,目标域选取夏季2019年8月13日至2019年8月26日的数据(共14天)及2019年8月18日至2019年8月26日的数据(共9天)作为训练集训练模型;当源域网络冻结卷积层与顶端循环层,其余网络参数重新训练时,目标域仍选取夏季2019年8月13日至2019年8月26日的数据(共14天)及2019年8月18日至2019年8月26日的数据(共9天)作为训练集训练模型;当源域网络冻结卷积层与两层循环层,其余网络参数重新训练时,目标域选取夏季2019年8月21日至2019年8月26日的数据(共6天)及2019年8月24日至2019年8月26日的数据(共3天)作为训练集训练模型。上述模型均以2019年8月27日至2019年9月1日的数据(共6天)作为测试集验证模型的泛化能力及精度,同时以三种预测时长作为对比验证,如表
10、表11及表12所示。
[0101]
表10预测时长为20分钟
[0102][0103]
表11预测时长为40分钟
[0104][0105]
表12预测时长为1小时
[0106][0107]
由上述表可知,冻结层数为1层至3层所建模型在各项评价指标中均表现较优,且冻结层数越少所建模型精度越高。在预测时长为20分钟时,其测试集拟合度为0.964~0.997,mse为0.499℃~6.117℃,mae为0.351℃~1.761℃;在预测时长为40分钟时,其测试集拟合度为0.945~0.997,mse为0.460℃~10.021℃,mae为0.423℃~2.224℃;在预测时长为1小时时,其测试集拟合度为0.931~0.997,mse为0.464℃~11.688℃,mae为0.485℃
~2.539℃。上述模型精度均与第二节训练数据充足时的预测模型精度相差不大,甚至在部分预测精度可以超过训练数据充足时的传统方法。可见,利用预训练与微调的方法构建夏季温度预测模型精度高,且在小样本的条件下可实现不同步长下温度的连续精准化预测。
[0108]
综上,目前方法多采用统计法和浅层神经网络法,仅能实现对于短期温室温度的精准预测,但随着预测时间的延长,因其难以挖掘数据中蕴含的时序特征,导致模型预测精度快速下降难以满足实际生产需求。本发明一种基于卷积神经网络和门控循环网络的设施温室温度模型构建方法,可以进行长期预测。其充分考虑了温度的时序性、非线性、高波动性及强耦合性特点,通过卷积神经网络挖掘环境数据中蕴含的有效信息;对提取的高维特征进行降维,将其提取的深层次抽象特征转换为全局特征向量作为循环层的输入,进行有效的动态时间序列数据建模。该方法兼顾了模型的运行效率和预测性能,为面向多种不同类型温室条件下精准高效地预测温度提供理论基础。同时本发明采用的迁移学习方法以微调方式在小数据集中调整网络参数,快速有效地构建多种预测模型。该技术在防止模型过拟合的同时,尽可能地减少了计算成本,为设施温室环境精准调控奠定基础。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1