基于D3AT-LSTM模型的时空气温并行预测方法

文档序号：39685173发布日期：2024-10-18 13:38阅读：58来源：国知局

本发明涉及气温预测，具体涉及基于d3at-lstm模型的时空气温并行预测方法。

背景技术：

1、最早的短期气温预报主要采用经验预测法和统计学方法。经验预测法基于历史天气状况和预报人员的个人经验来预测未来气温。这种方法依赖于预报员对过去天气事件的理解能力，而统计学方法则通过分析和选择与气温相关的气象因素，构建统计模型来预测未来一段时间内的气温走势。然而，由于这两种方法均缺乏对大气物理过程的深入理解，在预测气温变化的准确性方面受到限制。

2、随着技术的发展，数值天气预报成为了主流的气温预报方法。这种方法基于大气物理和动力学原理，通过高性能计算机模拟大气状态的演变，预测未来时间的天气情况。尽管数值预报在提高预报的准确性方面取得了显著进步，但由于模型初始化和数据同化过程中的延迟，使得数值预报在满足高精确度的气温预测方面仍然面临挑战，尤其是在波动性较强的气温序列的预测上。

3、随着遥感卫星与天体雷达等观测技术迅速发展，为短期气温预报提供了新的可能。卫星能够提供大范围、高频次的地表和大气温度观测数据，使得可利用的气象数据变得更加海量化与复杂化，这在一定程度上提高了气象预测精度，但同时也为气象监测带来了一定的冗余和干扰信息。由于气象序列在演变过程中受外界多种时空诱导因素的影响，多种气象变量与气温之间伴随着复杂的相互作用关系，气象要素整体走势呈现出非线性的波动性。如何充分利用海量的气象数据，充分挖掘潜在信息来进一步提升气温预测的精度，是当前预测方法急需解决的问题。

4、随着大数据时代的来临，深度学习技术发展迅速，为气象预测领域带来了新的解决思路，基于深度学习的网络架构通过计模拟人脑神经元的结构，来模拟信号从不同突触传递的过程，从而自适应的学习到其隐含规律。通过训练大量的历史气象数据，机器学习模型能够识别气温变化的复杂模式，有效预测未来的气温变化，为解决传统气温预报方法中存在的问题提供了新的解决方案。

5、因此在利用高维海量的气象数据开展气温预测，相对于传统的方法表现出更大的优势进而被广泛应用。然而，深度学习方法在气温预报中仍然存在泛化性弱、预测精度低等问题，仍有待提升的空间。

6、在气象预测领域的现有研究表明，虽然现有方法在提高气温预测精度方面取得了进展，但由于方法自身结构等限制，仍然存在一些不足。深度学习模型不可避免地面临过拟合问题，且参数众多导致计算资源消耗巨大，同时其“黑箱”属性限制了模型对时间序列内在特征解释性的表现。在长期序列预测中，其泛化能力较弱。

7、因此，提供一种在3dcnn与lstm模型的基础上加以改进，对影响气温序列的时空要素进行建模分析以全面提升气温预测的精确度的基于d3at-lstm模型的时空气温并行预测方法，已是一个值得研究的问题。

技术实现思路

1、本发明的目的是提供一种在3dcnn与lstm模型的基础上加以改进，对影响气温序列的时空要素进行建模分析以全面提升气温预测的精确度的基于d3at-lstm模型的时空气温并行预测方法。

2、本发明的目的是这样实现的：

3、基于d3at-lstm模型的时空气温并行预测方法，所述d3at-lstm模型的网络结构包括输入层、结合并行注意力机制的三维卷积层和lstm循环神经单元；从输入层、结合并行注意力机制的三维卷积层、lstm循环神经单元到最后的气温预测，前一层的结果作为后一层的输入；输入层负责输入网络所需的原始数据，所述原始数据是经过滑动窗口处理的历史气象观测序列，所述原始数首先经过清洗和归一化处理，以便为神经网络提供稳定、合适的输入；输入层处理过的气象数据被输入到结合并行注意力机制的三维卷积层，通过三维卷积模块进行处理，并引入通道注意力机制实现高阶的时空显著性特征的提取；通过对多个相邻站点的数据进行融合，来提取和利用更多的空间信息，同时通过引入通道注意力机制，以识别出不同时间通道上的重要特征，使网络能够更加聚焦于对预测结果影响较大的特征；lstm循环神经单元接收来自卷积层的输出，并根据这些输出调整自身的内部状态，以更好地适应气象序列的内部特征；通过引入门控机制，lstm循环神经单元捕获序列中长时间跨度上的依赖关系，从而更准确地预测气温等时间序列数据神经单元则负责处理长时依赖关系；三者共同协作，提高了对气象数据的处理能力和预测精度。输入层处理过的气象数据被输入到结合并行注意力机制的三维卷积层，通过三维卷积模块进行处理，并引入通道注意力机制实现高阶的时空显著性特征的提取。通过对多个相邻站点的数据进行融合，来提取和利用更多的空间信息，同时通过引入通道注意力机制，能够识别出不同时间通道上的重要特征，使网络能够更加聚焦于对预测结果影响较大的特征。包括以下步骤：

4、步骤1：输入层的处理：使用经过滑动窗口处理的历史气象观测序列“x”作为网络的输入；输入层负责输入网络所需的原始数据，这里使用的是经过滑动窗口处理的历史气象观测序列，数据首先经过清洗和归一化处理，以便为神经网络提供稳定、合适的输入。为了使模型能充分考虑到时间与空间上的复杂影响特征，输入层联合目标位置相邻坐标点的气象序列，构建了融合时间-空间-多特征的超体素结构，将其作为后续网络的输入，使得后续模型可以更充分的关注到作用于气温的内外界复杂时空要素。

5、步骤2：结合并行注意力机制的三维卷积层的处理：步骤1的经过处理的历史气象观测序列“x”被输入到结合并行注意力支路的3dcnn模块，通过三维卷积模块进行处理，并引入通道注意力机制实现高阶的时空显著性特征的提取；输入层处理过的气象数据被输入到结合并行注意力机制的三维卷积层，通过三维卷积模块进行处理，并引入通道注意力机制实现高阶的时空显著性特征的提取。

6、步骤3：lstm循环神经单元的应用：将每个时间节点的数据依次输入到lstm循环神经单元中，来捕捉每个节点长时间序列下粗粒度的依赖关系；lstm循环神经单元接收来自卷积层的输出，并根据这些输出调整自身的内部状态，以更好地适应气象序列的内部特征。结合注意力机制的卷积网络提取气象序列的局部时空特征，挖掘气象序列全局的长时的依赖关系对气温的预测很重要；循环神经网络通过对上下文信息进行建模，获得输入特征的长时间依赖性；lstm通过引入门控机制，防止因步长过长导致的记忆丢失和梯度弥散问题，有效处理长序列数据的依赖关系。

7、步骤4：气温预测：将lstm循环神经单元处理过的融合了不同维度特征的高维向量传入全连接层，最终得到预测气温的数值。

8、所述步骤1的具体操作如下：首先对气象数据进行清洗，缺失的数据用上一时刻的数据填补；由于气象特征具有不同的数值范围，为了能够加速网络权重参数的收敛，得到最优解，将数据作为神经网络的输入之前，对气象数据集每个特征要素使用线性函数min-max-scaling进行归一化；

9、采用的再分析气象数据具有特定时空分辨率的时序数据，在输入网络前，对于某个站点气温值的预测将联合其空间上相邻的八个点，来进行时空范围上气象特征的融合，作为后续的输入数据；为了符合3dcnn的数据输入格式，首先在第二维度扩展通道c＝1,原始气象数据被表示为每个时间片上c*w*h的多维张量,w和h分别表示站点数和特征数，然后利用窗口大小s＝72的滑动窗口技术，划分为多个时间上重叠的特征序列，输入特征最终被表示为融合时间-空间-多特征的四维张量xmfts(s*c*w*h)，s为输入的历史时间序列的长度。

10、所述步骤2的具体操作如下：对于气象特征超体素重构得到的xmfts，xmfts为输入层处理过的融合了时间-空间-多气象变量的超体素结构，将其作为后续网络的输入。xmfts在全部ttot个时间片上都有类似图像格式的w*h*c个像素的特征矩阵，xmfts融合了空间相关性与时间关联性信息；利用运用3dcnn模块对多个连续特征矩阵堆叠而成的“立方体”张量xmfts，进行时空卷积操作，实现同时捕获时间与空间维度上深层次的变化规律，3dcnn模块每次的输出结果都提取到上一层中局部连续的时空信息，得到更细粒度的高阶时空特征；在3dcnn模块引入并行的通道注意力支路senet，来对时间通道上的重要性进行评价；同时，为了保证注意力支路能更全面的分析序列间不同时刻上的重要度差异，对注意力模块输入的子域范围进行拓展，即在卷积模块输入序列长度lc的基础上左右各扩展1/2个lc的长度得到la，令la＝2lc，使其对不同时间通道的重要性程度做出全面的决策；

11、通道注意力支路senet通过压缩过程squeeze和缩放过程excitation来完成在时间通道上的显著性评价，对于输入的超体素信息，fsqueeze函数在空间的维度上进行全局平均池化，将每个时间片上的特征压缩为一个实数，fexcitation函数利用门控机制，来自适应地学习到每个时间通道的重要性；fsqueeze函数与fexcitation函数是senet网络结构中的现有的函数公式；

12、

13、其中，u为二维矩阵，h为高，w为宽，z为对特征在空间维度执行全局平均池化后的结果；

14、s＝fexcitation(z，w)＝σ(w2δ(w1z))

15、其中，v为sigmoid函数，δ为relu函数，w1为降维层参数，w2为升维层参数，s为利用门控机制自适应学习每个时间通道重要性后的结果。

16、所述步骤3的具体操作如下：将卷积子网获取到的多个时间步的高维特征，在每个时间步上展平为一维向量，分别作为lstm循环神经单元每个时间步的输入；lstm循环神经单元通过遗忘门决定了先前序列状态保留的程度，通过输入门决定了接受到的新特征信息加入到记忆单元中的水平，以此来不断更新隐藏状态；通过这种方式，lstm循环神经单元不断调整自身内部结构，更好的适应于气象序列的内部特征，以此来挖掘长时依赖关系实现预测效果的进一步提升。

17、本发明的有益效果是：本发明的预测图像中包含更多细节信息，对于局部气温值波动更为敏感。本发明能够有效地预测未来的气温分布状况，具备较好的长时预测能力，将卷积子网获取到的多个时间步的高维特征，在每个时间步上展平为一维向量，分别作为lstm循环神经单元每个时间步的输入。lstm循环神经单元通过遗忘门决定了先前序列状态保留的程度，通过输入门决定了接受到的新特征信息加入到记忆单元中的水平，以此来不断更新隐藏状态。通过这种方式，lstm循环神经单元不断调整自身内部结构，更好的适应于气象序列的内部特征，以此来挖掘长时依赖关系实现预测效果的进一步提升。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赫晓慧,李盼乐,乔梦佳,程淅杰,贺晓宇,刘宪华,杨永辉,孟玉清
技术所有人：郑州大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。