一种基于LSTM深度学习的大气污染预测方法及系统

文档序号:33295748发布日期:2023-02-28 21:25阅读:53来源:国知局
一种基于LSTM深度学习的大气污染预测方法及系统
一种基于lstm深度学习的大气污染预测方法及系统
技术领域
1.本发明属于大气环境预测领域,尤其涉及一种基于lstm深度学习的大气污染预测方法及系统。


背景技术:

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
3.随着工业发展,空气污染问题日益加剧,空气污染给人们的生活工作带来严重影响,对空气质量进行监测与预测,并及时进行告警,并根据预测结果进行提前预防和治理,有助于提升大气污染治理的针对性和效果。
4.现在的空气污染质量预测主要是采用大气模型进行预测,关注于一种大气污染物,对其进行单任务预测;随着机器学习的发展,也出现了使用机器学习进行大气污染的预测,部分预测系统采用单独使用某种算法或者多种智能算法结合来预测污染情况,存在预测不精准,气象参数使用不充分、无法有效使用实时观测数值进行预测等问题。
5.lstm(长短期记忆网络)深度学习是一种时间递归神经网络(rnn),专门用于处理序列性数据的神经网络,有效解决了长序列训练过程中的梯度消失和梯度爆炸问题,lstm能够在时间序列预测序列中有更好的表现。


技术实现要素:

6.为克服上述现有技术的不足,本发明提供了一种基于lstm深度学习的大气污染预测方法及系统,将大气观测历史数据,充分结合气象历史数据和预测气象数据,并采用实时观测值参与预测,增加了大气污染指数aqi和首要污染物数值预测的准确性。
7.为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
8.本发明第一方面提供了一种基于lstm深度学习的大气污染预测方法。
9.一种基于lstm深度学习的大气污染预测方法,包括:
10.获取气象历史数据、大气观测历史数据、预测气象数据和实时观测数据;
11.对获取的数据进行预处理;
12.确定lstm网络结构;
13.利用预处理后的数据对lstm网络进行训练并调优,得到训练好的lstm网络;
14.利用训练好的lstm网络进行预测,获得预测结果。
15.本发明第二方面提供了一种基于lstm深度学习的大气污染预测系统。
16.一种基于lstm深度学习的大气污染预测系统,包括:
17.数据获取模块,被配置为:获取气象历史数据、大气观测历史数据、预测气象数据和实时观测数据;
18.数据预处理模块,被配置为:对获取的数据进行预处理;
19.网络结构确定模块,被配置为:确定lstm网络结构;
20.训练模块,被配置为:利用预处理后的数据对lstm网络进行训练并调优,得到训练好的lstm网络;
21.预测模块,被配置为:利用训练好的lstm网络进行预测,获得预测结果。
22.本发明第三方面提供了计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本发明第一方面所述的基于lstm深度学习的大气污染预测方法中的步骤。
23.本发明第四方面提供了电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明第一方面所述的基于lstm深度学习的大气污染预测方法中的步骤。
24.以上一个或多个技术方案存在以下有益效果:
25.(1)本发明充分利用天气预报的预测气象参数,将大气观测历史数据,充分结合气象历史数据,并采用实时观测值参与预测,对预测空气质量因子aq i以及相应的大气污染物浓度、首要污染物进行预测,提高了预测的可靠性和准确性。
26.(2)本发明利用lstm深度学习算法对aq i、污染物以及首要污染物进行预测,lstm能够存储重要的过去信息,而忘记不重要的信息,能够有效缓解递归神经网络中刻画长距离依存关系中常常面临的梯度消失问题。
27.(3)本发明通过将实时观测数据增加进预测模型进行预测,提升预测的准确性。
28.(4)本发明利用rmse损失函数对lstm网络进行调优,进一步提升了预测的准确性。
29.(5)本发明在设定的时间后对模型进行重新训练,并将新观测的数据加入训练样本,使训练的网络模型更符合本地实际情况。
30.本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
31.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
32.图1为第一个实施例的方法流程图。
33.图2为第二个实施例的系统结构图。
34.图3是本发明lstm网络以及输入门、遗忘门、输出门和记忆细胞的结构示意图,其中x
t
为输入、h
t
为输出,a为lstm的模块。
具体实施方式
35.应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
36.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。
37.在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
38.本发明的设计初衷是为了解决现有技术中使用机器学习进行大气污染的预测时预测不精准、气象参数使用不充分、无法有效使用实时观测数值进行预测的问题,同时针对
本发明长序列数据的处理容易出现的梯度消失和梯度爆炸问题。
39.针对以上问题,本发明对lstm神经网络进行训练并调优,并利用训练好的lstm神经网络进行预测,得到了更加精准和可靠的预测效果。
40.lstm通过引入特别设计的结构和单元(记忆单元、门单元),有效缓解了递归神经网络中刻画长距离依存关系中常常面临的梯度消失问题。lstm能够存储重要的过去信息,而忘记不重要的信息。如图3所示,lstm有三个门:
41.输入门i nput gate:输入门将信息添加到细胞状态;
42.遗忘门forget gate:删除模型不再需要的信息;
43.输出门output gate:选择要显示的信息作为输出。
44.lstm在rnn结构基础上添加了各层的门节点。门有3类:遗忘阀门(forget gate),输入阀门(i nput gate)和输出阀门(output gate)。这些阀门可以打开或关闭,用于判断模型网络的记忆态,即之前网络的状态。判断该层输出的结果是否达到阈值从而决定是否将其加入到当前该层的计算中。
45.lstm模型的记忆功能就是由这些阀门节点实现的。当阀门打开的时候,前面模型的训练结果就会关联到当前的模型计算,而当阀门关闭的时候之前的计算结果就不再影响当前的计算。因此,通过调节阀门的开关我们就可以实现早期序列对最终结果的影响。
46.如图3所示,阀门节点利用s igmoid函数将网络的记忆态作为输入计算,如果输出结果达到阈值则将该阀门输出与当前层的的计算结果相乘(此处为矩阵相乘)作为下一层的输入;如果没有达到阈值则将该输出结果遗忘掉。阀门节点的权重会在每一次模型反向传播训练过程中更新。
47.实施例一
48.本实施例公开了一种基于lstm深度学习的大气污染预测方法。
49.如图1所示,一种基于lstm深度学习的大气污染预测方法,包括:
50.获取气象历史数据、大气观测历史数据、预测气象数据和实时观测数据;
51.对获取的数据进行预处理;
52.确定lstm网络结构;
53.利用预处理后的数据对lstm网络进行训练并调优,得到训练好的lstm网络;
54.利用训练好的lstm网络进行预测,获得预测结果。
55.在本实施例中,基于lstm深度学习的大气污染预测方法具体包括以下步骤:
56.步骤1:数据准备。
57.将气象历史数据和大气观测历史数据中的常量特征的值,例如日期、时间等删除,并记录好各个数据的顺序;删除重复数值;将数据中的缺失值进行拉格朗日填充或其它数值填充法填充(例如牛顿法、均值填充等),避免缺失值影响预测结果;
58.步骤2:数据的编码。
59.将存储的气象历史数据中的风向和大气观测历史数据中的首要污染物等非数值数据,通过one-hot进行编码。
60.步骤3:确定网络架构。
61.创建一个lstm网络,该lstm网络包含一个输入层和一个输出层,以及具有n个隐藏单元的lstm层,m个的全连接层和一个丢弃概率为p的丢弃层,n、m、p可以根据实际情况选
取。
62.使用si gmoi d函数作为连接函数,该函数可将任意范围内的输入值映射到(0,1)范围内。si gmoi d函数具体为:
[0063][0064]
其中,x为输入值。
[0065]
本发明的输入层采用11个神经元,其中包含5个气象参数和6个空气质量参数。其中,5个气象参数分别为温度、气压、湿度、风向、风速。6个空气质量参数为pm2.5、pm10、so2、co、no2、o3。
[0066]
输出层采用7个神经元,7个神经元包含6个空气质量参数和1个空气质量因子参数aq i。其中,6个空气质量参数pm2.5、pm10、so2、co、no2、o3。
[0067]
指定训练选项,确定求解器,采用自适应矩估计(adam)求解器;指定学习率;防止梯度爆炸,确定梯度阈值。
[0068]
步骤4:产生训练样本和测试样本。
[0069]
将气象历史数据、大气观测历史数据、实时观测数据以及后一个时间点的预测气象数据作为输入特征序列。按照设定比例划分训练样本和测试样本。
[0070]
步骤5:使用训练样本数据进行网络训练。
[0071]
步骤6:对网络进行调优。
[0072]
利用rmse(均方根)误差函数进行误差计算,rmse误差损失函数为:
[0073][0074]
其中,xi是目标输出,是使用测试样本数据的预测输出。
[0075]
步骤7:进行预测。
[0076]
利用训练好的lstm网络进行数据预测,预测结果为首要污染物、大气污染指数以及大气污染数据预测值。将数据转换为one-hot编码之前的非数值数据。
[0077]
步骤8:对模型进行定时更新。
[0078]
根据各个区域的大气污染治理效果,可以对模型每隔一定时间,譬如一个月的时间,进行重新训练,并将新观测的数据加入训练样本,以便使训练的网络模型更符合本地实际情况。
[0079]
本实施例采用北方某城市的大气观测历史数据和气象历史数据为具体实例,以7410组时间序列大气污染数据、aq i、首要污染物和相应天气数据为例,其中的7000组作为训练数据,410组作为测试验证数据。利用前一个小时的首要污染物、大气污染参数、天气参数和下一个小时的预测气象数据来预测下一个小时的首要污染物、aq i指数、大气污染参数。
[0080]
s1.数据预处理。
[0081]
根据2012年国家出版的《环境空气质量指数(aq i)技术规范(试行)》(hj633-2012)规定,对aq i为251-300时为严重污染,因此,对训练样本和测试样中aq i大于300的
数值,统一归一化为300。
[0082]
对首要污染物和天气中的风向进行one-hot编码。
[0083]
对观测数据中的缺失数据进行补充,本实施例中采用滑动窗对缺失值进行填充,采用了窗口长度为30的移动均值填充缺失数据。对长期缺失的数据进行删除操作,确保数据的完整性,以避免影响模型的建立。
[0084]
s2.设置lstm深度学习的相关参数。
[0085]
本实施例输入特征为32(其中首要污染物6个,aq i为1个,大气参数6个,天气参数19个),第二天的天气预测参数19个,合计输入51个特征因子。
[0086]
输出为首要污染物6个,aq i 1个,大气参数6个,合计13个输出因子。
[0087]
隐藏单元200个;全连接层网元50个,丢弃层的丢弃率0.5;学习率为0.01,求解器采用adam,以大小为20的小批量进行60轮训练。
[0088]
s3.训练网络并进行预测。
[0089]
对网络进行训练,并用训练好的网络进行预测。将首要污染物进行one-hot反馈回原来的污染物,对小于0的调整为0,大于0的保持为预测数值,并根据大小确定首要污染物。
[0090]
本实施例的实际值与预测值的对比如下:
[0091][0092]
由以上对比结果可以看出,预测值的首要污染物为pm2.5,与实际值一致;aq i预测值为153,而实际值为152;对大气污染的6个污染物种类数值同时进行了预测,同样获得了较高的预测准确度。
[0093]
实施例二
[0094]
本实施例公开了一种基于lstm深度学习的大气污染预测系统。
[0095]
如图2所示,一种基于lstm深度学习的大气污染预测系统,包括:
[0096]
数据获取模块,被配置为:获取气象历史数据、大气观测历史数据、预测气象数据和实时观测数据;
[0097]
数据预处理模块,被配置为:对获取的数据进行预处理;
[0098]
网络结构确定模块,被配置为:确定lstm网络结构;
[0099]
训练模块,被配置为:利用预处理后的数据对lstm网络进行训练并调优,得到训练好的lstm网络;
[0100]
预测模块,被配置为:利用训练好的lstm网络进行预测,获得预测结果。
[0101]
实施例三
[0102]
本实施例的目的是提供计算机可读存储介质。
[0103]
计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例1所述的基于lstm深度学习的大气污染预测方法中的步骤。
[0104]
实施例四
[0105]
本实施例的目的是提供电子设备。
[0106]
电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例1所述的基于lstm深度学习的大气污染预测方法中的步骤。
[0107]
以上实施例二、三和四的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
[0108]
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
[0109]
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1