本发明属于空气质量预测领域,具体涉及一种融合不同域数据特征的空气质量预测方法。
背景技术:
1、空气污染已成为全球人口所面临的紧迫环境问题,尤其对发展中国家而言,空气质量是民生关切的重要问题。近年来,社会的进步和工业快速发展导致了严重的环境污染问题,尤其是空气污染的加剧,主要表现为空气中可吸入颗粒物(pm2.5和pm10)的增加,对人体健康和生活环境产生严重影响。空气质量的好坏能够反映环境的污染程度,而准确的空气质量预测可以提供及时的空气质量警报,帮助相关部门干预高污染事件守护人们的健康,人们可以参考空气质量预测选择合适的户外活动时间与地址。因此,分析和预测空气质量对减少污染物以及降低污染物对人体的伤害具有重要意义,也一定程度能够帮助国家更好实现碳中和目标。
2、现有的空气质量预报方法主要分为数值分析法和统计预报法。数值分析法适用于大尺度区域的预报,并具有揭示污染机理的优势。然而,该方法的预报成本高,对所需数据的要求较为严格,并且无法实现实时在线空气质量预报。统计预报法适用于短期和小范围的预报任务,具有低成本的优势。然而,该方法无法满足长期空气质量预报的需求,并且预报精度较低。传统的预测方法在处理非线性和非平稳的空气质量数据时精度较低,同时空气质量受多种因素影响,具有不确定性和复杂性,传统的人工神经网络、反向传播神经网络和回归预测方法难以准确预测和学习不同空气质量指标之间的内部规律。
3、近年来,人工智能和机器学习等方法在环境保护和空气质量预报领域得到广泛应用,成为全球环保领域的研究热点和发展趋势。深度学习方法作为一种新兴的机器学习算法,通过对大量数据进行学习,发现其中的内在特征,从而提高分类和预测的准确性。相比传统的人工神经网络和支持向量机等机器学习模型,基于深度学习的预测模型在数据特征捕获和预测精度方面表现更好。深度学习技术在提取序列数据中的时序信息方面具有优势,相比传统机器学习方法,能够提高预测精度。但目前基于深度学习的空气质量预测方法通常在一个域中进行建模,缺乏对不同域特征融合的探索。
技术实现思路
1、针对现有技术存在的不足,本发明提出了一种融合不同域数据特征的空气质量预测方法,该方法包括:实时获取空气质量数据和气象数据,对空气质量数据和气象数据进行预处理,得到输入数据,将输入数据输入到训练好的空气质量预测模型中,得到空气质量预测结果;
2、空气质量预测模型的训练过程包括:
3、s1:获取空气质量数据和气象数据,对空气质量数据和气象数据进行预处理,得到输入数据;
4、s2:对输入数据作stft处理,得到时频特征,将时频特征输入到第一复数时频模块中进行处理,得到时频特征掩蔽,将输入数据和时频特征掩蔽相乘得到第一特征向量;
5、s3:采用时域模块对输入数据进行处理,得到时域特征向量;对时域特征向量作stft处理,得到第二特征向量;
6、s4:采用通道注意力机制对时频特征、第一特征向量和第二特征向量进行处理,得到融合特征;
7、s5:将融合特征输入到第二复数时频模块中进行处理,得到第二时频特征;将输入向量和第二时频特征相乘,对相乘结果作istft处理,得到空气质量预测结果;
8、s6:计算模型总损失并根据模型总损失调整模型参数,得到训练好的空气质量预测模型。
9、优选的,空气质量数据包括pm2.5、pm10、so2、no2、o3、co六种大气污染物浓度数据;气象数据包括降水量、风速、风向、气压、气温和湿度六种数据。
10、优选的,对空气质量数据和气象数据进行预处理的过程包括:采用线性插值法对空气质量数据和气象数据中的缺失值进行填充;对填充后的数据进行归一化处理,得到输入数据。
11、优选的,复数时频模块包括依次设置的六个编码器、两个lstm层、全连接层和六个解码器;编码器由卷积层、批归一化层和激活函数组成,解码器由反卷积层、批归一化层和激活函数组成;复数时频模块的输入与最后一个解码器的输出相乘作为复数时频模块的输出;复数时频模块还包括跳跃连接。
12、进一步的,跳跃连接的方式为:第一个编码器输出与第五个解码器输出采用跳跃连接融合,第二个编码器输出与第四个解码器输出采用跳跃连接融合,第三个编码器输出与第三个解码器输出采用跳跃连接融合,第四个编码器输出与第二个解码器输出采用跳跃连接融合,第五个编码器输出与第一个解码器输出采用跳跃连接融合,第六个编码器输出与全连接层的输出采用跳跃连接融合。
13、优选的,时域模块包括12个下采样块、两个卷积层、12个上采样块、13个concat层;第一个卷积层位于最后一个下采样块和第一个上采样块之间,第二个卷积层位于最后一个上采样块后;每个下采样块均由卷积层和下采样层组成,每个上采样块均由卷积层和上采样层组成;concat层用于拼接下采样块的输出与其对应倒序的上采样块的输出。
14、优选的,通道注意力机制对时频特征、第一特征向量和第二特征向量进行处理表示为:
15、g(x)=β(conv2(re(β(conv1(g(x))))))
16、l(x)=β(conv2(re(β(conv1(x)))))
17、
18、其中,g(x)表示全局通道上下文信息,l(x)表示局部通道上下文信息,β表示批归一化操作,g()表示全局平均池化,conv1表示第一卷积操作,conv2表示第二卷积操作,x表示将第一特征向量、时频特征和第二特征向量在通道维度拼接后的特征向量;表示逐元素乘法,表示广播加法,sig表示sigmoid函数,表示融合特征。
19、优选的,总损失为时域模块和两个复数时频模块的均方误差损失之和。
20、本发明的有益效果为:本发明设计复数时频模块和时域模块,将对空气质量数据和气象数据的时域特征和时频特征进行融合,同时考虑数据的时域和频域信息,融合了不同域的特征,使得空气质量预测模型可以更好学习到空气质量数据的深层特征,提高了模型预测结果的准确性,从而获得更好的预测结果。
1.一种融合不同域数据特征的空气质量预测方法,其特征在于,包括:实时获取空气质量数据和气象数据,对空气质量数据和气象数据进行预处理,得到输入数据,将输入数据输入到训练好的空气质量预测模型中,得到空气质量预测结果;
2.根据权利要求1所述的一种融合不同域数据特征的空气质量预测方法,其特征在于,所述空气质量数据包括pm2.5、pm10、so2、no2、o3、co六种大气污染物浓度数据;气象数据包括降水量、风速、风向、气压、气温和湿度六种数据。
3.根据权利要求1所述的一种融合不同域数据特征的空气质量预测方法,其特征在于,对空气质量数据和气象数据进行预处理的过程包括:采用线性插值法对空气质量数据和气象数据中的缺失值进行填充;对填充后的数据进行归一化处理,得到输入数据。
4.根据权利要求1所述的一种融合不同域数据特征的空气质量预测方法,其特征在于,所述复数时频模块包括依次设置的六个编码器、两个lstm层、全连接层和六个解码器;编码器由卷积层、批归一化层和激活函数组成,解码器由反卷积层、批归一化层和激活函数组成;复数时频模块的输入与最后一个解码器的输出相乘作为复数时频模块的输出;复数时频模块还包括跳跃连接。
5.根据权利要求4所述的一种融合不同域数据特征的空气质量预测方法,其特征在于,跳跃连接的方式为:第一个编码器输出与第五个解码器输出采用跳跃连接融合,第二个编码器输出与第四个解码器输出采用跳跃连接融合,第三个编码器输出与第三个解码器输出采用跳跃连接融合,第四个编码器输出与第二个解码器输出采用跳跃连接融合,第五个编码器输出与第一个解码器输出采用跳跃连接融合,第六个编码器输出与全连接层的输出采用跳跃连接融合。
6.根据权利要求1所述的一种融合不同域数据特征的空气质量预测方法,其特征在于,所述时域模块包括12个下采样块、两个卷积层、12个上采样块、13个concat层;第一个卷积层位于最后一个下采样块和第一个上采样块之间,第二个卷积层位于最后一个上采样块后;每个下采样块均由卷积层和下采样层组成,每个上采样块均由卷积层和上采样层组成;concat层用于拼接下采样块的输出与其对应倒序的上采样块的输出。
7.根据权利要求1所述的一种融合不同域数据特征的空气质量预测方法,其特征在于,通道注意力机制对时频特征、第一特征向量和第二特征向量进行处理表示为:
8.根据权利要求1所述的一种融合不同域数据特征的空气质量预测方法,其特征在于,所述模型总损失为时域模块和两个复数时频模块的均方误差损失之和。