一种大气污染物浓度分析方法、装置及存储介质与流程

文档序号:32058047发布日期:2022-11-04 22:15阅读:60来源:国知局
一种大气污染物浓度分析方法、装置及存储介质与流程

1.本发明一般地涉及大气环境研究领域。更具体地,本发明涉及一种大气污染物浓度分析方法、装置及存储介质。


背景技术:

2.在大气环境研究中,为了深入了解污染成因,评估大气污染控制政策的有效性,常需要对大气污染物浓度开展趋势分析。大气污染物浓度除受排放影响外,往往还依赖于气象条件,其中气象条件与大气复合污染的发生发展紧密相关,在某些特定点位和时段气象条件对大气污染物浓度的影响甚至可能远大于排放的影响,对大气污染物浓度的时空变化具有重要贡献。由于气象条件的“干扰”作用,无法直接通过污染物绝对浓度评估排放变化趋势,使大气污染控制政策的评价变得复杂和困难。因此分离气象条件对大气污染物浓度变化的影响,从而深入了解因排放变化而导致的大气污染物浓度的“真实”变化趋势十分必要。
3.气象标准化技术是一种通过控制气象对污染物浓度的影响,评估排放导致的大气污染物浓度水平的技术。目前,已有一些针对气象条件对大气污染物浓度影响的评价方法,常见的有基于空气质量模式,利用相同清单和不同年份的气象条件开展模拟,所得模拟浓度差即为由气象条件差异导致的大气污染物浓度变化,进而估算气象条件的影响。但是,该方法较易受到排放清单和模型机理准确性的影响,且运算效率较低。还有一种方式是基于气象指数,根据历史气象资料,在确定主要影响因子的基础上对气象要素开展统计分析,计算各气象要素分指数,加和得到气象综合指数,即气象条件的影响。但气象指数通常与空气质量数据结合相对较少,且针对气象条件与大气污染物浓度的非线性响应关系考虑不足,准确性较低。
4.因此,如何解决已有技术在大气污染物浓度趋势分析过程中运算效率低、准确性低的问题,是目前亟待解决的技术问题。


技术实现要素:

5.为解决上述一个或多个技术问题,本发明提出通过机器学习的方式分离大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献。为此,本发明在如下的多个方面中提供方案。
6.在第一方面中,本发明实施例提供一种大气污染物浓度分析方法,包括:获取多个大气污染评价数据,每个所述大气污染评价数据包括:大气污染物浓度参数、气象参数和时间参数,所述时间参数用于表征污染物的排放情况;将部分或全部的所述大气污染评价数据中的每个分别作为一个训练数据输入预设机器学习模型,所述预设机器学习模型为能够进行回归预测的机器学习模型;调整所述预设机器学习模型的最优参数和最大迭代次数,直至所述预设机器学习模型针对每个所述训练数据输出的大气污染物浓度预测值与对应的大气污染物浓度参数之间的差异在预设范围内时,确定完成所述预设机器学习模型的训
练;针对每个所述大气污染评价数据,根据大气污染物浓度参数、气象参数和时间参数,以及完成训练的所述预设机器学习模型确定大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献。
7.在本发明实施例提供的一种具体实施方式中,针对每个所述大气污染评价数据,根据大气污染物浓度参数、气象参数和时间参数,以及完成训练的所述预设机器学习模型确定大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献,包括:针对每个所述大气污染评价数据,将大气污染物浓度参数、气象参数和时间参数输入完成训练的所述预设机器学习模型;利用shap算法跟踪每个所述大气污染评价数据中包括的大气污染物浓度参数、气象参数和时间参数输入完成训练的所述预设机器学习模型时的预测过程,得到大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献。
8.在本发明实施例提供的一种具体实施方式中,气象参数包括:温度参数、湿度参数、风速参数、降水参数和气压参数,时间参数包括:周期参数和时间序列;利用shap算法跟踪每个所述大气污染评价数据中包括的大气污染物浓度参数、气象参数和时间参数输入完成训练的所述预设机器学习模型时的预测过程,得到大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献,包括:利用shap算法跟踪每个所述大气污染评价数据中包括的大气污染物浓度参数、气象参数和时间参数输入完成训练的所述预设机器学习模型时的预测过程,分别得到温度参数的气象贡献、湿度参数的气象贡献、风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献,以及周期参数的非气象贡献和时间序列的非气象贡献;将得到的温度参数的气象贡献、湿度参数的气象贡献、风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献进行求和,得到大气污染物浓度参数中气象参数导致的气象贡献;将得到的周期参数的非气象贡献和时间序列的非气象贡献进行求和,得到大气污染物浓度参数中时间参数导致的非气象贡献。
9.在本发明实施例提供的一种具体实施方式中,所述周期参数包括:以预设时长为周期的参数,所述周期参数为一个或多个,不同所述周期参数对应的预设时长不同。
10.在本发明实施例提供的一种具体实施方式中,还包括:针对不同的所述大气污染评价数据,根据温度参数、湿度参数、风速参数、降水参数和气压参数的变化确定温度参数的气象贡献、湿度参数的气象贡献、风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献的变化是否符合预设规则,所述预设规则根据物理规律确定;如不符合预设规则,则重新对所述预设机器学习模型进行训练。
11.在本发明实施例提供的一种具体实施方式中,还包括:将得到的温度参数的气象贡献和湿度参数的气象贡献进行求和,得到大气污染物浓度参数中反应条件导致的气象贡献;将得到的风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献进行求和,得到大气污染物浓度参数中扩散条件导致的气象贡献。
12.在本发明实施例提供的一种具体实施方式中,所述预设机器学习模型为利用r语言中的xgboost工具包搭建的xgboost模型,利用xgb.cv函数调整所述预设机器学习模型的最优参数和最大迭代次数。
13.在本发明实施例提供的一种具体实施方式中,针对每个所述大气污染评价数据,根据大气污染物浓度参数、气象参数和时间参数,以及完成训练的所述预设机器学习模型
确定大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献,包括:针对每个所述大气污染评价数据,将大气污染物浓度参数、气象参数和时间参数输入完成训练的所述预设机器学习模型,得到大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献。
14.第二方面中,本发明实施例还提供一种大气污染物浓度分析装置,包括:获取单元,用于获取多个大气污染评价数据,每个所述大气污染评价数据包括:大气污染物浓度参数、气象参数和时间参数,所述时间参数用于表征污染物的排放情况;输入单元,用于将部分或全部的所述大气污染评价数据中的每个分别作为一个训练数据输入预设机器学习模型,所述预设机器学习模型为能够进行回归预测的机器学习模型;训练单元,用于调整所述预设机器学习模型的最优参数和最大迭代次数,直至所述预设机器学习模型针对每个所述训练数据输出的大气污染物浓度预测值与对应的大气污染物浓度参数之间的差异在预设范围内时,确定完成所述预设机器学习模型的训练;贡献确定单元,用于针对每个所述大气污染评价数据,根据大气污染物浓度参数、气象参数和时间参数,以及完成训练的所述预设机器学习模型确定大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献。
15.在本发明实施例提供的一种具体实施方式中,所述贡献确定单元包括:输入子单元和跟踪子单元;所述输入子单元,用于针对每个所述大气污染评价数据,将大气污染物浓度参数、气象参数和时间参数输入完成训练的所述预设机器学习模型;所述跟踪子单元,用于利用shap算法跟踪每个所述大气污染评价数据中包括的大气污染物浓度参数、气象参数和时间参数输入完成训练的所述预设机器学习模型时的预测过程,得到大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献。
16.在本发明实施例提供的一种具体实施方式中,气象参数包括:温度参数、湿度参数、风速参数、降水参数和气压参数,时间参数包括:周期参数和时间序列;所述跟踪子单元具体用于:利用shap算法跟踪每个所述大气污染评价数据中包括的大气污染物浓度参数、气象参数和时间参数输入完成训练的所述预设机器学习模型时的预测过程,分别得到温度参数的气象贡献、湿度参数的气象贡献、风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献,以及周期参数的非气象贡献和时间序列的非气象贡献;将得到的温度参数的气象贡献、湿度参数的气象贡献、风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献进行求和,得到大气污染物浓度参数中气象参数导致的气象贡献;将得到的周期参数的非气象贡献和时间序列的非气象贡献进行求和,得到大气污染物浓度参数中时间参数导致的非气象贡献。
17.在本发明实施例提供的一种具体实施方式中,所述周期参数包括:以预设时长为周期的参数,所述周期参数为一个或多个,不同所述周期参数对应的预设时长不同。
18.在本发明实施例提供的一种具体实施方式中,还包括:规则确定单元,用于针对不同的所述大气污染评价数据,根据温度参数、湿度参数、风速参数、降水参数和气压参数的变化确定温度参数的气象贡献、湿度参数的气象贡献、风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献的变化是否符合预设规则,所述预设规则根据物理规律确定;如不符合预设规则,则重新对所述预设机器学习模型进行训练。
19.在本发明实施例提供的一种具体实施方式中,所述贡献确定单元还用于:将得到
的温度参数的气象贡献和湿度参数的气象贡献进行求和,得到大气污染物浓度参数中反应条件导致的气象贡献;将得到的风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献进行求和,得到大气污染物浓度参数中扩散条件导致的气象贡献。
20.在本发明实施例提供的一种具体实施方式中,所述预设机器学习模型为利用r语言中的xgboost工具包搭建的xgboost模型,利用xgb.cv函数调整所述预设机器学习模型的最优参数和最大迭代次数。
21.在本发明实施例提供的一种具体实施方式中,所述贡献确定单元具体用于:针对每个所述大气污染评价数据,将大气污染物浓度参数、气象参数和时间参数输入完成训练的所述预设机器学习模型,得到大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献。
22.第三方面中,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质包括计算机程序,当所述计算机程序被执行时,实现如第一方面任一实施例所述的大气污染物浓度分析方法。
23.本发明实施例提供的一种大气污染物浓度分析方法、装置及存储介质,通过采集的大气污染评价数据训练预设机器学习模型,并利用训练完成的预设机器学习模型分离大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献,运算效率高,且充分考虑了气象参数与大气污染物浓度的非线性关系,也不受污染物源排放清单准确性的影响,准确性高。
附图说明
24.通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,并且相同或对应的标号表示相同或对应的部分,其中:
25.图1是本发明实施例提供的一种大气污染物浓度分析方法的流程示意图;
26.图2是本发明实施例提供的一种大气污染物浓度分析装置的结构示意图。
具体实施方式
27.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
28.下面结合附图来详细描述本发明的具体实施方式。
29.参见图1所示,为本发明实施例提供的一种大气污染物浓度分析方法的流程示意图。本发明实施例提供的一种大气污染物浓度分析方法包括:
30.在步骤s110中,获取多个大气污染评价数据。
31.具体地,每个大气污染评价数据可以包括:大气污染物浓度参数、气象参数和时间参数,所述时间参数用于表征污染物的排放情况。其中,大气污染浓度参数用于表征大气污染情况,气象参数用于表征气象情况,气象情况也称为气象条件。如大气污染浓度参数可以为大气中pm2.5、臭氧等的含量,气象参数可以包括温度、湿度、风速、降水、气压等参数。
32.为方便理解,这里对本发明实施例用时间参数表征或替代污染物排放情况的原因进行说明。原因如下:已有证据表明污染物排放情况通常具有一些时间特征,且这些时间特征在反映到大气污染物浓度参数中无法用气象参数解释。如在连续的或不连续的日期序列下污染物排放通常具有一定的趋势特征,又如由于天气季节变化、大气污染控制政策等原因,污染物的排放又有一些周期特征。举例来说,在某一地区,由于人们环保意识的增强或者政策等原因,污染物的排放在连续一段时间内按照一定规律下降。在另一地区,由于经济高速发展带来污染物的排放在连续一段时间内按照一定规律上升。在高纬度地区,由于冬季较寒冷,人们燃煤导致冬季的污染物浓度较高,污染物呈现以年为周期性的变化。在控制排放,如汽车限号等措施下,污染物以控制排放的周期为准周期性的变化。
33.另外,通常所说的大气污染浓度数据都是针对某一城市、某一地区而言的,且确定有对应的时段,因此本技术实施例中的每个大气污染评价数据也是实地采集的某一地区某一时段的数据,但不同的大气污染评价数据可以来源于不同地区、不同时段。还需要说明的是,不同地区的污染物排放的时间特征很可能是不一样的,在本发明实施例的技术方案中,可通过采集的某一地区的污染物排放数据分析出污染物排放数据与时间之间的关系,进而利用相应的时间参数表征污染物的排放情况。
34.在一具体实施例中,可逐日获取某一城市大气污染物浓度参数(如pm2.5、臭氧等),以及对应的气象参数,包括温度、湿度、风速、降水、气压等。同时该城市的污染物排放由于政策等原因,呈现有以星期为周期的特征,以年为周期的特征,以及按照时间序列呈现出一定特征,响应的,该城市对应的时间参数包括:日期序列中的位置、位于一年中的第几天、一周中的第几天。
35.可以理解的是,在实际应用中,还存在其他实施例,如另一城市由于限号政策是单双号限行,则时间参数中包括以两天为周期的特征。某一个大气污染评价数据中的时间参数需根据对应地区污染物排放与时间之间的关系确定。
36.在步骤s120中,将部分或全部的大气污染评价数据中的每个分别作为一个训练数据输入预设机器学习模型。
37.具体地,本发明实施例预先构建一个能够进行回归预测的机器学习模型,本发明实施例称之为预设机器学习模型,然后利用步骤s110中获取的部分大气污染评价数据或者全部的大气污染评价数据作为预设机器学习模型的训练数据对预设机器学习模型进行训练。具体使用部分还是全部的大气污染评价数据根据模型训练精度要求确定。
38.在实际应用中,预设机器模型可以为xgboost模型、随机森林模型、神经网络模型等非参数回归模型。在训练过程中,以大气污染物浓度参数作因变量,气象参数和时间参数作自变量进行训练,自变量中所有气象参数作为气象对大气污染物浓度变化的直接响应,时间参数则作为污染物排放的替代。机器学习算法为数据分析提供了经典统计模型的替代方案,其优势在于无需处理经典统计模型所需的许多假设,如样本正态性、同方差、独立性等,同时对交互效应的处理也更严谨。机器学习算法不仅对大样本数据(如大气污染评价数据)的处理更便捷,而且预测精度更高,能够基于气象参数和时间参数充分解释大气污染物浓度的变化,有利于更准确的解释气象参数对大气污染物浓度的贡献。
39.在步骤s130中,调整预设机器学习模型的最优参数和最大迭代次数,直至预设机器学习模型针对每个训练数据输出的大气污染物浓度预测值与对应的大气污染物浓度参
数之间的差异在预设范围内时,确定完成预设机器学习模型的训练。
40.具体地,将步骤s110获取的气象参数和时间参数输入预设机器学习模型,预设机器学习模型输出大气污染物浓度预测值,计算大气污染物浓度预测值与步骤s110获取的大气污染物浓度参数之前的差异,并不断调整预设机器学习模型本身的参数和迭代次数。在预设机器学习模型针对每个训练数据输出的大气污染物浓度预测值与对应的大气污染物浓度参数之间的差异在预设范围内时,确定完成预设机器学习模型的训练。其中,预设范围的实际取值可以为经验值或者标定值,选取标准为训练得到的预设机器学习模型能够准确地进行大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献的预测。其中,时间参数导致的非气象贡献也即为污染物排放导致的贡献。
41.以预设机器学习模型为xgboost模型为例,在一具体实施例中,可采用r语言中的xgboost工具包搭建xgboost模型。然后将所要分析时段和点位(城市或地区)的大气污染物浓度参数以及对应的气象参数、时间参数带入xgboost模型,然后通过xgb.cv函数选择最优参数和最优迭代次数。xgboost模型的最优参数和最优迭代次数可以使xgboost模型达到最优预测精度,即基于自变量气象参数和时间参数和因变量大气污染物浓度参数,在最优参数和最优迭代次数下预测浓度和实际浓度的误差满足预测需求,同时又不会过拟合。确定好最优参数和最优迭代次数后通过xgboost工具包构建最终的xgboost模型。显而易见的是,预设机器学习模型也可以有其他表现形式,如基于r语言deweather工具包搭建gbdt模型,对气象参数和时间参数建立回归模型,又如基于r语言rmweather工具包搭建随机森林模型,对气象参数和时间参数建立回归模型。xgb.cv函数只是获取最优参数和最优迭代次数的一种具体实施方式。其他如python等语言的工具包也可以实现寻找最优参数和最优迭代次数的功能,具体实现可参见已有技术,此处不再赘述。
42.在步骤s140中,针对每个大气污染评价数据,根据大气污染物浓度参数、气象参数和时间参数,以及完成训练的预设机器学习模型确定大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献。
43.在实际应用中,步骤s140可以存在不同的实施方式,如在本发明实施例提供的一种具体实施方式中,步骤s140可以包括:
44.针对每个大气污染评价数据,将大气污染物浓度参数、气象参数和时间参数输入完成训练的预设机器学习模型,得到大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献。
45.具体地,预设机器学习模型训练完成后,针对每个大气污染评价数据,将大气污染物浓度参数、气象参数和时间参数输入完成训练的预设机器学习模型得到大气污染浓度预测值。同时采用固定时间参数的方式从大气污染评价数据中随机选择一组气象参数的方式构建新数据样本,重复抽样若干次代入预设机器学习模型进行预测,并对所得的大气污染物浓度预测值进行平均,将预设机器学习模型输出的大气污染浓度预测值与重复抽样后得到的大气污染物浓度预测值的平均值进行对比求差值,即可得到气象标准化后该时间参数下的污染物浓度,也即得到了时间参数导致的非气象贡献,而重新抽样求平均后得到的大气污染物浓度预测值也即气象参数导致的气象贡献。其中,重复抽样的次数应使得求平均后的大气污染物浓度预测值能够准确反映气象参数导致的气象贡献,其可以是经验值。
46.在本发明实施例提供的另一种具体实施方式中,步骤s140可以包括:
47.针对每个大气污染评价数据,将大气污染物浓度参数、气象参数和时间参数输入完成训练的预设机器学习模型。
48.利用shap(shapley additive explanation,机器学习模型解释工具)算法跟踪每个大气污染评价数据中包括的大气污染物浓度参数、气象参数和时间参数输入完成训练的预设机器学习模型时的预测过程,得到大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献。
49.本发明实施例中,我们基于shap算法量化气象参数导致的气象贡献和时间参数导致的非气象贡献。shap算法是基于博亦论提出的一类可解释机器学习方法,它使用shapley值来量化每个变量对目标变量的具体贡献。
50.在本发明实施例中,假设第i个大气污染评价数据为xi,第i个大气污染评价数据的第j个参数(可以为时间参数,也可以为气象参数)为x
i,j
,预设机器学习模型对第i个大气污染评价数据所对应大气污染物浓度的预测值为yi,预设机器学习模型的基线(通常是所有大气污染物浓度参数的均值)为y
base
,那么shapley值满足以下等式:
51.yi=y
base
+f(x
i,1
)+f(x
i,2
)+

+f(x
i,k
)
52.其中,f(x
i,1
)就是第i个大气污染评价数据中第1个特征/参数对最终预测值yi的贡献值,其他依次类推,k为大气污染评价数据中气象参数加时间参数的数量。
53.需要说明的是,在实际应用中,可以将气象参数整合成一个参数,时间参数整合成一个参数,此时步骤s140只能得出整个气象参数对应的贡献值,以及整个时间参数对应的贡献值。此种方式仅能从整体上评估气象参数和时间参数对污染物浓度的贡献,无法量化单个气象要素(如温度参数、湿度参数等)在某时段内对污染物浓度的贡献大小,无法体现每个气象要素对污染物浓度的贡献在时间和空间上的异同等。
54.基于此,在本发明实施例提供的一种具体实施方式中,气象参数包括:温度参数、湿度参数、风速参数、降水参数和气压参数,时间参数包括:周期参数和时间序列。
55.相应的,利用shap算法跟踪每个大气污染评价数据中包括的大气污染物浓度参数、气象参数和时间参数输入完成训练的预设机器学习模型时的预测过程,得到大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献,包括:利用shap算法跟踪每个大气污染评价数据中包括的大气污染物浓度参数、气象参数和时间参数输入完成训练的预设机器学习模型时的预测过程,分别得到温度参数的气象贡献、湿度参数的气象贡献、风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献,以及周期参数的非气象贡献和时间序列的非气象贡献;将得到的温度参数的气象贡献、湿度参数的气象贡献、风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献进行求和,得到大气污染物浓度参数中气象参数导致的气象贡献;将得到的周期参数的非气象贡献和时间序列的非气象贡献进行求和,得到大气污染物浓度参数中时间参数导致的非气象贡献。
56.在一具体实施方式中,基于r工具包shapforxgboost中的shap.values函数,计算预设机器学习模型中每个参数对大气污染物浓度参数的贡献,以此量化单一气象要素对大气污染物浓度参数的贡献,在此基础上,基于可加性原理,将所有气象参数的贡献求和得到气象贡献,所有时间参数求和得到非气象贡献,以此达到根据污染物浓度分离气象与非气象贡献的目的。具体地,shap算法可以基于训练好的预设机器学习模型计算每个输入参数(气象参数和时间参数)的shapley值,以此来代表单个气象/时间要素的贡献。所有气象因
素(温度、湿度、风速、降水、气压等)的shapley值求和得到气象参数的气象贡献,所有时间参数的shapley值求和得到非时间参数的非气象贡献。
57.采用本发明实施例的实施方式,一方面量化了污染物浓度的气象贡献和非气象贡献,解决了分析排放变化对污染物浓度的影响时,气象条件对排放水平的干扰,从而深入了解因排放变化而导致的污染物浓度“真实”变化趋势。另一方面,明确了单一气象要素对污染物浓度的贡献,量化不同时间和空间尺度上气象要素对污染物浓度贡献的异同,为城市、区域等不同空间尺度上开展气象标准化前后污染物浓度的长期(年际)和短期(季节、重点时段)变化,量化气象贡献提供了重要的分析工具,为大气污染控制政策的制定提供更精准、科学的依据。
58.在本发明实施例提供的一种具体实施方式中,周期参数包括:以预设时长为周期的参数,周期参数为一个或多个,不同周期参数对应的预设时长不同。在实际使用中,具体的周期参数的个数和对应的预设时长根据实际情况确定。比如,在某一城市,政府以月、星期为周期分别制定了限行、限排措施,则周期参数可以包括以月为周期的参数,以星期为周期的参数。又如,在另一城市,政府以单双号为周期制定了限行、限排措施,则周期参数可以包括以两天为周期的参数。
59.考虑到对已有数据来说,由于采集的大气污染评价数据的不确定性等原因,存在预设机器学习模型虽输出了准确的气象参数导致的气象贡献和时间参数导致的非气象贡献,但模型本身的机理并不合理。后续将不适用于其他采集的大气污染评价数据。为此,在本发明实施例提供的一种具体实施方式中,在图1所示实施例的基础上,还可以包括:
60.针对不同的大气污染评价数据,根据温度参数、湿度参数、风速参数、降水参数和气压参数的变化确定温度参数的气象贡献、湿度参数的气象贡献、风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献的变化是否符合预设规则,预设规则根据物理规律确定;如不符合预设规则,则重新对预设机器学习模型进行训练。
61.本发明实施例根据具体的物理规律设定了温度参数、湿度参数、风速参数、降水参数和气压参数等各参数的预设规则,以判断基于预设机器学习模型得到的各参数的气象贡献是否合理,进而对预设机器学习模型的合理性进行了评估,在预设机器学习模型不合理时,重新对预设机器学习模型进行训练,以得到更为合理的预设机器学习模型。
62.在本发明实施例提供的一种具体实施方式中,还包括:
63.将得到的温度参数的气象贡献和湿度参数的气象贡献进行求和,得到大气污染物浓度参数中反应条件导致的气象贡献;
64.将得到的风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献进行求和,得到大气污染物浓度参数中扩散条件导致的气象贡献。
65.本发明实施例的实施方式,根据各气象要素对大气污染物浓度影响机理的不同,将气象参数的贡献进行进一步分解,分解为反应条件和扩散条件,来细化分析气象参数对大气污染物浓度的影响。
66.在本发明实施例提供的一种具体实施方式中,所述预设机器学习模型为利用r语言中的xgboost工具包搭建的xgboost模型,利用xgb.cv函数调整所述预设机器学习模型的最优参数和最大迭代次数。
67.本发明实施例提供的一种大气污染物浓度分析方法,通过采集的大气污染评价数
据训练预设机器学习模型,并利用训练完成的预设机器学习模型分离大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献,运算效率高,且充分考虑了气象参数与大气污染物浓度的非线性关系,也不受污染物源排放清单准确性的影响,准确性高。
68.与前述方法实施例对应,参见图2所示,本发明实施例还提供一种大气污染物浓度分析装置,包括:获取单元210、输入单元220、训练单元230和贡献确定单元240。
69.获取单元210用于获取多个大气污染评价数据,每个所述大气污染评价数据包括:大气污染物浓度参数、气象参数和时间参数,所述时间参数用于表征污染物的排放情况。
70.输入单元220用于将部分或全部的所述大气污染评价数据中的每个分别作为一个训练数据输入预设机器学习模型,所述预设机器学习模型为能够进行回归预测的机器学习模型。
71.训练单元230用于调整所述预设机器学习模型的最优参数和最大迭代次数,直至所述预设机器学习模型针对每个所述训练数据输出的大气污染物浓度预测值与对应的大气污染物浓度参数之间的差异在预设范围内时,确定完成所述预设机器学习模型的训练。
72.贡献确定单元240用于针对每个所述大气污染评价数据,根据大气污染物浓度参数、气象参数和时间参数,以及完成训练的所述预设机器学习模型确定大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献。
73.本发明实施例提供的一种大气污染物浓度分析装置,通过采集的大气污染评价数据训练预设机器学习模型,并利用训练完成的预设机器学习模型分离大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献,运算效率高,且充分考虑了气象参数与大气污染物浓度的非线性关系,也不受污染物源排放清单准确性的影响,准确性高。
74.在本发明实施例提供的一种具体实施方式中,所述贡献确定单元240包括:输入子单元和跟踪子单元。
75.所述输入子单元,用于针对每个所述大气污染评价数据,将大气污染物浓度参数、气象参数和时间参数输入完成训练的所述预设机器学习模型。
76.所述跟踪子单元,用于利用shap算法跟踪每个所述大气污染评价数据中包括的大气污染物浓度参数、气象参数和时间参数输入完成训练的所述预设机器学习模型时的预测过程,得到大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献。
77.在本发明实施例提供的一种具体实施方式中,气象参数包括:温度参数、湿度参数、风速参数、降水参数和气压参数,时间参数包括:周期参数和时间序列。
78.所述跟踪子单元具体用于:利用shap算法跟踪每个所述大气污染评价数据中包括的大气污染物浓度参数、气象参数和时间参数输入完成训练的所述预设机器学习模型时的预测过程,分别得到温度参数的气象贡献、湿度参数的气象贡献、风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献,以及周期参数的非气象贡献和时间序列的非气象贡献;将得到的温度参数的气象贡献、湿度参数的气象贡献、风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献进行求和,得到大气污染物浓度参数中气象参数导致的气象贡献;将得到的周期参数的非气象贡献和时间序列的非气象贡献进行求和,得到
大气污染物浓度参数中时间参数导致的非气象贡献。
79.在本发明实施例提供的一种具体实施方式中,所述周期参数包括:以预设时长为周期的参数,所述周期参数为一个或多个,不同所述周期参数对应的预设时长不同。
80.在本发明实施例提供的一种具体实施方式中,还包括:规则确定单元,用于针对不同的所述大气污染评价数据,根据温度参数、湿度参数、风速参数、降水参数和气压参数的变化确定温度参数的气象贡献、湿度参数的气象贡献、风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献的变化是否符合预设规则,所述预设规则根据物理规律确定;如不符合预设规则,则重新对所述预设机器学习模型进行训练。
81.在本发明实施例提供的一种具体实施方式中,所述贡献确定单元240还用于:将得到的温度参数的气象贡献和湿度参数的气象贡献进行求和,得到大气污染物浓度参数中反应条件导致的气象贡献;将得到的风速参数的气象贡献、降水参数的气象贡献和气压参数的气象贡献进行求和,得到大气污染物浓度参数中扩散条件导致的气象贡献。
82.在本发明实施例提供的一种具体实施方式中,所述预设机器学习模型为利用r语言中的xgboost工具包搭建的xgboost模型,利用xgb.cv函数调整所述预设机器学习模型的最优参数和最大迭代次数。
83.在本发明实施例提供的一种具体实施方式中,所述贡献确定单元240具体用于:针对每个所述大气污染评价数据,将大气污染物浓度参数、气象参数和时间参数输入完成训练的所述预设机器学习模型,得到大气污染物浓度参数中气象参数导致的气象贡献和时间参数导致的非气象贡献。
84.与前述方法实施例对应,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质包括计算机程序,当所述计算机程序被执行时,实现如前述任一方法实施例所述的大气污染物浓度分析方法。
85.在本说明书的上述描述中,除非另有明确的规定和限定,术语“固定”、“安装”、“相连”或“连接”等术语应该做广义的理解。例如,就术语“连接”来说,其可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,或者可以是两个元件内部的连通或两个元件的相互作用关系。因此,除非本说明书另有明确的限定,本领域技术人员可以根据具体情况理解上述术语在本发明中的具体含义。
86.根据本说明书的上述描述,本领域技术人员还可以理解如下使用的术语,例如“上”、“下”、“前”、“后”、“左”、“右”、“长度”、“宽度”、“厚度”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“轴向”、“径向”、“周向”、“中心”、“纵向”、“横向”、“顺时针”或“逆时针”等指示方位或位置关系的术语是基于本说明书的附图所示的方位或位置关系的,其仅是为了便于阐述本发明的方案和简化描述的目的,而不是明示或暗示所涉及的装置或元件必须要具有所述特定的方位、以特定的方位来构造和进行操作,因此上述的方位或位置关系术语不能被理解或解释为对本发明方案的限制。
87.另外,本说明书中所使用的术语“第一”或“第二”等用于指代编号或序数的术语仅用于描述目的,而不能理解为明示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”或“第二”的特征可以明示或者隐含地包括至少一个该特征。在本说明书的描述中,“多个”的含义是至少两个,例如两个,三个或更多个等,除非另有明确具体
的限定。
88.虽然本说明书已经示出和描述了本发明的多个实施例,但对于本领域技术人员显而易见的是,这样的实施例只是以示例的方式提供的。本领域技术人员会在不偏离本发明思想和精神的情况下想到许多更改、改变和替代的方式。应当理解的是在实践本发明的过程中,可以采用对本文所描述的本发明实施例的各种替代方案。所附权利要求书旨在限定本发明的保护范围,并因此覆盖这些权利要求范围内的模块组成、等同或替代方案。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1