近地面臭氧空间分布的估算方法、装置、介质及设备与流程

文档序号:23221938发布日期:2020-12-08 15:04阅读:301来源:国知局
近地面臭氧空间分布的估算方法、装置、介质及设备与流程

本发明实施例涉及卫星遥感技术领域,尤其涉及一种近地面臭氧空间分布的估算方法、装置、介质及设备。



背景技术:

随着科学技术的发展,遥感技术已经成为天气、气象、环境空气质量以及其他空间现象最主要的探测技术。大气臭氧只占空气各组份的几百万分之一,却对全球气候和环境变化产生重要影响,因此采用遥感技术探测臭氧浓度也是近年来比较火热的议题。目前,比如常用的两种臭氧探测方式包括热红外遥感探测和紫外遥感探测。

热红外遥感的臭氧探测技术主要是基于9.6微米附件的一组波段反演获得臭氧总量和臭氧廓线,这是现有的比较成熟的技术。进一步也可基于热红外遥感反演的臭氧廓线,把对流层臭氧总量和近地面臭氧含量提取出来。但由于热红外遥感受地表热辐射对底层大气热辐射的影响,以及底层大气臭氧热辐射信号在上行辐射传输过程中,会被中高层大气吸收一部分,使近地面臭氧反演结果存在较大的不确定性,无法将热红外遥感反演的近地面臭氧直接用于环境空气质量监测。

紫外波段是臭氧吸收最强的光谱范围,利用紫外波段的卫星遥感探测数据,可以通过差分吸收光谱算法反演获得臭氧柱总量,亦可以通过最优化反演算法获得平流层臭氧廓线。但由于平原地区太阳紫外线很难到达大气底层,所以紫外卫星遥感技术无法满足环境空气质量对近地面臭氧浓度监测的需求。



技术实现要素:

本发明实施例提供一种近地面臭氧空间分布的估算方法、装置、介质及设备,可以实现通过预先训练好的机器学习模型,对近地面臭氧的空间分布进行精准预测的效果。

第一方面,本发明实施例提供了一种近地面臭氧空间分布的估算方法,该方法包括:

获取特征数据;所述特征数据包括实时采集的公里网格化的气象数据和卫星遥感的栅格数据;

将所述特征数据输入至预先训练的神经网络模型,得到所述神经网络模型的输出结果;

根据所述输出结果,确定近地面臭氧空间分布的估算结果。

进一步的,在获取特征数据之后,所述方法还包括:

对所述特征数据按照预设网格化规则进行网格化处理,得到网格化后的单点数据;

相应的,将所述特征数据输入至预先训练的神经网络模型,包括:

将所述单点数据输入至预先训练的神经网络模型。

进一步的,所述神经网络模型的训练过程包括:

从预先设置的采样点获取样本数据;其中,所述样本数据包括气象数据和卫星遥感数据,所述气象数据包括2m气温、2m比湿、10m风速、2m地面气压、降水以及短波辐射中的六种;所述卫星遥感数据包括o3对流层柱浓度、co柱浓度、no2柱浓度和甲醛柱浓度中的四种;

将所述样本数据进行预处理,并将预处理后的样本数据分为训练集和测试集;

采用训练集的样本数据输入至初始神经网络模型的输入层,以对所述初始神经网络模型进行训练,得到目标神经网络模型;其中,所述初始神经网络模型的网络架构是预先确定的;

对测试集的样本数据进行网格化处理,并将网格化样本数据的特征输入至所述目标神经网络模型,以对所述目标神经网络模型的输出结果进行测试;

若测试为收敛,则确定目标神经网络模型训练完成。

进一步的,所述初始神经网络模型的网络架构包括:输入层,第一卷积层,第一池化层,第二卷积层,第二池化层,全连接层以及输出层。

进一步的,所述第一卷积层和所述第二卷积层的卷积核大小为3×3,步长为1;

所述第一池化层和所述第二池化层为最大池化层;所述第一池化层和所述第二池化层的窗口大小为3×3,步长为2。

进一步的,所述将所述样本数据进行预处理,包括:

将所述样本数据中的气象数据由nc数据格式转换为csv数据格式;以及,将卫星遥感数据由txt数据格式转换为csv数据格式。

进一步的,根据所述输出结果,确定近地面臭氧空间分布的估算结果,包括:

获取所述神经网络模型的输出结果,并采用预设图像处理程序,对所述输出结果进行网格化分布成图。

第二方面,本发明实施例还提供了一种近地面臭氧空间分布的估算装置,该装置包括:

特征数据获取模块,用于获取特征数据;所述特征数据包括实时采集的气象数据和卫星遥感数据;

数据处理模块,用于将所述特征数据输入至预先训练的神经网络模型,得到所述神经网络模型的输出结果;

估算结果确定模块,用于根据所述输出结果,确定近地面臭氧空间分布的估算结果。

第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例所述的近地面臭氧空间分布的估算方法。

第四方面,本申请实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例所述的近地面臭氧空间分布的估算方法。

本申请实施例所提供的技术方案,获取特征数据;所述特征数据包括实时采集的气象数据和卫星遥感数据;将所述特征数据输入至预先训练的神经网络模型,得到所述神经网络模型的输出结果;根据所述输出结果,确定近地面臭氧空间分布的估算结果。通过采用本申请所提供的技术方案,可以实现通过预先训练好的机器学习模型,对臭氧的空间分布进行精准预测的效果。

附图说明

图1是本发明实施例一提供的近地面臭氧空间分布的估算方法的流程图;

图2是本申请实施例一提供的全连接网络模块的示意图;

图3是本发明实施例二提供的近地面臭氧空间分布的估算装置的结构示意图;

图4是本申请实施例四提供的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

本申请提供的技术方案,搜集并评估臭氧前体物和辐射光通量气象要素对臭氧的敏感性。

具体的,由于光化学烟雾的臭氧生成与太阳辐射等气象参数有关外,还与氮氧化物和发挥性有机物等前体物等存在非线性关系,而且不同地区的臭氧形成机制存在差异,所以需要针对不同地区开展臭氧影响因素的敏感性评估,并搜集足够的观测样本,为臭氧的智能算法打好基础。

另外,基于大数据集的近地面臭氧深度学习训练与算法验证。

具体的,利用与臭氧比较敏感的大数据集,和基于国控站点获得的同时期的近地面臭氧浓度值,然后研发基于机器学习神经元网络架构,训练神经元网络系数,形成适合于本地区近地面臭氧的机器学习算法。然后利用大数据集中未参入算法训练的一组数据,对积极学习算法进行精读验证与误差评价。

在区域尺度上国内外对于近地面臭氧的卫星遥感监测没有有效的手段。目前,基于热红外遥感探测获得的臭氧垂直分布由于大气底层信号探测的不确定较大,近地面臭氧的精度无法支撑空气质量的需求;基于紫外遥感探测手段主要用于整层大气臭氧的探测,以及平流层臭氧探测,无法获得近地面臭氧浓度。所以,本申请提案和已有的臭氧探测算法相比,可以克服两种卫星遥感探测的缺陷,从大数据中找出臭氧估算的有效方法。由于人工神经元网络算法的多元和多层结构的非线形特征,可以很好的刻画臭氧生成机制的非线形特征。经过对算法验证,该算法可以获得与不同地区相适应的近地面臭氧浓度的时空分布。

实施例一

图1是本发明实施例一提供的近地面臭氧空间分布的估算方法的流程图,本实施例可适用于对臭氧的空间分布进行估算的情况,该方法可以由本发明实施例所提供的近地面臭氧空间分布的估算装置来执行,该装置可以由软件和/或硬件的方式来实现,并可集成于用于臭氧空间分布的计算的电子设备中。

如图1所示,所述近地面臭氧空间分布的估算方法包括:

s110、获取特征数据;所述特征数据包括实时采集的气象数据和卫星遥感数据。

在本实施例中,近地面可以是低空地面,如对流层内的空间,可以是在地表人类生产生活的空间范围内的空间,或者地表以上空气质量站点采样高度2m内的范围的空间,或者风速10m内的范围的空间,等等。其中,气象数据可以是公里网格化的气象数据,卫星遥感数据可以是卫星遥感的栅格数据。

其中,特征数据中的气象数据,可以是在气象局的指定地址下载得到的气象数据。具体的,气象局的站点数据来源于国家质量控制中心,通过各个站点的大气监测仪器进行采集收取。另外,卫星遥感获得的o3对流层柱浓度、co柱浓度、no2对流层柱浓度和甲醛对流层柱浓度,从“空气质量卫星遥感监测系统v1.0”中获得。

在本实施例中,可选的,在获取特征数据之后,所述方法还包括:

对所述特征数据按照预设网格化规则进行网格化处理,得到网格化后的单点数据;

相应的,将所述特征数据输入至预先训练的神经网络模型,包括:

将所述单点数据输入至预先训练的神经网络模型。

可以理解的,由于站点的位置的设置是不受控的,因此可以根据得到的站点数据进行网格化处理,来得到输入模型的数据。

本方案中,气象数据选择的是国家气象局一万多个气象站点的气温、比湿、风速、气压、降水和辐射数据,并和气象卫星同类产品融合与同化处理获得的气象再分析数据,气象再分析数据来源于cldas-v2.0业务系统进行历史的回算以及实时产品生成,通过中国气象数据网对公众分布。该数据的空间分辨率为0.01°×0.01°,时间分辨率为1h,包含2m气温、2m比湿、10m风速、2m地面气压、降水、短波辐射六个要素的等经纬度网格融合分析。

其中,2m气温可以是在预设水平线以上2m的气温值,预设水平面是当地地表参考平面。2m比湿、10m风速也是采用类似的方式获得到的数据。

除此之外,可以获取通过卫星反演获得的每个网格都具有的o3对流层柱浓度,以及臭氧的前体物co柱浓度、no2柱浓度和甲醛柱浓度等。

其中,大气o3对流层柱浓度和co廓线浓度来源于美国航空航天局(nasa)aura卫星上搭载的热红外成像仪(airs)载荷数据,大气no2柱浓度和甲醛柱浓度来源于aura卫星上搭载的臭氧探测仪(omi)数据。这两个载荷数据通过“空气质量卫星遥感监测系统v1.0”反演获得。

s120、将所述特征数据输入至预先训练的神经网络模型,得到所述神经网络模型的输出结果。

其中,预先训练的神经网络模型,可以是存储在用于臭氧分布估算的设备中的,可以将得到的特征数据输入至预先训练的神经网络模型,以得到模型的输出结果。

其中,所述神经网络模型的训练过程包括:

从预先设置的采样点获取样本数据;其中,所述样本数据包括气象数据和卫星遥感数据,所述气象数据包括2m气温、2m比湿、10m风速、2m地面气压、降水以及短波辐射中的所有六种;所述卫星遥感数据包括o3对流层柱浓度、co柱浓度、no2柱浓度和甲醛柱浓度中的所有四种;

将所述样本数据进行预处理,并将预处理后的样本数据分为训练集和测试集;

采用训练集的样本数据输入至初始神经网络模型的输入层,以对所述初始神经网络模型进行训练,得到目标神经网络模型;其中,所述初始神经网络模型的网络架构是预先确定的;

对测试集的样本数据进行网格化处理,并将网格化样本数据的特征输入至所述目标神经网络模型,以对所述目标神经网络模型的输出结果进行测试;

若测试为收敛,且神经网络模型输出的近地面臭氧浓度结果和测试集中地面站点臭氧观测结果相比对,结果满足预设的阈值,则确定目标神经网络模型训练完成。

用于训练和测试的近地面臭氧来源于地面站点的监测,京津冀地区有89个站点;臭氧前体物来源于“空气质量卫星遥感监测系统v1.0”的生产。气象数据是网格化分布(分辨率为0.01°x0.01°),臭氧观测的站点分布的单个样本、臭氧前体物卫星遥感的栅格数据样本需要和网格是气象数据的像元进行匹配,形成训练用数据集。经过对数据进行缺失值的填充、无效值的去除,以及异常值的处理,数据集包含四万多个网格样本点。气象数据的时间分辨率是1小时,每颗卫星遥感数据为一天一次,具体包括o3廓线浓度、co廓线浓度、对流层no2柱浓度和甲醛柱浓度,相对应的地面站点小时的o3浓度值。这里的地面o3浓度观测值主要用于算法悬链和模型验证使用。

本方案中,可选的,所述将所述样本数据进行预处理,包括:

将所述样本数据中的气象数据由nc数据格式转换为csv(comma-separatedvalues,逗号分隔值)数据格式;以及,将卫星遥感数据由txt数据格式转换为csv数据格式。

由于需要统一数据格式,气象数据的原始格式是nc文件,站点数据是txt文件,通过python编程语言的gdal(geospatialdataabstractionlibrary)栅格空间数据读取/转换库、csv库提取数据集,以得到csv结构数据,完成构建数据集。

在将预处理后的样本数据分为训练集和测试集之后,可以采用训练集的样本数据输入至初始神经网络模型的输入层,以对所述初始神经网络模型进行训练,得到目标神经网络模型;其中,所述初始神经网络模型的网络架构是预先确定的。

在完成训练之后,可以得到目标神经网络模型,可以直接发布到线上使用,但是这样是不稳定的,结果也不够准确,因此需要采用一定数量的测试数据对其进行测试,装置测试结果收敛,即测试得到的近地面臭氧估算结果与实际站点观测的臭氧分布方差小于设定阈值,即可以确定目标神经网络模型训练完成,可以发布到线上使用。

在上述技术方案的基础上,可选的,所述初始神经网络模型的网络架构包括:输入层,第一卷积层,第一池化层,第二卷积层,第二池化层,全连接层以及输出层。

卷积神经网络是针对近地面臭氧的估算,将近地面臭氧的影响因素作为特征。将上述的卷积模块和池化层结构应用到卷积神经网络的结构中,以及添加相应的全连接层和其他必须的结构,最后设计的卷积神经网络的结构如下表:

cnn的层次结构

其中,网络模型的输入是对原始特征处理得到的,第2层和第4层是卷积层,第3层和第5层是池化层,第6层是全连接层,第7层输出层,输出层的神经元个数为1个,为近地面臭氧的浓度值。

在上述技术方案的基础上,可选的,所述第一卷积层(bn-conv)和所述第二卷积层的卷积核大小为3×3,步长为1;卷积层中bn(batchnormalizaion)用于深度模型来提升泛化能力,在模型推理时采用模型训练中近似的均值和方差,并用一个卷积等效替换,将bn层合并到卷积层中融合bn和conv,使融合后推理时间会减少。

所述第一池化层(max-pooling)和所述第二池化层为最大池化层;所述第一池化层和所述第二池化层的窗口大小为3×3,步长为2。池化层通过对数据进行分区采样,最大子采样函数取区域内所有神经元的最大值(max-pooling),把一个大的矩阵降采样成一个小的矩阵,减少计算量并防止过拟合。

利用卷积神经网络实现近地面臭氧的估算,要考虑到输入特征的数学特征,特征提取模型可以将输入特征转化维2维的特征平面,将特征平面作为卷积神经网络的输入。

本申请的卷积核结构和传统卷积核的对比,传统卷积核的数量必须是8的倍数,本申请设计的卷积核结合了1×1的卷积核特性,这样可以减少模型训练参数,增加模型训练速度和减少过拟合的现象。

随着卷积层数的增加,网络的参数会越来越多,通过池化层操作,可以在保留特征信息的情况下,降低特征的维度,从而可以有效的减低模型训练难度和过拟合情况。对于池化层的窗口设计需要根据实际的数据情况,根据数据集的特征,本申请选择的池化的窗口大小为3*3,池化步长选择的是2。

全连接层(fc,fullyconnectedlayers)中的每个神经元与其前一层的所有神经元进行全连接,在整个卷积神经网络中起到“分类器”的作用,整合卷积层或者池化层中具有类别区分性的局部信息,根据特征的组合进行分类。

图2是本申请实施例一提供的全连接网络模块的示意图。如图2所示,模块中两个全连接层(fc)的神经元个数相同,为了保证后面残差结构计算的方便,input层的神经元个数也与fc相同;

模型输出之前添加dropout结构;

为了提升cnn网络性能,全连接层fc每个神经元模块的激活函数选择的relu,结合数据的特性,使用relu激活函数实现非线性映射。将设计的全连接网络命名为res-fc。因为relu激活函数没有饱和区和复杂计算,实际收敛速度较快。

模型是由6层构成,第2层和第4层是全连接层,神经元个数分别为32个和64个,设计的全连接层是为了改变输入和输出的神经个数,连接res-fc模块。第3层和第5层是res-fc层,设置的神经元个数分别为32和64个,由于数据集的规范化方式是最小值-最大值方式,目标数据的取值范围在0到1之间,因此第5层输出选择的激活函数是sigmoid函数。

s130、根据所述输出结果,确定近地面臭氧空间分布的估算结果。

其中,在得到模型的输出结果之后,可以根据输出结果,确定近地面臭氧空间分布的估算结果。

本方案中,具体的,根据所述输出结果,确定近地面臭氧空间分布的估算结果,包括:

获取所述神经网络模型的输出结果,并采用预设图像处理程序,对所述输出结果进行网格化分布成图。计算估算结果,将网格化特征输入到训练好的模型中,得到估算结果,使用arcgis的图像处理功能,生成近地面臭氧的网格化分布。

本方案与原有的臭氧卫星遥感探测方法相比,本申请提案有以下技术优点:传统的卫星紫外波段遥感探测仅能获得臭氧总量,热红外遥感探测虽然可以获得臭氧垂直分布廓线,但底层臭氧浓度的不确定性非常大。利用地面站点监测的臭氧浓度仅是少数站点的离散监测结果,无法获得空间分布的底层臭氧浓度分布。本申请提出的基于气象数据和卫星监测的臭氧前体物浓度,可以通过建立近地面臭氧浓度卷积神经网络估算方法,获得空间连续分布的近地面臭氧浓度估算结果。

实施例二

图3是本发明实施例二提供的近地面臭氧空间分布的估算装置的结构示意图。如图3所示,所述近地面臭氧空间分布的估算装置,包括:

特征数据获取模块310,用于获取特征数据;所述特征数据包括实时采集的气象数据和卫星遥感数据;

数据处理模块320,用于将所述特征数据输入至预先训练的神经网络模型,得到所述神经网络模型的输出结果;

估算结果确定模块330,用于根据所述输出结果,确定近地面臭氧空间分布的估算结果。

上述产品可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。

实施例三

本申请实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种近地面臭氧空间分布的估算方法,该方法包括:

获取特征数据;所述特征数据包括实时采集的气象数据和卫星遥感数据;

将所述特征数据输入至预先训练的神经网络模型,得到所述神经网络模型的输出结果;

根据所述输出结果,确定近地面臭氧空间分布的估算结果。

存储介质——任何的各种类型的存储器电子设备或存储电子设备。术语“存储介质”旨在包括:安装介质,例如cd-rom、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如dram、ddrram、sram、edoram,兰巴斯(rambus)ram等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到计算机系统。第二计算机系统可以提供程序指令给计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。

当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的近地面臭氧空间分布的估算操作,还可以执行本申请任意实施例所提供的近地面臭氧空间分布的估算方法中的相关操作。

实施例四

本申请实施例提供了一种电子设备,该电子设备中可集成本申请实施例提供的近地面臭氧空间分布的估算装置。图4是本申请实施例四提供的一种电子设备的结构示意图。如图4所示,本实施例提供了一种电子设备400,其包括:一个或多个处理器420;存储装置410,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器420运行,使得所述一个或多个处理器420实现本申请实施例所提供的近地面臭氧空间分布的估算方法,该方法包括:

获取特征数据;所述特征数据包括实时采集的气象数据和卫星遥感数据;

将所述特征数据输入至预先训练的神经网络模型,得到所述神经网络模型的输出结果;

根据所述输出结果,确定近地面臭氧空间分布的估算结果。

当然,本领域技术人员可以理解,处理器420还可以实现本申请任意实施例所提供的近地面臭氧空间分布的估算方法的技术方案。

图4显示的电子设备400仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图4所示,该电子设备400包括处理器420、存储装置410、输入装置430和输出装置440;电子设备中处理器420的数量可以是一个或多个,图4中以一个处理器420为例;电子设备中的处理器420、存储装置410、输入装置430和输出装置440可以通过总线或其他方式连接,图4中以通过总线450连接为例。

存储装置410作为一种计算机可读存储介质,可用于存储软件程序、计算机可运行程序以及模块单元,如本申请实施例中的近地面臭氧空间分布的估算方法对应的程序指令。

存储装置410可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储装置410可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储装置410可进一步包括相对于处理器420远程设置的存储器,这些远程存储器可以通过网络连接。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置430可用于接收输入的数字、字符信息或语音信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置440可包括显示屏、扬声器等电子设备。

本申请实施例提供的电子设备,可以基于气象数据和卫星监测的臭氧前体物浓度,可以通过建立近地面臭氧浓度卷积神经网络估算方法,获得空间连续分布的臭氧浓度估算结果。

上述实施例中提供的近地面臭氧空间分布的估算装置、介质及设备可运行本申请任意实施例所提供的近地面臭氧空间分布的估算方法,具备运行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的近地面臭氧空间分布的估算方法。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1