本申请涉及空气质量预报技术领域,具体涉及一种空气污染物的空气质量分指数级别概率预报方法、装置、设备及存储介质。
背景技术:
近年来,空气污染问题严峻,引起了广泛的关注。合理的空气质量预报能够帮助政府部门做出决策,以限制人为污染物的排放量,同时引导公众规避污染峰值期,减少暴露时间,降低污染引起的健康风险。空气质量模式能够模拟出污染物的物理和化学反应过程,并能给出具有物理意义的四维污染物浓度时空特征,目前已经成为短时临近和中期空气质量预报的主要手段。
空气质量模式模拟污染物浓度变化其实是求解一个高度复杂的非线性偏微分方程组,由于较多的小尺度运动过程无法在其中显性的表达,同时我们也不可能获得一个绝对正确的初始和边界条件,因此,空气质量模式的预报值会一直存在不确定性。根据模式模拟结果做出的确定性预报却未能反映模式本身的不确定性,这很有可能会引导政府部门做出过激的决策,从而造成不必要的经济损失。
概率预报能够量化预报结果的不确定性,给出相对于确定性预报更多的信息,是空气质量预报研究的新方向。目前空气质量的概率预报处于起步阶段,现有研究主要集中在“空气质量模式关键不确定性来源诊断识别与分析”,研究内容较为复杂庞大,一般采用敏感性分析、贝叶斯统计推断等方法构建模式定量不确定性诊断系统,然后以数值模拟为基础,纳入模式和输入的各种不确定性分析结果形成概率预报,得到污染物浓度概率分布结果,该方法需要进行大量的扰动模拟,对计算资源要求较高,且在进行概率统计时,各个成员都同等对待,没有考虑成员之间的差异。目前,尚未有直接基于多模式、多区域、多时效的预报结果进行概率预报的研究,同时现有的空气污染领域概率预报也未能直接给出各污染物的空气质量分指数级别概率预报结果,无法满足业务需求。
技术实现要素:
本申请的目的是提供一种空气质量分指数级别概率预报方法、装置、设备及存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
根据本申请实施例的一个方面,提供一种空气质量分指数级别概率预报方法,包括:
针对若干种空气质量预报方法,获取每种所述空气质量预报方法对若干历史时间点的预报数据;所述预报数据为多种空气污染物的空气质量分指数预报值;
获取每一所述历史时间点的实况监测数据;
针对每一种所述污染物,获取每一种所述空气质量预报方法的预报最准确率;所述预报最准确率为所述空气质量预报方法的预报数据与对应的实况监测数据最接近的概率;
利用所述若干种空气质量预报方法以及对应的所述各污染物预报最准确率,获取待预报空气污染物的空气质量分指数的级别概率。
进一步地,所述针对每一种所述污染物,获取每一种所述空气质量预报方法的预报最准确率,包括:
针对每一种所述污染物,统计每一种所述空气质量预报方法对所述若干历史时间点的预报数据与所述实况监测数据最接近的次数;
计算所述最接近的次数与取样总次数的比值,以所述比值作为所述预报最准确率;所述取样总次数等于所述若干历史时间点的总数。
进一步地,所述利用所述若干种空气质量预报方法以及对应的所述各污染物预报最准确率,获取待预报空气污染物的空气质量分指数的级别概率,包括:
针对每一种所述污染物,分别用所述若干种空气质量预报方法获取新预报值;所述新预报值为所述待预报空气污染物的空气质量分指数;
根据预先设定的级别阈值范围,确定每一种所述污染物每一所述新预报值的级别;
对于每一种所述污染物的所述新预报值的级别,将级别相同的新预报值所对应的预报最准确率相加,以得到的和作为该污染物所述级别的级别概率。
进一步地,所述根据预先设定的级别阈值范围,确定每一种所述污染物每一所述新预报值的级别,包括:
将所述待预报空气污染物的空气质量分指数与预先设定的级别阈值范围进行比较;
查找到所述待预报空气污染物的空气质量分指数所属的级别阈值范围;
以所述空气质量分指数所属的级别阈值范围所对应的空气质量分指数级别作为所述新预报值的空气质量分指数级别。
根据本申请实施例的另一个方面,提供一种空气质量分指数级别概率预报装置,包括:
第一模块,用于针对若干种空气质量预报方法,获取每种所述空气质量预报方法对若干历史时间点的预报数据;所述预报数据为多种空气污染物的空气质量分指数预报值;
第二模块,用于获取每一所述历史时间点的实况监测数据;
第三模块,用于针对每一种所述污染物获取每一种所述空气质量预报方法的预报最准确率;所述预报最准确率为所述空气质量预报方法的预报数据与对应的实况监测数据最接近的概率;
第四模块,用于利用所述若干种空气质量预报方法以及对应的所述各污染物预报最准确率,获取待预报空气污染物的空气质量分指数的级别概率。
进一步地,所述第三模块包括:
统计模块,用于针对每一种所述污染物统计每一种所述空气质量预报方法对所述若干历史时间点的预报数据与所述实况监测数据最接近的次数;
计算模块,用于针对每一种所述污染物计算所述最接近的次数与取样总次数的比值,以所述比值作为所述预报最准确率;所述取样总次数等于所述若干历史时间点的总数进一步地,所述第四模块包括:
获取模块,用于针对每一种所述污染物分别用所述若干种空气质量预报方法获取新预报值;所述新预报值为所述待预报空气污染物的空气质量分指数;
确定模块,根据预先设定的级别阈值范围,确定每一种所述污染物每一所述新预报值的级别;
求和模块,用于针对每一种所述污染物的所述新预报值的级别,将级别相同的新预报值所对应的预报最准确率相加,以得到的和作为该污染物所述级别的级别概率。
进一步地,所述确定模块包括:
比较模块,用于将所述待预报空气污染物的空气质量分指数与预先设定的级别阈值范围进行比较;
查找模块,用于查找到所述待预报空气污染物的空气质量分指数所属的级别阈值范围;
划分模块,用于以所述空气质量分指数所属的级别阈值范围所对应的空气质量分指数级别作为所述新预报值的空气质量分指数级别。
根据本申请实施例的另一个方面,提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现所述的空气质量分指数级别概率预报方法。
根据本申请实施例的另一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以实现所述的空气质量分指数级别概率预报方法。
本申请实施例的其中一个方面提供的技术方案可以包括以下有益效果:本申请实施例提供的空气质量分指数级别概率预报方法,基于多种不同的预报方法的预报结果实现空气质量分指数级别概率预报,重点考虑了不同预报方法的预报效果差异(权重),并采用广义线性模型得到各预报方法的预报最准确率,最终计算得到空气质量分指数级别概率,预报结果准确度更高。
本申请的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者,部分特征和优点可以从说明书中推知或毫无疑义地确定,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请的一个实施例的空气质量分指数级别概率预报方法流程图;
图2示出了本申请的一个实施例的空气质量分指数级别概率预报装置结构框图;
图3示出了本申请的另一实施例的空气质量分指数级别概率预报方法流程图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图和具体实施例对本申请做进一步说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
如图1所示,本申请的一个实施例提供了一种空气质量分指数级别概率预报方法,包括:
s1、针对若干种空气质量预报方法,获取每种所述空气质量预报方法对若干历史时间点的预报数据;所述预报数据为多种空气污染物的空气质量分指数预报值。
不同类型的空气质量预报可以是数值模式不同的空气质量预报,也可以是时效不同的空气质量预报,也可以是区域不同的空气质量预报。
不同数值模式的空气质量预报可以包括中国科学院大气物理研究所开发的嵌套网格空气质量预报模式系统naqpms、美国环保署的cmaq模式、美国environ公司的空气质量综合模拟系统camx、美国大气海洋局(noaa)预报系统实验室(fsl)开发的wrf-chem模式。
例如,从五种类型的空气质量预报历史数据中,分别收集10次预报的空气污染物的空气质量分指数历史数据。
s2、获取每一所述历史时间点的实况监测数据。
根据空气质量分指数历史数据的时间点,收集对应于该时间点的实况监测数据。实况监测数据一般是由监测中心提供的。例如,对应于在a年b月c日预报的空气污染物的空气质量分指数历史数据,找出在a年b月c日的空气污染物的实况监测数据。
s3、针对每一种所述污染物,获取每一种所述空气质量预报方法的预报最准确率;所述预报最准确率为所述空气质量预报方法的预报数据与对应的实况监测数据最接近的概率。
步骤s3具体包括:
s301、针对每一种所述污染物,统计每一种所述空气质量预报方法对所述若干历史时间点的预报数据与所述实况监测数据最接近的次数;
s302、计算所述最接近的次数与取样总次数的比值,以所述比值作为所述预报最准确率;所述取样总次数等于所述若干历史时间点的总数。
例如,通过五种类型的空气质量预报方法共收集到10个历史时间点的多种(以六种为例)空气污染物的空气质量分指数数据,分别与对应的空气污染物的实况监测数据进行对比,其取样总次数为10。若针对某个污染物,第一种空气质量预报方法最接近实况监测值的次数为3次,则第一种空气质量预报方法的预报最准确率为3/10=0.3。
s4、利用所述若干种空气质量预报方法以及对应的所述各污染物预报最准确率,获取待预报空气污染物的空气质量分指数的级别概率。
在某些实施方式中,步骤s4包括:
s401、针对每一种所述污染物,分别用所述若干种空气质量预报方法获取新预报值;所述新预报值为所述待预报空气污染物的空气质量分指数;
s402、根据预先设定的级别阈值范围,确定每一种所述污染物每一所述新预报值的级别;
s403、对于每一种所述污染物的所述新预报值的级别,将级别相同的新预报值所对应的预报最准确率相加,以得到的和作为该污染物所述级别的级别概率。
例如,污染物分别为pm2.5、pm10、so2、no2、co、o3六种。以so2为例,若五种方法预报得到的空气质量分指数分别为45、55、64、31和120(空气质量分指数级别包括优(0~50)、良(51~100)、轻度污染(101~150)、中度污染(151~200)、重度污染(201~300)和严重污染(>300)),则五种方法的预报得到的数据对应的级别分别为优、良、良、优、轻度污染。假设五种空气质量分指数预报方法的预报最准确率依次为0.2、0.3、0.1、0.15和0.25,则优级别的级别概率为0.2+0.15=0.35,良级别的级别概率为0.3+0.1=0.4,轻度污染级别的级别概率为0.25,其他级别的级别概率为0。
在某些实施方式中,步骤s402包括:
s4021、将所述待预报空气污染物的空气质量分指数与预先设定的级别阈值范围进行比较;
s4022、查找到所述待预报空气污染物的空气质量分指数所属的级别阈值范围;
s4023、以所述空气质量分指数所属的级别阈值范围所对应的空气质量分指数级别作为所述新预报值的空气质量分指数级别。
空气质量分指数级别一般分为优、良、轻度污染、中度污染、重度污染、严重污染六个级别,每个级别分别对应一个分数段:0~50,51~100,101~150,151~200,201~300,300以上。若某个所述污染物空气质量分指数为115,则属于轻度污染级别。
本实施例提供的空气质量分指数级别概率预报方法,基于多种不同的预报方法的预报结果实现空气质量分指数级别概率预报,重点考虑了不同预报方法的预报效果差异(权重),并采用广义线性模型得到各预报方法的预报最准确率,最终计算得到空气质量分指数级别概率,预报结果准确度更高。
如图2所示,本实施例还提供一种空气质量分指数级别概率预报装置,包括:
第一模块100,用于针对若干种空气质量预报方法,获取每种所述空气质量预报方法对若干历史时间点的预报数据;所述预报数据为多种空气污染物的空气质量分指数预报值;
第二模块200,用于获取每一所述历史时间点的实况监测数据;
第三模块300,用于针对每一种所述污染物获取每一种所述空气质量预报方法的预报最准确率;所述预报最准确率为所述空气质量预报方法的预报数据与对应的实况监测数据最接近的概率;
第四模块400,用于利用所述若干种空气质量预报方法以及对应的所述各污染物预报最准确率,获取待预报空气污染物的空气质量分指数的级别概率。
在某些实施方式中,所述第三模块300包括:
统计模块,用于针对每一种所述污染物统计每一种所述空气质量预报方法对所述若干历史时间点的预报数据与所述实况监测数据最接近的次数,
计算模块,用于针对每一种所述污染物计算所述最接近的次数与取样总次数的比值,以所述比值作为所述预报最准确率;所述取样总次数等于所述若干历史时间点的总数。
在某些实施方式中,所述第四模块400包括:
获取模块,用于针对每一种所述污染物分别用所述若干种空气质量预报方法获取新预报值;所述新预报值为所述待预报空气污染物的空气质量分指数;
确定模块,用于根据预先设定的级别阈值范围,确定每一种所述污染物每一所述新预报值的级别;
求和模块,用于针对每一种所述污染物的所述新预报值的级别,将级别相同的新预报值所对应的预报最准确率相加,以得到的和作为该污染物所述级别的级别概率。
在某些实施方式中,所述确定模块包括:
比较模块,用于将所述待预报空气污染物的空气质量分指数与预先设定的级别阈值范围进行比较;
查找模块,用于查找到所述待预报空气污染物的空气质量分指数所属的级别阈值范围;
划分模块,用于以所述空气质量分指数所属的级别阈值范围所对应的空气质量分指数级别作为所述新预报值的空气质量分指数级别。
本实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现上述的空气质量分指数的级别概率预报方法。
本实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以实现上述的空气质量分指数的级别概率预报方法。
如图3所示,本申请的另一个实施例提供了一种空气质量分指数级别概率预报方法,包括以下步骤:
1)收集不同类型的空气质量预报方法(不同类型包括不同数值模式、不同区域和/或不同时效)获得的空气质量预报结果历史数据。
不同的数值模式可以包括中国科学院大气物理研究所开发的嵌套网格空气质量预报模式系统naqpms、美国环保署的cmaq模式、美国environ公司的空气质量综合模拟系统camx、美国大气海洋局(noaa)预报系统实验室(fsl)开发的wrf-chem模式。
收集内容可以包括各模式各嵌套区域各时效预报的pm2.5、pm10、so2、no2、co、o3的站点日均浓度预报结果。
2)收集监测中心提供的站点日均污染监测历史数据,污染物包括pm2.5、pm10、so2、no2、co、o3。该站点日均污染监测历史数据与步骤1)中的空气质量预报结果历史数据在时间上是对应的。
3)基于历史数据集(历史数据集包括空气质量预报结果历史数据和站点日均污染监测历史数据),计算各类型预报的各污染物空气质量分指数(iaqi)与监测值最接近的概率(计算权重):
将不同数值模式、不同区域、不同时效的预报方法均看作不同类型的预报方法,假定概率预报中的类型成员有m个(即不同类型的预报方法为m种),则对于某天的预报,可以得到m个类型预报的某个污染物的空气质量分指数yk:
式中,k为污染物的编号,污染物的种类包括pm2.5、pm10、so2、no2、co、o3,例如可以分别编号为1、2、3、4、5、6。
理论上,每个类型
通过广义线性模型,可以得到最终的概率输出结果:
h为概率向量,其中ηi为典范参数(canonicalparameter),在机器学习中,这个参数类似于从输入参数中提取出来的特征值。而在多类型的概率预报中,将典范参数定义为:
ηi=ri/bi;
其中ri为训练期的第i种类型的预报方法的预报数据与监测数据的相关系数;bi为第i个类型的预报方法的预报数据与实况监测数据的绝对偏差;某一类型的预报方法在训练期性能越好,那么其典范参数越大,其与监测值最为接近的概率值就越大。
4)统计各污染物在每个空气质量分指数级别的概率(权重频谱统计方法):
在得到每个类型预报的各污染物的iaqi与监测值最接近的概率之后,基于多模式、多区域、多时效的空气质量预报结果历史数据,即可统计出各污染物在每个空气质量分指数级别的概率p(class=g|speciesi)(考虑每个模式的概率不一致,不是简单的采样统计);
其中,g代表空气质量分指数级别,分为优、良、轻度污染、中度污染、重度污染、严重污染六个级别;i为污染物的序号,speciesi代表污染物的种类;污染物的种类包括pm2.5、pm10、so2、no2、co、o3,可以分别为其编序号。空气质量分指数级别是预先设定的。
本实施例的空气污染物的空气质量分指数的级别概率预报方法能够有效地量化模式预报的不确定性。同时,区别于现有的污染物浓度概率预报研究,本实施例直接基于多种不同的预报方法的预报结果进行概率预报,重点考虑了不同预报方法的效果差异(权重),且采用广义线性模型给出了各污染物的空气质量分指数级别概率预报结果,更能满足业务预报需求,能提供更准确的预报和决策参考。
需要说明的是:
术语“模块”并非意图受限于特定物理形式。取决于具体应用,模块可以实现为硬件、固件、软件和/或其组合。此外,不同的模块可以共享公共组件或甚至由相同组件实现。不同模块之间可以存在或不存在清楚的界限。
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本申请实施例的虚拟机的创建装置中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述实施例仅表达了本申请的实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。