反演模型的制作方法
【技术领域】
[0001] 本发明属于遥感技术领域,具体涉及的是基于杭州地区的气溶胶光学厚度(A0D) 的大气细颗粒物(PM2.5)的反演建模,利用A0D和PM2.5之间的正相关性,建立一种基于A0D 的杭州地区PM2.5反演模型。
【背景技术】
[0002] 大气颗粒物(particulatematter,PM)是指分散在空气环境中的固态或液态颗 粒物质,其中,动力学直径小于等于2. 5微米的即为细颗粒物(fineparticularmatter, PM2.5)。PM2.5因其易附带有毒有害物质,并且能够随呼吸直接进入人体肺部,对人体健康造 成一定伤害,因其输送距离远以及在空气中停留时间长的特点,可对大气造成污染。
[0003] 气溶胶光学厚度(AerosolOpticalDepth,A0D)描述的是大气颗粒物对太阳光的 吸收和散射特性,体现大气气溶胶的光学性质。目前,针对A0D的测定主要分为空基观测和 地基观测两种。空基观测是指通过搭载在卫星上的中分辨率成像光谱仪(M0DIS)获取数据 的方法,该方法能够覆盖更广的空间范围。地基观测是气溶胶光学特性研究中一种精度较 高的方法,主要是利用CE-318太阳光度计获取具有区域代表性的气溶胶光学参数。
[0004] 目前能够反映大气污染水平的指标虽然比较多,并且其中大部分指标都是通过地 面监测点测得,具有较高的精确度,但是污染物的浓度水平易受温度、湿度、气压等气象因 素的影响,因此在综合评价、比较以及真实反映各地区的空气质量存在一定的局限性。采用 A0D作为反映大气污染状况的综合指标,不仅扩大了监测的区域范围,同时可以整体反映颗 粒物及大气污染物的综合水平。因此,本发明利用A0D和PM2.5之间的相关性,建立反向传 播神经网络模型(BP神经网络模型),可以较好的反映PM2.5的污染状况。
[0005] 人工神经网络(ANN,artificialneuralnetworks)是以软硬件形式出现并执行 的计算机系统,简称为神经网络。神经网络是根据人脑神经系统中基本单元的工作方式,即 神经元的组织结构和运行机制建立的数学模型。
[0006] 神经网络起源于1940s,由W.McCulloch和W.Pitts提出首个人工神经网络模型; 到了 1960s,更多的学者进行神经网络模型的研究,其中包括F.Rosenblatt建立可用于模 式识别的神经感知器网络,B.Widrow和T.Hoff则提出了Delta学习算法;在此后的十年 里,M.Minsky和S.Papert发现了神经网络的局限性;直到80年代计算机的出现拯救了神 经网络及其领域[1]。
[0007] 神经网络是由大量简单的处理单元构成的复杂网络系统,即通过神经元及其互联 拓扑结构和网络学习算法,实现模拟人脑处理信息的能力。其中,神经网络通过数据在网络 系统中的流动,将神经元接收的输入数据流进行响应处理后传送到其他神经元。通过学习 过程,网络系统不断获取新的知识,并以网络结构和连接权值的形式存储在网络系统之中。
[0008] BP神经网络模型(backpropagationneutralnetwork,BP)起源于 1986 年,由 Rumelhart和McCelland提出,是迄今为止应用最为广泛的神经网络模型一直。BP神经网 络是一种按误差反向传播,具有三层或三层以上神经元的多层前馈神经网络模型,不同的 神经元之间通过网络的权值进行连接,层与层传递信息的同时通过添加阀值对信息进行整 合。
[0009] BP神经网络模型的学习过由信息的正向传播与误差的反向传播两部分组成。当信 息正向传播时,信息由输入层传入,经隐含层进行交换处理后,传递到输出层。若输出层的 实际输出与期望输出存在误差,则将进行第二个误差反向传播阶段。在误差反向传播时,将 输出误差由隐含层向输入层进行反向传播,同时将误差分摊到各个神经元,即为误差修正 网络的权值。权值不断调整的过程,即为BP神经网络学习训练的过程。
[0010] BP神经网络及其变化形式是人工神经网络中的核心部分。在人工神经网络的实际 应用中,BP神经网络的应用较为广泛,主要可以应用于:函数逼近、模式识别、分类和数据 压缩等应用领域[2]。
[0011] 引证文件
[0012] [1].程国建.神经计算与生长自组织网络[M].西安:西安交通大学出版 社,2008. 10.
[0013] [2].周品.MATLAB神经网络设计与应用[M].北京:清华大学出版社,2013. 3.
【发明内容】
[0014] 本发明的目的是根据杭州地区的A0D和PM2.5实测数据,建立一种基于A0D的杭州 地区PM2.5反演模型。
[0015] 本发明解决其技术问题所采用的技术方案具体包括如下步骤:
[0016] 步骤(1):对A0D和PM2.5的实测数据进行筛选;
[0017] 步骤(2):对用于模型计算的实测数据进行归一化预处理;
[0018] 步骤(3):建立基于A0D实测数据的BP神经网络模型;
[0019] 步骤(4):通过A0D测试数据验证PM2.5反演模型。
[0020] 步骤⑴中所述针对A0D和PM2.5的实测数据进行筛选,具体如下:由于A0D描述 的是大气颗粒物对太阳光的吸收和散射特性,体现大气气溶胶的光学性质,因此只有在日 出之后至日落之前可以测得数据,云的遮挡等天气因素也会造成A0D数据的缺失,以及太 阳高度计自身产生系统误差使得所测数据出现异常。
[0021] 与异常或缺失的A0D数据相对应的PM2.5数据同样不适用于BP神经网络的训练与 验证,因此针对异常数据需要进行剔除筛选。筛选的过程是针对实测数据中,在同一个时间 节点所分别测得的PM2.5和A0D数据,如果其中任意一方出现空缺或是超出标准范围(A0D的 值小于3),则剔除该时间节点的数据。
[0022] 步骤(2)中所述的归一化预处理,具体如下:
[0023] 由于神经网络应用范围广泛、来源多样,不同的数据类型其值域也不相同,因此, 在神经网络模型的构建过程中,需要对输入数据以及预期的输出数据进行归一化处理,也 就是通过计算时的所有的数据都统一在〇~1的范围内,即通过消除数据量纲的方式,提高 网络系统的运算速率,本发明采用的归一化公式如下:
[0024]
(2、、、、[)
[0025]式中,tn_为归一化之后变量t的平均值,t为归一化之前的变量值,t_、t_分别 为变量t的最大值、最小值
[0026] 步骤(3)中所述的建立基于A0D实测数据的BP神经网络模型,即利用神经网络系 统自学习、自适应、自组织以及较好的泛化能力实现基于A0D实测数据的PM2.5反演过程。具 体如下:
[0027] 3. 1对筛选后的实测数据进行随机分组,2/3的实测数据用于BP神经网络模型的 训练学习,1/3的实测数据用于BP神经网络模型的验证;
[0028] 3. 2采用误差反传(BP,backwardpropagation)学习律建立BP神经网络模型,同 时采用LM(levenberg-marquardt)算法函数(trainglm)作为训练函数,具体如下:
[0029] LM算法的目的是为在修正近似二阶训练速率时,避免计算Hessian矩阵。
[0030] 首先当误差性能函数具有平方和误差时,Hessian矩阵表示如下:
[0031] H=JTJ(3-2)
[0032] 梯度的计算表达式为:
[0033] g=JTe(3-3)
[0034] 其中,H是Hessian矩阵,即包含网络系统的误差函数对其权值和阈值一阶导数的 雅可比矩阵J;/则是雅可比矩阵J的转置矩阵;g是梯度;e是网络系统误差。
[0035] LM算法通过近似的Hessian矩阵进行如下修正:
[0036] x(k+l) =x(k)_[JTJ+yJ]Te (3-4)
[0037] 其中,x(k)表示第k次迭代的权值和阈值所组成的向量,k为自然数,表示迭代次 数;y为比例系数。当y取值较大时,LM算法接近于梯度下降法,每成功迭代一次,y会 减小一些,也就是说在每一次迭代后,即误差性能减小时,y会减小,因此,LM算法中每一 次迭代的误差性能总能达到最小。
[0038] 其次,需要确定神经网络系统的隐含层个数以及神经元个数。通常情况下,确定隐 含层的神经元个数有以下三种经验公式:
[0041 ]M=log2n(3-7)
[0042] 在上述公式中,1为样本总数,M为隐含层的神经元个数,n为输入层的神经元个 数,m为输出层的神经元个数,a是取值范围在0~10之间的常数。其中,在公式(3-5)中, 如果i〉M,则规定(士 =
[0043] 利用经验公式估算隐含层神经元个数时,需要对上述的三个经验均进行计算后, 结合其计算结果才能确定神经元个数的取值范围。
[0044] 此外,如果隐含层的数量为1,各个神经元之间会产生"相互作用",使得提高神经 网络系统的精度产生困难。具体的隐含层数量及其神经元个数需要进行多次实验才能获 取。
[0045] 本发明发现在隐含层数量为2,神经元数为14时建立的模型效果最好。
[0046] 最后,利用MATLAB神经网络工具箱建立BP神经网络模型,期间需要不断调整参 数,调整参数包括训练次数、训练步数、学习速率以及训练目标;从而使得本网络模型的学 习效果最佳。
[0047] 在步骤(4)中,针对步骤(3)中所建立的模型,利用1/3的数据进行BP神经网络 模型的验证。具体如下:
[0048] 在MATLAB中调用步骤(3)所建的BP神经网络模型,输入测试数据中的A0D实测 数据进行计算,得到PM2.5的模拟数据并做反归一化处理。
[0049] 本发明的有益效果如下:
[0050] 本发明能够实现PM2.5的反演建模,发明的主要思想是基于A0D和PM2.5之间的正相 关,建立反向传播神经网络模型(BP神经网络模型),可以较好的反映PM2.5的污染状况。
[0051] -方面,本发明使用A0D较其他气象因素可较好的反映PM2.5的浓度分布状况,此 外,地基所测的A0D数据准确度较高,能够更好的体现其与PM2.5之间的关系。
[0052] 另一方面,现可从遥感数据直接获取A0D的数据,利用本发明的反演模型即可得 到PM2.5的浓度分布,并且实施过程可行强、计算过程便于程序集成、计算结果精度可靠,具 有较高的行业推广价值和应用前景。
【附图说明】
[0053] 图1为本发明流程图;
[0054] 图2为模型计算结果与实测数据的散点关系图。
【具体实施方式】
[0055] 下面结合附图对本发明作进一步说明。
[0056] 如图1所示,一种基于A0D的杭州地区PM2.5反演模型。
[0057] 本发明解决其技术问题所采用的技术方案具体包括如下步骤:
[0058] 步骤(1):对A0D和