融合环境因素的大尺度土壤有机碳空间分布模拟方法

文档序号：6636807阅读：413来源：国知局

融合环境因素的大尺度土壤有机碳空间分布模拟方法
【专利摘要】本发明公开了融合环境因素的大尺度土壤有机碳空间分布模拟方法，涉及土壤数字土壤制图【技术领域】。包括以下步骤：(1)将植被类型图和土壤类型图叠加生成植被-土类单元组合的空间分布图，以建模点统计得到的各植被-土类单元的土壤有机碳含量均值赋值到图中对应的图斑，得到1km分辨率的土壤有机碳均值空间分布曲面m(k)；(2)以神经网络模型表达植被-土类均值残差与定量环境因子间的关系，获得植被-土类均值残差的空间分布曲面f’(xi,k,yj,k)；(3)以HASM模型模拟剩余残差的空间分布曲面r’(xi,k,yj,k)；(4)最后将m(k)、f’(xi,k,yj,k)和r’(xi,k,yj,k)相加得到HASM_EF方法对土壤有机碳空间分布的模拟结果。本发明为国家尺度上土壤有机碳储量的精准估算和大尺度土壤性质的时空变化研究提供参考。
【专利说明】融合环境因素的大尺度土壤有机碳空间分布模拟方法

【技术领域】
[0001] 本发明涉及的是土壤数字土壤制图【技术领域】，具体涉及一种融合环境因素的大尺度土壤有机碳空间分布模拟方法。

【背景技术】
[0002] 土壤是陆地表层系统中最大的有机碳库，土壤中有机碳的储量和动态直接影响着全球碳循环，是地理学研究和"未来地球"研究计划的重要内容。而高精度的土壤有机碳空间变化信息，不仅是准确估算区域土壤有机碳储量的基础，也是研究以碳为基础的温室气体收支平衡的基础资料和有效运行各种耦合土壤信息的陆面模型的重要输入参数。中国陆地面积约为全球的6. 4%，其精准的土壤有机碳空间变化信息一直是学界关注和探讨的热点。然而由于尺度大，影响因素复杂，中国国家尺度上土壤性质空间变异强烈，获取国家尺度上较高精度的土壤有机碳空间分布信息并不容易。
[0003] 空间模拟或插值是获取土壤性质空间变化的重要手段。由于土壤性质的空间异质性是在各种环境因素的综合作用下形成的，引入环境因子作为辅助变量的空间模拟方法利用了土壤与各因子间的对应关系，其精度明显高于仅基于样点值进行空间内插的方法。然而，国家尺度上影响土壤性质的因素包括土壤概念模型中的所有要素（母质、气候、地形、植被及人类活动等），不同因素对土壤性质空间异质性形成的作用不同。土地利用方式、土壤类型和母质类型等定性因素对土壤性质空间分布的影响显著，甚至会影响定量因素的作用强度。同时引入定性和定量辅助因子的方法，其精度明显优于仅融合定性或定量因子的模拟方法。而土壤性质与定量因子间的关系具有明显的非线性和空间非平稳性，这决定了在整个大尺度上采用一个简单的线性模型很难准确揭示复杂环境条件下土壤与定量因子间的复杂关系。此外，各因素间存在不同程度的共线性。基于土壤发生学理论提出的土壤概念模型给出了土壤与各成土因素间的一般关系，但并未具体化。因此，合理选择辅助因子以及准确表达土壤性质与各因子间的定量关系，成为了土壤性质空间分布高精度模拟的关键。之前的研究对国家尺度上土壤性质空间分布的高精度模拟方法进行了探索，取得了一定的成果，但方法中对不同因子作用的表达仍需进一步改进，模拟结果精度也还有待于进一步提商。

【发明内容】

[0004] 针对现有技术上存在的不足，本发明目的是在于提供一种融合环境因素的大尺度土壤有机碳空间分布模拟方法，以土壤发生学提出的土壤概念模型为基础，构建融合多种因素并合理表达各因素作用的土壤有机碳空间分布模拟方法，模拟中国表层土壤有机碳的空间分布格局，以期为国家尺度上土壤有机碳储量的精准估算和大尺度土壤性质的时空变化研究提供参考。
[0005] 为了实现上述目的，本发明是通过如下的技术方案来实现：融合环境因素的大尺度土壤有机碳空间分布模拟方法，将土壤样点的有机碳实测值划分为由不同因素决定的3 个部分：
[0006] Z (xi；k, yJ；k) = m(k) +f (xi；k, yJ；k) +r (xi；k, yJ；k) (I)
[0007] 式中：Z(Xi，k，hk)表示在点（ Xi，yp处属于第k种定性因素或定性因素组合的土壤样点的有机碳含量实测值，（Xi，yP为点位坐标；m(k)为第k种定性因素或定性因素组合的土壤有机碳含量平均值，该均值差异反映由不同定性因素或定性因素组合引起的土壤有机碳含量空间变异；f(Xi，k，yu)为点位（Xi，yP处去除定性因素影响后由该点位处气象、地形及植被盖度等点位环境因素差异引起的土壤有机碳含量变异；r(Xi，k，hk)为点位（ Xi，yj) 处去除研究中所选因素的影响后剩余的残差项，由研究中未考虑到的其它因素或点位处其它因素引起。
[0008] 假设3个部分相互独立，可由分别不同的方法获取：
[0009] (l)m(k):由定性因素决定的土壤有机碳空间变异部分。研究表明，土壤类型和土地利用方式在不同尺度上均是土壤有机碳空间分布的重要影响因子，且分类级别越低，对土壤有机碳空间变异的反映能力越高。本研究中m(k)部分以土壤类型和土地类型2个因素不同组合类型下土壤有机碳的均值来表示。根据之前的研究结果以及考虑到不同组合类型下需要有一定数量的样本数进行统计，研究中根据土地类型划分出自然植被（包括林地、草地灌木和荒漠）和农业植被（包括耕地和果园）2个类型，将2个植被类型与58个土类进行组合，部分组合中土壤样本数少于3个，则将其合并到相同植被类型下相同土纲内统计均值最接近的其它植被-土类组合中，共获得97个植被-土类分类单元（landscape-soil group unit，LS)。最后以建模样点数据分别统计各植被-土类单元土壤有机碳含量均值。
[0010] (2)f(Xi，k，yj;k):反映点位（ Xi，yj)处某一定性因素组合内部的土壤有机碳含量变异，由该点位处气象、地形及植被盖度等点位环境因素差异决定，通过样点实测值减去该样点所属的植被_土类单元均值获得。考虑到土壤有机碳与各定量因子间的非线性关系，采用径向基函数人工神经网络模型（Radial Basis Function Neural Network，RBFNN)来表达fUi+hk)与气象、地形及植被指数因子间的非线性关系，其中模型输入变量为由各定量环境因子转化而来的主成分。该神经网络模型能较好地刻画多元变量间的非线性映射关系，在土壤性质空间分布预测中取得了较成功的应用。同时考虑到土壤有机碳与各定量因子间的空间非平稳性以及之前研究结果，按土纲和植被类型划分出22个植被-土纲单元，分别在每一个植被-土纲单元中构建一个RBFNN模型，以表达在不同空间单元内土壤有机碳与各因子间不同的非线性关系，其表达式如下：
[0011] f ' (xi；k, yJ； k) = RBFNNn [PCI (xi；k, yJ； k), PC2 (xi；k, yJ； k), . . . , PCll (xi；k, Yjjk)] (2)式中，f'（Xi，k，yj，k)为神经网络模型对f (Xi，k，yj，k)的预测值；PCI (Xi，k，yj，k)? PCll (Xi，k，yj，k)为神经网络模型的输入变量，由气象、地形及植被指数等11个定量环境因子通过主成分分析转化而来，表示点位（Xi, y」）处的11个主成分值；n = 1,2,…，22,表示22 个植被-土纲单元。
[0012] (3)r (Xi,k，y」,k):为点位（Xi，y」）处去除研究中所选因素的影响后剩余的残差项，由样点实测值减去样点所属的植被-土类单元均值和RBFNN模型对f(xi;k，hk)的预测值获得。该部分的空间变化采用高精度曲面模型（High accuracy surface modeling,HASM)来进行模拟。该模型已在模拟气象、地形和土壤性质等生态因子空间变化的研究中取得了较好的效果。
[0013] 所述的该融合环境因素的土壤有机碳空间分布模拟方法（HASM_EF)模拟过程如下：
[0014] (1)将植被类型图和土壤类型图进行叠加，得到植被-土类单元组合的空间分布图；再以利用建模点统计得到的各植被-土类单元的土壤有机碳含量均值对图中相应的图斑进行赋值，生成Ikm分辨率土壤有机碳的各植被-土类单元均值空间分布曲面m(k)。
[0015] (2)以样点实测值减去样点所属的植被-土类单元均值，得到各样点的植被-土类均值残差，对该残差值进行必要的变换后（正态变换，图2c)，在每一个植被-土纲单元中以该残差变换值为输出变量，以环境因子主成分为输入变量，在软件MATLAB中分别训练适合于对应植被-土纲单元的RBFNN模型；然后将各环境因子主成分和植被-土纲单元组合空间分布栅格数据转换为矩阵数据，以植被-土纲单元组合为控制条件，在MATLAB中完成对植被-土类均值残差f'（Xi，k，ylk)空间分布的预测，并将预测结果以文本文件导出，在 ArcGIS软件中转化为Ikm分辨率的栅格数据。
[0016] (3)再以样点实测值减去前两部分的预测结果，得到去除所选因素影响后剩余的残差项r (Xi，k，yj，k)，以HASM模型进行模拟，得到对该残差项r (Xi，k，yj，k)空间变化的模拟结果 r'（xi，k，yj，k)。
[0017] (4)最后将 m(k)、f'（Xi，k，y」，k)和 r'（Xi，k，y」，k)3 个部分相加，即得到 HASM_EF 方法对土壤有机碳空间分布的模拟结果。
[0018] 本发明的有益效果：本发明的建模过程考虑了不同因素对国家尺度上土壤有机碳空间变异的解释能力；以环境因子主成分代替原环境因子作为模型输入变量，消除了原环境变量间的共线性；而在不同植被-土纲单元内建立神经网络模型则解决了其非线性问题以及在一定程度上考虑了其空间非平稳性问题；同时对残差的空间分布也进行了模拟。该方法不仅能反映土壤有机碳空间分布的宏观格局，还能较好地揭示土壤有机碳空间变化的细节信息，预测精度高。

【专利附图】

【附图说明】
[0019] 下面结合附图和【具体实施方式】来详细说明本发明；
[0020] 图1为本发明的建模点和验证点空间分布图；
[0021] 图2为本发明的土壤有机碳含量值、自然对数转换值及植被土类均值残差 Johnson转换值的频率分布图；
[0022] 图3为本发明的土壤有机碳各数据项的半方差函数图
[0023] 图4为本发明的不同方法对验证点有机碳的预测值与实测值间的线性关系图。

【具体实施方式】
[0024] 为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面结合

【具体实施方式】，进一步阐述本发明。
[0025] 参照图1至图4,本【具体实施方式】采用以下技术方案：所述的该融合环境因素的土壤有机碳空间分布模拟方法（HASM_EF)模拟过程如下：
[0026] (1)将植被类型图和土壤类型图进行叠加，得到植被-土类单元组合的空间分布图；再以利用建模点统计得到的各植被_ 土类单元的土壤有机碳含量均值对图中相应的图斑进行赋值，生成Ikm分辨率土壤有机碳的各植被-土类单元均值空间分布曲面m(k)。
[0027] (2)以样点实测值减去样点所属的植被-土类单元均值，得到各样点的植被-土类均值残差，对该残差值进行必要的变换后（正态变换，图2c)，在每一个植被-土纲单元中以该残差变换值为输出变量，以环境因子主成分为输入变量，在软件MATLAB中分别训练适合于对应植被-土纲单元的RBFNN模型；然后将各环境因子主成分和植被-土纲单元组合空间分布栅格数据转换为矩阵数据，以植被-土纲单元组合为控制条件，在MATLAB中完成对植被-土类均值残差f'（Xi，k，ylk)空间分布的预测，并将预测结果以文本文件导出，在 ArcGIS软件中转化为Ikm分辨率的栅格数据。
[0028] (3)再以样点实测值减去前两部分的预测结果，得到去除所选因素影响后剩余的残差项r (Xi，k，yj，k)，以HASM模型进行模拟，得到对该残差项r (Xi，k，yj，k)空间变化的模拟结果 r'（xi，k，yj，k)。
[0029] (4)最后将 m(k)、f '（Xi，k，y」，k)和 r'（Xi，k，y」，k) 3 个部分相加，即得到 HASM_EF 方法对土壤有机碳空间分布的模拟结果。
[0030] 土壤有机碳数据来自于第二次全国土壤普查时采集的典型土壤剖面。这些典型土壤剖面数据资料记录在《中国土种志》及各省级土种志中，每一个剖面都较详细地记录了该土壤剖面的采样地点、成土母质、土壤类型、地形特征、土地利用类型以及土壤理化性质等信息。本研究收集整理了这些资料，建立了第二次全国土壤普查的典型土壤剖面数据库，并结合全国行政区划、全国居民点空间分布数据、土壤类型图、母质图、植被类型图、90m分辨率D EM和1 :25万地形图等辅助资料对各剖面点位置逐一进行了定位，尽可能使各土壤剖面的位置接近原采样点位置，同时使定位处的环境条件符合各土壤剖面记录的环境信息；共整理获得6000多个具有相对准确位置信息的典型剖面。作为方法探讨，本研究仅选择表层土壤有机碳作为研究对象。
[0031] 个别样点由于受到点位异常环境因素影响，可能出现极端异常值，从而掩盖土壤有机碳与环境因素间的普遍关系，进而影响到预测结果的可靠性，因此需要对极端异常值进行排除。研究中采用样本平均值加减三倍标准差的方法在58 土类和6种土地利用方式 (林地、灌木、草地和3种不同熟制的农地）中标记异常值，同时在各土类和土地利用方式中标记为异常值的剖面点被最终确定为异常值进行剔除，研究中实际使用的样点数为6179 个（图1)。为评价模拟方法的精度，在ArcGIS的地统计学模块中将6179个样点随机分为建模数据集和验证数据集，分别包含5561个样点（90% )和618个样点（10% )，其空间分布见图Ia和图lb。
[0032] 根据土壤概念模型以及融合环境因子进行土壤性质空间分布模拟的相关研究，选择与几大成土因素相关的指标作为建模的辅助因子，包括气象、地形、植被、土地利用方式和土壤类型等定性和定量因子。定量因子中，气象数据来自于全国671个气象站1971年至 2000年30年的统计数据；由于气象因子具有较高的空间自相关性，研究中采用普通克里格法生成全国Ikm分辨率的多年平均气温（Temperature, T)、降水（Precipitation, P)、相对湿度（Relative Humidity，RH)、日照时数（Duration of Sunshine，DS)、太阳福射（Solar Radiation)和 >10°C积温（Accumulated Temperature, AT)的空间分布栅格数据。地形因子包括全国Ikm分辨率的DEM，以及利用Ikm DEM数据生成的坡度（Slope，S)、汇流面积 (Catchment area, CA)和地形湿度指数（Topographic index, TI)。归一化植被指数（NDVI) 采用分辨率为lkm、与第二次土壤普查时间最接近的1992年4月至1993年3月的36旬 AVHRR 数据平均值（来源于 USGS:http://edc2. usgs. gov/KM/lkmhomepage. php)。考虑到定量因子间存在不同程度的共线性，采用主成分分析方法将11个定量指标转化为11个互不相关的主成分（Principal Component, PC)作为模型的输入变量。定性因素选择了土壤类型和植被类型，研究中使用的全国1 :1〇〇万的土壤类型图和植被类型图来源于中国科学院资源环境数据中心。
[0033] 本【具体实施方式】利用了不同环境因素对国家尺度上土壤有机碳空间异质性形成的作用及解释能力，考虑了土壤有机碳与环境因子间关系的非线性、空间非平稳性以及各因子间的共线性，有效地提高了模拟精度，且模拟结果更符合实际情况，各项预测误差降低了 16. 86 %?47. 46%，有效地提高了模拟精度；模型性能指数为2. 26,达到了高精度模拟标准。实现了国家尺度上土壤有机碳空间分布的高精度模拟，同时也可为较大尺度上土壤性质的时空变化研究提供方法参考。
[0034] 实施例1 :对5561个建模样点的统计结果表明，中国表层土壤有机碳含量范围在 0. 35?262. 74g/kg之间，平均值为16. 96g/kg，变异系数达到116. 11%，属于极强烈的空间变异（表1)。从数据的分布形态来看，原始数据呈明显的偏态分布（图2a)，通过自然对数转换后其偏度值和峰度值以及分布频率图明显接近正态分布（图2b)。而植被土类均值残差经Johnson变换后的值更符合正态分布（图2c)，因此将符合正态分布的数据项用于相应的普通克里格插值、相关分析、回归分析以及神经网络建模。
[0035] 不同土地利用方式下土壤有机碳含量差异明显，自然植被土壤有机碳含量明显高于农业植被（表1)。自然植被中，林地土壤有机碳含量最大，为28. 63g/kg，其次是草荒地 23. 13g/kg，灌木地最小为20. 14g/kg。3种自然植被类型下土壤有机碳含量差异达到极显著（P〈0. 001)。农业植被的3种熟制中，一年三熟农地土壤有机碳含量略大于其他2种熟制类型，但差异不显著。从变异系数来看，农业植被下土壤有机碳含量变异系数在48. 80? 76. 42%之间，均属于中等程度的变异性。自然植被下土壤有机碳含量变异性明显大于农业植被；其中林地土壤有机碳含量变异系数为93. 72%，接近极强的变异性，灌木和草荒地土壤有机碳含量变异系数均超过100%，属于极强烈的空间变异性。
[0036] 表1不同土地利用方式下土壤有机碳含量统计特征
[0037]

【权利要求】
1. 融合环境因素的大尺度土壤有机碳空间分布模拟方法，其特征在于，包括以下步骤： (1)将植被类型图和土壤类型图进行叠加，得到植被-土类单元组合的空间分布图；再以利用建模点统计得到的各植被-土类单元的土壤有机碳含量均值对图中相应的图斑进行赋值，生成lkm分辨率土壤有机碳的各植被-土类单元均值空间分布曲面m(k); (2) 以样点实测值减去样点所属的植被-土类单元均值，得到各样点的植被-土类均值残差，对该残差值进行必要的变换后，在每一个植被-土纲单元中以该残差变换值为输出变量，以环境因子主成分为输入变量，在软件MATLAB中分别训练适合于对应植被-土纲单元的RBFNN模型；然后将各环境因子主成分和植被-土纲单元组合空间分布栅格数据转换为矩阵数据，以植被-土纲单元组合为控制条件，在MATLAB中完成对植被-土类均值残差空间分布的预测，并将预测结果以文本文件导出，在ArcGIS软件中转化为lkm 分辨率的栅格数据； (3) 再以样点实测值减去前两部分的预测结果，得到去除所选因素影响后剩余的残差项r (Xi，k，yj，k)，以HASM模型进行模拟，得到对该残差项r (Xi，k，yj，k)空间变化的模拟结果 r'（xi，k，yj，k); ⑷最后将m(k)、f'（Xi，k，yj;k)和r'（Xi， k，yj;k)三个部分相加，即得到HASM_EF方法对土壤有机碳空间分布的模拟结果。
2. 根据权利要求1所述的融合环境因素的大尺度土壤有机碳空间分布模拟方法，其特征在于，所述的步骤（2)和步骤（3)的样点实测值由不同因素决定的3个部分： z (xi, k. Yj, k) = m (k) +f (xi； k, yJ； k) +r (xi； k, yJ； k) (1) 式中：Z(Xi，k，hk)表示在点（Xi， yp处属于第k种定性因素或定性因素组合的土壤样点的有机碳含量实测值，（Xi，yP为点位坐标;m(k)为第k种定性因素或定性因素组合的土壤有机碳含量平均值，该均值差异反映由不同定性因素或定性因素组合引起的土壤有机碳含量空间变异汀('1;，7」，1;)为点位0^7」）处去除定性因素影响后由该点位处气象、地形及植被盖度等点位环境因素差异引起的土壤有机碳含量变异；r(Xi，k，hk)为点位（ Xi，yp处去除研究中所选因素的影响后剩余的残差项，由研究中未考虑到的其它因素或点位处其它因素引起；假设3个部分相互独立，可由分别不同的方法获取： (1) m(k):由定性因素决定的土壤有机碳空间变异部分；研究表明，土壤类型和土地利用方式在不同尺度上均是土壤有机碳空间分布的重要影响因子，且分类级别越低，对土壤有机碳空间变异的反映能力越高；本研究中m(k)部分以土壤类型和土地类型2个因素不同组合类型下土壤有机碳的均值来表示；根据之前的研究结果以及考虑到不同组合类型下需要有一定数量的样本数进行统计，研究中根据土地类型划分出自然植被和农业植被2个类型，将2个植被类型与58个土类进行组合，部分组合中土壤样本数少于3个，则将其合并到相同植被类型下相同土纲内统计均值最接近的其它植被-土类组合中，共获得97个植被-土类分类单元；最后以建模样点数据分别统计各植被-土类单元土壤有机碳含量均值； (2) f (Xi，k，yj，k):反映点位（Xi， yj)处某一定性因素组合内部的土壤有机碳含量变异，由该点位处气象、地形及植被盖度等点位环境因素差异决定，通过样点实测值减去该样点所属的植被-土类单元均值获得；考虑到土壤有机碳与各定量因子间的非线性关系，采用径向基函数人工神经网络模型来表达f(Xi，k，yj，k)与气象、地形及植被指数因子间的非线性关系，其中模型输入变量为由各定量环境因子转化而来的主成分；该神经网络模型能较好地刻画多元变量间的非线性映射关系，在土壤性质空间分布预测中取得了较成功的应用；同时考虑到土壤有机碳与各定量因子间的空间非平稳性以及之前研究结果，按土纲和植被类型划分出22个植被-土纲单元，分别在每一个植被-土纲单元中构建一个RBFNN模型，以表达在不同空间单元内土壤有机碳与各因子间不同的非线性关系，其表达式如下： f ' (xi;k, yJ;k) = RBFNNJPC1 (xi；k, yJ；k), PC2 (xi；k, yJ；k), ..., PC11 (xi；k, yJ；k)] (2) 式中，f'（Xi，k, y」，k)为神经网络模型对f (Xi，k, y」，k)的预测值；PCI (Xi，k, y」，k)? PC11 (Xi，k，yj，k)为神经网络模型的输入变量，由气象、地形及植被指数等11个定量环境因子通过主成分分析转化而来，表示点位（Xi, y」）处的11个主成分值；n = 1,2,…，22,表示22 个植被-土纲单元； (3)r (Xi，k，hk):为点位（Xi，以处去除研究中所选因素的影响后剩余的残差项，由样点实测值减去样点所属的植被-土类单元均值和RBFNN模型对f(xi;k，ylk)的预测值获得；该部分的空间变化采用高精度曲面模型（High accuracy surface modeling，HASM)来进行模拟；该模型已在模拟气象、地形和土壤性质等生态因子空间变化的研究中取得了较好的效果。
【文档编号】G06F17/50GK104408258SQ201410717756
【公开日】2015年3月11日申请日期:2014年12月1日优先权日:2014年12月1日
【发明者】李启权, 王昌全, 高雪松, 李冰, 袁大刚, 岳天祥, 杜正平, 史文娇申请人:四川农业大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李启权;王昌全;高雪松;李冰;袁大刚;岳天祥;杜正平;史文娇;
技术所有人：四川农业大学;
我是此专利的发明人

上一篇：基于粒子群算法的探测设备网的设备分配方法
上一篇：基于模糊算法的iec 61850配置文件工程化一致性测试方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。