土壤属性值的计算方法及装置与流程

文档序号:17250141发布日期:2019-03-30 09:01阅读:492来源:国知局
土壤属性值的计算方法及装置与流程

本发明涉及土壤数字制图技术领域,更具体地,涉及土壤属性值的计算方法及装置。



背景技术:

由于成土母质、土壤类型、地形地貌、区域气候、生物环境等自然因素和人类活动(土地利用方式如矿山开采、冶炼、工业生产排放、农田耕作以及农业管理措施等)的综合影响,土壤属性具有一定的空间分布特点,并表现出一定的空间结构性和随机性,区域土壤属性值(连续)既存在空间分异性,也存在空间自相关性,同时与环境因素间存在互作用性。精细化农业管理需要掌握田块内部各点土壤肥力进行差异化施肥、施药,在提高农业生产效益的同时减少农业环境污染。同时,治理日益加剧的土壤污染要求能够准确掌握土壤污染现状,实现有效的土壤污染风险评估,为土壤污染监测、防治与修复提供准确本底基础。因此,区域内土壤属性值(土壤有机质、碱解氮、速效磷、ph值以及土壤重金属等)空间预测准确与否,对于农业、环境、生态、国土资源等方面的科研和生产实际工作具有重要的影响作用。

土壤属性预测结果的准确度一方面受土壤属性本身内在特征影响,另一方面受土壤采样样本量、采样空间尺度和插值估算方法及参数、样点空间构型、土壤环境因素的辅助信息等诸多因素的影响。因此在基于已有采样点基础上,如何更充分利用样点信息和土壤环境信息进行土壤属性值估算,对于准确预测土壤空间信息,解决农业生产、环境保护、生态和国土资源管理等方面热点问题具有十分重要的理论及现实意义。

在实际采样实践中,受采样方式和成本的限制,很难做到高密度的采样。因此,在土壤属性插值操作中必须根据有限的、离散点估测区域土壤属性空间分布。少量采样点的不能代表整个区域的土壤属性含量,但是采样点数量过多也会造成财力、物力、人力、资源的浪费以及数据冗余等问题。鉴于背景技术方案中所述土壤属性插值的复杂性,通过少量采样点属性信息以及土壤环境变量准确估算区域待测点土壤属性含量,实际是合理的插值策略制定、选择的问题。

当前获取土壤属性空间分布的方法大都以土壤采样点数据为基础的插值方法,如反距离加权平均(idwa:inversedistanceweightedaveraging)、样条函数方法(spline)、多元回归方法(polynomialregression)、趋势面分析(tsa:trendsurfaceanalysis)、普通克里金(kriging)与共协克里金方法(co-kriging)、分层克里金等,这些方法都与采样点的数量和空间分布有一定相关性,但这些方法存在以下问题:1)仅利用了土壤采样点之间空间相关信息(样点距离远近、样点整体变化趋势),而忽略了土壤属性本身特征和环境辅助因素等有效信息,导致待插值点误差大;2)插值方法容易受样点数量、样点构型(样点距离、空间结构及均匀性)、样点属性值特征等因素影响,当采样点间距大于土壤属性变程时,或者区域变化复杂且样点稀疏时,采样密度低等情况下,均会引起预测精度和准确度的下降。



技术实现要素:

本发明提供一种克服上述问题或者至少部分地解决上述问题的土壤属性值的计算方法及装置。

第一个方面,本发明实施例提供一种土壤属性值的计算方法,包括:

选取对土壤属性值具有显著性影响的环境因素,作为影响因素,计算各影响因素对所述土壤属性值影响的权重;

采集待测点和各采样点的影响因素的值,结合所述各影响因素对所述土壤属性值影响的权重,计算待测点与每个采样点的土壤属性值在环境因素层面的相似度;

若所述土壤属性值在采样点的分布满足二阶平稳假设、内蕴平稳假设或者准二阶平稳假设,则基于所述采样点计算空间自相关距;若所述土壤属性值在采样点的分布不满足二阶平稳假设或者内蕴平稳假设,则基于各地块的影响因素计算环境因素的多尺度的空间相关距;

根据所述空间自相关距或所述多尺度的空间相关距确定所述待测点的空间邻域,将所述空间邻域内的采样点作为参考点,将所述待测点与所述参考点在环境因素层面间的相似度以及所述参考点的土壤属性值输入预先构建的计算模型,获得待测点的土壤属性值;

其中,所述预先构建的计算模型根据在空间邻域内的两两采样点在环境因素层面的相似度以及采样点的土壤属性值获得。

第二个方面,本发明实施例提供一种土壤属性值的计算装置,包括:

影响因素获取模块,用于选取对所述土壤属性值具有显著性影响的环境因素,作为影响因素,计算各影响因素对所述土壤属性值影响的权重;

环境因素相似度计算模块,用于采集待测点和各采样点的影响因素的值,结合所述各影响因素对所述土壤属性值影响的权重,计算待测点与每个采样点的土壤属性值在环境因素层面的相似度;

相关距确定模块,用于若所述土壤属性值在采样点的分布满足二阶平稳假设、内蕴平稳假设或者准二阶平稳假设,则基于所述采样点计算空间自相关距;若所述土壤属性值在采样点的分布不满足二阶平稳假设或者内蕴平稳假设,则基于各地块的影响因素计算环境因素的多尺度的空间相关距;

属性值计算模块,用于根据所述空间自相关距或所述多尺度的空间相关距确定所述待测点的空间邻域,将所述空间邻域内的采样点作为参考点,将所述待测点与所述参考点在环境因素层面间的相似度以及所述参考点的土壤属性值输入预先构建的计算模型,获得待测点的土壤属性值;

其中,所述预先构建的计算模型根据在空间邻域内的两两采样点在环境因素层面的相似度以及采样点的土壤属性值获得。

第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。

第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。

本发明实施例提供的土壤属性值的计算方法及装置,充分利用了与待测点的土壤属性相关的环境因素信息和空间邻域的采样点的土壤属性信息,能够更好地刻画突变边界处土壤属性的空间变异,确保土壤属性值更加贴近实际情况,能够克服因采样点密度不均一、采样密度低、采样点数量少而导致的部分预估区域属性值误差过大的问题,并且不但可以进行土壤属性的内插计算也可以用于采样点覆盖区域外的相似空间外推计算。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的土壤属性值的计算方法的流程示意图;

图2为本发明实施例提供的土壤属性值的计算装置的结构示意图;

图3为本发明实施例提供的电子设备的实体结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为了克服现有技术的上述问题,本发明实施例提供了一种土壤属性值的计算方法,其发明构思为:首先对研究区域内的采样点的土壤属性值以及环境因素进行采集,通过分析获得对土壤属性值具有显著影响的环境因素,根据环境因素的特点建立定量型和定性型的相似度模型,以计算待测点和采样点在环境因素层面的相似度,通过考虑环境因素的空间相关性,建立兼顾环境因素相似和空间自相关的计算模型,并确立土壤环境变量和空间自相关性的权重系数,利用本发明实施例的计算方法可以快速的实现区域内土壤属性值的推算,也可以实现采样点覆盖区域外土壤属性值得估算。

图1为本发明实施例提供的土壤属性值的计算方法的流程示意图,如图所示,包括:

s101、选取对土壤属性值具有显著性影响的环境因素,作为影响因素,计算各影响因素对土壤属性值影响的权重。

本发明实施例结合土壤发生学知识,通过土壤属性插值关键词检索以及文献知识挖掘方法检索国内外文献资料,收集并整理可能影响土壤属性值变化的环境因素,然后从影响待计算的土壤属性y的变化成因的角度分析小尺度研究区域内土壤环境的主要影响因素以及表征因素水平的表征因素,建立土壤环境因素候选集,s{x1,x2,…,xn},其中xn表示第n种候选环境因素,具体地,可以是表层土壤质地、土壤类型、土壤ph值、灌溉保证率、地形、耕地类型、肥料投入、农田管理措施等等。

根据环境因素的值的类型(简称环境因素的类型)划分用于因素方差分析的因素的水平,若环境因素的类型为定性型,则按类别或者相近类别合并大类作为方差分析的因素的水平,确保每个水平的观测值不少于5个。若环境因素的类型为定量型,则采用标准分类方法分成r个因素水平,具体因素的水平的划分方法有分位数法、自然间断点分级法、标准差法、自定义间隔分级法(根据已有的因素分级的技术规程标准或者使用者自定义,本发明实施例不作具体的限定)。

表1示出了已知采样点的候选环境因素的因素水平的观测值表,其中,a1,a2,...,ar表示某单一候选环境因素的r个因素水平,x11,x21,表示已知采样点的单一候选环境因素在不同因素水平下的待估属性的观测值。

表1已知采样点的候选环境因素的因素水平的观测值表

通过已有采样点的环境因素的值和土壤属性值,按照因素水平r构建土壤属性y与候选环境因素x的单因素方差分析模型,选取显著性水平a(0.1、0.05、0.025、0.001),采用f分布检验候选因素对于土壤属性是否存在显著性影响,对于f分布检验显著的环境因素作为相似度计算的影响因素,建立影响因素集s{x1,x2,…,xm},m表示影响因素的总数。具体实现可以通过spss的单因素anova检验。

根据最终确定的影响因素,依据单因素各水平观测值(如表1)计算环境变量因素对待估测属性的影响程度/相关度/解释度q。在实际应用时,可以通过地理探测器软件geodetector(下载地址:http://www.geodetector.org/)中的分异及因子探测器的q统计值探测。q的物理意义是用于探测影响因素x多大程度上解释了待计算属性y的差异性,其计算公式为:

式中:h=1,…,r为影响因素x的水平类;nh为水平h的个数,n为已知采样点的个数;和δ2分别是水平h的方程和全部采样点的y值的方差。q的值域为[0,1]。

根据各影响因素的q值计算影响因素的权重系数wi,建立权重系数向量w(w1,w2,…,wm),wi的计算公式为;

s102、采集待测点和各采样点的影响因素的值,结合各影响因素对土壤属性值影响的权重,计算待测点与每个采样点的土壤属性值在环境因素层面的相似度。

需要说明的是,待测点的土壤属性值估算的关键在于刻画已有采样点与待测点之间的土壤环境因素的相似度。设整个研究区部分地块有采样点,部分地块无采样点,且无采样地块或者待估点位于采样点最小凸包外,将待测点的土壤属性值与每个采样点的土壤属性值在环境因素层面的相似度表达为:

s=f(e)=f(e1,…,em)

其中,e1,…,em为影响因素,f(e)代表所有影响因素作用下的土壤属性值的相似关系。本发明实施例分别计算对于每个影响因素,待测点与已知采样点之间的相似度,最终结合每种影响因素的权重值,计算待测点与每个采样点的土壤属性值在环境因素层面的相似度。

s103、若土壤属性值在采样点的分布满足二阶平稳假设、内蕴平稳假设或者准二阶平稳,则基于采样点计算空间自相关距;若土壤属性值在采样点的分布不满足二阶平稳假设或者内蕴平稳假设,则基于各地块的影响因素计算环境因素的多尺度的空间相关距。

需要说明的是,空间相关距是观测到的某种现象在某一个尺度上的自相关距离,是该现象的一种内在尺度;空间上距离近的采样点差异性会较小而相似性较大,空间上距离远的采样点差异性会较大而相似性较小。二阶平稳假设指区域化变量z(x)的任意n维分布函数不因空间点x发生位移而改变。它具有数学期望存在且平稳、方差存在且平稳的性质,也即某个空间点x的位置偏移h距离时,偏移后对应的性质与偏移前的性质相同。二阶平稳、内蕴平稳和准二阶平稳都是为了获得基本重复规律而作的基本假设。当满足地统计学的假设条件(二阶平稳、内蕴平稳或者准二阶平稳)时,可以利用变异函数理论模型计算出区域划现象的相似性的尺度大小,也即空间自相关距。空间自相关距通常用半变异函数的变程来刻画。

土壤属性的空间变异程度受影响的因素较为复杂,同时受限制于受样点数量、样点构型(样点距离、空间结构及均匀性)、样点属性值特征等影响往往不满足地统计学的假设条件(二阶平稳、内蕴平稳或者准二阶平稳假设)。当不能满足地统计学的假设时,我们一般用土壤属性不存在常规上的空间自相关距,可能表现为土壤属性在不同尺度上有不同特征或者现象,而这种特征或者现象往往受到土壤属性的环境因素影响,因此可通过计算环境因素的特征尺度来反映土壤属性在不同尺度下的相似性,也即转化成计算环境因素的多尺度值也即多尺度的空间相关距。在模型中,不同尺度下的空间相关距下参与计算的采样点数量和各采样点的权重均不同,虽然公式一样,其土壤属性估计值结果不同。

s104、根据空间自相关距或多尺度的空间相关距确定待测点的空间邻域,将空间邻域内的采样点作为参考点,将待测点与参考点在环境因素层面间的相似度以及参考点的土壤属性值输入预先构建的计算模型,获得待测点的土壤属性值;其中,预先构建的计算模型根据在空间邻域内的两两采样点在环境因素层面的相似度以及采样点的土壤属性值获得。

需要说明的是,当土壤属性值在采样点的分布满足二阶平稳假设或者内蕴平稳假设时,本发明实施例显然会根据空间自相关距确定待测点的空间邻域,当土壤属性值在采样点的分布不满足二阶平稳假设或者内蕴平稳假设时,会根据多尺度的空间相关距确定待测点的空间邻域。可以理解的是,空间邻域内采样点的土壤属性,与待测点的土壤属性具有较大相似度。本发明实施例的计算模型兼顾了环境因素层面的相似性以及空间自相关,能够更准确地计算土壤属性值。计算模型的构建过程中,由于采样点的土壤属性值和影响因素的值都是已知的,因此,可以将采样点作为待测点,通过将在空间邻域内的两两采样点在环境因素层面的相似度以及其余采样点的土壤属性值作为输入项,生成待测点预计的土壤属性值,再将预计的土壤属性值与真实的土壤属性值进行比较,进而调成计算模型中的参数,最终获得高准确度的计算模型。

本发明实施例的计算方法充分利用了与土壤属性值相关的环境因素的信息,能够更好地刻画突变边界处土壤属性的空间变异,确保土壤属性值更加贴近实际情况,能够克服因采样点密度不均一、采样密度低、采样点数量少而导致的部分预估区域属性值误差过大的问题,并且不但可以进行土壤属性的内插计算也可以用于采样点覆盖区域外的相似空间外推计算。

在上述各实施例的基础上,作为一种可选实施例,计算待测点与各采样点在环境因素层面间的相似度,具体为:

对于任意一个影响因素,确定影响因素的值的类型,根据类型的特点和作用机理,确定待测点和采样点关于影响因素的相似度;

根据各影响因素的权重以及待测点与采样点关于各影响因素的相似度,获得待测点与采样点在环境因素层面的相似度。

具体地,本发明实施例将影响土壤属性值的影响因素用向量结构定义为:

a={[a1,v1,w1],[a2,v2,w2],…,[am,vm,wm]}

其中,a为土壤属性值,a为影响因素,v为影响因素的值,w为影响因素所占的权重值。

对于待测点d与采样点d'的土壤属性值在环境因素层面的相似度为α(d,d'),p为待测点的影响因素的集合,待测点d与采样点d'的影响因素p(p∈p)的值分别为待测点和采样点关于影响因素的相似度计算函数为wp为每种影响因素的权重值,待测点与各采样点在环境因素层面间的相似度的表达式为:

定性型的影响因素是指有序数据、二元数据、名义尺度数据。有序数据指有大小次序关系,二元数据通常是用0或者1表示土壤类型的有或者无,名义尺度数据也即类别型数据,其属性具有两个或者两个以上的状态值,一般用字符串、类别符号等表示,如土壤质地(壤质砂土、砂质壤土、壤土、粉砂质壤土、砂质粘壤土、粘壤土等)、土壤类型(红壤、棕壤、褐土、黑土、栗钙土、漠土、潮土、水稻土、盐碱土、岩性土和高山土等)。有序数据和名义尺度数据,这两类指标其属性值相对独立,紧邻的属性值在某些性质上保持一定的相似和接近度。对于完全相同的属性则相似度赋值为是1,若采样点与待测点属性接近为0.5,若两者属性值差异较大,则相似度赋值为0。待测点和采样点关于定性型影响因素的相似度计算函数为:

其中,表示与待测点d的属性接近的采样点d′的属性值集合,可列的属性集合为{v1,…,vm}sim;表示与待测点d的属性差异较大的采样点d′的属性值集合,可列的集合为{v1,…,vm}disc。

定量型的影响因素是采用数值形式描述指标的属性值,如有机质含量、ph值、高程等,此类属性变量的特点是数值处于一定阈值内的具体数值。根据属性的具体特性进行连续数据离散化,具体可通过相关规程标准划分出若干级别l1~ln。对于同属于一个级别则相似度为1,结合具体属性特点判定相邻级别的属性存在一定的相似性,则相似度赋值为0.5;对于两个级别性质相差较远,则相似度赋值为0。待测点和采样点关于定量型影响因素的相似度计算函数为:

其中,表示与待测点d的属性接近的采样点d′的属性分级的集合,可列的属性值分级集合为{lj=l1,…,lm}sim;表示与待测点d的属性分级差异较大的采样点d′的属性分级的集合,可列的集合为{lj=l1,…,lm}disc,其中li,lj为数值变量按规程标准、文献以及数据特征人为划分的级别数。

在上述各实施例的基础上,作为一个可选实施例,基于采样点计算空间自相关距,具体为:

采集采样点的坐标和土壤属性值构建半方差函数,计算半方差函数的变程,以作为空间自相关距。

需要说明的是,本发明实施例主要是探测研究区内土壤属性值的空间自相关性,借助采样点的数据计算的空间相关距,构建耦合空间自相关和属性相似的计算模型。

采用采样点土壤属性值的空间变异分析表征采样点的空间自相关性,当土壤属性值满足地统计学的二阶平稳假设或者内蕴稳定假设时,其空间自相关性可用半变异函数刻画。

首先去除个别全局的离群值样点,采用概率直方图检验数据频率分布,若不满足正态分布则进行log、square-root转换后使其满足正态分布,则进行半变异函数拟合,否则不再进行半变异函数的计算。其次,基于采样点数据进行全局趋势分析和数据各向异性分析,根据采样点数据是否存在全局趋势、是否存在各向异性情况,选择理论半变异函数模型(例如高斯模型、指数模型和球状模型),设置模型的块金常数,其对已有采样点空间变异值拟合后残差最小,求解半方差函数变程h。

本发明实施例是对采样点数据的空间自相关性进行探测,具体操作步骤是,导入采样点数据(含采样点x、y位置和土壤属性值)到gs+软件中,通过数据转换(datatransform)进行non、log、square-root等模式数据转换并进行数据正态分布检验。若采样点数据经过转换后仍不符合正态分布,则不进行后续的变程计算。若数据符合正态分布,则通过半方差分析(seminvarianceanalysis)进行数据的全局趋势分析以及各向异性分析,设置滞后距和半方差函数模型(球面模型、指数模型、高斯模型、线性模型)等,计算模型的决定系数r、残差rss、块金值c0和变程a。

在上述各实施例的基础上,作为一种可选实施例,空间相关距具体包括:

大尺度的主导因素的混合相关距用于表征以地块为单元计算的大尺度上的因素的全局空间相关性,所述大尺度的主导因素值为定量型;

中尺度的主导因素的混合相关距用于表征以地块为单元计算的中尺度上因素的局部空间相关性,所述中尺度的主导因素值为定量型,或者可转化为定量型;

小尺度的主导因素的混合相关距ry,用于表征以地块为单元计算的小尺度因素的空间相关性,所述小尺度的主导因素值为定性型;

其中,主导因素为影响因素中对土壤属性值具有显著影响的因素,定量型主导因素的值的类型为定量型,定性型主导因素的值的类型为定性型。

需要说明的是,本步骤主要是探测地块的环境因素局部、全局的空间分布规律和空间组团集聚性,进一步分析影响土壤属性值的特征尺度和空间自相关距。土壤属性值具有多尺度效应,在较大尺度上表现为分区异质性,在较小的区域内表现出均质性,具有区内的属性相似的特征,在同一个分布区内的观测数据之间潜在的相互依赖性。地理实体总是表现出一定的空间相关性。tobler地理学第一定律指出:任何事物与别的事物之间都是相关的,但近处的事物比远处的事物的相关性更强。表征地块间相关性可以用全局空间自相关系数和局部空间自相关系数来描述。具体方法和步骤如下:

选取地理探测器中q值较大,在影响因素向量中占主导的因素,因素权重和占75%以上的2-5个影响因素,作为主导因素。

探测大尺度主导因素的空间自相关性,若主导因素为定量型或者可转化为定量型主导因素,可通过计算定量型主导因素的全局空间自相关性,也即主导因素的全局集聚性或者全局的趋势性或者均值性,体现为距离越近越相关。若主导因素为定量型(变量个数为4>k>1),以地块为基本单元计算土壤环境的空间相关性,具体采用geoda软件中的空间统计分析模块探测地块属性(各地块的土壤属性值)在整个研究区域的空间关联性,空间关联性表现为空间聚类、空间离散和空间随机等。全局空间自相关性探测一般选用globalmoran'si指数值反映,空间自相关性globalmoran'si指数值的表达式为:

其中,xi和xj分别表示地块i、j的主导因素的值,n表示地块的数目,表示n个地块的主导因素的均值,表示n个地块的主导因素的方差,wij表示地块i和j之间的影响程度。

wij通常有三种方式确定:

(1)邻接关系:根据地块是否相邻来确定,相邻为1,不相邻为0;

(2)距离关系:通过距离值来确定,wij=(dij)-r,d为地块i、j间的距离或者小于设定距离阈值为1,大于距离阈值为0,r是反距离权重系数;

(3)最近k点关系:不考虑地块间距离的远近,设定相近地块个数为k,若属于设定的k个相近地块之一,则wij=1,否则wij=0。

指数值i的取值范围为[-1,1],主导因素的值要想被视为具有统计学上显著性的空间全局分布模式,需进行显著性检验,在进行检验之前,需对计算出的指数值进行标准化处理。

在0.05的置信水平下|z|=1.96,取|z|>1.96来表示地块的主导因素总体上自相关性是显著的。当z>1.96时表示是正的空间自相关的,即主导因素的取值分布存在高高相邻或低低相邻的情况,空间分布呈聚集状态,当z<-1.96时表示是负的空间自相关,即主导因素的取值分布存在高低相邻的情况,空间分布呈离散状态,|z|<1.96时,表示空间属性自相关性不显著,呈独立随机分布。

若存在全局空间聚集子区,则通过聚类算法(例如基于划分的方法、基于层次的方法、基于密度的方法、基于模型的方法)聚类后,度量各个聚类簇对应的子区的面积、周长后,分别求平均值记为as、ps,计算子区的平均影响距再对所有子区的平均影响距加权求和,获得定量型主导因素的全局尺度混合相关距,记为

wk为第k个定量型主导因素的权重

为第k个定量型主导因素的全局自相关的平均相关距。

具体操作步骤是,导入含有主导因素的耕地图斑文件(esrishp文件)到geoda中,选择邻接关系/距离关系/最近k点关系中的一种关系,计算各个点的空间邻接权重矩阵并生成邻接矩阵文件(trbl.gwt),选取主导因素,通过全局空间自相关分析模块计算moran'si指数,并获得z-score值,若z>1.96则主导因素存在空间相关,存在主导因素聚集区,若z<-1.96则表示是负的空间自相关,若|z|<1.96时,呈独立随机分布,没有集聚现象。若存在主导因素聚集区,则通过matlab、spss、gcluto等聚类软件中聚类算法(k-means、cure、som神经网络)计算主导因素子区平均影响距若存在多个主导因素,重复此步骤计算聚集区和求因素子区平均影响距,最终建立主导因素子区平均影响距集合

同时也探测中尺度主导因素的空间自相关性,若主要因素为定量型或者可转化为定量型主要因素,可通过计算定量型主导因素的局部空间自相关性,也即局部空间集聚性,也即地块的主导因素与邻近地块的主导因素的空间相关性。通常采用局部空间自相关指数表征空间某一地块的属性值同其邻接单元属性值相关程度,相关性表现为hh(高-高型)与ll(低-低型)、hl(高-低型)与lh(低-高型),其定义如下:

其中,xi和xj分别表示地块i、j的主导因素的值,n表示地块的数目,表示n个地块的主导因素的的均值,表示n个地块的主导因素的方差,wij表示地块i和j之间的影响程度。

如果局部自相关指数z得分大于1.96,则表示该地块属性与邻近单元高高(hh)聚集或低低(ll)聚集,具有统计显著性的相似值,如果z得分小于-1.96,则表示地块的主导因素与邻近地块的主导因素不一致,高低(hl)分布或低高(lh)分布,具有统计显著性的空间异常值。如果z得分在-1.96与1.96之间,则表示地块的主导因素在空间随机分布。若存在局部空间聚集或者空间异常子区,则直接度量多子区的面积、周长后求平均记为as、ps,计算子区的影响距再对所有子区的影响距进行加权求和,获得定量型主导因素的区域尺度混合相关距记为表示第k个定量型主导因素的局部自相关的平均相关距。

具体操作步骤是,导入含有主导因素的耕地图斑文件(esrishp文件)到geoda中,选择邻接关系/距离关系/最近k点关系中的一种关系,计算各个点的空间邻接权重矩阵并生成邻接矩阵文件(trbl.gwt),选取主导因素,通过局部空间自相关分析模块计算localmoran'si指数,并获得z-score值,若z>1.96则主导因素存在空间相关,存在主导因素聚集区,若z<-1.96则表示是负的空间自相关,若|z|<1.96时,呈独立随机分布,没有集聚现象。若存在主导因素聚集区,则通过matlab、spss、gcluto等聚类软件中聚类算法(k-means、cure、som神经网络)计算主导因素子区的平均影响距若存在多个主导因素,重复此步骤计算聚集区和求主导因素因素子区平均影响距,最终建立主导因素子区平均影响距集合

若主导因素为小尺度的因素,主导因素为定性型(变量为j>1)或可以转化为定性型,则在arcmap或者geoda软件中采用量算工具,测算主导因素的分区(sub-regions)的面积as、周长ps,因素分区若不存在可通过同属性值地块合并方式重新生成分区。计算子区的影响距可通过若存在多个主导因素j>1,重复此步骤计算主导因素子区平均影响距,最终建立主导因素子区平均影响距ry表示定性型主导因素的全局尺度混合相关距,wj表示第j个定性型主导因素的权重,表示第j个定性型主导因素的平均相关距。

在上述各实施例的基础上,根据空间自相关距或多尺度的空间相关距确定待测点的空间邻域,具体为:

当根据空间自相关距确定待测点的空间邻域时,在以待测点为圆心,以空间自相关距为半径的第一圆域内搜索采样点,若采样点的个数超过第一预设阈值,则将第一圆域作为待测点的空间邻域;若采样点的个数未超过第一阈值,则逐渐增加第一圆域的半径,直至更新后的第一圆域内采样点的个数超过第二预设阈值,则将更新后的第一圆域作为待测点的空间邻域。

具体地,对于采样点满足地统计假设条件(二阶平稳、内蕴假设或者准二阶平稳假设和准内蕴假设),变程存在且为a,待估点属性估计模型为:

其中,vp表示待测点p的土壤属性值,w1和w2分别表示环境因素的权重和空间自相关性的权重,d1表示以待测点为圆心,半径不大于空间自相关距的圆域,d2表示以待测点为圆心,半径大于空间自相关距的圆域,n表示圆域内采样点的总数,表示待测点p与采样点k在环境因素层面间的相似度,vk表示采样点k的土壤属性值,为表示待测点p与采样点k的空间自相关性的权重,|d1|≥u1表示以待测点为圆心,半径不大于的空间自相关距的圆域中采样点的个数不小于圆域内采样个数的第一阈值u1,|d2|≥u2表示以待测点为圆心,半径大于空间自相关距的圆域中采样点的个数不小于圆域内采样个数的第二阈值u2。

实际计算待测点p时,首先以p点为圆心,以变程a为半径的圆域d1内搜索包含其内的采样点k,若采样点点数不少于u1个,则依上式中(1)进行估算,循环此步骤进行待测点赋值,直到所有待测点不满足上述条件为止。对于剩余待测点,扩大待测点空间邻域的搜索半径,直到空间邻域内有5个采样点为止,按式中(2)估算该待测点属性值。上述算法可以通过编程遍历所有待测点实现。

当根据多尺度的空间相关距确定待测点的空间邻域时,在以待测点为圆心,以最小尺度的空间相关域为半径的第二圆域内搜索采样点,若采样点的个数超过第三预设阈值,则将第二圆域作为待测点的空间邻域;则逐渐增加第二圆域的半径,直至更新后的第二圆域内采样点的个数超过第四预设阈值,则将更新后的第二圆域作为待测点的空间邻域。

需要说明的是,对于采样点不满足地统计假设条件,也即变程不存在的情况,可利用环境因素的特征尺度构建待测点的估算模型,

土壤属性往往受到不同尺度上的环境因素(自然因素和人类活动因素)影响表现为大、中、小等不同尺度空间相关。大尺度相关主要是趋势变化的相关影响,如土壤重金属值容易受到土壤母质、空气沉降、污水灌溉等影响;中尺度属性相关表现为分层分区相关性,如土壤重金属容易受到土地利用方式、农田种植模式影响;小尺度空间相关表现为空间临近相关,如土壤重金属在小范围内可能与土壤内其他物质发生化学反应,同时也在小范围内具有迁移扩散过程。一般情况下,

其中,vp表示待测点p的土壤属性值,w1和w2分别表示环境因素的权重和空间自相关性的权重,d3表示以待测点为圆心,半径小于ry的圆域,d4表示以待测点为圆心,半径不大的圆域,d5表示以待测点为圆心,半径不大于的圆域,d6表示以待测点为圆心,半径大于的圆域。

|d3|表示以待测点为圆心,半径小于ry的圆域内的采样点的个数;|d4|表示以待测点为圆心,半径不大的圆域内的采样点的个数;|d5|表示以待测点为圆心,半径不大于的圆域内的采样点的个数;|d6|表示以待测点为圆心,半径大于的圆域内的采样点的个数;u3、u4、u5、u6分别表示圆域内采样个数的第三阈值、第四阈值、第五阈值和第六阈值,n表示圆域内采样点的总数,表示待测点p与采样点k在环境因素层面间的相似度,vk表示采样点k的土壤属性值,为表示待测点p与采样点k的空间自相关性的权重。

可以理解的是,u3不小于u4,u4不小于u5,u5不小于u6,例如,u3可以为3,u4、u5和u6为5,本发明实施例不对u3至u6的具体数值作进一步的限定。

此外,对于重金属等土壤属性,圆域内采样个数的阈值偏小,比如u3可以为3,u4、u5和u6为5,对于土壤有机值等土壤属性,圆域内采样个数的阈值可以稍微偏大一些,比如,u3可以为5或者6,u4、u5和u6为7或者8,本发明实施例不对具体的阈值作进一步的限定。

实际计算待测点p时,首先以p点为圆心,以小尺度ry为半径的圆域d3内搜索包含其内的采样点k,若采样点点数不少于u3个,则依上中的(1)进行估算,循环此步骤进行待测点赋值,直到所有未赋值点p不满足上述条件为止。对于剩余未赋值点p,扩大p点邻域搜索半径甚至全研究区,直到邻域内的采样点满足相应的阈值为止,按式上中的(2)、(3)、(4)估算待测点的土壤属性值。上述算法可以通过编程遍历所有待测点实现。

在上述各实施例的基础上,作为一种可选实施例,确定计算模型中的权重w1和w2的方法为;

将每个采样点作为待测点,遍历当待测点的空间邻域的半径为空间自相关距或最小尺度的空间相关距时估算模型的表达式,采用最小二乘法确定权重w1和w2。

具体地,将每个已有的采样点作为待测点p,遍历周围满足估算模型:中的采样点{k1,k2,…,km},采用最小二乘法确定上述中w1、w2权重系数。

最小二乘法导出为线性平方差计算的形式为:

对上式求导后为:

zp为采样点p的土壤属性值的真实值;z′p为w1、w2作用下的土壤属性值的预测值;m为偏差的平方和;p为采样点的序号,p=1,2,3…n,n为采样点个数。

可求得均方误差能够反映了估计值与真实值间的误差大小,也反映了用经验公式近似表达在空间邻近与属性相似作用下的待估计值近似程度的好坏。

此外,本发明实施例采用平均绝对误差(d)、均方根误差(rmse)和平均相对误差项指标来评价插值精度。其计算方式分别为

式中:z′p为本发明实施例的土壤属性值的预测值;zp为实际测定值;n为训练样本或检验样本的样点数,可以为采样点全集也可以部分子集。显然,rmse和越小,误差越小,插值精度越高。

图2为本发明实施例提供的土壤属性值的计算装置的结构示意图,如图2所示,该计算装置包括:影响因素获取模块201,环境因素相似度计算模块202,相关距确定模块203,属性值计算模块204,其中:

影响因素获取模块201,用于选取对土壤属性值具有显著性影响的环境因素,作为影响因素,计算各影响因素对土壤属性值影响的权重;

具体地,本发明实施例的影响因素获取模块结合土壤发生学知识,通过土壤属性插值关键词检索以及文献知识挖掘方法检索国内外文献资料,收集并整理可能影响土壤属性值变化的环境因素,然后从影响待计算的土壤属性y的变化成因的角度分析小尺度研究区域内土壤环境的主要影响因素以及表征因素水平的表征因素,建立土壤环境因素候选集,s{x1,x2,…,xn},其中xn表示第n种候选环境因素,具体地,可以是表层土壤质地、土壤类型、土壤ph值、灌溉保证率、地形、耕地类型、肥料投入、农田管理措施等等。

根据环境因素的值的类型(简称环境因素的类型)划分用于因素方差分析的因素的水平,若环境因素的类型为定性型,则按类别或者相近类别合并大类作为方差分析的因素的水平,确保每个水平的观测值不少于5个。若环境因素的类型为定量型,则采用标准分类方法分成r个因素水平,具体因素的水平的划分方法有分位数法、自然间断点分级法、标准差法、自定义间隔分级法(根据已有的因素分级的技术规程标准或者使用者自定义,本发明实施例不作具体的限定)。

通过已有采样点的环境因素的值和土壤属性值,按照因素水平r构建土壤属性y与候选环境因素x的单因素方差分析模型,选取显著性水平a(0.1、0.05、0.025、0.001),采用f分布检验候选因素对于土壤属性是否存在显著性影响,对于f分布检验显著的环境因素作为相似度计算的影响因素,建立影响因素集s{x1,x2,…,xm},m表示影响因素的总数。具体实现可以通过spss的单因素anova检验。

根据最终确定的影响因素,依据单因素各水平观测值(如表1)计算环境变量因素对待估测属性的影响程度/相关度/解释度q。在实际应用时,可以通过地理探测器软件geodetector(下载地址:http://www.geodetector.org/)中的分异及因子探测器的q统计值探测。q的物理意义是用于探测影响因素x多大程度上解释了待计算属性y的差异性,其计算公式为:

式中:h=1,…,r为影响因素x的水平类;nh为水平h的个数,n为已知采样点的个数;和δ2分别是水平h的方程和全部采样点的y值的方差。q的值域为[0,1]。

根据各影响因素的q值计算影响因素的权重系数wi,建立权重系数向量w(w1,w2,…,wm),wi的计算公式为;

环境因素相似度计算模块202,用于采集待测点和各采样点的影响因素的值,结合各影响因素对土壤属性值影响的权重,计算待测点与每个采样点的土壤属性值在环境因素层面的相似度;

需要说明的是,待测点的土壤属性值估算的关键在于刻画已有采样点与待测点之间的土壤环境因素的相似度。设整个研究区部分地块有采样点,部分地块无采样点,且无采样地块或者待估点位于采样点最小凸包外,本发明实施例的环境因素相似度计算模块将待测点的土壤属性值与每个采样点的土壤属性值在环境因素层面的相似度表达为:

s=f(e)=f(e1,…,em)

其中,e1,…,em为影响因素,f(e)代表所有影响因素作用下的土壤属性值的相似关系。本发明实施例分别计算对于每个影响因素,待测点与已知采样点之间的相似度,最终结合每种影响因素的权重值,计算待测点与每个采样点的土壤属性值在环境因素层面的相似度。

相关距确定模块203,用于若土壤属性值在采样点的分布满足二阶平稳假设、准二阶平稳假设或者内蕴平稳假设,则基于采样点计算空间自相关距;若土壤属性值在采样点的分布不满足二阶平稳假设或者内蕴平稳假设,则基于各地块的影响因素计算环境因素的多尺度的空间相关距。

需要说明的是,二阶平稳假设,指区域化变量z(x)的任意n维分布函数不因空间点x发生位移而改变。它具有数学期望存在且平稳、方差存在且平稳的性质。二阶平稳和内蕴平稳都是为了获得基本重复规律而作的基本假设。

属性值计算模块204,用于根据空间自相关距或多尺度的空间相关距确定待测点的空间邻域,将空间邻域内的采样点作为参考点,将待测点与参考点在环境因素层面间的相似度以及参考点的土壤属性值输入预先构建的计算模型,获得待测点的土壤属性值;预先构建的计算模型根据在空间邻域内的两两采样点在环境因素层面的相似度以及采样点的土壤属性值获得

需要说明的是,当土壤属性值在采样点的分布满足二阶平稳假设或者内蕴平稳假设时,本发明实施例的属性值计算模块显然会根据空间自相关距确定待测点的空间邻域,当土壤属性值在采样点的分布不满足二阶平稳假设、准二阶平稳假设或者内蕴平稳假设时,属性值计算模块会根据多尺度的空间相关距确定待测点的空间邻域。可以理解的是,空间邻域内采样点的土壤属性,与待测点的土壤属性具有较大相似度。本发明实施例的计算模型兼顾了环境因素层面的相似性以及空间自相关,能够更准确地计算土壤属性值。计算模型的构建过程中,由于采样点的土壤属性值和影响因素的值都是已知的,因此,可以将采样点作为待测点,通过将在空间邻域内的两两采样点在环境因素层面的相似度以及其余采样点的土壤属性值作为输入项,生成待测点预计的土壤属性值,再将预计的土壤属性值与真实的土壤属性值进行比较,进而调成计算模型中的参数,最终获得高准确度的计算模型。

本发明实施例提供的计算装置,具体执行上述各检测方法实施例流程,具体请详见上述各计算方法实施例的内容,在此不再赘述。本发明实施例提供的计算装置充分利用了与土壤属性值相关的环境因素的信息,能够更好地刻画突变边界处土壤属性的空间变异,确保土壤属性值更加贴近实际情况,能够克服因采样点密度不均一、采样密度低、采样点数量少而导致的部分预估区域属性值误差过大的问题,并且不但可以进行土壤属性的内插计算也可以用于采样点覆盖区域外的相似空间外推计算。

图3为本发明实施例提供的电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(communicationsinterface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储在存储器330上并可在处理器310上运行的计算机程序,以执行上述各实施例提供的检测方法,例如包括:。选取对土壤属性值具有显著性影响的环境因素,作为影响因素,计算各影响因素对土壤属性值影响的权重;采集待测点和各采样点的影响因素的值,结合各影响因素对土壤属性值影响的权重,计算待测点与每个采样点的土壤属性值在环境因素层面的相似度;若土壤属性值在采样点的分布满足二阶平稳假设、准二阶平稳假设或者内蕴平稳假设,则基于采样点计算空间自相关距;若土壤属性值在采样点的分布不满足二阶平稳假设或者内蕴平稳假设,则基于各地块的影响因素计算环境因素的多尺度的空间相关距;根据空间自相关距或多尺度的空间相关距确定待测点的空间邻域,将空间邻域内的采样点作为参考点,将待测点与参考点在环境因素层面间的相似度以及参考点的土壤属性值输入预先构建的计算模型,获得待测点的土壤属性值;其中,预先构建的计算模型根据在空间邻域内的两两采样点在环境因素层面的相似度以及采样点的土壤属性值获得。

此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:选取对土壤属性值具有显著性影响的环境因素,作为影响因素,计算各影响因素对土壤属性值影响的权重;采集待测点和各采样点的影响因素的值,结合各影响因素对土壤属性值影响的权重,计算待测点与每个采样点的土壤属性值在环境因素层面的相似度;若土壤属性值在采样点的分布满足二阶平稳假设或者内蕴平稳假设,则基于采样点计算空间自相关距;若土壤属性值在采样点的分布不满足二阶平稳假设或者内蕴平稳假设,则基于各地块的影响因素计算环境因素的多尺度的空间相关距;根据空间自相关距或多尺度的空间相关距确定待测点的空间邻域,将空间邻域内的采样点作为参考点,将待测点与参考点在环境因素层面间的相似度以及参考点的土壤属性值输入预先构建的计算模型,获得待测点的土壤属性值;其中,预先构建的计算模型根据在空间邻域内的两两采样点在环境因素层面的相似度以及采样点的土壤属性值获得。

以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1