一种训练旱情监测模型的方法、旱情监测方法及设备

文档序号:24556848发布日期:2021-04-06 12:07阅读:71来源:国知局
一种训练旱情监测模型的方法、旱情监测方法及设备
本发明涉及机器学习领域,尤其涉及一种训练旱情监测模型的方法、旱情监测方法及设备。
背景技术
:干旱具有频率高、持续时间长、影响范围广等特点,可对水资源、土地资源以及人民的生活造成潜在的影响,对国民经济尤其是农业生产造成严重影响,是我国和全球最大的自然灾害之一,引起各国政府、科研人员的重视,能否及时、准确地监测旱情对于抗旱准备和减少旱情风险是至关重要的。传统的旱情监测是用测量土壤含水量来监测干旱的程度及范围,该方法虽然简单,准确度较高,但代表性差,无法实现大范围干旱灾害的动态监测。卫星遥感资料具有宏观、动态、客观、时效性好的特点,为大范围的干旱灾害监测提供了一种便捷的手段。其中,中分辨率成像光谱仪(modis,moderateresolutionimagingspectroradiometer)资料因其成本比较低,光谱范围广、数据接收简单、更新频率高的优点为实时监测干旱提供了支撑和保障。利用遥感数据以及气象要素反演的归一化植被指数(ndvi),植被健康指数(vhi)、叶面积指数(lai)、年总初级生产力指数(gpp)等遥感指数在某些特定区域、时间段内具有比较良好的监测效果,但全球不同区域的地形、地貌的差异比较大,单一的指数难以有效、客观的反应全球的作物生长、旱情等信息。技术实现要素:本发明的实施例提供一种训练旱情监测模型的方法、旱情监测方法及设备,相较于传统的单纯依靠测量土壤含水量进行旱情监测,或是依靠根据遥感数据获得的单一遥感指数进行旱情监测,其可以在机器学习中,通过使用根据监测站点的观测数据确定的干旱状态作为标签,获取干旱状态和多种根据遥感数据获得的遥感指数之间的关联关系,从而在机器学习完成后,仅根据遥感数据即进行大范围地区的进行全面、精确的旱情检测。本发明为解决上述技术问题采用的技术方案为,一方面提供一种旱情监测模型的训练方法,所述方法包括:获得监测站点检测数据;根据监测站点检测数据,确定监测站点所处地区干旱等级;获得与监测站点关联的遥感格点的遥感数据;根据所述遥感格点的遥感数据,确定监测站点的多个遥感指数;以所述多个遥感指数作为旱情监测模型的输入,以所述旱情监测模型的输出结果趋向所述监测站点所处地区干旱等级为目标,更新所述旱情监测模型。优选地,所述旱情监测模型基于随机森林模型。优选地,所述多个遥感指数包括归一化植被指数、植被健康指数、叶面积指数、年总初级生产力指数。具体地,所述遥感数据包括,近红外波段反射率、red为红光波段反射率、热红外波段的辐亮度;所述根据遥感格点数据,确定监测站点所处地区的多个遥感指数,其数学表达式为:所述归一化植被指数ndvi的计算公式为:nir为近红外波段反射率,red为红光波段反射率,ndvi的值介于-1到1之间;植被健康指数值vhi的计算公式为:vhi=a×vci+b×tci其中,a为植被状态指数vci的权重,b为温度状况指数tci的权重;植被状态指数vci的计算公式为:其中,ndvii为某一时刻的ndvi的值,ndvimax和ndvimin表示所有时期ndvi的最大值和最小值;温度状况指数tci的计算公式为:其中,bt为某一时期的亮度温度,btmax和btmin表示所有时期bt的最大值和最小值;亮度温度bt的计算公式为:其中,lλ为热红外波段的辐亮度,k1、k2为定标常数;叶面积指数lai的计算公式为:lai=k-ln(1-ndvi)-1其中,k为消光系数;年总初级生产力指数gpp的计算公式为:gpp=εg×fparpav×parεg=ε0×tscalar×wscalar×pscalar其中,为是光合有效辐射,fparpav表示被植被光合部分吸收的光合有效辐射比例,εg表示光能利用率,ε0表示表观量子效率或最大光能利用率,tscalar、wscalar和pscalar分别表示温度、水分和叶物候期对最大光能利用率的调节系数。优选地,根据所述遥感格点的遥感数据,确定监测站点的多个遥感指数,包括,根据多个与监测站点关联的遥感格点的格点数据,确定监测站点所处地区的多个遥感指数。具体地,根据多个与监测站点关联的遥感格点的格点数据,确定监测站点所处地区的多个遥感指数,包括:根据与所述站点距离最近的四个遥感格点的格点数据,分别确定其中每个遥感格点的多个遥感指数;根据四个遥感格点的多个遥感指数、四个遥感格点分别与监测站点的距离,对四个遥感格点的多个遥感指数分别进行融合,获得站点所处地区的多个遥感指数。优选地,监测站点检测数据包括日气温、日蒸发量、日降水量其中的一种或多种;根据监测站点检测数据,确定监测站点所处地区干旱等级,包括:根据日蒸发量、日降水量确定预定时段降水量与蒸发量,根据预定时段降水量与蒸发量确定监测站点所处地区的湿润度指数,根据所述湿润度指数,确定监测站点所处地区干旱等级。第二方面,提供一种旱情监测方法,所述方法包括:获得遥感格点的遥感数据;根据所述遥感数据,确定待检测地区的多个遥感指数;将所述多个遥感指数输入根据第一方面所述的方法训练好的旱情监测模型,获得所述待检测地区的干旱等级。第三方面,提供一种旱情监测模型的训练装置,所述装置包括:站点数据获取单元,配置为获得监测站点检测数据;干旱等级确定单元,配置为根据监测站点检测数据,确定监测站点所处地区干旱等级;格点数据获取单元,配置为获得与监测站点关联的遥感格点的遥感数据;遥感指数确定单元,配置为根据所述遥感格点的遥感数据,确定监测站点的多个遥感指数;模型更新单元,配置为以所述多个遥感指数作为旱情监测模型的输入,以所述旱情监测模型的输出结果趋向所述监测站点所处地区干旱等级为目标,更新所述旱情监测模型。第四方面,提供一种旱情监测装置,所述装置包括:格点数据获取单元,配置为获得遥感格点的遥感数据;遥感指数确定单元,配置为根据所述遥感数据,确定待检测地区的多个遥感指数;结果确定单元,将所述多个遥感指数输入根据权利要求1所述的方法训练好的旱情监测模型,获得所述待检测地区的干旱等级。附图说明为了更清楚说明本发明实施例的技术方案,下面将对实施例描述中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例提供的一种训练旱情监测模型的方法的流程图;图2为本发明实施例提供的一种旱情监测方法的流程图;图3为本发明实施例提供的一种旱情监测模型的训练装置的结构图;图4为本发明实施例提供的一种旱情监测装置的结构图;图5为本发明实施例提供的获取监测站点遥感指数的原理示意图;图6为本发明实施例提供的随机森林模型的原理示意图;具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。如前所述,传统利用测量土壤含水量来监测干旱的程度及范围的方法,虽然简单、准确度较高,但是代表性差,无法实现大范围干旱灾害的动态监测。卫星遥感资料具有宏观、动态、客观、时效性好的特点,有利于将其用于大范围的干旱灾害监测,而基于遥感数据以及气象要素反演的(ndvi),植被健康指数(vhi)、叶面积指数(lai)、年总初级生产力指数(gpp)等遥感指数在某些特定区域、时间段内具有比较良好的监测效果,但是其也存在全球不同区域的地形、地貌的差异比较大,单一的遥感指数难以有效、客观的反应全球的作物生长、旱情信息的问题。为解决上述问题,本发明实施例提供一种训练旱情监测模型的方法、旱情监测方法及设备,其主要思想是,利用旱情监测站点的观测数据,确定站点所处地区的干旱状态,然后利用旱情监测站点附近的遥感数据计算出旱情监测站点多个遥感指数,通过训练一个机器学习模型来获取所述多个遥感指数和干旱状况之间的潜在相关性,在该机器学习模型训练完成之后,可以基于该模型,仅根据相对容易获得的大范围遥感数据,获取大范围地区的干旱状态,尤其是没有设立旱情监测站点的地区的干旱状态。图1为本发明实施例提供的一种旱情监测模型的训练方法的流程图。如图所示,该方法至少包括以下步骤:步骤11,获得监测站点检测数据。本说明书所述的监测站点指的是旱情监测站点。旱情监测站点监测的数据可以用来监测和判断其所在地区的干旱程度,且方法简单、准确度亦较高。但是全球范围的旱情监测站点的数量有限,其覆盖地区也就十分有限,对于没有设立旱情监测站点的地区,无法进行旱情监测,也就是说仅依靠旱情监测站点实现大范围干旱灾害的监测、尤其是实时性高的动态监测。在一个实施例中,监测站点检测数据可以包括日气温、日蒸发量、日降水量中的一种或多种。步骤12,根据监测站点检测数据,确定监测站点所处地区干旱等级。该步骤中,利用步骤11中获得的监测站点检测或观测数据,确定其所在地区的干旱等级。实际生产中,通常观测数据中会存在一些超出合理范围的异常数据,所以需要把异常数据规范到一个合理的范围内。因此,在一个实施例中,可以对于任一监测(观测)站点,计算该观测站点的各观测数据的平均值(mean)和方差(std),将各观测数据处于其(mean-2*std,mean+2*std)区间之外的观测值规范到此区间内,例如,该站点一个观测数据在某时刻的一个观测值低于此范围的下限,则把该观测值赋值为mean-2*std,而如果该观测值高于此范围的上限,则把该观测值赋值为mean+2*std。在一个实施例中,可以根据日蒸发量、日降水量确定预定时段降水量与蒸发量,根据预定时段降水量与蒸发量确定监测站点所处地区的湿润度指数,根据所述湿润度指数,确定监测站点所处地区干旱等级。具体的,相对湿润度指数是表征某时段降水量与蒸发量之间平衡的指标之一,在一个例子中,其计算公式可以如公式(1)所示。其中,p为降水量,pe为可能蒸散量。在更具体的例子中,降水量单位可以为毫米(mm),蒸散量单位可为毫米(mm),可以根据fao(联合国粮食及农业组织)的thornthwaite方法计算得到。在一个实施例中,可以按照(gb/t20481-2017)相对湿润度指数划分干旱等级,如表1所示。表1相对湿润度干旱等级划分表等级类型相对湿润度1无旱-0.40<m2轻旱-0.65<m≤-0.403中旱-0.80<m≤-0.654重旱-0.95<m≤-0.805特旱m≤-0.95步骤13,获得遥感格点的遥感数据。相对于站点监测数据,格点数据是指按空间(如按经度-纬度)均匀分布的数据。遥感卫星获得的监测数据一般本身具有格点或准格点形式,在一些例子中,可以对遥感卫星获得的监测数据做插值抑或区域平均,以获得遥感格点数据。在一个实施例中,可以获得批量化的遥感格点数据,即大量格点的格点数据。在另一个实施例中,也可以获得与监测站点关联的遥感格点的遥感数据,例如,根据距离关系相关联的遥感格点的遥感数据。实际生产中,遥感格点数据中也存在超出合理范围的异常数据,因此在一个实施例中,可以对于获得的每个格点的遥感数据,通过质控编码进行质量检测,对于其中检测后判断不能使用的数据进行剔除,然后通过sg(多项式平滑)滤波,填充遥感格点数据中的缺失数据。步骤14,根据遥感格点的遥感数据,确定监测站点所处地区的多个遥感指数。该步骤中,多个遥感指数可以根据遥感格点数据计算获得。使用多个遥感指数是因为全球不同区域的地形、地貌的差异较大,单一指数难以有效、客观的反应全球的旱情信息。因此,在一个实施例中,可以根据遥感格点数据,计算出多个不同的遥感指数,用于后续步骤中有效、全面的确定全球不同地区的旱情状态。在一个例子中,遥感格点数据可以包括近红外波段反射率、red为红光波段反射率、热红外波段的辐亮度中的一个或多个。在又一个例子中,多个遥感指数可以包括归一化植被指数、植被状态指数、温度状况指数、植被健康度指数中的一个或多个。根据一种实施方式,可以根据遥感格点数据,动态生成多个遥感指数的值。以数学方式表述,在一个例子中,归一化植被指数ndvi的计算公式可以为:nir为近红外波段反射率,red为红光波段反射率,ndvi的值介于-1到1之间。植被健康度指数(vhi)是一项综合遥感旱情监测指数,它是基于植被生态学“最小值”、“限制因子”和“忍耐性”提出的,由植被状态指数(vci)和温度状况指数(tci)加权得到,综合考虑了植被叶面状况和地面温度的情况。在一个例子中,植被健康指数值vhi的计算公式可以为:vhi=a×vci+b×tci(3)其中,a为植被状态指数vci的权重,b为温度状况指数tci的权重;vci、tci可以分别表征植被、与地表温度对土壤湿度的影响。在一个具体的例子中,a、b的取值可以分别为0.5、0.5。植被状态指数vci的计算公式为:其中,ndvii为某一时刻的ndvi的值,ndvimax和ndvimin表示所有时期ndvi的最大值和最小值;温度状况指数tci的计算公式为:其中,bt为某一时期的亮度温度,btmax和btmin表示所有时期bt的最大值和最小值;亮度温度bt的计算公式为:其中,lλ为热红外波段的辐亮度,k1、k2为定标常数;在一个例子中,叶面积指数lai的计算公式为:lai=k-ln(1-ndvi)-1(7)其中,k为消光系数;在不同的具体例子中,每种植被的消光系数各不相同,一般植被的k取值范围是0.8-1.3。在一个例子中,可以采用光能利用率遥感模型,获得年总初级生产力指数gpp。其理论基础是monteith提出的光能利用率理论,该模型主要将植被冠层分为光合部分(pav)和非光合部分(npv)。年总初级生产力指数gpp的计算公式为:gpp=εg×fparpav×par(8)εg=ε0×tscalar×wscalar×pscalar(9)其中,par为光合有效辐射,fparpav表示被植被光合部分吸收的光合有效辐射比例,εg表示光能利用率,ε0表示表观量子效率或最大光能利用率,tscalar、wscalar和pscalar分别表示温度、水分和叶物候期对最大光能利用率的调节系数。如前所述,遥感格点通常是从地理上来讲通常是均匀分布的,而监测站点则不具有均匀分布的特征,二者在地理位置上往往是不重合的,如图5所示。并且遥感格点的数量通常也大大高于监测站点的数量。因此,在一个实施例中,对于每种遥感指数,可以先计算与监测站点邻近的多个遥感格点的该遥感指数,然后将多个遥感格点的该遥感指数进行加权融合,获得该监测站点的该遥感指数。在一个具体的实施例中,可以根据与监测站点距离最近的四个遥感格点的格点数据,分别确定其中每个遥感格点的多个遥感指数;根据四个遥感格点的多个遥感指数、四个遥感格点分别与监测站点的距离,对四个遥感格点的多个遥感指数分别进行加权融合,获得站点所处地区的多个遥感指数。在一个例子中,遥感格点与监测站点的距离越近,其各遥感指数在监测站点对应的遥感指数的获得中所占权重越大。在另一个实施例中,还可以根据监测站点的其他关联格点的数据,确定其各遥感指数,比如,距离监测站点预定距离范围内的格点的数据、或者根据最近一个格点的数据。图5为本发明实施例提供的获取监测站点遥感指数的原理示意图。下面通过该实施例,进一步说明监测站点的遥感指数的获取方式。如图5所示,首先,获取监测站点的四个邻近格点的经纬度为q11=(x1,y1),q12=(x1,y2),q21=(x2,y1),q22=(x2,y2),在该格点的任一要素值(即任一遥感指数的值)计为fij,站点坐标计为p=(xp,yp)。其次,计算各格点与站点的距离其中(xi,yj)为格点坐标,该实施例中采用4近邻算法,即i,j∈{1,2}。然后,计算各格点的权重最后,根据各格点的权重和该要素值,计算站点的该要素值fp=∑fijwij。对于监测站点的各个遥感指数的值,均可通过上述方式获得。步骤15,将所述多个遥感指数输入旱情监测模型,以所述旱情监测模型的输出结果趋向所述站点所处地区干旱等级为目标,更新所述旱情监测模型。在一个实施例中,旱情监测模型可以基于随机森林模型。随机森林是一种高度灵活的机器学习模型,其中所谓“森林”是指决策树的集成,在机器学习中,随机森林利用多棵决策树对样本进行训练并预测的一种分类器,其输出的类别是由决策树输出的类别的众数而定。在一个例子中,可以用引导聚集算法(bagging,boostrapaggregating)进行训练。在一个例子中,根据下列算法而建造每棵决策树:(1)用n来表示训练用例(样本)的个数,m表示特征数目。(2)输入特征数目m,用于确定决策树上一个节点的决策结果;其中m应远小于m。从n个训练用例(样本)中以有放回抽样的方式,取样n次,形成一个训练集(即bootstrap取样),并用未抽到的用例(样本)作预测,评估其误差。(3)对于每一个节点,随机选择m个特征,决策树上每个节点的决定都是基于这些特征确定的。根据这m个特征,计算其最佳的分裂方式。每棵树都会完整成长而不会剪枝,这有可能在建完一棵正常树状分类器后会被采用,算法示意如图6所示,图中淡灰色和深灰色的点表示选择不同的特征,构建不同决策树的示意过程。在一个具体的例子中,训练的随机森林模型使用的scikit-learn(python编程语言的机器学习库)的版本为0.23.3,训练中对决策树的个数和深度进行迭代寻优,按照f1值(f1measure)来评价模型的优劣,选择最大的f1值对应的模型参数,模型分类的混淆矩阵如表2所示。表2分类的混淆矩阵表预测为正样本预测为负样本标签为正样本tpfn标签为负样本fptn在一个例子中,f1值的计算公式为:其中,精确率percision的计算公式为:召回率recall的计算公式为:图2为本发明实施例提供的一种全量子分子模拟方法的流程图。如图所示,该方法至少包含以下步骤:步骤21,获得遥感格点数据;步骤22,根据遥感格点数据,确定待检测地区的多个遥感指数;步骤23,将多个遥感指数输入根据图1所示的方法训练好的旱情监测模型,获得所述待检测地区的干旱等级。在不同的实施例中,可以采用不同的具体方式获得待检测地区干旱等级。例如,在一个实施例中,对于一个待检测地区,可以将多个格点的遥感指数输入模型获得多个干旱等级,然后对多个干旱等级取平均,以获取待检测地区的干旱等级。在另一个实施例中,还可以根据多个格点的遥感指数获得地区的中心点的融合的遥感指数,将融合的遥感指数输入模型输出这个中心点的干旱等级代表该地区的干旱等级。根据又一方面的实施例,提供了一种旱情监测模型的训练装置,图3示出本发明实施例提供的一种旱情监测模型的训练装置的结构图。如图4所示,该装置300包括:站点数据获取单元31,配置为获得监测站点检测数据;干旱等级确定单元32,配置为根据监测站点检测数据,确定监测站点所处地区干旱等级;格点数据获取单元33,配置为获得遥感格点数据;遥感指数确定单元34,配置为根据遥感格点数据,确定监测站点所处地区的多个遥感指数;模型更新单元35,配置为将所述多个遥感指数输入旱情监测模型,以所述旱情监测模型的输出结果趋向所述站点所处地区干旱等级为目标,更新所述旱情监测模型。根据再一方面的实施例,还提供了一种旱情监测装置,图4示出本发明实施例提供的一种旱情监测装置的结构图。如图4所示,该装置400包括:格点数据获取单元,配置为获得遥感格点数据;遥感指数确定单元,配置为根据遥感格点数据,确定待检测地区的多个遥感指数;结果确定单元,将所述多个遥感指数输入根据权利要求1所述的方法训练好的旱情监测模型,获得所述待检测地区的干旱等级。上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或
技术领域
内所公知的任意其它形式的存储介质中。以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1