本发明涉及农业信息,具体为一种基于机器学习的标准化降水蒸散指数(spei)粗分辨率数据空间降尺度方法及装置。
背景技术:
1、全球变暖将导致更频繁、更严重的干旱,对区域水资源供应以及陆地生态系统造成严重影响。中国是经常受到干旱影响的国家之一。近几十年来,受气候变化影响,我国干旱频发,给生态、农业和社会经济带来严重后果。因此,监测和减轻干旱至关重要。
2、干旱类型通常包括气象干旱、农业干旱、水文干旱和社会经济干旱。干旱指数是量化和描述干旱的基础,是进行干旱预警,监测和评估的有效工具。气象干旱指标标准化降水蒸散指数(standardized precipitation evapotranspiration index,spei)是目前应用最广泛的气象干旱指标之一。现有的spei数据产品虽然时间序列足够长(1901-2021年),但是其空间分辨率较为粗糙,为0.5°。在全球研究中较为合适,评估我国干旱的时空变化则空间分辨率较为粗糙。干旱的空间尺度可以从几公里到整个地区,因此有必要对我国干旱进行高分辨率网格尺度上的评估。缺乏长时间序列高空间分辨率的干旱数据集不便于量化我国长期干旱,难以掌握干旱复杂的时空特征。
3、目前也有通过气象站点spei进行插值获取高分辨率的空间连续的spei数据集,然而这种方法受限于站点分布不均匀以及某些区域缺乏气象站点数据,插值所得的结果往往具有较大的空间不确定性。地理加权回归目前常用的一种统计降尺度方法,但其在非平稳和非线性的问题中适用性有限。
4、由此可见,目前迫切需要开发一种针对上述不足的技术方案,构建一种有效的spei空间降尺度模型,提高我国spei长时间序列数据的空间分辨率,助力更精细地掌握我国干旱时空格局和发生规律,提高我国干旱风险评估的可靠性。
技术实现思路
1、为实现上述目的,发明提供一种基于机器学习的spei空间降尺度方法,使其提高spei数据产品的空间分辨率,满足精细尺度的干旱监测和评估以及水资源管理的应用需求,解决现有spei数据产品空间分辨率低的不足。
2、更具体地,本发明通过一种基于机器学习的spei粗分辨率数据空间降尺度方法,包括:
3、步骤1:获取研究区域内长时间序列的原始粗分辨率spei栅格数据;
4、步骤2:获取研究区域内降尺度因子数据,包括高分辨率气候、地形和地理位置因子栅格数据,其中气候因子和spei的长时间序列对应;
5、步骤3:将降尺度因子重采样到和原始spei一样的空间分辨率;
6、步骤4:构建所有像元的样本数据,以像元为统计单元,提取所有像元的spei值以及降尺度因子值,所有像元值作为样本,并将样本数据划分为测试集和训练集;
7、步骤5:基于训练集构建空间降尺度模型,将spei值作为因变量,降尺度因子作为自变量,利用机器学习算法高斯过程回归(gpr)构建降尺度模型,模型参数利用贝叶斯优化进行确定,模型的精度用测试集进行评估;以及
8、步骤6:将步骤2的高分辨率的降尺度因子栅格数据输入训练好的模型,生成长时间序列高空间分辨率的降尺度spei数据产品。
9、根据本发明的实施方案,其中所述方法还包括步骤7:使用步骤1的原始spei进行交叉验证并通过研究区域历史记录的干旱事件对降尺度spei数据产品进行验证。
10、根据本发明的实施方案,其中步骤2中,气候因子包括月平均温度、月最高温度、月最低温度以及月降水量;地形因子包括高程、坡度和坡向;地理位置因子包括经度和纬度。例如月降水,月平均温度,最高温度和最低温度数据可以获取自国家青藏高原科学数据中心(https://data.tpdc.ac.cn/),空间分辨率为0.0083333°(约1km),时间为1901年1月-2021年12月。本领域技术人员也可以根据具体情况选用其他的高分辨气象数据产品;地形因子可以利用数字高程模型(dem)计算得到,dem数据可以为srtm dem version4,本领域技术人员也可以根据具体情况选用其他的dem数据产品。
11、根据本发明的实施方案,其中步骤1中,所述粗分辨率为0.5°×0.5°,例如原始spei数据库由spei的提出者sergio m.vicente-serrano所构建,空间分辨率为0.5°,降尺度因子的空间分辨率为0.0083°。
12、根据本发明的实施方案,其中步骤5中,高斯过程回归(gpr)模型的超参数利用贝叶斯优化获取,降尺度模型基于每月的数据分别构建。
13、gpr方法是基于核函数的非参数概率模型,其核心理论为贝叶斯方法。gpr在小数据集上能够有很好的表现,通常不会受过拟合影响。具有高斯噪声的gpr可以表示如下:
14、y=f(x)+ε
15、式中,ε是服从高斯分布的噪声(ε~n(0,σ2)),x表示输入,y表示输出。f(x)是回归函数,可以表示为:
16、f(x)~gp(m(x),k(x,x′))
17、式中,m(x)为均值函数,k(x,x′)为协方差函数。
18、根据本发明的实施方案,其中步骤5还包括对模型的精度进行评估,利用测试集通过计算决定系数(r2),均方根误差(rmse),平均绝对误差(mae)来评估模型。
19、精度评估指标r2,rmse以及mae的其计算公式如下:
20、
21、
22、
23、式中:oi为第i个数据点的实际值;ei为第i个站点的模型模拟值;n表示样本数量;为实际值的平均值。
24、根据本发明的实施方案,其中所述步骤7包括通过计算原始spei与降尺度后的spei的相关性,以保证降尺度后的数据在精度上不降低,并利用历史干旱事件评估降尺度spei识别干旱的有效性。
25、根据本发明的实施方案,其中步骤4中,样本划分为70%训练集来训练模型,30%的测试集来评估模型精度。
26、应该理解的是,spei数据可以包括多个时间尺度,例如1月spei,3月spei,6月spei等。
27、本发明还提供一种基于机器学习的spei粗分辨率数据空间降尺度方法装置,包括:
28、粗分辨率数据获取模块,用于获取研究区域内长时间序列的原始粗分辨spei栅格数据;
29、降尺度因子数据获取模块,用于获取研究区域内降尺度因子数据;
30、降尺度因子重采样模块,用于将降尺度因子重采样到和原始spei一样的空间分辨率;
31、样本数据构建模块,用于构建所有像元的样本数据,并将样本数据划分为测试集和训练集;
32、空间降尺度模型构建模块,用于基于训练集构建空间降尺度机器学习模型并基于测试集评估模型的精度;以及
33、降尺度spei数据产品形成模块,用于将高分辨率的降尺度因子栅格数据输入训练好的模型,生成长时间序列高空间分辨率的降尺度spei数据产品。
34、根据本发明的实施方案,所述装置还包括验证模块,用于使用步骤1的原始spei进行交叉验证并通过研究区域历史记录的干旱事件对降尺度spei数据产品进行验证。
35、本发明还提供一种电子设备,包括存储器以及一个或多个处理器;
36、所述存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明所述的方法。
37、本发明基于机器学习gpr算法了提出了粗分辨率spei空间降尺度方法,构建的降尺度模型的因子容易获取,并且不需要站点实测数据,模型精度较高。该方法能够生成高空间分辨率的spei数据,所生成的数据能够为小范围高精度的干旱监测与评估提供数据支撑。