一种集成机器学习的多模式降水预估方法

文档序号:26542608发布日期:2021-09-07 22:27阅读:410来源:国知局
一种集成机器学习的多模式降水预估方法

1.本发明属于降水气候预估技术领域,具体涉及一种集成机器学习的多模式降水预估方法。


背景技术:

2.百年全球呈显著的增温趋势,根据ipcc报告,增温有可能给未来气候系统带来极大威胁,如近年来极端事件的频发。目前的初步研究表明,增温2度以上,极端事件的风险显著加大。基于多气候模式的集合预估是提高区域气候预估可靠性的有效手段,但以往多采用等权集合及加权集合,加权方案大多基于模式对当前气候模拟能力的统计指标,模拟性能、预估不确定对评估变量、方法也很敏感,如何降低多模式集合预估的不确定性带来极大的挑战。
3.近年来,随着机器学习算法的蓬勃发展,越来越多的学者运用机器学习进行极短的天气预报。但是结合全球大尺度模式与机器学习技术研究在全球升温背景下的中国区域的极端气候事件的预估较为薄弱。


技术实现要素:

4.本发明所要解决的技术问题是针对上述现有技术的不足提供一种集成机器学习的多模式降水预估方法,其采用了多模式和多机器算法集成技术,降低了未来预估中由不同模式和不同算法引入的不确定度,使预估的结果更具可靠性。
5.为实现上述技术目的,本发明采取的技术方案为:
6.一种集成机器学习的多模式降水预估方法,其特征在于包含以下步骤:
7.第一步:数据预处理:计算观测和22个cmip6模式历史和不同路径(ssp245,ssp585)下未来时期的强降水、连续干日、平均总降水、连续最大5日降水气候指数,采用双线性插值将cmip6结果插值到与观测资料一致的格点上,采用时间轴的数据切片得到中国区域未来增温1.5、2、3度时期的极端降水指数;
8.第二步:数据集构建:将cmip6模式数据分割成训练数据、评估验证数据、未来气候预估数据集,将每个cmip6模式格点的极端气候指数数据按照时间

空间交替的顺序映射成一列一维的数据,然后按照模式名的首字母顺序,将所有模式数据排列成一个二维数据矩阵,最后一列为观测结果;
9.第三步:集成机器学习预估:利用历史时段数据集训练多种机器学习模型,从时间和空间评估机器模型性能,基于性能赋予不同权重,集成生成未来不同增温情景、增温幅度的平均及极端降水概率预估结果。
10.上述的步骤一中基于观测和22个cmip6模式的逐日降水数据和wmo的降水气候指数定义计算并插值到中国区域的0.5x0.5度格点。
11.上述的步骤一中降水的气候极端指数包括历史时期和未来ssp245,ssp585升温路径下,先对工业革命时期温升1.5、2、3度前后20年气候态的强降水、连续干日、平均总降水
和连续最大5日降水。
12.上述的步骤二中用到的机器学习类型包括且不限于bp神经网络、lstm神经网络、卷积神经网络、k均值聚类算法、随机森林和多元线性回归算法。
13.上述的步骤三中评估机器学习模型性能指标是基于其中r为机器模型输出结果与观测相关系,σ
f
为模型与观测的方差接近程度,r0为模型与观测的最高相关系数,模型模拟性能越好,其s分数越高。
14.上述的步骤三中机器学习模型的权重由决定,i对应模式,n模式总数,概率集成预估是降水变化超过某一阈值(δt
th
)的概率p则可用式表示:
15.本发明首先分别计算cmip6气候模式的历史时期(1961—2014)和不同路径(ssp245,ssp585)下增温1.5和2度的中国区域预估时期的强降水、连续干日、平均总降水、连续最大5日降水等气候指数,然后利用历史时期的气候指数对多种机器学习算法进行训练,最后基于不同机器学习算法的性能对不同算法预估的结果进行融合,得到最终的预估结果。
16.本发明具体工作流程如下:首先按照wmo认可的27项极端气候指极端气候指数定义计算22个cmip6模式的历史时期1961

2014和未来不同路径(ssp245,ssp585)下的强降水、连续干日、平均总降水、连续最大5日降水等气候指数;进一步按照ipcc组织推荐的定义,计算22个cmip6模式输出的全球平均温升到达工业革命前水平的1.5度、2度、3度的时间点前后20年年的数据切片;进而获得训练期、检验期和预估期的模式资料;根据所采用的来自于中国气象局的0.5
×
0.5
°
逐日观测降水数据集(cn5.1)的空间格点信息,采用双线性插值插值算法,将模式结果插值到与观测资料空间分辨率一致的0.5
×
0.5
°
的格点上,得到格点化降水;为了消除不同参量间的数值范围的影响,将每个模式的5个时段的四个极端气候指数数据进行标准化,采用数据减去原始数据平均值除以标准方差进行标准化;最后将每个模式的5个时段的四个极端气候指数数据由空间格点的时间序列按照时间

空间交替的顺序映射成一列一维的数据,将22个不同cmip6模式的映射数据的按照模式名的首字母顺序排列成一个二维数据矩阵,最后一列为观测结果,进而得到集成的数据集;将数据集中的1961

1993年训练数据集分别输入到bp神经网络、lstm神经网络、卷积神经网络、k均值聚类算法、随机森林、多元线性回归等6种机器学习模型,利用不同机器学习模型的参数优化函数,优化调整6种学习模型的输入参数,得到参数最优调整的参数化的机器学习模型;将1994

2014年数据输入训练好的机器学习模型,采用对应观测数据,评估机器预估结果;评估指标采用不同机器模型输出结果与观测数据空间分布的相关系数及偏差大小计算的技巧分数评定,其中r为机器模型输出结果与观测相关系,σ
f
为模型与观测的方差接近程度,r0为模型与观测的最高相关系数。模型模拟性能越好,其s分数越高;根据模式模拟性能的技巧评分s,给不同模式分配集成的权重,其中第i个机器学习模型对应的
集成权重由决定,构成集成的最优机器学习模型;最后输入未来不同增温下的预估数据,利用集成的模型给出最优的概率集成预估,即降水变化相对目前1994

2014年参考阶段的值超过某一阈值(δt
th
)的概率p,则可用式表示:
17.本发明的优点在于以下几点:采用了多模式和多机器算法集成技术,降低了未来预估中由不同模式和不同算法引入的不确定度,使预估的结果更具可靠性。
附图说明
18.图1为本发明的工作流程图;
19.图2为本发明数据集生成的流程图。
具体实施方式
20.下面结合附图对本发明的具体实施方式作出进一步说明:
21.一种集成机器学习的多模式降水预估方法,其特征在于:其特征在于包含以下步骤:
22.第一步:数据预处理:计算观测和22个cmip6模式历史和不同路径(ssp245,ssp585)下未来时期的强降水、连续干日、平均总降水、连续最大5日降水气候指数,采用双线性插值将cmip6结果插值到与观测资料一致的格点上,采用时间轴的数据切片得到中国区域未来增温1.5、2、3度时期的极端降水指数;
23.第二步:数据集构建:将cmip6模式数据分割成训练数据、评估验证数据、未来气候预估数据集,将每个cmip6模式格点的极端气候指数数据按照时间

空间交替的顺序映射成一列一维的数据,然后按照模式名的首字母顺序,将所有模式数据排列成一个二维数据矩阵,最后一列为观测结果;
24.第三步:集成机器学习预估:利用历史时段数据集训练多种机器学习模型,从时间和空间评估机器模型性能,基于性能赋予不同权重,集成生成未来不同增温情景、增温幅度的平均及极端降水概率预估结果。
25.实施例中,步骤一中基于观测和22个cmip6模式的逐日降水数据和wmo的降水气候指数定义计算并插值到中国区域的0.5x0.5度格点。
26.实施例中,步骤一中降水的气候极端指数包括历史时期和未来ssp245,ssp585升温路径下,先对工业革命时期温升1.5、2、3度前后20年气候态的强降水、连续干日、平均总降水和连续最大5日降水。
27.实施例中,步骤二中用到的机器学习类型包括且不限于bp神经网络、lstm神经网络、卷积神经网络、k均值聚类算法、随机森林和多元线性回归算法。
28.实施例中,步骤三中评估机器学习模型性能指标是基于其中r为机器模型输出结果与观测相关系,σ
f
为模型与观测的方差接近程度,r0为模型与观测的最高相关系数,模型模拟性能越好,其s分数越高。
29.实施例中,步骤三中机器学习模型的权重由决定,i对应模式,n模式总
数,概率集成预估是降水变化超过某一阈值(δt
th
)的概率p则可用式表示:
30.本发明首先分别计算cmip6气候模式的历史时期(1961—2014)和不同路径(ssp245,ssp585)下增温1.5和2度的中国区域预估时期的强降水、连续干日、平均总降水、连续最大5日降水等气候指数,然后利用历史时期的气候指数对多种机器学习算法进行训练,最后基于不同机器学习算法的性能对不同算法预估的结果进行融合,得到最终的预估结果。
31.本发明具体工作流程如下:首先按照wmo认可的27项极端气候指极端气候指数定义计算22个cmip6模式的历史时期1961

2014和未来不同路径(ssp245,ssp585)下的强降水、连续干日、平均总降水、连续最大5日降水等气候指数;进一步按照ipcc组织推荐的定义,计算22个cmip6模式输出的全球平均温升到达工业革命前水平的1.5度、2度、3度的时间点前后20年年的数据切片;进而获得训练期、检验期和预估期的模式资料;根据所采用的来自于中国气象局的0.5
×
0.5
°
逐日观测降水数据集(cn5.1)的空间格点信息,采用双线性插值插值算法,将模式结果插值到与观测资料空间分辨率一致的0.5
×
0.5
°
的格点上,得到格点化降水;为了消除不同参量间的数值范围的影响,将每个模式的5个时段的四个极端气候指数数据进行标准化,采用数据减去原始数据平均值除以标准方差进行标准化;最后将每个模式的5个时段的四个极端气候指数数据由空间格点的时间序列按照时间

空间交替的顺序映射成一列一维的数据,将22个不同cmip6模式的映射数据的按照模式名的首字母顺序排列成一个二维数据矩阵,最后一列为观测结果,进而得到集成的数据集;将数据集中的1961

1993年训练数据集分别输入到bp神经网络、lstm神经网络、卷积神经网络、k均值聚类算法、随机森林、多元线性回归等6种机器学习模型,利用不同机器学习模型的参数优化函数,优化调整6种学习模型的输入参数,得到参数最优调整的参数化的机器学习模型;将1994

2014年数据输入训练好的机器学习模型,采用对应观测数据,评估机器预估结果;评估指标采用不同机器模型输出结果与观测数据空间分布的相关系数及偏差大小计算的技巧分数评定,其中r为机器模型输出结果与观测相关系,σ
f
为模型与观测的方差接近程度,r0为模型与观测的最高相关系数。模型模拟性能越好,其s分数越高;根据模式模拟性能的技巧评分s,给不同模式分配集成的权重,其中第i个机器学习模型对应的集成权重由决定,构成集成的最优机器学习模型;最后输入未来不同增温下的预估数据,利用集成的模型给出最优的概率集成预估,即降水变化相对目前1994

2014年参考阶段的值超过某一阈值(δt
th
)的概率p,则可用式表示:
32.以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1