一种基于混合深度学习模型的洪水过程概率预报方法

文档序号:32166887发布日期:2022-11-12 05:06阅读:85来源:国知局
一种基于混合深度学习模型的洪水过程概率预报方法

1.本发明属于水文预报的技术领域,具体涉及一种基于混合深度学习模型的洪水过程概率预报方法。


背景技术:

2.水文预报是一种重要的防洪抗旱非工程措施,如何提高洪水预报精度、延长预见期一直是制约水库运行管理水平的关键技术瓶颈。近年来,人工智能技术快速发展,出现了能够有效处理非线性、非稳态时间序列的深度学习模型,长短时记忆(lstm)神经网络是最具代表性的模型之一,相较于传统的人工神经网络,它能够在多时段洪水预报中取得较好的预报精度。冯钧等(2019)基于lstm神经网络提出一种中小河流短期洪水预报方法,该方法能够提取有效特征,具有较高的预报精度,优于传统的支持向量机模型,尤其在洪峰阶段,峰现时间和洪水峰值的预报精度有较大提高。但是,这些深度学习模型缺少物理成因基础,可解释性较低,不利于在工程管理中实施应用。zhou等(2022)将基于概念性水文模型的预报流量作为深度学习模型的额外输入,试图在预报流量过程中耦合产汇流过程。同时,基于过程水文模型的预报流量可以补充lstm模型在长预见期内的输入,缓解lstm模型过拟合问题,在一定程度上提高了深度学习模型的可解释性和预报精度。
3.同时,随着深度学习的研究不断深入,出现了可以解决序列-序列问题的编码-解码结构。编码过程可以提取输入序列的重要特征,并压缩至固定长度的中间向量,解码过程可以将中间向量转换为目标输出序列。耦合编码-解码结构的lstm神经网络,可以在编码和解码过程中将前一时间步提取的有效特征传递给后一时间步,在保证输出变量时间相关性的前提下,直接获得多预见期的预报洪水过程,相对单输出lstm模型有较高的可解释性和适用性。王帆等(2022)基于编码-解码结构提出一种基于深度学习框架的洪水预报模型及洪水预报方法,能够将预报降雨数据作为模型输入,充分利用水雨情信息,从而提高预报精度并延长预见期。
4.由于气象强迫等模型输入、参数和结构等不确定性因素的影响,预报洪水不可避免的存在不确定性问题,深度学习模型的确定性点估计为防洪决策提供的风险信息是有限的。而概率预报能够反映预报不确定性信息,可以为决策者决策提供风险信息。刘章君等(2017)提出一种集合降水预报与实时洪水概率预报的耦合方法,通过实时校正确定性预报误差、耦合集合降水预报信息和基于copula函数的贝叶斯预报系统,可以提高洪水预报精度和为决策者提供更可靠的预报区间。概率预报能够提高预报价值和可信度,对防洪决策等工作是十分必要的。
5.综上所述,深度学习模型的研究仍存在一些不足:(1)基于传统的编码-解码结构的神经网络无法学习概念性水文模型的产汇流过程,并存在暴露偏差问题,即训练过程和验证过程不一致,容易导致深度学习模型可解释性较低,性能不稳定,从而降低预报精度;(2)深度学习模型的输出多数为确定性点估计,无法提供预报不确定性估计,预报价值和可信度较低。


技术实现要素:

6.本发明的目的在于针对现有技术的不足之处,提供一种基于混合深度学习模型的洪水过程概率预报方法,该方法克服了曝光偏差问题、考虑输出变量时间相关性和量化预报不确定性的深度学习概率模型方法,能够进一步提高其适用性、可解释性和可信度。
7.为解决上述技术问题,本发明采用如下技术方案:
8.一种基于混合深度学习模型的洪水过程概率预报方法,其特征在于,包括如下步骤:
9.步骤1,收集和分析气象水文资料,计算流域平均产汇流时间,并根据实际需求设定预报预见期长度;
10.步骤2,根据步骤1收集的数据率定概念性水文模型参数,并采用率定后的概念性水文模型预报多时段预见期流量过程;
11.步骤3,以步骤2概念性模型的预报流量过程为外源输入,建立长短时记忆lstm-ede神经网络,将lstm-ede神经网络隐含层输出作为混合密度网络mdn的输入,构建用于量化预报不确定性的lstm-ede-mdn模型;
12.步骤4,设定步骤3构建的lstm-ede-mdn模型的激活函数和超参数,建立损失函数以优化超参数,并整理lstm-ede-mdn模型的输入和目标输出变量;
13.步骤5,根据步骤4整理的输入和目标输出变量训练lstm-ede-mdn模型,进而推求目标变量的条件概率分布函数,获得一定置信水平下的预报区间,量化预报过程的不确定性。
14.进一步地,步骤1具体包括:
15.步骤1.1,搜集的气象水文资料包括但不限于降水、气温、蒸发以及流域出口断面的流量,数据资料的时间尺度为日尺度或日内尺度;
16.步骤1.2,将数据资料划分为训练期、验证期和测试期数据;
17.步骤1.3,采用步骤1-1收集的降水、流量实测资料,依据不同时滞的降水与流量的相关系数估算流域平均产汇流时间,相关系数最大时对应的时滞数即为流域平均产汇流时间;
18.步骤1.4,根据实际防洪等任务需要,确定洪水预报的预见期长度,预见期长度小于等于流域平均产汇流时间。
19.进一步地,步骤2具体包括:
20.步骤2-1,根据实际情况选择合适的概念性水文模型;
21.步骤2-2,根据步骤1整理的数据,采用sce-ua法率定模型参数,并验证模型的有效性以及测试模型性能;
22.步骤2-3,采用步骤2-2测试后的概念性水文模型进行洪水预报,获得多时段预见期的流量过程。
23.进一步地,步骤3具体包括:
24.步骤3-1,将lstm神经网络耦合至外源输入编码-解码结构ede结构中,构建lstm-ede模型,其中,在ede结构解码过程中开发出接收概念性水文模型预报流量过程的接口;
25.步骤3-2,以y为目标输出变量,将lstm-ede模型解码过程的隐含层输出x作为混合密度网络mdn的输入,建立lstm-ede-mdn混合深度学习的概率预报模型,lstm-ede-mdn模型
输出多个核函数的权重w和参数θ,将核函数按照权重w相加组合为目标变量y的条件密度函数f(y|θ,x):
[0026][0027][0028]
式中,m为核函数的数量,是高斯核函数,wi为第i个核函数的权重。
[0029]
进一步地,步骤4具体包括:
[0030]
步骤4-1,设定lstm-ede-mdn模型的激活函数和超参数;
[0031]
步骤4-2,按照极大似然估计法构建损失函数,通过损失函数来优化调整超参数;
[0032]
步骤4-3,采用预报依据时间之前的实测降水和流量资料作为lstm-ede-mdn模型编码过程的输入,输入时间步数等于流域平均产汇流时间;采用概念性水文模型预报流量作为解码过程的输入;lstm-ede-mdn模型的输出为每一预报时刻目标变量的条件分布函数,输出时间步数等于预见期长度;另外,在步骤1收集的数据中整理出适合lstm-ede-mdn模型训练、验证和测试的数据集,包括编码、解码过程的输入以及目标输出变量。
[0033]
进一步地,步骤4-2中,构建的损失函数为:
[0034][0035]
式中,n为一个批次的数据长度;
[0036]
神经网络通过损失函数量化目标变量在lstm-ede-mdn模型输出条件分布函数中的概率密度大小,进而调整超参数;lstm-ede-mdn模型生成的混合密度函数为f(y

θ,x),在训练lstm-ede-mdn模型时,通过自适应矩估计算法优选出使得目标变量y在对数似然函数ln(f(y

θ,x))中概率密度最大的参数。
[0037]
进一步地,步骤5具体包括:
[0038]
步骤5-1,在步骤4中整理出相应的输入和目标输出变量分别作为lstm-ede-mdn模型训练、验证和测试的数据集,采用步骤4整理的训练集训练多个lstm-ede-mdn模型;
[0039]
步骤5-2,将步骤4整理的验证集代入步骤5-1训练完成的lstm-ede-mdn模型中,获得目标变量的条件概率分布函数,以连续排位概率分数指标最小为目标,在多个lstm-ede-mdn模型中选择验证集泛化性能最优的网络参数;
[0040]
步骤5-3,根据步骤5-2优选的网络参数,采用步骤4整理的测试集测试lstm-ede-mdn模型的概率预报性能,推求出目标变量的条件概率分布函数和确定性预报结果,同时设定置信水平,获得预报区间,从而实现量化预报不确定性。
[0041]
与现有技术相比,本发明的有益效果为:
[0042]
1.本发明构建的lstm-ede-mdn模型嵌套了可以接收概念性水文模型预报流量的ede结构,不仅可以学习概念性水文模型的产汇流过程,还可以克服曝光偏差问题,使得训练过程和验证过程一致,提高了可解释性、计算效率和预报精度;
[0043]
2.本发明构建的lstm-ede-mdn模型嵌套了mdn技术,可以在考虑输出变量时间相关性的前提下,将确定性点估计转换为概率分布的估计,获得一定置信水平的预报区间,从而达到量化预报洪水过程不确定性的目的,可以为决策者提供更多的风险信息,提高了预报价值和可信度。
附图说明
[0044]
图1是本发明实施例中lstm-ede-mdn模型的结构示意图;其中,(a)为编码过程,(b)为解码过程,(c)为概率预报过程;
[0045]
图2是本发明实施例中混合密度网络的示意图;
[0046]
图3是本发明实施例的实际流量、确定性预报及95%置信度预报区间的示意图。
具体实施方式
[0047]
下面将结合本发明实施例对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0048]
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
[0049]
下面结合具体实施例对本发明作进一步说明,但不作为本发明的限定。
[0050]
本发明实施例提供的一种基于混合深度学习模型的洪水过程概率预报方法,包括如下步骤:
[0051]
步骤1,收集和分析气象水文资料,计算流域平均产汇流时间并根据实际需求设定预报预见期长度;该步骤具体包括:
[0052]
步骤1-1,选择研究流域,搜集气象水文资料,具体包括降水、气温、蒸发以及流域出口断面的流量等实测资料,数据资料的时间尺度可为日尺度或日内尺度;
[0053]
步骤1-2,将步骤1-1搜集的数据资料划分为训练期、验证期和测试期数据;
[0054]
步骤1-3,采用降水-径流关系估计算流域平均的产汇流时间,采用步骤1-1收集的降水、流量实测资料,依据不同时滞的降水与流量的相关系数估算流域平均产汇流时间,相关系数最大时对应的时滞数即为流域平均产汇流时间;
[0055]
步骤1-4,根据实际防洪等任务需要,确定洪水预报的预见期长度,预见期长度应小于等于流域平均产汇流时间。
[0056]
步骤2,根据步骤1收集的数据率定概念性水文模型参数,并采用率定后的概念性水文模型预报多时段预见期流量过程;具体包括以下步骤:
[0057]
步骤2-1,根据实际情况选择合适的概念性水文模型,包括但不限于新安江模型等;
[0058]
步骤2-2,根据步骤1整理的训练期数据,采用sce-ua法率定概念性水文模型的参数,采用验证期数据检验概念性水文模型的有效性,并通过测试期数据测试概念性水文模型的性能;
[0059]
步骤2-3,采用测试后的概念性水文模型进行洪水预报,获得多时段预见期的流量过程。
[0060]
步骤3,以步骤2概念性模型的预报流量为外源输入,建立基于外源输入编码-解码结构的长短时记忆(lstm-ede)神经网络,将lstm-ede神经网络隐含层输出作为混合密度网络(mdn)的输入,构建用于量化预报不确定性的lstm-ede-mdn模型;该步骤具体包括:
[0061]
步骤3-1,将lstm神经网络耦合至外源输入编码-解码结构(ede)结构中,构建
lstm-ede模型(结构图见图1(a)和(b))。ede结构在解码过程中开发出接收外源输入序列的接口,能够接收概念性水文模型的预报流量过程(图1(b)虚线),不仅可以学习概念性水文模型的产汇流过程,还可以克服传统编码-解码结构存在的曝光偏差问题,提高可解释性、长预见期预报精度和计算效率;
[0062]
步骤3-2,以y为目标输出变量,将lstm-ede模型解码过程的隐含层输出x作为混合密度网络(mdn)的输入(mdn,图1(c)),建立所提lstm-ede-mdn混合深度学习概率预报模型(图1)。mdn可将lstm-ede模型与混合密度函数结合,借助神经网络生成多个核函数的权重w和参数,将核函数按照权重w相加组合为条件密度函数f(y|θ,x),θ为函数参数集,以逼近目标变量的真实分布。洪水预报序列为一维时间序列,混合密度网络采用高斯核函数,网络输出为多个核函数的权重w、期望μ和方差σ,其中,w通过softmax函数进行归一化,以确保形成有效的离散分布;σ采用指数函数处理,以保证为非负值函数。给定输入lstm-ede模型隐含层输出x时目标变量y的概率密度函数f(y|θ,x)为:
[0063][0064][0065]
式中,m为核函数的数量,是高斯核函数,wi为第i个核函数的权重。
[0066]
常用的核函数为高斯核函数公式为:
[0067][0068]
mdn的输出变量yf元素个数为3m;
[0069][0070]
lstm-ede-mdn模型可以在考虑输出变量时间相关性的前提下,将解码过程产生的点估计转化为概率分布的估计,以反映预报过程的不确定性。
[0071]
步骤4,设定步骤3构建的lstm-ede-mdn模型的激活函数和超参数,按照极大似然估计法建立损失函数,并整理lstm-ede-mdn模型的输入和目标输出变量;该步骤具体包括:
[0072]
步骤4-1,设定lstm-ede-mdn概率预报模型的激活函数和超参数,激活函数选择tanh函数,超参数包括编码和解码过程中lstm神经网络隐藏层层数、隐藏层内神经元数量和mdn中包含的核函数个数等。编码和解码过程中采用了n层包含m个神经元节点的lstm神经网络和mdn选择k个高斯核函数,图2为包含3个高斯核函数的mdn示意图;
[0073]
步骤4-2,按照极大似然估计法构建损失函数,不同于确定性输出深度学习的损失函数(如均方误差和平均绝对误差等),lstm-ede-mdn概率预报模型的损失函数是通过量化目标变量在网络输出条件分布函数中的概率密度大小来调整超参数的。lstm-ede-mdn模型生成的混合密度函数为f(y

θ,x),在训练lstm-ede-mdn模型时,通过自适应矩估计(adam)算法优选出使得目标变量y在对数似然函数ln(f(y

θ,x))中概率密度最大的参数。adam算法在反向传播过程中总是朝损失函数减小速率最快的方向优化神经网络超参数,因此,损失函数定义为:
[0074][0075]
式中:n为一个批次(batch)的数据长度。
[0076]
步骤4-3,采用预报依据时间之前的实测降水和流量资料作为lstm-ede-mdn模型编码过程的输入变量,输入时间步数应等于流域平均产汇流时间;采用概念性水文模型预报流量作为解码过程的输入,即外源输入序列。lstm-ede-mdn模型的输出为每一预报时刻目标变量的条件分布函数,输出时间步数等于预见期长度。另外,在步骤1收集的数据中整理出适合lstm-ede-mdn模型训练、验证和测试的数据集作为编码过程以及解码过程的输入。
[0077]
步骤5,根据步骤4整理的输入和目标输出变量训练lstm-ede-mdn模型,进而推求目标变量的条件概率分布函数,获得一定置信水平下的预报区间,实现量化预报不确定性。
[0078]
步骤5-1,采用步骤4整理的训练集训练多个lstm-ede-mdn模型,训练过程包括设置adam算法参数,如学习速率设置为0.001,设置训练神经网络使用的批次大小(batch size)和迭代次数(epoch)分别为120和600,以快速实现损失函数的优化过程;设置丢失率(dropout)为0.1,以获得最优的泛化性能等。
[0079]
步骤5-2,将步骤4整理的验证集数据代入步骤5-1训练完成的多个lstm-ede-mdn模型中,可以获得目标变量的条件概率分布函数。以连续排位概率分数(crps)指标最小为目标,在多个lstm-ede-mdn模型中选择验证集泛化性能最优的网络参数。连续概率排位分数(crps)指标可以评价概率预报的条件分布函数与预报量真实分布的拟合程度,能够综合考虑概率预报可靠性和集中度。较低的crps值被认为有更好的概率预报性能,其计算公式为:
[0080][0081][0082]
式中:n为样本数,q
o,i
表示第i个目标变量(实测流量)。f(
·
)是估计的概率分布函数,i(
·
)是示性函数,r表示流量变量。
[0083]
步骤5-3,根据步骤5-2优选的网络参数,采用步骤4整理的测试集数据测试lstm-ede-mdn模型的概率预报性能,从而推求出目标变量的条件概率分布函数和确定性预报结果,同时设定95%置信水平,获得预报区间,从而实现量化预报不确定性。图3展示了实测流量、根据本实施例模型计算得到的期望值预报流量和95%置信度的预报区间的对比情况。从图3可以看出,本实施例计算得到的期望值预报流量过程可以较好的拟合实测流量过程,同时,95%置信度的预报区间能够覆盖多数实测流量点,表明预报区间是合理可靠的,能够合理量化预报不确定性。
[0084]
综上,本发明首先收集研究流域气象水文基础资料,建立概念性模型,预报多时段的洪水过程,其次,在以概念性模型预报流量为外源输入的lstm-ede神经网络输出层耦合混合密度网络(mdn),构建lstm-ede-mdn概率预报模型,同时采用极大似然估计法建立损失函数,训练神经网络参数,最终获得在每个预见期的条件分布函数和预报区间,实现概率预
报。本发明耦合了以概念性模型预报流量为外源输入的lstm-ede神经网络和混合密度函数,可以解决传统编码-解码结构的曝光偏差问题和学习概念性水文模型产汇流过程,同时还能在考虑输出变量时间相关性的前提下,获得多时段洪水过程的概率预报,从而量化预报不确定性,提高了深度学习模型的适用性、可解释性和可信度。
[0085]
以上仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1