一种基于改进VMD-TCN的滑坡位移预测方法

文档序号:34387770发布日期:2023-06-08 07:05阅读:85来源:国知局
一种基于改进VMD-TCN的滑坡位移预测方法与流程

本发明涉及滑坡位移预测领域,尤其涉及一种基于改进vmd-tcn的滑坡位移预测方法。


背景技术:

1、山体滑坡是一种普遍存在的全球性灾害,是一种危害极大的地质灾害。滑坡灾害的发生不仅对人民群众生命和财产构成了重大威胁,同时也给生态环境、经济发展等方面造成了极大的影响。滑坡时间的预报是一世界性难题,滑坡位移预测对于减少滑坡的经济损失和人员伤亡有重要的意义。因此,建立有效、准确的滑坡位移预测模型,提高滑坡位移预测模型的性能,对于降低滑坡带来的损失有着重要的意义。

2、滑坡位移预测模型通常分为两大类:基于物理的模型和数据驱动的模型。基于物理的模型通常要涉及物理机制,需要提供山体滑坡的清晰物理解释。然而,这些模型通常需要对滑坡中涉及的材料进行大量昂贵的岩土工程表征,因此基于物理模型的泛化能力有限。基于物理的模型还需要对各种物理参数进行调整和优化,例如摩擦系数、凝聚力等。这些参数往往难以准确测量或估计,因此也会影响模型的准确性和可靠性。同时,基于物理的模型往往需要大量的人力和时间投入,建立和维护成本高,难以适应大规模的滑坡监测和预测需求。

3、数据驱动模型包括人工神经网络,决策树,支持向量机以及随机森林等。这些研究表明,数据驱动模型并不需要建立复杂的物理过程,从而提供令人满意的预测。但由于这些传统的模型对于高维度和大规模数据的处理能力较弱,因此在处理这些类型的数据时可能会遇到困难。并且传统的模型的结构相对较为简单,难以处理更加复杂的数据模式和关系。

4、近年来,基于时间序列和深度学习的混合预测模型,因其在滑坡位移预测中预测精度和泛化能力相比于传统的数据驱动模型更强而备受关注。例如,循环神经网络rnn及其变体,包括长短期记忆网络lstm和门控循环单元gru。gru和lstm相比于传统模型,它们能够捕捉长期依赖关系,可以处理变长序列数据。但循环神经网络模型训练时间长,在反向传播算法中,存在梯度消失或梯度爆炸的问题,这会导致模型训练的困难和不稳定。

5、滑坡位移预测作为滑坡监测预警的重要组成部分,对滑坡灾害的防治具有重要意义。随着深度学习的不断发展,bai等人在2018年提出的时间卷积网络,英文temporalconvolutional network,简称tcn。在广泛的序列建模任务中,tcn不仅比循环架构的神经网络如rnn及其变体更精确,而且更快速、更清晰。tcn的有效性已经在多个领域得到证实,但目前尚未发现将tcn应用在滑坡位移预测中的研究,如何正确地应用这一方法仍是一个挑战。

6、目前,关于滑坡位移的分解,常用的方法有ma,emd、vmd等。

7、ma英文moving average,中文为移动平均,emd英文empiricalmodedecomposition,中文经验模态分解, vmd英文variational mode decomposition,中文变分模态分解。

8、vmd是一种自适应、完全非递归的模态变分和信号处理的方法。它将一个实值输入信号分解成多个具有特定稀疏特性的本征模态函数(intrinsic mode function,imf)分量,具有可提前确定模态分量个数的优点。相比于emd方法存的端点效应和模态分量混叠的问题,vmd对非平稳、非线性信号具有良好的处理效果。


技术实现思路

1、本发明的目的就在于提供一种解决因现有集中技术所用的循环神经网络模型存在训练时间长、梯度消失或梯度爆炸等问题导致模型存在难以训练和不稳定等问题的,能提高滑坡位移预测的精度的一种基于改进vmd-tcn的滑坡位移预测方法。

2、为了实现上述目的,本发明采用的技术方案是这样的:一种基于改进vmd-tcn的滑坡位移预测方法,包括以下步骤;

3、(1)采集待预测区域内一滑坡变形监测点在时间t1~t2时间段内的滑坡数据,所述滑坡数据包括该滑坡变形监测点的历史累积位移数据和影响该区域滑坡的多个影响因子序列;

4、(2)用vmd方法对历史累积位移数据进行分解,得到趋势项位移和周期项位移;

5、(3)确定预测的时间节点t3,用holt线性趋势预测对趋势项位移进行预测,得到时间节点t3的趋势项位移预测值;

6、(4)将影响因子序列分别与周期项位移进行相关性分析,获得相关性高的前n个影响因子序列,与周期项位移构成n+1维的影响因子向量,n=2~4;

7、(5)训练得到周期项位移预测模型,包括步骤(51)~(53);

8、(51)构建一周期项位移预测网络;

9、所述周期项位移预测网络包括依次连接的q层改进tcn块、一自注意力模块、一平均最大池化层和一全连接层,q≥3;

10、所述改进tcn块为包括依次连接的第一空洞因果卷积层、第一权重规范化层、第一激活函数层、第一丢弃层、第二空洞因果卷积层、第二权重规范化层、第二激活函数层、第二丢弃层,还包括多头注意力层、1×1卷积层、求和单元和第三激活函数层;

11、上一级的输出、第一丢弃层和第二丢弃层的输出均连接多头注意力层,其中上一级的输出作为查询向量、第一丢弃层的输出作为键向量、第二丢弃层的输出作为值向量,并行送入多头注意力层中,多头注意力层的输出经1×1卷积层后再与第二丢弃层的输出一起送入求和单元中求和,再经第三激活函数层进行非线性变换后得到该改进tcn块的输出;

12、(52)计算预测时间差△t=t2-t3,预设滑动窗口的大小s和步长,s>△t,用滑动窗口在影响因子向量上进行m次采样,每次采样得到一长度为s的子向量,依次标记为第1个到第m个;

13、(53)对第i个子向量,其最后一列元素对应的时间为ti,影响因子向量中ti+△t时刻的周期项位移为第i个子向量的期望输出,依次用子向量训练周期项位移预测网络,得到周期项位移预测模型,其中i=1~m;

14、(6)根据时间节点t3,用滑动窗口对(t2-△t)~t2时间段的影响因子向量采样得到一待测子向量,输入周期项位移预测模型得到输出,即为时间节点t3的周期项位移预测值;

15、(7)将时间节点t3处的周期项位移预测值和趋势项位移预测值相加,得到滑坡位移预测值。

16、作为优选:所述步骤(1)中,所述影响因子序列包括但不限于库水位、降雨量、滑坡前一段时间内的位移、土壤水分含量、土壤强度、矿物质类型;所述步骤(1)还包括对历史累积位移数据和影响因子分别预处理,所述预处理包括去除异常数据和噪声滤波。

17、作为优选:步骤(4)中相关性分析包括但不限于pearson相关性分析、spearman相关性分析、kendall相关性分析和主成分分析;

18、步骤(4)还包括对影响因子向量进行z-score标准化处理。

19、作为优选:所述步骤(4)中,获得相关性高的前n个影响因子序列,具体为,将影响因子序列按相关性从高到低排序,获取前n个的影响因子序列。

20、作为优选:改进tcn块中,

21、所述第一空洞因果卷积层、第二空洞因果卷积层用于提取输入其中数据的卷积特征;

22、所述第一权重规范化层和第二权重规范化层,分别用于对第一空洞因果卷积层和第二空洞因果卷积层的输出进行规范化处理;

23、所述第一激活函数层和第二激活函数层,分别用于对第一权重规范化层和第二权重规范化层的输出进行非线性变换;

24、所述第一丢弃层和第二丢弃层,分别用于随机将第一激活函数层和第二激活函数层部分输出的权重设置为0;

25、所述多头注意力层,用于将输入按时间序列拆分为多个头,每个头分别计算注意力输出一向量,再按时间序列将向量拼接得到多头注意力层的输出。

26、作为优选:所述第一权重规范化层和第二权重规范化层,为批归一化层、组归一化层或实例归一化层;

27、所述第一激活函数层、第二激活函数层、第三激活函数层的激活函数为relu、elu、或leakyrelu;

28、所述第一丢弃层、第二丢弃层为随机丢弃层或自适应丢弃层。

29、本发明所述改进tcn块中,第一空洞因果卷积层、第二空洞因果卷积层的因果性保证了模型不会利用未来信息;第一权重规范化层和第二权重规范化层能增强模型的泛化能力;第一激活函数层和第二激活函数层能增强模型的表达能力;第一丢弃层和第二丢弃层能随机丢弃部分特征,避免过拟合;多头注意力层采用多头注意力机制,能以不同的程度关注输入序列的不同部分,进而提取关键特征。

30、自注意力模块采用自注意力机制对输入序列的不同部分进行不同程度的关注,以更好地捕捉序列中的重要信息。

31、平均最大池化层,目的是对输入的数据进行降维。具体来说,池化层将输入特征图分为不重叠的子区域,并对每个子区域计算平均值或最大值。这样做可以保留其中的重要特征,减少计算量,并防止过拟合。

32、本网络的最后为全连接层,改层作为神经网络的输出层使用,用于将前一层的所有节点与当前层的所有节点连接起来。这样做可以将前一层的特征组合成更高层次的特征,从而更好地进行预测。

33、与现有技术相比,本发明的优点在于:

34、(1)关于改进tcn块:因果卷积层是指输入数据只依赖于过去的值,不依赖于未来的值,这样可以保证模型对于未来的预测不会受到未来信息的影响。空洞因果卷积是在因果卷积的基础上,通过在卷积核中跳过一些位置来引入空洞,从而扩大感受野,进一步提高模型的性能。在改进tcn块中引入多头注意力,用以不同的程度关注输入序列的不同部分,进而提取关键特征;本发明中,改进tcn块具有不同的层次,不同层次的改进tcn块具有不同的作用:较浅层的改进tcn块用于提取输入序列的低级别特征,局部时间模式和趋势;较深层的改进tcn块用于提取更高级别的特征,长期时间依赖关系和序列整体模式。通过堆叠多个改进tcn块,以得到更深层次的时间序列表示,提高模型的预测准确度和鲁棒性。

35、(2)关于多头注意力层:多头注意力技术用在空洞因果卷积操作的不同阶段,以及输入序列的不同部分进行不同程度的关注,以更好地捕捉序列中的重要信息。通过将多头注意力结合到改进的tcn块中,可以更好地利用时间序列中的信息。改进的tcn块的输出为一个完整的输出向量,并没有分段。

36、(3)关于自注意力模块:自注意力技术可以帮助模型更好地学习时间序列中不同时间点之间的关系。自注意力会将当前时间点的特征向量与其它时间点的特征向量进行比较,并根据它们的相似度来计算当前时间点的输出。这种方法可以帮助模型更好地理解时间序列中不同时间点之间的相关性,从而提高预测精度。

37、(4)本发明的多头注意力机制和自注意力机制相互融合,用多头注意力层更好地捕捉时间序列中的重要信息,再利用自注意力机制模块进一步提取时间序列中的重要信息,从而可以更好地利用时序数据中的信息,捕捉周期性特征,提高模型对时间序列的建模能力和预测精度,本发明将改进tcn块、多头注意力机制、自注意力机制进行了有机融合,不仅有效解决现有技术所有神经网络模型存在训练时间长、梯度消失或梯度爆炸等问题,且模型容易训练并相对稳定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1