基于LSTM-GA模型的时间序列风能数据预测方法与流程

文档序号:31449393发布日期:2022-09-07 12:50阅读:463来源:国知局
基于LSTM-GA模型的时间序列风能数据预测方法与流程
基于lstm-ga模型的时间序列风能数据预测方法
技术领域
1.本发明涉及风能数据预测的技术领域,具体为基于lstm-ga模型的时间序列风能数据预测方法。


背景技术:

2.由于风力发电是波动的,其行为表现出某种形式的规律性,存在短期预测模型、中期预测模型和长期预测模型。随着时间范围的增加,预测中的错误也会随之增加。
3.文献研究表明,对风力发电系统的预测主要依赖于短期和中期模型。在分析和预测方面,由于预测成本较低,短期模型大多是基于统计的,并且学习方法是基于历史时间序列数据的;使用机器学习技术的人工智能方法在统计模型中使用逐渐增多,这些方法是数据驱动的;使用某种形式的神经网络,模糊系统或时间序列分析,线性回归,支持向量机模型等。然而,神经网络模型的选择对预测过程至关重要。各种神经网络模型正在研究中,包括简单的多层感知器(mlp)到更复杂的高级技术,如深度神经网络(dnn),循环神经网络(rnn),长期短期模型(lstm)和基于卷积的神经网络(cnn)。这些方法在输入和输出之间建立线性或非线性关系并进行风电功率预测。与传统的人工神经网络(ann)不同,dnn对运行很深的隐藏层数使用多级抽象,而ann被认为是浅层。cnn是一种深度模型,它使用可学习的权重,将它们传递给激活函数并使用邻域池化操作来减小尺寸,从而输出越来越复杂的特征层次结构。当使用适当的正则化训练时,cnn可以实现卓越的性能。rnn使用定向连接和内部存储器递归处理输入序列。网络的内部状态允许它动态的时间行为。rnn可以发现内在隐藏的高级不变结构数据,并使用其内部存储器处理任意输入序列。由于循环性,如果网络展开太多时间步长,某些权重的梯度开始变得太小或太大,即梯度消失问题。为了克服这个问题,设计了lstm网络,其中隐藏层被一组门计算单元替换。
4.尽管在预测wpf方面取得了许多成功,但仍有必要建立非线性消费模式的模型,以使用中低期预测模型来提高预测和稳定性。考虑到时间的增加会导致误差的增加,优化时间捕捉窗口是有意义的,因为仅仅增加延迟时间滞后的数量就会导致数据过度拟合并导致误差累积。
5.因此,急需一种新的风能预测方法,从而给风能发电提供更好地指导性用电规划。


技术实现要素:

6.针对上述问题,本发明提供了基于lstm-ga模型的时间序列风能数据预测方法,其提出了一种结合遗传算法ga和长短期记忆网络lstm的风能数据预测方法,采用ga算法优化lstm网络、选择最佳窗口大小及神经元数目的结构因素,利用优化后的lstm网络进行风能数据分析,实现可靠预测。
7.基于lstm-ga模型的时间序列风能数据预测方法,其特征在于:首先进行数据预处理,将数据集分为历史风能数值和未来风能值用于训练;然后使用ga算法对窗口大小和单元数进行解码,将窗口数据集用于训练和验证;输入时间滞后的数量和隐藏层的数量、规模
大小及迭代次数;通过lstm模型用于训练和计算验证集上的误差;使用ga计算的时间窗口返回当前ga解决方案的适应度分数,利用ga寻得lstm网络的最优参数,将优化后的lstm网络用于风能数据处理,以得到风能数据的精准预测。
8.其进一步特征在于,其包括如下步骤:
9.步骤一、数据预处理,在风能数据输入预测模型之前,需要对其进行预处理,并将预处理后的数据集划分成3个集合,即训练集、验证集和测试集,输入风能数据x是预测时间前一周中,每小时的风能数据与相应的温度、天气、日照、环境信息的汇总,x=[x1,x2,l,xn],输出时标记数据为待预测时刻的实际风能数据。
[0010]
采用数据归一化方法将风能与天气数据预处理成(1,2)之间的数值,假定历史风能数据与天气数据集是m
×
n的矩阵,则x表示为:
[0011][0012]
对原始数据集矩阵每一列的数据进行归一化处理:
[0013][0014]
式中,与分别为矩阵x每列数据的最小值和最大值,x
ij
代表第i个样本输入数据的第j个特征;
[0015]
步骤二、lstm-ga模型构建,其通过ga算法需找最优参数应用于lstm网络训练,之后进行适应度值评估,判断为收敛后进行参数优化设定、进行lstm网络训练,结合训练数据、连通数据集进行测试数据计算、最后到处风能数据预测分析结果;其中训练数据被选择用于训练数据样本参与基于ga的参数选择。
[0016]
其更进一步特征在于:
[0017]
其还包括有步骤三,评价标准,其通过计算平均绝对误差mae和样本标准差rmse,确定lstm-ga网络的数据分析性能。
[0018]
其再进一步特征在于:
[0019]
lstm-ga模型构建中,lstm网络训练中包含了存储单元、输入、输出和遗忘门,单元之间有一个反复的联系;该单元在随机时间间隔上传送“状态”值,并由单元的每个门执行写入、读取和复位操作。除非输入门允许,否则相关数值不能被存储在单元格中,在时刻为处的输入值和存储单元的候选值的推导公式如下:
[0020]it
=σ(ωixi+u
iht-1
+bi)
[0021][0022]
式中,w是权重,u是矩阵,b是偏差。遗忘门处理状态单元的权重,遗忘门的值计算如下:
[0023]ft
=σ(ωfx
t
+ufh
i-1
+bj)
[0024]
存储单元的状态更新如下:
[0025][0026]
存储单元的新状态有助于确定输出门的数值:
[0027]ot
=σ(ωox
t
+u
oht-1
+v
oct
+bo)
[0028]
lstm单元的最终输出值为:
[0029][0030]
lstm-ga模型构建中,采用ga算法寻找最优参数的流程如下,初始化-计算适应度-检查终止条件-交叉-选择和变异,在初始化阶段,搜索空间中任意选择一条染色体,然后根据预设的适应度函数确定染色体的适应度,适应度函数是影响模型性能的关键因素,一些染色体在这一过程中被反复选择,而有些染色体未经选择就消失了,因为这些染色体是根据适应度函数的适应性随机选择产生的,显性染色体有更高的机会遗传到下一代,所选择的显性染色体经过相似片段的交换和基因组合的改变可以产生后代,故将ga算法用于优化lstm模型,以选择最佳的视窗大小、神经元数目与批量大小;
[0031]
lstm网络是由lstm单元组成的深层循环神经网络模型,通过在模型中共享参数,n可以被推广到训练过程中的不可见序列长度,采用lstm网络处理风能数据,向后保留1000个时间步长以上的信息;
[0032]
在lstm-ga模型中,ga算法开始搜索空间之前对具有可能解的种群进行初始化,其中使用的染色体编码为二进制位,表示时间窗口大小、批量大小和神经元数量,通过一个预设的适应度函数来判断解,选择最小的rmse作为最优解。利用ga寻得lstm网络的最优参数,将优化后的lstm网络用于风能数据处理,以得到精准预测;
[0033]
步骤三中,mae定义为预测值与实际值之间绝对误差的平均值,反映了预测值的实际误差,rmse是预测值与实际观测值之差的样本标准差。mae和rmse的定义分别如下:
[0034][0035][0036]
式中,n为采样数量,y'为模型预测值,y为实际期望值。
[0037]
采用本发明后,首先进行数据预处理,将数据集分为历史风能数值和未来风能值用于训练。然后使用ga算法对窗口大小和单元数进行解码,将窗口数据集用于训练和验证;输入为时间滞后的数量和隐藏层的数量、规模大小及迭代次数。lstm模型用于训练和计算验证集上的误差;使用ga计算的时间窗口返回当前ga解决方案的适应度分数;其提出了一种结合遗传算法(ga)和长短期记忆网络(lstm)的风能数据预测方法,采用ga算法优化lstm网络、选择最佳窗口大小及神经元数目的结构因素,利用优化后的lstm网络进行风能数据分析,实现可靠预测。
附图说明
[0038]
图1为本发明方法的模型框图;
[0039]
图2为本发明的lstm网络训练的流程图;
[0040]
图3为ga算法的处理过程如流程图。
具体实施方式
[0041]
基于lstm-ga模型的时间序列风能数据预测方法:首先进行数据预处理,将数据集分为历史风能数值和未来风能值用于训练;然后使用ga算法对窗口大小和单元数进行解码,将窗口数据集用于训练和验证;输入时间滞后的数量和隐藏层的数量、规模大小及迭代次数;通过lstm模型用于训练和计算验证集上的误差;使用ga计算的时间窗口返回当前ga解决方案的适应度分数,利用ga寻得lstm网络的最优参数,将优化后的lstm网络用于风能数据处理,以得到风能数据的精准预测。
[0042]
其进一步特征在于,其包括如下步骤:
[0043]
步骤一、数据预处理,在风能数据输入预测模型之前,需要对其进行预处理,并将预处理后的数据集划分成3个集合,即训练集、验证集和测试集,输入风能数据x是预测时间前一周中,每小时的风能数据与相应的温度、天气、日照、环境信息的汇总,x=[x1,x2,l,xn],输出时标记数据为待预测时刻的实际风能数据。
[0044]
采用数据归一化方法将风能与天气数据预处理成(1,2)之间的数值,假定历史风能数据与天气数据集是m
×
n的矩阵,则x表示为:
[0045][0046]
对原始数据集矩阵每一列的数据进行归一化处理:
[0047][0048]
式中,与分别为矩阵x每列数据的最小值和最大值,x
ij
代表第i个样本输入数据的第j个特征。
[0049]
步骤二、lstm-ga模型构建,其通过ga算法需找最优参数应用于lstm网络训练,之后进行适应度值评估,判断为收敛后进行参数优化设定、进行lstm网络训练,结合训练数据、连通数据集进行测试数据计算、最后到处风能数据预测分析结果;其中训练数据被选择用于训练数据样本参与基于ga的参数选择;
[0050]
lstm-ga模型构建中,lstm网络训练中包含了存储单元、输入、输出和遗忘门,单元之间有一个反复的联系;该单元在随机时间间隔上传送“状态”值,并由单元的每个门执行写入、读取和复位操作。除非输入门允许,否则相关数值不能被存储在单元格中,在时刻为处的输入值和存储单元的候选值的推导公式如下:
[0051]it
=σ(ωixi+u
iht-1
+bi)
[0052]
[0053]
式中,w是权重,u是矩阵,b是偏差。遗忘门处理状态单元的权重,遗忘门的值计算如下:
[0054]ft
=σ(ωfx
t
+ufh
i-1
+bj)
[0055]
存储单元的状态更新如下:
[0056][0057]
存储单元的新状态有助于确定输出门的数值:
[0058]ot
=σ(ωox
t
+u
oht-1
+v
oct
+bo)
[0059]
lstm单元的最终输出值为:
[0060][0061]
lstm-ga模型构建中,采用ga算法寻找最优参数的流程如下,初始化-计算适应度-检查终止条件-交叉-选择和变异,在初始化阶段,搜索空间中任意选择一条染色体,然后根据预设的适应度函数确定染色体的适应度,适应度函数是影响模型性能的关键因素,一些染色体在这一过程中被反复选择,而有些染色体未经选择就消失了,因为这些染色体是根据适应度函数的适应性随机选择产生的,显性染色体有更高的机会遗传到下一代,所选择的显性染色体经过相似片段的交换和基因组合的改变可以产生后代,故将ga算法用于优化lstm模型,以选择最佳的视窗大小、神经元数目与批量大小;
[0062]
lstm网络是由lstm单元组成的深层循环神经网络模型,通过在模型中共享参数,n可以被推广到训练过程中的不可见序列长度,采用lstm网络处理风能数据,向后保留1000个时间步长以上的信息;
[0063]
在lstm-ga模型中,ga算法开始搜索空间之前对具有可能解的种群进行初始化,其中使用的染色体编码为二进制位,表示时间窗口大小、批量大小和神经元数量,通过一个预设的适应度函数来判断解,选择最小的rmse作为最优解。利用ga寻得lstm网络的最优参数,将优化后的lstm网络用于风能数据处理,以得到精准预测。
[0064]
步骤三、评价标准,其通过计算平均绝对误差mae和样本标准差rmse,确定lstm-ga网络的数据分析性能;mae定义为预测值与实际值之间绝对误差的平均值,反映了预测值的实际误差,rmse是预测值与实际观测值之差的样本标准差。mae和rmse的定义分别如下:
[0065][0066][0067]
式中,n为采样数量,y'为模型预测值,y为实际期望值。
[0068]
其工作原理如下,首先进行数据预处理,将数据集分为历史风能数值和未来风能值用于训练。然后使用ga算法对窗口大小和单元数进行解码,将窗口数据集用于训练和验证;输入为时间滞后的数量和隐藏层的数量、规模大小及迭代次数。lstm模型用于训练和计算验证集上的误差;使用ga计算的时间窗口返回当前ga解决方案的适应度分数;其提出了一种结合遗传算法(ga)和长短期记忆网络(lstm)的风能数据预测方法,采用ga算法优化lstm网络、选择最佳窗口大小及神经元数目的结构因素,利用优化后的lstm网络进行风能
数据分析,实现可靠预测。
[0069]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0070]
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1