一种基于改进CNN-LSTM的光伏发电功率预测方法与流程

文档序号:33380843发布日期:2023-03-08 05:39阅读:96来源:国知局
一种基于改进CNN-LSTM的光伏发电功率预测方法与流程
一种基于改进cnn-lstm的光伏发电功率预测方法
技术领域
1.本发明涉及太阳辐射测量技术领域,尤其涉及一种基于改进cnn-lstm的光伏发电功率预测方法。


背景技术:

2.石油、煤炭等化石燃料被大量使用并逐渐走向枯竭,目前世界各国既要应对能源缺乏,又要应对环境恶化。发展可再生新能源已经成为各国的首要选择,太阳能作为可再生新能源的一种,不受地域限制的辐照在地球表面,具有可再生能力强、清洁环保、资源丰富、开发利用方便等优点。因此,对光伏发电进行功率预测能提高光伏发电的预见性,帮助电网更好地运行和调度以及制定合理的电价,推进光伏发电的进一步蓬勃发展,越来越多的机器学习算法和优化模型应用于光伏发电功率预测,预测精度和模型稳定性都有比较好的表现。高质量的数据样本与稳定的预测模型结合,能进一步提高预测精度,光伏发电出力情况受天气和其他随机因素影响比较大,数据采集也受设备的限制含有大量噪声和缺测、误测信息。低质量的数据样本输入到预测模型中会增加模型训练的难度进而影响预测效果。目前,基于统计分析构建输入输出模型比较常见,而且输入的数据质量直接影响预测精度,因此本发明提供一种基于改进cnn-lstm的光伏发电功率预测方法,旨在提高光伏发电功率预测的精度,在光伏发电大规模并网时提高光伏出力的预见性,帮助电网更好的调度安排和制定电价,提高光伏发电消纳能力。


技术实现要素:

3.本发明的目的在于提供一种基于改进cnn-lstm的光伏发电功率预测方法,以解决上述背景技术中提出的问题。
4.本发明解决其技术问题所采用的技术方案是:
5.一种基于改进cnn-lstm的光伏发电功率预测方法,包括以下步骤:
6.1)从特征分析的角度对样本数据进行分析和降维处理。
7.光伏发电系统输出功率由其系统构成和组件转换效率决定,受气象因素影响,其中,太阳辐射强度以及温度的影响很大。温度影响光伏阵列的组件温度,从而影响设备效率和逆变器的输出功率。n
e1
=eqaηη
t
ηiηnη1×
10-3
,其中,ne1为理论输出功率,单位kw;eq为太阳辐射强度,单位w/m2;a为组件安装面积,单位m2;η
t
为组件转换效率温度修正系数;ηi为组件安装方位角、倾角修正系数;ηn为逆变器效率系数;η1为线路损失修正系数;es为标准状态下的阳光强度,es=1000w/m2,paz为光伏系统的安装容量,单位kw。
8.数据预处理具体步骤:(1)检查数据连续性并标记缺点数据和重复数据,将时间转换成时间戳格式,逐次计算相邻两点的时间戳的差值,对缺测和重复的数据点进行标记;(2)根据最大功率值检验异常数据。通过箱线图确定数据的上下限,对异常的数据进行标记和删除;(3)对连续缺测的功率数据进行删除操作。(4)对数据进行归一化处理,消除不同因
素间量纲的影响。根据数值换算到区间的不同,可分为以下两种:一是最小最大值法,二是平均值法。最小最大值法将数值换算到(0,1)区间,平均值法将数值换算到(-1,1)区间,最小最大值法计算公式如下:其中,x*为归一化后的数值,xmax为最大值,xmin为最小值。平均值法计算公式如下:其中,x*为归一化后的数值,xmean为x的平均值,xvar为x的方差。
9.2)在分析各气象成分与输出功率的相关关系后进行特征选择,剔除冗余成分实现数据降维。
10.光伏场站数据特征降维是指数据预处理之后,仍然存在着许多冗余信息。减少冗余信息,能够减少模型的计算量、提高训练速度、优化模型性能。从特征的角度完成数据降维,能够帮助数据分析。基于特征角度的数据降维方法选取特征选择法。
11.影响光伏发电功率预测的气象因素有很多,将光伏场站提供的16个数值天气预报数据进行有效的特征选择,形成特征子集,可以更好地帮助模型训练,同时减少计算量。本发明选择单变量特征选择方法,分别衡量每一个输入特征与输出的关系,保留相关度高的特征,删除相关性低的。
12.光伏发电功率预测的降维算法是指光伏发电功率预测研究过程中面临着大量的采集数据,保留和功率相关性高的数据,去除冗余数据,对于光伏发电功率预测的研究很有必要性。通过特征选择进行数据降维,可以帮助模型在训练中更好的学习和分析数据特征,从而提升预测效果。
13.相关系数用于描述变量之间的相关性,本发明选择pearson相关系数:皮尔逊相关系数,由卡尔
·
皮尔逊提出,用于度量两组数据之间的相关性,其定义为其中cov(x,y)是x,y的协方差,σ
x
、σy分别是x,y的标准差。ρ
x,y
的值越接近1,表示两组数据的相关性越强。
14.梯度提升决策树是一种基于梯度提升机和决策树的改进型学习算法。gbdt基于集成学习中boosting思想,在大量无规则的样本数据中自上而下的搜索,寻找当前的最优划分点,在减少残差的梯度方向上,每一次迭代都会创建一些决策树[46]。通过gbdt可以减小气象因素间的冗余程度。输入训练数据集t={(x1,y1),(x2,y2),

,(xn,yn)},损失函数为l(y,f(x))。输出为回归树f(x)。
[0015]
基于特征选择和特征转换的降维算法,皮尔逊相关系数和gbdt方法侧重于考虑原始样本输入成分对输出的影响,减少相关性不强的成分,实现数据降维。而主成分分析侧重于得到尽可能包含原始样本所有信息的矩阵,得到原始样本的低维矩阵实现数据降维。特征选择和特征转换的降维方法都有自身的优缺点。为了结合不同降维方法的优点,本发明提出一种新的降维方法pearson-gbdt-pca,综合相关系数和gbdt特征选择得到的成分实现降维,再经过pca矩阵转换实现数据样本的进一步降维。
[0016]
3)在保留光伏发电功率重要影响成分的基础上,通过特征转换实现再次降维。
[0017]
基于主成分分析特征转换的数据降维算法研究是指除了分析输出和输入成分间
的相关性,去掉冗余输入成分的降维方法外,还考虑整体样本的数据转换降维处理。本发明应用的是主成分分析降维方法,pca主要目的是把高维变量变成线性无关的低维变量,同时对原始变量仍具有很好的表征。pca是一种矩阵压缩算法,将n
×
m的原始样本矩阵转换成n
×
k的低维矩阵,在转换之后,变量间互不相关。设输入x1,x2,
……
,xm是原始变量,pca后得到目标变量y1,y2,
……
,ym,满足k<m。设原始样本x为n
×
m的矩阵
[0018][0019]
xi=(x
1i
,x
2i


,x
mi
)
t
,i=1,2,...,m
[0020]
设w为变换矩阵,则pca将原始变量线性组合为
[0021][0022][0023]
总结得y=(y1,y2,...,ym)=w
t
,且yi=w
1i
x1+w
2i
x2+...+w
mi
xm,i=1,2,...,m。
[0024]
这里要求yi与yj(i≠j,i,j=1,2,

,m)不相关且方差逐次递减,则cov(yi,yj)=0且方差d(yi)>d(yj)。设c是x=(x1,x2,

,xm)的协方差矩阵,其特征值为λi(i=1,2,

,m),其中λ1≥λ2≥...λm,则
[0025]
d(yi)=λi,i=1,2,...,m
[0026]
d(y1)≥d(y2)≥...≥d(ym)
[0027][0028]
第k个主成分的方差贡献率定义为
[0029]
pca算法的具体步骤为:设原始数据x为n
×
m的矩阵,将原始数据x进行零均值化,即其中为xi的平均值,σi为方差,然后求协方差矩阵的特征值和特征向量,按照累计方差贡献率的大小排列特征值,选择合适的k个成分,则得到的主成分为根据主成分分析得出各主成分的方差贡献率。
[0030]
4)数值天气预报数据和功率数据组成二维时间序列数据,考虑到长短期记忆神经网络和卷积神经网络在处理时间序列数据和二维数据方面的优势,将两种神经网络模型组合应用到光伏发电功率预测中。
[0031]
通过卷积神经网络提出改进的cnn-lstm光伏发电功率预测模型,并利用贝叶斯优化方法优化模型。卷积神经网络是最早提出的深度学习算法之一,有特殊的卷积和池化处理方式,可以提取二维图像和高维数据,常被应用于计算机视觉和自然语言处理。光伏发电功率涉及的数值天气预报数据和历史功率数据是二维数据,可以被卷积神经网络较好的提取特征,完成模型拟合。卷积神经网络由输入层、隐含层和输出层组成,其中隐含层又分为卷积层、池化层和全连接层。输入层的作用是预处理输入的图像或数据。预处理方法能够减少数据量纲的差异对模型的影响,可以提高模型的学习效率。隐含层包括卷积层、池化层、全连接层,作用是完成特征的提取和学习。卷积层中最重要的是卷积核。卷积核的个数、大小和形状,需要根据数据或图像的实际情况确定。一维卷积通常用来处理一维、二维数据或图像,二维卷积常用于二维数据矩阵的卷积操作,三维卷积常用于医学及视频处理领域的三维数据。步长是指进行卷积计算时,每次移动的格数。即步长为几时,卷积核每次向右移动几个格子。池化层也称采样层,主要作用是采样降维,即在不改变数据或图像特征的前提下,将数据的维数尽可能地降低。通过池化函数,将特征图某点替换为其相邻输出的全局特征。全连接层的作用是将特征映射到样本标记空间。通过全连接层将神经元权重连接,并向下一层网络传递数据信息。即通过矩阵乘法对特征向量加权求和计算,并通过激活函数得到全连接层的输出。输出层即增加一层softmax层,并将全连接层的输出值输入到softmax层中,得到神经网络的最后输出,即神经网络非线性映射的非线性变换结果。卷积神经网络特有的卷积核池化操作能很好的提取数据的特征信息,而长短期记忆神经网络具有很强的记忆性,对序列化数据处理效果较好。基于两种神经网络模型的优势考虑,将两种模型组合。模型的输入数据为经过第二章降维处理后的四维矩阵,每次输入6个时刻的数据,即得到6
×
4的数组矩阵。
[0032]
基于改进的cnn-lstm光伏发电功率预测模型分为两部分:一是通过卷积层提取数据特征并构建卷积神经网络,得到光伏发电功率的预测值。二是通过lstm输入层输入数据信息,并加入attention注意力机制对输出进行加权平均计算,得到光伏发电功率预测值。模型最后加入全连接层,处理两部分得到的预测值,得到最终的改进cnn-lstm光伏发电功率预测值。
[0033]
本发明创造的有益效果是:通过pearson相关系数和gbdt特征重要度分析,实现了基于特征选择的数据降维,又通过主成分分析,实现了基于特征转换的数据降维,保留与输出有较强相关性的气象因素,剔除冗余气象因素实现数据降维,有效的减少模型的计算量、提高训练速度、优化模型性能。
[0034]
基于改进的cnn-lstm光伏发电功率预测模型,从时序和全局两个角度对输入数据进行了不同的处理预测,有更强的鲁棒性和信息提取能力,从而产生更好的预测效果。
[0035]
在改进的cnn-lstm光伏发电功率预测模型的基础上进行贝叶斯优化,使改进后的cnn-lstm模型有更高的稳定性。
附图说明
[0036]
图1是数据预处理流程图;
[0037]
图2是pearson-gbdt-pca的降维方法流程图;
[0038]
图3是基于改进的cnn-lstm光伏发电功率预测模型结构;
[0039]
图4是结合贝叶斯优化的改进cnn-lstm光伏发电功率预测算法流程图。
具体实施方式
[0040]
下面将结合本发明创造实施例中的附图,对本发明创造实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明创造一部分实施例,而不是全部的实施例。基于本发明创造中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明创造保护的范围。
[0041]
下面结合本发明的具体实施例和附图,对本发明加以详细描述。
[0042]
其中结合图1,数据预处理具体步骤为1)检查数据连续性并标记缺点数据和重复数据。将时间转换成时间戳格式,逐次计算相邻两点的时间戳的差值,对缺测和重复的数据点进行标记;2)根据最大功率值检验异常数据。通过箱线图确定数据的上下限,对异常的数据进行标记和删除;3)对连续缺测的功率数据进行删除操作;4)对数据进行归一化处理,消除不同因素间量纲的影响。
[0043]
其中结合图2,皮尔逊相关系数分析中认为相关系数大于0.35的成分与输出有较强的相关性;gbdt特征选择中认为特征重要度大于0.02的成分与输出有较强的相关性。对皮尔逊相关系数选择的特征集和gbdt选择的特征集取并集运算得到综合特征集,即认为综合特征集中的气象因素均与光伏发电功率有较强的相关性。按照pca方法,选择累计方差贡献率超过85%的主成分,作为后续模型的输入样本。因此得到特征集的过程为:经过相关系数的计算得到特征集x1为短波辐射、热感通量、长波辐射、湿度、温度,共5个数值天气预报数据成分,即x1={c1,c2,c3,c4,c5}。经过gbdt特征重要度的计算得到特征集为x2为短波辐射、温度、长波辐射、地表气压、云量,共5个数值天气预报数据成分,即x2={c1,c3,c5,c6,c7},综合考虑两种特征选择的降维方法,对特征集x1,x2取并集运算得到特征集x3为短波辐射、热感通量、长波辐射、湿度、温度、地表气压、云量,共7个数值天气预报数据成分,即x3={c1,c2,c3,c4,c5,c6,c7},对特征集x3进行主成分分析,求其协方差矩阵c和特征值λi(i=1,2,

,7),组成特征向量w,得到前i个主成分的方差贡献率,对特征集x3进行主成分分析,最后选择累计方差大于85%的主成分组成最终降维矩阵。
[0044]
其中结合图3,基于改进的cnn-lstm光伏发电功率预测模型分为两部分:一是通过卷积层提取数据特征并构建卷积神经网络,得到光伏发电功率的预测值。二是通过lstm输入层输入数据信息,并加入attention注意力机制对输出进行加权平均计算,得到光伏发电功率预测值。模型最后加入全连接层,处理两部分得到的预测值,得到最终的改进cnn-lstm光伏发电功率预测值。在该改进结构中,存在cnn和lstm两种不同的网络分支,网络拓扑结构为发散与融合的结构。通过这种拓扑结构可以达到融合两种不同网络优点的目的。网络的输入是从时序上进行了分割之后的特征序列,该输入首先进入发散的网络结构,发散出两个分支。lstm的结构特征让该分支可以着重于从时序上进行特征提取,得到预测结果,称为时序分支。cnn的结构特征将时序维度和特征维度看作一个二维的空间结构,等价化了时序和外部观测特征两个维度,更加关注于输入本身的全局性。整体网络通过发散分支分别结合了两种不同网络的优点,从时序和全局两个角度对输入数据进行了不同的处理预测。最后将两种不同的预测结果进行融合,即使用全连接网络将两个发散的分支连接起来进行最后的输出。经过这种改进,本发明提出的方法相较于其他的单纯的时序方法或者cnn方法
会有更强的鲁棒性和信息提取能力,从而产生更好的预测效果。
[0045]
其中结合图4,本发明使用贝叶斯优化作为cnn-lstm光伏发电功率预测模型的模型搜索方法。在该改进结构中,存在cnn和lstm两种不同的网络分支,网络拓扑结构为发散与融合的结构。通过这种拓扑结构可以达到融合两种不同网络优点的目的。网络的输入是从时序上进行了分割之后的特征序列,该输入首先进入发散的网络结构,发散出两个分支。lstm的结构特征让该分支可以着重于从时序上进行特征提取,得到预测结果,称为时序分支。cnn的结构特征将时序维度和特征维度看作一个二维的空间结构,等价化了时序和外部观测特征两个维度,更加关注于输入本身的全局性。整体网络通过发散分支分别结合了两种不同网络的优点,从时序和全局两个角度对输入数据进行了不同的处理预测。最后将两种不同的预测结果进行融合,即使用全连接网络将两个发散的分支连接起来进行最后的输出。经过这种改进,本发明所提出的方法相较于其他的单纯的时序方法或者cnn方法会有更强的鲁棒性和信息提取能力,从而产生更好的预测效果,结合贝叶斯优化的改进cnn-lstm光伏发电功率预测算法流程如附图4所示。在进行贝叶斯优化时,主要搜索参数:cnn卷积核大小、时序的范围、优化器选择,将优化器选择转化为0-1之间的离散浮点值、初始学习率、学习率衰减、学习率衰减的回合数、batchsize大小、cnn的层数以及中间层的卷积核数量、权重衰减、损失函数选择,将损失函数选择转化为0-1之间的离散浮点值等。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1