本发明属于电力系统,主要涉及一种基于混合深度学习的光伏发电预测方法、装置及存储介质。
背景技术:
1、当前光伏发电作为一种清洁、可再生的能源形式,在一定程度上可以缓解化石能源的短缺、环境污染和气候变化等问题。精准地预测光伏功率,不仅可为光伏电站并网运行及能量管理运行提供依据,也为及时发现设备异常、排除故障提供参考。因此,准确地预测光伏发电功率对电网的未来规划和稳定安全的运行具有重要意义。然而,影响光伏发电功率的关键因子太阳辐照度受气候、地势等影响,具有明显的波动性和间歇性,因此给光伏发电功率预测带来一定困难。
2、目前光伏发电功率预测分为物理方法、统计方法和机器学习方法。物理方法主要是构建物理模型进行计算,而建模相对困难。统计方法主要是时间序列法和回归分析法,仅适用于平稳时间序列且数据样本量较少的情况。机器学习方法以支持向量机、人工神经网络为代表。由于光伏发电功率的时序特性,在处理时序非线性问题上具有优势的长短期记忆神经网络lstm被广泛应用。但是单一lstm模型的预测结果具有滞后性,并且随着预测时间的延长,预测效果变差。单一模型虽在不断地改进,但还是存在自身先天的不足与局限。光伏发电功率受太阳辐照度、气温等环境因素影响,因此,光伏发电的预测还需要考虑不同环境因素的影响,提升模型的预测效果。此外,尽管考虑了各种环境因素,也未对模型的输入特征进行筛选,致使预测模型输入参数过多,增加了预测模型的复杂度。
技术实现思路
1、本发明为了解决上述问题,提出了一种基于混合深度学习的光伏发电预测方法、装置及存储介质,本发明解决了传统光伏发电功率特征提取不足的问题,弥补了lstm对长时序输入特征弱化与遗忘的不足,提高了预测模型对不同时刻历史数据的敏感度。
2、为实现上述目的,本发明采用如下技术方案:
3、一种基于混合深度学习模型的光伏发电预测方法包括以下步骤:
4、步骤1.采集光伏发电功率以及历史气象数据作为研究数据集,并对原始数据进行预处理;
5、步骤2.采用最大信息系数mic的特征选择方法来分析光伏发电功率与气象因素之间的相关关系,筛选出相关性较强的特征;
6、步骤3.构建基于cnn-lstm-mha的光伏发电预测模型,使用步骤2获得的经特征提取后的训练数据集训练cnn-lstm-mha网络模型;
7、步骤4.采用平均绝对百分比误差、标准均方根误差和相关系数对模型的预测效果进行整体评价。
8、cnn-lstm-mha是卷积神经网络-长短期记忆神经网络-多头注意力机制的英文简称。cnn对应是卷积神经网络的英文简称,lstm对应的长短期记忆神经网络的的英文简称,mha对应的是多头注意力机制的英文简称。
9、所述步骤1的数据包括辐照度、温度、湿度、风速这些气象数据以及光伏发电功率的历史数据;步骤1还包括:对所述历史数据进行预处理,所述预处理是对不同类型数据进行数据清洗和归一化处理。
10、1)数据清洗的目的是确保数据的完整性和准确性,在数据清洗过程中,需检查数据集中是否存在缺失值、异常值,并相应的做出处理。缺失值和异常值的填充方法如下式:
11、
12、式中,xi为填充后的第i个数据,xi-2、xi-1、xi+1和xi+2分别为第i-2、i-1、i+1和i+2个数据。
13、所述步骤2的mic的计算公式如下式,它的取值范围为[0,1],其中,0表示没有相关性,1表示完全相关性,即值越大,表明两变量的相关性越强。
14、
15、
16、式中,m为光伏发电功率变量,n为气象因素变量,i(m,n)为m、n两变量的互信息系数,p(m,n)为m、n两变量的联合概率,p(m)和p(n)分别为m、n两变量的概率,mic(m,n)为m、n两变量的最大信息系数,a,b是在m,n方向上划分格子的个数,即网格分布,b为常数。
17、所述步骤3的卷积神经网络cnn包括卷积层、批量归一化层、激活函数层、最大池化层和全连接层;输入数据首先通过卷积层不同尺度的卷积核进行卷积计算,提取不同精细度的特征,卷积之后加入批量归一化层、激活函数层,得到一组特征向量;接着通过最大池化层对生成的特征向量进行压缩,并通过全连接层调整输出维度。
18、所述步骤3的长短期记忆神经网络lstm单元包含遗忘门、输入门和输出门,其数学模型如下:
19、遗忘门:
20、ft=σ(wf·[ht-1,xt]+bf)
21、输入门:
22、
23、
24、it=σ(wi·[ht-1,xt]+bi)
25、输出门:
26、ot=σ(wo·[ht-1,xt]+bo)
27、ht=ot·tanh(ct)
28、式中,ft是遗忘门t时刻的输出状态,it是输入门t时刻的输出状态,ot是输出门t时刻的输出状态;xt为t时刻的样本数据;和ct分别是神经元t时刻的即时状态及长期状态;ht是神经元t时刻的隐藏状态,ht-1是神经元t-1时刻的隐藏状态;wf和bf分别为遗忘门对应的权重系数矩阵和偏置项;wi和bi分别为输入门对应的权重系数矩阵和偏置项;wo和bo分别为输出门对应的权重系数矩阵和偏置项;wc和bc分别为神经元对应的权重系数矩阵和偏置项;σ(·)和tanh(·)分别是sigmoid激活函数和双曲正切激活函数。
29、所述步骤3的多头注意力机制mha能够并行执行多个注意力,主要用于对输入的序列进行特征提取和处理,模型学习到不同的特征表示,从而提高模型的性能,其计算过程如下所示:
30、1)首先,将查询q、键k和值v分别映射到n个不同的线性空间中:
31、
32、2)然后,使用缩放点积注意力,计算每个注意力头的注意力得分:
33、
34、3)最后,将多个注意力头的结果拼接经过另一个线性转换,得到最终的多头注意力:
35、
36、其中,wiq为查询映射到第i个注意力头对应的线性空间的参数矩阵,wik为键映射到第i个注意力头对应的线性空间的参数矩阵,wiv为值映射到第i个注意力头对应的线性空间的参数矩阵,qi为查询映射到第i个注意力头对应的线性空间的结果,ki为键映射到第i个注意力头对应的线性空间的结果,vi为值映射到第i个注意力头对应的线性空间的结果,hi为第i个注意力头的注意力得分,softmax(·)为归一化指数函数,为ki的转置,d是一个缩放因子,mha(q,k,v)为最终多头注意力的输出结果,wo为将多头注意力表示映射到原始的向量空间中参数矩阵。
37、所述步骤3的训练过程为:将数据集按比例分为训练集、验证集和测试集,采用adam优化算法对建立的cnn-lstm-mha模型进行训练优化。
38、所述步骤4采用平均绝对百分比误差、标准均方根误差和相关系数对模型的预测效果进行整体评价。
39、平均绝对百分比误差:
40、
41、标准均方根误差:
42、
43、相关系数:
44、
45、式中,nmape为平均绝对百分比误差,nrmse为标准均方根误差,r2为实际值和预测值之间的相关性系数,yi代表实际值,y′i代表预测值,m为样本总数,代表实际值的样本平均值,代表预测值的样本平均值。
46、相应的,本发明提出一种基于cnn-lstm-mha的光伏发电预测装置,包括:
47、数据存储模块,用于存储光伏发电功率以及历史气象数据;
48、数据处理模块,用于对数据存储模块中的数据进行预处理,预处理包括数据清洗和归一化处理,数据清洗确保数据的完整性和准确性,归一化处理防止变量间数量级差异较大影响模型预测精度,处理后的数据保存在数据存储模块;
49、特征选择模块,用于对数据存储模块的经预处理后的训练数据集进行特征选择,并将其作为光伏发电预测模块的输入。所述特征选择模块采用最大信息系数mic的特征选择方法来分析光伏发电功率与气象因素之间的相关关系,发掘不同特征之间的相互作用及给出特征的重要性分析结果;
50、光伏发电预测模块,用于计算光伏发电功率的预测值。所述光伏发电预测模块采用基于cnn-lstm-mha模型,将注意力机制融入光伏发电预测模块,可以在众多输入信息中关注对当前任务更重要的信息特征,降低对其他信息的关注度,甚至过滤掉无关信息,可提高预测精度。
51、本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的基于cnn-lstm-mha的光伏发电预测方法的步骤。
52、有益效果:
53、1、本发明方法采用mic方法作为理论支撑,选择影响光伏发电的关键数据特征,提升输入变量与目标变量的相关性,有效提高预测精度;
54、2、本发明方法结合cnn在特征提取上的优势以及lstm在时间序列预测方面的优势,解决了传统光伏发电功率特征提取不足的问题,并利用mha注意力机制弥补了lstm对长时序输入特征弱化与遗忘的不足,提高了预测模型对不同时刻历史数据的敏感度。