本发明属于电力系统领域,涉及一种基于相似日聚类和深度学习的光伏短期发电功率预测方法。
背景技术:
1、当前光伏短期发电功率预测技术主要有:①传统数学统计学方法。这类统计方法模型简单、计算速度快,能很快得出预测结果,但是只对线性关系具有较好的预测精度,对于包含复杂非线性关系的数据预测精度较低。②智能预测方法。比如近年来较为火热的深度学习法、神经网络算法等。这些方法可以在一定程度上提高具有非线性关系和时序性的短期光伏发电功率的预测精度。
2、但是在不同季节、不同天气类型下的nwp气象数据具有间歇性、随机性,即使使用方法2其预测精度也难以达到预期,现有的光伏功率预测为了使预测精度达到预期,一般会从构建良好的,模型输入样本、模型本身的构建、模型参数优化三方面入手。
3、现有目前针对短期光伏发电功率预测还存在以下问题及难点,(1)受不同季节影响和天气类型变换的原因,nwp数据变化规律较为不明显,波动性强,不利于模型进行学习以及预测。(2)构建的输入样本数据质量不高,导致在相同预测模型下达到的预测精度较低。(3)模型预测效率较低。
4、针对传统的算法模型对于短期光伏发电功率预测精度较低的问题,基于相似日聚类和深度学习设计一种高效且预测精确度高的算法预测模型,该模型通过运用相似日聚类的算法构建良好的输入样本,使其在同等后续预测模型下能够获得更好的预测效果,再结合cnn-gru-attention预测算法,达到对短期光伏发电功率预测精确度的提升,并提高模型的预测效率。
技术实现思路
1、有鉴于此,本发明的目的在于提供基于相似日聚类和深度学习的光伏短期发电功率预测方法。
2、为达到上述目的,本发明提供如下技术方案:
3、基于相似日聚类和深度学习的光伏短期发电功率预测方法,该方法包括以下步骤:
4、s1:收集并整理光伏发电功率历史数据和数值天气预报nwp(numerical weatherprediction)数据,通过统一预处理,供后续算法使用;
5、s2:基于皮尔森和最大信息系数mic算法对数据进行降维处理;
6、s3:利用相似日聚类算法构建输入样本数据;
7、s4:利用深度学习算法cnn-gru-attention进行学习并预测光伏发电功率。
8、进一步的,所述s3具体为:
9、s31:准备光伏发电功率数据集
10、收集某地区的某光伏发电电站的数值天气预报nwp数据和历史发电功率数据,并对搜集到的数据进行统一标准和异常值缺失值处理;
11、s32:相似日聚类算法进行输入样本构建
12、①输入数据降维处理
13、在对输入样本进行相似日聚类之前,对高维nwp数据进行相关性分析,寻找对于输出的光伏发电功率具有高相关性的特征,剔除冗余特征;
14、②kmeans+gra算法进行相似日聚类
15、利用皮尔森相关系数和最大互信息系数选择与光伏输出功率具有较强相关性的nwp特征的并集作后续研究,成功对高维nwp数据进行降维处理,去除相关性低或不相关的冗余特征数据;
16、kmeans算法为:对于给定的样本集,计算样本之间的距离,将样本划分为k个簇类,对于最佳k值使用肘部法则来确定,使得聚类后的样本数据簇内相似,簇间有差别;
17、具体步骤如下:
18、(1)设定输入的样本集,根据肘部法则确定所需聚类的最佳聚类数量k值;
19、(2)从样本集中随机抽取k个数据向量作为初始化聚类中心;
20、(3)计算每个数据点到k个聚类中心的欧式距离,把每个数据点分配到距离它最近的聚类中心代表的类别中,全部计算分配完毕后得到初始化聚类结果,形成k个簇类;
21、(4)得到初始化的聚类结果后,重新计算每个簇类的类中心点,即计算均值,得到新的簇类中心;
22、(5)迭代循环,重复步骤(3)和步骤(4),直到均值不再变化或者达到最初预设的迭代次数,则停止计算;
23、x0(k)、xi(k)是待预测日以及第i个历史日的第k个特征,ρ是分辨系数,取值为0.5;记δi(k)=|x0(k)-xi(k)|,计算关联度系数的公式为下:
24、
25、那么待预测日x0与历史日xi的总关联度ri的计算公式为下:
26、
27、通过灰色关联度计算,确定与待预测日的nwp特征数据曲线相似度最高的日期作为相似日;
28、③cnn-gru-attention模型训练
29、卷积神经网络cnn层提取数据中不同特征值之间的空间联系。
30、进一步的,所述相关性分析包括两部分:
31、(1)皮尔森相关性分析;皮尔森相关系数分析不同变量间的线性相关性,根据计算得到的相关系数来确定保留特征;
32、(2)最大互信息系数mic;最大互信息系数用来衡量两个特征变量之间的关联程度,通过计算两个变量之间的互信息,正则化之后的值衡量两个变量之间的相关性;
33、皮尔森相关系数的计算公式如下:
34、
35、n是数据样本的大小,|r|越大则两个变量之间的相关性越强,|r|≥0.6表示强相关,0.4≤|r|<0.6表示中等强度相关,0.2≤|r|<0.4表示弱相关,0≤|r|<0.2表示极弱相关或不相关;
36、最大互信息系数计算公式如下:
37、
38、公式(2)为互信息的概念;mic的计算公式如下:
39、
40、a,b是x,y方向上的划分格子的个数,即网格分布,b是变量,设置大小为数据量的0.6次方左右。
41、本发明的有益效果在于:通过相关性分析对模型输入数据进行降维处理,并对nwp数据按照不同季节和不同天气类型进行聚类分析找寻相似日,利用相似日和待预测日的nwp数据作为最终的模型输入数据,喂入深度学习算法模型进行短期光伏发电功率预测,比起传统数学统计学方法和普通的深度学习算法,学习效率更高效、预测结果更准确、更高泛化。
42、本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
1.基于相似日聚类和深度学习的光伏短期发电功率预测方法,其特征在于:该方法包括以下步骤:
2.根据权利要求1所述的基于相似日聚类和深度学习的光伏短期发电功率预测方法,其特征在于:所述s3具体为:
3.根据权利要求1所述的基于相似日聚类和深度学习的光伏短期发电功率预测方法,其特征在于:所述相关性分析包括两部分: