本发明涉及一种光伏功率预测方法,尤其是涉及一种基于深度神经网络与集成学习的超短期光伏功率预测方法。
背景技术:
1、中国专利公开号cn114330935a公开了《基于多种结合策略集成学习的新能源功率预测方法和系统》,具体公开了根据目标预测对象,获取样本新能源数据;所述样本新能源数据包括训练新能源数据和验证新能源数据;通过所述训练新能源数据训练得到多个初级预测模型;通过预设的多种集成指令,分别对所述多个初级预测模型进行集成处理,得到多个集成预测模型;根据各所述集成预测模型的性能指标,从所述多个集成预测模型中确定出目标预测模型,通过所述目标预测模型进行新能源功率预测。该方法可以提升对新能源场站的功率预测精度。
2、同时中国专利公开号cn112561058a公开了《基于stacking-集成学习短期光伏功率预测方法》,具体提出了一种基于stacking-集成学习短期光伏功率预测方法,基于历史光伏预测数据样本集训练基于多个不同模型的基学习器构成的第一层预测模型,将第一层预测模型的预测结果输入元学习器模型训练第二层预测模型,然后将待预测日的输入变量经第一层预测模型和第二层预测模型预测后得出预测结果。基于stacking-集成学习短期光伏功率预测方法考虑不同深度学习的训练原理差异,充分发挥各模型优势,与传统单模型预测相比该预测方法的预测精度有着较为明显的提升。
3、《基于包络线聚类的多模融合超短期光伏功率预测算法》针对传统功率预测方法以气象因素进行聚类划分时各气象因素权重难以分配以及单模型预测精度较差的问题,提出一种基于光伏功率包络线聚类的多模融合超短期光伏功率预测算法。
4、以上现有技术存在以下技术问题:
5、1)使用单一结构的学习机进行超短期光伏功率预测,缺少有效的模型结构选择机制;
6、2)过分依赖气象预报,忽略场站实际的相关数据与控制方式对功率预测的修正过程;
7、3)算法缺少生产环境的部署和运维说明;
8、4)对模型的评价体系不具备行业与领域标准性与专业性
9、实现整个光伏功率预测的关键在于三个方面:数据,算法,部署环境。针对光伏场站历史数据库的整理,机器学习算法的构建,算法的线上部署这个标准流程具有普适性与应用广泛性,超短期光伏功率预测则适用于该标准流程。
10、a)数据方面:当前可再生能源场站管理模式不佳导致场站数据库数据缺失,数据采集与维护不当,与机器学习算法所需的高质量数据形成的剧烈矛盾。使得人工智能领域中,数据驱动型的机器学习技术不能很好地发挥优势。
11、b)模型方面:当前基于深度神经网络模型的机器学习方法已取得重大突破,但针对可再生能源领域的应用却并不广泛。
12、c)部署环境:当前发电仍以火力发电为主,各大发电新能源装机量相对较少,运维管理落后,问题频发。
13、因此如何来提高预测精度,成为需要解决的技术问题。
技术实现思路
1、本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于深度神经网络与集成学习的超短期光伏功率预测方法。
2、本发明的目的可以通过以下技术方案来实现:
3、根据本发明的一个方面,提供了一种基于深度神经网络与集成学习的超短期光伏功率预测方法,该方法引入了非线性神经网络模型与集成学习方法,利用神经网络的非线性特性,建立多种气象因素与光伏功率预测的联系,并通过gibbs-boltzmann分布依据各最优网络的错误率加权,集成多个最优网络进一步提高预测精度;同时采用测控技术修正当前的实发功率,提高光伏场站超短期光伏功率预测精度。
4、作为优选的技术方案,该方法具体包括以下步骤:
5、步骤s1,获取实验光伏场站数据;
6、步骤s2,清洗与筛选场站数据库中相关数据;
7、步骤s3,利用bootstrap法,搭建多个不同结构的神经网络算法并学习模型;
8、步骤s4,计算比较多个训练后的神经网络的回归误差,选取最优结构模型计算gibbs-boltzmann分布参数;
9、步骤s5,评估超短期功率预测模型,并进行性能提升。
10、作为优选的技术方案,所述步骤s1中的光伏场站数据包括第一数据集和第二数据集,其中第一数据集包括并网总功率、实际辐照度和辐照度预报值,第二数据集包括气象站中所测得的倾角辐照强度、环境温度、背板温度、环境湿度、风向、风速和大气压力。
11、作为优选的技术方案,所述步骤s2具体为:针对关系型数据库中提取的数据,将之转换为送入神经网络的结构化数据,包括数据预处理与特征工程。
12、作为优选的技术方案,所述针对关系型数据库中提取的数据,将之转换为送入神经网络的结构化数据具体为:
13、首先针对数据集的数据进行下采样,将不同源数据的时间对齐;然后将时间对齐后的缺失值选择性删除或采用中位数填充,以保证各个属性上没有空缺值,完成属性对齐;之后将经过预处理数据利用经验法构建特征,针对连续信号采用pearson相关系数分别衡量各个提取出的特征与发电功率的相关性,最终筛选出相关性最高的特征。
14、作为优选的技术方案,所述步骤s3具体为:
15、首先,利用交叉验证原理从数据中随机抽取85%数据作为训练集,其余15%数据作为交叉验证集1
16、然后,将测试数据经过数据清洗生成特征,分别送入最优模型中的单个神经网络模型,得到100个预测结果;
17、最终,根据误差使用gibbs-boltzmann分布对100个最优模型加权得到预测结果。
18、作为优选的技术方案,重复抽取100次,送入多个不同超参数组合的神经网络模型a-z,利用损失函数对训练集与交叉验证集的误差大小决定单个神经网络模型的最优参数,同时根据模型a-z分别得到的100次结果做出箱线图,比较误差分布后进行模型选择,挑选出模型的最优超参数模型作为最优模型族的超参数结构。
19、作为优选的技术方案,所述gibbs-boltzmann分布具体公式为:
20、
21、其中errorii为第i个最优结构模型的训练误差与交叉验证误差平均值。
22、作为优选的技术方案,所述步骤s4具体为:
23、采取了两种有效的评判别方式,在模型的训练和交叉验证中使用了rmse与mae的度量方式;在测试阶段使用了电网调度两个“细则”的方式,统计考核点数与考核金额的度量方式。
24、作为优选的技术方案,所述方法还包括:
25、将agc调峰总信号分解至各个可调节功率的逆变器上,将agc命令下发到光伏场站各个逆变器上,对预测时间节点的实际功率进行调节,将其逼近当前时刻的预测值,最终降低电网对预测不准确的考核;
26、部署超短期功率预测模型至线上平台测试;超短期功率预测模型部署于算法平台服务器,场站数据服务器接收现场气象站、数值天气预测数据源信号,将相关数据信号发送至算法平台服务器,算法平台服务器经过计算流程输出结果,并将结果重新传输至数据服务器,通过与电网调度对接的渠道,将预测值上传至电网调度。
27、与现有技术相比,本发明引入了非线性神经网络模型与集成学习方法,利用神经网络的非线性特性,建立起辐照度,温度,湿度,风速,风向等多种气象因素对光伏功率预测的联系,并通过集成多个最优网络进一步提高预测精度。同时,采用测控技术修正当前的实发功率,旨在提高光伏场站超短期光伏功率预测精度,解决光伏场站超短期功率预测精度不足而带来的考核问题。解决因发电量预测不准产生的电网稳定性问题,为进一步提升电力市场交易水平打下基础。