一种光伏功率短期概率预测方法、装置、设备及介质与流程

文档序号:41333759发布日期:2025-03-19 14:43阅读:14来源:国知局
一种光伏功率短期概率预测方法、装置、设备及介质与流程

本发明涉及电力系统光伏预测,尤其涉及一种光伏功率短期概率预测方法、装置、设备及介质。


背景技术:

1、太阳能作为可再生能源中最丰富、发展潜力最大的清洁能源,其开发与利用已成为我国能源结构调整的重要方向。光伏发电的短期功率预测不仅能有效降低光伏出力不确定性对电网的影响,还能提高光伏发电系统的可靠性,从而促进电网实现高质量的稳定供电,近年来,太阳能开发利用已成为全球能源转型的重要领域,光伏发电进入规模化发展阶段,展现出良好的前景。

2、光伏发电功率预测方法经过多年的研究,已形成相对成熟的体系,主流的预测方法包括统计方法和人工智能算法,虽然统计方法因其原理简单、易于实现而广泛应用,但在样本数据复杂的情况下,预测效果往往不理想,另一方面,人工智能算法在处理时间序列时的效果也不尽如人意,特别是在进行较长时间序列预测时,其性能显得不足,为此,深度学习方法被引入,尤其是长短期记忆网络(lstm),因其优越的历史数据记忆能力和对长期依赖关系的处理能力,广泛应用于光伏功率预测中。

3、然而,目前光伏功率短期概率预测方法普遍存在忽略气象数据与光伏出力之间的内在联系、模型泛化性较差、缺乏对误差边界分位数的灵活处理等问题,导致模型预测效果较差。因此,亟需研究新的模型融合与自适应边界优化的光伏功率短期概率预测方法,以克服这些不足。

4、公开于该背景技术部分的信息仅仅旨在加深对本发明的总体背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。


技术实现思路

1、本发明提供了一种光伏功率短期概率预测方法、装置、设备及介质,从而有效解决背景技术中的问题。

2、为了达到上述目的,本发明所采用的技术方案是:一种光伏功率短期概率预测方法,包括如下步骤:

3、s10:对原始数据进行处理,包括数据插值和数据选择,以获得预处理数据;

4、s20:基于emd和kpca模型对所述预处理数据进行特征提取,包括光伏功率与气象数据的相关特征,从而提取影响光伏发电的关键因素;

5、s30:采用stacking模型对提取的所述特征进行确定性预测,生成初步的光伏功率预测结果,并通过交叉验证提高所述stacking模型的泛化能力;

6、s40:对所述光伏功率预测结果进行评估,计算预测误差并进行性能分析,以获得预测结果;

7、s50:基于所述预测结果,采用自适应边界优化策略对确定性预测结果进行修正,从而生成光伏功率的短期概率预测结果。

8、进一步地,在步骤s10中,对原始数据进行处理,包括数据插值和数据选择,以获得预处理数据,包括:

9、s11:采用线性插值方法对所述原始数据进行插值处理,将低分辨率的数据转换为高分辨率的数据,以提高数据的完整性和连续性;

10、s12:基于所述数据的插值处理结果,对经过插值处理的多源气象数据与光伏出力进行斯皮尔曼相关性分析,以评估气象数据与光伏出力之间的相关性,并选择与光伏发电相关性大的影响因素,以优化数据集,并计算斯皮尔曼相关系数。

11、进一步地,所述线性插值方法的计算模型包括:

12、

13、式中,y为被插后的输出,x为插值节点,x1和y1分别为第一组数据的横、纵坐标;x2和y2分别为第二组数据的横、纵坐标。

14、进一步地,假设气象数据为x,光伏出力为y,所述斯皮尔曼相关系数的计算模型包括:

15、

16、式中,ρ为x和y的斯皮尔曼相关系数,xi和yi分别为x和y的观测值秩次,和分别为x和y的平均秩次,n为x的总数量。

17、进一步地,在步骤s20中,基于emd和kpca模型对所述预处理数据进行特征提取,步骤包括:

18、s21:利用emd算法对处理后的气象和光伏功率特征数据进行分解,以丰富输入变量的多样性,并突出环境序列在不同时间尺度下的局部特性;

19、s22:对分解后的所述特征数据进行kpca降维,选择累计贡献率达到85%的主成分;

20、s23:将处理后的所述特征数据样本归一化至[0,1]区间,归一化计算模型为:

21、

22、式中,p′、p、pmax和pmin分别为归一化数据、功率值、最大功率值和最小功率值。

23、进一步地,在步骤s30中,采用stacking模型对提取的所述特征进行确定性预测,生成初步的光伏功率预测结果,并通过交叉验证提高所述stacking模型的泛化能力,步骤包括:

24、s31:将通过emd和kpca提取特征的所述气象数据和光伏功率数据进行整合,并划分为n个大小相同的子数据集与一个测试集,作为stacking预测模型的输入数据;

25、s32:选择n种训练算法,将整合后的所述数据输入到第一层预测模型中,选择训练算法a1,通过交叉验证对基学习器进行训练,获得d1,d2,...,dn共计n组对验证集的预测值,记为t1,t2,...,tn,以及n组对测试集的预测值;

26、s33:将所述n组对验证集的预测值进行组合,即t1=[t1,t2,...,tn],并将所述n组测试集的预测值取平均,得到一组预测值b1;

27、s34:重复步骤s32至步骤s33,选择训练算法a2~an,最终获得基学习器的预测值[t1,t2,...,tn]和测试集的预测值[b1,b2,...,bn];

28、s35:将所述预测值[t1,t2,...,tn]和所述测试集的预测值[b1,b2,...,bn]分别作为第二层的训练集和测试集,使用算法a’训练元学习器,以获得最终的预测结果;

29、s36:在stacking框架下,选择rf、svm和knn作为所述基学习器的训练算法,选择linear regression作为所述元学习器的训练算法,构成基于stacking的预测模型。

30、进一步地,在步骤s40中,对所述光伏功率预测结果进行评估,步骤包括:

31、s41:先将所述光伏功率预测结果进行反归一化处理;

32、s42:采用相对均方误差、平均绝对误差、平均绝对百分比误差与决定系数来评估指标来评估模型预测的性能,模型包括:

33、

34、式中,rmse为相对均方误差,mae为平均绝对误差,mape为平均绝对百分比误差,r2为决定系数,n为预测样本的数量,yi为预测值,为真实值,为真实值的平均值。

35、进一步地,在步骤s50中,基于所述预测结果,采用自适应边界优化策略对确定性预测结果进行修正,步骤包括:

36、s51:根据预测区间覆盖概率和预测区间标称置信度之间的偏差以及区间得分,分别评估预测区间的可靠性和整体性能;

37、s52:考虑所述预测区间外点的偏移,采用优化问题的成本函数进行描述;

38、s53:基于所述成本函数,结合极限学习机与传统线性分位数回归的方法,优化所述预测区间的边界,以提高边界分位数的精度。

39、进一步地,在步骤s51中,所述预测区间覆盖概率的模型包括:

40、

41、式中,tp为预测样本的数量,ηi为布尔量,ti为预测值,iα为预测区间。

42、进一步地,锐度是用来衡量所述预测区间宽度的指标,所述锐度的模型包括:

43、

44、

45、式中,awα为区间预测区间宽度,tp为预测样本的数量,w(xi)为每个预测区间的宽度,为上边界,qα为下边界。

46、进一步地,在步骤s51中,根据预测区间覆盖概率和预测区间标称置信度之间的偏差以及区间得分,包括锐度和区间得分,模型包括:

47、

48、式中,sα(xi)为第i次迭代的预测区间的带宽偏差,w(xi)为每个预测区间的宽度,qα为下边界,为上边界,ti为目标值,α为分位数,tp为预测样本的数量。

49、进一步地,在步骤s52中,采用优化问题的成本函数,模型包括:

50、

51、式中,xi和yi分别为要预测的样本输入和测量值,t为预测样本的数量,α为分位数;和a分别为上分位数和下分位数的百分比,wα为映射模型参数,和wa分别为非线性分位数回归中的输出系数,g为极限学习机的输出,ξi,α和为中间变量。

52、进一步地,在步骤s53中,上百分位数的标称比例通过元启发式算法进行自适应优化,所述下百分位数的标称比例的量化,模型包括:

53、

54、0≤α≤α;

55、式中,α为分位数;和a分别为上分位数和下分位数的百分比。

56、本发明还包括一种光伏功率短期概率预测装置,使用如上述的方法,包括:

57、数据处理模块,用于对原始数据进行处理,包括数据插值和数据选择,以获得预处理数据;

58、特征提取模块,用于基于emd和kpca模型对所述预处理数据进行特征提取,包括光伏功率与气象数据的相关特征,从而提取影响光伏发电的关键因素;

59、预测模型模块,用于采用stacking模型对提取的所述特征进行确定性预测,生成初步的光伏功率预测结果,并通过交叉验证提高所述stacking模型的泛化能力;

60、评估模块,用于对所述光伏功率预测结果进行评估,计算预测误差并进行性能分析,以获得预测结果;

61、优化模块,用于基于所述预测结果,采用自适应边界优化策略对确定性预测结果进行修正,从而生成光伏功率的短期概率预测结果。

62、本发明还包括一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上述的方法。

63、本发明还包括一种存储介质,其上存储有计算机程序,进一步地,该计算机程序被处理器执行时实现如上述的方法。

64、本发明的有益效果为:

65、通过数据插值方法解决了数据分辨率较低的问题,通过相关性分析解决了对数据的时序相关性考虑不足的问题,通过emd和kpca方法解决了输入特征冗余的问题,通过stacking模型解决了模型泛化性不佳的问题,通过自适应边界分位数优化策略解决了预测区间性能不佳的问题,因此,本发明具备高效处理多源数据、考虑数据时序相关性、准确捕捉特征变化,模型泛化性优越,预测误差分析质量高的优点。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1