一种基于XGBoost和QRLSTM的短期负荷概率预测方法与流程

文档序号:30078317发布日期:2022-05-18 03:49阅读:560来源:国知局
一种基于XGBoost和QRLSTM的短期负荷概率预测方法与流程
一种基于xgboost和qrlstm的短期负荷概率预测方法
技术领域
1.本发明涉及电力预测技术领域,具体涉及一种基于xgboost和qrlstm的短期负荷概率预测方法。


背景技术:

2.短期负荷预测通常根据电力系统运行特点、以往用电规律、天气等因素来推测未来几小时内的电力需求。精准的短期负荷预测可用于实时发电计划的制定以及实时电力市场结算等,为电力系统的安全经济运行提供基础。近年来,新能源发电并网增加了电力负荷的不确定性,给短期负荷预测带来挑战,所以研究如何提高负荷预测精度和获得电力负荷的不确定性信息具有现实意义。
3.目前短期负荷预测方法根据预测结果可分为点负荷预测和概率负荷预测两类。点负荷预测方法主要有支持向量机(svr)、长短期记忆网络(lstm)与极端梯度提升树(xgboost)等。点负荷预测方法虽然研究较多,但存在预测结果仅为单一数值,不能对电力负荷的不确定性定量描述等问题。概率性负荷预测方法相对于点负荷预测方法可以量化未来电力负荷不确定性信息,因而在近几年受到了更多研究者的青睐。研究工作者将分位数回归理论与神经网络、径向基神经网络结合进行概率密度预测,同时也有使用分位数回归理论与lstm结合构造分位数回归长短期记忆网络(qrlstm)进行短期风电功率预测,验证了qrlstm预测效果优于普通模型。以上概率预测方法研究重点在算法融合和改进上,对挖掘影响电力负荷不确定性的重要特征研究存在不足,导致无法可靠准确地进行电力负荷概率预测。


技术实现要素:

4.针对现有技术的不足,本发明提供一种基于xgboost和qrlstm的短期负荷概率预测方法,与现有技术相比,本发明能够准确、快速地进行电力负荷预测,并能反映电力负荷的概率性信息。
5.本发明是通过如下技术方案实现的:
6.提供一种基于xgboost和qrlstm的短期负荷概率预测方法,包括以下步骤:
7.s1:获取基本数据,包括历史负荷数据、日期类型数据和天气相关数据集;
8.s2:根据数据类型选择相应的特征及编码方式构造数据集,并将数据通过如下公式归一化处理,
[0009][0010]
式中:x为原始输入特征,x
max
与x
min
为某个原始特征的两个极值,xn为归一化后的结果;
[0011]
s3:使用xgboost算法进行点负荷预测并生成特征重要性排序;
[0012]
s4:根据重要特征、点负荷预测结果添加至s2构造的数据集;
[0013]
s5:使用弹球损失函数和lstm构造qrlstm(分位数回归长短期记忆网络)函数。
[0014]
s6:使用s4中构造的数据集建立qrlstm预测模型,并获得不同分位数下的预测结果z1,...,zn;
[0015]
s7:将s6中qrlstm输出各个分位数下的预测结果作为核密度估计输入值,通过下式获取概率密度曲线;
[0016][0017]
式中:
[0018]
n为输入样本总数;
[0019]
h为带宽:
[0020][0021]
k(
·
)为非负核函数:
[0022]
采用经验法选取epanechnikov函数作为核函数,该核函数的计算公式和带宽计算公式如下所示:
[0023][0024]
进一步的,在s2中,三种数据类型分别对应的特征及编码方式见表1:
[0025]
表1数据类型与特征及编码方式的对照表
[0026][0027]
进一步的,s3的具体过程如下:
[0028]
s31、算法参数及预测函数f0(x)初始化;
[0029]
s32、迭代计算损失函数在训练样本上的一阶导数gi与二阶导数hi;
[0030]
s33、通过贪心策略生成新回归树f
t
(x),并计算叶节点参数值;
[0031]
s34、将新回归树添加到预测函数中并统计输入特征被用于生成新树的次数;
[0032]
s35、判断损失函数值是否多次未下降或者达到最大迭代次数,如果是则转向s36,
如果否则转向s32;
[0033]
s36、得到完整预测函数和特征重要性。
[0034]
进一步的,s5中qrlstm函数的构造方法:
[0035]
s51、弹球损失函数的计算公式为下式:
[0036][0037][0038]
式中:yi为在i时刻的电力负荷值,为i时刻在q分位数下的电力负荷预测值。
[0039]
s52、采用弹球损失函数改造lstm的目标函数构造qrlstm函数如下式:
[0040][0041]
式中:q为条件分位数的总数目;q为分位数;为在q条件分位数下的预测值;qrlstm可输出多个分位数预测结果用于反映电力负荷不确定性。
[0042]
与现有技术相比,本发明具有以下优点:
[0043]
一、本发明提出一种基于xgboost和qrlstm的短期负荷概率预测方法,使用xgboost算法进行点负荷预测并对影响电力负荷的特征进行排序,解决特征冗余的问题。
[0044]
二、本发明使用弹球损失函数改造lstm的目标函数得到qrlstm预测模型,可得到电力负荷的分位数预测结果,解决点负荷预测不能反映电力负荷概率性的问题
[0045]
三、本发明提出两阶段预测方法即使用xgboost预测方法得到点负荷结果,将点负荷结果作为qrlstm预测模型的输入特征,使得预测结果更加准确、快速。
附图说明
[0046]
图1为本发明的方法流程示意图。
[0047]
图2为实施例应用本发明方法的过程示意图。
[0048]
图3为改造后的qrlstm结构示意图。
[0049]
图4为实施例中本发明方法与传统方法的预测结果对比示意图。
[0050]
图5为实施例中本发明方法预测概率密度示意图。
[0051]
图6为本发明中数据类型与特征及编码方式的对照表。
[0052]
图7为本发明的预测方法与其余预测方法的预测对比结果。
具体实施方式
[0053]
为能清楚说明本方案的技术特点,下面通过具体实施方式,对本方案进行阐述。
[0054]
本实施例的详细应用过程如图2所示,具体描述如下所述:
[0055]
s1:获取本发明所需的基本数据,主要包括历史负荷数据、日期类型数据和天气相关数据集等;
[0056]
s2:根据获取的数据构造数据集,并将数据归一化处理;
[0057]
s3:使用xgboost算法进行点负荷预测并生成特征重要性排序;
[0058]
s4:根据重要特征、点负荷预测结果添加至s2构造的数据集;
[0059]
s5:使用弹球损失函数和lstm构造分位数回归长短期记忆网路(qrlstm);
[0060]
s6:使用s4中构造的数据集建立qrlstm预测模型,并获得不同分位数下的预测结果z1,...,zn;
[0061]
s7:使用核密度估计函数得到概率密度曲线。
[0062]
在s2中为根据获取的数据构造数据集,并将数据归一化处理,其详细描述如下所述:
[0063]
s21、构造的数据中集包含特征及编码方式如图6所示。
[0064]
s22、数据归一化公式如下所示:
[0065][0066]
式中:x为原始输入特征,x
max
与x
min
为某个原始特征的两个极值,xn为归一化后的结果。
[0067]
s3中使用xgboost算法进行点负荷预测并生成特征重要性排序,其详细过程如下所述:
[0068]
s31、算法参数及预测函数f0(x)初始化;
[0069]
s32、迭代计算损失函数在训练样本上的一阶导数gi与二阶导数hi;
[0070]
s33、通过贪心策略生成新回归树f
t
(x),并计算叶节点参数值;
[0071]
s34、将新回归树添加到预测函数中并统计输入特征被用于生成新树的次数;
[0072]
s35、判断损失函数值是否多次未下降或者达到最大迭代次数,如果是则转向s36,如果否则转向s32;
[0073]
s36、得到完整预测函数和特征重要性。
[0074]
在s5中使用弹球损失函数和lstm构造分位数回归长短期记忆网路(qrlstm),具体的:
[0075]
s51、弹球损失又称分位数回归损失,可对概率预测结果的清晰度和可靠性两个指标上综合评估,弹球损失越小表示概率预测结果的清晰度和可靠性越好,其计算公式如下所示。
[0076]
[0077][0078]
式中:yi为在i时刻的电力负荷值,为i时刻在q分位数下的电力负荷预测值。
[0079]
s52、采用弹球损失改造lstm的目标函数构造qrlstm,改造后的目标函数如下式所示:
[0080][0081]
式中:q为条件分位数的总数目;q为分位数;为在q条件分位数下的预测值;构造的qrlstm结构图如图3所示。改造后的qrlstm可输出多个分位数预测结果用于反映电力负荷不确定性。
[0082]
将s6中qrlstm输出各个分位数下的预测值作为核密度估计输入值,通过下式可获取概率密度曲线。
[0083][0084]
式中:
[0085]
n为输入样本总数;
[0086]
h为带宽:
[0087][0088]
k(
·
)为非负核函数:采用经验法选取epanechnikov函数作为核函数,该核函数的计算公式和带宽计算公式如下所示。
[0089][0090]
以新西兰公共电力数据集长度为2013年至2015年采样间隔为1h的负荷数据集作为实验数据集。为了说明提出预测方法的有效性,构造对比预测方法有:
[0091]
分位数回归神经网络(qrnn)、xgb+qrlstm、xgb+qrnn与xgboost预测方法。
[0092]
为了量化本发明预测值的精确度,采用平均绝对百分比误差(mean absolute percentage error,mape)和根均方误差(root mean square error,rmse)作为确定性负荷预测结果评价指标,其表达式如下所示。
[0093][0094][0095]
式中:n为预测样本总数目;yn为电力负荷实际值;为负荷预测值。mape和rmse分别反映预测效果的精准度和稳定性。
[0096]
采用弹球损失评价概率预测结果的可靠性,其计算公式如下所示:
[0097][0098][0099]
式中:yi为在i时刻的电力负荷值,为i时刻在q分位数下的电力负荷预测值。
[0100]
本发明的预测方法与其余预测方法的预测对比结果如图7所示。
[0101]
从上表可以看出,本发明提出的预测方法在采用的评价方式中均获得较好的预测效果。本发明方法相比于xgb+qrnn、qrlstm、qrnn、xgboost预测模型在mape方面分别降低0.45%、0.24%、1.71%、0.31%;在rmse评价上分别降低了19.32(mw)、11.8(mw)、76.26(mw)、17.32(mw),验证了提出的预测方法可提高电力负荷预测精度。在弹球损失评价上,提出的预测方法评分相比于xgb+qrnn、qrlstm、qrnn概率性预测模型分别降低5.14(mw)、2.28(mw)、19.32(mw),反映出本文方法在概率预测的清晰度和可靠性指标上得到提升。
[0102]
图4为本发明方法与对比方法的预测结果对比图,qrnn预测方法在波动阶段不能较好的拟合实际负荷曲线。本发明提出的预测方法无论在平稳阶段和波动阶段均能较好的拟合负荷实际值,表现出稳定的预测效果,。从而验证本发明提出预测方法可在波动阶段有效挖掘影响电力负荷的因素,提高点负荷预测精度。
[0103]
图5中为本发明方法的概率密度预测曲线图,本发明提出预测方法波峰更加靠近负荷实际值,同时预测波形更加稳定,波动较小。从而验证本发明提出预测方法中的特征挖掘可使概率预测方法更加准确描述电力负荷的不确定性信息
[0104]
综上所述,本发明使用xgboost算法进行点负荷预测并对影响电力负荷的特征进行排序,解决预测过程中特征冗余的问题。
[0105]
本发明使用弹球损失函数改造lstm的目标函数得到qrlstm预测模型,可得到电力负荷的分位数预测结果,解决点负荷预测不能反映电力负荷概率性的问题。
[0106]
本发明使用核密度估计算法通过分位数预测结果生成概率密度曲线直观的反映概率性信息。
[0107]
本发明提出两阶段预测方法即使用xgboost预测方法得到点负荷结果,将点负荷结果作为qrlstm预测模型的输入特征,使得预测结果更加准确、快速。
[0108]
当然,上述说明也并不仅限于上述举例,本发明未经描述的技术特征可以通过或
采用现有技术实现,在此不再赘述;以上实施例及附图仅用于说明本发明的技术方案并非是对本发明的限制,参照优选的实施方式对本发明进行了详细说明,本领域的普通技术人员应当理解,本技术领域的普通技术人员在本发明的实质范围内所做出的变化、改型、添加或替换都不脱离本发明的宗旨,也应属于本发明的权利要求保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1