一种基于cnn和分位数回归的短期电力负荷概率预测方法
技术领域
[0001]
本发明涉及短期电力负荷预测技术领域,特别是涉及基于卷积神经网络和分位数回归的短期负荷概率预测方法。
背景技术:[0002]
电能是日常生活和工业生产中必不可缺的部分,由于电能具有实时性和难以大量存储的性质,对电力负荷进行合理预测成为维护电力系统稳定运行的必要前提,同时如何准确地进行预测也是电力系统所面临的难题。
[0003]
根据以往的研究,确定性负荷预测方法可大致分为两类:统计模型和机器学习模型。统计模型主要包括自回归移动平均(arma)模型,指数平滑(es)模型,多元线性回归(mlr)模型和半参数加性模型。机器学习模型主要包括支持向量回归(svr),随机森林(rf),人工神经网络(ann)。然而,由于传统的点预测方法提供的是单个预测估计值,无法准确衡量电力负荷的高度不确定性,因此,越来越多的学者将研究领域从确定性预测转换成区间预测。许多学者已经开始将分位数回归方法与机器学习模型相结合来获得高质量的区间负荷预测结果。然后进一步对概率密度进行估计可以获得更全面的预测信息,对给定数据集进行概率密度估计的方法主要分为两类:参数估计方法和非参数估计方法。概率密度预测是目前能提供最多负荷预测信息的预测方法,具有最全面的参考价值。
[0004]
因此希望有一种基于卷积神经网络和分位数回归的短期负荷概率预测方法能够解决现有技术中存在的问题。
技术实现要素:[0005]
本发明公开了一种基于卷积神经网络和分位数回归的短期负荷概率预测方法,所述所述基于卷积神经网络和分位数回归的短期电力负荷概率密度预测方法包括以下步骤:
[0006]
步骤一:采集电力负荷数据,根据电力负荷数据与外部影响因素的相关性确定输入数据;
[0007]
步骤二:对输入数据进行预处理,并将输入数据切分为训练集和测试集;
[0008]
步骤三:使用步骤二中的训练集数据进行基于卷积神经网络和分位数回归的短期负荷概率密度预测模型训练,得到训练好的基于卷积神经网络和分位数回归的短期负荷概率密度预测模型;
[0009]
步骤四:将步骤二中的测试集数据输入到训练好的基于卷积神经网络和分位数回归的短期负荷概率密度预测模型中,得到不同分位点下的预测值;
[0010]
步骤五:将不同分位点下的预测值作为输入,在不同置信度下使用核密度估计方法进行负荷概率密度预测,得到预测区间和概率密度曲线。
[0011]
优选地,所述步骤一输入数据包括负荷值和温度。
[0012]
优选地,所述步骤二输入数据预处理采用minmax法补充数据缺失值并清洗异常值,然后使用公式(1)对数据进行归一化处理,使数据值域变换到[0,1],其中x
norm
为归一化
后的数据,x为原始数据,x
min
、x
max
为数据的最大值和最小值:
[0013][0014]
优选地,
[0015]
所述步骤三的短期负荷概率密度预测模型按照如下方式训练得到:
[0016]
将分位数损失作为卷积神经网络的损失函数,对所述卷积神经网络的参数进行优化,得到所述短期负荷概率密度预测模型。
[0017]
优选地,所述分位数损失对不同分位点下的预测结果通过模型一次性输出,所述分位数损失为公式(2)所示,为分位数损失函数,表示第j
th
样本点在i分位数下的预测值,q表示分位点的个数::
[0018][0019]
优选地,所述步骤五的核密度估计方法采取epanechnikov核作为核函数,根据所述不同置信度的要求,截取相应预测区间的概率密度数据。
[0020]
优选地,一种基于cnn和分位数回归的短期电力负荷概率预测装置包括:
[0021]
采集模块,用于采集电力负荷数据,根据电力负荷数据与外部影响因素的相关性确定输入数据;
[0022]
处理模块,用于对输入数据进行预处理,并将输入数据切分为训练集数据和测试集数据;
[0023]
训练模块,用于使用所述训练集数据进行基于卷积神经网络和分位数回归的短期负荷概率密度预测模型训练,得到训练好的基于卷积神经网络和分位数回归的短期负荷概率密度预测模型;
[0024]
输入模块,用于将所述测试集数据输入到训练好的基于卷积神经网络和分位数回归的短期负荷概率密度预测模型中,得到不同分位点下的预测值;
[0025]
预测模块,用于将不同分位点下的预测值作为输入,在不同置信度下使用核密度估计方法进行负荷概率密度预测,得到预测区间和概率密度曲线。
[0026]
优选地,所述预测模块具体用于:采取epanechnikov核作为核函数,根据所述不同置信度的要求,截取相应预测区间的概率密度数据。
[0027]
优选地,一种设备,所述设备包括:处理器以及存储有计算机程序指令的存储器;所述处理器执行所述计算机程序指令时实现如权利要求1-6任意一项所述的预测方法。
[0028]
优选地,一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-6任意一项所述的预测方法。
[0029]
本发明提出了一种基于卷积神经网络和分位数回归的短期负荷概率预测方法,本发明的有益效果包括:
[0030]
1.本发明采用弹球损失取代卷积神经网络的损失函数,将确定性预测方法扩展为概率预测方法,并通过核密度估计的方法,得到不同时刻点下预测区间内各点的概率密度信息;
[0031]
2.本发明基于卷积神经网络和分位数回归的短期负荷概率密度预测模型是多结果输出模型,仅需通过单次训练便可以得到不同分位点下的预测值,大量地节约了预测时间。
附图说明
[0032]
图1为基于卷积神经网络和分位数回归的短期负荷概率预测方法的流程示意图。
[0033]
图2为基于卷积神经网络和分位数回归的短期负荷概率预测方法的详细流程示意图。
[0034]
图3为gefcom2014数据集每小时负荷图。
[0035]
图4为gefcom2014数据集每小时温度图。
[0036]
图5为基于qrcnn-e在gefcom2014数据集上80%和100%置信度下的负荷预测区间曲线图。
具体实施方式
[0037]
为使本发明实施的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行更加详细的描述。在附图中,自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。所描述的实施例是本发明一部分实施例,而不是全部的实施例。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0038]
本发明构建了一个基于卷积神经网络和分位数回归的短期负荷概率密度预测模型(qrcnn-e),该模型通过使用分位数损失(也称为弹球损失)代替mse来优化网络参数,将卷积神经网络与分位数回归方法相结合,将点预测扩展为区间预测,同时弥补了分位数回归方法对复杂非线性问题难解的缺陷。紧接着利用核密度估计方法拟合预测结果的概率密度分布。从而提高电力负荷预测精度,保障电能的高质量运输和稳定供应。
[0039]
所述基于卷积神经网络和分位数回归的短期负荷概率密度预测模型使用以下方法:
[0040]
(1)卷积神经网络方法:考虑不同影响因素(包括温度和电价等)对电力负荷的影响,构建其非线性映射关系并对其进行数学建模,将低维特征抽象为高维特征。
[0041]
(2)分位数回归方法:传统的qr方法作为线性回归方法之一,能够通过对历史负荷及相关影响因素数据集进行回归分析,得到未来时刻不同分位点下的负荷值,提供比点预测更全面的预测信息。
[0042]
(3)分位数回归卷积神经网络方法:通过使用分位数损失(也称为弹球损失)代替mse来优化网络参数,将卷积神经网络与分位数回归方法相结合,将点预测扩展为区间预测,同时弥补了分位数回归方法对复杂非线性问题难解的缺陷。
[0043]
(4)核密度估计方法:将分位数回归卷积神经网络结果作为核密度估计方法的输入,从而拟合预测结果的概率密度分布。同时,探究了不同置信水平对于预测结果的影响。
[0044]
如图1和2所示,本发明提供了一种基于卷积神经网络和分位数回归的短期电力负荷概率密度预测方法,有效预测电力负荷,解决了电力系统决策者如何有效地调度优化电
网系统的问题。
[0045]
步骤一:采集电力负荷数据,根据电力负荷数据与外部影响因素的相关性确定关键性影响因素;我们选取从2005年1月1号1点到2005年3月31号24点共2159个时刻的数据作为数据集。同时,我们根据影响因素分析选取待预测时刻的前五个时刻、前一天同一时刻、前两天同一时刻,前一周同一天的同一时刻的负荷值和温度作为输入特征。
[0046]
步骤二:将数据进行预处理,补充缺失值并清洗异常值,然后将数据归一化到[0,1],接着将数据切分为训练集和测试集;
[0047]
首先,采用minmax法补充数据缺失值并清洗异常值,然后使用公式(1)对数据进行归一化处理,使数据值域变换到[0,1],其中x
norm
为归一化后的数据,x为原始数据,x
min
、x
max
为数据的最大值和最小值:
[0048][0049]
选取数据集的前80%作为训练数据,另外的20%作为测试数据。对于分位数回归模型,采用的分位数间隔为0.01。
[0050]
步骤三:训练qrcnn预测模型,将分位数损失作为卷积神经网络的损失函数,指导网络进行训练,实现参数的不断更新,直到模型收敛;
[0051]
将卷积神经网络与分位数回归方法进行结合,用分位数损失(也称弹球损失)替代均方误差来指导卷积神经网络(cnn)模型的训练,使得cnn能够对不同分位点进行预测。为了减轻训练成本,我们对弹球损失进行改进,使得不同分位点下的预测结果通过模型一次性输出,这样大大提高了模型效率。同时,经过验证,模型准确性并未因此降低。改进后的弹球损失为公式(2)所示,为分位数损失函数,表示第j
th
样本点在i分位数下的预测值,q表示分位点的个数::
[0052][0053]
步骤四:将测试数据输入到训练好的模型中,得到不同分位点下的预测值;
[0054]
步骤五:将不同分位点下的预测值作为输入,在不同置信度下使用核密度估计方法进行负荷概率密度预测,得到预测区间和概率密度曲线。
[0055]
在核密度估计时,采取epanechnikov核作为核函数,同时根据不同的置信度要求,截取相应的数据。在90%置信度的实验中,我们截取[0.1,0.9]区间内的分位数。在100%置信区间下,全部的分位数数据将被运用。
[0056]
在另一实施例中,使用gefcom2014的数据集,从2005年1月1号1点到2005年3月31号24点共2159个时刻的数据作为本实验数据集。同时,选取待预测时刻的前五个时刻、前一天同一时刻、前两天同一时刻,前一周同一天的同一时刻的负荷值和温度作为输入特征。对于温度信息的选择,本发明对25个天气预报站的温度信息进行综合,取平均值作为相应时刻的温度。该数据集的整体分布情况如图3和4所示。
[0057]
从图3和4看出,电力负荷与温度具有相关性。具体表现在,当温度较低的时候,负荷偏高,而当温度升高时,负荷有下降趋势。
[0058]
在该数据集上,依据不同模型分位数回归结果,设置不同的核密度带宽,以取得最
好的实验效果。带宽设置如表1所示:
[0059]
表1:模型带宽设置
[0060][0061]
在表2和表3中分别总结了各模型在点预测和区间预测的结果:
[0062]
表2基于gefcom2014数据集的点预测实验结果评估
[0063][0064]
表3基于gefcom2014数据集的区间预测实验结果评估
[0065][0066]
如表2所示,qrcnn-e的中值在80%置信水平下得到的结果最优,同时,qrcnn-e的整体表现也优于其他方法。由此推断qrcnn-e可以通过使用卷积神经网络提取对预测有价值的抽象特征。实验结果也表明,深度网络比浅层学习模型具有更强的学习能力。
[0067]
表3展示了不同方法在gefcom2014数据集上的概率预测结果。可以看出,每个模型的picp均能得到高于置信水平的覆盖值,qrcnn-e在不同置信水平下均取得最小的pinaw。
通过分析整体评估指标cwc可以看出,所提方法击败了其余的比较算法。综合表2和表3可看出qrcnn-e不仅可以在确定性预测中实现了高精度的预测目标,而且在区间预测中也能表现最佳。
[0068]
如图5展示了不同置信水平下预测区间上、下限与真实值的关系。事实证明,100%置信度下的预测区间涵盖了所有真实值,80%置信水平下的预测区间也几乎涵盖了所有实际值。另外,80%置信水平下的预测区间比100%置信水平下的预测区间更窄且更接近实际值。
[0069]
本发明提供的用电负荷概率密度预测评方法,通过对历史负荷数据及关键性影响因素的分析,掌握电网电力负荷的未来走向并准确预测未来时刻负荷,为电力系统灵活调度提供依据。
[0070]
本发明的开发语言为python,开发工具为spyder、pycharm,操作系统为windows10。
[0071]
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0072]
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0073]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0074]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0075]
最后需要指出的是:以上实施例仅用以说明本发明的技术方案,而非对其限制。尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。