一种考虑极限学习机参数优化的负荷预测场景构建方法与流程

文档序号:31804523发布日期:2022-10-14 19:54阅读:65来源:国知局
一种考虑极限学习机参数优化的负荷预测场景构建方法与流程

1.本发明涉及电力系统预测与典型场景生成技术领域,特别是一种考虑极限学习机参数优化的负荷预测场景构建方法。


背景技术:

2.随着负荷种类逐渐增多、分布式光伏等可再生能源渗透率增大,电网负荷不确定性逐渐增强,为电网安全稳定运行带来更大挑战。因此,在保证较高准确性的基础上进行负荷预测,对电网规划具有重要意义。
3.目前,负荷预测包括点预测和概率预测两种形式。点预测的方法一般包括回归分析预测方法、支持向量机预测方法、神经网络预测方法等方法。通过点预测方法进行负荷预测,可以获得与待测变量较为接近的值,通过计算预测值与真实值之间的差值来判断预测结果的准确程度,但这一方法只能得到未来某一时段的确切值,并未考虑负荷的不确定性与随机性。
4.不同于点预测方法,概率预测能够有效地表征负荷不确定性,相比于点预测方法,概率预测可以提供更多的信息。根据概率预测输出表达形式的不同,可分为概率密度预测、分位数预测以及区间预测等。此外,部分研究在进行负荷预测时未计及气象因素,现有的负荷预测计算效率与准确度也有待提高。鉴于现有研究可以看出,负荷预测方法还有待进一步改进。


技术实现要素:

5.本发明的目的是为了克服现有技术的不足,提供一种考虑极限学习机参数优化的负荷预测场景构建方法,通过遗传算法优化极限学习机模型输入权重与偏置,通过分位数回归方法优化模型输出权重,提升负荷概率预测的准确性,采用k-means方法聚类生成负荷典型场景。
6.实现上述目的的一种技术方案是:一种考虑极限学习机参数优化的负荷预测场景构建方法,包括以下步骤:
7.步骤1:收集历史负荷数据与天气数据集,进行数据预处理与归一化,根据日期性质与星期类型筛选数据,构成模型训练集;
8.步骤2:采用遗传算法优化极限学习机隐层输入权重与偏置参数;
9.步骤3:采用分位数回归方法优化elm隐层输出权重;
10.步骤4:确定优化后改进elm模型,并计算负荷概率预测结果,根据区间覆盖率及区间平均宽度表征预测效果;
11.步骤5:通过k-means算法聚类负荷预测数据,构建负荷典型场景。
12.进一步的,步骤1中所述历史负荷数据与天气数据集的收集方法为,以特定时间间隔收集待预测负荷数据与日平均气温、日最高气温、日最低气温、相对湿度和降雨量的天气数据,构成初始数据集。
13.进一步的,步骤1中所述数据筛选的方法为,将数据日期划分为工作日与非工作日,若需要预测的日期与前一日的日期性质相同,则将该日天气数据以及前一日最大负荷作为预测模型输入变量,否则将该日天气数据作为预测模型输入变量;将与该日星期类型相同的日期对应数据作为训练集,并计算数据相关系数,将其中与其余日期负荷相关系数小于0.9的数据剔除。
14.进一步的,步骤2中极限学习机的模型具体为:
15.第i个样本的输入量xi有n个,实际输出量ti有m个,该样本的输入量经过极限学习机模型训练以后,得到的输出yi可表示为:yi=βg(w
·
xi+b);式中:w为极限学习机输入层与隐含层之间的权重矩阵,其为d
×
n阶矩阵,d为隐含层节点的数量;b为隐含层的偏置矩阵;β为隐含层与输出层间的之间的权重矩阵;g(
·
)为激励函数;
16.选取g(
·
)使yi与ti近似相等,ti可表示为:ti≈βg(w
·
xi+b);
17.n个样本的实际输出为t=[y1,y2,
···
,yn]
t
∈rn×m,可表示为:t≈hβ;式中:h为n个样本的输入量经过elm的w、b以及g(
·
)处理后的矩阵;
[0018]
当w与b确定时,对β优化,使t与hβ之间的差值接近于零,最优的β
*
可通过求取上式的最小二乘解得到:β
*
=h

t;
[0019]
式中:h

为经处理后的矩阵h的广义逆矩阵,可表示为h

=h

(hh
t
)-1

[0020]
进一步的,步骤2中采用遗传算法的参数优化过程的方法为:
[0021]
首先生成n
ga
个w与b组成初始种群,再计算个体适应度值进行评估,其中个体适应度计算方式为:
[0022][0023]
式中:η为极大数;
[0024]
之后筛选出50个适应度值较大的个体作为父方与母方;将最佳个体对应的w与b作为父方对应的w与b,其余筛选出的个体对应的w与b作为母方对应的w与b;随机交换父方的w、b与母方的w、b一行数据构成子代;然后,对子代中的w与b进行变异处理;其中,最佳个体需要保留到下一代种群中,以防止最佳个体在经过一系列处理后性能变差;当适应度函数值变化较小时或迭代循环次数达到一定值时,即可退出循环。
[0025]
进一步的,步骤3中分位数回归的参数优化过程为:
[0026]
预测变量y的第τ分位数可以表示成:τ=inf{y:f(y)≥τ},0<τ<1;式中:inf{
·
}下确界函数;f(y)为y的分布函数;
[0027]
第j个预测量的预测区间上界为其为预测量的第α
up
分位数,预测区间下界为其为预测量的第α
low
分位数;为简化计算,进行如下假设:
[0028]
利用极限学习机和分位数回归相结合的方法,计算elm隐含层输出权值,具体计算方法为:
[0029]
[0030]
式中:ρ(
·
)为检验函数;ti、q(xj,β
up
)与q(xj,β
low
)分别为预测量对应的实际值、预测区间上界及下界归一化后的值;
[0031]
检验函数可表示为:ρ
τ
(μ)=μ(τ-i(μ));式中,若μ小于零,则i(μ)等于1,否则i(μ)等于0。
[0032]
进一步的,步骤4中的预测区间评价指标区间覆盖率及区间平均宽度的方法为:
[0033]
picp是指实际值在预测区间以内的个数与样本总数的比值,计算公式为:式中:n为样本总数,k
i(α)
为布尔量,若真实值大于预测区间上界或者小于预测区间下界,则k
i(α)
为0,否则为1;
[0034]
采用pinaw衡量预测区间的宽度,其计算方式为:式中:r为预测实际值的最大值,u
i(α)
为预测区间的上界,l
i(α)
为预测区间的下界。
[0035]
进一步的,步骤5中的k-means聚类的具体方法为:
[0036]
步骤5.1,任意选取k组需要聚类的数据作为凝聚中心;
[0037]
步骤5.2,为每个类选择数据,其包含与聚类中心较近的待聚类数据;
[0038]
步骤5.3,聚类中心为每类数据的均值所替代;
[0039]
步骤5.4,若聚类中心的变化小于设定值,则聚类完成;
[0040]
采用ch
(+)
指标进行评估:
[0041][0042]
式中:n为数据总体数量,ni为第i类数据总量,vi为第i类的聚类中心,为数据均值,xj为第j组数据。
[0043]
与现有技术相比,本发明具有以下有益效果:
[0044]
(1)本发明将遗传算法与分位数回归法应用于极限学习机模型参数优化,提高模型预测准确性;采用极限学习机进行负荷预测,避免传统神经网络模型中存在的过拟合、效率低等缺点,提高负荷预测效率与模型泛用性。本发明设计的负荷预测模型典型场景生成方法,预测结果准确度较高,具有实际应用价值。
[0045]
(2)本发明基于k-means方法生成负荷典型场景,确保负荷典型场景对原始信息的概括程度,直观体现负荷预测结果,辅助电网规划过程。
附图说明
[0046]
图1为本发明实施例的不同置信度下负荷预测指标分布图;
[0047]
图2为本发明实施例的2014年3月12日负荷预测曲线;
[0048]
图3为本发明实施例的负荷典型场景生成结果。
具体实施方式
[0049]
为了能更好地对本发明的技术方案进行理解,下面通过具体地实施例进行详细地
说明:
[0050]
本发明的一种考虑极限学习机参数优化的负荷预测及典型场景构建方法,包括以下步骤:
[0051]
步骤1:收集历史负荷数据与天气数据集,进行数据预处理与归一化,根据日期性质与星期类型筛选数据,构成模型训练集;
[0052]
步骤2:采用遗传算法(genetic algorithm,ga)优化极限学习机(extreme learning machine,elm)隐层输入权重与偏置参数;
[0053]
步骤3:采用分位数回归(quantile regression,qr)方法优化elm隐层输出权重;
[0054]
步骤4:确定优化后改进elm模型,并计算负荷概率预测结果,根据区间覆盖率(prediction interval coverage probability,picp)及区间平均宽度(prediction interval nominal average width,pinaw)表征预测效果;
[0055]
步骤5:通过k-means算法聚类负荷预测数据,构建负荷典型场景。
[0056]
其中,步骤1中所述历史负荷数据与天气数据集是指:以特定时间间隔收集待预测负荷数据与日平均气温、日最高气温、日最低气温、相对湿度和降雨量的天气数据,构成初始数据集。
[0057]
其中,步骤1中所述数据筛选是指:将数据日期划分为工作日与非工作日,若需要预测的日期与前一日的日期性质相同,则将该日天气数据以及前一日最大负荷作为预测模型输入变量,否则将该日天气数据作为预测模型输入变量。将与该日星期类型相同的日期对应数据作为训练集,并计算数据相关系数,将其中与其余日期负荷相关系数小于0.9的数据剔除。
[0058]
其中,步骤2中elm模型是指:传统神经网络计算规模大、迭代次数多、需使用较长时间才可获得相对理想的结果,而elm具有计算速度快、输入样本变化时仍能够获得较为理想的输出、可以刻画输出量与输入量间的非线性关系等优点,因此选用elm模型进行负荷概率预测。其中,第i个样本的输入量xi有n个,实际输出量ti有m个。该样本的输入量经过elm模型训练以后,得到的输出yi可表示为:yi=βg(w
·
xi+b)。式中:w为elm输入层与隐含层之间的权重矩阵,其为d
×
n阶矩阵,d为隐含层节点的数量;b为隐含层的偏置矩阵;β为隐含层与输出层间的之间的权重矩阵;g(
·
)为激励函数。
[0059]
选取适当的g(
·
),可使yi与ti近似相等,ti可表示为:ti≈βg(w
·
xi+b)。
[0060]
n个样本的实际输出为t=[y1,y2,
···
,yn]
t
∈rn×m,可表示为:t≈hβ。式中:h为n个样本的输入量经过elm的w、b以及g(
·
)处理后的矩阵。
[0061]
当w与b确定时,可通过优化β,使t与hβ之间的差值无限接近于零。根据广义逆理论,最优的β
*
可通过求取式(3-6)的最小二乘解得到:β
*
=h

t。
[0062]
式中:h

为经处理后的矩阵h的广义逆矩阵,可表示为h

=h

(hh
t
)-1

[0063]
其中,步骤2中采用ga的参数优化过程是指:为保证隐层输入w与b矩阵的准确性,采用遗传算法进行搜索,优化w与b取值。首先生成n
ga
个w与b组成初始种群,再计算个体适应度值进行评估,其中个体适应度计算方式为:
[0064]
[0065]
式中:η为极大数。
[0066]
理想的预测区间picp(w,b)应尽可能大于pinc,同时pinaw尽可能小。适应度值越接近于零,则该个体对应的w与b越优。已知个体的w与b,可通过分位数回归计算出相应的β
*
,从而得到预测区间,再计算个体适应度值。
[0067]
之后筛选出50个适应度值较大的个体作为父方与母方。将最佳个体对应的w与b作为父方对应的w与b,其余筛选出的个体对应的w与b作为母方对应的w与b。随机交换父方的w、b与母方的w、b一行数据构成子代。然后,对子代中的w与b进行变异处理。其中,最佳个体需要保留到下一代种群中,以防止最佳个体在经过一系列处理后性能变差。当适应度函数值变化较小时或迭代循环次数达到一定值时,即可退出循环。
[0068]
其中,步骤3中采用qr的参数优化过程是指:elm模型中,一般情况下,训练样本的数量多于隐含层节点数量d,这会导致hh
t
奇异,无法找到合适的β
*
。若单纯增大隐含层节点个数,一方面会导致运算量变大,另一方面会使模型过度训练而导致训练结果不够准确。考虑上述因素,利用qr方法计算最优权重矩阵β
*
。其中,预测变量y的第τ分位数可以表示成:τ=inf{y:f(y)≥τ},0<τ<1。式中:inf{
·
}下确界函数;f(y)为y的分布函数。
[0069]
第j个预测量的预测区间上界为其为预测量的第α
up
分位数,预测区间下界为其为预测量的第α
low
分位数。为简化计算,进行如下假设:
[0070]
qr主要用于解决线性问题,而“源荷”预测问题本身为复杂的非线性问题,因此利用elm与qr相结合的方法,计算elm隐含层输出权值,具体计算方式为:
[0071][0072]
式中:ρ(
·
)为检验函数;ti、q(xj,β
up
)与q(xj,β
low
)分别为预测量对应的实际值、预测区间上界及下界归一化后的值。
[0073]
检验函数可表示为:ρ
τ
(μ)=μ(τ-i(μ))。式中,若μ小于零,则i(μ)等于1,否则i(μ)等于0。
[0074]
其中,步骤4中的预测区间评价指标picp与pinaw是指:picp是指实际值在预测区间以内的个数与样本总数的比值,计算公式为:式中:n为样本总数,k
i(α)
为布尔量,若真实值大于预测区间上界或者小于预测区间下界,则k
i(α)
为0,否则为1。
[0075]
理想情况下,picp应该尽可能大,使预测区间尽可能地包含实际值。若预设的pinc远远大于预测区间的picp,则说明该预测区间准确性较低,需对预测模型进行调整。
[0076]
除了区间内实际值个数,区间宽度也是衡量预测结果准确性的重要标准。采用pinaw衡量预测区间的宽度,其计算方式为:式中:r为预测实际值的最大值,u
i(α)
为预测区间的上界,l
i(α)
为预测区间的下界。
[0077]
pinaw的数值越小,代表预测值的波动越小,预测结果越理想。实际预测过程中,应在较高的picp与较低的pinaw中寻求平衡,即维持可靠性与清晰性的统一,以得到符合要求
的预测区间结果。
[0078]
其中,步骤5中的k-means聚类方法具体是指:利用k-means聚类算法来获得负荷典型场景。若将数据聚成k类,需选择合适的聚类中心,其方法如下:
[0079]
步骤5.1,任意选取k组需要聚类的数据作为凝聚中心;
[0080]
步骤5.2,为每个类选择数据,其包含与聚类中心较近的待聚类数据;
[0081]
步骤5.3,聚类中心为每类数据的均值所替代;
[0082]
步骤5.4,若聚类中心的变化小于设定值,则聚类完成。
[0083]
选择合适的聚类数可使聚类效果更优,因此有必要进行聚类性能检验,可用ch
(+)
指标进行评估:
[0084][0085]
式中:n为数据总体数量,ni为第i类数据总量,vi为第i类的聚类中心,为数据均值,xj为第j组数据。
[0086]
在本实施例中,采用某地区2012年至2014年的天气数据以及负荷数据进行负荷概率预测,作为测试算例。所包含的天气数据为日平均气温、日最高气温、日最低气温、相对湿度和降雨量,负荷数据时间间隔为15分钟。该算例对待预测日期进行时间步长为15分钟的负荷区间预测。与分布式光伏功率概率预测类似,在预测前,需将进行数据筛选后的数据做归一化处理。
[0087]
将日期划分为工作日与非工作日,若需要预测的日期与前一日的日期性质相同,则将该日天气数据以及前一日最大负荷作为模型输入变量,否则将该日天气数据作为模型输入变量。将与该日星期类型相同的日期对应数据作为训练集,并将其中与其余日期负荷相关系数小于0.9的数据剔除掉。
[0088]
该算例对2014年3月12日的负荷进行概率预测,其中设置的置信度为95%以及90%,并对结果进行评估。不同显著性水平下,负荷预测区间的picp与pinaw指标分布如图1所示,picp值均较高且pinaw均小于10%。
[0089]
3月12日负荷预测曲线如图2所示。由图可得,负荷预测曲线的走势与实际负荷曲线的走势基本一致,测试算例下模型可获得较为准确的结果,可以描述电网负荷的波动性。当置信度降低时,预测区间对于负荷的真实值的覆盖率持平或有所降低,但pinaw均有所降低。此外,还可以看出,在负荷迅速上升或迅速下降时期预测区间的宽度相比于其他时期的区间宽度要窄。负荷峰值方面,3月12日为春季星期三,其负荷峰值(标幺值)接近0.7,负荷季节负荷基本特征。
[0090]
采用历史数据,对该地区2014年春季的工作日与非工作日的天气数据分别做聚类处理,经过ch
(+)
指标验证,将天气数据聚类为4个场景,其中工作日和非工作日各构建2个典型场景。根据负荷预测结果,采用k-means算法进行聚类,得到了负荷的典型场景如图3所示。其中场景一、二为工作日负荷典型场景,场景三、四则为非工作日典型场景。分析可得,负荷典型场景构建结果较为准确,符合该季节负荷基本趋势,可提供工作日与非工作日的负荷主要特征,为电网规划提供参考。
[0091]
本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1