一种基于核极限学习机模型的功率区间预测方法
【技术领域】
[0001] 本发明属于风电发电功率预测领域,尤其涉及一种基于粒子群优化核极限学习机 模型的风电功率区间预测方法。
【背景技术】
[0002] 风能作为一种清洁的可再生能源已经得到世界各国的广泛应用,它具有安全、清 洁、充裕而且资源巨大等特点。风力发电是人类利用风能的主要形式,然而风自身具有很强 的随机性和不稳定性,就会导致风电功率的剧烈波动。尤其近几年风电产业发展迅速,装机 容量持续增加,大规模风电接入电网的背景下,风电功率的随机不稳定性给电力系统的安 全稳定运行带来严峻挑战。对风电功率进行预测,使电力调度部门提前根据风电功率变化 及时调整调度计划,以减轻风电系统对电网造成不利影响,减少系统的备用容量,降低电力 系统运行成本,保证供电质量。所以风电功率预测已成为风电产业研究热点和技术必需。 [0003] 目前风电功率预测从预测方法上可分为物理方法和统计方法。物理方法要求较多 风机相关物理信息,采用物理方程进行预测,应用较为复杂;统计方法对风电历史数据进行 统计分析,根据其内在规律进行预测。常用的统计预测方法有时间序列、人工神经网络、支 持向量机等。但是,目前风电功率预测通常为确定性的点预测,这就对预测结果的准确性的 要求较高,但实际预测过程中存在各种不确定因素,得到的预测结果一般都有不同程度的 误差。因此,需要进行风电功率概率性区间预测,给出预测功率值可能出现的概率。区间预 测方法可以对由不确定性因素引起的预测结果变动范围进行量化,得出未来在某一置信水 平下由上、下界确定的预测区间(prediction intervals,PIs),向电力系统规划的决策者 提供更多ig息。
[0004] 传统区间预测方法,如:分位数回归,非参数核密度估计,单层前向神经网络,需要 大量样本进行复杂数学计算以及对参数分布进行先验假设,计算预测误差相关系数矩阵、 联合概率分布函数等。为了摆脱模型对于大量训练样本的需求,提高非线性拟合能力能力, 学者将极限学习机(ELM, Extreme Learning Machine)技术应用于风电功率预测领域中,运 用较少的训练样本实现了较快更较精确的预测,且有效避免陷入局部最小的危险。但在实 际工程运用中ELM也体现了一些不足之处:在计算数据低维时可能出现的线性不可分,影 响预测效果,导致ELM模型的输出易出现随机波动,稳定性和泛化能力不理想。
【发明内容】
[0005] 针对传统风电功率点预测及极限学习机方法的不足,本发明提出了一种基于粒子 群优化核极限学习机(KELM, Kernel Extreme Learning Machine)模型的风电功率区间预 测方法,包括:
[0006] 步骤 1 :获取风电场SCADA(Supervisory Control And Data Acquisition,数据米 集与监视控制系统)中的实际风速、功率数据,根据风速与功率相关性进行处理,将数据分 为训练样本和测试样本,将数据归一化;
[0007] 步骤2 :在训练数据中,将风速数据序列作为KELM模型的输入值,对功率数据进行 小幅上下浮动来作为KELM模型的初始预测区间上下限;初始化KELM预测模型的参数,包括 选取核函数、惩罚系数,代入步骤1处理的训练样本数据,得到初始输出权重β int;
[0008] 步骤3 :初始化粒子群参数,包括设定种群数、粒子初始位置和随机设定初始速 度、个体极值、全体极值;把初始输出权重Pint设为粒子初始位置,惯性权重按线性递减策 略动态调整;
[0009] 步骤4 :根据预测区间覆盖概率(PI coverage probability,PICP)、预测区间平 均带宽(PI normalized average width,PINAW)和累积带宽偏差(Accumulated width deviation,AWD)这3个评价指标构建粒子群的优化目标函数F来作为粒子群优化的适应 度值,进行粒子群寻优,根据比较每个粒子的F在每次迭代中的大小,更新粒子速度、位置、 个体极值和全体极值,得到最优输出权重β bf3St;
[0010] 步骤5 :根据步骤4寻优得到的最优输出权重β test代入KELM模型,代入测试样本, 输出即为风电功率预测区间,使用步骤4中的各项评价指标来评价预测区间。
[0011] 所述步骤1具体包括:
[0012] 步骤101 :数据预处理,按一定时间间隔采集SCADA中--对应的风速与功率数 据,按时间顺序排序,删除其中的零点、缺值点、停机点及限功率点,排除人为因素干扰;
[0013] 步骤102 :数据再处理,根据初步处理的风速及功率数据,绘制风功率曲线,根据 功率曲线,分别按照风速、功率进行分段,运用莱茵达法则去除每个风速段内误差较大值; 如果分段内数据过少则不进行莱茵达法则删除,最终得到一组具有较强相关性的数据;
[0014] 步骤103 :归一化步骤102中处理的数据到[0,1]区间,将数据分为训练样本和测 试样本,其中风速数据序列构成Xi= [Xl,X2…Xm]T;与之对应的功率数据序列t i= [ti,b,… ,tJT,他们共同构成N个训练样本i代表序列中第i个数据,m代表训练数据个 数。
[0015] 所述步骤2具体包括:
[0016] 步骤201 :将风速数据序列X1作为KELM模型的输入值,对功率数据序列t i进行小 幅上下浮动,作为KELM模型的初始预测区间上下限g^ ;
[0017] 步骤202 :初始化KELM预测模型参数,选取RBF径向基核函数:Κ(μ,v)= θχρ(-(μ_ν)2/σ),其中μ、V为映射数据,σ为宽度参数,控制函数的径向作用范围;β# = HT(I/C+HHT) 1T,其中β*为输出权重,C为惩罚系数,T是模型输出即预测区间上下限,I 为单位矩阵,H为极限学习机的隐含层输出矩阵;
[0018] 步骤203 :将步骤1中的训练样本代入KELM模型计算得到初始输出权重β int。
[0019] 所述步骤3具体包括:
[0020] 步骤301 :初始化粒子群参数,设KELM模型计算得到的初始输出权重β int为粒子 初始位置,粒子初始速度为[0-1]的随机数,粒子维数为输出权重维数;
[0021] 步骤302 :采用动态调整惯性权重策略,兼顾粒子群的全局搜索能力和局部搜索 能力,惯性权重按线性递减策略动态调整:《(t) = COmax-(COmax-COmin)(Vtmax)
[0022] 其中t为当前迭代次数,t_为最大迭代次数,ω (t)为第t次迭代时权重,权重最 大ωΜΧ= 0. 9,权重最小值ω ηιη= 0. 1。
[0023] 所述步骤4具体包括:
[0024] 步骤401 :根据预测区间覆盖概率、预测区间平均带宽和累积带宽偏差这3个评价 指标构建粒子群的优化目标函数F来作为粒子群优化的适应度值:
[0025]
[0026] 其中,γ、爹、λ分别为针对预测目标覆盖率偏差、预测区间平均带宽和累积带宽 偏差的权重系数,t为当前迭代次数,α为置信水平;
[0027] 预测区间覆盖概率
表示实际观测值即预测目标值h落在 预测区间上下限内的概率;其中队为预测样本数,κ 布尔量,如果预测目标值t i包含于 区间预测上下限,则K1= 1,否则κ
[0028] 区间平均带宽
,其中R为预测目标值t 的变化范围,用于对平均带宽进行归一化处理;
[0029] 累积带宽偏差表示预测目标值h偏离预测区间上限或下限的程度:
[0031] 步骤402 :粒子群每次迭代得到一组新的输出权重,进而得到KELM模型输出,由此 计算此次优化目标函数F即适应度,与粒子本身最优解即个体极值和种群当前最优解即全 体极值进行比较,留下适应度更小的粒子,并更新个体极值和全局极值,同时粒子按下面公 式更新自己的速度和位置:
[0033] Xj (t+1) = Xj (t) + Φ V ) (t+1)
[0034] 其中,t代表迭代次数(t)为第j个粒子在第t代的速度;ω为惯性权重;Cl、 C2为认知系数取值均为2 R2为均匀分布随机数,由[0, 1]之间随机赋值;为粒子 j个体历史最优位置;^丨⑴为群体历史最优位置;X] (t)为粒子在第t代的位置;Φ是一个 收缩因子,用来保持速度在一定范围内,取值为1。
[0035] 本发明的有益效果在于:通过本发明方法对风电功率区间进行区间预测,替代传 统点预测,易于工程实现,能够得到较好的预测结果,不仅能描述未来风电功率可能波动范 围,同时能有效评估预测区间的可靠性,给出风电功率在不同置信水平下可能的波动区间, 更好地为电力系统决策人提供参考。
【附图说明】
[0036] 图1为本发明风电功率区间预测方法的流程示意图。
[0037] 图2为KELM预测模型示意图。
[0038] 图3-图5为某风电场风电功率区间在不同置信水平下的实际预测结果,图中的横 坐标为时间,每个点之间间隔15分钟。
【具体实施方式】
[0039] 下面结合附图,对实施例作详细说明。
[0040] 如图1流程示意图所示,为本发明采用华能酒泉某风电场在2014年7-10月间从 SCADA中采集到的实际风电功率数据,分辨率为15min,包括实测输出功率和测风塔风速, 对其中一天功率进行区间预测。该风场有133台I. 5MW变桨距调节三叶片水平轴异步发电 机。该方法包含以下步骤:
[0041] 步骤1 :获取风电场SCADA中的实际风速、功率数据,根据风速与功率相关性进行 处理,将数据分为训练样本和测试样本,将数据归一化;
[0042] 步骤101 :数据预处理:采集SCADA中间隔为15分钟的风速与功率--对应数据, 按时间顺序排序,删除其中的零点,缺值点,停机点及限功率点,排除人为因素干扰;
[0043] 步骤102 :数据再处理:根据初步处理的风速及功率数据,绘制风功率曲线,根据 功率曲线,分别按照风速(每段〇. 25m/s),功率(每段IOOkW)分段,运用莱茵达法则去除每 个风速段内误差较大值。如果分段内数据过少(少于5个点)则不进行莱茵达法则删除, 最终得到一组具有较强相关性的数据;
[0044] 步骤103 :归一化步骤102中处理的数据到[0,1]区间,将数据分为训练样本和测 试样本,其中风速数据序列构成Xi= [Xl,X2…Xm]T;与之对应的功率数据序列t i= [ti,b,… ,tJT,他们共同构成N个训练样才
i代表序列中第i个数据,m代表训练数据个 数。
[0045] 步骤2 :在训练数据中,将风速数据序列作为KELM模型的输入值,对功率数据进行 小幅上下浮动来作为KELM模型的初始预测区间上下限;初始化KELM预测模型的参数,模型 如图2所示,包括选取核函数、惩罚系数,代入步骤1处理的训练样本数据,得到初始输出权 重 β int。
[0046