本发明涉及数据处理,具体涉及一种分布式电源短期出力功率预测方法。
背景技术:
1、分布式电源是指小型的、离散的能源发电系统,通常直接部署在能源终端使用地点的位置。分布式电源通常使用可再生能源或燃料电池等清洁能源,可以满足任何场景的能源需求,从而减少对于传统中央化发电厂的依赖,降低输电损耗,同时促进能源的可持续利用。
2、由于分布式电源是需要基于能源消耗来发电,而每天所需的电量以及不同时间段的电量需求又不一样,因此,为了达到能够时刻满足电源所针对区域内的电力需求,同时尽可能不造成能源的浪费,往往需要对区域内的用电负荷进行预测,以根据预测结果实时调节能源的使用,从而实现对分布式电源的短期出力功率进行预测优化的目的。
3、现有技术中,通过获取待预测区域中的历史用电负荷数据,利用历史用电负荷数据对自回归差分移动平均模型(autoregressive integratedmovingaverage model,arima)进行训练,得到训练好的arima模型,然后利用训练好的arima模型对分布式电源的短期出力功率进行预测。
4、但是,在获取历史用电负荷数据时,由于传感器的异常等问题,使得获取得到历史用电负荷数据中存在大量的噪声数据,而该噪声生数据与待预测区域的突发情况(例如,长时间的负荷过高)导致的用电负荷数据异常,在数据波动上的表现较为接近,但后者的用电负荷异常数据对于训练arima模型具有参考价值,而前者噪声数据的数据干扰不具备参考价值,进而使得利用历史用电负荷数据对arima模型进行训练所得到的arima模型的预测能力较差。
5、因此,如何优化利用历史用电负荷数据对arima模型进行训练的训练结果,以提高分布式电源短期出力功率的预测结果成为亟待解决的问题。
技术实现思路
1、有鉴于此,本发明实施例提供了一种分布式电源短期出力功率预测方法,以解决如何优化利用历史用电负荷数据对arima模型进行训练的训练结果,以提高分布式电源短期出力功率的预测结果的问题。
2、本发明实施例中提供了一种分布式电源短期出力功率预测方法,该方法包括以下步骤:
3、获取预设时段内任一分布式电源所针对区域的历史用电负荷时序数据;
4、根据所述历史用电负荷时序数据中各个数据的局部数据差异,获取所述分布式电源所针对区域在所述预设时段内的用电负荷波动常态指标;
5、利用预设时间间隔将所述预设时段划分为至少一个周期,在所述历史用电负荷时序数据中取任一周期内的数据作为周期时序数据,针对任一周期时序数据,根据所述周期时序数据中各个数据的局部数据,分别获取每个数据的含噪系数,根据所述周期时序数据中每个数据的含噪系数,获取对应周期内的用电负荷的时序波动指标;
6、获取所述周期时序数据分别与每个其他周期时序数据之间的相似度,根据所述相似度、所述时序波动指标和所述用电负荷波动常态指标,获取所述周期时序数据的含噪异常程度;
7、根据每个所述周期时序数据的含噪异常程度以及所述历史用电负荷时序数据,对arima模型进行训练,得到训练好的arima模型,利用所述训练好的arima模型对所述分布式电源的短期出力功率进行预测。
8、进一步的,所述根据所述历史用电负荷时序数据中各个数据的局部数据差异,获取所述分布式电源所针对区域在所述预设时段内的用电负荷波动常态指标,包括:
9、获取所述历史用电负荷时序数据的第一数据均值;
10、针对所述历史用电负荷时序数据中的任一数据,以所述数据为中心,获取预设尺寸窗口内包含的所有数据,根据所述预设尺寸窗口内包含的所有数据,获取最大数据和最小数据之间的数据差值,统计所述预设尺寸窗口中的极值数据的数量;
11、计算所述第一数据均值和所述数据之间的差值绝对值,对所述数据差值进行归一化处理,得到对应的归一化结果,对所述极值数据的数量进行负映射,得到对应的映射结果,获取第一预设值与所述映射结果之间的第一差值;
12、获取所述差值绝对值、所述归一化结果和所述第一差值之间的乘积作为所述数据的波动特征值;
13、获取所述历史用电负荷时序数据中的每个数据的波动特征值,计算所有波动特征值的均值,将所述均值进行归一化后的结果作为所述分布式电源所针对区域在所述预设时段内的用电负荷波动常态指标。
14、进一步的,所述根据所述周期时序数据中各个数据的局部数据,分别获取每个数据的含噪系数,包括:
15、获取所述周期时序数据中的极值数据;
16、针对所述周期时序数据中的任一数据,以所述数据为中心,获取预设尺寸窗口内包含的极值数据并统计极值数据的第一数量,对所述第一数量进行负映射,得到对应的映射值,获取目标值与所述映射值之间的差值;
17、根据所述预设尺寸窗口内包含的极值数据,分别获取每两个相邻极值数据之间的时间跨度,计算所有时间跨度之间的标准差;
18、获取所述差值与所述标准差之间的相乘结果,将对所述相乘结果进行归一化后的结果作为所述数据的含噪系数。
19、进一步的,所述根据所述周期时序数据中每个数据的含噪系数,获取对应周期内的用电负荷的时序波动指标,包括:
20、获取所述周期时序数据的第二数据均值;
21、针对所述周期时序数据中的任一极值数据,计算所述极值数据与所述第二数据均值之间的差值,获取所述差值与所述极值数据的含噪系数之间的乘积的平方结果;
22、根据所述周期时序数据中的每个极值数据的平方结果,计算平方结果的均值,将所述平均结果的均值进行二次开方后的结果作为所述周期时序数据对应周期内的用电负荷的时序波动指标。
23、进一步的,所述获取所述周期时序数据分别与每个其他周期时序数据之间的相似度,包括:
24、针对任一其他周期时序数据,利用dtw算法对所述周期时序数据和所述其他周期时序数据进行数据点之间的最短路径匹配,得到对应的匹配结果;
25、针对所述匹配结果中的任一组匹配数据,获取所述组匹配数据之间的距离,根据所述组匹配数据中属于所述周期时序数据的数据作为目标数据,根据所述目标数据的含噪系数,获取所述组匹配数据的距离权重;
26、根据所述匹配结果中每组匹配数据的距离权重,对所有组匹配数据的距离进行加权求和,得到对应的加权求和结果,将所述加权求和结果的倒数作为所述周期时序数据与所述其他周期时序数据之间的相似度。
27、进一步的,所述根据所述相似度、所述时序波动指标和所述用电负荷波动常态指标,获取所述周期时序数据的含噪异常程度,包括:
28、根据所述周期时序数据与每个其他周期时序数据之间的相似度,计算平均相似度,获取常数1与所述平均相似度之间的第一相差结果;
29、获取常数1与所述用电负荷波动常态指标之间的第二相差结果,将所述第一相差结果、所述时序波动指标和所述第二相差结果之间的乘积作为所述周期时序数据的含噪异常程度。
30、进一步的,所述根据每个所述周期时序数据的含噪异常程度以及所述历史用电负荷时序数据,对arima模型进行训练,得到训练好的arima模型,包括:
31、根据每个所述周期时序数据的含噪异常程度,获取所述历史用电负荷时序数据中每个数据的权重系数,根据所述历史用电负荷时序数据以及所述历史用电负荷时序数据中每个数据的权重系数,对arima模型进行训练,得到训练好的arima模型。
32、进一步的,所述根据所述历史用电负荷时序数据以及所述历史用电负荷时序数据中每个数据的权重系数,对arima模型进行训练,得到训练好的arima模型,包括:
33、针对所述历史用电负荷时序数据中的任一数据,将所述数据输入arima模型,得到所述数据的预测值,计算所述数据与所述预测值之间的差值,获取所述差值与所述数据的权重系数之间的乘积平方;
34、根据所述历史用电负荷时序数据中的每个数据对应的乘积平方,计算乘积平方的均值,将所述乘积平方的均值进行二次开方的结果作为所述历史用电负荷时序数据的均方根误差;
35、利用梯度下降法反向修正所述arima模型的模型参数,直至所述均方根误差收敛,得到训练好的arima模型。
36、进一步的,所述根据每个所述周期时序数据的含噪异常程度,获取所述历史用电负荷时序数据中每个数据的权重系数,包括:
37、针对所述历史用电负荷时序数据中的任一数据,确认所述数据所属的周期时序数据作为目标周期时序数据,将常数1与所述目标周期时序数据的含噪异常程度之间的差值作为所述数据的权重系数。
38、本发明实施例至少具有如下有益效果:
39、本发明通过获取预设时段内任一分布式电源所针对区域的历史用电负荷时序数据,并对该历史用电负荷时序数据进行预设时段内的用电负荷波动状态、历史用电负荷时序数据中每个数据的含噪系数,以及预设时段内各个周期之间的时序波动差异进行分析,从而得到用于约束历史用电负荷时序数据中的每个数据的含噪异常程度,进而根据含噪异常程度对历史用电负荷时序数据中的每个数据在训练arima模型时的误差权重进行优化,从而使得受噪声干扰的数据对arima模型的训练干扰较小,提高了arima模型的训练结果,使得训练好的arima模型的预测能力更强、预测的结果更加准确,进而提高了利用训练好的arima模型对分布式电源的短期出力功率的预测结果更加符合实际。