本发明涉及电力负荷预测,具体是一种基于大数据技术的供电最高负荷中短期预测方法。
背景技术:
1、电力系统负荷预测是电力系统各种安全技术措施的重要组成部分,它和继电保护、稳定计算、短路计算一样,对电力系统的安全、经济、稳定运行有着非常重要的作用。负荷预测是电网规划及经营工作的基础,准确的负荷预测有助于提高系统运行的安全性和稳定性,能够减少发电成本、可以保证规划的精确。短期负荷预测是指周以内的负荷预测,可用于安排电力调度计划,包括负荷经济分配,电力系统安全性检测,设备检修等。在未来的多变且分布式电网场景中,短期负荷预测变得更加重要。
2、对于短期负荷预测,现有的方法大多将研究的重点放在了对于预测模型的改进或者创新上,如使用创新的机器学习模型用于电力负荷预测、使用改进的机器学习模型用于电力负荷预测等,虽然基于数据驱动的智能模型精度越来越高,但是随着数据量和数据维度的增多,导致智能模型在精度提高的同时,模型的复杂度和训练时间指数级增加,甚至难以收敛;同时无法对预测终端的运算情况进行监控,导致终端算力较低,影响整体数据处理效率;基于以上不足,本发明提出一种基于大数据技术的供电最高负荷中短期预测方法。
技术实现思路
1、本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种基于大数据技术的供电最高负荷中短期预测方法。
2、为实现上述目的,根据本发明的第一方面的实施例提出一种基于大数据技术的供电最高负荷中短期预测方法,包括如下步骤:
3、步骤一:周期性的构建样本数据集;具体为:对选取的给定时间段的样本数据进行整理、提取,形成输入、输出数据集;
4、步骤二:对样本中的输入数据进行数据清洗和缺失值处理;对处理后的数据进行标准化变换,并将数据集分成训练集、验证集和测试集;
5、步骤三:预测终端对gru网络结构中的状态单元进行修改,使每个输出状态单元先进入激活函数后再进行下一步的计算,以此构建改进的gru神经网络;
6、将训练集、验证集以及测试集作为历史特征值输入所述gru神经网络以进行模型训练,并通过损失函数进行模型评估,获得使训练样本整体误差最小的模型权重;
7、步骤四:在预测终端运算过程中,实时采集预测终端的运算时序数据并进行运算损耗指数yz分析;所述运算时序数据包括同一时刻预测终端的访问节点连接数据、算力占用数据和温度数据;
8、若yz大于预设损耗阈值,则表明预测终端运算损耗严重,生成运算力低下信号至控制中心;以提醒管理员更换新的预测终端进行数据分析;
9、步骤五:获得最优gru模型后,将待预测时区前一时区的电力负荷数据和待预测时区的气候文本数据作为模型输入,计算标准化预测结果;
10、按照训练时计算的标准化变换系数对所述标准化预测结果进行逆变换,得出最终预测结果;
11、步骤六:采集预测终端的数据预测记录,并对预测终端进行预测优化指数yh评估;为管理员选择预测终端提供参考;所述数据预测记录包括数据容量、数据类型数以及预测时长。
12、进一步地,步骤四中采集预测终端的运算时序数据并进行运算损耗指数yz分析,具体分析步骤包括:
13、采集预测终端的运算时序数据,分析得到预测终端的运算时间段;
14、获取预测终端在任意时刻的访问节点连接数为gt,设定预测终端接入访问节点的最大容量为g2,最小容量为g3;
15、利用公式gf=(g2-gt)/(gt-g3)计算得到预测终端的节点充余系数gf;
16、在运算时间段内,将预测终端的节点充余系数最大值标记为gfmax;算力占用率最大值标记为zlmax;温度最大值标记为wmax;
17、统计预测终端的运算时长为rt;利用公式yz=ƒ×rt×(gfmax×a1+zlmax×a2+wmax×a3)计算得到预测终端的运算损耗指数yz,其中a1、a2、a3均为预设系数因子;ƒ为预设均衡系数。
18、进一步地,步骤六中对预测终端进行预测优化指数yh评估,具体评估过程为:在预设时间段内,采集预测终端的数据预测记录;
19、统计预测终端的数据预测次数为p1;将每个数据预测记录中的数据容量、数据类型数以及预测时长标记为wl1、wl2以及wl3;
20、利用公式ym=(wl1×g1+wl2×g2)/(wl3×g3)计算得到预效值ym,其中g1、g2、g3均为预设系数因子,取值(0,0.13];
21、对预效值ym进行等级评判得到评价信号,具体为:
22、将预效值ym与预设效率阈值相比较;所述预设效率阈值包括x1、x2;且x2<x1;当ym≥x1时,此时评价信号为高级预效信号;
23、当x2≤ym<x1时,此时评价信号为中级预效信号;当ym<x2时,此时评价信号为初级预效信号;
24、统计高级预效信号、中级预效信号和初级预效信号各自相较于评价信号次数的占比并依次标记为zb1、zb2、zb3;
25、利用公式yh=ƒ×p1×(zb1×3+zb2×2)/zb3计算得到预测终端的预测优化指数yh,其中ƒ为预设补偿系数,取值(0,0.0013]。
26、进一步地,输入数据是指某个时间段内、以设定时间为间隔的气候文本数据和电力负荷数据,输出数据是滞后于输入数据某个时期后的电力负荷数据;设定时间由管理员预设。
27、进一步地,对样本中的输入数据进行数据清洗,包括:对空值进行填充或者丢弃;对重复数据进行去重处理;对范围错误的气候文本数据进行清洗;对气候文本数据进行数据验证。
28、进一步地,采用平均插值法进行缺失值处理,具体包括:
29、对电力负荷数据进行单位换算处理,补全采样时间点保证其连续,并利用平均插值法填补采样点缺失数据,得到电力负荷时间序列;若采样时间点和数据大面积缺失,则利用同时期他年数据进行填补。
30、进一步地,步骤三中改进gru神经网络是在计算门的过程中使状态先进入一个激活函数,同时在输出端也需要通过一个激活函数,才能完成最后的输出;所述激活函数选择selu函数,以使神经元的激励值自动收敛到零均值和单位方差。
31、与现有技术相比,本发明的有益效果是:
32、1、本发明中对样本中的输入数据进行数据清洗和缺失值处理;对处理后的数据进行标准化变换,并将数据集分成训练集、验证集和测试集;然后预测终端对gru网络结构中的状态单元进行修改,使每个输出状态单元先进入激活函数后再进行下一步的计算,以此构建改进的gru神经网络;进一步提升了网络的数据挖掘能力和效率;将训练集、验证集以及测试集作为历史特征值输入所述gru神经网络以进行模型训练,并通过损失函数进行模型评估,获得使训练样本整体误差最小的模型权重;获得最优gru模型后,将待预测时区前一时区的电力负荷数据和待预测时区的气候文本数据作为模型输入,计算标准化预测结果;提高数据预测准确度和效率;
33、2、本发明在预测终端运算过程中,实时采集预测终端的运算时序数据并进行运算损耗指数yz分析;所述运算时序数据包括同一时刻预测终端的访问节点连接数据、算力占用数据和温度数据;若yz大于预设损耗阈值,则表明预测终端运算损耗严重,生成运算力低下信号至控制中心;以提醒管理员更换新的预测终端进行数据分析,提高数据处理效率;以及采集预测终端的数据预测记录,并对预测终端进行预测优化指数yh评估;为管理员选择预测终端提供参考;提高数据处理效率。