本发明属于电网中长期负荷预测领域,具体涉及一种基于xgboost的电力系统负荷预测方法及装置。
背景技术:
1、电力负荷预测在电力系统调度、维护和容量规划等方面起着至关重要的作用,对指导电网规划建设和改善电力系统资源的优化配置具有重要的意义。实际的电力负荷预测分为短期、中期和长期预测,而中长期负荷预测对于电力系统的经济、高效和安全运行具有重要意义。但是,中长期负荷预测面临多种挑战,尤其在新型产业体系下,导致负荷呈现复杂的非对称振荡多变特性,增加了精准预测的难度。与短期负荷预测相比,中长期负荷预测所需数据量较少,因此时间跨度大、准确的电力负荷预测对于电力系统的经济、高效、安全运行以及发电计划和电力布局规划具有重要意义。
2、因为实际电力负荷数据常常呈现非线性强、波动性较大和时序性等特性,而现有的负荷预测模型较少考虑复杂非线性关系和时序特征,因此在预测的精确度方面有待提高。
技术实现思路
1、本发明提出了一种基于xgboost的电力系统负荷预测方法及装置,能更好地捕捉实际电力负荷数据中的复杂非线性关系和时序特征,提高中长期电力负荷预测的准确性和鲁棒性,提升电力系统的负荷能力和运行稳定性。
2、本发明的第一方面提供了一种基于xgboost的电力系统负荷预测方法,所述方法包括:
3、获取预设时段的历史电力负荷数据,对预设时段的历史电力负荷数据进行预处理,得到第一电力负荷数据;
4、通过预设的xgboost算法处理第一电力负荷数据,得到交叉特征值;其中,预设的xgboost算法中的计算参数是通过预设的bso算法优化而获得,所述计算参数包括学习率、回归树的数量和回归树的深度;
5、通过预设的特征工程对预设时段的历史电力负荷数据和交叉特征值进行特征处理,得到第二特征数据;
6、通过预设的dnn模型对第二特征数据进行负荷预测,得到预测负荷数据;
7、将预测负荷数据和实际历史负荷数据进行对比,通过预设的筛选条件,得到电力系统中长期负荷预测结果。
8、上述方案通过预设时段的历史电力负荷数据,经过特征提取和数据预测,更好的捕捉数据的非线性关系和时序特征,再通过数据比对,提升数据的精确度,得到中长期负荷预测结果,使电力负荷预测有着较高的准确性和鲁棒性,有助于提升电力系统的负荷能力和运行稳定性。
9、在第一方面的一种可能的实现方法中,获取预设时段的历史电力负荷数据,对预设时段的历史电力负荷数据进行预处理,得到第一电力负荷数据,具体为:
10、根据预设时段的历史电力负荷数据,对预设时段的历史电力负荷数据依次进行确定时间分辨率、特征提取、季节性调整、缺失值处理和数据标准化,得到第一电力负荷数据。
11、其中,确定时间分辨率为确定数据采样的时间间隔,特征提取为提取预设时段的历史电力负荷数据的平均值、最大值、最小值和标准差,季节性调整为使用预设的差分操作和季节性指标对数据进行调整,缺失值处理为使用预设的插值方法填补预设时段的历史电力负荷数据的缺失值,数据标准化为使用预设的标准化处理方法统一预设时段的历史电力负荷数据的数据格式。
12、上述方案通过对预设时段的历史电力负荷数据进行预处理,提取xgboost算法需要的数据特征,并设置数据的采样的时间间隔,方便接下来xgboost算法的计算,提高数据计算的效率。
13、在第一方面的一种可能的实现方法中,通过预设的xgboost算法处理第一电力负荷数据,得到交叉特征值,具体为:
14、根据第一电力负荷数据,通过预设的xgboost算法的损失函数计算每个第一电力负荷数据的导数;
15、根据第一电力负荷数据的导数,构建第一电力负荷数据对应的回归树;
16、根据回归树,更新第一电力负荷数据;
17、当回归树满足预设的终止条件时,根据当前的第一电力负荷数据得到交叉特征值;
18、否则,根据当前的第一电力负荷数据再次构建回归树。
19、上述方案通过预设的xgboost算法处理第一电力负荷数据,提取目标特征数据,得到高精确度的交叉特征值用于电力负荷的预测。
20、在第一方面的一种可能的实现方法中,更新第一电力负荷数据,具体为:
21、更新后的第一电力负荷数据具体公式为:
22、
23、其中,t为构建回归树的次数,xi为第i个第一电力负荷数据,fk为第k次构建的回归树,f为全部回归树的集合,ft为第t次构建的回归树,为上一次更新后的第一电力负荷数据。
24、在第一方面的一种可能的实现方法中,预设的xgboost算法中的计算参数是通过预设的bso算法优化而获得,具体为:
25、根据预设的bso算法对预设的xgboost算法中的学习率、回归树的数量和回归树的深度进行寻优操作,通过预设的k-means聚类算法,得到最优的学习率、回归树的数量和回归树的深度;
26、将最优的学习率、回归树的数量和回归树的深度输入到预设的xgboost算法中,对预设的xgboost算法的计算参数进行优化。
27、上述方案通过预设的bso算法对预设的xgboost算法的参数进行寻优并优化,使得预设的xgboost算法有着更好的特征提取能力,能更准确地抓取数据地特征。
28、在第一方面的一种可能的实现方法中,通过预设的特征工程对预设时段的历史电力负荷数据和交叉特征值进行特征处理,得到第二特征数据,具体为
29、根据预设时段的历史电力负荷数据,设置时间分辨率,再进行季节性调整,得到产出特征;
30、将产出特征和交叉特征值进行拼接处理,得到第二特征数据。
31、上述方案通过特征工程,对数据进行时间上的划分处理,降低季节的改变对数据的影响,然后对数据进行拼接,得到完整的数据用于接下来的负荷预测。
32、在第一方面的一种可能的实现方法中,通过预设的dnn模型对第二特征数据进行负荷预测,得到预测负荷数据,具体为:
33、将第二特征数据输入预设的dnn模型中,去第二特征数据的线性化,并捕捉第二特征数据的非线性关系,得到第三输入值;
34、根据第三输入值,通过dnn模型的偏移向量和若干个权重系数矩阵以预设的时序目标进行迭代运算,当满足预设的迭代条件时,确定预测负荷数据。
35、上述方案通过预设的dnn模型进行负荷预测,先对数据去线性化,再进行迭代计算不断提升预测的精确度和准确捕捉数据的时序特征,得到符合迭代条件的预测负荷数据。
36、在第一方面的一种可能的实现方法中,预测负荷数据,具体为:
37、预测负荷数据yi的具体公式为:
38、
39、其中,xi为第i个第三输入值,wij为权重系数矩阵,bj为偏移向量,n为第三输入值的总数量,j为xi在预设的dnn模型的某一隐藏层的第j次运算。
40、在第一方面的一种可能的实现方法中,将预测负荷数据和实际历史负荷数据进行对比,通过预设的筛选条件,得到中长期负荷预测结果,具体为:
41、计算预测负荷数据和实际历史负荷数据的均方根误差和平均绝对百分比误差;
42、根据所述均方根误差和平均绝对百分比误差,通过预设的筛选条件,评估预测负荷数据的精确度,得到满足预设数据精确度的中长期负荷预测结果。
43、上述方案通过将预测负荷数据和实际历史负荷数据进行对比,计算均方根误差和平均绝对百分比误差以评估预测负荷数据的精确度,找到符合要求的数据,提升了数据精度。
44、在第一方面的一种可能的实现方法中,均方根误差和平均绝对百分比误差,具体为:
45、均方根误差yrmse的具体公式为:
46、
47、其中,n为预测负荷数据的数量,m为预测未来时间点的个数,xtrue(ij)为第i个在第j个时间点的实际历史负荷数据,xpred(ij)为第i个在第j个时间点的预测负荷数据;
48、平均绝对百分比误差ymape的具体公式为:
49、
50、本发明第二方面提供了一种基于xgboost的电力系统负荷预测装置,所述装置包括:数据预处理模块、特征提取模块、特征处理模块、电力负荷预测模块和数据校验模块;
51、其中,所述数据预处理模块用于获取预设时段的历史电力负荷数据进行预处理,得到第一电力负荷数据;其中,预处理包括设置时间分辨率、特征提取、季节性调整、缺失值处理和数据标准化;
52、所述特征提取模块用于根据第一电力负荷数据,通过预设的xgboost算法进行处理,得到交叉特征值;其中,预设的xgboost算法已通过预设的bso算法优化计算参数,计算参数包括学习率、回归树的数量和回归树的深度;
53、所述特征处理模块用于根据预设时段的历史电力负荷数据和交叉特征值,通过预设的特征工程进行特征处理,得到第二特征数据;
54、所述电力负荷预测模块用于根据第二特征数据,通过预设的dnn模型进行负荷预测,得到预测负荷数据;
55、所述数据校验模块用于将预测负荷数据和实际历史负荷数据进行对比,通过预设的筛选条件,得到中长期负荷预测结果;
56、所述电力系统优化模块用于根据中长期负荷预测结果,优化电力系统的负荷能力。