基于深度学习的台区短期负荷预测方法

文档序号:29256970发布日期:2022-03-16 11:21阅读:243来源:国知局
基于深度学习的台区短期负荷预测方法

1.本发明涉及配电网分析领域,特别提供了一种基于深度学习的台区短期负荷预测方法。


背景技术:

2.随着现代电力系统的迅猛发展,大批量电力数据源源不断的出现,致使传统的负荷预测方法已经不能满足当前社会发展需求,引起了供电企业对负荷预测的高度重视。近年来随着大数据和人工智能技术的广泛应用,人们开始考虑利用大数据技术来提高负荷预测精度,这样可以让电力系统更加合理,经济有效地进行日常生产项目的安排。负荷预测从预测的时间尺度上可以分为长期、中期、短期和超短期预测,其中短期负荷预测适用于配电台区级别的负荷预测。
3.对于短期负荷预测的研究方法主要分为两种,一种是传统的机器学习方法,如支持向量机算法svm及其高级算法,在处理小样本数据时svm相对更加快速,但是svm不能处理大批量数据样本,速度缓慢,因此其适合处理特征维数多,数据集较少的负荷数据。另一种是使用人工神经网络方法,如传统的神经网络及其改进算法,它们对于处理海量数据具有很好的性能。但是负荷数据存在时序特性,而人工神经网络方法只使用全连接层和非线性激活函数,显然,不能够满足负荷预测精度要求。
4.因此,提出一种新型的短期负荷预测方法,以解决上述问题,成为研究热点。


技术实现要素:

5.鉴于此,本发明的目的在于提供一种基于深度学习的台区短期负荷预测方法,以解决现有短期负荷预测方法存在的问题。
6.本发明提供的技术方案是:基于深度学习的台区短期负荷预测方法,包括如下步骤:
7.s1:采集低压配电台区的时序运行数据,其中,所述时序运行数据包括电压、电流、有功功率、无功功率和时间信息;
8.s2:对所述时序运行数据进行预处理和特征工程工作,其中,所述预处理包括剔除异常数据、填充缺失值和数据标准化,得到数值型数据,所述特征工程工作为按照小时、周、月、是否为工作日、是否为高峰负荷时段5个维度增加时间属性的特征,并采用独热向量编码规则生成稀疏特征向量,得到类别型数据的特征向量;
9.s3:将所述数值型数据输入到训练好的seq2seq-attention模型中,得到经过attention模型附加权重的向量序列,之后,将经过全连接网络的类别型数据的特征向量与所述向量序列进行向量合并,并经过激活函数得到负荷预测结果,其中,所述seq2seq-attention模型是在基于lstm的seq2seq模型基础上引入attention机制后构建的,用于负荷预测。
10.进一步优选,s1中,剔除异常数据的方法如下:
11.定义变量a,使用分位数来检测异常数据,并利用公式(1)剔除异常数据:
[0012][0013]
式中,q1和q3分别为第一个和第三个四分位数,iqr为四分位数取值范围。
[0014]
进一步优选,s1中,填充缺失值的方法如下:采用前后量测数据的平均值进行数据填充。
[0015]
进一步优选,s1中,数据标准化利用公式(2)实现
[0016][0017]
式中,表示第i个样本的第n个特征,符号e表示期望,符号std表示方差。
[0018]
进一步优选,s3之前还包括训练seq2seq-attention模型的步骤,具体包括:
[0019]
s31:在基于lstm的seq2seq模型基础上引入attention机制,构建seq2seq-attention模型;
[0020]
s32:利用训练集样本训练seq2seq-attention模型,并利用验证集样本对模型进行优化,直至得到最优模型,即:训练好的seq2seq-attention模型。
[0021]
进一步优选,s32中,训练集样本和验证集样本为经过预处理和特征工程工作的数据样本。
[0022]
进一步优选,s32中,采用均方根误差rmse作为评价指标。
[0023]
进一步优选,s32中,采用adagrad算法对参数进行优化,实现学习率的动态更新。
[0024]
本发明提供的基于深度学习的台区短期负荷预测方法,针对传统机器学习方法的不足,搭建了一种基于深度学习理论的新预测模型,seq2seq-attention模型是以lstm单元组成编码器和译码器,并加入attention机制的一种模型,它可以同时实现深度神经网络的机器学习功能,lstm模块提供时间序列信息的表达功能,以及attention机制联系不同时段间数据信息功能,在seq2seq-attention模型和电力系统大量多维时间序列数据基础之上,基于seq2seq-attention模型下的台区短期负荷预测方法,能够达到较高的预测准确性。
[0025]
本发明提供的基于深度学习的台区短期负荷预测方法,构建了新的预测模型,在seq2seq模型基础上引入了attention机制,能够将解码器的一个lstm单元提取的信息与编码器中其他的lstm单元相连,使不同时段间的隐含信息都可以用权值精确地表示出来,能够更好的对电力系统中的多维时间序列特征数据进行预测。
附图说明
[0026]
下面结合附图及实施方式对本发明作进一步详细的说明:
[0027]
图1为本发明提供的基于深度学习的台区短期负荷预测方法的流程图;
[0028]
图2为seq2seq-attention模型的结构图;
[0029]
图3为attention机制原理图。
具体实施方式
[0030]
下面将结合具体的实施方案对本发明进行进一步的解释,但并不局限本发明。
[0031]
如图1所示,本发明提供了一种基于深度学习的台区短期负荷预测方法,包括如下步骤:
[0032]
s1:采集低压配电台区的时序运行数据,其中,所述时序运行数据包括电压、电流、有功功率、无功功率和时间信息;
[0033]
s2:对所述时序运行数据进行预处理和特征工程工作,其中,所述预处理包括剔除异常数据、填充缺失值和数据标准化,得到数值型数据,所述特征工程工作为按照小时、周、月、是否为工作日、是否为高峰负荷时段5个维度增加时间属性的特征,并采用独热向量编码规则生成稀疏特征向量,得到类别型数据的特征向量;
[0034]
s3:将所述数值型数据输入到训练好的seq2seq-attention模型中,得到经过attention模型附加权重的向量序列,之后,将经过全连接网络的类别型数据的特征向量与所述向量序列进行向量合并,并经过激活函数得到负荷预测结果,其中,所述seq2seq-attention模型是在基于lstm的seq2seq模型基础上引入attention机制后构建的,用于负荷预测。
[0035]
该基于深度学习的台区短期负荷预测方法,针对传统机器学习方法的不足,搭建了一种基于深度学习理论的新模型,seq2seq-attention模型是以lstm单元组成编码器和译码器,并加入attention机制的一种模型,它可以同时实现深度神经网络的机器学习功能,lstm模块提供时间序列信息的表达功能,以及attention机制联系不同时段间数据功能。在seq2seq-attention模型和电力系统大量多维时间序列数据基础之上,基于seq2seq-attention模型下的台区短期负荷预测方法,能够达到较高的预测准确性。
[0036]
作为技术方案的改进,s1中,剔除异常数据的方法如下:
[0037]
定义变量a,使用分位数来检测异常数据,并利用公式(1)剔除异常数据:
[0038][0039]
式中,q1和q3分别为第一个和第三个四分位数,iqr为四分位数取值范围。
[0040]
作为技术方案的改进,s1中,填充缺失值的方法如下:采用前后量测数据的平均值进行数据填充。
[0041]
作为技术方案的改进,s1中,数据标准化利用公式(2)实现
[0042][0043]
式中,表示第i个样本的第n个特征,符号e表示期望,符号std表示方差。
[0044]
作为技术方案的改进,s3之前还包括训练seq2seq-attention模型的步骤,具体包括:
[0045]
s31:在基于lstm的seq2seq模型基础上引入attention机制,构建seq2seq-attention模型;
[0046]
s32:利用训练集样本训练seq2seq-attention模型,并利用验证集样本对模型进行优化,直至得到最优模型,即:训练好的seq2seq-attention模型。
[0047]
作为技术方案的改进,s32中,训练集样本和验证集样本为经过预处理和特征工程工作的数据样本。
[0048]
作为技术方案的改进,s32中,采用均方根误差rmse作为评价指标。
[0049]
作为技术方案的改进,s32中,采用adagrad算法对参数进行优化,实现学习率的动态更新,可加快目标函数收敛,充分利用少数有意义样本,具有自适应性。
[0050]
实施例
[0051]
(1)通过电力公司用电信息采集系统采集低压配电台区的时序运行数据,其中,所述时序运行数据包括电压、电流、有功功率、无功功率和时间信息;
[0052]
(2)对所述时序运行数据进行预处理和特征工程工作:
[0053]
21)剔除异常数据
[0054]
定义变量a,使用分位数来检测异常数据,并利用公式(1)剔除异常数据:
[0055][0056]
式中,q1和q3分别为第一个和第三个四分位数,iqr为四分位数取值范围;
[0057]
22)填充缺失值
[0058]
采用前后量测数据的平均值进行数据填充;
[0059]
23)数据标准化
[0060]
电力数据中常存在异常值和较多噪音,采用标准化对其进行处理为均值为0,方差为1的数据样本,处理后的数据特征是符合正态分布的,标准化方程式如下:
[0061][0062]
式中,表示第i个样本的第n个特征,符号e表示期望,符号std表示方差;
[0063]
24)特征工程
[0064]
考虑实际用电情况具有时间特性,将各台区按照小时、周、月、是否为工作日、是否为高峰负荷时段(例:定义08:30~11:30,18:00~23:00为高峰负荷时段)不同维度增加时间属性的特征,采用独热向量编码规则生成由0与1构成的稀疏特征向量,得到模型输入的类别型数据。
[0065]
(3)构建、训练并优化seq2seq-attention模型
[0066]
seq2seq(sequence-to-sequence)模型是以编码(encode)和解码(decode)为代表的架构方式,根据输入序列x来生成输出序列y,广泛应用在回归预测任务中。以encode和decode为代表的seq2seq模型,encode意思是将输入序列转化成一个固定长度的向量,decode意思是将输入的固定长度向量解码成输出序列。其中编码解码的方式采用lstm网络,即编码器和解码器由多个lstm单元组成,可以使输入序列长度可变,也可解决传统rnn模型存在梯度下降的问题。
[0067]
编码器用于处理输入样本,对lstm单元的输入信息进行编码。编码器中的lstm单元可以使用其隐藏层来表达和传递时间序列信息。解码器用于接收来自编码器的编码信息,对编码信息进行解码,然后将解码后的信息送入到输出模块。
[0068]
由于seq2seq模型在编码和解码阶段始终由一个不变的语义向量来联系着,编码器要将整个序列的信息压缩进一个固定长度的向量中去。这将造成:1)语义向量无法完全表示整个序列的信息;2)最开始输入的序列容易被后输入的序列给覆盖掉,会丢失许多细节信息。
[0069]
因此,本发明在seq2seq模型中引入attention机制,构造seq2seq-attention模型(如图2所示)。
[0070]
通过引入attention机制,打破了seq2seq模型只能利用编码器最终单一向量结果的限制,从而使模型可以集中对于下一个目标重要的输入信息上,极大的改善了模型效果。另外一个优势是,通过观察attention权重矩阵的变化,可以更好地了解到输入数据样本中哪些数据,有助于提高负荷预测精度。attention机制原理参如图3所示。
[0071]
图3中,符号h
1-h5指编码器中不同的lstm单元所表示的信息,h0指的是解码器第一个lstm单元的输出信息,ri为采用余弦相似度计算得到的注意力打分,wi为attention模块为时间序列信息赋予的权重,c1指的是attention模块的输出,然后将其发送到解码器的第一个lstm单元作为输入信息。这些符号的原理受以下等式约束。
[0072][0073]
训练及优化过程如下:
[0074]
将数据样本按照7:3的比例划分成训练集和验证集,对seq2seq-attention模型结构进行训练和优化,训练集用来训练seq2seq-attention模型,调整权值wi,不断修正指标性能以便于得到最优参数,验证集用来检验训练模型性能的好坏。训练完成后即得到完整的基于seq2seq-attention负荷预测模型。
[0075]
如图1所示,训练过程中,数据样本经预处理和特征工程工作后,数值型数据输入到seq2seq-attention模型中,得到经过attention模型附加权重的向量序列,之后,与经过全连接网络的类别型数据进行向量合并,经过激活函数后,即可得到预测负荷值。
[0076]
优化过程中,对负荷预测任务的误差采用均方根误差rmse作为评价指标,计算公式如下:
[0077][0078]
式中,n为预测序列长度,yi为第i个实际负荷值,为第i个预测负荷值,误差越大,
rmse值越大。
[0079]
seq2seq-attention模型的优化器采用adagrad算法,可以将模型中每一个参数的每一次迭代的梯度取平方累加再开方,用基础学习率除以这个数,来实现学习率的动态更新,即自适应学习率。adagrad算法公式如下:
[0080][0081]
其中,θi为待优化参数,t代表每一次迭代,η代表学习率,ε一般是一个极小值,作用是防止分母为0,表示第i个参数的梯度,g
i,t
表示了前t步参数θi梯度的累加:
[0082][0083]
简化成向量形式:
[0084][0085]
随着算法不断迭代,g
t
会越来越大,整体的学习率会越来越小,只需要设置初始学习率,可以实现学习率的自我调整。
[0086]
经过优化后,可得到最优模型,之后,利用该模型即可进行短期负荷预测。
[0087]
上面结合附图对本发明的实施方式做了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1