一种基于特征挖掘的光伏发电三层筛选窃电识别方法

文档序号:25091384发布日期:2021-05-18 20:29阅读:317来源:国知局
一种基于特征挖掘的光伏发电三层筛选窃电识别方法

1.本发明属于光伏发电技术领域,涉及一种基于特征挖掘的光伏发电三层筛选窃电识别方法。


背景技术:

2.近年来随着新能源技术的发展,新能源技术已成为各国在能源领域研究的重点,在国家政策的扶植下,中国光伏发电装机保持高速增长。由于分布式光伏发电享受的补贴主要取决于自身发电量,存在用户通过一定的技术手段使得分布式光伏上网电表多计量发电量,进而获取高额补贴。目前典型的窃电方法有:光伏计量表升压法、光伏计量表升流法、市电改接法、市电整流逆变法。
3.光伏防窃电与传统的防窃电不同,不是防从电网窃电,而是防光伏电能计量表虚高。目前光伏反窃电技术仅能识别单一或若干光伏窃电行为,且对数据的要求较高,难以实际应用,亟需对光伏反窃电技术进行深入研究。


技术实现要素:

4.本发明所要解决的技术问题是提供一种基于特征挖掘的光伏发电三层筛选窃电识别方法,能提高光伏发电预测的准确率,效果好。实现对分布式光伏发电业主的有效监管,是对分布式光伏发电补贴政策的有力技术支撑。
5.发明的技术解决方案如下:
6.一种基于特征挖掘的光伏发电三层筛选窃电识别方法,包括以下步骤:
7.步骤1:提取各时间窗下光伏出力相关的气象因素趋势特征对应的气象信息数据,气象信息数据又称原始数据,对其进行挖掘,构造出多个有效特征;构造方法为:多项式特征构造和统计特征构造;
8.步骤2:将获得的气象信息数据(即原始数据)及经过特征挖掘工程处理后的特征作为输入,传送到gru

attention模型进行训练及预测,最后输出预测发电量;
9.步骤3:进行基于特征挖掘的gru

attention光伏发电三层筛选窃电识别;三层筛选识别法分为以小时为单位的实时窃电嫌疑判定,以天为单位的短期窃电嫌疑判定,以月为单位的长期窃电评估。
10.步骤1中,所述的气象因素包括辐照度、温度、湿度、风速、压强,提取各时间窗下光伏出力相关的气象因素趋势特征;对气象特征更进一步的挖掘,得到多个特征。为提高模型的训练效果及预测准确度,提取各时间窗下光伏出力相关的气象因素趋势特征,对气象特征更进一步的挖掘,经过处理后可产生136个特征。
11.所述步骤2中,将气象因素趋势特征对应的数据分为两部分,其中一部分(80%)用于训练,另一部分(20%)用于测试。
12.数据为光伏电站一年多每天每个小时4点,总计20496条。gru是一种更加简单的循环神经网络,加进了门控机制来控制信息更新的方式。在原有的基础上引入了一个更新门
来控制当前状态从历史状态中选取多少信息以及从候选状态中接受多少新信息。由于传统rnn均采用tanh和sigmoid作为激活函数,存在rnn在反向传播时产生梯度爆炸或消失的现象,因此提出了gru循环神经网络,可以有效地解决循环层自身传递的梯度爆炸或消失的问题。将经过特征挖掘工程处理后的如湿度、风速、辐照度等特征作为输入传送进gru系统,再将输出的数据送入第二层网络attention模型中,最终可输出光伏出力预测值。
13.所述步骤3中,进行实时窃电嫌疑判定的方法:
14.(1)采用早晚两小时的发电量与光伏出力模型预测发电量进行比较,早晚两小时是指7:00

9:00,17:00

19:00两个时间段;因为此时太阳处于刚升起或落下状态,对应的光伏发电量很小;但对于窃电用户来说,其窃电曲线不随气象条件变化而变化,有可能出现早晚的发电量明显高于理论计算电量的情况。当150%理论发电量≥实际发电量≥50%理论发电量时,判定正常;理论发电量是指预测的发电量;此范围之外则该分布式光伏电站在该天存在窃电嫌疑;
15.(2)对实时窃电嫌疑判定为正常的光伏电站进行短期窃电嫌疑判定,利用一天实际发电量与理论发电量进行对比,当120%理论发电量≥实际发电量≥80%理论发电量时,判定正常;此范围之外则该分布式光伏电站在该天存在窃电嫌疑;
16.(3)进行长期窃电评估:通过统计月度由前两步筛选出的光伏电站存在窃电嫌疑的天数,给出窃电嫌疑判定结果。
17.所述的气象信息数据为某光伏发电站一年中每天07:00

19:00时间段,每间隔15min记录一次所得到的数据;数据中包括功率、光照强度、现场温度、风速风向、湿度。
18.有益效果:
19.本发明公开了一种基于特征挖掘的光伏发电三层筛选窃电识别方法,即基于特征挖掘和gru

a模型的光伏发电三层筛选窃电识别方法,包括以下步骤:1)首先提取各时间窗下光伏出力相关的气象因素趋势特征,对其进行挖掘,从而构造出更多的有效特征;2)将构造好的特征群输入gru

attention模型来训练及预测,得到电站的发电功率;3)基于特征挖掘gru

attention的光伏发电评估,给出三层筛选窃电识别方法:实时窃电评估、短期窃电评估、长期窃电评估。本发明采用基于特征挖掘和gru

attention模型,解决了传统循环神经网络的梯度消失或爆炸问题,记忆能力更强,训练速度更快;特征是决定预测模型精度的核心因素,因此本发明基于特征构造的模型预测精度更高,大大提高了光伏发电窃电识别率。
20.gru是一种更加简单的循环神经网络,加进了门控机制来控制信息更新的方式。在原有的基础上引入了一个更新门来控制当前状态从历史状态中选取多少信息以及从候选状态中接受多少新信息。由于传统rnn均采用tanh和sigmoid作为激活函数,存在rnn在反向传播时产生梯度爆炸或消失的现象,因此提出了gru循环神经网络,可以有效地解决循环层自身传递的梯度爆炸或消失的问题。将经过特征挖掘工程处理后的如湿度、风速、辐照度等特征作为输入传送进gru系统,再将输出的数据送入第二层网络attention模型中,最终可输出光伏出力预测值。
21.与现有技术相比,本发明的优点为:
22.1)一种基于特征挖掘和gru

a模型的光伏发电三层筛选窃电识别方法,依据特征挖掘,预测准确度高,效果好。
23.2)gru循环神经网络,可以有效地解决循环层自身传递的梯度爆炸或消失的问题,训练速度更快。
24.3)三层筛选结构的分布式光伏窃电识别方法,逐级筛选,窃电判定可信度高,有效提高了分布式光伏窃电识别率。
附图说明
25.图1为本发明的gru

attention光伏发电模型中的gru网络结构图;
26.图2为本发明的gru

attention光伏发电模型中attention机制的自注意力模型;
27.图3为本发明的光伏发电模型预测流程图;
28.图4为本发明的中期窃电嫌疑判定流程图;
29.图5为光伏实际功率与实发辐照度关系图;
30.图6为光伏实际功率与温度关系图;
31.图7为光伏实际功率与湿度关系图;
32.图8为光伏实际功率与风速关系图;
33.图9为光伏实际功率与风向关系图;
34.图10为光伏实际功率与压强关系图;
35.图11为dis2peak与peak辐照度特征构造方法;
36.图12为实测值与预测值的电量示意图。
具体实施方式
37.一种基于特征挖掘和gru

a模型的光伏发电三层筛选窃电识别方法,包括以下步骤:
38.1)基于光伏出力相关的气象因素特征挖掘,构造出更多的有效特征,具体为:
[0039]1‑
1)针对的原始数据为我国西北地区某光伏发电站一年来每天07:00

19:00时间段,每间隔15min记录一次所得到;数据中包括功率、光照强度、现场温度、风速风向、湿度等数据。
[0040]1‑
2)光伏发电功率的主要影响因素有辐照度、温度、湿度、风速、压强等,提取各时间窗下光伏出力相关的气象因素趋势特征。
[0041]1‑
3)对气象特征更进一步的挖掘,首先需要分析哪些因素对发电量有影响,在选择模型输入变量时考虑与发电量关联性较强的作为特征进行分析。
[0042]
经过多项式特征构造和统计特征构造可产生136个特征。如dis2peak和peak辐照度特征,前者代表距离周期峰值的距离,后者代表辐照度峰值的实际值。定义dis2peak特征有效判断数据采样点在一天中的大致时刻,符合光伏数据的时间序列特性,因此将dis2peak当做一个特征参数放到光伏发电预测模型中进行训练,能够在某种程度上提高预测的准确度。
[0043]
对光伏出力有影响的因素都可以称为特征,但是在输入到模型训练前,要选的是对光伏出力影响大的特征,在特征挖掘构造时,遵循的也是这个原则。
[0044]
气象信息就是发电站所记录得到的光照强度、现场温度、风速风向、湿度等数据。
[0045]
2)将获得的气象信息数据及经过特征挖掘工程处理后的特征作为输入,经预处理
传送给gru

attention模型来训练及预测,最后输出预测发电量。
[0046]2‑
1)预处理指将数据分为两部分,留出一部分作测试。其中80%用来训练,剩下20%用作测试。
[0047]2‑
2)gru是一种更加简单的循环神经网络,加进了门控机制来控制信息更新的方式。在原有的基础上引入了一个更新门来控制当前状态从历史状态中选取多少信息以及从候选状态中接受多少新信息。它的传递公式如下所示:
[0048][0049]
z
t
=σ(w
z
x
t
+u
z
h
t
‑1+b
z
) (2)
[0050][0051]
r
t
=σ(w
r
x
t
+u
r
h
t
‑1+b
r
) (4)
[0052][0053]
其中:z
t
∈[0,1]是更新门,h
t
是当前状态,h
t
‑1是前一状态;r
t
∈[0,1]是重置门,是当前时刻的候选状态;为向量乘积符号,σ为sigmoid函数,函数形式是:tanh为双曲正切函数。由式(4)可以看出,当z
t
=0,r=1时,gru网络为简单循环网络;当z
t
=0,r=1时,h
t
只和x
t
有关,和h
t
‑1无关;当z
t
=1时,h
t
=h
t
‑1,和当前输入x
t
无关。w
z
,w
h
,w
t
是状态

状态权重矩阵;x
t
是t时刻的输入。
[0054]
attention机制从大量信息中选择一些关键信息进行处理,以简化运算,减少神经网络的运算负担。attention机制的计算可分两步,(1)在所有输入信息上计算注意力分布;(2)根据注意力分布来计算加权平均。本发明选用自注意力模型来作为输入的注意力模型。假设输入信息为x=[x1,
···
,x
n
,]∈r
d1。n
,输出信息为h=[h1,
···
,h
n
,]∈r
d1。n
,通过线性变换可以得到以下三组向量序列:
[0055][0056][0057][0058]
其中q是查询向量序列、k是键向量序列、v是值向量序列,w
q
、w
k
、w
v
分别是可学习的参数矩阵。
[0059][0060]
其中,i,j∈[1,n]为输出和输入向量序列的位置,连接权重α
ij
由注意力机制动态生成。
[0061]2‑
3)优化所述步骤2

2)提出的gru

attention光伏出力预测模型。
[0062]2‑
4)验证所述步骤2

3)优化好的光伏出力预测模型。
[0063]2‑
5)模型应用。将经过特征挖掘工程处理后的如湿度、风速、辐照度等特征作为输入传送进gru系统,再将输出的数据送入第二层网络attention模型中,最终可输出光伏出力预测值。
[0064]
3)进行基于特征挖掘和gru

attention模型的光伏发电三层筛选窃电识别;三层筛选识别法分为以小时为单位的实时窃电嫌疑判定,以天为单位的短期窃电嫌疑判定,以月为单位的长期窃电评估。具体为:
[0065]3‑
1)进行实时窃电嫌疑判定:采用早晚两小时的发电量与光伏出力模型预测发电量进行比较,当150%理论发电量≥实际发电量≥50%理论发电量时,判定正常;此范围之外则该分布式光伏电站在该天存在窃电嫌疑;
[0066]3‑
2)对实时窃电嫌疑判定为正常的光伏电站进行短期窃电嫌疑判定,利用一天实际发电量与理论发电量进行对比,当120%理论发电量≥实际发电量≥80%理论发电量时,判定正常;此范围之外则该分布式光伏电站在该天存在窃电嫌疑;
[0067]3‑
3)进行长期窃电评估:通过统计月度通过步骤3

1)、步骤3

2)筛选出的光伏电站存在窃电嫌疑的天数,给出窃电嫌疑判定结果。
[0068]
前述的步骤1

2)中,相关气象因素趋势特征图如图5

10:由此能看到各特征与光伏实际出力之间的关系。
[0069]
前述的步骤1

3)中,在功率归一化的前提下进行特征构造。温度、湿度、压强等和天气相关的预测数据都可以通过气象预报得到,但是预测辐照度就得通过图11分析获得。从图5中可以看出辐照度具有较强的周期性规律,因此构造两种特征来表示这种周期性。即dis2peak和peak辐照度,前者代表距离周期峰值的距离,后者代表辐照度峰值的实际值。然后添加了时间特征、相关因素的均值、方差等特征,以及每天白天温差特征,还有各因素差值构造,此类特征构造不仅可以增加特征的非线性性,而且可以发掘特征融合后对光伏发电功率的关系。最后添加了相关因素之间的多项式(polynomial)特征。特征说明详见附图说明。其中多项式特征的构造方法为:假设有特征a、b,则对应特征为1,a,b,a2,ab,b2;统计特征的构造方法为:假设有特征a、b,则对应统计特征为a mean,b mean,astd,b std。std表示标准差。
[0070]
具体的特征如下:
[0071][0072][0073]
前述的步骤2)中,由于传统rnn均采用tanh和sigmoid作为激活函数,存在rnn在反向传播时产生梯度爆炸或消失的现象,因此提出了gru循环神经网络,可以有效地解决循环层自身传递的梯度爆炸或消失的问题。
[0074]
前述的步骤2

3)中,训练时,模型参数的优化采用adam(adaptive moment estimation)算法。adam是一阶优化算法,可以通过连续更新迭代网络神经元节点的权重和偏置使函数值降至最优值。此算法选定gru

attention的损失函数为mse(meansquaredeorr):
[0075][0076]
式中:n为样本个数;y
i
为实际值;为模型输出值。
[0077]
前述的步骤3

3)中,当光伏电站一个月内存在窃电嫌疑总天数小于等于7天时,认为该光伏电站具有轻度窃电嫌疑,建议增长检查周期,如一个季度或半年;当光伏电站一个月内存在窃电嫌疑总天数介于7

15天之间,认为该光伏电站具有中度窃电嫌疑,应标识为近期重点监督对象;当光伏电站一个月内存在窃电嫌疑总天数大于等于15天,认为该光伏电站具有重大窃电嫌疑,建议现场稽查。
[0078]
本发明的一种基于特征挖掘和gru

a模型的光伏发电三层筛选窃电识别方法,包括以下三个部分:
[0079]
1.基于光伏出力相关的气象因素特征挖掘,构造出更多的有效特征
[0080]
特征是决定预测模型精度的核心因素,而传统模型有的仅考虑数值天气预报(numerical weather prediction,nwp)数据,有的虽然进一步在nwp数据基础上进行了天气划分,但对于气象特征还能更进一步的挖掘。因此本发明提出的特征挖掘有效提高了模型精度。
[0081]
在功率归一化的前提下进行特征构造。光伏发电功率的主要影响因素有辐照度、温度、湿度、风速、压强等,提取各时间窗下光伏出力相关的气象因素趋势特征,特征构造后共有136个组合特征。如dis2peak_辐照度、辐照度^2、辐照度+湿度、各因素平均值等。
[0082]
2.建立基于特征挖掘的gru

attention光伏出力预测模型
[0083]
由于传统rnn均采用tanh和sigmoid作为激活函数,存在rnn在反向传播时产生梯度爆炸或消失的现象,因此提出了gru循环神经网络,可以有效地解决循环层自身传递的梯度爆炸或消失的问题。结构图参见图1及图2。gru

attention模型记忆能力更强,训练速度更快,同时解决了传统循环神经网络的梯度消失或爆炸问题。
[0084]
如图3所示,建立基于特征挖掘的光伏出力预测模型包括如下步骤:
[0085]
首先模型建立。在分布式光伏发电系统运行历史信息数据库及当地气象局提供的气象信息的基础上,建立分布式光伏出力计算模型,该模型基于分布式光伏电站数据和特征挖掘。特征挖掘效果越好,模型越精确。分布式光伏出力预测模型的输入量是历史发电电站数据和其他特征数据,输出为光伏电站某时间段的出力曲线。
[0086]
其次是模型优化。在训练数据过程中,为消除某些不合理数据的影响,采样时刻与采样点发电量数据偏差不符合常理,特别是受云层影响的数据,因此需要对建立的模型进行优化,对偏差较大的样本数据进行剔除。
[0087]
然后模型验证。对于优化好的分布式光伏出力预测模型,需要检验其精度,若模型精度在可接受范围内,可进入下一步模型应用;否则需要重新进行模型优化。在该步骤中,采用adam(adaptive moment estimation)算法。adam是一阶优化算法,可以通过连续更新迭代网络神经元节点的权重和偏置使函数值降至最优值。此算法选定gru

attention的损失函数为mse(mean squared eorr):光伏功率预测的评价指标选定如下:1)r2(r

squared):2)mape(meanabsolute percentage error)相对百分误差绝对值的平均值:指标反应的是预测值和真实值的差,因此越小越好。
[0088]
最后为模型应用。输入光伏电站当地气象信息,预测获得光伏电站实时出力量。
[0089]
3.进行基于三层筛选窃电识别的窃电嫌疑判定
[0090]
由于光伏电站输出功率受气象条件影响较大,具有随机不确定性,为提高分布式光伏窃电识别率,本发明采用具有时间累积效应的光伏发电量作为判别窃电与否的依据。
[0091]
分布式光伏窃电嫌疑判定分为实时窃电嫌疑判定(以小时为单位),短期窃电嫌疑判定(以天为单位)和中长期窃电嫌疑判定(以月为单位)三层。
[0092]
进行实时窃电嫌疑判定:采用早晚两小时的发电量与光伏出力模型预测发电量进行比较,当150%理论发电量≥实际发电量≥50%理论发电量时,判定正常;此范围之外则该分布式光伏电站在该天存在窃电嫌疑;
[0093]
对实时窃电嫌疑判定为正常的光伏电站进行短期窃电嫌疑判定,利用一天实际发电量与理论发电量进行对比,当120%理论发电量≥实际发电量≥80%理论发电量时,判定正常;此范围之外则该分布式光伏电站在该天存在窃电嫌疑;
[0094]
如图4所示,长期窃电嫌疑判定检测周期为一个月为例,需要对光伏电站一个月内通过第一层和第二层检测出来存在窃电嫌疑的天数进行统计,并将计算结果求和。当光伏电站一个月内存在窃电嫌疑总天数小于等于7天,认为该光伏电站具有轻度窃电嫌疑,建议增长检查周期,如一个季度或者半年;当光伏电站一个月内存在窃电嫌疑总天数介于7

15天之间,认为该光伏电站具有中度窃电嫌疑,应标识为近期重点监督对象;当光伏电站一个月内存在窃电嫌疑总天数大于等于15天,认为该光伏电站具有重大窃电嫌疑,建议现场稽查。
[0095]
具体案例:
[0096]
以中国西部某光伏电站5月1日至5月30日的气象数据和发电量为例(采样频率为15min,记录时间为07:00

19:00),其中某5天发电量人为构造为窃电数据,以验证本文方法的有效性。将三十天的气象数据经过处理输入到gru

attention光伏出力预测模型,从而得到相应的预测值。由图12可知,实测值与预测值的电量差异大小,进而计算出两者的比值,结合三层筛选法最终判定是否有窃电嫌疑。经验证,5天窃电嫌疑数据能很好地被判定出。
[0097]
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。经实验应用,通过上述方法光伏出力预测准确度高,效果好。
[0098]
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1