一种基于改进生成对抗网络的电压暂降事件类型辨识方法与流程

文档序号:27213188发布日期:2021-11-03 15:17阅读:112来源:国知局
一种基于改进生成对抗网络的电压暂降事件类型辨识方法与流程

1.本发明涉及一种基于改进生成对抗网络的电压暂降事件类型辨识方法,属于电压暂降辨 识技术领域。


背景技术:

2.随着智能制造业的不断发展,电网中敏感用户(半导体生产、精密仪器加工等企业)的 数量不断增多,电压暂降对电网及用户造成的影响越来越严重。为缓解电压暂降对负荷侧尤 其是含有敏感负荷的重点用户带来的影响,我国多个省级电力公司已在各自服务范围内铺设 了大量的电压暂降监测装置,旨在为暂降事件的详细分析提供必要的数据支撑。
3.准确识别电压暂降事件类型,确定暂降事件主成因是解决暂降问题的基础。电压暂降主 要可分为随机性暂降和计划性暂降两类,其中,随机性暂降为短路(单相短路,两相短路及三 相短路)故障引起的暂降,而计划性暂降则是由人为操作而导致的暂降,包括大型感应电机启 动及变压器投切两种情况。
4.目前,针对电压暂降类型识别的思路主要有两种,一种是基于人工提取特征,构建暂降 样本特征矩阵,利用特征数据训练分类模型以实现暂降类型的辨识;另一种则是采用特征自 提取网络代替基于人工经验的信号处理分析,通过损失计算来不断的驱动特征自提取网络参 数的调整,提高网络对样本的自适应能力,从而减少特征提取误差对最终暂降类型辨识结果 的影响。
5.然而在实际情况中,暂降样本的分布具有极大的不平衡性(单相故障暂降的占比远高于其 他类型),并且不同季节、不同地区的暂降事件分布特性也有较大差别。这些方法虽很好的避 免了人工特征提取的误差,简化了样本的特征提取过程,但对于模型的训练需要大量的样本 数据做支撑,当样本数量分布不平衡或较少时,特征自提取网络无法对各个类型特征进行充 分的学习,暂降类型辨识的准确率也就无法得到保证。


技术实现要素:

6.本发明的目的在于针对以上问题,本发明提出一种基于改进生成对抗网络的电压暂降事 件类型辨识方法,在判别器内融合cbam模块来改善判断模型的特征自提取能力,从而提高 整个ac

gan网络的性能。
7.一种基于改进生成对抗网络的电压暂降事件类型辨识方法,所述方法包括:
8.将获取的暂降三相电压数据转换为基于空间矢量的二维轨迹曲线,得到不同暂降类型的 spm轨迹;
9.将不同暂降类型的spm轨迹输入到预先建立的辨识模型中,得到电压暂降事件的类型, 其中辨识模型中融入cbam注意力模块。
10.进一步地,将获取的暂降三相电压数据转换为二维轨迹曲线的方法包括如下步骤:
11.获取三相瞬时电压数据,并通过计算转换为二维spm波形轨迹,计算公式如下:
[0012][0013]
式中v
a
,v
b
,v
c
分别为三相电压瞬时采样数据,v
spm
表示经过空间矢量变化后的电压值;α 为运算子,α=1∠120
°

[0014]
进一步地,所述辨识模型包括生成器g和判别器d,辨识模型的建立包括在生成器g中 添加了生成样本的标签信息,用于指导生成器g的训练,同时增加样本多类型分类功能,在 判断样本“真假”的基础上实现多类型样本分类;
[0015]
在判别器d中融合注意力模块,用于聚焦各类暂降spm轨迹中的细节特征。
[0016]
进一步地,所述注意力模块包括通道注意力和空间注意力两部分网络,利用平均池化和 最大池化聚合全通道信息,产生两个不同的空间特征描述favg,fmax,然后分别经过包含一 个mlp,将结果加权后得到每个通道的参数分布权值。
[0017]
进一步地,通道的参数分布权值计算公式为:
[0018]
m
c
(f)=σ(mlp(avgpool(f))+mlp(maxpool(f)))
[0019]
式中f表示输入卷积特征,式中σ表示sigmoid函数,最大池化结果和平均池化结果的 mlp处理参数共享。
[0020]
进一步地,将通道注意力输出结果作为空间注意力的输入,对每个通道的特征矩阵中每 个位置的数据做最大池化和平均池化,然后对两个池化后的结果进行卷积降维聚合,最后通 过sigmoid函数得到空间注意力特征,则特征计算表达式为:
[0021][0022]
式中,f表示降维卷积计算,采用7
×
7的卷积核降维卷积计算,通过补0的方式使得卷积 前、后的特征矩阵大小不变。
[0023]
进一步地,在训练过程中辨识模型的损失函数由两部分组成,一是对“真假”数据源判断的 损失l
s
,二是标签类别判断的损失l
c
,表达式为:
[0024][0025]
其中p(c=c|x
real
)和p(c=c|x
fake
)分别表示对真实样本和生成样本数据标签判断正确的概 率生成器g在训练过程中优化目标函数为:
[0026]
maxl(g)=max(e[logp(c=c|x
fake
)]

e[logp(s=fake|x
fake
)])
[0027]
这里将“真假”数据源判断优化方向作取反处理,与标签判断一致;
[0028]
对于判别器g训练过程中则是对“真、假”数据源和标签类型判断的共同优化,因此对应 的目标函数为:
[0029]
maxl(d)=max(l
s
+l
c
)
[0030]
样本源和样本标签判断的结果均由判断器d输出,判断器d的性能决定着改进后的辨识 模型的总体性能。
[0031]
进一步地,所述电压暂降事件的类型包括六类,分别为:单相故障(c1)、两相故障(c2)、 三相故障(c3)、复合故障(c4)、感应电机启动(c5)和变压器投切(c6)。
[0032]
与现有技术相比,本发明所达到的有益效果:本发明提出了基于spm的暂降电压数
据转 换方法,将暂降样本数据统一规整为spm二维轨迹图片,在有效的区别了不同类型暂降特征 的同时,减少了类型辨识所需分析的数据量。
[0033]
本发明所提出的模型中判别器的特征提取网络中融合了cbam模块,相比于传统模型, 改进模型能够更准确的抓取到每个暂降样本的特征,从而提高了整个模型对暂降样本类型的 辨识能力。在不同的实际数据场景下,依然能够保持全暂降类型93%以上的辨识正确率。
附图说明
[0034]
图1是本发明融合了注意力模型的改进的辨识模型网络架构;
[0035]
图2是本发明江苏某地区暂降事件实测电压rms波形;
[0036]
图3是本发明电压暂降事件的spm轨迹;
[0037]
图4是本发明通道注意力示意图;
[0038]
图5是本发明空间注意力示意图;
[0039]
图6是本发明判别器损失函数迭代结果;
[0040]
图7是本发明判别器分类正确率;
[0041]
图8是本发明传统ac

gan模型与改进ac

gan模型间is结果比较;
[0042]
图9是本发明传统ac

gan模型与改进ac

gan模型间fid结果比较;
[0043]
图10是本发明改进ac

gan模型与传统ac

gan模型特征提取热力图对比;
[0044]
图11是本发明场景一的样本辨识情况;
[0045]
图12是本发明场景二的样本辨识情况;
[0046]
图13是本发明场景三的样本辨识情况。
具体实施方式
[0047]
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体 实施方式,进一步阐述本发明。
[0048]
如图1所示,本发明所述的基于改进生成对抗网络的电压暂降事件类型辨识方法,包括 步骤:
[0049]
步骤一,基于空间矢量的电压暂降数据转换,将获取的暂降三相电压数据转换为基于空 间矢量的二维轨迹曲线,得到不同暂降类型的spm轨迹;图2为江苏某城市暂降监测系统上 传实测数据的rms波形,采样率为12.8khz。图2(a)~(g)分别为单相故障、两相故障、三相 故障、单相演变为三相故障、两相演变为三相故障、感应电机启动以及变压器投切。由图中 可知,每条暂降事件实测数据的暂降幅值、数据长度、暂降域起止位置各不相同,并且相比 于仿真数据,实测数据包含了较多谐波,噪声、振荡等因素的干扰,加大了特征提取的难度。 因此为使得样本数据更加规整(只关注轨迹,规避采样数据长度不一和暂降域起止位置不同带 来的影响),提高特征自提取精度的同时减少数据计算量,本发明提出基于空间矢量变换(space phasor model,spm)的数据转换方法,将三相瞬时电压数据转换为二维spm波形轨迹,计算 公式如下:
[0050]
[0051]
式中v
a
,v
b
,v
c
分别为三相电压瞬时采样数据,spm变换结果如图3所示,横轴为v
spm
的实部,纵轴为v
spm
的虚部。变换结果的排列顺序与rms波形排列顺序一致。
[0052]
由图3可知,不同暂降类型的spm轨迹之间区分较为明显。未发生暂降时,spm轨迹 为标准圆。非对称情况如单相故障时,暂升相弥补了暂降相的电压幅值,其变换近似为标准 圆;两相故障时,spm轨迹畸变成了椭圆。而对称情况的三相暂降,则与正常电压幅值共同 构成了同心圆。感应电机启动及变压器投切类型暂降的spm轨迹也各自有着不同的特征。另 外,spm变换还能够很好的刻画故障暂降过程中出现的故障演变情况,单相故障演变成三相 故障和两相故障演变为三相故障的情况都包含了椭圆和同心圆的轨迹,红色阴影部分的细节 特征体现了由正常到三相短路故障的演变过程,为模型对该情况的准确辨识奠定了基础。基 于此,本发明将暂降类型共划分为6类,分别为:单相故障(c1)、两相故障(c2)、三相故障(c3)、 复合故障(c4)、感应电机启动(c5)、变压器投切(c6)。
[0053]
步骤二,基于改进ac

ga的电压暂降类型辨识模型。传统的生成对抗网络(gan)由生成 器(generator,g)和判别器(discriminator,d)两部分共同组成,顾名思义,生成器g是根据真实 的样本特征生成与真实样本近似甚至一致的样本数据,以补充数量欠缺的样本类型,使样本 分布达到平衡。判别器d是对生成样本质量的监督,判断生成样本是否与真实样本的特征一 致,以达到扩充样本数量的目的。对于生成器g来说,数据的输入只包含生成样本,因此生 成器g的目标函数为:
[0054][0055]
其中s表示数据源,x
fake
表示生成器生成的样本,p(s=fake|x
fake
)表示生成样本属于生成 样本数据源的概率,e表示期望计算。由式(2)可知,生成器g的优化目标是使得生成的样本 被判断为“假样本”的概率越小越好,当生成样本足以“以假乱真”时,优化目标完成。对于判 别器d来说,数据的输入同时包含真实样本和生成样本,其目标函数如式(3)所示:
[0056][0057]
式中,x real
表示真实样本,p(s=real|x real
)表示真实样本属于真实样本数据源的概率,其 优化目标为:无论输入的是真实样本还是生成样本,最终结果都能够给出正确的判断。gan 在训练过程中通过两者的交替优化相互博弈,最终达到纳什均衡后完成模型训练。
[0058]
进一步地,本发明提出了ac

gan辨识模型,在传统的gan生成器g中添加了生成样 本的标签信息,指导生成器g的训练,同时增加了样本多类型分类功能,在判断样本“真假
”ꢀ
的基础上实现多类型样本分类,扩展了生成对抗网络的应用范围。因此,在训练过程中 ac

gan辨识模型的损失函数由两部分组成,一是对“真假”数据源判断的损失l
s
,二是标签 类别判断的损失l
c
,公式表达为:
[0059][0060]
其中p(c=c|x
real
)和p(c=c|x
fake
)分别表示对真实样本和生成样本数据标签判断正确的概 率。对于生成器g来说,训练过程中损失函数的优化不包含真实数据,因此优化目标函数为:
数与测试样本识别正确率结果如图6、7所示:
[0076]
改进模型中加入的cbam注意力模块使得判别网络对每种暂降类型的细节特征更聚焦, 对输入图片中的特征点把握更准确,其训练误差下降速度和误差值均低于传统模型。同时, 在迭代50次后,模型的识别准确率逐渐进入稳定状态,改进模型在完成迭代的过程中正确率 始终高于传统模型。
[0077]
进一步地,为更直观的评价模型对于特征的学习能力,本发明引入了概率空间分数 (inceptionscore,is)、特征空间距离(fr
é
chet inceptiondistance,fid)来评价生成模型生成 样本的质量和多样性。
[0078]
is是生成模型最常用的评价指标之一,该指标以生成样本的标签判断概率结果为依据来 考察样本生成样本的质量和样本类型分布。计算公式如下:
[0079][0080]
其中,
[0081]
式中p(y|x)为该样本x属于各个类别的概率分布,p(y)为生成图片全体在所有类别上的边 缘分布。kl表示散度计算函数,用以衡量两个概率密度分布的距离,值越大,说明两个概率 分布的区分度越高。由公式可知,基于onehot编码设置,当模型性能较为优越时,p(y|x)向量 在所属类别维度处较为突出,其余则接近0(概率密度结果呈尖峰状),而p(y)则相反,模型性 能越好,边缘概率值越平均,因此,is的整体结果应随着训练迭代次数的增加而增大。则改 进模型与传统模型的is结果比较如下图7所示:
[0082]
进一步地,本发明利用fid来量化总体生成样本和真实样本特征分布的距离,计算公式 如下:
[0083][0084]
其中g和r分别代表生成图像和真实图像,μ
g
和μ
r
表示的是各自特征向量的均值,σ
g
和σ
r
表示各自特征向量的协方差矩阵,tr表示矩阵对角线元素求和,开根计算的结果如果为复数, 则只取实部值。由公式可知,生成样本的特征分布与真实样本的特征分布之间的距离越近, fid值越小,表明生成模型的性能越好,反之则越大。
[0085]
进一步地,如图9所示,在训练完成50次后,改进模型fid的结果为58.33,远低于传 统模型的结果,这表明改进模型的训练效率优于传统模型。其次,在200次迭代过后,传统 模型的fid值出现较大震荡,而改进模型的变化则相对平稳,由此可知,改进模型在200次 迭代后参数训练已基本完成,生成网络与判别网络的对抗也近似达到平衡,在500次训练结 束后,改进模型的fid值可达到27.2。
[0086]
作为一个实施例,本发明利用grad cam对特征提取网络重点关注的特征位置进行了特 征热力图可视化,图10是改进型与传统型对个别样本特征的提取情况对比,红色区域为网络 重点关注的区域,同时也是对样本分类的依据,其中p表示softmax输出的概率值,p_c1~p_c6 为样本预测标签,c1~c6为样本实际标签。如图所示,传统模型的特征提取网络并没有抓取 到个别暂降样本的细节特征,最终导致暂降类型判断的错误。如单相短路故障(c1)样本,传 统模型错误的关注到了标准圆内的空白区域,而改进模型则重点提取了标准圆周的特征,相 应的p值和p_c结果也证明了传统模型特征提取的偏差(改进型为0.967,
而传统型只有 0.678)。对于c3、c4类型样本,改进模型的关注重心都准确的定位在了标准圆内部的细节部 分,区分出了该类型样本与其他类型间的差别,最终得到的p值和p_c结果也与所关注的特 征细节相对应。
[0087]
根据江苏电网电压暂降监测统计可知,6种暂降类型中,短路故障引起暂降的事件所占比 例最大,其中单相短路占比超过了50%以上,相比而言两相短路以及最为严重的三相短路发 生次数较少。而计划性暂降,感应电机启动、变压器投切事件的占比约为故障总数的10%。 本发明在三种不同场景下分别对改进模型的暂降分类效果进行考察。
[0088]
场景一:暂降样本平衡分布情况
[0089]
场景一为理想情况,每种暂降类型设置140个训练样本,与60个测试样本,共1200个 样本。
[0090]
场景二:某市6月的暂降事件统计情况
[0091]
场景二为苏南某地区10kv配电系统6月份上传的暂降事件实测数据,由于6月份正处于 雷雨大风多发季节,短路故障引起的暂降事件数量大幅增加,尤其是单相短路故障的数量明 显多于其他暂降类型,各类型暂降事件的数量分布不平衡。
[0092]
场景三:某市9月的暂降事件统计情况。
[0093]
场景三为苏北某市10kv配电系统9月份上传的暂降事件实测数据,由于该时间段晴天数 量较6月份大幅增加,整体的暂降事件数几乎下降至场景二的一半。由于当地企业在大容量 电机启动时采用了限流软启动方式,很好的控制了电机启动电流的上升,使得整月的感应电 机启动导致的暂降事件仅有12例。
[0094]
三种场景的暂降训练数据分布如表1所示,最终三种场景的测试样本均与场景一的测试 样本一致。
[0095]
表1三种场景暂降训练数据分布
[0096]
样本类型场景一场景二场景三c1140476247c2140233112c314017289c41407754c51406312c61405646总计8401077560
[0097]
为避免样本数量不足或分布不均使roc轨迹出现离散锯齿状的问题,本发明采用改进型 连续roc曲线对分类结果进行评价,混淆矩阵的连续表达形式如下表2所示:
[0098]
表2改进型连续roc曲线的混淆矩阵
[0099] 正样本(实际)负样本(实际)正样本(预测)α(1

φ
+
(
·
))(1

α)(1

φ

(
·
))负样本(预测)αφ
+
(
·
)(1

α)φ

(
·
)总计α(1

α)
[0100]
其中
[0101][0102]
φ表示高斯分布函数,t表示阈值线性变化序列,分别表示正、负样本预测概率均 值,分别表示正、负样本预测概率标准差。α为正负样本平衡因子,文中取值为0.5, 避免了正负样本不平衡对roc曲线的影响,则roc曲线的横坐标,假阳性率(false positive rate, fpr),以及纵坐标真阳性率(true positive rate,tpr)的计算公式如下:
[0103]
fpr=1

φ

(
·
)
ꢀꢀꢀꢀꢀꢀ
(12)
[0104][0105]
随着概率阈值t的变化,roc结果也随之发生改变,由公式可知,模型对正类与负类判 断的概率分布越离散,相应的标准差越大,最终的roc曲线则越远离对角分割线,所反映的 分类器性能也就越好,反之,正类与负类的概率分布距离越小,则证明分类模型的性能越差, roc曲线结果越接近对角线。通常采用roc曲线下的面积值(area under curve,auc)来量化 模型对各个类型的分类结果。对于上述三种情况,改进模型的roc结果如图11~13所示。
[0106]
具体量化辨识结果如下表所示,其中auc表示roc曲线在横坐标上的积分,acc表示 该类样本的分类正确率:
[0107]
表3改进ac

gan模型的辨识结果
[0108][0109]
图11~13中各暂降类型的roc曲线轨迹均靠近(0,1)坐标点,表明正样本判断的概率值较 为集中且与负样本概率判断结果区分度明显。三种场景下,各类型暂降的auc结果均大于 0.95,辨识准确率都可维持在93%以上。改进模型针对场景三中感应电机启动暂降训练样本 极度匮乏的情况,生成的样本数据很好的弥补了对该类样本的数量,使得分类器对该类型的 特征进行了充分的学习,最终判断结果保持稳定。
[0110]
为进一步验证本发明所提方法的优越性,本发明分别采用k

svd法(方法一)、深度学习 模型融合法(方法二)、卷积神经网络法(方法三)、深度置信网络法(方法四)s变换与多维分 形法(方法五)、分别对上述三种场景进行分析,训练数据与测试数据均与前述一致(详细的 auc、acc计算结果均在附录中给出)。六种辨识方法在样本数量充足且分布平衡的场景一下 都展现了三个场景中较高的分类正确率。对于故障类型暂降,对三相电压数据分别进行逐相 分析的方法一、二、五辨识正确率都很高。相比之下方法三、四在数据处理过程中出现了一 定的信息损失,导致其辨识能力有所欠缺。
[0111]
场景二、三中数据分布不平衡的情况对现有方法的辨识稳定性都造成了一定的影
响,方 法一对于场景三中c5,分类正确率仅有48.3%,在错分样本中,原子组合包含了较多的故障 类原子,这是由于故障样本数量与c5、c6样本数据相差巨大,字典对故障模式的学习更充 分,而对c5、c6特征学习不足,字典库中的原子模式有限导致了算法对样本分解匹配的能 力有所欠缺,相比之下,方法二对暂降样本的辨识不依赖字典原子库,采用基于深度学习融 合的分类模型,识别效果较方法一有所提高。方法五采用基于s变换的信号处理方式对暂降 数据进行特征提取,以单相暂降数据为讨论对象(通常选用暂降最低相),为综合比较处理结 果,本发明综合了三相的处理结果输出最终的类型结果。该方法对单一故障暂降类型的判断 正确率较高。但在复合暂降样本的识别中,该方法不能很好地表达故障演变过程的特征,若 复合的其中一段暂降持续时间较短,特征不明显时,则该方法的辨识能力有限。本发明所提 出的改进ac

gan可以很好的适应上述三种不同的场景,测试结果均优于对比方法。
[0112]
表4与现有方法对比的结果
[0113][0114]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说, 在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为 本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1