本发明涉及低压配电网拓扑结构校验,具体是涉及一种基于vae和lstm的低压配电网拓扑结构异常检测方法、装置及系统。
背景技术:
1、电力公司通常使用gis系统记录、维护配电网设备的地理坐标及其拓扑连接关系。低压用户由于现场接线复杂、数据流大、因负荷不均衡导致运行方式改变、户变关系变动较多、原始数据缺失和质量较差,缺乏有效手段校核人工录入的数据等问题,造成了计算机系统中配电网拓扑数据的错误。针对用户所属台区或配变所属馈线记录错误问题,专门组织人员实地巡测,耗费大量人力物力,准确性也不高。因此,研究低压配电网拓扑结构校验技术有很大的必要性。
2、目前现有的低压配电网拓扑结构校验方法中,多是从高级量测体系(advancedmetering infrastructure,ami)中获取待校验台区用户最近一段时间的电压序列数据,通过计算数据之间的相关系数来度量不同用户电压曲线之间的相似性。
3、在中国发明专利cn201911100635.8中公开了一种基于改进k值聚类算法的低压配电网拓扑校验方法及系统,对低压用户电压数据进行基于数据点密度的噪声处理产生高密度数据集,(计算每个数据结点到其余结点的欧氏距离的距离数集,若其值大于平均值则判断为噪声数据进行删除,否则加入高密度数据集d中;)在高数据密度集中采用自适应k值选择算法,初始设置k值为2,将欧式距离最大的2条边作为初始聚类中心,根据初始聚类中心,以皮卡尔系数计算其余数据点与聚类中心的相似系数,将相似系数大于相似系数阈值作为归类依据完成聚类d’。在其余初始中心中对剩余的高密度数据d-d'进行聚集完成初始聚类。若存在一个初始聚类中心没有分配到数据点或者高密度数据集中数据点聚类后并未完全分配,则增加k值得新的初始聚类中心,迭代计算至高密度数据中数据全部被分配得到正确的台区分类数据,实现对低压拓扑结构进行校验。
4、在中国发明专利cn202010431318.0也公开了一种基于环域离群点检测的低压拓扑结果校验方法,通过计算台区表计的电表功率突变量数据,使用均值漂移聚类算法形成台区总表、分支表箱和用户电表隶属关系消除量级差距的影响,利用皮卡尔相关系数作为相关性度量来衡量用户间电压曲线的相似性,从一个随机中心点开始,将与其距离小于r的数据点记为新集合,将新集合概率加1得加和向量,中心向加和向量方向移动迭代直至集合向量收敛,其最终向量值和其余聚类的向量值距离若小于阈值,则将其集合加入其余聚类集中,否则形成新的聚类集。重复上述步骤直至所有点均被标记访问,将实际的拓扑结构与校验后的拓扑结构进行对比分析,找出校验错误的局部拓扑进行相关研究。
5、在上述两种拓扑校验算法中,均采用基于邻近度的异常检测算法,但是随着数据维度的升高,基于邻近度的异常检测计算复杂度和时间复杂度增加,难以适应大数据计算的要求。低压用户电压用户是一种时间序列数据,传统的邻近算法直接用于异常检测会忽略某些数据特征并且受数据噪声影响大。
技术实现思路
1、本发明的目的在于提供一致基于vae-lstm的低压配电网拓扑结构异常检测方法、装置及系统,以解决低压配电网拓扑校验中检测结果受噪声影响大,难以适用于大数据计算和检测精度不高的技术问题。
2、为实现上述目的,本发明采取的技术方案如下:
3、本发明提供了一种基于vae-lstm的低压配电网拓扑结构异常检测方法,其包括如下步骤:
4、步骤1、收集一个台区内台区用户的历史正常低压时序数据、历史异常低压时序数据,对用户低压数据进行数据预处理;将历史数据按预设的比例分割为训练集、测试集和验证集,其中训练集和验证集中均为用户的历史正常低压时序数据;
5、步骤2、建立vae-lstm模型;
6、步骤3、将训练集输入基于vae-lstm的模型中进行训练,得到训练后的模型;
7、步骤4、将验证集输入vae-lstm模型对模型进行优化,将优化后的模型放入收集终端中;
8、步骤5、对于后续接受的数据,输入模型进行测试,若模型数据的数据与原始数据的差值超过阈值,则认定为异常数据,并将异常检测的结果输出至前端。
9、进一步的,所述步骤1中,设定时序窗口大小固定为l,对用户电表的电压时序数据取n段长度为l的序列构成模型输入数据:x={x1,x2,...,xn},每次都提取n段长度为l的电压时序数据构成数据集,数据集中按照设定比将对历史数据划分为训练集、验证集和测试集,其中,训练集和验证集中数据只包括正常的低压用户电压时序数据。
10、进一步的,所述步骤1中,低压数据进行数据预处理步骤包括:
11、对低压时序数据进行归一化处理:i从1到n遍历生成各个ri,r={r1,r2,...,rn}为生成的归一化序列:
12、
13、fi=fi-1-β(fi-1-max(xi)+min(xi))
14、
15、其中,参数α,β为相邻时间序列的关系因子,参数d和f分别为基线校正和比例因子,在归一化过程中自适应变化。在初次训练模型中,对两个参数遍历搜索找到最佳的参数值,r={r1,r2,...,rn}为生成的归一化序列;
16、在生成的归一化序列组成的数据集中按照一定比例分割为训练集和验证集和测试集,其中训练集和验证集只包含历史正常的低压时序数据,测试集中包含历史异常的低压时序数据。
17、进一步的,所述步骤2中,建立vae模型提取短窗口内电压时序数据的局部特征和建立lstm模型提取长时依赖关系;将第i个窗口的编码作为一个低维的隐变量输入,输入到lstm模型中,然后预测下一个隐变量,再经过vae解码器形成重建窗口数据,通过计算重构误差作为异常检测的分数。
18、进一步的,所述vae模型包括3层神经网络,即输入层、隐层和输出层;其中输入层到隐层是一个编码器,以n个连续的局部窗口电压时序数据r={r1,r2,...,rn}作为输入,通过编码器映射到潜在空间用低维的隐变量表示;从隐层到输出层是一个解码器,解码器通过隐层中的隐变量重构输入形成与输入时序电压数据r逼近的数据x’作为输出;
19、在编码和解码过程中,通过编码器得到输入的时序电压数据的隐变量分布参数φ、θ,再从n(0,1)中随机取很小的数ε,把随机数ε联合隐变量分布参数φ、θ,得先验概率分布pθ(z),然后根据条件概率分布函数pθ(z|v)解码得到重构的时序电压数据。
20、进一步的,所述lstm模型由四个内置的交互层组成,其中:
21、第一个交互层为遗忘门,确定和删除上一层隐藏层输出不需要的信息;遗忘门ft计算方法为:
22、ft=σ(wf·[ht-1,xt]+bf)
23、式中ft表示遗忘门,xt为当前节点信息,ht-1为历史隐藏信息,wf为遗忘门的权重矩阵,bf为遗忘门偏置量,σ(·)表示sigmoid函数;
24、第二个交互层称为输入门,通过对遗忘门中对上一层信息进行取舍后,与当前网络输入信息的乘积来控制输入门it:
25、it=σ(wi·[ht-1,xt]+bi)
26、式中it为输入门,wi为输入门的权重矩阵,bi为输入门偏置量;
27、第三个交互层称为记忆门,有效记忆历史输入值,通过对输入门中的数据,利用tanh函数将信息进一步更新,保存在记忆门中:
28、
29、
30、式中ct-1为前一时刻的单元状态,ct为当前单元状态,wc为记忆门权重矩阵,bc为记忆门偏置量,tanh(·)表示双曲正切函数,符号表示向量对应分量相乘得到一个新的向量;
31、第四个交互层称为输出层,输出门通过sigmoid函数判断神经元状态是否输出从而得到输出门ot:
32、ot=σ(wo·[ht-1,xt]+bo)
33、式中wo为计算输出门的权重矩阵,bo为输出门偏执量。
34、进一步的,所述步骤3中,输入训练集中时序电压数据,采用最小化重构误差算法对模型进行训练确定参数,获得训练后的vae-lstm模型;目标损失函数为:
35、l(φ,θ;x)=-dkl(qφ(zk|xk)||pθ(zk)+eq[logapθ(xk|zk)]
36、式中x表示数据集,qφ和pθ分别表示lstm-vae模型的编码器网络和解码器网络;φ和θ对应编码器和解码器网络的参数;dkl是正则化项,可使qφ(zk|xk)向标准正态分布看齐;是根据xk推导出zk的一个后验概率,pθ(zk)为zk的先验概率;eq是期望的自编码重建,是数据重构的损失函数。
37、进一步的,所述步骤4中,利用验证集中时序电压数据对模型进行优化;利用最大化elob对vae模型优化参数φ、θ:
38、elbo=eq(z|x;φ)[logap(x|z)-logq(z|x;φ)]
39、maxθ,φedeq(z|x;φ)[logap(x,z;θ)-logq(z|x;φ)]
40、式中x表示数据集,p(x|z)为先验概率,p(x,z;θ)为后验概率,q(z|x;φ)为变分分布;
41、在vae模型优化后,利用最小化重构误差对lstm模型优化,让lstm模型取序列中第一个k-1个隐函数分布,并预测下一个k-1个隐变量;
42、
43、式中表示输入的低压用户时序序列,为vae-lstm模型重建输出的用户电压时序序列预测。
44、通过最小化隐变量的预测误差来优化lstm模型参数,即
45、进一步的,所述步骤5中,在构建重构误差时,若输入样本为r={x1,x2,...,xn},经过vae-lstm重建的结果为x'={x1',x'2,...,x'n},则重构误差e:
46、
47、若重构误差e超过了预先设定的阈值,则判定该低压用户的时序数据属于异常数据。
48、本发明还提供了一种基于vae-lstm的低压配电网拓扑结构异常检测系统,其包括:
49、收据收集与处理模块,用于收集一个台区内台区用户的历史正常低压时序数据、历史异常低压时序数据,并对用户低压数据进行数据预处理;将历史数据按预设的比例分割为训练集、测试集和验证集,其中训练集和验证集中均为用户的历史正常低压时序数据;
50、模型构建模块,用于构建vae-lstm模型;
51、模型训练模块,将训练集输入基于vae-lstm的模型中进行训练,得到训练后的模型;
52、模型优化模块,将验证集输入vae-lstm模型对模型进行优化,优化后的模型放入收集终端中;
53、数据验证模块,用于将数据输入模型进行测试,若模型数据的数据与原始数据的差值超过阈值,则认定为异常数据,并将异常检测的结果输出至前端。
54、本发明还提供了一种基于vae-lstm的低压配电网拓扑结构异常检测装置,,所述装置包括存储器和处理器;
55、所述存储器,用于存储计算机程序;
56、所述处理器,用于当执行所述计算机程序时,实现所述的基于vae-lstm的低压配电网拓扑结构异常检测方法。
57、本发明还提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现所述的基于vae-lstm的低压配电网拓扑结构异常检测方法。
58、本发明的有益效果是:本发明克服了低压配电网拓扑校验中检测结果受噪声影响大,难以适用于大数据计算和检测精度不高的问题。其通过使用同一台区低压用户电压时序数据作为输入数据,可以更加准确检测出异常数据,对于不同台区用户电压数据的异常检测有较高的鲁棒性。