一种基于数据挖掘的户变关系辨识方法与流程

文档序号:29045583发布日期:2022-02-25 21:57阅读:241来源:国知局
一种基于数据挖掘的户变关系辨识方法与流程

1.本发明属于电力电子技术领域,尤其涉及配电网低压台区户变关系辨识模型的建立。


背景技术:

2.配电网作为电力输送的最后环节,长期存在拓扑缺失、错误的情况,随着配电网中可调控资源的增加,正确的户变关系模型对台区的在线管理显得愈加重要。而依靠人工的方式进行排查不仅仅成本高,对于台区复杂的接线与节点环境效率低。而配电物联网的建设使得用户的电能数据可以在线采集,馈线处也安装了更多的监测设备,为基于数据的方式研究配电网拓扑提供了条件。
3.而户变关系辨识属于低压配电网拓扑识别问题中的子问题,由于配电网不同电压等级的规划设计与量测信息完整度不同,低压配电网的拓扑辨识问题按照研究对象可以分为以下几类:台区挂接的10kv馈线识别,10kv的量测较多,此方面研究倾向于检验挂接开关状态;户变关系识别,校验用户所属台区,一般表现为个别台区出现负损现象,以及低压用户所属馈线、相位识别。现有识别方法上主要分为两类:注入信号方法与数据分析法。注入信号法通过在网络中安装专门的设备注入谐波或无功功率等信号,在相邻节点处读取信号的特征以实现联通性识别,需要安装主动监测装置;而现有数据分析的方式通过智能电表采集的电压、功率数据分析用户间的相关性,实现户变关系辨识,数据辨识。


技术实现要素:

4.针对现有技术存在的问题,本发明考虑到低压台区量测信息不足、用户节点与馈线有明确的层级关系,提供了一种基于数据挖掘技术的户变关系辨识方法。为解决上述技术问题,本发明采用了以下技术方案:一种基于数据挖掘的户变关系辨识方法,包括以下步骤:
5.步骤s1,采集台区下各层级设备数据,所述各层级设备数据包括变压器处总表、馈线监测单元ltu与用户处设备的有功电量、无功电量、电压幅值和有功功率;步骤s2,以电压波动相似度作为距离标准,采用dbscan聚类算法对台区内设备进行聚类算法处理,形成相应的聚类中心和噪声点,并将聚类中心和噪声点分别标记为本台区用户设备和疑似非台区用户设备;
6.步骤s3,首先将标记为本台区用户设备的电量作为整体,然后提取疑似非台区用户设备电量并与本台区用户设备电量进行组合,比较组合后的电量与本台区总体消耗电量的相关程度,进而对提取的疑似非台区用户设备是否为本台区用户设备进行判断确认。
7.作为优选方案,步骤s2所述dbscan聚类算法具体步骤包括:
8.首先,采用电压波动相似度值dist作为各个节点间的距离,并设置与中心点的距离参数e,以及距中心距离为e的空间内点的数量的阈值minpts,然后导入各节点间电压波动相似度的(电压时间序列)数据集;所述各个节点间的距离dist通过式(1)计算获得:
[0009][0010]
式中,dist为两个设备节点间电压波动相似度值,sim为两个向量a和b的夹角余弦值,取值范围在-1~1之间,ai和bi分别为向量a和b的各维度分量,n为向量a和b拥有的维度分量数量;
[0011]
然后,任选数据集中一点统计其e邻域内数据点数n,并与minpts进行比较,如果当n≥minpts时,则将其标记为异常点;否则,将该点标记为高密度点,并对其e邻域内所有点进行相同操作;
[0012]
最后,根据密度可达关系最大化形成聚类,并充分扩展样本空间,直至每个点被访问后,输出聚类结果。
[0013]
作为优选方案,步骤s3采用apriori数据挖掘算法,具体包括以下步骤:
[0014]
(1)将本台区用户设备作为整体,并从步骤s2得到的疑似非台区用户设备中提取任意数量项用户设备,并与本台区用户设备整体进行组合,得到组合t,t={s1,s2,l,sk,l,sn},sk为第k个用户设备s的电量,n为组合t中用户设备个数,称组合t为n项集;进而得到包含不同数量用户设备的组合t
i,j
的数据集d,d={t
1,1
,t
1,2
l t
1,n
,t
2,1
,t
2,2
l t
2,n
l t
i,j
l t
n,n
},t
i,j
为数据集d下的子集,表示包含i个用户设备的第j个组合,n为所有用户设备总个数;
[0015]
不同项集t组合进而得到数据集d,d={t
1,1
,t
1,2
l t
1,n
,t
2,1
,t
2,2
l t
2,n
l t}
[0016]
进而得到不同项数的n项集tn的数据集d,d={t1,t2,l tk,l,tn},数据集d下的任何子集x,若|x|=k,因此称集合x为k项集;
[0017]
(2)首先,获取初始条件:根据下式(2)的电量上限约束条件,从数据集d中得到所有满足该条件的1项集l1,l1={t
1,1
,t
1,2
,l t
1,k
,l,t
1,p
},p≤n;
[0018]al,k
<λa
l
ꢀꢀꢀ
(2)
[0019]
式中,a
l,k
为馈线l下第k个用户设备的电能,a
l
为馈线l输送的总电能,λ为馈线l的线损系数;
[0020]
(3)对l1中子集和进行两两组合,如果则将两者的元素进行合并,得到新的子集c2,
[0021]
(4)如果c2中子集t
2,k

任何一个1项集不在l1中或不满足公式(3)的约束,则将t
2,k

从c2中删除得到新的集合l2,,
[0022]
式(3)中,a
l,j
为馈线l下第j个用户设备的电能,a
l
为馈线l输送的总电能,λ为馈线l的线损系数;
[0023]
(5)假设k-1项集为l
k-1
,将l
k-1
组合中子集和进行两两组合,如果满足的条件,则将两者的元素相加,得到新集合ck,
[0024]
(6)如果ck中的子集t
k,h

的任何一个子k项集不在lk中或不满足公式(4)的约束条件,则将t
k,h

从ck中删除,从而得到lk,lk={t
k,1
,t
k,2
,l,t
k,q
},
[0025][0026]
式中,a
l,j
为馈线l下第j个用户设备的电能,a
l
为馈线l输送的总电能,λ为馈线l的线损系数;
[0027]
(7)重复步骤(5)和(6)直到生成新的项集为空,得到所有项集l1~lk,停止运算;
[0028]
(8)对得到的l1~lk数据集进行扫描,删除不满足公式(5)下限约束条件的数据集,从而得到满足所有电能约束条件的从属节点集;
[0029][0030]
式中,a
l,j
为馈线l下第j个用户设备的电能,a
l
为馈线l输送的总电能,λ为馈线l的线损系数;
[0031]
(9)最后,对步骤(8)得到的从属节点集设备的电量按公式(1)进行余弦值计算得到夹角余弦值sim,并设置最小余弦相似度阈值minsim,按下式(6)进行比较:
[0032]
sim>minsim
ꢀꢀ
(6)
[0033]
式中,sim为从属节点集中设备的电量的夹角余弦值,minsim为设置的最小余弦相似度阈值;
[0034]
符合上式(6)的组合为满足强相关且相似度最大的组合方案,即得到正确的户变从属关系关系。
[0035]
作为优选方案,步骤(9)中国所述最小余弦相似度阈值minsim的取值范围为0.8《minsim《1.0。
[0036]
作为优选方案,所述馈线l的线损系数为台区存在分布式电源时的综合线损系数。
[0037]
作为优选方案,所述与中心点的距离参数e为0.050~0.060,距中心距离为e的空间内点的数量的阈值minpts为3。
[0038]
有益效果:与现有技术相比,本发明基于台区内节点的电压波动相似特点,利用dbscan算法聚类出疑似的不属于目标台区的节点;其次基于上下游设备的电能相似性确认疑似节点是否属于目标台区,采用apriori算法生成符合约束条件的台区从属节点集,再使用余弦相似度判别得到最可能的户变从属结果。因此,本发明通过电压相似性标记疑似非本台区节点,辨识效率大幅提高,且无需现有配电网额外安装检测装置,更利于推广,通过
实施例验证,本发明具有更高的户变关系辨识准确率。
附图说明
[0039]
图1为本发明实施例380v低压配电网结构示意图;
[0040]
图2为本发明所述台区的设备电压波动规律相似曲线对比示例图;
[0041]
图3为本发明所述dbscan聚类算法的原理效果图;
[0042]
图4为本发明所述dbscan聚类算法的逻辑流程图;
[0043]
图5为现有技术中基于最小误差平方和(sse)标准的样本判断误差统计图;
[0044]
图6为本发明所述基于余弦相似度标准的样本判断误差统计图;
[0045]
图7为本发明所述基于数据挖掘技术的户变关系辨识方法的流程图。
具体实施方式
[0046]
下面结合附图和具体实施例,进一步阐明本发明。应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本技术所附权利要求所限定的范围。
[0047]
本发明提出的基于数据挖掘技术的户变关系辨识方案,首先基于台区内节点的电压相似性标记出疑似非本台区的设备,其次对疑似节点的电能曲线与台区内节点组合并结合变压器侧数据进行相关性分析得到确定的户变从属关系。最后,通过实施例实测台区数据为案例,验证了算法的可行性和准确率。
[0048]
将本发明应用在380v低压配电网中用户与配电台区的从属关系的识别,电网在380v的构造不同于高压、中压配电网存在环形、花瓣式结构与多电源供电,而是以放射性结构与树干型为主,在这种结构下,潮流存在确定的流动方向,存在明确各节点之间的从属关系的客观条件。本发明基于能量守恒,台区馈线所属节点消耗的电能和加上线损等于馈线输送的电能;同一台区内设备的电压信号在考虑有一定的衰减时,其电压波动曲线十分相似,而不同台区的设备之间的电压波动曲线就存在较大的差异,如图2所示可知:属于同一台区的设备电压波动规律相似,不同台区间电压波动去向存在较大差异。本发明在考虑电压波动的相关性对疑似不属于本台区的设备进行筛选,将其设为待处理检查的疑似项,然后通过apriori算法挖掘频繁项集与关联规则的数据最终确认正确的户变从属关系,相对于采取遍历所有组合并筛选出符合约束条件的方式,需要扫描种,这种方法会产生许多明显无意义的组合,需要多次扫描数据库且算法随着网络规模的增大复杂度呈阶乘级别的上升,本发明采用聚类和apriori算法大幅提高了辨识效率。基本步骤包括:
[0049]
步骤s1,采集台区下各层级设备数据,如图1所示,低压配电网中可观测到的数据分别为变压器处总表、馈线监测单元(ltu)与用户处的有功电量a(kw
·
h)、无功电量q(kvar
·
h),电压幅值v(v),有功功率p(w)。
[0050]
步骤s2,以电压波动相似度作为距离标准,采用dbscan聚类算法对台区内设备进行聚类算法处理,形成相应的聚类中心和噪声点,并将聚类中心和噪声点分别标记为本台区用户设备和疑似非台区用户设备。相对现有技术中聚类算法的距离采用欧拉距离,本发明采用电压波动相似度作为距离标准,解决了传统欧拉距离进行度量是无法较好的反应电
压波动的相似性,同时具有计算效率更高的优点。如图4所示,具体步骤包括:
[0051]
首先,采用电压波动相似度值dist作为各个节点间的距离,并设置与中心点的距离参数e,以及距中心距离为e的空间内点的数量的阈值minpts,然后导入各节点间电压波动相似度的(电压时间序列)数据集;所述各个节点间的距离dist通过式(1)计算获得:
[0052][0053]
式中,dist为两个设备节点间电压波动相似度值,sim为两个向量a和b的夹角余弦值,取值范围在-1~1之间,ai和bi分别为向量a和b的各维度分量,n为向量a和b拥有的维度分量数量;
[0054]
然后,任选数据集中一点统计其e邻域内数据点数n,并与minpts进行比较,如果当n≥minpts时,则将其标记为异常点;否则,将该点标记为高密度点,并对其e邻域内所有点进行相同操作;
[0055]
最后,根据密度可达关系最大化形成聚类,并充分扩展样本空间,直至每个点被访问后,输出聚类结果。
[0056]
步骤s3,首先将标记为本台区用户设备的电量作为整体,然后提取疑似非台区用户设备电量并与本台区用户设备电量进行组合,比较组合后的电量与本台区总体消耗电量的相关程度,进而对提取的疑似非台区用户设备是否为本台区用户设备进行判断确认。具体而言:
[0057]
(1)将本台区用户设备作为整体,并从步骤s2得到的疑似非台区用户设备中提取任意数量项用户设备,并与本台区用户设备整体进行组合,得到组合t,t={s1,s2,l,sk,l,sn},sk为第k个用户设备s的电量,n为组合t中用户设备个数,称组合t为n项集;进而得到包含不同数量用户设备的组合t
i,j
的数据集d,d={t
1,1
,t
1,2
l t
1,n
,t
2,1
,t
2,2
l t
2,n
l t
i,j
l t
n,n
},t
i,j
为数据集d下的子集,表示包含i个用户设备的第j个组合,n为所有用户设备总个数;
[0058]
不同项集t组合进而得到数据集d,d={t
1,1
,t
1,2
l t
1,n
,t
2,1
,t
2,2
l t
2,n
l t}
[0059]
进而得到不同项数的n项集tn的数据集d,d={t1,t2,l tk,l,tn},数据集d下的任何子集x,若|x|=k,因此称集合x为k项集;
[0060]
(2)首先,获取初始条件:根据下式(2)的电量上限约束条件,从数据集d中得到所有满足该条件的1项集l1,l1={t
1,1
,t
1,2
,l t
1,k
,l,t
1,p
},p≤n;
[0061]al,k
<λa
l
ꢀꢀ
(2)
[0062]
式中,a
l,k
为馈线l下第k个用户设备的电能,a
l
为馈线l输送的总电能,λ为馈线l的线损系数;
[0063]
(3)对l1中子集和进行两两组合,如果则将两者的元素进
行合并,得到新的子集c2,
[0064]
(4)如果c2中子集t
2,k

任何一个1项集不在l1中或不满足公式(3)的约束,则将t
2,k

从c2中删除得到新的集合l2,,
[0065]
式(3)中,a
l,j
为馈线l下第j个用户设备的电能,a
l
为馈线l输送的总电能,λ为馈线l的线损系数;
[0066]
(5)假设k-1项集为l
k-1
,将l
k-1
组合中子集和进行两两组合,如果满足的条件,则将两者的元素相加,得到新集合ck,
[0067]
(6)如果ck中的子集t
k,h

的任何一个子k项集不在lk中或不满足公式(4)的约束条件,则将t
k,h

从ck中删除,从而得到lk,,
[0068]
式中,a
l,j
为馈线l下第j个用户设备的电能,a
l
为馈线l输送的总电能,λ为馈线l的线损系数;
[0069]
(7)重复步骤(5)和(6)直到生成新的项集为空,得到所有项集l1~lk,停止运算;
[0070]
(8)对得到的l1~lk数据集进行扫描,删除不满足公式(5)下限约束条件的数据集,从而得到满足所有电能约束条件的从属节点集;
[0071][0072]
式中,a
l,j
为馈线l下第j个用户设备的电能,a
l
为馈线l输送的总电能,λ为馈线l的线损系数;
[0073]
(9)最后,对步骤(8)得到的从属节点集设备的电量按公式(1)进行余弦值计算得到夹角余弦值sim,并设置最小余弦相似度阈值minsim,按下式(6)进行比较:
[0074]
sim>minsim
ꢀꢀꢀ
(6)
[0075]
式中,sim为从属节点集中设备的电量的夹角余弦值,minsim为设置的最小余弦相似度阈值;
[0076]
符合上式(6)的组合为满足强相关且相似度最大的组合方案,即得到正确的户变从属关系关系。
[0077]
以下将本发明方法应用在江苏仪征某地进行实测数据进行算例分析,本算例具有图1所示台区结构,具有变压器、ltu(馈线监测单元)、用户三级分布,其中节点1为变压器出
线节点,节点2,3,4为ltu节点,节点5~15为用于负荷节点,节点16~19为非本台区干扰节点,拓扑从属关系如下表1所示。
[0078]
表1台区从属关系对照表
[0079][0080]
首先,各节点数据没15分钟采集一次,每组数据96点(即一日数据),共准备10组数据。
[0081]
基于dbscan算法的疑似用户筛选,设置参数minpts=3,即每一簇最具有三个节点。设置e分别为0.05、0.055、0.06,数据的聚类结果如表2~4中所示。
[0082]
表2聚类结果(e=0.05)
[0083][0084]
表3聚类结果(e=0.055)
[0085][0086]
表4聚类结果(e=0.06)
[0087][0088]
由表2可以看出,当设置e为0.05时,划分结果分为了三个簇,疑似的噪声点中存在部分本属于台区的误判,但是非本台区的设备全部都标记为疑似。当e为0.055时,标记的疑
似点恰好都为非本台区的设备。当e为0.06时,标记的疑似节点没有误判,但是存在非本台区的节点没有标记为疑似的问题,这回导致下一步确认的误判。所以在聚类筛选这一步,e值应该选的适当小一点,虽然会将一些属于本台区的设备标记为疑似点,但是能够在下一步的相关性分析中得到确认。
[0089]
进一步的,基于节点电量相关性对疑似点进一步进行户变关系确认,如图6所示,本发明使用余弦相似度判断标准后,正确率达到97.8%,相当于现有技术中采用最小误差平方和(sse)标准,节点误判明显得到下降。
[0090]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1