基于自编码和分布式聚类相结合的用户用电特性分析方法与流程

文档序号:32443341发布日期:2022-12-06 23:02阅读:来源:国知局

技术特征:
1.一种用户用电特性分析方法,包括以下步骤:步骤1、将所有数据划分为n个区域,每个区域的数据标记为局部数据;步骤2、对各局部数据的每一条原始日负荷曲线进行校验和归一化处理;步骤3、对数据进行自编码,获得高维数据的核心数据;步骤4、对各局部数据开展自适应k-means聚类,所有的聚类中心构成该局部数据的局部模型,并传送至全局数据中心;步骤5、全局数据中心接收所有n个局部数据中心得到的局部模型,然后对其进行二次聚类,形成m个聚类中心;步骤6、根据所述局部模型和全局聚类之间的聚类归属关系,向各局部数据中心反馈最终聚类标号。2.根据权利要求1所述的用户用电特性分析方法,其特征在于,步骤2按照下式对每一条无空缺值负荷采集点的原始日负荷曲线进行标幺化处理:式中:x
t
,x
min
,x
max
,x'
t
分别为一条原始日负荷曲线中的t时刻负荷值、最小负荷、最大负荷和标幺化后的t时刻负荷值,其中1≤t≤t,t为每日总时段。3.根据权利要求1所述的用户用电特性分析方法,其特征在于,步骤3自编码为无监督学习算法,它由三层网络组成,其中输入层与输出层神经元数量相等,隐藏层神经元数量少于输入输出层,自编码机将输入的特征经过非线性变化到隐藏层上。4.根据权利要求3所述的用户用电特性分析方法,其特征在于,步骤3自编码机的训练分为编码和解码两个步骤.其中编码部分,数据x在输入层通过激活函数映射到隐藏层h,激活函数下所示:式中,ω1为编码部分的权值,b1为偏置单元;解码部分为隐藏层h还原输入数据,还原得到的数据用y表示,解码公式如下所示:式中,ω2为解码部分的权值,b2为偏置单元.自编码机的目标函数如下所示:式中,n为输入的样本个数。5.根据权利要求1所述的用户用电特性分析方法,其特征在于,步骤4对局部数据自适应k-means聚类分析的步骤如下:步骤4.1:对该局部数据中心经过处理及自编码得到数据曲线进行k取值为k
i,min
的k-means聚类分析,得到k
i,min
个聚类,并将该k
i,min
个聚类标记为未检验聚类,其中下标i表示第i条归一化电力数据曲线;步骤4.2:对该局部数据中心的未检验聚类进行检验,判断其是否满足所述聚类误差指
标b,其中,判断步骤4.1得到的第j个聚类是否满足所述聚类误差指标b,即判断该第j个聚类是否满足以下条件的约束,即式中:j为正整数且1≤j≤kmin;e
j
为第j个聚类的总代表误差;n
j
为属于第j个聚类的归一化日负荷曲线的数量;为第j个聚类的聚类中心的第t个负荷值;为属于第j个聚类的第i条归一化日负荷曲线的t时刻负荷值;步骤4.3:当步骤4.2中对一个未检验聚类进行检验的判断结果为是时,将满足所述聚类误差指标b的未检验聚类标记为已检验聚类;当步骤4.2中对一个未检验聚类进行检验的判断结果为否时,对该不满足所述聚类误差指标b的未检验聚类进行k取值为2的k-means聚类分析,使得该不满足所述聚类误差指标b的未检验聚类再次聚类划分为两个新的聚类,并将这两个新的聚类标记为未检验聚类;步骤4.4:重复步骤4.2和步骤4.3,直至该局部数据中心的所有未检验聚类均已标记为已检验聚类或者该局部数据中心的包含未检验聚类和已检验聚类的聚类总数量达到最大聚类数量k
i,max
,并将此时该局部数据中心的所有聚类均标记为该局部数据中心的局部聚类,将局部聚类的聚类中心标记为局部典型曲线。6.根据权利要求1所述的用户用电特性分析方法,其特征在于,步骤1对所有数据的划分是将数据物理存储区较近的区域划分在一起,每个局部数据的数据量相近似。

技术总结
本发明涉及一种基于自编码和分布式聚类相结合的用户用电特性分析方法,首先利用自编码对用电数据进行预处理,提取高维数据的核心数据,然后利用自适应k-means聚类算法对分布在各区域的用电数据进行局部聚类分析,提取各局部数据的典型负荷曲线,构建局部模型;然后利用传统聚类算法对获取的局部模型进行二次聚类分析,获取全局的典型负荷曲线,构建全局模型;最后向局部数据中心反馈全局聚类结果,实现全局聚类分析。解决用户用电数据体量大、分布广的问题,达到快速、全面提取特征数据的目的。目的。目的。


技术研发人员:王庆彪 雷光远 尹鹏 张涛 高志伟 唐永聪 吕根 尹海丞 王明昊 舒可心 梁海深 梁特 张樱譞 李云双 张凯 李云秀 葛磊蛟 尚继伟 于惟坤 穆九鹏
受保护的技术使用者:国家电网有限公司
技术研发日:2022.08.17
技术公布日:2022/12/5
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1