一种融合稀疏降噪自编码网络降维和聚类的配电网台区分类方法与流程

文档序号:18742821发布日期:2019-09-21 01:59阅读:218来源:国知局
一种融合稀疏降噪自编码网络降维和聚类的配电网台区分类方法与流程

本发明涉及一种融合稀疏降噪自编码网络降维和聚类的配电网台区分类方法,属于配电网台区分类领域。



背景技术:

近年来,政府开展“煤改电”工程,将用清洁的电能消耗代替大量的燃煤燃气消耗,煤改电地区则大力推行用户接入电采暖设备减缓燃煤环境污染。伴随着电力用户各种电采暖设备的大量接入,台区负荷类型日益增多,设备接入变化速度加快,对台区变压器运行产生较大影响,产生日趋复杂、庞大、属性繁杂的配电网台区变压器运行数据,电力部门需要对数据处理分析,制定详细改造策略,从而改造升级变压器,与此同时,不同电力部门数据信息共享困难,各机构不能及时同步管理电采暖设备信息,台区主要负荷信息无从得知,即通过变压器采集的运行数据是无标签的,但是台区变压器运行过程中负载率数据序列能够在曲线变化趋势中反映出该台区主要负荷运行特性和规律,因此从负载率数据中挖掘台区负荷特性,提取有效特征,从而指导电网节能改造等工作,支持智能化业务分析与决策。

负荷辨识分类是配电网关键数据分析应用中的一个重要板块,采用传统电网物理机理的分析方法对日趋复杂的电力用户负荷数据难以建模分析,且受计算资源限制,制定不同电网规划策略会耗费大量人力。如何有效快速地从配电网多源大数据中提取知识,并以数据为驱动制定决策方案以优化电网运行,已成为当前国内外的一个研究热点。

随着计算机科学与通信等相关学科的快速发展,涌现出了一些新兴的数据处理与分析技术,这些新技术克服了目前存在的信息与资源分散、异构性严重、横向不能共享、上下级间纵向贯通困难等缺陷,因而有着广阔的应用前景。

面向需求侧的电力负荷用户分类算法研究较多,有使用K-means算法、改进K-means算法、模糊K-means、层次聚类等算法进行用户分类,也有使用基于密度的DBSCAN算法对实际负荷曲线直接聚类,直接聚类不对原始序列做处理而直接进行聚类,间接聚类是在对原始序列进行特征提取后,即降低数据维度,对特征序列进行聚类。也有建立了多维度用电特征评价指标,采用优选策略提取负荷曲线的最佳特征集,实现了用户用电行为的聚类优选。用户用电负荷数据随时间不断增长,大大增加数据分析的时间和空间复杂度,为了避免电力数据维度灾难,采用sammon映射、自组织映射、主成分分析等降维算法对原始负荷序列降维,再对降维数据集进行集成聚类,得到了有效的聚类结果。

依靠数据驱动分析配电网台区类型,是基于变压器运行时负载率数据分类的,而负载率反映出变压器在一定容量下对台区负荷运行的承受能力,台区内负荷运行特性会反映在变压器负载率数据上,因此基于变压器负载率数据的台区分类实质上是基于负荷特性分类,与面向需求侧的电力负荷用户分类应用有相似之处。类比电力负荷用户分类,序列特征维数高,时域波动较大,且容易受噪声污染,直接聚类计算复杂度大,而基于数据驱动的深度学习技术的发展,其在复杂数据的处理分析中表现了不俗的优势,其中的自编码器网络(Auto-Encoder,AE)可以对无标签数据进行特征学习和提取,从高维的原始数据中获得低维的特征表达,简化了分类工作。本发明提出一种间接聚类方法,基于深度学习领域的自编码器网络,在各网络层加入稀疏性限制,同时在输入序列数据中加入按一定概率分布的噪声,即构成稀疏降噪自编码网络(Sparse De-noising Auto-Encoder,SDAE),对台区变压器负载率高维序列数据提取特征降维,然后对特征序列进行聚类处理分析。该间接聚类方法,在降低了负载率数据维度的同时,充分提取了负载率特征,该模型具有良好的鲁棒性和抗噪性能,降低了聚类复杂度,使得聚类结果更加准确合理稳定,可为配电网台区变压器升级改造,电网规划提供有效参考。



技术实现要素:

本发明的目的在于,针对配电网台区变压器负载率数据维度过高,直接聚类效率低下的问题,提供一种新型的融合稀疏降噪自编码网络降维和聚类的配电网台区分类方法。

本方法采用深度学习领域的具有自主特征提取,数据压缩特性的稀疏降噪自编码器网络结构,对加噪的变压器负载率无标签序列数据进行无监督特征提取,通过三层加入稀疏性约束的全连接编码层对数据进行降维处理,然后通过三层解码层重构原始负载率序列,训练过程不断降低重构误差,以达到数据降维的目的,再通过K-means聚类算法对降维的负载率特征序列进行聚类分析,分类出不同台区,该方法能够自主提取负载率序列特征达到数据降维,提高聚类效率,有效分类的目的,具有一定抗噪性和泛化能力。

一种融合稀疏降噪自编码网络降维和聚类的配电网台区分类方法,该方法在数据处理层对变压器年负载率序列进行归一化、加噪操作,然后是稀疏降噪自编码模型无监督训练过程,得到降维特征序列,采用K-means聚类算法对降维特征序列聚类分析,得到煤改电台区和非煤改电台区分类结果。筛选出煤改电台区,针对煤改电台区采暖季变压器日负载率序列同样采用上述方法,分类出不同类型台区。该方法包括以下步骤:

步骤1:将台区变压器年负载率序列数据经过数据处理层进行归一化处理,并加入一定比例噪声;

步骤2:由三层自编码网络的全连接编码层(encode)对步骤1中归一化数据进行特征提取降维操作,每个隐藏层部分神经元加入稀疏性约束,再由三层自编码网络的全连接解码层(decode)对步骤2中提取的特征序列进行重构操作,在训练过程中,使得序列重构误差最小,从而获得特征降维序列。

步骤3:由K-means聚类算法对步骤4中的降维特征序列进行聚类分析。

步骤4:继续采用步骤1—步骤3所述方法,对煤改电台区日负载率序列进行降维聚类分析。

所述步骤1中数据预处理,将变压器年/日负载率序列数据做归一化处理,采用min-max标准化(Min-max normalization)/0-1标准化(0-1normalization),消除原始数据量纲的影响,解决指标之间的可比性,将数据值缩放至[0,1]之间,标准化公式如下:

其中xmax为样本数据的最大值,xmin为样本数据的最小值。

然后在归一化的样本中分别加入10%和20%比例的噪声,得到加噪负载率序列。

所述的稀疏降噪自编码网络提取降维步骤为:

步骤1:三层全连接编码层对数据处理层输入的年负载率加噪样本训练,每层部分神经元加入稀疏性约束,年负载率提取抽象特征数分别是150、75、35;

步骤2:然后通过三层全连接解码层,即编码层的逆过程,对编码层最后一层提取出的35个抽象特征进行重构训练;

步骤3:不断训练此网络,使得重构误差最小,即提取的负载率序列抽象特征最能“表征”原始数据。

步骤4:将变压器日负载率加噪样本作为该模型输入,继续采用步骤1—步骤3所述方法,只是将三个编码层抽象特征提取数即神经元个数修改为64、32、16,应用此参数的模型降维日负载率序列,提取出16个抽象特征。

所述的对特征序列进行K-means聚类,计算DBI聚类内部指标,寻找最佳聚类数,然后设置K-means聚类数目,分类出不同台区。

与现有技术相比,本发明方法具有以下的优点:

(1)本发明采用的是深度学习和聚类分析融合的技术,可以有效避免PCA等传统特征提取降维方法的局限性,提高了特征提取降维过程的抗噪和泛化能力,降低了直接聚类复杂度;

(2)在电网中,台区负荷类型日益增多,设备接入变化速度加快,对台区变压器运行产生较大影响,产生日趋复杂、庞大、属性繁杂的配电网台区变压器运行数据,电力部门数据信息共享困难,台区主要负荷信息无从得知,造成变压器运行数据是无标签的,因此从负载率数据中挖掘台区负荷特性,利用该模型自主提取有效特征,从而进行高效聚类分析,指导电网节能改造等工作;

附图说明

图1是稀疏降噪自编码器降维和聚类融合的配电网台区分类模型。

图2是稀疏降噪自编码器降维模型训练构建图。

具体实施方式

下面结合附图,对融合稀疏降噪自编码网络降维和聚类的配电网台区分类方法及其实施例作详细说明。

图1是本发明的融合稀疏降噪自编码网络降维和聚类的配电网台区分类模型。

实施例:

如图1所示,本实施例的稀疏降噪自编码器降维和聚类融合的配电网台区分类方法,搭建一个含有数据处理层、3层稀疏降噪自编码层(包括3层解码层),和K-means聚类层的一个融合模型,其中数据处理层也是整个模型的输入层,聚类层可作为整个模型的输出层。

如图2所示,本实施例模型的稀疏降噪自编码器降维模型无监督训练过程包括编码和解码两个步骤,其中编码过程给每个隐藏层部分神经元加入稀疏性约束,使得部分神经元被抑制,让负载率数据特征在网络中有效传递,让解码过程的重构操作来获得更有效更高级的表达,通过不断训练降低重构误差,来确定自编码器降维模型的每层神经元个数和学习率等超参数,使得重构代价函数最小,最终获得本发明的稀疏降噪自编码器降维模型。

基于稀疏降噪自编码器降维模型的建立步骤如下:

(1)准备变压器负载率数据:

本案例的样本数据选取某省电力公司1571台配电网台区变压器运行数据,数据通过配电精益化系统获取,数据点采样间隔15min,每日96个采样点。运行数据为功率数据,根据公式(1.1)计算每个台区每日第i(1≤i≤96)采样点负载率,日负载率序列选取采暖季某一天的1571条样本,再计算2015年9月至2016年9月一年的每日平均负载率,得到年负载率序列1571条样本数据。

其中Pi为当日第i采样点总有功功率(MW),Qi为当日第i采样点总无功功率(MVar),SN为该变压器额定容量,从变压器参数表获得。

(2)对负载率数据进行预处理:对年负载率和日负载率数据的每个样本进行归一化,加噪等预处理操作,划分训练集和测试集,数据训练批次的划分等,标准化后负载率样本矩阵为:

日负载率矩阵:n=1571、h=96维。

年负载率矩阵:n=1571,h=366维。

(3)通过稀疏降噪自编码器对负载率数据无监督预训练特征提取降维,步骤如下:

a)编码层映射:模型训练数据输入为经过加随机噪声的负载率序列通过公式(2)映射到隐藏层,经过编码层,输入层的输入可以得到n组(隐藏层神经元个数)特征激活值h,存在以下关系:

上式中,W是从输入层到隐藏层的网络连接权重,是输入的加噪数据,b是偏置,f是编码网络的激活函数,我们选择sigmoid函数。

在编码层的隐藏层(本例选取3层)加入稀疏性约束,使大多数节点被约束为零,只有少数不为零,当神经元的输出接近于1时,认为神经元被激活,当输出接近于零时,那该神经元被抑制。表示隐藏神经元j的激活值,隐藏神经元的平均激活值表示为:

在SDAE中加入额外的惩罚因子,使得隐藏神经元的平均激活值保持在一个很小的范围内。惩罚因子表示为:

其中ρ是稀疏性参数,通常是一个接近于0的较小的值。

b)解码层映射:输入映射到输出层的公式(3)如下:

是编码层到解码层的连接权重,将得到的h进行特征重构,偏置是并且权重矩阵W和满足

c)定义降维模型代价函数:

其中,β控制稀疏性惩罚因子的权重。

d)训练该模型,当步骤(c)的代价函数收敛,即达到最小且稳定时,可运用此模型对年负载率和日负载率测试集数据进行特征提取,即可取步骤(a)中公式(1.2)所示h为降维特征序列,作为K-means聚类模型的输入。

(4)变压器负载率降维特征序列聚类分析:使用步骤(3)的年负载率降维特征数据进行K-means聚类分析,在聚类结果中选取煤改电类型台区,并在日负载率特征序列中筛选出该台区类型的样本,对日负载率特征序列进行K-means聚类分析,最终分类出不同台区。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不局限于此,如降维模型中编码隐藏层可由全连接层替换为卷积池化层,解码隐藏层可替换为反卷积反池化层,即卷积自编码器网络降维。该模型还可应用到其他具有高维特征序列数据的分类中。

本发明属于配电网台区分析技术领域,一种融合稀疏降噪自编码网络(Sparse De-noising Auto-encoder,SDAE)降维和聚类的配电网台区分类方法。该方法首先通过最大最小归一化方法对配电网台区变压器年负载率序列数据进行处理,然后在年负载率数据中加入一定噪声比例,输入三层全连接编码层(encode),每层隐藏层部分神经元加入稀疏性约束,逐层训练提取特征值降维,再通过三层全连接解码层(decode)将降维序列重构出年负载率序列曲线,网络训练过程使用sigmoid激活函数,优化器使用Adam,使得重构误差达到最小值,将提取的特征序列作为K-means聚类算法输入,分类出煤改电台区和非煤改电台区,再应用该方法对煤改电台区变压器日负载率序列进行降维聚类分析,分类出不同类型台区。本发明通过数据驱动方式提取配电网台区变压器负载率序列相关特征,再使用降维特征序列聚类的间接聚类方法克服了PCA主成分分析线性降维等传统降维方法可能会丢失部分原始特征的缺点,降维模型对原始序列抗噪能力更强,泛化性能更高,再融合聚类方法降低了聚类复杂度,能够有效分类出不同台区,从而为电网规划改造提供支持。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1