本发明涉及电力系统领域,特别是涉及一种新型电力系统负荷曲线聚类方法。
背景技术:
随着智能电网技术的发展,各种先进量测装置在电力系统中得到了广泛的应用。电力系统的发、输、配、用电各个环节都产生了海量的数据。如何从海量的电力数据中提取有价值的信息是当前电力系统的研究热点。在电力市场中,售电商需基于用户的分时用电行为特点实行差异化营销,以反应日时间尺度上不同时段的电能成本差异。然而电力用户数目巨大,难以逐用户制定营销规则,需根据用户的用电行为特点进行分类处理。用户的负荷曲线反应了用户的用电行为习惯,通过对负荷曲线进行聚类,可以了解用户的用电行为模式,进而帮助电力供应商细化营销策略。
传统的电力系统负荷分类方法是基于负荷曲线的欧式距离,采用Kmeans、模糊C均值、层次聚类法算法实现。采用负荷曲线全维度的欧式距离进行聚类的优点是考虑负荷曲线全部时段的数值,具有最全面的信息。但上述方法也存在不足,采用欧氏距离的实质是几何平均距离的相近性,不能充分保证时间序列的形态或轮廓的相似性。且上述方法易受极端值及噪声影响。实际工程中常提取一些指标来表示负荷的形态信息,如负荷率,峰谷差率,峰期负载率,谷期负载率等。这些指标能反映出工程实际中所关注的用电量信息,比如峰谷用电信息以及不同时段的用电特性等。负荷聚类时将负荷特性指标考虑进来能够使负荷曲线分类更加合理。
针对现有技术的不足,本发明将基于全维度负荷曲线聚类可以考虑负荷曲线的细节信息以及负荷特性指标考虑负荷形态的信息的优点结合,提出了一种新型电力系统负荷曲线聚类方法。
技术实现要素:
有鉴于此,本发明的目的是提供一种新型电力系统负荷曲线聚类方法,第一步采用近邻传播算法进行初步聚类,第二步基于负荷特性指标采用kNN算法进行二次分类,该方法算法更加稳定,分类更加准确。
本发明采用以下方案实现:一种新型电力系统负荷曲线聚类方法,具体包括以下步骤:
步骤S1:从监测控制和数据采集系统获取待分类的负荷或变压器5天以上的工作日的日负荷曲线有功功率数据;
步骤S2:对步骤S1得到的日负荷曲线有功功率数据,对于每个负荷或者变压器在每个时刻分别取所有工作日的平均值作为用户典型负荷曲线;
步骤S3:对步骤S2得到的用户典型负荷曲线进行标准化处理,采用极大值标准化方法,即pij=pij/pimax,式pij中为用户i第j个时段的功率,pimax为用户i最大用电功率;
步骤S4:采用近邻传播算法对用户典型负荷曲线进行聚类,得到初步的分类结果;
步骤S5:计算用户负荷形态特性指标,对每个用户负荷形态特性指标采用min-max标准化处理得到标准化的负荷形态特性指标。
步骤S6:基于步骤S5得到的标准化的负荷形态特性指标,对步骤S4的初步的分类结果进行二次分类。
进一步地,所述步骤S4中,近邻传播算法具体步骤为:
步骤S41:初始化相似度矩阵S,归属度矩阵A,吸引度矩阵R,偏好值P,最大迭代次数maxits,聚类中心稳定次数;
步骤S42:当迭代次数或聚类中心稳定次数小于设定值时计算下面步骤,否则进入下一步:Rold=R′;Aold=A′;更新R和A;计算下一步计算的矩阵R′和A′;
步骤S43:选取所有的r(i,i)+a(i,i)>0的点作为聚类中心;
步骤S44:将剩余数据点分配到最近的聚类中心作为类别标签。
进一步地,所述步骤S5中,采用的用户负荷形态特性指标包括负荷率:日峰谷差率:峰期负载率:谷期负载率:平期负载率:其中Pav为负荷平均值,Pmax为负荷最大值,Pmin为负荷最小值,Pav.peak为负荷峰期平均值,Pav.flat为负荷平期平均值。Pav.valley为负荷谷期平均值。
进一步地,所述步骤S6中,二次分类方法是:对于第i个负荷,以其它所有负荷作为训练样本,其中xk为第k个负荷的负荷形态特征指标集向量,yk为第k个负荷一次聚类的类别,以该负荷作为预测样本采用kNN算法进行重新分类,直到所有负荷分类完毕。
与现有技术相比,本发明将基于全维度负荷曲线聚类可以考虑负荷曲线的细节信息以及负荷特性指标考虑负荷形态的信息的优点结合,该方法分为两步,第一步采用基于欧式距离的负荷曲线聚类方法获得聚类结果;第二步采用kNN算法对电力系统负荷进行二次分类。本发明具有以下有益效果:1、对于负荷曲线的极端值及噪声不敏感,算法更加稳定。2、能考虑负荷曲线整体形态信息,分类更加准确。
附图说明
图1是本发明的方法流程示意图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
本实施例提供一种新型电力系统负荷曲线聚类方法,如图1所示,具体包括以下步骤:
步骤S1:从监测控制和数据采集系统获取待分类的负荷或变压器5天以上的工作日的日负荷曲线有功功率数据;
步骤S2:对步骤S1得到的日负荷曲线有功功率数据,对于每个负荷或者变压器在每个时刻分别取所有工作日的平均值作为用户典型负荷曲线;
步骤S3:对步骤S2得到的用户典型负荷曲线进行标准化处理,采用极大值标准化方法,即pij=pij/pimax,式pij中为用户i第j个时段的功率,pimax为用户i最大用电功率;
步骤S4:采用近邻传播算法对用户典型负荷曲线进行聚类,得到初步的分类结果;
步骤S5:计算用户负荷形态特性指标,对每个用户负荷形态特性指标采用min-max标准化处理得到标准化的负荷形态特性指标。
步骤S6:基于步骤S5得到的标准化的负荷形态特性指标,对步骤S4的初步的分类结果进行二次分类。
在本实施例中,近邻传播算法具体方法如下:
算法首先要得到样本的相似度矩阵S,S可以通过很多方法来度量,通常选择负的欧式距离。相似度矩阵可以是对称的也可以是不对称的,即s(i,j)和s(j,i)可以相等也可不等。其中s(i,i)是一个重要的值,表示样本i作为聚类中心的偏好,s(i,i)越大则样本i作为聚类中心的可能性越大,这个值通常被赋予一个先验值P(i)。
吸引度矩阵R:吸引度r(i,k)表示点xi发送到候选聚类中心xk的消息,表示点xk作为点xi聚类中心的合适程度。
归属度矩阵A:归属度矩阵是由候选聚类中心xk发送到点xi的消息,表示点xi选择点xk作为聚类中心的程度。
吸引度矩阵通过相似度矩阵S和归属度矩阵A进行更新:
归属度矩阵通过吸引度矩阵进行更新:
算法计算时易产生振荡,因此引入阻尼因子lam对计算的新矩阵和原始矩阵进行加权求和得到下一步计算的矩阵:
R′=(1-lam)*R+lam*Rold
A′=(1-lam)*A+lam*Aold
在本实施例中,所述步骤S4中,近邻传播算法具体步骤为:
步骤S41:初始化相似度矩阵S,归属度矩阵A,吸引度矩阵R,偏好值P,最大迭代次数maxits,聚类中心稳定次数;
步骤S42:当迭代次数或聚类中心稳定次数小于设定值时计算下面步骤,否则进入下一步:Rold=R′;Aold=A′;更新R和A;计算下一步计算的矩阵R′和A′;
步骤S43:选取所有的r(i,i)+a(i,i)>0的点作为聚类中心;
步骤S44:将剩余数据点分配到最近的聚类中心作为类别标签。
在本实施例中,所述步骤S5中,采用的用户负荷形态特性指标包括负荷率:日峰谷差率:峰期负载率:谷期负载率:平期负载率:其中Pav为负荷平均值,Pmax为负荷最大值,Pmin为负荷最小值,Pav.peak为负荷峰期平均值,Pav.flat为负荷平期平均值。Pav.valley为负荷谷期平均值。
在本实施例中,所述步骤S6中,二次分类方法是:对于第i个负荷,以其它所有负荷作为训练样本,其中xk为第k个负荷的负荷形态特征指标集向量,yk为第k个负荷一次聚类的类别,以该负荷作为预测样本采用kNN算法进行重新分类,直到所有负荷分类完毕。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。