一种基于数据驱动的母线负荷特性分析的制作方法

文档序号:10594339阅读:334来源:国知局
一种基于数据驱动的母线负荷特性分析的制作方法
【专利摘要】本发明公开一种基于数据驱动的母线负荷特性分析,对每日母线负荷曲线进行聚类分析,充分考虑了不同时段电量的波形大小,对波动性较大的时段赋予较高的权重,以提升聚类算法对母线负荷辨识度,再根据母线负荷曲线聚类结果,对母线进行划分,然后在此基础上提出了模式切换熵、相对波动率、日平均负荷、温度敏感度等四个指标,从不同维度描述母线负荷特性;最后根据提取和特征,利用K最邻近算法对母线负荷进行分类,最终通过对广州实际母线负荷数据进行了算例仿真;该基于数据驱动的母线负荷特性分析所提出的指标能够较好的刻画母线负荷特性,并能取得较好的分类效果。
【专利说明】
-种基于数据驱动的母线负荷特性分析
技术领域
[0001 ]本发明具体设及一种基于数据驱动的母线负荷特性分析。
【背景技术】
[0002] 母线负荷定义为变电站的一台主变所供电区域的终端负荷的总和,是对系统负荷 的细化。与系统负荷相比,母线负荷基数小,波动性大。深入分析母线负荷的特性对于提高 负荷预测精度,评估电网安全稳定,辨识需求响应潜力等具有重要的意义。
[0003] 目前,对母线负荷的特性的分析与研究主要集中在负荷率、峰值出现时刻等描述 母线负荷形状的基于简单数值统计的指标上;然而,与系统负荷相比,母线负荷基数小,数 量多,波动性大,需要提取能够反映母线负荷随机性和波动性的指标。
[0004] 现代电力系统正步入大数据时代,需要广泛采集多元数据,利用先进的数据挖掘 手段开展应用分析。

【发明内容】

[0005] 本发明针对现有技术的不足,提供了一种能够较好地刻画母线负荷特性,并能取 得较好的分类效果的基于数据驱动的母线负荷特性分析。
[0006] 为了解决上述的问题本发明的采用的技术W及方法如下:
[0007] -种基于数据驱动的母线负荷特性分析,包括数据预处理、聚类分析、指标提取、 母线分类;其中,
[000引数据预处理包括数据清洗和数据标么化两个方面,数据清洗工作在集成的母线负 荷预测平台中完成;
[0009] 在聚类分析阶段,基于马氏距离进行处理,每条母线负荷曲线的根据其形状进行 划分,然后计算每条母线划分到不同类别的频次,确定母线所属类别;
[0010] 在指标提取阶段,提取每条母线在不同用电模式直接切换的规律程度,定义模式 切换赌来衡量;统计每条母线在不同时刻负荷波动的相对大小,定义相对波动率来衡量;计 算每条母线特定时段内的平均负荷,定义日平均负荷来衡量;综合分析电量对溫度的敏感 度,定义溫度敏感度来衡量;
[0011] 在母线分类阶段,W在聚类分析阶段对母线划分结果作为标签,在指标提取阶段 得到的四个特征作为属性,利用K最邻近算法进行有监督的分类学习。
[0012] 进一步的,在聚类分析阶段,当属性相关、具有不同的值域、并且数据分布近似于 高斯分布时,欧氏距离的拓展,定义为:
[001引 d(Xi,Xj) = (Xi-Xj)[ 2 ]-i(Xi-Xj)T
[0014]式中:xi表示第i条负荷曲线;其中[S ri表示数据协方差矩阵的逆,数据X和y的协 方差矩阵定义如下:
[0015]
[0016] 式中:〇ij为第i时段负荷和第j时段负荷的协方差。
[0017] 进一步的,在聚类分析阶段,采用基于划分的k-means聚类算法进行分析,求解每 条母线负荷曲线类标号Z的优化,通过循环迭代求解:
[001 引
[0019] 式中:N表示待聚类母线负荷曲线的条数;M表示聚类数目;Zm,n表示第n条母线是否 属于第m类的指示函数,若属于则为1,否则为0;Cm表示第m类的聚类中屯、;
[0020] 采用DB巧旨数来确定最优聚类数,DB巧旨数定义如下:
[0021;
[0022] 式中:^?0:^^表示属于第〇类的所有母线负荷曲线与聚类中屯、距离的和。
[0023] 进一步的,在聚类分析阶段,每条母线的所有负荷曲线都能划分到N类中的一类, 对第i条母线的所有负荷曲线所属类别进行频次统计,如果第n类出现的频次最高,则认为 该母线为第n类;
[0024] Fi=[fii,fi2,...,fiN]
[0025]
[0026] 式中:fu表示第i条母线所有负荷曲线中属于第j类的负荷曲线数目,Xi表示第i条 母线所属的类别号。
[0027] 进一步的,在指标提取阶段,模式切换赌的定义如下:
[002J
[0029] 式中:出表示第i条母线的模式切换赌;Pin表示第i条母线中出现第n种用电模式的 频率:
[0030]
[0031] 式中:fu表示第i条母线所有负荷曲线中属于第j类的负荷曲线数目。
[0032] 进一步的,在指标提取阶段,相对波动率的定义如下:
[0033]
[0034] 式中:B康示第i条母线的相对波动率;T表示一天的总时段数,本文为96时段;化, 分别表示第i条母线在第t时段负荷的标准差和均值。
[0035] 讲一击的.#拾标梅取阶段,日平均负荷的定义如下:
[0036]
[0037] 式中:Al表示第i条母线的日平均负荷;L表示特定时段的天数;Piit表示第i条母线 在第1天t时段的负荷大小。
[0038] 进一步的,在指标提取阶段,溫度敏感度的定义如下:
[0039
[0040] 式中:Ki表示第i条母线的溫度敏感度;表示第i条母线在第1天t时段的标么化 后的负荷大小;Wii表示第i条母线在第1天环境的平均溫度。
[0041] 进一步的,在母线分类阶段,采用简单的K最邻近算法进行分析,利用5折交叉验证 的分类效果。
[0042] 该分析方法首先通过无监督的聚类分析对母线负荷的基本模式进行了提取,并根 据各模式出现的频次对母线进行了划分;然后提取了反映母线负荷日间波动性、日内波动 性、外界因素敏感度等的指标,对母线负荷特性进行多维度描述;最后通过K-最邻近算法, 根据所提取的母线负荷特性,对各母线进行了有监督的分类分析,说明母线的负荷特性和 母线的基本模式具有较大关联关系,运一结论可W用于母线负荷预测中去;另外,还提出了 母线负荷特性分析框架可W应用于电压等级更低,随机性波动性更强的母线负荷。
[0043] 本发明的有益效果为:首先对每日母线负荷曲线进行聚类分析,充分考虑了不同 时段电量的波形大小,对波动性较大的时段赋予较高的权重,W提升聚类算法对母线负荷 辨识度,再根据母线负荷曲线聚类结果,对母线进行划分;然后在此基础上提出了模式切换 赌、相对波动率、日平均负荷、溫度敏感度等四个指标,从不同维度描述母线负荷特性;最后 根据提取和特征,利用K最邻近算法对母线负荷进行分类,最终通过对实际母线负荷数据进 行算例仿真,该分析提出的指标能够较好的刻画母线负荷特性,并能取得较好的分类效果。
【附图说明】
[0044] 图1为本发明的母线负荷特性分析框架图;
[0045] 图2为本发明的典型母线负荷曲线图;
[0046] 图3为本发明的伍仙口和开元母线连续两周负荷曲线图;
[0047] 图4为本发明的模式切换赌与相对波动率散点图;
[004引图5为本发明的广州母线平均负荷分布情况图;
[0049]图6为本发明的厚德和聚龙母线溫度与日平均负荷散点图。
【具体实施方式】
[0050]下面结合实施例和附图对本发明做进一步的详细说明,但它们并不是对本发明技 术方案的限定,基于本发明教导所做出的任何变换,均落在本发明的保护范围。
[0化1 ]实施例:
[0052] 母线负荷特性分析框架:
[0053] 如图1所示给出了本文母线负荷特性分析的框架,主要分为数据预处理、聚类分 析、指标提取、母线分类等四个步骤;数据预处理包括数据清洗和数据标么化两个方面,其 中数据清洗工作在集成的母线负荷预测平台中完成。
[0054] 在聚类分析阶段,每条母线负荷曲线的根据其形状进行划分,然后计算每条母线 划分到不同类别的频次,确定母线所属类别。
[0055] 在指标提取阶段,提取每条母线在不同用电模式直接切换的规律程度,定义模式 切换赌来衡量;统计每条母线在不同时刻负荷波动的相对大小,定义相对波动率来衡量;计 算每条母线特定时段内的平均负荷,定义日平均负荷来衡量;综合分析电量对溫度的敏感 度,定义溫度敏感度来衡量。
[0056] 在母线分类阶段,W在聚类分析阶段对母线划分结果作为标签,在指标提取阶段 得到的四个特征作为属性,利用K最邻近算法进行有监督的分类学习。
[0057] 下面将分别重点介绍聚类分析、指标提取、母线分类等=方面的内容,并W广州市 2015年7月15日至2015年11月10日的130条220kV母线负荷为例开展实证分析。
[0化引基于马氏距离的母线负荷聚类:
[0059] 聚类分析法是一种无监督的学习方法,根据事物彼此不同的属性进行辨认,将具 有相似属性的事物聚为一类,把差异较大的事物划分开来,使得同一类的事物具有高度的 相似性,不同类的事物保持较大的差异。
[0060] 聚类基本原理:
[0061] 度量不同样本之间的差异度或相似度是聚类的基础;目前对不同负荷曲线差异度 的度量主要是基于欧式距离的,认为不同时刻的电量在差异度度量中权重是一样的,不能 很好的反映不同时段时间的差异与关联关系。
[0062] 当属性相关、具有不同的值域、并且数据分布近似于高斯分布时,欧氏距离的拓 展,马氏距离可W有效考虑不同时段电量之间的相关性,定义为:
[0063] d(Xi,Xj) = (Xi-Xj)[X]-i(Xi-Xj)T (1)
[0064] 式中:xi表示第i条负荷曲线;其中[S ri表示数据协方差矩阵的逆;数据X和y的协 方差矩阵定义如下:
[00 化]
[0066] 式中:Oij为第i时段负荷和第j时段负荷的协方差。
[0067] 采用基于划分的k-means聚类算法进行分析,其本质上是一个求解每条母线负荷 曲线类标号Z的优化问题,可W通过循环迭代求解:
[006引 (3)
[0069] 式中:N表示待聚类母线负荷曲线的条数;M表示聚类数目;zm,n表示第n条母线是否 属于第m类的指示函数,若属于则为1,否则为0;Cm表示第m类的聚类中屯、。
[0070] 对于k-means聚类算法,最重要的就是确定聚类数据N,采用DBI(化vies Bouldin index)指数来确定最优聚类数,DB巧旨数定义如下:
[0071 (4)
[0072] 式中:^^文:心;)表示属于第11类的所有母线负荷曲线与聚类中屯、距离的和;一般081 指数越低,说明类内负荷曲线相似度越大,类间负荷曲线差异度越大,聚类效果越好。
[0073] 聚类结果分析:
[0074] 通过对广州母线负荷数据进行聚类分析得到,当N = 6时,DBI指数取值最小,所W 本文将聚类数定为6,并得到每一类典型的母线负荷曲线如图2所示;其中红线表示典型的 负荷曲线,即每一类的聚类中屯、,并在每一时刻都附有箱图,表示在该时刻的所有母线负荷 值的分布情况;获取的六种典型母线负荷曲线具有较大差异的峰谷特性,下面将分别对每 一类负荷曲线进行分析。
[0075] 第一类是典型的早高峰和午高峰母线负荷曲线,早高峰在早上10-11之间出现,而 午高峰则在下午2-4之间出现并持续一段时间,其中早高峰叫午高峰更大,曲线表现出非常 明显的午休特性。
[0076] 第二类同样是双峰母线负荷曲线,较第一类不同的是,午休特性更加显著,在中午 12点出现了加大幅度的下滑,在下午虽然有所回升,但其峰值明显低于早高峰,并从下午5 点开始逐渐下跌。
[0077] 第=类是具有持续高峰的母线负荷曲线,从早上5点开始攀升,并于早上11点达到 高峰,除了在中午12点出现较小的午休跌落外,负荷高峰一直持续到晚上8点。
[0078] 第四类是典型的晚高峰母线负荷曲线,是典型的"duck"型曲线,从早上6点开始负 荷不断攀升,并在早上11点出现较小的峰值,并很快在中午12点跌落,维持一段时间后,从 下午3点逐渐攀升,并于下午5点出现晚高峰,一直持续到晚上9点,该母线负荷中居民负荷 占比可能较高。
[0079] 第五类是典型的具有早高峰,午高峰和晚高峰的S峰母线负荷曲线,该类负荷曲 线同样具有午休特性,在中午12点出现,另外在下午5点也出现了较小的跌落。
[0080] 第六类是典型的单峰母线负荷曲线,在中午12点达到高峰后开始不断下跌,在下 午1点到5点之间跌落较慢,而下午5点之后跌落较快。
[0081 ]基于聚类的母线负荷划分:
[0082]通过聚类分析,每条母线的所有负荷曲线都能划分到N类中的一类,对第i条母线 的所有负荷曲线所属类别进行频次统计,如果第n类出现的频次最高,则认为该母线为第n 类。
[008;3] Fi=化i,fi2,...,fiN] (5) 卿]
(目):
[0085]式中:fu表示第i条母线所有负荷曲线中属于第j类的负荷曲线数目,Xi表示第i条 母线所属的类别号。
[0086] 母线负荷特性指标:
[0087] 由于前述的负荷曲线聚类分析实质上是对母线负荷曲线形状的分析,在下述将主 要关注母线负荷曲线的不确定性,从日内的不确定性,日间的切换规律、负荷惯性大小、对 外界因素的影响等四个方面,提出了模式切换赌、相对波动率、日平均负荷、溫度灵敏度等 四个指标,对母线负荷特性进行描述。
[0088] 模式切换赌:
[0089] 模式切换赌是基于母线负荷曲线聚类结果提出来的,用来表示母线负荷曲线每天 模式变化的十/1、. 心々n下.
[0090] (7)
[0091] 式中:出表示第i条母线的模式切换赌;Pin表示第i条母线中出现第n种用电模式的 频率:
[0092] (8)
[0093] 模式切换赌越大,说明该母线用电模式众多,日间的不确定性较大;模式切换赌越 小,说明该母线用电模式越少,用电模式相对固定,日间不确定性较小;如图3所示为伍仙 口#3主变高侧和开元#1主变高侧两条母线连续两周的负荷曲线;其中,伍仙口#3主变高侧 母线的模式切换赌最低,为0.297,从图中可W看出,该母线负荷用电模式相对固定;开元#1 主变高侧母线的模式切换赌最高,为1.774,从图中可W看出,该母线的用电模式较多,也有 较多的"银齿'。
[0094] 相对波动率:
[00%]相对波动率定义为母线负荷在不同时段出力值的方差与均值的比值的平均值,定 义如下:
[0096] 巧)
[0097] 式中:B康示第i条母线的相对波动率;T表示一天的总时段数,本文为96时段;曰it, 分别表示第i条母线在第t时段负荷的标准差和均值。
[009引 日平均负荷
[0099] 口亚+ 旬包巧見巧一化时间内,母线负荷的平均值:
[0100]
[0101] 式中:Al表示第i条母线的日平均负荷;L表示特定时段的天数;Piit表示第i条母线 在第1天t时段的负荷大小。
[0102] 日平均负荷直接表征母线负荷基数的大小,一般基数越大,母线负荷表现出的"惯 性"越大,越容易预测;如图5所示为广州所有220kV母线的日平均负荷,近似正态分布,最高 值能达到162MW。
[0103] 溫度敏感度:
[0104] 溫度敏感度定义为环境溫度没升高一度,母线负荷相对变化的大小。由于所研究 的负荷时段为2015年7月15日至2015年11月10日,广州正处高溫天气,所W直接利用线性函 数拟合即可:
[0105] (5)
[0106] 式中:Ki表示第i条母线的溫度敏感度;At表示第i条母线在第1天t时段的标么化 后的负荷大小;Wii表示第i条母线在第1天环境的平均溫度。
[0107] 溫度是影响用电负荷的主要因素,溫度敏感度反映了母线负荷受外界环境影响的 大小,一般居民负荷越多,空调等溫度敏感负荷越大,该母线溫度敏感度也就越大;如图6所 示为厚德#3主变高侧和聚龙#2主变高侧母线的每天溫度和日平均负荷的散点图;从图中可 W看出,两条母线对溫度均具有较高的敏感性,随着溫度的升高,日平均负荷也随之升高。
[0108] 与模式切换赌不同,相对波动率描述了母线负荷曲线的日间波动性,两者从不同 的角度描述了负荷曲线的不确定性;如图4所示是广州所有220kV母线的模式切换赌与相对 波动率的散点图;从图中可W看出,模式切换赌与相对波动率的相关性不大,及时较小的模 式切换赌,也可能对应较高的相对波动率;反之亦然。
[0109] 基于K-最近邻的母线负荷分类:
[0110] 下述将W第3章提取的四个指标作为属性(attribute), W前述划分结果作为标签 (label),通过构造分类模型建立两者之间的关联关系;K最近邻分类算法是最简单的分类 算法,其核屯、思想是如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一 个类别,则该样本也属于运个类别,并具有运个类别上样本的特性;K最邻近算法主要靠周 围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉 或重叠较多的待分样本集来说,K最邻近算法较其他方法更为适合,对于多分类问题,K最邻 近算法的分类效果一般较好。
[0111] 下述相当于是一个6分类问题,所W采用简单的K最邻近算法进行分析。表1给出了 考虑不同指标情况下,利用5折交叉验证的分类效果;结果表明,同时考虑反映母线负荷波 动性、外界敏感度和惯性大小的指标能够取得较好的分类效果(85.6%),同时也说明母线 负荷曲线形状与母线负荷的其他属性具有较强的关联关系。
[0112] 表1考虑不同指标的分类效果
[0113]
[0114] 本发明的有益效果为:首先对每日母线负荷曲线进行聚类分析,充分考虑了不同 时段电量的波形大小,对波动性较大的时段赋予较高的权重,W提升聚类算法对母线负荷 辨识度,再根据母线负荷曲线聚类结果,对母线进行划分;然后在此基础上提出了模式切换 赌、相对波动率、日平均负荷、溫度敏感度等四个指标,从不同维度描述母线负荷特性;最后 根据提取和特征,利用K最邻近算法对母线负荷进行分类,最终通过对实际母线负荷数据进 行算例仿真,该分析提出的指标能够较好的刻画母线负荷特性,并能取得较好的分类效果。
[0115] W上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何 不经过创造性劳动想到的变化或替换,都应涵盖在本发明的保护范围之内,因此,本发明的 保护范围应该W权利要求书所限定的保护范围为准。
【主权项】
1. 一种基于数据驱动的母线负荷特性分析,其特征在于:包括数据预处理、聚类分析、 指标提取、母线分类;其中, 数据预处理包括数据清洗和数据标么化两个方面,数据清洗工作在集成的母线负荷预 测平台中完成; 在聚类分析阶段,基于马氏距离进行处理,每条母线负荷曲线的根据其形状进行划分, 然后计算每条母线划分到不同类别的频次,确定母线所属类别; 在指标提取阶段,提取每条母线在不同用电模式直接切换的规律程度,定义模式切换 熵来衡量;统计每条母线在不同时刻负荷波动的相对大小,定义相对波动率来衡量;计算每 条母线特定时段内的平均负荷,定义日平均负荷来衡量;综合分析电量对温度的敏感度,定 义温度敏感度来衡量; 在母线分类阶段,以在聚类分析阶段对母线划分结果作为标签,在指标提取阶段得到 的四个特征作为属性,利用K最邻近算法进行有监督的分类学习。2. 如权利要求1所述的基于数据驱动的母线负荷特性分析,其特征在于:在聚类分析阶 段,当属性相关、具有不同的值域、并且数据分布近似于高斯分布时,欧氏距离的拓展,定义 为: d(xi,xj) = (xi-xj)[ Σ ]_1(xi-Xj)T 式中:Xl表示第i条负荷曲线;其中[ΣΓ1表示数据协方差矩阵的逆,数据χ和y的协方差 矩阵定义如下:式中:〇ij为第i时段负荷和第j时段负荷的协方差。3. 如权利要求2所述的基于数据驱动的母线负荷特性分析,其特征在于:在聚类分析阶 段,采用基于划分的k-means聚类算法进行分析,求解每条母线负荷曲线类标号Z的优化,通 过循环迭代求解:式中:N表示待聚类母线负荷曲线的条数;Μ表示聚类数目;zm,n表示第η条母线是否属于 第m类的指示函数,若属于则为1,否则为0;cm表示第m类的聚类中心; 采用DBI指数来确定最优聚类数,DBI指数定义如下:式中:?^Χ(η))表示属于第η类的所有母线负荷曲线与聚类中心距离的和。4. 如权利要求3所述的基于数据驱动的母线负荷特性分析,其特征在于:在聚类分析阶 段,每条母线的所有负荷曲线都能划分到Ν类中的一类,对第i条母线的所有负荷曲线所属 类别进行频次统计,如果第η类出现的频次最高,则认为该母线为第η类; Fi=[fil,fi2,.-.,fiN]式中:表示第i条母线所有负荷曲线中属于第j类的负荷曲线数目,Xl表示第i条母线 所属的类别号。5. 如权利要求1或4所述的基于数据驱动的母线负荷特性分析,其特征在于:在指标提 取阶段,模式切换熵的定义如下:式中:?表示第i条母线的模式切换熵;ριη表示第i条母线中出现第η种用电模式的频 率:式中:fu表示第i条母线所有负荷曲线中属于第j类的负荷曲线数目。6. 如权利要求5所述的基于数据驱动的母线负荷特性分析,其特征在于:在指标提取阶 段,相对波动率的定义如下:式中:Bi表不第i条母线的相对波动率;T表不一天的总时段数,本文为96时段;〇it,yit分 别表示第i条母线在第t时段负荷的标准差和均值。7. 如权利要求6所述的基于数据驱动的母线负荷特性分析,其特征在于:在指标提取阶 段,日平均负荷的定义如下:式中:仏表示第i条母线的日平均负荷;L表示特定时段的天数;Pm表示第i条母线在第1 天t时段的负荷大小。8. 如权利要求7所述的基于数据驱动的母线负荷特性分析,其特征在于:在指标提取阶 段,温度敏感度的定义如下:式中表示第i条母线的温度敏感度;表示第i条母线在第1天t时段的标么化后的 负荷大小;Wn表示第i条母线在第1天环境的平均温度。9. 如权利要求1或4所述的基于数据驱动的母线负荷特性分析,其特征在于:在母线分 类阶段,采用简单的K最邻近算法进行分析,利用5折交叉验证的分类效果。10. 如权利要求8所述的基于数据驱动的母线负荷特性分析,其特征在于:在母线分类 阶段,采用简单的K最邻近算法进行分析,利用5折交叉验证的分类效果。
【文档编号】G06F17/50GK105956319SQ201610334789
【公开日】2016年9月21日
【申请日】2016年5月18日
【发明人】陈明辉, 王珂, 蔡莹, 韩俊杰, 罗欣, 赵燃, 刘梅, 刘斐
【申请人】广州供电局有限公司, 北京清软创新科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1