一种基于特征优选的楼宇负荷特性分析方法与流程

文档序号:16212468发布日期:2018-12-08 07:55阅读:238来源:国知局
一种基于特征优选的楼宇负荷特性分析方法与流程
本发明涉及一种楼宇负荷特性分析方法,尤其是涉及一种基于特征优选的楼宇负荷特性分析方法。
背景技术
随着智能电网的快速发展,用电信息采集系统的逐渐完善,楼宇用能的监测进一步加强,用电负荷数据呈现出数据量大、数据类型多、增长速度快等大数据特征,电力大数据逐渐成为人们关注的研究热点。目前,用电大数据的研究工作主要侧重于对已知负荷数据集进行用户用电行为模式与用电特性的挖掘,数据挖掘算法的改进等,挖掘隐藏在数据中的用电行为习惯,为节能工作提供重要的决策依据。用电行为分析与负荷特性的结果与选用的样本特征数据密切相关,不同样本特征数据分析得到的结果差异较大,因此,需要对样本数据特征进行筛选,提高分析结果的准确性。然而,大部分用电行为分析的研究只是单纯地对负荷数据进行聚类分析,没有考虑影响负荷数据变化的样本特征,忽略了对样本特征的分析和优化选择,其分析的有效性有待验证,分析性能可以进一步提升。技术实现要素:本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于特征优选的楼宇负荷特性分析方法。本发明的目的可以通过以下技术方案来实现:一种基于特征优选的楼宇负荷特性分析方法,该方法包括如下步骤:(1)获取待分析时间区间内楼宇负荷数据以及影响楼宇负荷的样本特征,所述的样本特征包括气象类特征和负荷类特征;(2)基于楼宇负荷数据对样本特征进行综合优选,选取影响楼宇负荷的优选特征;(3)对优选特征进行加权聚类,确定不同的用电模式,结合负荷数据确定每种用电模式下的负荷分布。所述的气象类特征包括:最高气温:一天中的最高气温值;最低气温:一天中的最低气温值;平均风速:一天中风速的平均值;平均压强:一天中压强的平均值;平均相对湿度:一天中相对湿度的平均值;天气情况:包括晴、多云、阴、雨、雨夹雪;人体舒适度指数:i为人体舒适度指数,t为平均气温,rh为平均相对湿度,v为平均风速。所述的负荷类特征包括:日最大负荷:一天中负荷的最大值;日最小负荷:一天中负荷的最小值;日峰谷差:日最大负荷-日最小负荷;日负荷率:日平均负荷/日最大负荷,其中日平均负荷为一天中负荷的平均值;峰时段耗电率:高峰时段用电量/总用电量;谷时段耗电率:低谷时段用电量/总用电量;平时段耗电率:平时段用电量/总用电量。步骤(2)对样本特征进行综合优选前对样本特征进行归一化,具体地:将任意一个样本特征分别组成一组样本特征序列,对每一组样本特征序列中的数据采用下式进行归一化:其中,x*为归一化处理后的数据,x为归一化处理前的数据,min为样本特征序列中的最小值,max为样本特征序列中的最大值。步骤(2)优选特征通过如下方式获得:(21)将楼宇负荷数据组成负荷序列a:{a(a)|a=1,2,···,n},同时获取归一化后的第i个样本特征序列bi:{bi(b)|b=1,2,···,n},a=b=1,2,……n,n为负荷序列中负荷数据的总个数以及第i个样本特征中数据总个数,i=1,2,……n,n为特征样本序列的总个数;(22)根据下式计算第i个样本特征序列bi与负荷序列a的互信息i(a,bi):i(a,bi)=h(a)+h(bi)-h(a,bi),其中,h(a)为负荷序列的信息熵,h(bi)为第i个样本特征序列的信息熵,h(a,bi)为第i个样本特征序列与负荷序列的联合熵,pa(a)为负荷序列的边缘概率分布,为第i个样本特征序列的边缘概率分布;(23)根据下式计算第i个样本特征序列bi与负荷序列a的灰色关联度γi:其中,ζi(a)为负荷序列与第i个样本特征序列的相关系数,δi(a)为第i个样本特征序列第a点与负荷序列第a点的绝对差值,ρ为分辨系数,a=1,2,……n,i=1,2,……n;(24)根据下式获取第i个样本特征序列bi的综合优选系数:(25)选取综合优选系数大于设定值的样本特征序列所对应的样本特征作为优选特征。步骤(3)采用k-means聚类法对优选特征进行加权聚类,具体地:(31)获取优选特征的权重ωj,j=1,2,……m,m为优选特征的总个数;(32)将待分析时间区间内的优选特征组成数据样本集,选取k个初始聚类中心;(33)计算数据集样本到聚类中心的加权距离,按照加权距离最小的原则分配最邻近类别;(34)根据聚类结果重新计算k个聚类中心作为新的聚类中心;(35)重复步骤(33)~(34),直至聚类中心不再变化,或满足迭代次数要求;进而每一个聚类中心对应一种用电模式。步骤(3)确定每种用电模式下的负荷分布:包括每种用电模式下的总负荷数据分布以及每种用电模式下不同用电成分的分布。与现有技术相比,本发明具有如下优点:(1)本发明基于特征优选的楼宇负荷特性分析方法能够有效提取出关键影响特征,提高聚类的质量,并且计算速度快,通用型强,可应用于楼宇的负荷特性研究;(2)本发明样本特征种类多,不仅包括负荷类特征,还包括考虑人体舒适度指数在内的气象特征,具有全面性,从而使得基于特征优选的楼宇负荷特性分析结果更加准确可靠;(3)本发明结合评价样本特征有效性的互信息和判断样本特征变化趋势关联性的灰色关联度,提出了一种综合优选系数的计算方法,优选特征结果具有科学性和准确性;(4)本发明基于优选后的优选特征进行用电模式划分并分析其负荷特性,可以达到降维的目的,提高分析性能和分析的有效性。附图说明图1为本发明基于特征优选的楼宇负荷特性分析方法的流程框图;图2为本实施例三种用电模式下的用电成分分布图。具体实施方式下面结合附图和具体实施例对本发明进行详细说明。注意,以下的实施方式的说明只是实质上的例示,本发明并不意在对其适用物或其用途进行限定,且本发明并不限定于以下的实施方式。实施例如图1所示,一种基于特征优选的楼宇负荷特性分析方法,该方法包括如下步骤:步骤(1):获取待分析时间区间内楼宇负荷数据以及影响楼宇负荷的样本特征,样本特征包括气象类特征和负荷类特征。本实施例以某商场为例,分析样本为2015年全年的负荷数据(每15分钟采样一次)。气象类特征包括最高气温、最低气温、平均风速、平均压强、平均相对湿度、天气情况和人体舒适度指数,具体地:最高气温:一天中的最高气温值;最低气温:一天中的最低气温值;平均风速:一天中风速的平均值;平均压强:一天中压强的平均值;平均相对湿度:一天中相对湿度的平均值;天气情况:包括晴、多云、阴、雨、雨夹雪,天气情况分别量化到[0,1]区间上,其中晴量化为1,多云量化为0.9,阴量化为0.8,小雨量化为0.7,中雨量化为0.6,大雨量化为0.5,雨夹雪量化为0.4;人体舒适度指数:i为人体舒适度指数,t为平均气温,rh为平均相对湿度,v为平均风速。负荷类特征包括日最大负荷、日最小负荷、日峰谷差、日负荷率、峰时段耗电率、谷时段耗电率和平时段耗电率,具体地:日最大负荷:一天中负荷的最大值;日最小负荷:一天中负荷的最小值;日峰谷差:日最大负荷-日最小负荷;日负荷率:日平均负荷/日最大负荷,其中日平均负荷为一天中负荷的平均值;峰时段耗电率:高峰时段用电量/总用电量;谷时段耗电率:低谷时段用电量/总用电量;平时段耗电率:平时段用电量/总用电量。步骤(2):对样本特征进行归一化,具体地:将任意一个样本特征分别组成一组样本特征序列,对每一组样本特征序列中的数据采用下式进行归一化:其中,x*为归一化处理后的数据,x为归一化处理前的数据,min为样本特征序列中的最小值,max为样本特征序列中的最大值。步骤(3):基于楼宇负荷数据对样本特征进行综合优选,选取影响楼宇负荷的优选特征。选取合适有效的样本特征,不仅要考虑特征的有效性,还需要考虑特征与负荷序列变化趋势的关联性,本发明采用互信息来评价特征的有效性,采用灰色关联度来计算特征与负荷序列变化趋势的关联程度。因此,步骤(3)优选特征通过如下方式获得:(31)将楼宇负荷数据组成负荷序列a:{a(a)|a=1,2,···,n},同时获取归一化后的第i个样本特征序列bi:{bi(b)|b=1,2,···,n},a=b=1,2,……n,n为负荷序列中负荷数据的总个数以及第i个样本特征中数据总个数,i=1,2,……n,n为特征样本序列的总个数;(32)根据下式计算第i个样本特征序列bi与负荷序列a的互信息i(a,bi):i(a,bi)=h(a)+h(bi)-h(a,bi),其中,h(a)为负荷序列的信息熵,h(bi)为第i个样本特征序列的信息熵,h(a,bi)为第i个样本特征序列与负荷序列的联合熵,pa(a)为负荷序列的边缘概率分布,为第i个样本特征序列的边缘概率分布;(33)根据下式计算第i个样本特征序列bi与负荷序列a的灰色关联度γi:其中,ζi(a)为负荷序列与第i个样本特征序列的相关系数,δi(a)为第i个样本特征序列第a点与负荷序列第a点的绝对差值,ρ为分辨系数,a=1,2,……n,i=1,2,……n,本实施例中ρ取0.5;(34)根据下式获取第i个样本特征序列bi的综合优选系数:(35)选取综合优选系数大于设定值的样本特征序列所对应的样本特征作为优选特征。本实施例中优选特征选择4个,分别为日最大负荷、日峰谷差、人体舒适度指数以及最高气温。完成上述优选特征的选取后,对优选特征进行有效性评判,具体地:k-means算法是最经典的聚类算法之一,它具有计算简单、快速、有效的优点。davies-bouldin指数(简称dbi)可以用来评判聚类效果的好坏,dbi的数值越小,表明类内距离越小,类间距离越大,即聚类效果越好。本发明基于k-means聚类的效果来判断样本特征的优选是否有效,具体步骤如下:①调用matlab中的k-means函数,对每一个样本特征单独进行聚类。度量距离选择欧式距离,最大迭代次数为500次。②采用dbi指数对聚类效果进行评判,并将评判结果与样本特征优选的结果进行对比,评判样本特征的优选是否有效。本实施例中,特征样本如表1所示。表1样本特征简要说明各特征的优选及评价结果如表2所示,不同特征组合的聚类结果如表3所示。可以看到,综合优选系数的结果与聚类效果一致,综合优选系数越大的特征,聚类的效果越好。对试验的商场数据来说,日最大负荷、日峰谷差、人体舒适度指数、最高气温、最低气温是主要影响特征,在进行用电行为分析时可以重点研究,以降低数据维度,提高分析的效率。本发明提出的特征优选方法能够很好的反映出样本特征的有效性。表2样本特征优选及评价结果标号名称综合优选系数dbi指数8日最大负荷0.12650.618710日峰谷差0.12150.63566人体舒适度指数0.11530.64991最高气温0.09610.67612最低气温0.08770.68714平均压强0.08290.815212峰时耗电率0.07720.84689日最小负荷0.07710.881814平时耗电率0.05171.422213谷时耗电率0.05011.485611日负荷率0.04332.09955相对湿度0.02895.61083平均风速0.021112.17717天气情况0.020314.2672表3不同特征组合的聚类结果对比特征组合dbi指数运行计时/s8、100.59380.2398、10、6、10.57150.2518、10、6、1、2、40.63150.2928、10、6、1、2、4、12、90.63750.3098、10、6、1、2、4、12、9、14、130.63510.3398、10、6、1、2、4、12、9、14、13、11、50.63160.341全部特征0.63510.343步骤(4):对优选特征进行加权聚类,确定不同的用电模式,结合负荷数据确定每种用电模式下的负荷分布,包括每种用电模式下的总负荷数据分布以及每种用电模式下不同用电成分的分布。具体地,步骤(4)采用k-means聚类法对优选特征进行加权聚类,具体地:(41)获取优选特征的权重ωj,j=1,2,……m,m为优选特征的总个数;(42)将待分析时间区间内的优选特征组成数据样本集,选取k个初始聚类中心;(43)计算数据集样本到聚类中心的加权距离,按照加权距离最小的原则分配最邻近类别;(44)根据聚类结果重新计算k个聚类中心作为新的聚类中心;(45)重复步骤(43)~(44),直至聚类中心不再变化,或满足迭代次数要求;进而每一个聚类中心对应一种用电模式。本实施例以综合优选权重0.09为阈值,挑选出日最大负荷,日峰谷差,人体舒适度指数,最高气温为关键特征的聚类对象集合,进行加权聚类,划分出不同的用电模式,并以此为基础完成负荷特性分析。不同模式的聚类中心如表4所示。表4各用电模式的聚类中心模式最大负荷峰谷差人体舒适度指数最高气温模式一0.4310.4190.6040.574模式二0.1500.1520.1990.204模式三0.7220.7030.8470.800图2为本实施例中三种不同模式下不同用电成分的分布,图2(a)~(c)依次对应模式一、模式二和模式三,不同用电成分包括照明与插座、空调用能、动力用能以及特殊与其他。上述实施方式仅为例举,不表示对本发明范围的限定。这些实施方式还能以其它各种方式来实施,且能在不脱离本发明技术思想的范围内作各种省略、置换、变更。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1