逐年负荷预测中历史数据预处理的方法与装置的制作方法

文档序号:6333525阅读:442来源:国知局
专利名称:逐年负荷预测中历史数据预处理的方法与装置的制作方法
技术领域
本发明涉及数据挖掘技术领域,特别涉及一种逐年负荷预测中历史数据预处理的 方法与装置。
背景技术
负荷预测作为电力系统规划、设计、生产调度的基础性工作,是一项重要的研究内 容。根据预测的期限来分,负荷预测大致可分为以年为单位的中长期预测和以日为单位的 短期预测。逐年负荷预测即上述中长期预测有两大类不同的预测思路一类是根据历史用电 的变化趋势进行趋势外推,不考虑负荷变化的影响因素,如时间序列法、回归分析法、灰色 预测法等;另一类是通过计算影响因素与用电负荷之间的关系来求取负荷的预测值。第 二类方法又包括确定性预测和不确定预测两种,其中确定性负荷预测方法将影响因素(如 GDP)与待预测的电量用一个或一组方程来描述,电量与各变量之间有明确的对应关系,包 括传统的弹性系数法、部门单耗法等,此类方法的优势在于所需要的原始数据较少,处理方 便。而不确定性方法考虑多重的影响因素,通过建立多维社会经济因素(输入)与用电负 荷(输出)之间的非线性映射模型求取负荷的预测值。不确定性预测方法以基于人工智 能理论的人工神经网络(ANN,Artificial Neural Network)和支持向量机(SVM, Support Vector Machines)为代表性算法。由于实际的负荷增长和社会经济发展指标之间很难用精 确的方程进行描述,不确定性预测方法在目前的研究中得到较多的关注。不确定性预测方法分为两个步骤首先利用历史年份的社会经济因素和相应的用 电量作为训练样本训练生成预测模型,再将待预测年份的社会经济指标输入至训练好的预 测模型中获得用电量输出。该预测过程有不合理而需要进一步改进的地方目前的研究中 对历史年份的选取没有预处理的过程,各年份的数据进行同样的处理,在预测模型的训练 过程中起到同样的作用。而事实上,社会经济发展情况每年皆不相同,比如待预测年份的社 会经济发展环境与距其较远的历史年份的社会经济情况可能较不相似,而与近几年的情况 更为相近。因此,目前的方法不利于生成准确的预测模型。

发明内容
本发明的逐年负荷预测中历史数据预处理的方法与装置,对历史数据进行分析并 处理以提高预测模型的准确度。本发明的逐年负荷预测中历史数据预处理的方法,包括步骤采集待测年份和与所述待测年份相邻的N个历史年份的经济指标;计算所述经济指标的增长速度;比较待测年份与N个历史年份所述经济指标增长速度的相似度,将相似度最低的 M个历史年份的所述经济指标增长速度用最相似的历史年份的所述经济指标增长速度代替。
4
优选地,所述经济指标包括GDP、第二产业GDP、人均GDP、居民消费水平、从业人
口数、固定资投资、进出口总额、工业总产值和居民可支配收入。优选地,在所述步骤计算所述经济指标的增长速度和所述步骤比较待测年份与N 个历史年所述经济指标增长速度的相似度之间还包括对同一所述经济指标不同年份的增 长速度进行归一化处理,所述步骤比较待测年份与N个历史年所述经济指标增长速度的相 似度中的所述增长速度为归一化处理后的增长速度。本发明的逐年负荷预测中历史数据预处理的方法,通过比较增长速度相似度来决 定历史数据的取舍,将与待测年份经济指标增长速度曲线差异较大的年份的数据用与待测 年份曲线最相似的年份的数据代替,由此排除了与待测年份经济发展状况相差较远年份的 数据的影响,且选取了与用电量最相关的九个经济指标,有利于生成准确的预测模型。本发明的逐年负荷预测中历史数据预处理的装置,包括采集模块,用于采集待测年份和与所述待测年份相邻的N个历史年份的经济指 标;增长速度计算模块,用于计算所述经济指标的增长速度;相似度比较模块,用于比较待测年份与N个历史年份的所述经济指标增长速度的 相似度;数据处理模块,用于将相似度最低的M个历史年份的所述经济指标增长速度用最 相似的历史年份的所述经济指标增长速度代替。优选地,所述经济指标包括⑶P、第二产业⑶P、人均⑶P、居民消费水平、从业人
口数、固定资产投资、进出口总额、工业总产值和居民可支配收入。优选地,还包括归一化模块,用于对同一所述经济指标不同年份的增长速度进行 归一化处理,所述相似度比较模块用于比较待测年份与N个历史年份的经归一化处理后的 所述经济指标增长速度的相似度。本发明的逐年负荷预测中历史数据预处理的装置,采用相似度比较模块来比较待 测年份与历史年份经济指标增长速度曲线的相似度,并根据比较结果对各年份数据进行有 区别地处理,将与待测年份曲线差异较大的年份的数据用相似度最高的年份的数据替代, 从而建立更准确的预测模型,提高负荷预测的精确度。


图1是本发明的逐年负荷预测中历史数据预处理的方法实施例一的流程示意图;图2是本发明的逐年负荷预测中历史数据预处理的方法实施例三的流程示意图;图3是本发明的逐年负荷预测中历史数据预处理的装置的结构示意图。
具体实施例方式本发明的逐年负荷预测中历史数据预处理的方法,通过比较待测年份与以往年份 的社会经济发展状况来决定对历史数据的取舍,将相异的舍去相似的保留,较之未处理的 情况,经本发明的方法与装置预处理后,训练样本的选取更为合理,下面结合附图和具体实 施例详细解释本发明。实施例一
本发明的逐年负荷预测历史数据预处理的方法,如图1所示,包括步骤步骤101、采集待测年份和与待测年份相邻的N个历史年份的经济指标;步骤102、计算所述经济指标的增长速度;步骤103、比较待测年份与N个历史年份所述经济指标增长速度的相似度,将相似 度最低的M个历史年份的所述经济指标增长速度用最相似的历史年份的所述经济指标增 长速度代替。步骤103比较了相似度后,将历史年份经济指标增长速度按照相似度高低排名, 上述最相似的历史年份即排在第一位的年份,相似度最低的M个历史年份即排在后M位的 年份。本实施例中的待测年份可以是当前年份,也可以是未来年份,如今年2010年,明 年2011年,由于待测年份实际的经济指标无法得知,因此待测年份的经济指标采用预估 值,又由于电力负荷的发展受到多种社会经济因素的影响,长期的社会经济发展很难准确 预估,因此本发明的预处理方法更适用于近期5年以内的电力负荷预测,历史年份指的是 待测年份之前与待测年份相邻的年份,其经济指标可以从统计年鉴、经济报告等相关资料 中采集。实施例二 经济指标有很多种,对其选取是否恰当关系到预测模型的准确度,本实施例详细 阐述了经济指标是如何选取的。本实施例中经济指标的选取原则为选择与用电量增长最为相关的经济指标,或 者说变化趋势与用电量最为一致的经济指标。具体来讲,对全国30个省市的历史数据(用 电量和经济指标)进行关联性分析,从而选择出与用电量最为密切的经济指标,详细分析 过程如下1、为保证数据的真实可靠性,同时考虑到经济指标需能够量化(用电量虽然也受 到社会政策影响,如为保障奥运期间空气质量,相关地区的行业会采取限产、调产的措施, 本实施例暂不考虑此类不易量化的影响因素),关联性分析中选取的候选经济指标均来自 各省市历年公开出版的统计年鉴或经济年鉴。从年鉴中选取了 25项各省市记录均较完整、 统计口径没有较大变化的经济指标,涵盖了国民经济核算、产业构成、人口、产值、贸易、人 民生活水平、财政收支、价格指数等;2、2009年出版的中国统计年鉴中提供了电力企业联合会发布的2000年及以后各 省市用电量表格,该表格相对于各省市年鉴中的数据更完整可靠,因此分析的历史数据的 跨度为2000-2008年。3、由于公开出版物中缺少西藏地区的用电量数据,港澳台地区的经济体制与大陆 不同,关联性分析中所研究的省市为中国大陆除西藏外的26个省、自治区和4个直辖市。4、针对上述30个省市、2000至2008年、每年25项的经济指标,计算各经济指标与 用电量之间的关联性,利用关联规则的置信度表征关联程度,置信度的物理意义为不同的 社会经济发展指标与用电量增长趋势的一致程度。5、关联性分析结果显示,基于置信度和统计显著性,全社会用电量增长的主导因 素包括工业生产指标(第二产业⑶P和工业总产值)、国民生产总值(⑶P和人均⑶P)、进 出口总额、固定资产投资以及人民生活水平(城镇居民人均可支配收入)。此外,一些地区
62000-2008年的分析结果还表明,从业人口和居民消费水平两项指标与用电量关联度较高, 而且这两项指标导致用电量变化的物理概念明确。 综上,本实施例选取了九项与用电量增长较为密切的经济指标,分别为国民生产 总值(GDP、第二产业GDP、人均GDP),人民生活水平(居民消费水平、城镇居民人均可支配收 入)、从业人口、工业总产值、进出口总额和固定资产投资,该九项经济指标是综合考虑了全 国30个省市的经济指标与用电量的关系而最终选定的,因此本实施例适用性较广针对性 不强,若想进一步增加针对性和准确性,可仅根据某一地区的发展情况选定最适合该地区 的经济指标。 本实施例的其他技术特征与实施例一相同,在此不予赘述。实施例三不同的经济指标其增长速度可能相差甚远,为增加可比性,本实施例对经济指标 的增长速度进行了归一化处理,且用欧式距离来量化不同年份经济指标增长速度的相似 度,如图2所示,本实施例的详细步骤如下。步骤201、对经济指标和历史年份进行编号,采集待测年份和与待测年份相邻的N 个历史年份的经济指标Fij,其中,i = 1,2,. . . 9,j = 1,2,. . . N,N为历史年份的个数;步骤202、计算上述经济指标的年增长速度Sij Sij = (Fij-Fiij^)^(^^100% ;(1)步骤203、对同一经济指标不同年份的增长速度进行归一化处理S; = (Slj )/(S— -Symin) ;(2)Sij经归一化处理后变为$,Sijfflax表示第i个经济指标在第j年的最大值,Sijfflin表 示表示第i个经济指标在第j年的最小值;步骤204、每个年份九个归一化后的经济指标增长速度组成一个包含九个元素的 向量f^S^S^...S。,或一条九维曲线,计算历史年份曲线与待测年份曲线的欧式距离aS;=||^-S^||(3)步骤205、Δ$的值越小说明两条曲线越接近,对应年份的社会经济发展环境越相 似,Δζ值越大说明环境差异越大,根据此值识别出与待测年份社会经济发展状况最相异的 Ν/4个年份,及最相似的一个年份,若Ν/4为非整数,则取其四舍五入值;步骤206、最相异Ν/4个历史年份的经济指标由最相似年份的经济指标替代。上式⑴、⑵、(3)中的i和j表示的意义与步骤201中的i、j的意义相同,步骤 206中最相异N/4个历史年份的数据也可以直接删除,但为保证样本数,用最相似年份的数 据代替。实施例一与实施例二中的N、M均为经验值,本实施例用N/4代替M,由于80年代 及其以前年份的统计年鉴等数据并不完整,且待测年份与距其较远的历史年份的经济发展 状况相差也较大,可比性不强,因此历史年份数N的取值不宜较大,但若N的取值过小即样 本数过少,又将影响预测模型的准确度,因此,N是个经验值,M也是个经验值,经验证,当N 取24,M取N/4即6时,负荷预测的精度最佳,如表1所示,历史年份从1985年至2008共24 年,但为了方便预测值与真实值的比较,将用电量与经济指标的真实值已知的2008作为待 测年,则历史年份为1985-2007共23年,下面以表1-5中广东省的数据为例,进一步说明本
7实施例。1、采集整理广东省1985-2008年九项经济指标的数据,其中2008年作为待测年。
权利要求
一种逐年负荷预测中历史数据预处理的方法,其特征在于,包括采集待测年份和与所述待测年份相邻的N个历史年份的经济指标;计算所述经济指标的增长速度;比较待测年份与N个历史年份所述经济指标增长速度的相似度,将相似度最低的M个历史年份的所述经济指标增长速度用最相似的历史年份的所述经济指标增长速度代替。
2.根据权利要求1所述的逐年负荷预测中历史数据预处理的方法,其特征在于,所述 经济指标包括⑶P、第二产业⑶P、人均⑶P、居民消费水平、从业人口数、固定资产投资、进 出口总额、工业总产值和居民可支配收入。
3.根据权利要求1或2所述的逐年负荷预测中历史数据预处理的方法,其特征在于,在 所述步骤计算所述经济指标的增长速度和所述步骤比较待测年份与N个历史年份所述经 济指标增长速度的相似度之间还包括对同一所述经济指标不同年份的增长速度进行归一 化处理,所述步骤比较待测年份与N个历史年所述经济指标增长速度的相似度中的所述增 长速度为归一化处理后的增长速度。
4.根据权利要求1或2所述的逐年负荷预测中历史数据预处理的方法,其特征在于,在 所述步骤计算所述经济指标的年增长速度之后还包括计算待测年份与N个历史年份所述 经济指标增长速度曲线的欧式距离,根据计算出的所述欧式距离进行所述步骤比较待测年 份与N个历史年所述经济指标增长速度的相似度,所述经济指标增长速度曲线为该年所有 经济指标增长速度连成的曲线。
5.根据权利要求1或2所述的逐年负荷预测中历史数据预处理的方法,其特征在于,所 述N为24,所述M为6。
6.一种逐年负荷预测中历史数据预处理的装置,其特征在于,包括采集模块,用于采集待测年份和与所述待测年份相邻的N个历史年份的经济指标;增长速度计算模块,用于计算所述经济指标的增长速度;相似度比较模块,用于比较待测年份与N个历史年份的所述经济指标增长速度的相似度;数据处理模块,用于将相似度最低的M个历史年份的所述经济指标增长速度用最相似 的历史年份的所述经济指标增长速度代替。
7.根据权利要求6所述的逐年负荷预测中历史数据预处理的装置,其特征在于,所述 经济指标包括⑶P、第二产业⑶P、人均⑶P、居民消费水平、从业人口数、固定资产投资、进 出口总额、工业总产值和居民可支配收入。
8.根据权利要求6或7所述的逐年负荷预测中历史数据预处理的装置,其特征在于,还 包括归一化模块,用于对同一所述经济指标不同年份的增长速度进行归一化处理,所述相 似度比较模块用于比较待测年份与N个历史年份的经归一化处理后的所述经济指标增长 速度的相似度。
9.根据权利要求6或7所述的逐年负荷预测中历史数据预处理的装置,其特征在于,所 述相似度比较模块还用于计算待测年份与N个历史年份所述经济指标增长速度曲线的欧 式距离,根据计算出的所述欧式距离比较所述相似度,所述经济指标增长速度曲线为该年 所有经济指标增长速度连成的曲线。
10.根据权利要求6或7所述的逐年负荷预测中历史数据与处理的装置,其特征在于,所述N为24,所述M为6。
全文摘要
本发明公开了一种逐年负荷预测历史数据预处理的方法,选取九个与用电量相关的经济指标来表征社会经济发展状况,比较待测年份与历史年份经济指标增长速度的相似度,用最相似年份的数据代替最相异年份的数据,提高了预测模型的准确度和负荷预测的精度;本发明还公开了一种逐年负荷预测历史数据预处理的装置,增长速度计算模块计算采集模块采集的待测年份和历史年份的经济指标的增长速度,相似度比较模块比较待测年份与历史年份经济指标增长速度的相似度,数据处理模块将最相似的年份的数据代替最相异年份的数据,对历史数据有选择地取舍,实现了对逐年负荷预测历史数据的预处理。
文档编号G06F19/00GK101976301SQ201010503939
公开日2011年2月16日 申请日期2010年10月9日 优先权日2010年10月9日
发明者付超, 徐政, 李智勇, 陈志刚 申请人:广东省电力设计研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1