本申请涉及电力系统规划与调度运行技术领域,尤其涉及以一种用于预测行业用电量的空间协同预测方法。
背景技术:
行业用电量在全社会用电量占有较高比重,而不同行业用电量的影响因素不同且电能消费特性存在差异,导致变化规律也各有特点,针对典型行业用电量预测方法开展研究,不仅可以进一步提高地区总电量的预测准确度,同时也具有理论研究价值。
传统的行业用电量的预测研究多在单一地区的不同时间尺度上开展,随着区域协调发展战略的不断推进,不同地区行业间的联系日益紧密,对地区行业用电量预测来说,传统的单维度历史序列分析已不能满足需求,因此,对行业用电量的预测研究逐渐从时间尺度延申至空间尺度。
目前,针对空间尺度下的行业用电量预测方面的研究多集中于空间负荷预测,现有技术中,公开了一种多尺度空间分辨率下的多级负荷预测方法,该方法是基于混合高斯分布与主成分分析的城市空间负荷预测方法,对多尺度空间分辨率下的负荷进行建模分析,并利用粒子群算法进行空间尺度上的多级协调。但是,发明人在本申请的研究过程中发现,采用前述方法对行业用电量进行预测时,在地区负荷影响因素识别方面可供选择因素较为单一,使得预测结果不精确。
技术实现要素:
本申请提供了用于预测行业用电量的空间协同预测方法,以解决采用现有技术中对行业用电量进行预测时,在地区负荷影响因素识别方面可供选择因素较为单一,使得预测结果不精确的问题。
本申请实施例提供一种用于预测行业用电量的空间协同预测方法,包括:
利用主成分分析,获得各地区相同行业的行业用电量的主导因素;
分别将各地区的行业用电量和其对应的主导因素组成地区数据集,将在同一截面下的各地区数据集组合,获得面板数据集;
对所述面板数据集进行平稳性检验,对通过所述平稳性检验的面板数据集,进行协整关系检验,以确定行业用电量与其对应的主导因素之间存在协整关系;
将通过协整关系检验之后的所述面板数据构建空间协同预测模型,利用所述空间协同预测模型预测行业用电量。
可选地,所述利用主成分分析,获得各地区相同行业的行业用电量的主导因素,包括:
从电力系统的历史统计数据中提取行业用电量及相关的社会经济发展指标;
利用pearson相关系数分析得到行业用电量与社会经济发展指标的相关性,获取相关性较高的经济发展指标;
利用主成分分析法对所述经济发展指标进行主成分提取,使用提取到的主成分构建行业用电量与相关因素的主成分方程;
根据所述主成分方程,计算得到相关因素对行业用电量增长的贡献度,将贡献度大的相关因素作为行业用电量的主导因素。
可选地,对所述面板数据集进行平稳性检验,对通过所述平稳性检验的面板数据集,进行协整关系检验,以确定行业用电量与其对应的主导因素之间存在协整关系,包括:
对所述面板数据集单位根检验,判断所述单位根检验的结果是否平稳,若否,则对所述面板数据集进行差分处理;
若是,则对所述面板数据进行协整检验,确定行业用电量与其对应的主导因素之间存在协整关系。
可选地,所述单位根检验采用llc检验、ips检验或breitung检验的一种或多种;
所述协整检验采用kao检验或pedroni检验的一种或多种。
可选地,所述将通过协整关系检验之后的所述面板数据构建空间协同预测模型,包括:
利用通过协整关系检验之后的所述面板数据构建回归模型,所述回归模型的表达式为:
pit=αi+βizit+εit,i=1,2,...n;t=1...t;
其中,pit为待回归预测变量,即在第i个截面下的第t个时间节点处行业用电量的观测值;zit为各自变量,代表第i个截面下的第t个时间节点处行业用电量的主导因素的样本观测值;αi为截距;βi为各行业用电量主导因素的系数项,εit为随机误差项;
利用f统计量,确定所述回归模型的系数类型,所述回归模型的系数类型包括变系数模型和固定系数模型;
利用hausman检验,确定所述回归模型的截距,进而确定所述回归模型的效应类型,随机效应模型或是固定效应模型;
根据系数类型和效应类型,得到空间协同预测模型。
本申请公开一种用于预测行业用电量的空间协同预测方法,所述方法包括:首先利用主成分分析,获得各地区相同行业的行业用电量的主导因素;然后分别将各地区的行业用电量和其对应的主导因素组成地区数据集,将在同一截面下的各地区数据集组合,获得面板数据集;接着对所述面板数据集进行平稳性检验,对通过所述平稳性检验的面板数据集,进行协整关系检验,以确定行业用电量与其对应的主导因素之间存在协整关系;最后将通过协整关系检验之后的所述面板数据构建空间协同预测模型,利用所述空间协同预测模型预测行业用电量。
采用前述的方法,可以实现多地区同一行用电量的预测,全面地反映不同地区行业用电量之间的内在联系,并且考虑到影响行业用电量的多种因素,提高了预测的准确性。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的用于预测行业用电量的空间协同预测方法的流程示意图;
图2是本申请一个实施例中一种用于预测行业用电量的空间协同预测方法的流程示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
本申请提供了用于预测行业用电量的空间协同预测方法,以解决采用现有技术中对行业用电量进行预测时,在地区负荷影响因素识别方面可供选择因素较为单一,使得预测结果不精确的问题。
参照图1,示出了一种用于预测行业用电量的空间协同预测方法,所述方法包括:
步骤s1,利用主成分分析,获得各地区相同行业的行业用电量的主导因素。
本步骤中,首先对影响行业用电量的主导因素进行提取,地区总用电量由各行业电量及生活用电组成,由于地区经济发展阶段影响,我国绝大多数地区行业总用电量比重占有绝对主导地位。不同行业用电影响因素不同,由于电能消费特性存在差异,导致变化规律也各有特点,为了准确地对行业用电量进行用电分析,在建立空间协同预测模型之前需要对影响行业电量增长的主导因素进行提取识别。
步骤s2,分别将各地区的行业用电量和其对应的主导因素组成地区数据集,将在同一截面下的各地区数据集组合,获得面板数据集。
本实施例中,面板数据是多个个体在某一时间点构成的截面数据,对行业用电量面板数据来说,面板数据集既包括单地区行业历史用电量数据,又包括不同地区行业用电量在同一时间点的截面数据,面板数据相较于传统单时间序列数据通常具有以下优点:1)面板数据的观测值维度有一定的提升,在抽样估计时提高了精度,有助于提升分析结果的准确性和普适性;2)在对面板数据进行建模的过程中可以加入虚拟变量或是对随机误差项进行分解,以更全面地分析提取行业用电量影响因素特征;3)基于面板数据的建模相较于单时间序列反映了更多动态信息与实证结果,在解决实际问题中适应性更强;4)面板数据由于其数据维度的复杂度提升可以构造相关性更复杂的实证模型。
因此,基于面板数据的特性,采用面板回归模型对行业用电量进行空间协同建模预测,有助于全面地反映不同地区行业用电量之间的内在联系,也能使地区行业用电量数据得到更为有效的利用。
步骤s3,对所述面板数据集进行平稳性检验,对通过所述平稳性检验的面板数据集,进行协整关系检验,以确定行业用电量与其对应的主导因素之间存在协整关系。
为避免步骤s2中得到的面板数据集出现异常,形成伪回归,首先要对上述面板数据集进行检验,检验包括平稳性检验和协整关系检验,首先进行平稳性检验,通过之后再进行协整关系检验,以确保行业用电量与其对应的主导因素之间存在协整关系。
步骤s4,将通过协整关系检验之后的所述面板数据构建空间协同预测模型,利用所述空间协同预测模型预测行业用电量。
本步骤是基于面板数据建立空间协同预测模型,然后再利用空间协同预测模型预测行业用电量,该模型可以预测未来各行业用电的用电量,可以为电网规划提供有利参考,同时也为地区的电力调度规划部门的工作提供参考。
本申请实施例公开的一种用于预测行业用电量的空间协同预测方法,通过引入主成分分析得到影响行业用电量的主导因素,并结合空间计量经济学理论中的面板数据的概念,通过对面板回归模型进行改进来实现行业用电量的空间协同预测分析,采用该方法可以实现多地区同一行用电量的预测,全面地反映不同地区行业用电量之间的内在联系,提高了预测的准确性。
进一步地,步骤s1中,利用主成分分析,获得各地区相同行业的行业用电量的主导因素,包括以下步骤:
从电力系统的历史统计数据中提取行业用电量及相关的社会经济发展指标;
利用pearson相关系数分析得到行业用电量与社会经济发展指标的相关性,获取相关性较高的经济发展指标;
利用主成分分析法对所述经济发展指标进行主成分提取,使用提取到的主成分构建行业用电量与相关因素的主成分方程;
根据所述主成分方程,计算得到相关因素对行业用电量增长的贡献度,将贡献度大的相关因素作为行业用电量的主导因素。
本实施例中,是从行业用电量的众多因素系统性影响角度出发,利用主成分分析法对相关社会经济发展指标进行降维处理,提取各经济因素对行业电量增长的贡献度。主成分分析(principalcomponentanalysis,pca)的实质是一种化繁为简、将指标数尽可能压缩的降维(即空间压缩)技术,也是一种综合评价方法。主成分分析的目的是通过分析原来较多可观测指标之中所反映的个体信息,从中提取出较少的综合性指标,该分析方法的基本任务是根据样本的观测值确定应该构造多少个综合指标(主成分),并构造出各主成分的表达式,其一般实现步骤如下:1)输入样本观测值;2)根据样本观测值,计算各指标的样本均值和样本标准差;3)根据样本均值和样本标准差,对样本标准化,计算样本相关阵:4)求矩阵的特征值及特征向量;5)建立主成分,按累积方差贡献率。
本实施例是基于上述主成分分析理论,构建各地区行业用电的主导因素,首先从电力系统的历史统计数据中提取行业用电量及相关的社会经济发展指标,然后基于pearson相关系数分析得到行业用电量与社会经济发展指标的相关性的大小,获取相关性较高的经济发展指标,接着利用主成分分析法对所述经济发展指标进行主成分提取,使用提取到的主成分构建行业用电量与相关因素的主成分方程;最后,根据所述主成分方程,计算得到相关因素对行业用电量增长的贡献度大小,将贡献度大的相关因素作为行业用电量的主导因素。
进一步地,步骤s3中,对所述面板数据集进行平稳性检验,对通过所述平稳性检验的面板数据集,进行协整关系检验,以确定行业用电量与其对应的主导因素之间存在协整关系,包括以下步骤:
对所述面板数据集单位根检验,判断所述单位根检验的结果是否平稳,若否,则对所述面板数据集进行差分处理;
若是,则对所述面板数据进行协整检验,确定行业用电量与其对应的主导因素之间存在协整关系。
在构建基于面板数据的行业用电量空间协同预测模型之前,为了避免出现“伪回归”,需要对待分析数据集,即面板数据集,进行平稳性检验,本实施例中的平稳性检验是采用面板单位根检验法,具体包括以下3种:llc检验、ips检验、breitung检验,以下分别介绍上述三种检验方法:
llc检验:根据其数学定义,llc检验方程的表达式如下:
yu=ρiyi,t-1+γzit+uit,i=1,2,...n;t=1...t(1);
其中:yi,t-1为yit的一阶滞后项,ρi为具体的滞后期,uit为平稳过程,zit代表以固定效应或时间趋势,通常可以表示为常数,经过差分化处理后可得到上述方程的差分形式,其表达式如下:
δyit=δiyi,t-1+αi+βi+uit(2);
其中:δi=ρi-1,根据llc检验的假设,uit代表均值为0的独立同分布序列,另外对所有的i都有δi=δ,llc检验的原假设条件为h0:δ=0;相应的备选条件为:h0:δ﹤0;llc检验所选用的检验统计量t为统计量,原假设成立代表存在单位根,即该序列是一个非平稳的过程;相应的若原假设不成立,则代表存在单位根,即该序列是一个平稳的序列,llc检验方法适用于观测值与个体的维度在中等范围内的面板数据序列。
ips检验:根据其数学定义,ips测试的adf模式如下:
ips检验的原假设条件为:h0:αi=0;相应的备选条件为:h0:αi≠0。在对各单元进行单位根检验检查之后,获得αi的t统计量为
若原假设成立代表存在单位根,即该序列是一个非平稳的过程;相应的若原假设不成立,则代表存在单位根,即该序列是一个平稳的序列,ips检验方法相较于llc检验法放松了对时间序列同质性假设的限制条件,应用更加广泛。
breitung检验:与上述llc检验类似,breitung检验要求面板数据序列自身具有相同的自回归系数,然而不同之处在于breitung检验在进行回归分析之前需要对数据进行相应的转化预处理,以适应标准化的t统计分析量,该领域学者breitung通过进行多次的montecarlo数值模拟试验,分析得到该种检验方法适用于规模中等(n=20,t=30)的面板数据序列。
经过上述检验之后,若行业用电量的面板数据集未通过平稳性检验,可通过差分处理或取自然对数的方法对原数据序列进行处理,重复上述过程直至面板数据达到平稳。
经过上述平稳性检验之后,进一步引入面板协整关系检验来检验变量之间的中长期均衡关系,针对行业用电量通常用来检验行业用电量及其相关影响因素之间的协整关系。本实施例基于行业用电量面板数据的特征,可以利用以下两种方法进行面板协整检验:
kao检验:kao检验是一种针对同质类型的面板数据定义的一种协整检验理论方法,其数学模型表达式为:
yu=αi+βit+εit,i=1,2,...n;t=1...t(5);
基于e-g两步法的基础,定义该检验的原假设条件为h0:ρ=1,该假设是以adf检验为基础,详细的数学表达式为:
pedroni检验:在此种检验方法的定义下,基于以下回归方程式:
yit=αi+βixit+tδi+uit(8);
基于上式得到其残差序列,测试其残差的稳定性:
定义原假设和备选假设如下:h0:ρi=1,h0:ρi﹤1,pedroni检验包含7个完备定义的检验统计量,具体可参见现有技术,在此不做详细描述。
进一步地,在步骤s4中,所述将通过协整关系检验之后的所述面板数据构建空间协同预测模型,包括以下步骤:
基于面板数据的截面性质,可以得到比单独的时间序列更复杂的结构模型,针对行业用电量的特征利用通过协整关系检验之后的所述面板数据建立行业用电量面板回归模型,所述回归模型的表达式为:
pit=αi+βizit+εit,i=1,2,...n;t=1...t(11);
其中,pit为待回归预测变量,即在第i个截面下的第t个时间节点处行业用电量的观测值;zit为各自变量,代表第i个截面下的第t个时间节点处行业用电量的主导因素的样本观测值;αi为截距;βi为各行业用电量主导因素的系数项,εit为随机误差项;
利用f统计量,确定所述回归模型的系数类型,也就是回归模型系数设定:基于以上模型定义,需要控制部分不可观测的序列特性,定义以下假设:
即模型中的自变量系数在各横截面上取值完全相同,为了检验该假设构建f统计量如下:
其中:rssr代表在约束条件下模型的残差平方和,rrsu代表无约束下的模型残差平方和,ku代表无约束条件下的解释变量个数,kr代表约束条件下的解释变量个数,m代表样本个数。
当rssr和rrsu存在显著差异,此时f统计量的值大于临界值,拒绝原假设,即模型中的自变量系数在各横截面上取值不完全相同,需要建立变系数的面板回归模型;否则接受原假设,建立固定系数的面板回归模型。
确定模型系数的类型之后,再根据截距项设定回归模型是确定选择随机效应模型或是固定效应模型。这里引入hausman检验法来判断构造模型的类型,该检验法可以用于检验个体的随机效应,同时也被广泛应用于定量描述变量的正交性,一般情况下,hausman检验法构造wald统计量定义如下:
式中:
按以上定义,可以基于此统计量判断模型的随机效应或是固定效应。显著性水平阈值可按经验确定,若检验得到的统计量w小于x2分布的临界值,则在该显著水平下接受原假设,即优先选择随机效应模型;相应地若检验得到的统计量w大于x2分布的临界值,则在该显著水平下拒绝原假设,即优先选择固定效应模型。
最后根据系数类型和效应类型,得到空间协同预测模型。
基于上述公开的方案,本申请实施例提供了一个实施例的完整流程图,参照图2,图2中首先对n个地区的行业用电分别进行主成分分析,得到主成分因子,也就是行业用电的主导因素,主导因素与行业用电量组成地区数据集,各地区数据集取同一截面的数据组成面板数据,然后对面板数据集进行单位根检验,如果检验结果不平稳,则对面板数据进行差分处理,直至数据平稳,之后再对面板数据集进行协整检验,利用上述面板数据集建立模型,然后经过f统计量检验确定是变系数模型或者固定系数模型,hausman检验确定是固定效应或者随机效应,最后建立空间协同预测模型,然后利用空间协同预测模型预测行业用电量,得到预测结果。
本申请实施例还公开了使用上述公开的预测方法进行预测的具体案例分析,具体过程如下:
主导因素的获取:
选取地理位置较为接近的南方五个省份1993-2018年度行业用电量作为研究对象,为方便表示分别以地区a、地区b、地区c、地区d、地区e指代。
分别对五个地区非金属行业用电量进行主成分因子的提取及主成分方程的建立,结果如表1所示,表1是五个地区非金属行业第一主成分提取结果。
表1
五个地区的主成分表达分别如下:
(1)地区a:
设主成分为zna,列出主成分与相关指标的函数关系:
zna=0.506827xaa+0.509117xac+0.484971xai+0.498728xap(15);
其中,xaa为地区gdp的归一化值、xac为第二产业gdp的归一化值、xai为消费品零售总额的归一化值、xap为水泥产量的归一化值。
(2)地区b:
设主成分为znb,列出主成分与相关指标的函数关系:
znb=0.499410xba+0.500784xbc+0.499837xbj+0.499968xbp(16);
其中,xba为地区gdp的归一化值、xbc为第二产业gdp的归一化值、xbj为大型工业增加值的归一化值、xbp为水泥产量的归一化值。
(3)地区c:
设主成分为znc,列出主成分与相关指标的函数关系:
znc=0.500402xca+0.500685xcc+0.5000648xcj+0.498262xcp(17);
其中,xca为地区gdp的归一化值、xcc为第二产业gdp的归一化值、xcj为大型工业增加值的归一化值、xcp为水泥产量的归一化值。
(4)地区d:
设主成分为znd,列出主成分与相关指标的函数关系:
znd=0.503092xda+0.503967xdc+0.503406xdj+0.489385xdp(18);
其中,xda为地区gdp的归一化值、xdc为第二产业gdp的归一化值、xdj为大型工业增加值的归一化值、xdp为水泥产量的归一化值。
(5)地区e:
设主成分为zne,列出主成分与相关指标的函数关系:
zne=0.501800xea+0.498565xec+0.500015xei+0.499614xep(19);
其中,xea为地区gdp的归一化值、xec为第二产业gdp的归一化值、xei为消费品零售总额的归一化值、xep为水泥产量的归一化值。
分析结果表明,不同地区同一行业电量的主导因素不完全相同;将上述五个地区1993-2018年的非金属行业用电量以及相应的主成分组合得到面板数据集,其中五个地区的非金属行业用电量面板数据定义为p,主成分面板数据定义为z。
对上述提取得到的行业用电量面板数据集及相应主成分的面板数据取自然对数以消除原始数据在量级上的差距,同时也消除原始数据之间的异方差性,分别得到lnp与lnz,这种自然对数变换并不会影响变量之间的长期协整关系和短期波动。
平稳性以及协整关系检验:
(1)面板单位根检验
由于本章使用的面板数据截面数较少(即n<t),故选用llc检验法、ips检验法以及breintung检验法共同确定其平稳性。若在1%置信水平下,三种检验方法得到的结果都显示拒绝原假设,则认为面板数据是平稳的;反之,则不平稳。同时对地区非金属行业用电量以及主成分的0阶和1阶差分的数据进行单位根检验,结果如表2所示,表2是地区非金属行业用电量及主成分的单位根检验结果。
表2
由上表结果可知,原序列lnp与lnz均为非平稳数据,经过一阶差分后,在1%的置信水平下拒绝原假设,即一阶差分后的lnp与lnz是平稳序列,且为同阶单整,可以进一步进行面板协整检验。
(2)面板协整检验
由前述的单位根检验结果,对一阶差分后的δlnp与δlnz进一步进行面板协整检验,这里选用kao检验与pedroni检验,具体检验结果如表3所示,表3是地区非金属行业用电量及主成分的面板协整检验结果。
表3
由表3结果可知,在5%的置信水平下两种检验方法均拒绝原假设,δlnp与δlnz面板数据序列之间存在协整关系,因此,进行进一步的模型回归是有意义的。
空间协调预测模型的实现及结果分析:
(1)模型系数设定
利用f统计量检验识别确认面板回归模型选择变系数模型或是固定系数模型,检验结果如表4所示,表4是地区非金属行业用电量面板回归模型f统计量检验结果:
表4
由上表结果可知,f统计量检验值大于f统计量临界值,在5%的置信水平下拒绝原假设,优先选择变系数模型。
(2)截距项设定
进一步利用hausman检验识别确认面板回归模型最后选择固定效应模型或是随机效应模型,检验结果如表5所示,表5是地区非金属行业用电量面板回归模型hausman检验结果:
表5
由上表检验结果可知,在1%的置信水平下接受原假设,优先选择随机效应模型。
基于以上各项检验得到的结论,对δlnp与δlnz面板数据序列进行变系数随机效应模型回归,回归模型形如公式(11),具体结果如表6所示,表6是地区非金属行业变系数随机效应模型回归结果:
表6
模型表达式如下:
δlnp=βδlnz+α(20);
其中:β=(1.3165,0.8956,1.0246,1.6987,1.2354),α=(0.3498,0.2417,0.7551,0.6324)。
上述模型拟合度r2=0.9584,拟合效果较好,利用该变系数随机效应面板回归模型对上述5个地区2018年非金属行业用电量进行预测,同时以基于主成分因子的主成分回归年度预测模型分别对5个地区2018年非金属行业用电量进行预测,以进行对比,具体结果如表7所示,表7是地区非金属行业用电量变系数随机效应面板回归模型预测结果及误差对比(亿千瓦时):
表7
由上表可知,除地区d之外,其他地区利用变系数随机效应面板回归模型得到的2018年地区非金属用电量预测结果均优于主成分回归法得到的预测值,而且从整体预测误差来看,变系数随机效应面板回归预测模型结果的mape值小于主成分回归法结果的mape值,且模型整体易用性更强。
由以上公开的示例可知,本申请公开的用于行业用电量预测的空间协同预测方法,针对不同地区相同行业用电量影响因素的差异性,提出利用主成分分析提取得到的主成分因子替换面板回归中相应截面的主导因素,使面板数据可以进行回归分析。
进一步地,由实例分析可得本申请建立的基于面板变系数随机效应回归模型的空间协同预测模型可实现多个地区相同行业用电量的协同预测,且该模型整体预测精度相较于分地区单独进行主成分回归预测的精度有所提升。
另外,由于不同地区行业用电量增长主导因素存在差异,本申请提出利用提取出的主成分因子替代截面下的影响因素构建面板数据集,后续若能进一步扩大地区范围及影响因素的样本容量,可建立面板数据的多元回归模型,进一步提高面板回归模型的预测精度。
以上结合具体实施方式和范例性实例对本申请进行了详细说明,不过这些说明并不能理解为对本申请的限制。本领域技术人员理解,在不偏离本申请精神和范围的情况下,可以对本申请技术方案及其实施方式进行多种等价替换、修饰或改进,这些均落入本申请的范围内。本申请的保护范围以所附权利要求为准。