一种架空线路工程可研阶段的风速区间预测方法和装置

文档序号:33480091发布日期:2023-03-15 11:53阅读:118来源:国知局
一种架空线路工程可研阶段的风速区间预测方法和装置

1.本发明涉及数据预处理与识别技术领域,尤其涉及一种架空线路工程可研阶段的风速区间预测方法和装置。


背景技术:

2.由于长期气象台站分布较为稀疏,其观测场多位于市郊边界区或近郊,随着城市化进程加快,测风环境普遍退化,不能客观反映线路工程所经过的野外开阔地、山岭迎风坡和滨海强风区等不同地区的风速空间分布规律。新疆地区地广人稀,由于风速的变化直接对于工程造价具有直接影响,设计风速是架空输电线路设计的关键参数,设计风速取值直接关系到线路工程的经济性、安全性和适用性。目前架空输电线路设计风速主要依据线路走廊附近长期气象台站的风速资料,准确性有待提升。因此对风速进行准确预测,在可研阶段对风速的科学估算,能够对设备选型,方案制定等提供一定支撑与参考,对精准造价、提高经济效益和市场竞争力具有重要意义。
3.长期以来,国内外学者对风速的预测方法进行了大量探索与研究,并使用点预测方法取得了一定的预测成果,然而点预测方法难以描述风速随机性,无法确保预测的可靠性。


技术实现要素:

4.鉴于上述的分析,本发明实施例旨在提供一种架空线路工程可研阶段的风速区间预测方法和装置,用以解决现有方法对于当前风速确定精准性不高的实际问题,所构建模型无法体现对不同线路工程可研阶段的风速参数进行科学估算的问题。
5.一方面,本发明实施例提供了一种架空线路工程可研阶段的风速区间预测方法,包括:收集历史风速数据,并对所述历史风速数据进行预处理,其中,所述预处理包括数据修正、连续性检验,以及异常值与缺失值处理;结合变分模态分解方法,将风速分解为多个子序列,并根据样本熵将所述多个子序列重构为稳定趋势序列、有序波动序列和无序震荡序列,然后基于模糊信息粒化,对所述无序震荡序列的极大值、极小值和平均值进行识别与提取;以及采用粒子群优化的神经网络分别构建所述稳定趋势序列、所述有序波动序列、极大值序列、极小值序列以及平均值序列的预测模型,并将所述预测模型的预测结果进行叠加,确定架空线路工程可研阶段的风速区间。
6.上述技术方案的有益效果如下:结合变分模态分解方法,对风速分解为多个子序列,并根据样本熵对子序列进行重构,包括稳定趋势、有序波动和无序震荡三个部分以提升预测的精准性,然后基于模糊信息粒化理论,对无序震荡部分的极大值、极小值以及平均值进行识别与提取。采用改进粒子群优化gru网络结构,有效提高区间覆盖率,降低平均误差,预测区间可信度更高。
7.基于上述方法的进一步改进,所述历史风速数据包括国家气象台站历史沿革和历年最大10分钟平均风速观测数据、区域自动气象站10分钟平均风速观测数据、不同电压等
级已建线路工程杆塔坐标、设计风速、风灾事故和基础地理信息数据。
8.基于上述方法的进一步改进,所述历史风速数据包括间断风速数据和连续风速数据,其中,对所述历史风速数据进行预处理包括:对所述间断风速数据中的间断前风速序列和间断后风速序列进行显著性检验以验证数据的连续性并采用幂指数公式对所述间断风速数据进行修正;采取异常值处理法对连续风速数据中的异常数据进行分段清洗,通过四点插值细分算法对清洗后的异常数据进行重构;对于显著偏大或偏小的所述历史风速数据进行分析,通过天气系统过程分析、台站间对比分析和不同气象要素相关分析确定数据记录是否可靠。
9.基于上述方法的进一步改进,对所述间断风速数据中的间断前风速序列和间断后风速序列进行显著性检验以验证数据的连续性并采用幂指数公式对所述间断风速数据进行修正包括:所述间断前风速序列为x1,x2,

,x
n1
,所述间断后风速序列为l1,l2,

,l
n2
,所述间断前风速序列和所述间断后风速序列的平均值为全部风速数据的平均值
[0010][0011]
所述全部风速数据对于所述平均值的偏差平方和为:
[0012][0013]
通过以下公式判断所述间断前风速序列和所述间断后风速序列进行显著性检验以验证所述间断风速数据的连续性:
[0014][0015]
采用以下幂指数公式修正所述间断风速数据中的异常数据:
[0016][0017]
其中,v为标准高度风速,z为气象台站历史沿革中记录的风速仪高度,v0为风速仪观测风速,α为空旷平坦地区地面粗糙度系数,取值0.15;
[0018]
采用以下线性回归模型进行风速此时换算:
[0019]v10
=av2+b;
[0020]
其中,v
10
是10分钟平均风速最大值序列,v2是2分钟平均风速最大值序列,从有风速自记的台站中挑选年自记10分钟平均最大风速值,并将其换算到标准高度以得到v
10
序列;从相应台站的相同年份中挑选定时2分钟平均最大风速值并换算到标准高度以得到v2序列;根据最小二乘法求常数a、b。
[0021]
基于上述方法的进一步改进,采取异常值处理法对连续风速数据中的异常数据进行分段清洗,通过四点插值细分算法对清洗后的异常数据进行重构包括:将所述历史风速数据划分成s个区间,所述s个区间中的第i个风速-功率区间的功率数据样本为pi={p
i,1
,p
i,2
,

,p
i,m
},其中,i=1,2,

,s,p
i,1
≤p
i,2


≤p
i,m
,以及m为每个风速-功率区间内功率
点的个数;通过以下公式计算所述第i个风速-功率区间内的功率平均值:
[0022][0023]
其中,p
i,j
为第i个风速-功率区间内的各功率点的功率值;通过以下公式计算所述第i个风速-功率区间内的功率点数据的标准差:
[0024][0025]
通过以下公式计算所述第i个风速-功率区间内的每个功率点数据的偏差绝对值:
[0026][0027]
当在所述第i个风速-功率区间中的功率点数据的偏差绝对值δ
i,j
最大时,所述功率点数据是要被剔除的异常值;通过以下公式计算τ值:
[0028][0029]
其中,t为功率样本数据的t分布值;α为显著性水平,其值影响功率数据的充裕度,当δ
i,j
≥τsi时,功率点数据为异常点,当δ
i,j
≤τsi时,所述功率点数据为正常点。
[0030]
基于上述方法的进一步改进,通过四点插值细分算法对清洗后的异常数据进行重构包括:将所述清洗后的异常数据从小到大排列并分成四等份,将处于3个分割点位置的数据作为四分位数,通过以下公式计算第二分位数mi:
[0031][0032]
mi为功率数据样本p
i'
数据的中位数,第一分位数、第三分位数分别表示p
i'
中分割前、后25%功率数据点的位置的数值;当m为偶数时,通过mi将p
i'
划分为长度相同的两个序列p
i_1
={p
i,1
,p
i,2
,

,p
i,(m-1)/2
}和p
i_2
={p
i,(m+1)/2
,p
i,(m+3)/2
,

,p
i,m
},q
1,i
为p
i_1
的中位数,q
3,i
为p
i_2
的中位数,当m=4k+3(k=0,1,...)时,通过以下公式计算q
1,i
和q
3,i

[0033][0034]
当m=4k+1(k=0,1,...)时,通过以下公式计算q
1,i
和q
3,i

[0035][0036]
通过以下公式计算p
i'
的四分位间距ii:
[0037]ii
=q
3,i-q
1,i

[0038]
通过以下公式计算的上限w
u,i
、下限w
d,i
来排除数据中的异常值:
[0039]wu,i
=q
3,i
+1.5ii;
[0040]wd,i
=q
1,i-1.5ii;
[0041]
在识别出误差后,通过四点插值细分算法利用相邻的4个风速对应功率值来计算待插补功率点:
[0042][0043]
其中,p
i-1
,pi,p
i+1
,p
i+2
分别为与所述待插补功率点最接近的4个风速对应功率值;ω为张量参数,当ω∈[0,0.125]时,获得插值点。
[0044]
基于上述方法的进一步改进,结合变分模态分解方法,将风速分解为多个子序列,并根据样本熵将所述多个子序列重构为稳定趋势序列、有序波动序列和无序震荡序列,然后基于模糊信息粒化,识别与提取所述无序震荡序列的极大值、极小值和平均值包括:对于每个模式函数uk(t),通过希尔伯特变换计算相应的分析信号以获得其单边频谱:
[0045][0046]
其中,δ(t)为狄拉克函数;k为需要分解的模态个数;对于所述每个模式函数uk(t),通过混叠与模式函数uk(t)对应的中心频率ωk的指数项e-jωkt
,将每个模态的频谱调制到相应的基本频带:
[0047][0048]
使用调解信号的高斯平滑方法估计每个模式信号的带宽以解决约束条件下变分问题,目标函数为:
[0049][0050]
通过变分模态原始风速序列分解为k个子序列,并基于样本熵值获得稳定趋势序列、有序波动序列、无序震荡序列;采用模糊信息粒化方法对所述无序震荡序列进行处理,得到每个窗口的最小值、平均值和最大值;采用以下隶属函数对所述每个窗口建立模糊信息粒子:
[0051][0052]
其中,x为风速序列,a、m、b为模糊粒化窗口的每个模糊信息粒子的最小值、平均值、最大值。
[0053]
基于上述方法的进一步改进,采用粒子群优化的神经网络分别构建所述稳定趋势序列、所述有序波动序列、极大值序列、极小值序列以及平均值序列的预测模型包括:对所述稳定趋势序列、所述有序波动序列、所述极大值序列、所述极小值序列以及所述平均值序
列分别建立粒子群优化pso的门控循环单元gru预测模型,并通过所述pso对嵌入维数m、延迟时间τ、隐藏层节点数l进行联合优化;所述gru预测模型用于处理时间序列,将输入的历史信息通过门控的方式选择性的遗忘或保留,以对未来风速数据进行预测,所述gru预测模型包括训练部分和预测部分,所述预测部分包含输入层、隐藏层和输出层,根据样本损失采用梯度下降算法对所述gru预测模型进行训练,使得样本损失函数值最小,并更新各网络参数的权重:
[0054]zt
=σ(w
xz
x
t
+w
hzht-1
+bz);
[0055]rt
=σ(w
rz
x
t
+w
hrht-1
+br);
[0056][0057][0058]yt
=σ(w
hoht
+by);
[0059]
其中,相空间重构矩阵的相点作为网络输入x,序列x={x(1+mτ),x(2+mτ),...,x(m+mτ)}作为网络输出y,h为隐含层,σ为sigmoid激活函数,z
t
,r
t
分别为循环网络的更新门和重置门,w
xz
是t时刻输入层与更新门之间的权重;w
hz
是t-1时刻隐藏层与t时刻更新门之间的权重,w
xr
是t时刻输入层与重置门之间的权重,w
hr
是t-1时刻隐藏层与t时刻重置门之间的权重,w
ho
是t时刻隐藏层与输出层之间的权重,θ是矩阵的hadamard积。
[0060]
另一方面,本发明实施例提供了一种架空线路工程可研阶段的风速区间预测装置,包括:数据获取模块,用于收集历史风速数据;预处理模块,用于对所述历史风速数据进行预处理,其中,所述预处理包括数据修正、连续性检验,以及异常值与缺失值处理;分解重构模块,用于结合变分模态分解方法,将风速分解为多个子序列,并根据样本熵将所述多个子序列重构为稳定趋势序列、有序波动序列和无序震荡序列,然后基于模糊信息粒化,对所述无序震荡序列的极大值、极小值和平均值进行识别与提取;以及预测模块,用于采用粒子群优化的神经网络分别构建所述稳定趋势序列、所述有序波动序列、极大值序列、极小值序列以及平均值序列的预测模型,并将所述预测模型的预测结果进行叠加,确定架空线路工程可研阶段的风速区间。
[0061]
基于上述装置的进一步改进,所述历史风速数据包括间断风速数据和连续风速数据,其中,所述预处理模块,用于对所述间断风速数据中的间断前风速序列和间断后风速序列进行显著性检验以验证数据的连续性并采用幂指数公式对所述间断风速数据进行修正;采取异常值处理法对连续风速数据中的异常数据进行分段清洗,通过四点插值细分算法对清洗后的异常数据进行重构;以及对于显著偏大或偏小的所述历史风速数据进行分析,通过天气系统过程分析、台站间对比分析和不同气象要素相关分析确定数据记录是否可靠。
[0062]
与现有技术相比,本发明至少可实现如下有益效果之一:
[0063]
1、首先对数据进行观测资料一致性和数据记录可靠性审查。对于显著偏大或偏小的风速数据进行分析,通过天气系统过程分析、台站间对比分析、不同气象要素相关分析审定数据记录可靠与否。针对连续和不连续,异常值分别提出相应方法,提升数据的精确性。针对间断数据采取分序列显著性检验的方式,通过将间断前后序列数据进行显著性检验,验证数据的连续性,采用幂指数公式对数据进行修正。针对连续数据采取异常值识别法对异常数据进行分段清洗,通过四点插值细分算法对清洗后的异常数据进行重构。
[0064]
2、针对风险数据系列方面,结合变分模态分解方法,对风速分解为多个子序列,并根据样本熵对子序列进行重构,包括稳定趋势、有序波动和无序震荡三个部分以提升预测的精准性,然后基于模糊信息粒化理论,对无序震荡部分的极大值、极小值以及平均值进行识别与提取;形成预测的五个子模块,并进行预测,直接对风速序列建立区间预测模型预测精度较低,使用适当的数据预处理方法可显著提高预测精度。
[0065]
3、采用改进粒子群优化gru网络结构,有效提高区间覆盖率,降低平均误差,预测区间可信度更高;相比于浅层神经网络,基于gru建立的预测模型在单步及多步区间预测时均能动态追踪风速信号的变化,有较强的学习能力及较高的预测精度。
[0066]
本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。
附图说明
[0067]
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
[0068]
图1为根据本发明实施例的架空线路工程可研阶段的风速区间预测方法的流程图;
[0069]
图2为根据本发明实施例的变分模态分解与重构的框图;
[0070]
图3为根据本发明实施例的原始风速时间序列的曲线图;
[0071]
图4为根据本发明实施例的门控循环单元gru的预测框图;
[0072]
图5a、图5b、图5c、图5d和图5e分别为根据本发明实施例的稳定趋势序列、有序波动序列、极大值序列、平均值序列以及极小值序列的曲线图;
[0073]
图6为根据本发明实施例的门控循环单元gru的权值初始化过程的流程图;以及
[0074]
图7为根据本发明实施例的架空线路工程可研阶段的风速区间预测装置的框图。
具体实施方式
[0075]
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本技术一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
[0076]
参考图1,本发明的一个具体实施例,公开了一种架空线路工程可研阶段的风速区间预测方法,包括:在步骤s102中,收集历史风速数据,并对历史风速数据进行预处理,其中,预处理包括数据修正、连续性检验,以及异常值与缺失值处理;在步骤s104中,结合变分模态分解方法,将风速分解为多个子序列,并根据样本熵将多个子序列重构为稳定趋势序列、有序波动序列和无序震荡序列,然后基于模糊信息粒化,对无序震荡序列的极大值、极小值和平均值进行识别与提取;以及在步骤s106中,采用粒子群优化的神经网络分别构建稳定趋势序列、有序波动序列、极大值序列、极小值序列以及平均值序列的预测模型,并将预测模型的预测结果进行叠加,确定架空线路工程可研阶段的风速区间。
[0077]
与现有技术相比,本实施例提供的架空线路工程可研阶段的风速区间预测方法中,结合变分模态分解方法,对风速分解为多个子序列,并根据样本熵对子序列进行重构,
包括稳定趋势、有序波动和无序震荡三个部分以提升预测的精准性,然后基于模糊信息粒化理论,对无序震荡部分的极大值、极小值以及平均值进行识别与提取。采用改进粒子群优化gru网络结构,有效提高区间覆盖率,降低平均误差,预测区间可信度更高。
[0078]
下文中,将参考图1对根据本发明实施例的架空线路工程可研阶段的风速区间预测方法的各个步骤进行详细说明。
[0079]
在步骤s102中,收集历史风速数据,并对历史风速数据进行预处理,其中,预处理包括数据修正、连续性检验,以及异常值与缺失值处理。具体地,历史风速数据包括国家气象台站历史沿革和历年最大10分钟平均风速观测数据、区域自动气象站10分钟平均风速观测数据、不同电压等级已建线路工程杆塔坐标、设计风速、风灾事故和基础地理信息数据。
[0080]
历史风速数据包括间断风速数据和连续风速数据,其中,对历史风速数据进行预处理包括:对间断风速数据中的间断前风速序列和间断后风速序列进行显著性检验以验证数据的连续性并采用幂指数公式对间断风速数据进行修正;采取异常值处理法对连续风速数据中的异常数据进行分段清洗,通过四点插值细分算法对清洗后的异常数据进行重构;以及对于显著偏大或偏小的历史风速数据进行分析,通过天气系统过程分析、台站间对比分析和不同气象要素相关分析确定数据记录是否可靠。
[0081]
具体地,对间断风速数据中的间断前风速序列和间断后风速序列进行显著性检验以验证数据的连续性并采用幂指数公式对间断风速数据进行修正包括:间断前风速序列为x1,x2,

,x
n1
,间断后风速序列为l1,l2,

,l
n2
,间断前风速序列和间断后风速序列的平均值为全部风速数据的平均值
[0082][0083]
全部风速数据对于平均值的偏差平方和为:
[0084][0085]
通过以下公式判断间断前风速序列和间断后风速序列进行显著性检验以验证间断风速数据的连续性:
[0086][0087]
采用以下幂指数公式修正间断风速数据中的异常数据:
[0088][0089]
其中,v为标准高度风速,z为气象台站历史沿革中记录的风速仪高度,v0为风速仪观测风速,α为空旷平坦地区地面粗糙度系数,取值0.15;
[0090]
采用以下线性回归模型进行风速此时换算:
[0091]v10
=av2+b;
[0092]
其中,v
10
是10分钟平均风速最大值序列,v2是2分钟平均风速最大值序列,从有风
速自记的台站中挑选年自记10分钟平均最大风速值,并将其换算到标准高度以得到v
10
序列;从相应台站的相同年份中挑选定时2分钟平均最大风速值并换算到标准高度以得到v2序列;根据最小二乘法求常数a、b。
[0093]
具体地,采取异常值处理法对连续风速数据中的异常数据进行分段清洗,通过四点插值细分算法对清洗后的异常数据进行重构包括:
[0094]
将历史风速数据划分成s个区间,s个区间中的第i个风速-功率区间的功率数据样本为pi={p
i,1
,p
i,2
,

,p
i,m
},其中,i=1,2,

,s,p
i,1
≤p
i,2


≤p
i,m
,以及m为每个风速-功率区间内功率点的个数;
[0095]
通过以下公式计算第i个风速-功率区间内的功率平均值:
[0096][0097]
其中,p
i,j
为第i个风速-功率区间内的各功率点的功率值;
[0098]
通过以下公式计算第i个风速-功率区间内的功率点数据的标准差:
[0099][0100]
通过以下公式计算第i个风速-功率区间内的每个功率点数据的偏差绝对值:
[0101][0102]
当在第i个风速-功率区间中的功率点数据的偏差绝对值δ
i,j
最大时,功率点数据是要被剔除的异常值;
[0103]
通过以下公式计算τ值:
[0104][0105]
其中,t为功率样本数据的t分布值;α为显著性水平,其值影响功率数据的充裕度,当δ
i,j
≥τsi时,功率点数据为异常点,当δ
i,j
≤τsi时,功率点数据为正常点。
[0106]
具体地,通过四点插值细分算法对清洗后的异常数据进行重构包括:将清洗后的异常数据从小到大排列并分成四等份,将处于3个分割点位置的数据作为四分位数,通过以下公式计算第二分位数mi:
[0107][0108]
mi为功率数据样本p
i'
数据的中位数,第一分位数、第三分位数分别表示p
i'
中分割前、后25%功率数据点的位置的数值;
[0109]
当m为偶数时,通过mi将p
i'
划分为长度相同的两个序列p
i_1
={p
i,1
,p
i,2
,

,p
i,(m-1)/2
}和p
i_2
={p
i,(m+1)/2
,p
i,(m+3)/2
,

,p
i,m
},q
1,i
为p
i_1
的中位数,q
3,i
为p
i_2
的中位数,当m=4k+3(k=0,1,...)时,通过以下公式计算q
1,i
和q
3,i

[0110][0111]
当m=4k+1(k=0,1,...)时,通过以下公式计算q
1,i
和q
3,i

[0112][0113]
通过以下公式计算p
i'
的四分位间距ii:
[0114]ii
=q
3,i-q
1,i

[0115]
通过以下公式计算的上限w
u,i
、下限w
d,i
来排除数据中的异常值:
[0116]wu,i
=q
3,i
+1.5ii;
[0117]wd,i
=q
1,i-1.5ii;
[0118]
在识别出误差后,通过四点插值细分算法利用相邻的4个风速对应功率值来计算待插补功率点:
[0119][0120]
其中,p
i-1
,pi,p
i+1
,p
i+2
分别为与待插补功率点最接近的4个风速对应功率值;ω为张量参数,当ω∈[0,0.125]时,获得插值点。
[0121]
在步骤s104中,结合变分模态分解方法,将风速分解为多个子序列,并根据样本熵将多个子序列重构为稳定趋势序列、有序波动序列和无序震荡序列,然后基于模糊信息粒化,对无序震荡序列的极大值、极小值和平均值进行识别与提取。
[0122]
具体地,结合变分模态分解方法,将风速分解为多个子序列,并根据样本熵将多个子序列重构为稳定趋势序列、有序波动序列和无序震荡序列,然后基于模糊信息粒化,识别与提取无序震荡序列的极大值、极小值和平均值包括:
[0123]
对于每个模式函数uk(t),通过希尔伯特变换计算相应的分析信号以获得其单边频谱:
[0124][0125]
其中,δ(t)为狄拉克函数;k为需要分解的模态个数;
[0126]
对于每个模式函数uk(t),通过混叠与模式函数uk(t)对应的中心频率ωk的指数项e-jωkt
,将每个模态的频谱调制到相应的基本频带;
[0127][0128]
使用调解信号的高斯平滑方法估计每个模式信号的带宽以解决约束条件下变分问题,目标函数为:
[0129][0130]
通过变分模态原始风速序列分解为k个子序列,并基于样本熵值获得稳定趋势序列、有序波动序列、无序震荡序列;
[0131]
采用模糊信息粒化方法对无序震荡序列进行处理,得到每个窗口的最小值、平均值和最大值;
[0132]
采用以下隶属函数对每个窗口建立模糊信息粒子:
[0133][0134]
其中,x为风速序列,a、m、b为模糊粒化窗口的每个模糊信息粒子的最小值、平均值、最大值。
[0135]
在步骤s106中,采用粒子群优化的神经网络分别构建稳定趋势序列、有序波动序列、极大值序列、极小值序列以及平均值序列的预测模型,并将预测模型的预测结果进行叠加,确定架空线路工程可研阶段的风速区间。
[0136]
具体地,采用粒子群优化的神经网络分别构建稳定趋势序列、有序波动序列、极大值序列、极小值序列以及平均值序列的预测模型包括:
[0137]
对稳定趋势序列、有序波动序列、极大值序列、极小值序列以及平均值序列分别建立粒子群优化pso的门控循环单元gru预测模型,并通过pso对嵌入维数m、延迟时间τ、隐藏层节点数l进行联合优化;
[0138]
gru预测模型用于处理时间序列,将输入的历史信息通过门控的方式选择性的遗忘或保留,以对未来风速数据进行预测,gru预测模型包括训练部分和预测部分,预测部分包含输入层、隐藏层和输出层,根据样本损失采用梯度下降算法对gru预测模型进行训练,使得样本损失函数值最小,并更新各网络参数的权重:
[0139]zt
=σ(w
xz
x
t
+w
hzht-1
+bz);
[0140]rt
=σ(w
rz
x
t
+w
hrht-1
+br);
[0141][0142][0143]yt
=σ(w
hoht
+by);
[0144]
其中,相空间重构矩阵的相点作为网络输入x,序列x={x(1+mτ),x(2+mτ),...,x(m+mτ)}作为网络输出y,h为隐含层,σ为sigmoid激活函数,z
t
,r
t
分别为循环网络的更新门和重置门,w
xz
是t时刻输入层与更新门之间的权重;w
hz
是t-1时刻隐藏层与t时刻更新门之间的权重,w
xr
是t时刻输入层与重置门之间的权重,w
hr
是t-1时刻隐藏层与t时刻重置门之间的权重,w
ho
是t时刻隐藏层与输出层之间的权重,θ是矩阵的hadamard积。
[0145]
参考图7,本发明的一个具体实施例,公开了一种架空线路工程可研阶段的风速区间预测装置,包括:数据获取模块702,用于收集历史风速数据;预处理模块704,用于对历史风速数据进行预处理,其中,预处理包括数据修正、连续性检验,以及异常值与缺失值处理;分解重构模块706,用于结合变分模态分解方法,将风速分解为多个子序列,并根据样本熵将多个子序列重构为稳定趋势序列、有序波动序列和无序震荡序列,然后基于模糊信息粒化,对无序震荡序列的极大值、极小值和平均值进行识别与提取;以及预测模块708,用于采用粒子群优化的神经网络分别构建稳定趋势序列、有序波动序列、极大值序列、极小值序列以及平均值序列的预测模型,并将预测模型的预测结果进行叠加,确定架空线路工程可研阶段的风速区间。
[0146]
历史风速数据包括间断风速数据和连续风速数据,其中,预处理模块704用于对间断风速数据中的间断前风速序列和间断后风速序列进行显著性检验以验证数据的连续性并采用幂指数公式对间断风速数据进行修正;采取异常值处理法对连续风速数据中的异常数据进行分段清洗,通过四点插值细分算法对清洗后的异常数据进行重构;以及对于显著偏大或偏小的历史风速数据进行分析,通过天气系统过程分析、台站间对比分析和不同气象要素相关分析确定数据记录是否可靠。
[0147]
下文中,将参考图2至图6,以具体示例的方式对根据本发明实施例的架空线路工程可研阶段的风速区间预测方法进行详细说明。
[0148]
架空线路工程可研阶段的风速区间预测方法包括:收集历史数据,包括国家气象台和地区气象站的平均风速数据;对数据进行预处理,包括数据修正与连续性检验,以及异常值与缺失值处理;结合变分模态分解方法,对风速分解为多个子序列,并根据样本熵对子序列进行重构,包括稳定趋势、有序波动和无序震荡三个部分,然后基于模糊信息粒化理论,对无序震荡部分的极大值、极小值以及平均值进行识别与提取;最后运用粒子群优化的神经网络模型,分别构建上述5个模块的预测模型,并将子模块的预测结果进行叠加,实现可研阶段风速区间的科学确定。
[0149]
上述技术方案的有益效果如下:通过对于数据的收集,结合数据特点,从连续和不连续两个维度提出数据处理的主要方式,最终提高数据可靠性,保证风速确定结果的合理性。针对间断数据采取分序列显著性检验的方式,通过将间断前后序列数据进行显著性检验,验证数据的连续性,采用幂指数公式对数据进行修正。针对连续数据采取异常值识别法对异常数据进行分段清洗,通过四点插值细分算法对清洗后的异常数据进行重构。
[0150]
针对间断数据采取分序列显著性检验的方式,通过将间断前后序列数据进行显著性检验,验证数据的连续性,采用幂指数公式对数据进行修正。
[0151]
针对连续数据采取异常值识别法对异常数据进行分段清洗,通过四点插值细分算法对清洗后的异常数据进行重构。
[0152]
首先对数据进行观测资料一致性和数据记录可靠性审查。对于显著偏大或偏小的风速资料进行分析,通过天气系统过程分析、台站间对比分析、不同气象要素相关分析审定数据记录可靠与否。
[0153]
异常值处理法可用于在一个独立变量中发现孤立点。将风速按一定大小划分成s个区间,对各区间的异常功率数据点使用异常值法进行分段识别剔除。
[0154]
间断年之前(不包括该年)的风速序列为子序列1,其后的序列为子序列2。设子序
列1为x1,x2,...,x
n1
子序列2为l1,l2,...,l
n2
。子序列1和2的平均值分别为和全部数据平均值为
[0155][0156]
全部数据对于平均值的偏差平方和为:
[0157][0158]
判断组间差异是否显著,利用f检验方法来进行显著性检验(验证数据偏大还是偏小):
[0159][0160]
针对异常数据进行修正,包括风速高度订正和次时换算。
[0161]
风速高度订正采用幂指数公式:
[0162][0163]
其中v为标准高度风速,z为气象台站历史沿革中记录的风速仪高度,v0为风速仪观测风速,α为空旷平坦地区地面粗糙度系数,取值0.15。
[0164]
风速次时换算采用线性回归模型:
[0165]v10
=av2+b;
[0166]v10
是10分钟平均风速最大值序列。v2是2分钟平均风速最大值序列。从有风速自记的台站中,分别挑出年自记10分钟平均最大风速值,并将其换算到标准高度,得到v
10
序列。
[0167]
从相应台站的相同年份中挑出定时2分钟平均最大风速值,并换算到标准高度,得到v2序列。
[0168]
根据最小二乘法求常数a、b。
[0169]
针对连续数据,进行异常值检测,方法如下。
[0170]
将风速按一定大小划分成s个区间,记第i个风速-功率区间的功率数据样本为pi={p
i,1
,p
i,2
,..p
i,m
},其中i=1,2,...,s,p
i,1
≤p
i,2
≤...≤p
i,m
,m为每个风速-功率区间内功率点的个数。
[0171]
首先计算区间内功率数据的均值为:
[0172][0173]
式中:p
i,j
为第i个区间内的各功率值。
[0174]
第i个区间内功率数据的标准差为:
[0175]
[0176]
将区间内每一个功率样本数据的偏差绝对值记为
[0177][0178]
若在第i个区间中,被观察功率数据的偏差绝对值δ
i,j
最大,则该点可能是要被剔除的异常值。因为功率偏差值最大时,说明功率值在此区间最大或者最小,此时该点为功率异常值的可能性越大。
[0179]
thompson tau法中τ值的计算如下
[0180][0181]
式中:t为功率样本数据的t分布值;α为显著性水平,其值影响功率数据的充裕度。
[0182]
当δ
i,j
≥τsi时,所检测的功率值为异常点;反之若δ
i,j
≤τsi时,则所检测的功率值为正常点。当该功率值被检测为异常值时,则将该功率值予以剔除,再重新计算区间内的平均值和标准差。τ的值也会随着区间内功率数据个数变化而变化,直至没有发现新的功率异常值。
[0183]
通过上述方法完成首次识别后,各风速区间内剩余的功率点个数为m',为简化命名将区间内功率点个数m'仍记为m,首次识别完成后第i个风速-功率区间的功率数据样本为pi'={p
i',1
,p
i',2
,..p
i',m
},其中p
i',1
≤p
i',2
≤...≤p
i',m

[0184]
四分位数是一种统计学中的分位数,即把所有数据从小到大排列分成四等份,处于3个分割点位置的数据即为四分位数。第二分位数mi表示样本p
i'
数据的中位数,其计算式为。
[0185][0186]
第一、三分位数分别表示p
i'
中分割前、后25%数据点的位置所表示的数值。区间内数据点总量m不同,计算式略有差异。
[0187]
当m为偶数时,mi将p
i'
分成长度相同的两个序列p
i_1
={p
i,1
,p
i,2
,

,p
i,(m-1)/2
}和p
i_2
={p
i,(m+1)/2
,p
i,(m+3)/2
,

,p
i,m
}。q
1,i
为p
i_1
的中位数。q
3,i
为p
i_2
的中位数。
[0188]
当m=4k+3(k=0,1,...)时,计算式为
[0189][0190]
当m=4k+1(k=0,1,...)时,计算式为
[0191][0192]
得到p
i'
的四分位间距ii为
[0193]ii
=q
3,i-q
1,i

[0194]
四分位法中,用上限w
u,i
、下限w
d,i
来排除数据中的异常值,计算式分别为
[0195]wu,i
=q
3,i
+1.5ii;
[0196]wd,i
=q
1,i-1.5ii;
[0197]
识别误差后,用四点插值细分算法利用相邻的4个点来计算新的插值点,在每次计算时都使用相同的运算规则。通过寻找与待插补风速相近的4个风速点,利用四点插值算法进行缺失数据插值具有理论可行性。
[0198][0199]
其中p
2i+1
为待插补功率点;p
i-1
,pi,p
i+1
,p
i+2
分别为与待插补功率点最接近的4个风速对应功率值;ω为张量参数,当ω∈[0,0.125]时,可得到较满意的插值点,本专利取区间中点ω=1/16。
[0200]
参考图2,结合变分模态分解方法,对风速分解为多个子序列,并根据样本熵对子序列进行重构,包括稳定趋势、有序波动和无序震荡三个部分,然后基于模糊信息粒化理论,对无序震荡部分的极大值、极小值以及平均值进行识别与提取,预测更加精确,通过将无需震荡进一步分解,能够提升预测精准程度。
[0201]
变分模态分解是一种自适应和非递归信号分解的处理方式,分解后的序列稳定性较好,并且可很好地反映信号的奇异性特性,具有较好的噪声鲁棒性。在获取各分量的过程中,此算法通过将信号的分解过程转换到变分框架内,搜寻约束变分模型的最优解,最终实现信号的自适应分解,摆脱经验模态分解循环筛分剥离处理信号的方式。
[0202]
构造变分问题的步骤如下:
[0203]
对于每个模式函数uk(t),通过希尔伯特变换计算相应的分析信号以获得其单边频谱。
[0204][0205]
式中,δ(t)为狄拉克函数;k为需要分解的模态个数。
[0206]
对于每个模式函数uk(t),通过混叠与模式函数uk(t)对应的中心频率ωk的指数项e-jωkt
,将每个模态的频谱调制到相应的基本频带。
[0207][0208]
使用调解信号的高斯平滑方法估计每个模式信号的带宽,解决了约束条件下变分问题,目标函数为:
[0209][0210]
通过变分模态分解风速序列为k个子序列,然后基于样本熵方法得到三个序列,分别为稳定趋势、有序波动、无序震荡。
[0211]
针对无序震荡序列,采用模糊信息粒化方法进行处理,得到每个窗口的最小值、平
均值和最大值。
[0212]
信息粒就是一些元素的集合,这些元素由于难以区别、或相似、或接近或某种功能而结合在一起。信息粒作为信息的表现形式在我们的周围是无所不在的,它是人类认识世界的一个基本概念。人类在认识世界时往往将一部分相似的事物放在一起作为一个整体研究它们所具有的性质或特点,实际上,这种处理事物的方式就是信息粒化。而所研究的“整体”就称为信息粒。
[0213]
信息粒化中,粒为非模糊的粒化方式(c-粒化)在众多方法技术中起着重要的作用,但是在几乎所有人的推理及概念形成中,粒都是模糊的(f-粒化),非模糊的粒化没有反映这一事实。模糊信息粒化正是受人类粒化信息方式启发并据此进行推理的。
[0214]
首先将原始风速序列x(参考图3)按照时间分割成长度相等的子序列作为操作窗口,对每个窗口采用隶属函数建立一个模糊信息粒子p,构成一个模糊集以代替原始序列的所有有效特征信息,即一个能描述x的模糊概念g,因此本质上是确定g的隶属函数的过程,使p=a(x)。
[0215]
选用三角型模糊粒子进行研究,其隶属函数为:
[0216][0217]
式中:x—风速序列;a、m、b—模糊粒化窗口每个粒子的最小值、平均值、最大值。
[0218]
本发明基于上述模块,构建改进粒子群优化的gru预测模型。对5个模块分别建立粒子群优化的gru预测模型,并通过pso对嵌入维数m、延迟时间τ、隐藏层节点数l进行联合优化。
[0219]
输入就是相当于这个风速可以分为三个部分一块是较为稳定的序列(参考图5a),一块是有序波动的(参考图5b),一块是无序震荡的,其中无序震荡的包含最大值(参考图5c)、平均值(参考图5d)和最小值(参考图5e)三个值,分别相当于将这五个序列作为预测的输入,分别构建模型,最后再重构一起形成最终的风速预测结果。
[0220]
门控循环单元gru(gated recurrent unit)是处理时间序列的一种网络模型,相比于传统的bp算法,gru有较强的学习能力,能将输入的历史信息通过“门控”的方式选择性的遗忘或保留,从而实现对未来数据的预测。网络结构分为训练和预测2个部分,预测部分包含输入层、隐藏层和输出层等3个部分,根据样本损失,采用梯度下降算法,对gru网络进行训练,使得样本损失函数值最小,并更新各网络参数的权重。
[0221]zt
=σ(w
xz
x
t
+w
hzht-1
+bz);
[0222]rt
=σ(w
rz
x
t
+w
hrht-1
+br);
[0223][0224][0225]yt
=σ(w
hoht
+by);
[0226]
gru网络预测框图如图4所示,网络结构分为训练和预测2个部分,预测部分包含输入层、隐藏层和输出层等3个部分,根据样本损失,采用梯度下降算法,对gru网络进行训练,使得样本损失函数值最小,并更新各网络参数的权重;下部分为gru网络隐藏层的展开图,其中相空间重构矩阵的相点作为网络的输入部分x,序列x={x(1+mτ),x(2+mτ),...,x(m+mτ)}作为输出部分的y,h为隐含层,σ为sigmoid激活函数,z
t
,r
t
分别为循环网络的更新门和重置门。w
xz
是t时刻输入层与更新门之间的权重。w
hz
是t-1时刻隐藏层与t时刻更新门之间的权重,w
xr
是t时刻输入层与重置门之间的权重。w
hr
是t-1时刻隐藏层与t时刻重置门之间的权重,w
ho
是t时刻隐藏层与输出层之间的权重。θ是矩阵的hadamard积。bz、br、by、bh分别为各自的偏置量。
[0227]
参考图4,当输入状态x
t
进入后,首先分别输出到两个门。在状态线中,x
t
与权重w
sh
相乘,重置门r
t
与上一时刻的隐藏状态h
t-1
做向量元素相乘,然后向量加和成为隐藏层的输入向量
[0228]
gru的学习速度快且训练误差较小,但是其隐藏层之间,以及隐藏层和输出层之间的初始化权重是随机选取的,对于后续的训练过程缺乏针对性。改进的粒子群优化算法全局寻优能力强,将其引入到gru的网络训练过程中可以进一步提高其模型预测能力。参考图6,基于改进粒子群算法的,gru权值初始化过程如下:
[0229]
对于给定的训练集[xi,yi],初始化n
p
个维数为e(e=kn+1,其中k为gru的隐藏层的数目,n为输入神经元的个数)的参数向量t
q,g
(q=1,2,

,n
p
),任一维的取值范围为[-1,1],g为迭代的次数。
[0230]
gru的初始权值矩阵和偏置向量构成粒子群个体,对于每个群体中的个体t
q,g
,计算出各个门控单元,候选状态以及网络的输出结果。
[0231]
计算每个粒子对应的gru预测结果,取均方根误差作为ipso算法的适应度函数,优化目标为均方根误差最小的gru对应的粒子。
[0232]
更新群体最优g
best
和个体最优p
best

[0233]
计算聚集度。
[0234]
当聚集度达到阈值,按本文提出的新动态拓扑结构和粒子搜索行为更新粒子的速度和位置。
[0235]
达到粒子群终止迭代次数条件后,完成gru模型的初始化过程。完成gru的初始化过程后,继续使用该算法进行网络参数的学习。分别对每一个模块构建并训练gru模型,最终通过新的gru网络整合各分量的预测结果。
[0236]
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
[0237]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1