基于果蝇算法优化的变压器状态参量数据预测方法及系统与流程

文档序号:18253749发布日期:2019-07-24 09:59阅读:132来源:国知局
基于果蝇算法优化的变压器状态参量数据预测方法及系统与流程
本发明涉及电力系统输变电设备运行维护领域中的变压器状态参量预测方法及系统,尤其涉及一种基于果蝇算法优化的变压器状态参量预测方法及系统。
背景技术
:电力变压器作为输变电系统的主要核心设备,保证其能够健康稳定地运行具有重要意义。通常通过监测变压器运行状态并预测其变化趋势,从而有效预防变压器故障、做好预案,保证变压器的稳定运行。为了有效监测变压器运行状态并预测其变化趋势,通常需要监测反映变压器运行状态的各变压器状态参量并对其进行预测。变压器的状态参量信息维度很高,数据量庞大,不同的状态参量数据从不同角度在一定程度上反映了变压器的运行状态。变压器的状态参量数据主要包括在线监测数据、离线实验数据、运行巡检数据以及变压器自身技术参数数据等,这些数据可以从各个方面反映变压器的运行状态,利用这些数据对变压器运行状态进行预测具有重要的研究意义。变压器在线监测状态参量数据是一个复杂的数据序列,对变压器在线监测状态参量数据未来的变化趋势进行预测,能够更好地预测变压器的运行状态变化。传统的变压器状态参量预测模型仅仅考虑了单一变量或者少数几个变量的数据对序列未来的变化趋势进行判断。并且在对历史数据进行拟合时,无法保留较为久远的历史信息对当前时刻的作用,从而无法实现对未来较长时间尺度的预测。广义回归神经网络(generalizedregressionneuralnetwork,GRNN)是由美国学者DonldF.Specht提出的一种新型的径向基神经网络。它是以非线性回归分析为基础的径向基神经网络。该网络有能力从历史数据中预测任意形式的函数,并且最后收敛于样本量积累最多的优化回归面。在结构上和多层感知神经网络类似,包括输入层、模式层、求和层和输出层。广义回归神经网络在网络的训练过程中不需要调整每个神经元之间的连接的权重,网络的学习过程仅仅依赖于数据样本本身,模型唯一需要设定的是光滑因子参数,很大程度上降低了人为主观影响因素,因此特别适用于具有非线性特征的变压器状态参量数据的预测。基于神经网络构建的预测模型可以用于变压器状态参量数据预测,但是存在超参数选取容易陷入局部收敛,导致预测模型训练效率低,影响预测准确率和可靠性的问题。技术实现要素:本发明的目的之一是提供一种基于果蝇算法优化的变压器状态参量数据预测方法,该方法能避免超参数选取陷入局部收敛,从而提升预测模型训练效率,保证较高的变压器状态参量数据预测准确率和可靠性。根据上述发明目的,本发明提出了一种基于果蝇算法优化的变压器状态参量数据预测方法,其对变压器状态参量数据进行预测,所述方法包括以下步骤:S100:获取一段时间内的变压器状态量数据,并将其转换为矩阵形式的变压器状态量矩阵,所述变压器状态量包括变压器状态参量的相关数据;S200:构建变压器状态参量数据预测模型,基于果蝇算法求得所述预测模型的超参数,基于所述变压器状态量矩阵对所述预测模型进行训练;S300:基于经步骤S200训练的变压器状态参量数据预测模型预测变压器状态参量数据。本发明提出的基于果蝇算法优化的变压器状态参量数据预测方法,其采用果蝇算法求得预测模型的超参数,以避免超参数选取陷入局部收敛,从而提升预测模型训练效率,保证较高的变压器状态参量数据预测准确率和可靠性。超参数是训练之前设置值的参数,而不是通过训练得到的参数值。通常情况下,需要对超参数进行优化,选择一组最优超参数,以提高训练的效率和效果。果蝇算法(FruitFlyOptimizationAlgorithm,FOA)是由中国台湾学者Wen-TsaoPan提出的一种优化算法,该算法的思路是模拟果蝇觅食的行为:首先以嗅觉发现事物的大致方位,然后再在近距离的情况下用视觉发现事物的具体位置并接近觅食的过程。果蝇算法具有很好的全局优化性能,因此基于果蝇算法求得的预测模型的超参数,能避免超参数选取陷入局部收敛,从而提升预测模型训练效率,保证较高的变压器状态参量数据预测准确率和可靠性。通常所述预测模型基于神经网络构建。进一步地,本发明所述的基于果蝇算法优化的变压器状态参量数据预测方法中,步骤S200中所述变压器状态参量数据预测模型基于广义回归神经网络构建,所述超参数为所述广义回归神经网络中的光滑因子。上述方案中,广义回归神经网络是以非线性回归分析为基础的径向基神经网络。该网络有能力从历史数据中预测任意形式的函数,并且最后收敛于样本量积累最多的优化回归面;广义回归神经网络在网络的训练过程中不需要调整每个神经元之间的连接的权重,网络的学习过程仅仅依赖于数据样本本身,模型唯一需要设定的是光滑因子参数,很大程度上降低了人为主观影响因素,因此特别适用于具有非线性特征的变压器状态参量数据的预测。此外,广义回归神经网络可以保留较为久远的历史信息对当前时刻的作用,从而可以实现对未来较长时间尺度的预测。所述光滑因子为所述广义回归神经网络所要设置的唯一超参数。进一步地,本发明所述的基于果蝇算法优化的变压器状态参量数据预测方法中,步骤S200中所述果蝇算法采用动态步长初始化群体中个体的位置。传统方果蝇算法采用固定步长初始化群体中个体的位置。固定步长存在以下问题:如果设定的步长过大,则会导致算法的搜索能力变弱,花费的搜索时间过长,导致算法的效率偏低;如果设置的步长过小,则算法容易陷入局部最优。因此上述方案考虑以动态步长代替传统的固定步长,从而避免上述固定步长存在的问题。进一步地,本发明所述的基于果蝇算法优化的变压器状态参量数据预测方法中,步骤S200中所述果蝇算法采用交叉验证法,将种群分为多个相等的子种群,然后分别进行优化分析,最终再选择最优解。上述方案保证了算法能够充分利用数据,防止算法陷入局部最优解。进一步地,本发明所述的基于果蝇算法优化的变压器状态参量数据预测方法中,步骤S200中采用误差反向传播算法对所述预测模型进行训练。上述方案中,所述预测模型的结构参数通常包括广义回归网络的隐藏层层数、神经元节点数,所述误差反向传播算法可以用于确定所述预测模型的结构参数。进一步地,本发明所述的基于果蝇算法优化的变压器状态参量数据预测方法中,步骤S100中所述变压器状态参量的相关数据包括参量本身的数据和/或参量间的比值数据。上述方案中,为了进一步保证预测效果,通常希望多纳入一些维度的变压器状态量,即状态量选择范围不限于状态参量,还可以包括状态参量之间的比值等相关数据。进一步地,本发明所述的基于果蝇算法优化的变压器状态参量数据预测方法中,步骤S100中所述变压器状态参量包括变压器本体参量和变电站环境参量。上述方案中,由于变压器运行状态不仅受变压器本体参量的影响,还受变电站环境参量的影响,因此将变压器本体参量和变电站环境参量纳入变压器状态参量的选择范围。更进一步地,上述基于果蝇算法优化的变压器状态参量数据预测方法中,所述变压器本体参量包括变压器油中溶解的气体含量和/或变压器油温。上述方案中,变压器油中溶解的气体含量和变压器油温在一定程度上可以反映变压器绝缘老化或故障的程度,因此将变压器油中溶解的气体含量和变压器油温纳入变压器本体参量的选择范围。更进一步地,上述基于果蝇算法优化的变压器状态参量数据预测方法中,所述变电站环境参量包括气温、地面湿度、相对湿度、平均风速中的一种或多种。上述方案中,气温、地面湿度、相对湿度、平均风速等因素会对变压器的性能造成影响,被认为是变压器状态的相关因素,因此将气温、地面湿度、相对湿度、平均风速等因素纳入变压器本体参量的选择范围。更进一步地,上述基于果蝇算法优化的变压器状态参量数据预测方法中,所述变压器油中溶解的气体包括H2、CO、CH4、C2H2、C2H4、C2H6中的一种或多种。上述方案中,可以基于油中溶解气体分析(DGA)相应的色谱数据得到相关参量的原始数据。上述方案采选择的气体种类包括氢气(H2)、一氧化碳(CO)、甲烷(CH4)、乙炔(C2H2)、乙烯(C2H4)以及乙烷(C2H6)。更进一步地,上述基于果蝇算法优化的变压器状态参量数据预测方法中,基于所述变压器油中溶解的气体,所述参量间的比值数据包括CH4/H2、C2H2/C2H4、C2H4/C2H6、C2H6/CH4、C2H2/CH4、C2H6/C2H2中的一种或多种。上述方案中,为了拓展输入向量的维度,借鉴了利用油中溶解气体分析(DGA)比值对变压器故障进行诊断的思路,将常用的国际电工委员会(IEC)比值、Rogers比值以及Dornenburg比值也纳入输入向量的选择范围,即将CH4/H2、C2H2/C2H4、C2H4/C2H6、C2H6/CH4、C2H2/CH4、C2H6/C2H26组DGA比值也纳入所述参量间的比值数据选择范围。本发明的另一目的是提供一种基于果蝇算法优化的变压器状态参量数据预测系统,该系统能能避免超参数选取陷入局部收敛,从而提升预测模型训练效率,保证较高的变压器状态参量数据预测准确率和可靠性。根据上述发明目的,本发明提出了一种基于果蝇算法优化的变压器状态参量数据预测系统,该系统包括数据连接的数据采集模块和数据处理模块,采用上述变压器状态参量数据预测方法中的任意一种方法预测变压器状态参量数据。本发明提出的基于果蝇算法优化的变压器状态参量数据预测系统,其通过采用上述任一变压器状态参量数据预测方法对变压器状态参量数据进行预测,因此,根据前述原理,该系统能避免超参数选取陷入局部收敛,从而提升预测模型训练效率,保证较高的变压器状态参量数据预测准确率和可靠性。本发明所述的基于果蝇算法优化的变压器状态参量数据预测方法能能避免超参数选取陷入局部收敛,从而提升预测模型训练效率,保证较高的变压器状态参量数据预测准确率和可靠性。本发明方法采用果蝇算法优化和预测模型的组合,具有很好的灵活性和拓展性,可以自由选择合适的预测模型。本发明方法经实验验证具有较好的拟合能力和预测能力。本发明所述的基于果蝇算法优化的变压器状态参量数据预测系统同样具有以上优点和有益效果。附图说明图1为本发明所述的基于果蝇算法优化的变压器状态参量数据预测方法的流程示意图。图2为本发明所述的基于果蝇算法优化的变压器状态参量数据预测方法在一种实施方式下的流程示意图。图3为验证实例中光滑因子优化过程的均方根误差Rmse变化曲线示意图。图4为验证实例中甲烷气体浓度预测结果相对百分误差示意图。具体实施方式下面将结合说明书附图和具体的实施例对本发明所述的基于果蝇算法优化的变压器状态参量数据预测方法及系统做进一步的详细说明。图1示意了基于果蝇算法优化的变压器状态参量数据预测方法的流程。如图1所示,本发明的基于果蝇算法优化的变压器状态参量数据预测方法的流程包括:S100:获取一段时间内的变压器状态量数据,并将其转换为矩阵形式的变压器状态量矩阵,所述变压器状态量包括变压器状态参量的相关数据;S200:构建变压器状态参量数据预测模型,基于果蝇算法求得所述预测模型的超参数,基于所述变压器状态量矩阵对所述预测模型进行训练;S300:基于经步骤S200训练的变压器状态参量数据预测模型预测变压器状态参量数据。在某些实施方式中,步骤S300中变压器状态参量数据预测模型基于广义回归神经网络构建,所述超参数为所述广义回归神经网络中的光滑因子。在某些实施方式中,步骤S200中所述果蝇算法采用动态步长初始化群体中个体的位置。在某些实施方式中,步骤S200中所述果蝇算法采用交叉验证法,将种群分为多个相等的子种群,然后分别进行优化分析,最终再选择最优解。在某些实施方式中,步骤S200中采用误差反向传播算法对预测模型进行训练。在某些实施方式中,步骤S100中变压器状态参量的相关数据包括参量本身的数据和/或参量间的比值数据。在某些实施方式中,步骤S100中变压器状态参量包括变压器本体参量和变电站环境参量。其中,在一些实施方式中,变压器本体参量包括变压器油中溶解的气体含量和/或变压器油温;在一些实施方式中,变电站环境参量包括气温、地面湿度、相对湿度、平均风速中的一种或多种。其中,在一些实施方式中,变压器油中溶解的气体包括H2、CO、CH4、C2H2、C2H4、C2H6中的一种或多种。其中,在一些实施方式中,基于变压器油中溶解的气体,参量间的比值数据包括CH4/H2、C2H2/C2H4、C2H4/C2H6、C2H6/CH4、C2H2/CH4、C2H6/C2H2中的一种或多种。图2示意了基于果蝇算法优化的变压器状态参量数据预测方法在一种实施方式下的流程。如图2所示,本发明所述的基于果蝇算法优化的变压器状态参量数据预测方法在一种实施方式下的流程包括以下步骤1-步骤6:步骤1:通过数据采集模块获取一段时间内的变压器在线监测状态量数据。该步骤通过数据采集模块采集一段时间内的变压器在线监测状态量数据,其中,变压器在线监测状态量包括变压器状态参量及参量间比值。其中,变压器状态参量具体包括变压器油中溶解的气体含量、变压器油温等变压器本体参量,以及气温、地面温度、相对湿度和平均风速等变电站环境参量。其中,变压器油中溶解的气体包括氢气(H2)、一氧化碳(CO)、甲烷(CH4)、乙炔(C2H2)、乙烯(C2H4)以及乙烷(C2H6),参量间比值采用6组变压器油中溶解的气体含量比值,以分子式之比的形式表示分别为CH4/H2,C2H2/C2H4,C2H4/C2H6,C2H6/CH4,C2H2/CH4,C2H6/C2H2。步骤2:通过数据处理模块将变压器在线监测状态量数据转换为变压器在线监测状态量矩阵X。该步骤通过数据处理模块采用离差标准化方法对变压器在线监测状态量数据进行归一化处理,得到变压器在线监测状态量矩阵X:其中,X1、X2和Xr表示各变压器在线监测状态量,下标1,2……n表示时间序列。步骤3:通过数据处理模块构建变压器状态参量数据预测模型。该步骤中,基于广义回归神经网络构建变压器状态参量数据预测模型,并通过多次反复试验选取最优结果来确定预测模型的结构。其中,预测模型的结构参数包括广义回归网络的隐藏层层数、神经元节点数。广义回归神经网络由输入层、模式层、求和层和输出层构成。广义回归神经网络的基本思想是利用非线性回归计算得到的,其灵感来源于统计学科中的概率论的特点。对于一个网络,当用函数进行逼近时,其网络输出就是网络对于输入向量的回归结果。设f(x,y)是随机变量x和y的概率密度函数,其中x是p维的输入向量,y是对应的输出向量。已知X是随机变量x的一组测量值,则y相对于X的回归值为:也是在输入为X的条件下所对应的y的预测输出。当概率密度函数f(X,y)未知时,就需用应用Parzen非参数估计的方法,利用采集到的样本数据估计密度函数式中xi,yi是随机变量x和y的样本观测值;n是样本的容量;σ是高斯函数的宽度系数,也称光滑因子或者扩展参数。将式(2)的代替(1)的f(X,y),同时交换积分与加和的顺序,可得:因为所以式(3)以进一步化简为:由式(4)可知,构建GRNN网络时,网络需要训练的超参数只有一个参数σ需要设定。当光滑因子σ趋向于无穷大时,d(X,xi)趋向于零。从而代表所有样本因变量的均值。当光滑因子σ趋向于零时,则和训练样本非常接近。此时如果预测的点在训练样本集合中时,预测值会和样本的期望值十分接近,但是一旦是新的数据,即是样本中未能包含进去的点,则预测效果可能会非常差,无法满足预测要求。所以只有当光滑因子σ取值合适时,所有的训练样本的因变量才能被充分考虑进去,与预测点距离近的样本点所对应的因变量也被附加了更大的权重。传统的方式是通过交叉验证法来得到光滑因子σ,在一定程度上提高了网络的逼近能力和分类能力。本发明则在下面的步骤4中结合改进的果蝇优化算法来选取光滑因子σ,算例结果表明该方法具有更好的全局收敛性,在预测过程中提高了预测的精度和可靠性。步骤4:通过数据处理模块基于果蝇算法求得预测模型的光滑因子。果蝇算法步骤如下:步骤4-1:在每一次迭代中,光滑因子和模型评判指标均方根误差值作为一对参数,对其进行随机初始化Init_X,Init_Y。步骤4-2:初始化群体中个体的位置:xi=Init_X+l*r(5)yi=Init_Y+l*r(6)式中,l表示步长值,r是[0,1]区间的随机数,xi,yi为个体位置坐标。步骤4-3:计算个体与原点的距离di,并求判定值pi.。pi=1/di(8)步骤4-4:找出群体中最优个体。[bestS,bestIndex]=max(p)(9)步骤4-5:更新判定值和新的坐标。bestSmell=bestS(10)x=x(bestIndex)(11)y=y(bestIndex)(12)式中bestSmell即为模型的最优光滑因子参数。由于在步骤4-2中,传统方法的步长是固定的。如果设定的步长过大,则会导致算法的搜索能力变弱,花费的搜索时间过长,导致算法的效率偏低;如果设置的步长过小,则算法容易陷入局部最优。其次传统的果蝇算法存在收敛精度低的问题。本发明对步长值的选取进行改进,采用动态步长来代替固定步长。优化的步长公式如下:式中,ki是当前的迭代次数,k是最大迭代次数,l0是初始步长,li是当前步长。而针对收敛精度低的问题,本发明采用了交叉验证的方法,将种群分为多个相等的子种群,然后分别进行优化分析,最终再选择最好的解。该方案保证了算法能够充分利用数据,防止算法陷入局部最优解。步骤5:通过数据处理模块基于变压器在线监测状态量矩阵X对预测模型进行训练。该步骤中,将变压器在线监测状态量矩阵X中的变压器在线监测状态量前80%的数据作为输入,采用误差反向传播算法对预测模型进行训练,确定该预测模型的结构参数。步骤6:通过数据处理模块基于经训练的变压器状态参量数据预测模型预测变压器状态参量数据。该步骤中,将变压器在线监测状态量矩阵X中的剩下的20%的变压器在线监测状态量作为输入数据输入经过训练的预测模型,输入给GRNN神经网络层,神经网络层输出预测结果。上述数据采集模块和数据处理模块相互数据连接,构成本实施例的基于果蝇算法优化的变压器状态参量数据预测系统。该系统采用上述变压器状态参量数据预测方法对变压器状态参量数据进行预测。下面对上述实施例进行测试验证。图3示意了本验证实例中光滑因子优化过程的均方根误差Rmse变化曲线,图4示意了本验证实例中甲烷气体浓度预测结果相对百分误差。本验证实例采用上述实施例的变压器状态参量数据预测方法和系统对变压器状态参量数据进行预测。基于某220kV变压器油色谱在线监测装置油色谱数据获取变压器在线监测状态量数据,数据的采样间隔为1天。将400组监测数据作为训练样本,将30组监测数据作为测试样本。为了评价本发明提出的组合预测模型的准确性和有效性,采用以下几个评价准则来进行分析:测试集的真实值和预测值的均方根误差值Rmse,其表达式为:真实值和预测值的平均相对百分误差,其表达式为:最大相对百分误差,其表达式为:式中,N是测试集数据的个数,xi是真实值,是预测值。本验证实例以甲烷CH4气体浓度预测结果为例说明整个预测的流程。首先输入的变压器在线监测状态量向量依次为:CH4(仅历史浓度)、H2、CO、C2H2、C2H4、C2H6、总烃、总可燃气浓度、C2H2/C2H4、C2H4/C2H6、环境温度和油温共11组监测数据。将这些向量进行标准化处理,映射到[0,1]之间,转换函数为:式中,xmin为向量样本数据的最小值,xmax为向量样本数据的最大值。基于广义回归神经网络构建的变压器状态参量数据预测模型。基于改进的果蝇算法确定预测模型的光滑因子σ。光滑因子优化过程的均方根误差Rmse变化曲线如图3所示,通过100次迭代,最终在第44次迭代中收敛,此时的Rmse值最小为0.0105,对应的光滑因子σ的值为0.0867。基于上述向量训练基于广义回归神经网络构建的变压器状态参量数据预测模型,确定模型的隐藏层层数、神经元节点数。基于经训练的变压器状态参量数据预测模型对甲烷气体浓度进行预测,真实值和预测值的相对百分误差如图4所示,横坐标为时间序列,单位为天,纵坐标为相对百分误差,单位为%,图中平均相对百分误差为0.55%,最大相对百分误差1.32%。将本发明的预测方法同传统的支持向量机(SVM)、反馈神经网络(BPNN)预测方法的结果进行比较。预测的变压器状态参量数据为甲烷气体浓度数据,测试集的个数为30,预测效果如表1所示。表1.不同预测方法对预测效果的影响预测方法平均误差%最大误差%本发明方法0.551.32SVM3.154.31BPNN1.86.2.36从表1可以看出,在测试集的样本数相同的情况下,本发明提出的基于果蝇算法优化的变压器状态参量数据预测方法和系统预测结果更为准确,对数据的拟合较好。不同的测试集数目对预测的准确性也会造成一定的影响。分别对10、30、60、90个数据点进行预测,预测结果如表2所示。表2.不同测试集样本数目对预测效果的影响从表2中可以得出:当测试集样本数目较小时,本发明提出的预测模型比其它几种模型预测的准确率要高。随着测试集样本数目的增多,几种模型的预测准确度都有所下降,但本发明提出的预测方法在预测性能上明显优于其余两种模型。要注意的是,以上列举的仅为本发明的具体实施例,显然本发明不限于以上实施例,随之有着许多的类似变化。本领域的技术人员如果从本发明公开的内容直接导出或联想到的所有变形,均应属于本发明的保护范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1