本发明属于电力系统频率预测
技术领域:
,特别涉及一种基于xgboost算法的电力系统扰动后频率特征预测方法。
背景技术:
:电力系统的频率稳定是指电力系受到严重扰动后,发电和负荷出现较大不平衡,系统频率仍能保持稳定而不发生频率崩溃的能力。随着可再生能源的大规模接入以及电网异步互联新格局的出现,一旦出现大功率不平衡问题,容易导致全网的频率大幅度波动,电力系统的频率失稳风险剧增。因此,快速、准确地分析扰动后电力系统的频率特征对于保障电力系统稳定运行具有重要意义。目前,在频率稳定分析中主要采用时域仿真方法,通过对系统各元件进行详细建模,实现电力系统受扰动后频率动态特性的准确分析。然而,完整的时域仿真法仅适用于频率特性的离线分析,难以在线应用。为提升时域仿真的分析速度,基于单机单负荷等值和基于线性化的频率分析方法被提出,但这两种方法的准确性较差。近年来,机器学习技术的快速发展和广泛使用,为电力系统频率动态特征的预测提供了新的发展契机。目前已有使用反向传播算法(backpropagation,bp)、卷积神经网络算法(cnn)等方式对电力系统扰动后的安全性进行分析。但bp算法存在着精度较低、离线训练时间长等缺点,而卷积神经网络算法调参困难且稳定性较差。技术实现要素:为解决以上现有技术存在的分析速度低、准确性较差、建模困难等问题,本发明的目的在于提供一种基于xgboost算法的电力系统扰动后频率特征预测方法。为了实现上述目的,本发明采用的技术方案是:一种基于xgboost算法的电力系统扰动后频率特征预测方法,包括以下步骤:步骤1:获取多个样本,每个所述样本包括电力系统在运行过程中的相关参数以及电力系统在扰动后的频率特征量,其中所述相关参数作为输入特征;步骤2:将步骤1获取的样本中的输入特征使用皮尔逊相关系数法进行特征筛选;步骤3:将步骤2筛选获取的样本按比例划分成训练样本、验证样本和预测样本,其中训练样本组成训练集,验证样本组成验证集,预测样本组成预测集;步骤4:设置xgboost算法的参数,利用训练集的样本构造基于xgboost算法的频率特征预测模型,建立输入特征和频率特征的非线性映射关系;步骤5:使用步骤3获取的验证集在步骤5获取的预测模型中进行预测,修预测模型的参数直到误差最低,至此训练好预测模型;步骤6:对预测集进行预测,即使用步骤5获取的预测模型对预测集中每个预测样本进行回归预测,通过对预测集进行回归预测的结果,计算其预测性能,最终得到用于电力系统扰动后频率特征的预测模型;步骤7:当电力系统出现扰动时,使用步骤6得到的电力系统扰动后频率特征的预测模型进行在线预测,快速准确地得到频率特征量。通过预测得到的特征量能够对后续电力系统需要进行的低频状态下的减载或高频下的切机操作、频率的二次调整操作以及频率保护装置是否会运行提供重要参考,更好的保障了电力系统的稳定运行。所述步骤1中,电力系统在运行过程中的相关参数包括系统总的负荷水平、扰动前各节点电压、扰动前各节点相角、扰动后各节点电压、扰动后各节点相角、扰动前各发电机有功功率、扰动前各发电机无功功率、扰动后各发电机有功功率、扰动后各发电机无功功率、各发电机惯性时间常数、各负荷的静态负荷模型、各发电机功率缺额以及总功率缺额。所述步骤1中,电力系统在扰动后的频率特征量包括电力系统扰动后惯性中心频率的最大频率变化率、极值频率和准稳态频率。所述步骤2中,当两个特征的相关系数大于0.98时仅选择其中一个保留,另一个删除。与现有技术相比,本发明较之传统频率预测方法更加快速且准确度更高,应用于电力公司,可以提升电力公司的频率预测水平,提高电力系统的可靠性,保障电力系统稳定运行。附图说明图1为基于xgboost算法的电力系统扰动后频率特征预测方法流程图。图2为运用本发明中方法的实施例的最大频率变化率的实际值与预测值的绝对误差分布图。图3为运用本发明中方法的实施例的极值频率的实际值与预测值的绝对误差分布图。图4为运用本发明中方法的实施例的准稳态频率的实际值与预测值的绝对误差分布图。具体实施方式下面结合附图和具体实施例对本发明作进一步详细说明。应该强调的是,下属说明仅是示例性的,仅用于更加清楚地说明本发明的技术方案,不能以此来限制本发明的保护范围。本实施例使用matlab的pst软件包在新英格兰10机39母线系统上进行了仿真以获得样本集。步骤1:设置负荷水平为50%,50.1%,50.2%,…,100%相应改变系统中各台发电机的有功出力,负荷模型采用zip模型,系统扰动考虑除平衡机的发电机跳机故障,仿真得到4500组仿真样本。步骤2:初始特征为216维,采用皮尔逊相关系数法,当两组特征相关系数高于0.98时随机选取其中一组删除。经过特征筛选后,保留106维关键特征作为模型的输入特征。步骤3:随机选取其中的2700组作为训练集样本,剩余的900组作为验证集样本,900组作为预测集样本。步骤4:设置xgboost算法的参数,利用训练集的样本构造基于xgboost算法的频率特征预测模型,建立输入特征和频率特征的非线性映射关系,具体过程为:xgboost算法的模型为式中,为第i个样本中的频率特征的预测值,xi为输入特征,k为独立树的总量,fk(xi)为第k棵树对数据集中第i个样本的计算分数,f是cart(回归树)构成的集合空间,fk对应第k棵独立树的结构q和叶子权重ω;xgboost算法的目标函数l(φ)为式中,是损失函数,表示第i个样本中的频率特征的预测值和其目标值yi之间的误差,用于描述模型拟合数据的程度,n为样本总数;ω(fk)是正则项,控制模型的复杂度,避免过度拟合,定义ω(fk)为式中,γ和λ为模型的惩罚系数;t为叶子节点数;ωj为第j个叶子节点的最优值;采用加法学习方式(additivetraining)的方式,在每一轮迭代中将当前最佳的树模型加入整体模型中,整体模型l(t)为式中,为第t-1轮迭代时第i个样本中的频率特征的预测值,ft(xi)为第t轮迭代时第i个样本中的频率特征最佳的树模型,为当前最佳的树模型加入后的误差函数;对式(4)进行二阶泰勒展开近似可得式中,gi和hi分别为损失函数的一阶、二阶导数,第t轮的目标函数可以简化为定义ij={i|q(xi)=j}为第j个叶子节点的样本集,通过扩展第t轮迭代时的正则项ω(ft),可以将式(8)改写为对于固定的树结构q,对ωj求偏导ωj*为第j个叶子节点的最优权重,将式(10)带入式(9)可得最优目标函数值为由于无法列举所有可能的树结构q,故采用贪心算法,在划分子树时选择增益最大的划分,增益表达式为式中,il、ir分别代表树分类后的左子树和右子树的样本组。由此,可完成xgboost算法模型的训练。之后,使用网格搜索法寻找xgboost算法模型中学习率(learning_rate)和最大深度(max_depth)两个参数的最优值。其中,学习率控制每个弱学习器的权重缩减系数,最大深度控制树结构的深度。学习率分别取{0.01,0.1,0.3,1},最大深度分别取{2,4,6,10},以均方根误差(rmse)为指标,使用xgboost模型预测验证集。均方根误差(rootmeansquareerror,rmse)的具体计算方式为式中:n为样本总数;为第i个样本中的频率特征的预测值;yi为目标值。具体结果如表1,2,3所示;表1最大频率变化率在不同学习率和最大深度下的均方根误差表2极值频率在不同学习率和最大深度下的均方根误差表3准稳态频率在不同学习率和最大深度下的均方根误差由表1、表2和表3可知,最大频率变化率、极值频率、准稳态频率的学习率和最大深度两种参数的最优值如表4所示表4扰动后频率特征量模型的学习率与最大深度最优值频率特征量学习率最大深度最大频率变化率0.110极值频率0.110准稳态频率0.110步骤5:图2、图3和图4分别为xgboost算法在预测集中对最大频率变化率、极值频率、准稳态频率进行预测时的绝对误差分布图。绝对误差(absoluteerror,ae)的具体计算方式为ae=yi-yi(14)步骤6:利用相同的样本集,分别构建基于支持向量机回归算法(svr)、bp神经网络算法和卷积神经网络算法(cnn)的系统扰动后频率特征量预测模型,并通过网格搜索得到最优参数。最终将预测结果与xgboost算法的预测结果对比,3种频率特征的预测对比结果如表3-5。其中,svm模型惩罚参数c设置为100;核函数参数gamma设置为0.1。bp神经网络模型隐藏层激活函数为relu;学习率设置为0.01。cnn模型设置为2个卷积层、1个池化层、1个全连接层。以最大绝对误差和均方根误差为指标衡量预测结果的准确度。最大绝对误差(maxabsoluteerror,mae)的具体计算方式为mae=max(abs|yi-yi|)(15)最终结果如表5、表6和表7所示。表5最大频率变化率预测结果对比表6极值频率预测结果对比表7准稳态频率预测结果对比可以看出,在4种频率特征指标的预测结果中,xgboost算法的预测性能均优于其余3种方法,证明了本方法在预测频率特征时的优势。。以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本发明所在
技术领域:
的技术人员在本发明揭露的技术范围内,可轻易想到的变化和替换,都应涵盖在本发明的保护范围之内。当前第1页12