1.本发明涉及电网物资质量检测技术领域,具体地说是一种基于随机森林的避雷器绝缘状态评估方法。
背景技术:2.避雷器是电网中一种重要的过电压保护装置,避免被保护设备遭受雷电过电压或操作过电压的损害,是电力系统安全运行的有力保障。避雷器在运行时会出现内部绝缘受潮及阀片老化等缺陷,影响电力安全运行。为了保证电网的稳定运行和被保护设备的安全,防止避雷器因自身故障引发更为严重的电网事故,需要定期进行预防性试验,检查其工作状态是否良好。
3.目前电网中使用较为广泛的是定期试验、带电检测和在线监测的方法。定期试验需停运被保护设备以避免其绝缘遭到损坏,因此,试验条件通常不是避雷器真实运行的条件,试验结果的准确性得不到保证,且定期试验的方法无法防范发生于两个试验间隔时间内的故障。
4.带电检测和在线监测的方法,以避雷器的总泄漏电流、阻性泄漏电流及放电次数为基础,通过电流数值是否出现异常增加的情况判断其是否发生故障,这在理论上能够一定程度地反映避雷器的故障状态。然而,由于避雷器的实际工作运行环境很复杂,温度、湿度及表面污秽等环境因素的干扰使得实测数据的准确性会大大降低,单一的测量值难以作为避雷器绝缘状态的判断依据,需要结合其他有关变量才能准确分析避雷器的内部运行状态。
5.基于以上原因,本发明设计了一种基于随机森林的避雷器绝缘状态评估方法,从避雷器的带电检测信息、在线监测信息、物资检测信息和环境信息中挑选特征参量,组成绝缘状态特征变量数据集,基于随机森林算法构建避雷器绝缘状态评估模型,其评估结果可为电网避雷器运行维护提供理论支撑,最大程度地发挥避雷器的防雷功能。
技术实现要素:6.本发明的目的是克服现有技术的不足,提供一种基于随机森林的避雷器绝缘状态评估方法,从避雷器的带电检测信息、在线监测信息、物资检测信息和环境信息中挑选特征参量,组成绝缘状态特征变量数据集,基于随机森林算法构建避雷器绝缘状态评估模型,其评估结果可为电网避雷器运行维护提供理论支撑,最大程度地发挥避雷器的防雷功能。
7.为了达到上述目的,本发明提供一种基于随机森林的避雷器绝缘状态评估方法,包括以下步骤:
8.s1,获取不同绝缘状态类型的避雷器待测样本,根据历史故障数据样本和现场实际运行经验,避雷器的绝缘状态类型大致可分为四类:内部受潮、绝缘老化、外绝缘污秽、其他类型;
9.s2,避雷器的特征数据主要由带电检测信息、在线监测信息、物资检测信息和环境
信息组成;
10.s3,对s2所得的数据集进行数据归一化处理,采用z-score归一化方法,其计算公式为:
[0011][0012][0013][0014]
z-score规范化处理后所得到的新数据的平均值为0,标准差为1;
[0015]
s4,将归一化后的数据进行分割,一部分数据作为测试集,一部分数据作为训练集;
[0016]
s5,在训练集上应用随机森林算法构建避雷器绝缘状态评估模型,同时应用网格搜索(grid search)和交叉验证的方式得到随机森林的两个关键参数:每颗树的特征数量(mfeature)和树的数目(ntree)的最优值,使得随机树模型能够更好地拟合训练样本;
[0017]
s5中的交叉验证的方法为:
[0018]
将训练样本随机划分为m个互不相交的子集s1,s2,s3,
……
,sm,每个子集的大小大致相等,每次选取m-1份作为训练集,用剩下的1份作为测试集,进行训练和测试;训练和测试进行m次,每个子样本测试一次,得到m次不同的测试效果,平均m次的结果作为最终的模型效果;
[0019]
s5中的网格搜索的方法为:
[0020]
随机森林的方法有两个关键参数,其取值会大大影响模型的有效性,分别为每颗树的特征数量(mfeature)和树的数目(ntree);
[0021]
设定特征数量mfeature和树的数目ntree的取值区间,设定相应的步长,遍历所有的参数组合,结合交叉验证,计算每一组合的评价指标roc曲线下的面积(roc_auc)的大小,确定最优的特征数量mfeature和树的数目ntree值,从而得到最佳的避雷器绝缘状态分类预测模型;
[0022]
s6,基于s5中的测试集数据,使用总体准确率,查全率和查准率等指标,对训练得到的模型进行评估;
[0023]
s7,若s6评估指标符合要求,将s1中的待测样本输入避雷器绝缘状态评估模型,获得待测样本的绝缘状态类型。
[0024]
随机森林算法包括以下步骤:
[0025]
s51,在训练数据集中,采用有放回的抽样方法(bootstrapping),从原始数据集中选取样本作为一个训练集;
[0026]
s52,用抽样得到的训练集生成一棵决策树,在生成树的每一个结点时:
[0027]
随机不重复地选择k个特征,一般地m为特征变量的数目;
[0028]
利用这k个特征分别对样本集进行划分,找到最佳的划分特征,可用基尼系数、增
益率、信息增益指标来判别;
[0029]
s53,重复s51~s52共k次,k即为随机森林中决策树的个数;
[0030]
s54,建立随机森林分类模型,由于状态评价是一个分类问题,采用多数投票法得出最终预测结果,即对随机森林模型内的所有决策树的预测结果进行投票,得票最高的类别即为最终的输出类别。
[0031]
同现有技术相比,本技术通过从避雷器的带电检测信息、在线监测信息、物资检测信息和环境信息中挑选特征参量,组成绝缘状态特征变量数据集,基于随机森林算法构建避雷器绝缘状态评估模型,其评估结果可为电网避雷器运行维护提供理论支撑,最大程度地发挥避雷器的防雷功能。
附图说明
[0032]
图1为本发明随机森林算法构建流程示意图。
[0033]
图2为本发明避雷器绝缘状态评估流程图。
[0034]
图3为本发明随机森林参数寻优过程示意图。
具体实施方式
[0035]
现结合附图对本发明做进一步描述。
[0036]
参见图1~3,本发明提供了一种基于随机森林的避雷器绝缘状态评估方法:
[0037]
1、获取不同绝缘状态类型的避雷器样本。根据历史故障数据样本和现场实际运行经验,避雷器的绝缘状态类型大致可分为四类:内部受潮、绝缘老化、外绝缘污秽、其他类型。选取了2018~2021年变电站内避雷器的记录数据,共3670条。样本中所包含的类别c={正常,异常-老化、异常-受潮,异常-表面污秽,异常-其他原因},其中避雷器异常-老化样本占比为6%,异常-受潮样本占比为10%,异常-表面污秽样本占比为8%,异常-其他原因样本占比为5%。
[0038]
2、避雷器的特征数据主要由带电检测信息、在线监测信息、物资检测信息、环境信息组成。其中,物资检测数据主要包括台账数据、出厂试验报告、交接试验报告等。本发明选取了具有代表性且能有效反映避雷器运行状况的特征变量,具体下表所示:
[0039]
数据来源数据类型在线监测数据泄漏电流、阻性电流、动作次数带电检测数据红外、局放物资检测泄漏电流、阻性电流环境数据温度、湿度、气象
[0040]
3、对步骤2所得的数据集进行数据归一化处理,本发明采用z-score归一化方法,其计算公式为:
[0041][0042]
其中
[0043][0044][0045]
z-score规范化处理后所得到的新数据的平均值为0,标准差为1。
[0046]
4、将归一化后的数据进行分割,80%数据(2936条)作为测试集,20%数据(734条)作为训练集。
[0047]
5、采用网格搜索和交叉验证的方式进行参数寻优,设定随机森林的参数mfeature和ntree的取值区间分别为[5,10]和[50,300],设定相应的步长mstep=1和nstep=50,两两组合,形成所有可能的参数组合候选集,如下表所示:
[0048][0049]
训练样本的随机等分数为3,寻优过程如图3所示,基于评估指标roc曲线的auc值,寻优结果为mfeature=150和ntree=4。基于这两个最优的参数,构建随机森林模型,得到避雷器绝缘状态评估模型。
[0050]
6、基于测试集数据,使用总体准确率,查全率和查准率等指标,对训练得到的模型进行评估。各绝缘状态的预测结果如下表所示:
[0051]
计价指标正常老化受潮表面污秽其他原因查准率93.4%84.3%83.2%80.1%82.1%查全率92.5%85.5%78.5179.2%80.6%
[0052]
由上表可以看出,“正常”的查全率和查准率最高,其他故障类型的查准率和查全率都超过78%,模型对各故障类别具有较高的预测能力。另外,模型的平均预测准确率为88.6%。
[0053]
为了进一步验证随机森林模型的优越性,将该算法与决策树与支持向量机所构建的模型进行对比,对比过程重复10次,每次从原始数据中随机抽取80%的数据作为训练样本,用该训练样本构建随机森林、决策树和支持向量机模型,剩余的20%数据作为测试样本,计算不同模型的预测准确率。随机森林模型、决策树模型与支持向量机模型的总体准确率平均值分别为89.12%,85.23%和84.75%。因此,随机森林模型的泛化能力更好,预测准确性更高。
[0054]
7、将待测样本输入避雷器绝缘状态评估模型,获得待测样本的绝缘状态类型。
[0055]
以上仅是本发明的优选实施方式,只是用于帮助理解本技术的方法及其核心思想,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
[0056]
本发明从整体上解决了现有技术中受到外界温度、湿度及污秽条件等不确定因素的影响,测量量难以作为最终结果的判断依据的技术问题,基于随机森林算法的避雷器绝缘状态评估模型,该模型结合了避雷器带电检测、在线监测等多元信息,考虑了表征运行状态的最典型特征变量,具有较高可信度。相较于其它状态评估方法具有容错和容差能力,具有很强的自适应能力;能把识别速度快、学习算法稳定、易于训练等特点。实际测试数据表明本发明所建立模型的平均预测准确率可达89.12%,比决策树模型及支持向量机模型的平均预测准确率高,故模型的可靠性较强。对避雷器可能存在的缺陷进行推理预测,可以为现场提供更为有效的决策依据,具有一定的工程应用价值。