本公开涉及电网智能诊断技术领域,特别是涉及一种基于随机森林算法的保护动作智能诊断方法及系统。
背景技术:
随着电力系统的不断扩大,保护装置的可靠运行越来越重要,继电保护装置能否正确动作并快速切除故障,直接影响着电力系统的稳定运行。
发现人在实际工作中发现,目前继电保护动作分析主要由专业人员来完成,无法实现在线智能化分析,自动化水平低,分析时间长,越来越不适应智能电网的要求。
技术实现要素:
本说明书实施方式的目的之一是提供一种基于随机森林算法的保护动作智能诊断方法,将随机森林算法应用于保护动作行为智能诊断,作为保护设备运维和检修参考,保障电力系统安全稳定运行。
本说明书实施方式提供一种基于随机森林算法的保护动作智能诊断方法,通过以下技术方案实现:
包括:
获取电网历史故障数据,提取历史故障特征量及目标量;
采用随机森林算法建立基于多棵不同的决策树历史故障保护动作分析模型;
利用电网历史故障数据对所建立的模型进行训练及调优,获得训练后的模型;
当故障发生时,提取表征电网故障的相关特征量,输入到训练后的模型中,计算得出正确的保护动作序列,与保护上送的保护事件、保护及录波器得到的开关量信息对比判断保护动作是否正确,实现保护动作智能诊断。
本说明书实施方式的目的之二是提供一种基于随机森林算法的保护动作智能诊断系统,将随机森林算法应用于保护动作行为智能诊断,作为保护设备运维和检修参考,保障电力系统安全稳定运行。
本说明书另一实施方式提供一种基于随机森林算法的保护动作智能诊断系统,通过以下技术方案实现:
包括:
历史数据提取单元,被配置为:获取电网历史故障数据,提取历史故障特征量及目标量;
模型建立单元,被配置为:采用随机森林算法建立基于多棵不同的决策树历史故障保护动作分析模型;
模型训练单元,被配置为:利用电网历史故障数据对所建立的模型进行训练及调优,获得训练后的模型;
智能诊断单元,被配置为:当故障发生时,提取表征电网故障的相关特征量,输入到训练后的模型中,计算得出正确的保护动作序列,与保护上送的保护事件、保护及录波器得到的开关量信息对比判断保护动作是否正确,实现保护动作智能诊断。
与现有技术相比,本公开的有益效果是:
本公开技术方案提出将随机森林算法应用于保护动作行为智能诊断。综合分析电网历史故障,提取历史故障特征量,采用随机森林算法建立基于多棵不同的决策树历史故障保护动作分析模型,通过多数投票机制决定保护动作序列,与保护上送的保护事件、保护及录波器得到的开关量信息对比判断保护动作是否正确。
本公开技术方案作为保护设备运维和检修参考,保障电力系统安全稳定运行。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1是本公开实施例子基于随机森林算法保护动作行为智能诊断流程图;
图2是本公开实施例子以a相故障为例故障切除前决策树示意图;
图3是本公开实施例子以a相故障投单重为例合闸前决策树示意图;
图4是本公开实施例子重合后决策树示意图。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
随机森林算法(randomforestalgorithm,rfa)是一类组合决策树分类器的方法,具有较少参数调整、可避免过度拟合、适用于数据集中存在大量未知特征、能估算哪个特征在分类中更重要及对噪声更鲁棒等优点,逐渐在众多领域得到应用。
作为保证电网可靠、安全运行的第一道防线,继电保护的快速正确动作将有效遏制系统运行状态的恶化,从而保证系统的稳定运行,因此,继电保护工作的轻微错误,都有可能造成电网运行的严重影响,甚至可能出现系统崩溃。继电保护系统是一个庞大而复杂得系统,发生故障时会产生大量数据,如何对海量数据进行筛选、分析、提取,用以判断继电保护动作是否正确意义重大。随机森林算法因其本身具有的特点,作为人工智能机器学习的重要技术和方法,在电力系统故障诊断逐步得到应用。
实施例子一
该实施例子提供了一种基于随机森林算法的保护动作智能诊断方法,该方法综合分析电网历史故障,提取历史故障特征量,采用随机森林算法建立基于多棵不同的决策树历史故障保护动作分析模型,通过多数投票机制决定保护动作序列,与保护上送的保护事件、保护及录波器得到的开关量信息对比判断保护动作是否正确。
在一实施例子中,一种基于随机森林算法的保护动作智能诊断方法,可包括的步骤为:
步骤一:历史故障特征量及目标量提取及筛选。确定表征电网故障相关特征量及目标量,从历史故障保护动作事件、保护波形、录波器波形中提取特征量和目标量。对提取的历史故障特征、目标量不满足要求的进行筛除,最终组成样本数据;
此处不满足要求具体指:由于设备原因,可导致历史故障记录保护动作事件、保护波形、录波器波形数据或文件存在明显错误,不满足样本要求。
步骤二:模型训练:使用历史故障特征对随机森林模型进行训练及调优。
步骤三:模型预测及反馈。当故障发生时,提取表征电网故障的相关特征量,输入到基于随机森林历史数据的保护动作行为智能诊断模型中,计算得出正确的保护动作序列,与保护上送的保护事件、保护及录波器得到的开关量信息对比判断保护动作是否正确,实现保护动作智能诊断;诊断模型做出判断后经人工判断确认为正确加入样本库中。
正确的保护动作序列在计算时,通过对历史故障数据进行模型训练和调优,建立特征量和目标量的逻辑关系模型,当新的故障特征量输入时,会根据模型预测输出结果。
在该步骤中,此样本库指模型预测训练时用到的样本库,模型预测准确,即计算输出的保护动作序列与故障数据提取的目标量吻合,加入样本库是本次故障数据提取的故障特征量和目标量。
在上述实例子中,对于上述各步骤所涉及的具体算法作如下阐述:
步骤s1:本公开技术方案首次提出将故障过程进行切片,划分为故障切除前、重合前、重合后三个阶段,分别进行故障特征量和目标量提取。通过对大量历史复杂故障进行分析,发现复杂故障三个阶段保护的动作行为与普通简单故障的某一阶段保护动作行为相同。故可将故障划分为故障切除前,重合前,重合后三个阶段,并将其作为训练样本,采用随机森林算法建立各阶段的保护动作分析模型,以此来诊断复杂故障各阶段的保护动作行为。
在该步骤中,三个模型不需要进行结合,是分别用来训练,对于复杂故障,三个模型预测结果依次为三个阶段保护动作的行为,需要与对应阶段实际保护动作行为对比,判断预测是否准确。
步骤s2:根据保护动作事件、保护波形、录波器波形及电力系统保护动作逻辑及相关专业知识确定各阶段模型所需特征量和目标量。
步骤s3:本次随机森林算法建立基于多棵不同的决策树历史故障保护动作分析模型,降低单一决策树有可能带来的片面性和不确定性
步骤s4:通过多数投票机制决定保护动作序列,与保护上送的保护事件、保护及录波器得到的开关量信息对比判断保护动作是否正确。本此模型采用随机森林算法是基于多棵不同的决策树,每棵树都会预测出一个结果,可能会输出多于1种结果,模型采用多数服从少数决定预测结果,作为本次整体预测结论。
步骤s5:模型训练步骤是使用历史故障特征对随机森林模型进行训练及调优。其中预选变量个数和随机森林中树的个数是重要参数,对系统的调优非常关键。这些参数在调节随机森林模型的准确性方面也起着至关重要的作用。本次预选变量个数取特征总数的平方根。当随机森林中树的个数达到一定数目后,树的个数增加,模型性能不再提高,须经反复的实验最终确定树的个数。
在该步骤中,树的个数过多,会增加模型的复杂程度;过少会导致预测不准确,树的个数选取无法从理论上确定,故需要反复试验确定。在该步骤中,特征总数故障各个阶段的特征量之和。
步骤s6:随机森林模型的构建过程如下:
1)设定输入特征数目,用于确定决策树上一个节点的决策结果。参见附图2中,每个椭圆对应一个节点。
2)从训练用例(样本)中以有放回抽样的方式,随机抽取一部分数据形成一个训练集,并用未抽到的用例(样本)作预测,评估其误差。
3)对于每一个节点,随机选择特征,计算其最佳的分裂方式,计算其最佳分裂方式的方法有多种,下面介绍使用信息增益来选择最佳分裂方式,信息增益越大,说明分裂越彻底,所以应选择分裂后信息增益最大的属性进行分裂。
训练样本即模型训练用的数据,此次指从历史故障中提取的故障特征量和目标量。设d为对训练样本进行划分的类别,则d的熵(entropy)表示为:
其中,m为目标量的类别数量,在本实施例子中为分类目标量所有情况总数,即确定故障目标量总数,其中pi表示第i个类别在整个训练元组中出现的概率,可以用属于此类别元素的数量除以训练元组元素总数量作为估计。
假设将训练样本d按属性a进行划分,在具体例子中,如:样本(d)按照“故障相别(a)”进行划分,可划分为a相故障、b相故障、c相故障、ab、bc、ac相故障等。则a对d划分的期望信息为:
而信息增益即为两者的差值:
goin(a)=info(d)-infoa(d)
4)每棵树都会完整成长而不会剪枝,这有可能在建完一棵正常树状分类器后会被采用。
5)重复上述步骤,构建另外一棵棵决策树,直到达到预定数目的一群决策树为止,即构建好了随机森林模型。
随机森林算法需要根据随机选择的特征进行反复测试,直至计算出最佳的分裂方式,加入此次生成树为最佳分裂方式生成,则会被分类器采用,否则不采用。
随机森林算法作为一种较为成熟的算法,本公开技术方案重在建立特有的故障特征量集、目标量集、并首次提出将故障分段研究。本公开技术方案是侧重算法服务于工程实际,建立的预测模型是基于故障特征量集、目标量集的确定和提取,
步骤s7:模型预测与反馈步骤是当故障发生时,从保护波形、录波器波形中提取表征电网故障的相关特征量,输入到基于随机森林历史数据的保护动作行为智能诊断模型中,计算得出正确的保护动作序列,与保护上送的保护事件、保护及录波器得到的开关量信息对比判断保护动作是否正确;诊断模型做出判断后经人工判断确认为正确加入样本库中。
实施例子二
该实施例子提供了一种基于随机森林算法的保护动作智能诊断方法,并将该方法具体应用至实际工程例子中,用于判断继电保护装置的动作正确与否。在具体实施工程例子中,包括以下内容:
步骤一:确定并提取故障特征量。故障切除前提取的特征量:故障相别,过渡电阻,故障持续时间范围内a、b、c三相阻抗方差,故障持续时间范围内ab、bc、ac相相间阻抗方差,零序电压、电流,故障距离百分比,共11项;重合前提取的特征量:故障相别,重合闸方式,a、b、c三相无流,共5项;重合后提取的特征量:故障相别,过渡电阻,故障持续时间范围内a、b、c三相阻抗方差,故障持续时间范围内ab、bc、ac相相间阻抗方差,零序电压、电流,故障距离百分比,共11项。
步骤二:确定并提取故障目标量。故障切除前目标量:a、b、c相差动,零序差动动作,a、b、c距离ⅰ段动作,纵联方向保护动作,ab、ac、bc相间距离ⅰ段动作,a、b、c相跳闸出口,a、b、c相跳位共17项;合闸前目标量:重合闸1项;重合后目标量:故障后保护动作(包括差动保护动作、零序过流加速段动作、距离加速段动作,其中一个动作即为动作),重合后a、b、c相跳闸出口,重合后a、b、c相跳位共7项。保护发生动作或开关量发生变位则标记为1否则标记为0,最终将该动作序列转换为一个整数作为随机森林模型的目标量。
为方便计算,将是否动作用数字代替。按照上所述目标量顺序,如10000000000000则表示为a相差动动作。
步骤三:获取某省近一年的电网故障作为样本数据。对样本进行故障特征量和目标量提取,筛除不符合要求的样本数据。将样本数据分为两部分,一部分样本数据对随机森林进行训练获得分析模型,另一部分样本数据用于进行测试验证,训练样本、测试样本保持故障类型、故障点位置等特征均衡。
样本中,故障类型要全面覆盖,且每个类型数量基本相同,同样涵盖各故障点的位置,确保样本有效,预测模型适用于各种故障,实现特征均衡。
步骤四:选择子特征的个数的经验值一般是原特征个数的平方根,目前系统中设置三段分析树,第一阶段特征11个、第二阶段4个、第三阶段11个,共计的特征数量为26个,所以预设变量个数设置为6个;随机森林中树的个数较多的可以让模型有更好的性能,但当随机森林中树的个数达到一定数目后树的个数的增加无法让模型有更好的性能,经过反复的实验最终将树的个数设置为30。
步骤五:根据本专利上述随机森林模型的构建过程,建立随机森林模型。
步骤六:通过训练样本测试部分验证,分析正确率整体可高达95%。
参见附图1所示,基于随机森林算法保护动作行为智能诊断流程图。
当故障发生时,从保护波形、录波器波形中提取表征电网故障的相关特征量,输入到基于随机森林历史数据的保护动作行为智能诊断模型中,计算得出正确的保护动作序列,与保护上送的保护事件、保护及录波器得到的开关量信息对比判断保护动作是否正确;诊断模型做出判断后经人工判断确认为正确加入样本库中。
模型的特征量和目标量的确定,是根据经验、理论初步确定的,难免会存在不足的地方,在模型的预测的过程中或预测后,可根据预测结果对模型进行修正,提高准确率;初测建立样本集时,难免会掺混实际保护动作特性出现错误的样本,对模型预测的准确性造成影响;而根据模型预测的结果与实际保护动作吻合的故障记录,准确度极高,替换旧数据会一定程度提高模型预测的准确度。
在具体例子中,如图2所示,合闸前以a相故障投单重决策树示意图,故障相别、阻抗方差、零序电流、零序电压,均为随机选择的故障特征量,根据这些特征量所具有的属性不断分裂,最终形成决策树。
在具体例子中,如图3所示,以a相故障投单重为例合闸前决策树示意图,根据特征量选择a、b、c三相是否有流、重合闸方式,以及特征量的属性,不断分裂,其目标量为是否重合闸,最终建立重合闸前的决策树。
在具体例子中,如图4所示,重合后决策树示意图,根据故障后特征量选择故障相故障电流、健全相是否有故障电流,以及特征量有、无的属性,分裂,最终建立的重合闸后的决策树。
实施例子三
该实施例子提供了一种基于随机森林算法的保护动作智能诊断系统,包括:
历史数据提取单元,被配置为:获取电网历史故障数据,提取历史故障特征量及目标量;
模型建立单元,被配置为:采用随机森林算法建立基于多棵不同的决策树历史故障保护动作分析模型;
模型训练单元,被配置为:利用电网历史故障数据对所建立的模型进行训练及调优,获得训练后的模型;
智能诊断单元,被配置为:当故障发生时,提取表征电网故障的相关特征量,输入到训练后的模型中,计算得出正确的保护动作序列,与保护上送的保护事件、保护及录波器得到的开关量信息对比判断保护动作是否正确,实现保护动作智能诊断。
应当注意,尽管在上文的详细描述中提及了设备的若干模块或子模块,但是这种划分仅仅是示例性而非强制性的。实际上,根据本公开的实施例,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
实施例子四
该实施例子公开了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤:
获取电网历史故障数据,提取历史故障特征量及目标量;
采用随机森林算法建立基于多棵不同的决策树历史故障保护动作分析模型;
利用电网历史故障数据对所建立的模型进行训练及调优,获得训练后的模型;
当故障发生时,提取表征电网故障的相关特征量,输入到训练后的模型中,计算得出正确的保护动作序列,与保护上送的保护事件、保护及录波器得到的开关量信息对比判断保护动作是否正确,实现保护动作智能诊断。
这些计算机可执行指令在设备中运行时使得该设备执行根据本公开中的各个实施例所描述的方法或过程。
实施例子五
该实施例子公开了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现以下步骤:
获取电网历史故障数据,提取历史故障特征量及目标量;
采用随机森林算法建立基于多棵不同的决策树历史故障保护动作分析模型;
利用电网历史故障数据对所建立的模型进行训练及调优,获得训练后的模型;
当故障发生时,提取表征电网故障的相关特征量,输入到训练后的模型中,计算得出正确的保护动作序列,与保护上送的保护事件、保护及录波器得到的开关量信息对比判断保护动作是否正确,实现保护动作智能诊断。
这些计算机可执行指令在设备中运行时使得该设备执行根据本公开中的各个实施例所描述的方法或过程。
在本实施例中,计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。
本文所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
实施例子五
该实施例子公开了一种继电保护装置,该继电保护装置的动作的诊断利用上述一种基于随机森林算法的保护动作智能诊断方法进行诊断,通过多数投票机制决定保护动作序列,与保护上送的保护事件、保护及录波器得到的开关量信息对比判断保护动作是否正确,若对比一致,则继电保护装置动作正确,否则,动作有误。利用该技术方案可以作为保护设备运维和检修参考,保障电力系统安全稳定运行。
可以理解的是,在本说明书的描述中,参考术语“一实施例”、“另一实施例”、“其他实施例”、或“第一实施例~第n实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。