一种基于svm分类技术的电网故障原因诊断方法
【专利摘要】一种基于SVM(Support Vector Machine,支持向量机)分类技术的故障原因诊断方法,利用电网中大量的历史录波数据,采用小波变换方法把原始信号分解为表达不同层次不同频带的特征向量,并通过实验的结果选取最优的核函数,进而对历史录波数据进行SVM分类模型训练,形成支持在线自动化故障原因预测模型。从而辅助电力专业人员结合实时录波数据,在线对电网故障的原因进行提前预测,以便及时采取对应的保护措施,具有较强的实用价值。
【专利说明】
一种基于SVM分类技术的电网故障原因诊断方法
技术领域
[00011本发明属于电力系统技术领域,具体涉及一种针对电力系统的基于SVM(Support Vector Machine,支持向量机)分类技术的故障原因诊断方法。
【背景技术】
[0002] 当前,电网中存在大量的录波装置,实时记录电网发生故障前后的电气变量的时 序数据。目前对于此类数据,都是为了事后分析电网故障原因,分析手段一般也是以手动分 析为主,缺乏在线、大规模、自动化分析的手段。录波器启动记录的条件往往是单一指标的 超限,而且为了能够在分析事故原因时提供充分证据,越限门槛值一般都设定得比较低。这 样形成的结果是,很多录波对应的时刻,系统并没有发生明显异常,而个别故障时刻的重要 录波,也只在事后分析时才发挥作用。长年积累下来大量的录波文件,除了用于历史备案且 占据大量的硬盘空间,却没有形成能帮助运行人员理解电网状态的知识,以便能及时识别 故障原因及采取相应的措施进行应对,甚至进行预测以便制定必要的预防措施。
[0003] 在此背景下,本申请提出一种基于SVM分类技术的故障原因诊断方法,该方法属于 一种数据驱动的方法,根据历史上收集的设备监测数据,自动训练、建立故障原因诊断模 型,探索大量录波数据中蕴含的规律与模式,并将此规律和模式形成预测模型,结合实时录 波数据在线电网故障的原因进行及时判断。
【发明内容】
[0004] 本发明的目的是为了解决当前存在的问题:对录波数据分析较为独立、对大规模 的录波数据并没有综合进行利用,分析的自动化程度不高,一般都以手动分析为主,而且分 析的结果一般用于事后分析电网故障,不能将其中规律性的知识进行挖掘和提炼,发挥其 更大价值。
[0005] 为解决上述技术问题,本发明具体采用以下技术方案:
[0006] 一种基于SVM分类技术的电网故障原因诊断方法,其特征在于:
[0007] 利用电网中大量的历史录波数据,采用小波变换方法把原始数据信号分解为表达 不同层次不同频带的特征向量,对历史录波数据进行SVM分类模型训练,获得分类决策函 数,最后基于该分类决策函数对故障时的实时录波数据进行分析从而实现对电网故障原因 的诊断。
[0008] 所述诊断方法包括以下步骤:
[0009] 步骤1:从电网业务系统的原始录波数据库中获取历史录波数据及故障信息形成 原始数据样本集;
[0010] 步骤2:对步骤1中形成原始数据样本集进行预处理并通过插值形成规范的电压/ 电流信号数据样本;
[0011] 步骤3:将步骤2所得到的规范的电压/电流信号数据样本分解为表达不同层次不 同频带信息的数据序列即各阶小波系数,对各阶小波系数进行能量计算,完成对规范的电 压/电流信号数据样本的特征提取,形成特征向量,并按照故障相别字母序的顺序重新排列 组合,形成一个组合特征向量;
[0012] 步骤4:构造训练样本Di:
[0013] D, = [F^ /, FTypet]
[0014] 其中i为训练样本序号,为步骤3最后形成的组合特征向量,FTypei是分类标记 即为故障原因字段的值,故障原因包括山火、雷电、异物、树木放电,每一故障原因字段的值 映射为一个数字;
[0015] 通过支持向量机(SVM)对训练样本按照类别进行分类训练,
[0016] 得到以下分类决策函数:
[0017] f'(X) = {prob(X,Ci) 11 = 1. .m},
[0018] 其中,X为待预测样本,probKCO为待预测样本X属于某个类别&的概率,1为类别 的下标,一共有m个类别;
[0019] 步骤5:采集实时录波数据,将所采集的实时录波数据用步骤2、3中同样的特征提 取方法,将提取的实时故障录波数据中的电流/电压信号的特征向量根据按照故障相别字 母序的顺序重新排列组合形成组合特征向量€",,其中P表示待预测样本的序号;
[0020] 根据步骤4中训练得到的多分类决策函数:
[0021] f' (X) = {prob(X,Ci) 11 = 1. .m}
[0022] 将代替X,将所有的故障原因类别任选一个标识为FType替换Ci,计算得到该预 测样本属于各个故障原因类别的概率。
[0023] 本发明具有以下有益的技术效果:
[0024] 本发明基于大数据技术的故障预测方法,克服了之前基于模型方法的建模复杂、 先验参数确定的困难。不是针对单个录波文件独立进行分析,而是将所有录波数据整体上 进行考虑,深度洞察隐藏于海量录波文件中确定性的规律和模式。本发明便于辅助电力专 业人员快速对实时产生的录波数据进行分析并预判引起电网故障原因,以便及时采取对应 的保护措施,具有较强的实用价值。
【附图说明】
[0025]图1为基于SVM分类技术的电网故障原因诊断方法流程图;
[0026]图2为从录波中提取与挖掘相关的电压电流信号。
【具体实施方式】
[0027]下面结合说明书附图对本发明的技术方案做进一步详细介绍。
[0028] 本申请以一个基于某个电网的变电站的故障录波数据来预测故障原因的实验为 例,说明如何基于历史数据预测电网故障。
[0029] 如附图1所示,本申请公开的基于SVM分类技术的电网故障原因诊断方法具体包括 以下步骤:
[0030] 步骤1:从电网业务系统的原始录波数据库中获取历史录波数据及故障信息形成 原始数据样本集,其中,所述历史录波数据为故障录波器或集中录波器产生的录波文件,所 述故障信息包括厂站、录波产生时间、数据采样频率、故障时间、故障相别、故障通道号、故 障原因;
[0031]本发明以某电网为实施例,收集某电网的历史故障录波数据,如下表所示,样本数 为200个,电流频率为50HZ。
[0032]表1原始录波信息表
[0033]
[0034]
[0035] 共中)站id列为)站的綱亏,时|日」为故障求汲数据的升妬生成时|日」。求汲数据中, 其内容为发生故障前、后一段时间的状态检测数据,应包含了故障的全过程监测数据,表1 中,列举了录波文件相关的参数,录波参数不限于表中所列。故障点是故障发生时刻所在的 数据点序号。故障原因为事后确认的故障原因。
[0036] 步骤2:对步骤1中形成原始数据样本集进行预处理并通过插值形成规范电压/电 流信号数据样本。
[0037] 2.1首先对关键字段缺失的数据进行筛除。这里关键字段为故障通道号、故障原 因。因为如果没有此字段,将导致故障相关的电压电流信号无法提取,训练样本类别无法确 定。
[0038] 2.2其次,根据算法对数据质量的要求,对原始的历史录波数据进行判定,筛除质 量不满足要求的原始录波数据。在这里,选取故障点前2个周波和故障后10个周波的数据作 为感兴趣的区间。数据长度达不到此最小条件的样本予以筛除。
[0039] 2.3之后将故障点前后12个周波数据,从原始数据中提取出来,作为数据样本。因 小波变换后每层对应的信号频率为原始频率的一半,因此为了保证样本的一致性,按照统 一的频率对提取出的样本进行插值。设定统一的频率为5000,则其他频率的样本数据根据 此频率进行降采样或插值,如图2所示。
[0040] 2.4按照统一的频率对提取出的电压/电流信号数据样本进行插值,最终形成统一 采样频率的规范的电压/电流信号数据样本,此样本中包含1^、1^、1](:、13、113、1(3对应的数据 序列:〇11 3、0仙、〇11。、〇13、0心〇1。,其中,1^、1]13、1^、1&、113、1(3分别为所提取的三相提取出的电 压/电流信号数据,〇^、〇此、〇 11。、〇13^1。为三相电压/电流信号数据样本所分别对应的数 据序列。
[0041] 步骤3:将步骤2所得到的规范的电压/电流信号数据样本分解为表达不同层次不 同频带信息的数据序列即各阶小波系数,对各阶小波系数进行能量计算,完成对规范的电 压/电流信号数据样本的特征提取,形成特征向量,并按照故障相别字母序的顺序重新排列 组合,形成一个组合特征向量;
[0042] 具体方法是依次对规范电压/电流信号数据样本中的数据序列f(t)进行小波变 换,表不为:
[0043]
[0044] 其中f(t)为电压/电流信号数据序列,为〇113、0_、〇11。、013、0 1^1。,、为第如介的近似 信号即进行小波变换分解的j阶近似信号,Dk为第k阶的细节信号,j表示设定的进行小波变 换分解最大阶数;
[0045] C〇fAq为小波变换第q阶近似信号对应的系数数组,cofDi-cofDq分别为小波变换 第q阶细节信号对应的系数数组;将cofA q和cofDi-cofDq组合成一个小波系数向量为 C〇fAll = [C0fAq,C0fDl, . . .cofDq],进而分别计算小波系数能量,小波近似系数的能量E (COfAq)为:
[0046]
[0047] 其中f为数组C〇fAq每个元素的下标,lenq为数组cofA q的长度,g为数组cofAll的每 个元素下标,lenaii为cofAll的长度;
[0048]细节系数的能量E(cofDk)为:
[0049]
[0050] 其中cofDk表示第k阶小波细节系数数组,s为数组cofDk的下标,lenk为数组cofDk 的长度,g为cof Al 1的下标,lenaii为数组cof Al 1的长度;
[0051]将E(cofAj)、E(cofDk)进行组合,形成欲提取的子特征向量Fu/i:
[0052] Fu/i = [E(cofAj),E(cofDi),E(cofD2),· · .E(cofDj)]
[0053] 依次对于步骤2中的〇113、0仙、〇11。、〇13、〇1^〇1。分别进行特征向量提取,形成6个子特 征向量而^1 1^11。、?1^1^1^将这6个子特征向量,按照故障相别字母序的顺序重新排列 组合,形成一个组合特征向量。
[0054]因为状态检测数据一种生数据,在进行模型训练前,需要将生数据转换为熟数据 即特征数据,因此该过程根据设备类型的不同而不同。采用小波分析,对故障点前后12个周 波进行信号分解,首先需要根据原始信号的特点选择小波基,考虑到原始信号是电压电流 信号,为正弦信号叠加异常信号,因此本实施例选择db4小波基作为基函数。
[0055]利用小波变换可以对时间序列信号进行特征提取,提取出可以代表时间序列信号 的向量数据 FU/I=[E(C0fAj),E(C0fDl),E(C0fD2),...E( C0fDj)],完成从原始信号到特征 向量数据的变换。在本实施例中,用小波变换将原始信号分解到第5层。得到各个录波数据 对应的样本如下表所示:
[0056] 表2录波数据信号分解处理后形成的样本
[0057]
[0058] 步骤4:构造训练样本Di:
[0059]
[0060] 其中i为训练样本序号,/?为步骤3最后形成的组合特征向量,FTypei是分类标记 即为故障原因字段的值,故障原因包括山火、雷电、异物、树木放电等,每一故障原因字段的 值映射为一个数字;
[0061] 通过支持向量机(SVM)对训练样本按照类别进行分类训练:
[0062]支持向量机(SVM)是一种经典二分类模型,通过在原特征空间或经投影后的高维 空间上构造最优分类面,将给定的属于两个类别的训练样本分开。支持向量机模型训练的 过程是构造超平面的过程,其依据是两类样本离超平面的距离最大化,在训练中通过利用 已知样本与类别,在本发明中已知样本为和类别FTyp ei,可得到分离超平面:
[0063] ω* · x+b* = 0
[0064] 其中为超平面参数,x为训练样本,最终得到二分类决策函数为
[0065] f(X) =sgn( ω* · X+b*)
[0066] 为训练得到的超平面参数,X为输入的测试样本,sgn函数根据样本X距离超 平面的距离,返回+1或-1,表示该样本属于二类中的哪一类。
[0067]由于SVM解决的是二分类问题,而本发明处理的情况是多分类的情况,因此采用通 常的一对一法(one-versus-one,简称0V0)处理多分类问题,分类决策函数变为:
[0068]得到以下分类决策函数:
[0069] f'(X) = {prob(X,Ci) 11 = 1. .m},
[0070] 其中,X为待预测样本,ρΓ〇ΜΧ,ω为待预测样本X属于某个类别(^的概率,1为类别 的下标,一共有m个类别。
[0071 ] prob(X,Cu)定义如下:
[0072
[0073] 其中,右式上部表示判定X类别为Cu的总次数,表示类别为CU,CV时二分 类超平面参数,sgn函数为二分类决策函数,当sgn函数返回值为1表示样本X属于Cu类别,计 数值加 1;右式下部为判定的总次数,设定类别的数目为m,则共有2mX(m-l)个二分类别对; 训练中将故障原因类别相同的样本进行归集,依次取出两个类别C U,CV的样本,进行训练得 到其对应的超平面参数^£_^、,循环这个过程直到遍历完毕所有的类别对,得到所有 的超平面参数,进而分类决策函数f'(X)的参数得到确定。
[0074] 以一个样本的特征向量生成作为例子,比如样本1的故障相别为B,经过之前步骤 提出来各个电压电流的子特征向量为?113{_、?11。{ 13、?1^?1^那么最终形成的该样本对应 的组合特征向量为:
[0075] <Fub,Fuc,Fua,Fib,Fic,Fia>
[0076] 另外,进行训练时,需要将样本类别进行数值化处理,建立如下映射表:
[0077]表3故障类别映射表
[0078] '[0079]最终的训练样本数据集为:
' '
[0080] 表4训练样本数据集
[0081]
[0082] 将得到的训练数据集输入训练模型,得到多类别预测函数即分类预测模型。
[0083] 步骤5:步骤5:采集实时录波数据,将所采集的实时录波数据用步骤2、3中同样的 特征提取方法,将提取的实时录波数据中的电流/电压信号的特征向量根据按照故障相别 字母序的顺序重新排列组合形成组合特征向量€;\其中P表示待预测样本的序号;
[0084] 根据步骤4中训练得到的多分类决策函数:
[0085] f' (X) = {prob(X,Ck) | k = 1. .m}
[0086] 将代替X,将所有的故障原因类别任选一个标识为FType替换Ck,计算得到该预 测样本属于各个故障原因类别的概率。
[0087] 分类预测模型训练完成后,需结合实时录波数据进行故障原因诊断。实时录波数 据从保护装置条件触发产生上送到上位机,或者由上位机定时召唤采集。实时录波数据及 相关信息类似表1,但其没有故障原因这一列的信息,此列正是这一步骤需要计算给出的结 果。将一批用于测试的实时录波数据,按照步骤2)至4)的处理过程,将原始数据转换为模型 的输入向量,对故障原因进行预测和验证,预测结果如表5所示:
[0088] 表5预测结果
[0089]
[0090]由表的结果可以看出,对于测试的8个实时录波数据,除了6和7号数据样本,其他 样本的预测结果与样本的实际所属类别是一致的。同时在6和7号数据样本中,数据样本的 预测结果与实际类别较为接近,如6号数据样本实际类别为"外力破坏",预测结果中,类别 为"外力破坏"和"异物"的概率分别为18.8 3 %和5 0.64 %,分别为概率最大的前两位;同样7 号数据样本实际类别为"异物",而预测结果中,类别为"雷电"和"异物"的概率分别为 39.93%和 25.98%。
[0091]
【申请人】结合说明书附图对本发明的实施例做了详细的说明与描述,但是本领域技 术人员应该理解,以上实施例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者 更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精 神所作的任何改进或修饰都应当落在本发明的保护范围之内。
【主权项】
1. 一种基于SVM分类技术的电网故障原因诊断方法,其特征在于: 利用电网中大量的历史录波数据,采用小波变换方法把原始数据信号分解为表达不同 层次不同频带的特征向量,对历史录波数据进行SVM分类模型训练,获得分类决策函数,最 后基于该分类决策函数对故障时的实时录波数据进行分析从而实现对电网故障原因的诊 断。2. -种基于SVM分类技术的电网故障原因诊断方法,其特征在于,所述诊断方法包括W 下步骤: 步骤1:从电网业务系统的原始录波数据库中获取历史录波数据及故障信息形成原始 数据样本集; 步骤2:对步骤1中形成原始数据样本集进行预处理并通过插值形成规范的电压/电流 信号数据样本; 步骤3:将步骤2所得到的规范的电压/电流信号数据样本分解为表达不同层次不同频 带信息的数据序列即各阶小波系数,对各阶小波系数进行能量计算,完成对规范的电压/电 流信号数据样本的特征提取,形成特征向量,并按照故障相别字母序的顺序重新排列组合, 形成一个组合特征向量巧 步骤4:构造训练样本化:其中i为训练样本序号,巧,,为步骤3最后形成的组合特征向量,FTypei是分类标记即为 故障原因字段的值,故障原因包括山火、雷电、异物、树木放电,每一故障原因字段的值映射 为一个数字; 通过支持向量机(SVM)对训练样本按照类别进行分类训练, 得到W下分类决策函数: f' (X) = {prob(X,Ci) 11 = 1. .m}, 其中,X为待预测样本,prob(X,Ci)为待预测样本X属于某个类别Cl的概率,1为类别的下 标,一共有m个类别; 步骤5:采集实时录波数据,将所采集的实时录波数据用步骤2、3中同样的特征提取方 法,将提取的实时故障录波数据中的电流/电压信号的特征向量根据按照故障相别字母序 的顺序重新排列组合形成组合特征向量巧自,其中P表示待预测样本的序号; 根据步骤4中训练得到的多分类决策函数: f' (X) = {prob(X,Ci) 11 = 1. .m} 将f/',代替X,将所有的故障原因类别任选一个标识为FType替换Ci,计算得到该预测样 本属于各个故障原因类别的概率。3. 根据权利要求2所述的基于SVM分类技术的电网故障原因诊断方法,其特征在于: 在步骤1中,所述历史录波数据为故障录波器或集中录波器产生的录波文件,所述故障 信息包括厂站、录波产生时间、数据采样频率、故障时间、故障相别、故障通道号、故障原因。4. 根据权利要求2或3所述的基于SVM分类技术的电网故障原因诊断方法,其特征在于: 在步骤2中,对原始数据样本集的预处理和插值包括W下内容: 2.1筛除关键字段缺失的原始数据样本,所述关键字段包括故障通道号、故障原因; 2.2筛除数据长度小于设定值的原始数据样本,所述设定值是指故障前2个周波和故障 后10个周波共12个周波的数据长度; 2.3针对故障通道号所指向的电压/电流信号数据,将故障点前后12个周波的电压/电 流信号数据,从原始录波文件中提取出来; 2.4按照统一的频率对提取出的电压/电流信号数据样本进行插值,最终形成统一采样 频率的规范的电压/电流信号数据样本,此样本中包含化、师、Uc、la、Ib、Ic对应的数据序 列:〇113、0化、0化、〇13、0比、〇1。,其中,11日、化、恥、1日、化、1〇分别为所提取的;相提取出的电压/ 电流信号数据,Dua、Dub、Duc、Dia、Dib、〇1。为;相电压/电流信号数据样本所分别对应的数据序 列。
【文档编号】G01R31/08GK105974265SQ201610279840
【公开日】2016年9月28日
【申请日】2016年4月29日
【发明人】徐延明, 丁柏玲, 张利强
【申请人】北京四方继保自动化股份有限公司