基于关联规则的电网资源故障诊断方法
【技术领域】
[0001] 本发明涉及电网故障分析技术领域,具体涉及一种基于关联规则的电网资源故障 诊断方法。
【背景技术】
[0002] 随着电力电网规模的不断扩大,发生故障时电力设备会有大量的故障信息,当调 度中心收到这些信息后,调度人员一般会快速分析故障特征,判断故障设备并尽快恢复供 电。而在电网故障实际诊断中,调度人员面临如何从海量历史故障数据中找出所发生的连 锁故障之间的相互影响的关联性、所发生此故障对于引发起其他故障的概率问题。
[0003] 我国在故障诊断技术方面的研究可分为两个阶段,第一阶段为起步阶段,从1979 年至1990年大约用了 10年时间,这个阶段的特点是认识设备诊断技术的重要性,设备诊断 技术的基础理论研究十分活跃,这个阶段以快速傅里叶变换、谱分析、信号处理等技术为基 础,以设备状态监测为技术目标;第二阶段为发展阶段,从1991年开始至90年代末以我国 工业的建设迅速发展为背景,以现代化管理的需要为前提,出现了诊断技术迅速发展的局 面。这个阶段以故障分类、模式识别、智能化专家系统及其计算(故障树计算、模糊逻辑计 算、神经网络计算、基因计算等)为基础,全方位开展了设备的故障诊断研究,从理论和生 产应用上形成了具有我国特点的故障诊断理论,研制出了可与国际接轨的大型设备状态监 测与故障诊断系统。
[0004] 目前,电力设备故障诊断是涉及多方面的知识,国内外学者在研究采用诸如神经 网络、模糊理论等技术领域,取得了一定的进展。应用这些方法在故障诊断方面虽然都有一 定的优势,但采用单一的诊断模式对电力设备进行故障诊断时,会存在推理能力弱,出现匹 配冲突,容错能力差的缺点,所以仅仅单凭某一个方法就主观地下结论容易导致误判或漏 判。针对上述的电力设备故障诊断的问题,如何克服了单一方法的缺陷与不足,提高电力设 备故障诊断的准确度,是当前急需解决的问题。
【发明内容】
[0005] 本发明的目的是为了克服现有的单一方法的电力设备故障诊断缺陷与不足的问 题。本发明的基于关联规则的电网资源故障诊断方法,综合采集电力设备相关数据,建立多 维数据模型和故障事实表,为数据挖掘提供数据基础,采用聚类分析对数据进行初步分析, 综合各类数据进行数据关联分析,进行比较判断,形成多智能判据综合,故障判断准确,具 有良好的应用前景。
[0006] 为了达到上述的目的,本发明所采用的技术方案是:
[0007] -种基于关联规则的电网资源故障诊断方法,其特征在于:包括以下步骤,
[0008] 步骤(A),抽取故障数据,对故障数据进行转换,并加载到数据仓库,建立多维数据 模型和故障事实表;
[0009] 步骤(B),对故障数据进行聚类分析;
[0010] 步骤(C),对故障数据进行关联规则分析;
[0011] 步骤(D),将实际的故障事件抽象为节点,根据步骤(B)聚类分析和步骤(C)的关 联分析的结果进行比对,比对步骤(C)中得到高可信度的故障电网设备在步骤(B)中的聚 合程度相符合,则得到诊断结果,并对电网故障处理给出辅助建议;
[0012] 前述的基于关联规则的电网资源故障诊断方法,其特征在于:步骤(A)抽取故障 数据,是从数据仓库中抽取历史故障数据。
[0013] 前述的基于关联规则的电网资源故障诊断方法,其特征在于:步骤(B),对故障数 据进行聚类分析,包括以下步骤,
[0014] (B1),如公式(1)所示,利用欧氏距离作为故障数据样本见的相似性度量,
[0015]
[0016] 其中,X= {Xm|m= 1,2,…,total}为故障数据集;X中的样本用数目为d个描述 属性来表示,且d个描述属性都是连续型属性;数据样本Xi= (Xu,Xl2, -XJ,数 据样本Xi= (X川Xj2,…Xjd) ;Xn,Xl2,…1和X川Xj2,…Xjd分别是样本X种X对应d个描 述属性AyA2,... 取值;数据样本X满Xj之间的相似度用它们之间的距离d(xdXj)来 表示,距离越小,数据样本&和X,越相似,差异度越小;距离越大,数据样本X4卩X,越不相 似,差异度越大;
[0017] (B2),选择评价聚类性能的准则函数,如公式(2)所示,
[0018] (2;
[0019] 其中,设故障数据集X包含数目为k的聚类子集X1,X2, ...,Xk,各个聚类子集的均 值代表点分别为ml,m2,. ..,mk;p为样本特征向量;
[0020] (B3),选择故障数据的初始分类,之后采用迭代的方法利用公式(1)得到聚类结 果,通过评价聚类性能的准则函数公式(2)取得最优值。
[0021] 前述的基于关联规则的电网资源故障诊断方法,其特征在于:步骤(0,对故障数 据进行关联规则分析,包括以下步骤,
[0022] (C1),给定一组故障信息F=的,F2,…F^}、故障区域C=IA,C2,…Cn},故障关联 规则为R:C= >Y的蕴含式,其中R为规则的条件并且是F的模式,Y为规则的结果并且是C 的模式;
[0023] (C2)根据公式(3),得到关联规则下故障数据集X的支持度,
[0024]
(3)
[0025] 其中,supporUX)描述故障数据集X出现的概率,a)um(XgT_)为交易集D中包 含故障数据集X的交易数量,Id|为交易集d中包含的所有交易数量;
[0026] (C2)根据公式(4),得到关联规则的可信度confidence(X3Π,
[0027]
[0028] 其中,suppporUXUY)为关联规则下故障数据集X和规则的结果Y共同出现的 支持度;support(X)为关联规则下故障数据集X的支持度。
[0029] 本发明的有益效果是:本发明的基于关联规则的电网资源故障诊断方法,综合采 集电力设备相关数据,建立多维数据模型和故障事实表,为数据挖掘提供数据基础,采用聚 类分析对数据进行初步分析,综合各类数据进行数据关联分析,进行比较判断,形成多智能 判据综合,故障判断准确,具有良好的应用前景。
【附图说明】
[0030] 图1是本发明的基于关联规则的电网资源故障诊断方法的流程图。
【具体实施方式】
[0031] 下面将结合说明书附图,对本发明作进一步的说明。
[0032] 本发明的基于关联规则的电网资源故障诊断方法,综合采集电力设备相关数据, 建立多维数据模型和故障事实表,为数据挖掘提供数据基础,采用聚类分析对数据进行初 步分析,综合各类数据进行数据关联分析,进行比较判断,形成多智能判据综合,故障判断 准确,如图1所示,包括以下步骤,
[0033] 步骤(A),抽取故障数据,对故障数据进行转换,并加载到数据仓库,建立多维数 据模型和故障事实表,抽取故障数据,是从数据仓库中抽取历史故障数据,主要是从PMS、 SCADA/EMS、MIS、DBMS、PUMs、GIS等系统中获得;数据转换是更改数据的类型、大小、小数位 数、精度或者字段为空型等,在转换过程中应该对不同的数据源,如:TXT、EXCEL、DOC、DB等 进行相应的转换;源数据中的数据类型由int类型更改为char类型,数据占用空间大小有 8字节变成4字节等;将转换后的数据进行同意、分类加载到数据仓库中,由于关心的主题 不同把数据仓库的数据建立各种数据集市。例如:当关注区域分类相关的信息的时候,可以 建立相关于区域的汇总信息;当关注电压相关信息的时候,就可以常见关于电压的汇总信 息;
[0034] 建立的故障事