一种输电网故障信息与线路越限信息的相关度分析法
【专利摘要】本发明公开了一种输电网故障信息与线路越限信息的相关度分析法,其实施步骤如下:从历史故障数据库中筛选事件;按照厂站进行抽样建立样本训练集;使用关联规则算法对样本训练集中的每一个厂站样本集进行训练,得到规律蕴含式;分别基于相同故障类型、相同发生时间、相同厂站所在地区对所有厂站样本集的规律蕴含式进行分类分别得到规律蕴含式集,找出每一种规律蕴含式集的共性规律作为该规律蕴含式集的规则。本发明能够有效利用历史故障数据库的信息完成数据挖掘得到知识、深层次地理解并有效的使用这些数据、挖掘出线路故障与设备潮流越限的相关度规律、可为相关技术人员提供决策支持、可用于实时在线监测下设备潮流越限预警。
【专利说明】一种输电网故障信息与线路越限信息的相关度分析法
【技术领域】
[0001]本发明涉及电网历史数据库数据挖掘技术,具体涉及一种输电网故障信息与线路越限信息的相关度分析法。
【背景技术】
[0002]随着计算机和通信技术的不断发展,数字式保护和故障录波器等智能电子装置在电网中的应用已越来越普遍。在电网发生故障或受到扰动时,装置都会把这些信息记录到数据中,目前,电网的故障信息系统在长期的运行过程中积累了海量的历史数据,这些数据蕴含着丰富的知识,若不能充分利用这些知识,会造成不可避免的“数据灾难”和“资源荒废”。电网发生的事故,在数据上往往呈现出某种特征,尤其反映在人们往往不关心的数据维度中,而在另一方面,从这些特征反问实际工程,也会对应一些典型的事故例证。能否从这些数据中挖掘出知识,能否深层次地理解并有效的使用这些数据,已经成为数据挖掘技术在电网历史数据中的关键技术。
【发明内容】
[0003]本发明要解决的技术问题是提供一种能够有效利用历史故障数据库的信息完成数据挖掘得到知识、深层次地理解并有效的使用这些数据、挖掘出线路故障与设备潮流越限的相关度规律、可为相关技术人员提供决策支持、可用于实时在线监测下设备潮流越限预警的输电网故障信息与线路越限信息的相关度分析法。
[0004]为了解决上述技术问题,本发明采用的技术方案为:
[0005]一种输电网故障信 息与线路越限信息的相关度分析法,其实施步骤如下:
[0006]I)从历史故障数据库中筛选出各个厂站包含线路故障信息与设备潮流越限信息的事件,且每一个事件的信息包含该事件的发生时间;
[0007]2)在筛选得到的事件集中按照厂站进行抽样建立样本训练集,所述样本训练集包含与厂站一一对应的多个元素,每一个元素为对应一个厂站的厂站样本集;
[0008]3)使用Apriori关联规则算法对所述样本训练集中的每一个厂站样本集进行训练,得到如式(I)所示的K阶频繁项目集,并转换得到如式(2)所示的规律蕴含式;
[0009]Ix1, Y1,12, y3---yk}⑴
[0010](JpJ25J3-1, ?⑵
[0011]式(I)和式(2)中,X1表示某一条线路故障,Y1, y2, y^..yk表示该条线路故障后发生潮流越限的装置;
[0012]4)分别基于相同故障类型、相同发生时间、相同厂站所在地区对所有厂站样本集的规律蕴含式进行分类,分别得到针对不同故障类型、不同发生时间、不同厂站所在地区的规律蕴含式集,找出每一个故障类型对应规律蕴含式集的共性规律作为该故障类型的规贝U,找出每一个发生时间对应规律蕴含式集的共性规律作为线路故障的发生时间规则,找出每一个厂站所在地区对应规律蕴含式集的共性规律作为线路故障的厂站所在地区规则。[0013]作为本发明输电网故障信息与线路越限信息的相关度分析法的进一步改进:
[0014]所述步骤4)的详细步骤如下:
[0015]4.1)分别基于相同故障类型、相同发生时间、相同厂站所在地区对所有厂站样本集的规律蕴含式进行分类,分别得到针对不同故障类型、不同发生时间、不同厂站所在地区的规律蕴含式集;
[0016]4.2)找出每一个故障类型对应规律蕴含式集中线路故障后发生潮流越限的装置,分析上述线路故障后发生潮流越限的装置拓扑关系,将线路故障后发生潮流越限的装置在拓扑关系中的相同位置作为该故障类型的规则;
[0017]4.3)找出每一个发生时间对应规律蕴含式集中装置最容易发生潮流越限的时间段,将所述最容易发生潮流越限的时间段作为线路故障的发生时间规则;
[0018]4.4)找出每一个厂站所在地区对应规律蕴含式集中装置最容易发生潮流越限的地区,将所述最容易发生潮流越限的地区作为线路故障的厂站所在地区规则。
[0019]本发明具有下述优点:本发明针对电力系统中一旦发生故障,电网的保护装置会立即将故障线路切除,而线路的切除会造成潮流转移,可能导致某些装置的潮流大于最大允许值而发生潮流越限现象的特点,利用历史故障数据库,通过运用数据挖掘工具,在历史数据库中挖掘出线路故障与设备潮流越限的相关度规律,将其总结为规则,一方面可为相关技术人员提供决策支持,例如在某条线路断线情况下经常性发生潮流越限的装置可考虑调整其越限阀值,另一方面也可用于实时在线监测下设备潮流越限预警,例如在实时监测到某条线路发生故障后利用规则发出相应设备的潮流越限预警,能够有效利用历史故障数据库的信息完成数据挖掘得到知识、深层次地理解并有效的使用这些数据、挖掘出线路故障与设备潮流越限的相关度规律、可为相关技术人员提供决策支持、可用于实时在线监测下设备潮流越限预警。
【专利附图】
【附图说明】
[0020]图1为本发明实施例的基本流程示意图。
[0021]图2为本发明实施例应用的Apriori关联规则算法的基本流程示意图。
【具体实施方式】
[0022]如图1所示,本实施例输电网故障信息与线路越限信息的相关度分析法的实施步骤如下:
[0023]I)形成事件集:从历史故障数据库中筛选出各个厂站包含线路故障信息与设备潮流越限信息的事件,且每一个事件的信息包含该事件的发生时间。
[0024]历史故障数据库中的报警信息繁多,本实施例只关注线路故障信息与设备潮流越限信息,所以第一步就要消除其它的数据,留下我们所关注的线路故障信息与设备潮流越限信息,对于单次故障所产生的这些数据我们用\表示,i为事件的编号,由所有\组成的集合称为事件集,本实施例用字母T来表示,即存在T= Itptht3……tj的关系。本实施例中,所有线路故障信息与设备潮流越限信息在历史故障数据库中都是文字表述形式,为了便于数据挖掘,要将这些文字表述转化为字母。在本发明中分别用X表示线路故障信息,用Y表示设备潮流越限信息,那么用Xi表示具体的线路故障信息,即有X=Ix1, X2, X3……XnI,用Ji表示具体的潮流越限信息,即有Y= {yi,I2, y3...yn}。例如表示事件I,其中包含故障类型X1与潮流越限信息yu y2, y3> Yi, y2.可以是某三台出现潮流越限的设备,即存在关系Yi, Y2, 5^3}。
[0025]2)建立样本训练集:在筛选得到的事件集中按照厂站进行抽样建立样本训练集,所述样本训练集包含与厂站一一对应的多个元素,每一个元素为对应一个厂站的厂站样本集。
[0026]样本训练集是在所有的事件集中进行抽样而得出的一个集合,该集合用于Apriori关联规则算法,用字母D来表示。样本训练集D是按照一定原则对事件集T抽样形成,所以其组成元素也是由单次事件t组成。为了保证本实施例得出结果的代表性与说服力,本实施例抽样建立样本训练集时,针对电力系统故障的特点采用的抽样原则简单可归纳为四点,如下:(1)抽样要满足尽可能多的包含各类故障类型的事件,要避免样本训练集中故障类型过于单一;(2)抽样要满足尽可能多的包含不同地区的事件,要避免样本训练集中故障发生的区域过于集中;(3)抽样要满足尽可能多的包含不同时间发生的事件,要避免样本训练集中故障发生的时间过于集中;(4)在满足(1)、(2)、(3)原则的基础上,样本的数量要尽可能的多。
[0027]本实施例在获得足够多的样本集之后,还要将单次事件t按照厂站进行分类,形成厂站样本集d,例如A厂站的所有事件存放在集合Cl1中,B厂站的所有事件存放在集合d2中,依次其他变电站的事件相继存放在d3,d4, d5…中,即存在/ 2 W 2 O的关系。
[0028]3)关联规则:使用Apriori关联规则算法对所述样本训练集中的每一个厂站样本集d进行训练,得到如式(I)所示的K阶频繁项目集,并转换得到如式(2)所示的规律蕴含式;
[0031 ] 式(I)和式(2 )中,X1表示某一条线路故障,Y1, Y2, yk表示该条线路故障后发生潮流越限的装置。
[0032]本实施例利用分析相关度的数据挖掘工具的Apriori关联规则算法对所述样本训练集中的每一个厂站样本集d进行训练,从而分析线路故障信息与设备潮流越限信息间的相关度规律。如图2所示,Apriori关联规则算法的基本算法流程如下:
[0033]3.1)扫描厂站样本集d,对厂站样本集d的每一项进行计数,得到一阶候选项目集;
[0034]3.2)扫描一阶候选项集,通过Aprior1-Gen计算出一阶项目的支持度,去除不满足支持度的一阶候选项,得到二阶候选项目集。
[0035]3.3)扫描二阶候选项目集,再通过Aprior1-Gen计算出每个二阶项目的支持度,去除不满足支持度的二阶候选项目,如此循环直到K阶项目集(所有K+1阶项目不满足支持度或不存在)。
[0036]本实施例用F(S%)表示关联规则,其中S%为满足条件的事件t在样本训练集D中所占比例,即支持度(Support),支持度的计算公式如式(3)所示。
[0037]=K) =I/W I(3)[0038]式(3)中,X表示单次事件中的线路故障信息,用Y表示单次事件中的设备潮流越限信息,那么用Xi表示具体的线路故障信息,即有X= Ix1, X2, X3.....Xj,用Ji表示具体的潮流越限信息,即有Y=Iy1, y2, y3-..yj,d表示厂站样本集,t表示事件。
[0039]4)形成规则:分别基于相同故障类型、相同发生时间、相同厂站所在地区对所有厂站样本集的规律蕴含式进行分类,分别得到针对不同故障类型、不同发生时间、不同厂站所在地区的规律蕴含式集,找出每一个故障类型对应规律蕴含式集的共性规律作为该故障类型的规则,找出每一个发生时间对应规律蕴含式集的共性规律作为线路故障的发生时间规贝U,找出每一个厂站所在地区对应规律蕴含式集的共性规律作为线路故障的厂站所在地区规则。
[0040]由于步骤3)是通过计算机使用Apriori关联规则算法得出来的,需要进一步人为的进行提炼、加工,分析其中更多潜在的规律。例如不同时间段发生的线路故障,引发的潮流越限装置有些什么样的共性特征,发生相同类型的线路故障,引发的潮流越限装置又会有些什么样的共性特征等,将这些特征分析清楚后,最终升华为规则,供工作人员做决策支持借鉴。本实施例中,所述步骤4)的详细步骤如下:
[0041]4.1)分别基于相同故障类型、相同发生时间、相同厂站所在地区对所有厂站样本集的规律蕴含式进行分类,分别得到针对不同故障类型、不同发生时间、不同厂站所在地区的规律蕴含式集;
[0042]4.2)找出每一个故障类型对应规律蕴含式集中线路故障后发生潮流越限的装置,分析上述线路故障后发生潮流越限的装置拓扑关系,将线路故障后发生潮流越限的装置在拓扑关系中的相同位置作为该故障类型的规则;
[0043]4.3)找出每一个发生时间对应规律蕴含式集中装置最容易发生潮流越限的时间段,将所述最容易发生潮流越限的时间段作为线路故障的发生时间规则;
[0044]4.4)找出每一个厂站所在地区对应规律蕴含式集中装置最容易发生潮流越限的地区,将所述最容易发生潮流越限的地区作为线路故障的厂站所在地区规则。
[0045]由于在历史数据库中报警信息繁多,首先要对其进行去噪,在单次事故所产生的报警数据中,将我们所关心的线路故障数据与设备潮流越限数据搜索出来,将其它信息去除,形成单次事件,由单次事件组成的集合称为事件集,然后在事件集中按一定的原则抽样,形成样本训练集,再运用数据挖掘工具中的关联规则算法对样本训练集进行处理,得出初步规则,最后对初步规则分故障类型、时间、地区来观察寻找出故障信息与越限信息中的相关度规律,得出最终规则。本实施例分成四个步骤:形成事件集、建立样本训练集、关联规则和形成规则。形成事件集时,提取出历史事故数据库中单次事故照成的线路故障信息和设备潮流越限报警信息,去掉其它报警信息,所有这些单次事件集合起来形成事件集。建立样本集时,在事件集中按一定原则抽样,形成用于关联规则的样本集。关联规则时,运用关联规则Apriori算法,找出装置的越限信息与故障间的相关度规律。(4)形成规则时,分故障类型、时间、地区来观察关联规则得出的初步规则,归纳总结,形成最终规则。本实施例能够有效利用历史故障数据库的信息完成数据挖掘得到知识,在蕴含繁杂信息的电力系统监控系统产生历史故障数据的数据库中,挖掘出线路故障与设备潮流越限之间的相关度规律,再通过人工提炼最终升华为规则,这些规则可为相关技术人员提供决策支持,也可用于设备的潮流越限预警,实现了具体的故障越限信息与具体的故障信息的相关度分析,通过分析该结果可以得出该数据在信息层面蕴含的规律,该规律来源于信息层面,背后蕴含的价值可能比运用电力系统机理分析出来的规律更具有借鉴意义。
[0046]以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本【技术领域】的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
【权利要求】
1.一种输电网故障信息与线路越限信息的相关度分析法,其特征在于实施步骤如下: 1)从历史故障数据库中筛选出各个厂站包含线路故障信息与设备潮流越限信息的事件,且每一个事件的信息包含该事件的发生时间; 2)在筛选得到的事件集中按照厂站进行抽样建立样本训练集,所述样本训练集包含与厂站一一对应的多个元素,每一个元素为对应一个厂站的厂站样本集; 3)使用Apriori关联规则算法对所述样本训练集中的每一个厂站样本集进行训练,得到如式(I)所示的K阶频繁项目集,并转换得到如式(2)所示的规律蕴含式; 式(I)和式(2)中,X1表示某一条线路故障,Y1, y2, y^yk表示该条线路故障后发生潮流越限的装置; 4)分别基于相同故障类型、相同发生时间、相同厂站所在地区对所有厂站样本集的规律蕴含式进行分类,分别得到针对不同故障类型、不同发生时间、不同厂站所在地区的规律蕴含式集,找出每一个故障类型对应规律蕴含式集的共性规律作为该故障类型的规则,找出每一个发生时间对应规律蕴含式集的共性规律作为线路故障的发生时间规则,找出每一个厂站所在地区对应规律蕴含式集的共性规律作为线路故障的厂站所在地区规则。
2.根据权利要求1所述的输电网故障信息与线路越限信息的相关度分析法,其特征在于,所述步骤4)的详细步骤如下: `4.1)分别基于相同故障类型、相同发生时间、相同厂站所在地区对所有厂站样本集的规律蕴含式进行分类,分别得到针对不同故障类型、不同发生时间、不同厂站所在地区的规律蕴含式集; `4.2)找出每一个故障类型对应规律蕴含式集中线路故障后发生潮流越限的装置,分析上述线路故障后发生潮流越限的装置拓扑关系,将线路故障后发生潮流越限的装置在拓扑关系中的相同位置作为该故障类型的规则; ` 4.3)找出每一个发生时间对应规律蕴含式集中装置最容易发生潮流越限的时间段,将所述最容易发生潮流越限的时间段作为线路故障的发生时间规则; `4.4)找出每一个厂站所在地区对应规律蕴含式集中装置最容易发生潮流越限的地区,将所述最容易发生潮流越限的地区作为线路故障的厂站所在地区规则。
【文档编号】G06F17/30GK103489138SQ201310490456
【公开日】2014年1月1日 申请日期:2013年10月16日 优先权日:2013年10月16日
【发明者】梁勇超, 马瑞 申请人:国家电网公司, 国网湖南省电力公司检修公司