本发明涉及配电网故障信息分析技术领域,具体涉及一种配电网故障影响因素的挖掘方法。
背景技术:
配电网是电力系统中的最后一个环节,直接面向客户,在整个电力系统中有着举足轻重的作用。但是由于配电网结构的复杂性,配电运行管理中会产生大量的业务数据,极大的增加了配电网故障分析的难度,依赖人工统计分析的手段已经无法满足运行管理的需求。
基于配电网的大数据挖掘作为一种新兴的分析技术,能够挖掘配电网中的历史运行数据中所包含的有价值的信息。通过挖掘配电网中的故障信息,如故障发生时间、故障发生地点、故障设备类型、故障原因、负载情况、天气情况、节假日、故障修复时间等的信息,找出一定时期内与配电网故障强相关联的信息。通过故障信息的相关性分析,确定某一时间内配网运行管理的重点,如针对性的对抢修、重过载等进行综合整治。而目前还未有系统的从配电网故障信息挖掘故障的方法。
技术实现要素:
为了解决上述问题,本发明提供了一种配电网故障影响因素的挖掘方法,具体技术方案如下:
一种配电网故障影响因素的挖掘方法包括以下步骤:
(1)提取配电网故障信息数据,并对配电网故障信息数据按配电网设备故障类型进行校验和清洗,过滤掉不符合校验规则的数据,数据清洗完成后进行数据的整合;
(2)对故障信息数据进行整合后,采用条件概率作为评价指标,分别计算每种配电网设备故障类型在各个故障影响因素下发生的条件概率;
(3)将上述计算得到的条件概率以降序的形式排序,取出排名在前a%的数据作为强相关事件。
优选地,所述步骤(2)分别计算配电网故障与造成配电网故障的因素的条件概率具体包括以下步骤:
(1)按照影响故障因素对故障信息数据进行分组,计算配电网故障在该故障影响因素下发生的概率;所述配电网故障包括所有配电网设备故障类型;
(2)按照故障影响因素和配电网设备故障类型对故障信息数据进行分组,计算每种配电网设备故障在该故障影响因素下发生的概率;
(3)计算每种配电网设备故障类型在各个故障影响因素下发生的条件概率,计算方式如下:
其中,bj表示对该故障影响因素进行分组的事件;p(bj)表示在故障影响因素bj下配电网故障发生的概率;
ai表示对配电网设备故障类型进行分组的事件;p(aibj)表示电网设备故障类型ai在故障影响因素bj下发生的概率;
p(ai|bj)表示配电网设备故障类型ai在故障影响因素bj下发生的条件概率。
优选地,所述故障影响因素包括天气因素、节假日因素、负载因素。
有益效果为:本发明中的挖掘算法基于配电网运行数据、计量数据、调度数据的基础上,使用相条件概率作为指标,找出与配电网故障强相关联的故障影响因素数据,为配电网管理提供决策依据,并让运维部门对发生概率高的故障事件进行针对性整治。
附图说明
图1为本发明的实施例中天气因素未清洗、整合的数据示意图;
图2为本发明的实施例天气因素中清洗、整合后的数据示意图;
图3为本发明的实施例中对天气因素进行分组的示意图;
图4为本发明的实施例中以天气因素和配电网设备故障类型进行分组的示意图;
图5为本发明中以节假日因素和配电网设备故障类型进行分组的示意图;
图6为本发明中以负载因素和配电网设备故障类型进行分组的示意图;
图7为本发明的实施例中计算天气因素对配电网设备故障的相关性的流程示意图。
具体实施方式
为了更好的理解本发明,下面结合附图和具体实施例对本发明作进一步说明:
一种配电网故障影响因素的挖掘方法包括以下步骤:
(1)提取配电网故障信息数据,并对配电网故障信息数据按配电网设备故障类型进行校验和清洗,过滤掉不符合校验规则的数据,数据清洗完成后进行数据的整合。
数据提取是使用jdbc的连接方式从数据中心取出故障单数据、负载率数据、缺陷单数据。由于系统中的数据很多项别都支持主观的填报,所以数据质量不高,同一种情况可能有多种描述,甚至有填报错误导致数据无法使用的。这里使用模糊匹配的方法对数据进行转换,对一些有错误的数据采取剔除的手段。其中,模糊匹配的手段主要使用了正则表达式,对于数据中现有的情况进行枚举归纳,实现数据清洗。图1为提取出来的原始数据示意图,图中weather字段通过查询维表可以得到id号所对应的天气的中文翻译,device_name则通过模糊匹配的手段,得到归纳后的设备名称,如图2所示。
数据整合的对象是指一些原本在数据库没有主外键关系的表,整合数据需要把数据整合到同一张表里,整合的方式是使用时间、站点、线路共同的关系约束来实现。
(2)对故障信息数据进行整合后,采用条件概率作为评价指标,分别计算每种配电网设备故障类型在各个故障影响因素下发生的条件概率。故障影响因素包括天气因素、节假日因素、负载因素。按照天气因素对配电网故障进行分组的情况如图3所示。天气因素分为晴朗和雷雨,以天气因素和配电网设备故障类型进行分组的情况如图4所示,
以节假日因素和配电网设备故障类型进行分组的情况如图5所示,其中,holiday一列中,true表示为节假日,false表示为非节假日,falut1一列中,true表示发生故障。以负载因素和配电网设备故障类型进行分组的情况如图6所示,负载情况分为重载、过载、轻载三种情况。本实施例以天气因素为例,如图7所示,具体步骤如下:
1)按照天气对故障信息数据进行分组,如图4所示。事件b1为晴朗,事件b2为雷雨,计算配电网故障在该故障影响因素下发生的概率;配电网故障包括所有配电网设备故障类型;由此可得到:
晴朗天气下配电网故障发生的概率为:p(b1)=5/11;
雷雨天气下配电网故障发生的概率为:p(b2)=6/11。
2)按照天气和配电网设备故障类型对故障信息数据进行分组,如图4所示,计算每种配电网设备故障在该故障影响因素下发生的概率;从图2或图3可知,配电网设备故障类型包括变压器故障、令克故障、架空线故障,分组后可知,事件a1为变压器故障,事件a2为令克故障,事件a3为架空线故障,则:
在晴朗的天气b1下变压器故障a1发生的概率为:p(a1b1)=2/11;
在晴朗的天气b1下令克故障a2发生的概率为:p(a2b1)=1/11;
在晴朗的天气b1下架空线故障a3发生的概率为:p(a3b1)=2/11;
在雷雨的天气b2下变压器故障a1发生的概率为:p(a1b2)=1/11;
在雷雨的天气b2下令克故障a2发生的概率为:p(a2b2)=1/11;
在雷雨的天气b2下架空线故障a3发生的概率为:p(a3b2)=4/11。
3)计算每种配电网设备故障类型在各个故障影响因素下发生的条件概率,计算方式如下:
其中,bj表示对该故障影响因素进行分组的事件;p(bj)表示在故障影响因素bj下配电网故障发生的概率;
ai表示对配电网设备故障类型进行分组的事件;p(aibj)表示电网设备故障类型ai在故障影响因素bj下发生的概率;
p(ai|bj)表示配电网设备故障类型ai在故障影响因素bj下发生的条件概率。
则在晴朗的天气b1下变压器故障a1发生的条件概率为:
在晴朗的天气b1下架空线故障a3发生的条件概率为:
在雷雨的天气b2下变压器故障a1发生的条件概率为:
在雷雨的天气b2下令克故障a2发生的条件概率为:
在雷雨的天气b2下架空线故障a3发生的条件概率为:
(3)将上述计算得到的条件概率以降序的形式排序,取出排名在前a%的数据作为强相关事件,并对该配电网设备故障进行针对性整治,a的数值由人工设定,在本实施例中,a%=40%,则由上可知,在雷雨的天气b2下架空线故障a3发生的条件概率和在晴朗的天气b1下架空线故障a3发生的条件概率在40%的数据范围内,由此可知,架空线故障发生的概率比较高,应该重点关注,并针对性进行整治。
本发明不局限于以上所述的具体实施方式,以上所述仅为本发明的较佳实施案例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。