一种基于并行关联规则挖掘的配电网运行可靠性预测方法与流程

文档序号:12271403阅读:313来源:国知局
一种基于并行关联规则挖掘的配电网运行可靠性预测方法与流程

本发明涉及一种配电网运行可靠性预测方法,具体涉及一种基于并行关联规则挖掘的配电网运行可靠性预测方法。



背景技术:

配电网运行可靠性是指涉及设备自身健康状况、外部环境条件、系统运行条件和系统运行行为时,配电网在短期内按可接受的质量标准和所需数量不间断地向用户提供的电力和电量能力的度量,配电网运行可靠性预测就是通过分析计算得到配电系统在给定的时间尺度和运行条件下的可靠性指标。配电网运行可靠性评估可实现对当前系统在未来时段内的可靠性预测。目前,随着数据采集与监控/能量管理系统(SCADA/EMS)的逐渐完善和成熟及大数据处理技术的发展,为以运行可靠性为中心的监测和调度提供了可能性。

配电网运行可靠性预测是根据运行可靠性指标评估需求,从源自各类配电系统的结构各异的各种台账数据、运行数据、气象数据、社会经济数据等海量数据中,抽取与主要评估指标相关的数据,从海量的低价值密度数据中挖掘关联规则,寻找影响运行可靠性的主要因素,再将主要影响因素作为可行性预测的输入,进行预测,获得运行可靠性水平。运行可行性评估除需要大量历史与实时数据外,由于数据量大、结构各异,难以用传统数据处理工具进行处理。



技术实现要素:

为了克服上述现有技术的不足,本发明提供一种基于并行关联规则挖掘的配电网运行可靠性预测方法,本发明采用并行关联规则挖掘从海量数据中快速提取有用信息,精确定位影响可靠性指标的主要因素,减少了评估模型的输入数据维数,简化了建模难度。

为了实现上述发明目的,本发明采取如下技术方案:

一种基于并行关联规则挖掘的配电网运行可靠性预测方法,所述方法包括:

(1)从多源异构配电大数据提取相关数据;

(2)用并行关联规则挖掘方法,挖掘影响配电网可靠性的因素,建立“影响因素——>运行可靠性指标相关性模型”;

(3)根据获取人工神经网络的输入影响因素,和历史运行条件与运行可靠性参数,建立“影响因素——>运行可靠性指标定量计算模型”;

(4)将实时运行条件数据作为人工神经网络模型的输入,预测相应运行条件下的网络可靠性指标值。

优选的,所述步骤(1)包括如下步骤:

步骤1-1、拼接、集成多源异构配电数据,形成包含影响因素、运行可靠性指标值的数据样本集,记为S;

步骤1-2、T表示由多个属性确定的每个样本的一个“事务”,所述属性称为“项”,各影响因素、运行可靠性指标值分别为一个“项”;

步骤1-3、多个项组成的集合称为“项集”,每个子集事务T都是一个项集;

步骤1-4、n个事务组成事务数据库,根据运行可靠性指标,从样本集中抽取可靠性指标不合格的数据样本,组成一个事务数据库,记为事务数据库D。

优选的,所述步骤(1)中,所述相关数据包括网络运行可靠性参数、条件参数以及网络运行条件下的网络运行可靠性指标值;所述网络运行可靠性指标包括状态类指标、程度类指标、层状类指标和时限类指标。

优选的,所述类指标都包括下述子指标:潮流安全概率与裕度指标、电压上下限安全裕度指标、潮流过载概率与期望指标、电压越限概率与期望指标、切负荷概率指标、电力不足期望指标和电量不足期望指标;所述可靠性参数为对元件失效或停运数据进行统计分析得到的固有参数;所述条件参数为与研究的时间尺度和运行条件相关的历史和预测数据的输入数据。

优选的,所述步骤(2)包括如下步骤:

步骤2-1、主进程读取事务数据库D的过程中统计并对比各项集得到第1阶候选集;

步骤2-2、用Hadoop框架下的Map函数将所述事务数据库D划分为部分候选集,并将其并行分发给Reduce函数,通过支持度统计并筛选出全局1阶候选集,得到1阶频繁项集;

步骤2-3、根据是否存在2阶候选集,确定是否生成第2阶候选集,并进行数据归类,建立“影响因素——>运行可靠性指标相关性模型”。

优选的,所述步骤2-3中,所述数据归类包括如下步骤:

步骤2-3-1、将相同的1阶频繁项集的数据作为一类,发送到同一个MapReduce中;

步骤2-3-2、生成全局2阶候选集,进而生成2阶频繁项集,以此类推,直到产生N阶频繁项集,且不存在N+1阶候选集;

步骤2-3-3、输出N个频繁项集,获得N个影响因素。

优选的,所述步骤(3)包括如下步骤:

步骤3-1、根据“影响因素——>运行可靠性指标相关性模型”,将数据样本集S中的样本提取影响因素项集,形成新的数据样本;

步骤3-2、将所述新的数据样本做为人工神经网络模型的输入,将相应的运行可靠性指标参数项集作为输出,进行训练;

步骤3-3、建立“影响因素——>运行可靠性指标定量计算模型”,同时及时根据最新的管理、经济动态和新到来的信息数据,对模型进行检验与更新。

与最接近的现有技术比,本发明提供的技术方案具有以下优异效果:

本发明提供的技术方案采用人工神经网络预测法,有效利用历史数据与实时数据对网络运行的可靠性进行准确预测,大大减少了建模难度,采用并行关联规则挖掘从海量数据中快速提取有用信息,可以对影响网络运行可靠性指标的主要因素进行精确定位,减少了评估模型的输入数据维数,简化了建模难度,实现了网络运行可靠性的快速精确评估。

附图说明

图1是本发明提供的配电网运行可靠性预测模型图

图2是本发明提供的一种基于并行关联规则挖掘的配电网运行可靠性预测方法的流程图

图3是本发明提供的并行关联规则挖掘方法流程图

具体实施方式

下面结合附图对本发明作进一步详细说明。

本发明所提的配电网运行可靠性预测是基于RTU/SCADA/EMS系统提供的大量实时运行数据,考虑设备自身健康状况、外部环境条件、系统运行条件和系统运行行为的变化对系统可靠性的影响,研究系统在当前状态下的短期可靠性,实时地给出系统的运行可靠性指标,基于评估结果,定量分析影响系统可靠性的关键因素,快速寻找系统薄弱元件和薄弱环节,保障配电网经济可靠运行。本发明所提的预测方法是是根据运行可靠性指标评估需求,从来源于各类配电系统的结构各异的各种台账数据、运行数据、气象数据、社会经济数据等海量数据中,抽取与主要评估指标相关的数据,从海量的低价值密度数据中挖掘关联规则,寻找影响运行可靠性的主要因素,再将主要影响因素作为可行性预测的输入,进行预测,获得运行可靠性水平。运行可行性评估除需要大量历史与实时数据外,由于数据量大、结构各异,难以用传统数据处理工具进行处理,因而,需要采用并行关联规则挖掘与人工神经网络预测等大数据技术。基于并行关联规则挖掘与人工神经网络预测的配电网运行可靠性预测模型及流程图分别如附图1、附图2所示,具体步骤如下:

步骤1、根据运行可靠性评估需求,从多源异构配电大数据中提取相关数据;

所述多源异构配电大数据是多来源不同类型的配电数据,配电网数据源包括信息采集系统、生产管理系统、配电自动化系统、营销系统等,类型包括结构化数据、半结构化数据和非结构化数据。

配电网运行可靠性不仅要能反映系统的负荷损失情况,还要求能反映系统的安全裕度,以及线路潮流过载、节点电压超限等运行约束违限的情况,能够直观全面地描述系统整体可靠性,能够反映重要负荷节点和关键元件的可靠性,能够反映系统短期与长期的可靠性。相应的,运行可靠性指标包括状态类指标、程度类指标、层状类指标和时限类指标等四大类指标,各大类指标又分为若干子指标,包括:潮流安全概率与裕度、电压上下限安全裕度、潮流过载概率与期望、电压越限概率与期望、切负荷概率、电力不足期望、电量不足期望。配电系统的运行可靠性指标主要从现场长期运行记录的大量统计数据中得出,运行可靠性模型需要可靠性参数和条件参数,前者是固有参数,是对元件失效或停运数据进行统计分析得到的结果,后者是输入数据,是与研究的时间尺度和运行条件相关的历史和预测数据,这些数据主要来源于配电系统调度、运检、营销、监控等业务信息,如系统运行时出现的各类信号、各类设备的状态信息等,以及大量的经济社会类相关数据,如地理信息、天气、现场环境与图像等。配电网运行可靠性数据源包括配电自动化系统、调度自动化系统、电能质量监测管理系统、生产管理系统、地理信息系统、用电信息采集系统、配变负荷监测系统、负荷控制系统、营销业务管理系统、EPR系统、95598客服系统。

这些数据中,与运行可靠性相关的数据包括设备运行可靠性参数和条件参数,以及运行条件下的运行可靠性指标值。将这些多源异构配电数据进行拼接、集成,形成包含影响因素、运行可靠性指标值的数据样本集,记为S,每个样本记为一个“事务”,用T表示,每个事务由多个属性来确定,这里的属性称为“项”,各影响因素、运行可靠性指标值分别为一个“项”;多个项组成的集合称为“项集”,每个子集事务T都是一个项集;n个事务组成事务数据库,根据运行可靠性指标,从样本集中抽取可靠性指标不合格的数据样本,组成一个事务数据库,记为事务数据库D。

步骤2、采用并行关联规则挖掘方法,挖掘影响运行可靠性的相关因素,建立“影响因素——>运行可靠性指标相关性模型”;

关联规则技术在数据处理方面具有强大的处理力,采用关联规则挖掘方法,根据运行可靠性的主要评估指标,研究各个指标与各种设备参数、电气条件、运行状态、环境因素等影响因素之间的相关关系,可以从海量数据中寻找到影响运行可靠性各指标相应的主要因素。运行可靠性影响因素挖掘问题中所涉及到的数据集的规模大并具有多维的特性,巨大的数据量使得关联规则挖掘必须在多处理机上采用并行的方式处理。

关联规则中,某子集事务T中项集A出现的频率是包含项集的事务数,记为,也是A的支持度,大于设定的最小阀值时,A称为频繁项集。若项集,,且,则称为关联规则,事务数据库D中包含的概率为关联规则的支持度s,记为,支持度与置信度分别反映此关联规则的有效性和确定性,其中支持度表征关联规则在事务数据库中的重要程度或出现的概率,支持度越高,关联程度越高。关联规则的置信度c是包含的事务数与包含A的事务数的比值,它是概率,记做,置信度表征关联规则的可信程度,置信度越高,可信度越高。

在进行关联规则挖掘之前,预先定义最小支持度阀值和最小置信度阀值,支持度大于等于最小阀值、置信度大于等于最小阀值的规则,这些规则称为“强规则”,寻找运行可靠性指标主要影响因素的方法就是从事务数据库D中挖掘“强规则”。关联规则挖掘的基本过程分2个阶段:①寻找事务数据库中的所有频繁项集;②由频繁项集产生强关联规则。

Apriori算法是一种常用的挖掘关联规则的频繁项集的方法。由于传统的挖掘平台自身在计算处理能力上具有局限性,传统的数据挖掘模型不适用于多维度多噪声的海量数据,需要采用并行挖掘模式,本发明在Hadoop框架上,将Apriori算法下MapReduce中分布实现,实现配电大数据条件下的并行关联规则挖掘,其过程如附图3所示,具体步骤为:

①主进程在对数据集D的读取过程中对各项集进行统计对比,产生第1阶候选集;

②利用Hadoop框架下的Map函数将D分为若干个部分候选集,再将其并行分发给Reduce函数,通过支持度进行统计并筛选出全局1阶候选集,之后再产生1阶频繁项集;

③判断是否存在2阶候选集,若存在,生成第2阶候选集,在生成第2阶候选集后,可对数据进行一次归类:将相同的1阶频繁项集的数据作为一类,发送到同一个MapReduce中,生成全局2阶候选集,进而生成2阶频繁项集,以此类推,直到产生N阶频繁项集,且不存在N+1阶候选集,输出N个频繁项集,获得N个主要影响因素,建立“影响因素——>运行可靠性指标相关性模型”。

步骤3、获得主要影响因素,作为人工神经网络的输入,再基于历史运行条件与运行可靠性参数,建立“影响因素——>运行可靠性指标定量计算模型”;

根据“影响因素——>运行可靠性指标相关性模型”,将数据样本集S中的样本提取主要影响因素项集,形成新的数据样本,作为人工神经网络模型的输入,将相应的运行可靠性指标参数项集作为输出,进行训练,建立“影响因素——>运行可靠性指标定量计算人工神经网络模型”,同时及时根据最新的管理、经济动态和新到来的信息数据,对模型进行检验与更新以提高预测的准确性。

步骤4、将实时运行条件数据作为人工神经网络模型的输入,预测相应运行条件下的运行可靠性指标值。

最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明申请待批的权利要求范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1