基于配电网cps在线数据挖掘的优化控制方法
【技术领域】
[0001] 本发明涉及一种优化控制方法,具体涉及基于配电网CPS在线数据挖掘的优化控 制方法。
【背景技术】
[0002] 信息物理系统(Cyber Physical Systems,CPS)又叫信息物理融合系统,是随着信 息与通信技术的快速发展,在近几年涌现的一个新的研究领域,最早由美国国家基金委员 会(NSF, National Science Foundation)于2006年提出。CPS被认为有望成为继计算机、 互联网之后世界信息技术的第三次浪潮,其核心是计算、通讯、控制的融合,如图2所示。 CPS是一个在环境感知的基础上,深度融合了计算、通信和控制能力的可控、可信、可扩展的 网络化物理设备系统,它通过计算进程和物理进程相互影响的反馈循环实现深度融合和实 时交互来增加或扩展新的功能,以安全、可靠、高效和实时的方式监测或者控制一个物理实 体,它包含了无处不在的环境感知、嵌入式计算、网络通信和网络控制等系统工程,使得物 理系统具有计算、通信、精确控制、远程协作和自治功能。
[0003] 随着智能电网的发展,配电网构成日益复杂,智能配电网在组织结构上包括电网 一次部分(分布式电源、馈线、变压器、负荷)、大量的数据采集设备(传感器、FTU、RTU以及 嵌入式数据采集设备)、先进高速通信网络(电力专用光纤网络、调度数据通信网、公共有 线Internet和无线网络)、控制中心和大量的计算分析资源,是典型的CPS。配电网CPS依 托现实世界丰富的信息监测设备,以及完善可靠的通信网络,实现配电网运行调度与其所 涉及的内部数据、外部数据等信息量的集成融合、相互使用。将配电网作为CPS,更好地描述 了现实配电网,并能对运行调度进行更加精确有效的控制。
[0004] 在智能电网的背景下,配电网CPS提供了海量数据,这些数据已成为电力企业进 行决策的基础。但是,单纯数据的积累并不能给电力企业带来益处,只有运用相关的技术手 段,对海量的数据进行深加工,发现隐含的信息并加以利用,进而指导电力企业做出正确的 决策,这样海量数据的作用才能发挥到极致。
[0005] 计算机技术和通信技术的迅猛发展将人类社会带入到了信息时代。为了进一步提 高数据信息的利用率,基于数据库的知识发现(Knowledge Discovery in Database,简称 KDD)及其核心技术--数据挖掘(Data Mining,简称DM)便应运而生了。KDD是从数据中 发现有用知识的整个过程,数据挖掘是KDD过程中的一个特定步骤。KDD的定义有若干个 版本,现在被普遍采用的定义如下:KDD是指从大量数据中提取有效的、新颖的、潜在有用 的和最终可理解的模式的非平凡过程。狭义上讲,数据挖掘是知识挖掘过程中的一个主要 步骤。但是配电网中的数据挖掘一般表示整个知识挖掘过程,是指从数据中提取隐含在其 中人们事先未知但又潜在有用的信息和知识,并将其最终表示成人们可理解模式的高级过 程。
[0006] 基于配电网CPS每天产生的海量运营数据。如何利用现有的技术和手段,从如此 众多的数据中发掘出潜在的价值,进而更好的控制配电网,提高配电网运行的安全性、可靠 性,是当前亟需解决的问题。
[0007] 实现配电网CPS的最终目标是增强对物理系统的控制能力。目前配电网采用相对 简单而固定的控制模式,控制的灵活性差,且由于难以实现系统范围内的最优控制而不得 不牺牲系统的整体运行效率。
[0008] 针对配电网在运行过程中不断产生和积累大量运行数据,已有不少学者研究运用 数据挖掘技术从中揭示隐藏在其背后的设备运行特点或规律,找出使配电网更加安全可靠 运行的方法,提高运行人员的决策水平。数据挖掘技术具有五大任务:预测(Prediction)、 分类(Classification)、关联规则分析(Association Rules Analysis)、聚类分析 (Cluster)、离群分析(Outlier Analysis)。目前,各类任务都已在电力系统中进行了应用。 但是基于数据挖掘的各类应用都没有把配电网作为CPS来考虑,也未考虑数据的实时性, 数据挖掘结果未能进一步作用于配电网中各种物理实体,未能实现配电网的整体综合化的 最优控制。
【发明内容】
[0009] 为解决上述问题,本发明提出基于配电网CPS在线数据挖掘的优化控制方法,包 括:将配电网CPS提供的海量历史数据和实时数据进行清洗,挖掘其潜在价值,找出数据间 关联关系,通过算例进行分析验证关联规则的有效性,并不断修正关联规则,将配电网CPS 提供的实时数据与挖掘结果进行匹配,输出结果并将其反馈给配电网CPS控制中心,实现 配电网的最优控制。
[0010] 本发明的目的是采用下述技术方案实现的:
[0011] 基于配电网CPS在线数据挖掘的优化控制方法,包括:
[0012] (1)获取配电网CPS的数据源,对数据源进行清洗;
[0013] (2)建立数据源与控制量之间的关联规则模型,并进行数据挖掘;
[0014] (3)将实际配电网络作为算例,验证关联规则是否正确,若正确,转至步骤(4),否 则修正关联规则;
[0015] (4)接收配电网实时数据与关联规则进行匹配,输出匹配结果。
[0016] 优选的,所述步骤(1)中获取配电网CPS的数据源的获取方法包括,在配电网CPS 中嵌入传感器,用于获取配电网CPS中的实时数据和历史数据。
[0017] 优选的,对数据源进行清洗包括,
[0018] 步骤(1-1)采用拉格朗日内插法,将数据源的缺失数据补齐;yn+1为缺失数据,则:
[0020] 其中,X1为数列中的第i个数据,η为数列所包含的数据量;设Xl^x 1, -,Xm和 y。,yi,…,yn为已知量。
[0021] 步骤(1-2)采用统计检测法分别计算数列X。,X1,…,Xn的平均值与标准差,获取数 据源中的疑似异常数据,其表达式为: CN 105184394 A 说明书 3/7 页
[0024] 基于切比雪夫定理,判断当前数据^是否为疑似异常数据;若Χ,>?+βσ:或者 $ 则X1为疑似异常数据;其中,ε为自定义因子。
[0025] 步骤(1-3)对所述疑似异常数据^进行分析,若所述X i由采集设备和/或采集通 道发生故障产生,则X1为错误数据;若为由线路故障产生,则X i为正确数据。
[0026] 进一步地,验证分析结果是否正确包括,将数据^与下一个数据采集周期采集到 的数据X1'进行对比,如果Xl' ·(l-λ) · (l+λ),则Χι为正确数据,否则 错误数据;其中,λ为用户自定义常数,取值为5%。
[0027] 进一步地,验证完成后,对错误数据进行修正;所述数据修正方法与缺失数据补齐 方法相同。
[0028] 优选的,所述步骤(2)建立数据源与控制量之间的关联规则模型包括,定义数据 挖掘对象为数据项集I = U1, i2,…,ij,其包含m个不同数据项;ik为第k个数据项k = 1,2,…,m ;所述I中的元素个数即数据项集长度,长度为k的数据项集为k维数据项集;
[0029] 事件T为数据项集I的一个子集,每个事件均携带一个唯一标识tid与之相连,记 作Tl ;1为tid值;多个不同的事件构成事件数据库D ;
[0030] 设X为数据项集I中项的集合,如果IETI则表示事件T包含X。
[0031] 进一步地,所述关联规则为模型H F的蕴含式,有X C /,Fc / 且;Tn F = 0 包括支持度、置信度和相关度。
[0032] 优选的,通过执行所述步骤(2)的数据挖掘,获取支持度、置信度和相关度,具体 包括:
[0033] 设f G J为数据项集,B为事件集D中包含X的事件数量,A为事件集D中所有事 件的总数,所述数据项集X的支持度为Sup (X),则:
[0035] 定义关联规则R的置信度Conf(R),用于描述规则的可靠程度,??其中, X c /,y d /,且I n r = 0,则:
[0037] 所述相关度用于表征X和Y之间的相关程度,其表达式为:
[0039] 式中,Sup (Y)为事件D中包含Y的事件数量与事件D中所有事件总数之比。
[0040] 优选的,所述步骤(3)的验证方法具体包括,若Sup (X U Y) = Sup (X) Sup (Y),表 示X独立于Y ;若相关度大于1,则X和Y为正相关,反之,若相关度小于1则模式X和Y为 负相关,将该规则删除。
[0041] 优选的,所述步骤(4)输出匹配结果包括:
[0043] 式中,SupnilA最小支持度,Sup _> 0 ;若数据项集满足最小支持度,则为频繁项 集;Confmin为最小置信度,Conf min> 0 ;Rel min为最小相关度,Rel min> 1〇
[0044] 与现有技术相比,本发明达到的有益效果是:
[0045] 本发明提出的方法的配电网CPS将全局控制与局部分散控制有机结合起来,使得 数据挖掘结果传输到配电网CPS的控制中心,配电网CPS可通过各种嵌入式控制系统对物 理设备进行局部控制,控制中心通过在线调整控制系统的参数和在必要时直接控制物理设 备协调优化整个系统,实现了配电网的闭环控制。
[0046] 将配电网CPS提供的海量历史数据和实时数据进行清洗,挖掘其潜在价值,找出 数据间关联关系,通过算例进行分析验证关联规则的有效性,并不断修正关联规则,将配电 网CPS提供的实时数据与挖掘结果进行匹配,输出结果并将其反馈给配电网CPS,实现配电 网的最优控制。
[0047] 充分利用配电网CPS输出的历史数据和实时数据,深度挖掘配电网潜在的、有用 的信息,将准确性高、及时性好、数据有效性良好的挖掘结果反馈给配电网CPS控制中心, 实现配电网的整体综合化的最优控制,必将在电力企业成本降低、配电网安全运行等方面 发挥重大作用。
【附图说明】
[0048] 图1为基于配电网CPS在线数据挖掘的优化控制方法流程图;
[0049] 图2为【背景技术】提供的CPS的核心示意图;
[0050] 图3为基于配电网CPS的闭环控制过程示意图。
【具体实施方式】
[0051] 下面结合附图对本发明的【具体实施方式】做进一步的详细说明。
[0052] 如图1所示,针对配电网健全信息条件下,从健全信息的复杂性、矛盾性、冗余性 等特点,提出基于配电网CPS在线数据挖掘的优化控制方法,其中,配电网是典型的CPS ;
[0053] 具体步骤包括:
[0054] (1)获取配电网CPS的数据源,对数据源进行清洗;对配电网数据来源、信息状况 以及数据格式进行清洗,是本发明的前提与基础。
[0055] 步骤(1)的获取方法包括,在配电网CPS中嵌入传感器,用于获取配电网CPS中的 实时数据和历史数据。配电网CPS中的物理实体均嵌入了传感设备,以实现对