1.本发明涉及数据分析管理,具体涉及一种电网数据分析管理系统。
背景技术:2.实现信息驱动的大电网智能调控对电网安全稳定运行具有重要实际意义,当前世界各国能源安全问题突出、环境污染问题严峻,大力发展风电、光电等新能源,实现能源生产向可再生能源转型,是全球能源与经济实现可持续发展的重大需求。由于可再生能源的不断并网和运行,大量电力电子设备及其控制装置接入电力系统,使电力系统向高比例可再生能源和高比例电子化趋势发展。新型电力系统将呈现多时间尺度的相互作用、非线性程度强、结构更加复杂、状态变量阶数更高等特点,这些特点给新一代电力系统的稳定性分析和调控带来严峻挑战。
3.随着智能电网的发展,传统电网所提供的电能质量已经无法满足用户需要,从统计的电网故障看,约80%的电网故障来源于配电网,并且随着新能源节点的接入,主动配电网中电压波动等多方面因素均会提升故障风险。不同于传统电网的数据管理与状态分析,智能电网需要采集大量关联数据,并且需要对关联数据进行实时数据查询与分析,传统的数据存储方式和数据分析方法已经无法适用智能电网的大数据分析中。
技术实现要素:4.(一)解决的技术问题
5.针对现有技术所存在的上述缺点,本发明提供了一种电网数据分析管理系统,能够有效克服现有技术所存在的不能对电网数据进行有效完善、无法准确分析电网运行状态的缺陷。
6.(二)技术方案
7.为实现以上目的,本发明通过以下技术方案予以实现:
8.一种电网数据分析管理系统,包括服务器,所述服务器通过数据挖掘模块基于数据挖掘模型对电网数据进行定向挖掘,所述服务器通过数据标记模块基于信源编码对不同类型的电网数据设定不同的类型标签,所述服务器利用数据处理模块对不同类型的电网数据进行数据修正,所述服务器利用数据分配模块基于类型标签将修正后的电网数据分配至对应数据传输通道,存储至数据存储模块内不同的数据存储节点;
9.所述服务器通过数据建模模块利用随机矩阵对电网同步数据进行建模,所述服务器通过历史数据分析模块对记录存储的历史电网同步数据进行分析处理,所述服务器通过分布界限图构建模块基于分析处理结果构建关于历史电网同步数据特征值的分布界限图,所述服务器通过特征分布图构建模块构建关于实时电网同步数据特征值的特征分布图,所述服务器通过对比分析模块对特征分布图、分布界限图进行比较分析,并基于分析结果判断当前电网运行状态。
10.优选地,所述数据处理模块筛查各类型电网数据中的缺漏数据,并基于k近邻算法
结合缺漏数据附近k个电网数据计算得到该缺漏数据对应的替换数据。
11.优选地,所述数据处理模块选取最接近缺漏数据的n个标志数据,并分别以标志数据为起点进行从近到远的遍历,记录每次遍历数据中的最小值a1和平均值a2,对每个缺漏数据使用2次k近邻算法,k分别取a1、a2,并根据计算结果判断是否进行估算进程。
12.优选地,所述数据处理模块对缺漏数据使用2次k近邻算法后,得到的结果一致,则该结果为替换数据;否则进行估算进程。
13.优选地,所述数据处理模块进行估算进程,包括:
14.通过a2=a2‑
x对平均值a2进行赋值运算,再将k分别取a1、a2使用2次k近邻算法,如果得到的结果一致,则该结果为替换数据;
15.如果得到的结果不一致,通过a1=a1+y对最小值a1进行赋值运算,再将k分别取a1、a2使用2次k近邻算法,如果得到的结果一致,则该结果为替换数据;
16.如果得到的结果仍然不一致,则重复上述过程直至得到相同结果;
17.其中,x=(a2‑
a1)/n,y=x
‑
1,且x、y均为不小于0的整数。
18.优选地,所述数据分配模块采用sparkr的并行化k
‑
means算法,根据类型标签实现电网数据的分类,并基于分类结果为电网数据匹配对应的数据传输通道。
19.优选地,还包括数据关联模块、权限分配模块和数据调用模块,所述服务器通过数据分配模块为电网数据在数据存储节点内寻找合适位置,并对该电网数据进行数据关联;
20.所述服务器通过权限分配模块基于类型标签为不同类型的电网数据设定操作权限;
21.所述服务器通过数据调用模块对用户进行的数据操作进行验证,并基于用户输入的调用条件执行通过验证的数据操作,向用户返回调用数据。
22.优选地,所述历史数据分析模块将记录存储的历史电网同步数据平均分为多个时间段数据,并进行归一化处理;
23.所述分布界限图构建模块计算历史电网同步数据的特征值分布函数,并得到特征值分布函数的上分布界限函数、下分布界限函数,建立关于历史电网同步数据特征值的分布界限图。
24.优选地,所述特征分布图构建模块计算实时电网同步数据的特征值分布函数,并建立关于实时电网同步数据特征值的特征分布图。
25.优选地,所述对比分析模块按照统一标准对分布界限图、特征分布图进行图像合并,如果特征分布图位于分布界限图内部,则电网运行状态稳定;否则电网运行状态异常。
26.(三)有益效果
27.与现有技术相比,本发明所提供的一种电网数据分析管理系统,数据处理模块能够筛查各类型电网数据中的缺漏数据,并基于k近邻算法结合缺漏数据附近k个电网数据计算得到该缺漏数据对应的替换数据,能够对缺漏数据补入替换数据,有效提升挖掘电网数据的准确性、完善性;分布界限图构建模块建立关于历史电网同步数据特征值的分布界限图,特征分布图构建模块建立关于实时电网同步数据特征值的特征分布图,通过对分布界限图、特征分布图的合并比较,实现对电网运行状态地准确分析。
附图说明
28.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
29.图1为本发明的系统示意图;
30.图2为本发明中分析电网运行状态的流程示意图。
具体实施方式
31.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
32.一种电网数据分析管理系统,如图1和图2所示,包括服务器,服务器通过数据挖掘模块基于数据挖掘模型对电网数据进行定向挖掘,服务器通过数据标记模块基于信源编码对不同类型的电网数据设定不同的类型标签,服务器利用数据处理模块对不同类型的电网数据进行数据修正,服务器利用数据分配模块基于类型标签将修正后的电网数据分配至对应数据传输通道,存储至数据存储模块内不同的数据存储节点。
33.本技术技术方案中,还包括数据关联模块、权限分配模块和数据调用模块,服务器通过数据分配模块为电网数据在数据存储节点内寻找合适位置,并对该电网数据进行数据关联;
34.服务器通过权限分配模块基于类型标签为不同类型的电网数据设定操作权限;
35.服务器通过数据调用模块对用户进行的数据操作进行验证,并基于用户输入的调用条件执行通过验证的数据操作,向用户返回调用数据。
36.本技术技术方案中,基于信源编码对不同类型的电网数据设定不同的类型标签,并基于类型标签将修正后的电网数据分配至对应数据传输通道,存储至数据存储模块内不同的数据存储节点,同时为电网数据在数据存储节点内寻找合适位置,并对该电网数据进行数据关联,实现了对电网数据的优化存储。此外,权限分配模块的设置提升了用户通过数据调用模块调用电网数据的安全性。
37.数据处理模块筛查各类型电网数据中的缺漏数据,并基于k近邻算法结合缺漏数据附近k个电网数据计算得到该缺漏数据对应的替换数据。下面对数据处理模块计算缺替换数据的过程进行详细说明:
38.1)数据处理模块选取最接近缺漏数据的n个标志数据,并分别以标志数据为起点进行从近到远的遍历,记录每次遍历数据中的最小值a1和平均值a2,对每个缺漏数据使用2次k近邻算法,k分别取a1、a2,并根据计算结果判断是否进行估算进程;
39.2)数据处理模块对缺漏数据使用2次k近邻算法后,得到的结果一致,则该结果为替换数据;否则进行估算进程;
40.3)数据处理模块进行估算进程,包括:
41.通过a2=a2‑
x对平均值a2进行赋值运算,再将k分别取a1、a2使用2次k近邻算法,如
果得到的结果一致,则该结果为替换数据;
42.如果得到的结果不一致,通过a1=a1+y对最小值a1进行赋值运算,再将k分别取a1、a2使用2次k近邻算法,如果得到的结果一致,则该结果为替换数据;
43.如果得到的结果仍然不一致,则重复上述过程直至得到相同结果;
44.其中,x=(a2‑
a1)/n,y=x
‑
1,且x、y均为不小于0的整数。
45.本技术技术方案中,通过上述方式,逐步调整k的取值,直至得到最终结果,能够在很大程度上保证替换数据的准确率,对于大规模的数据处理具有重要价值,同时调整幅度从大到小,也减少了计算次数,兼顾了计算效率。
46.数据分配模块采用sparkr的并行化k
‑
means算法,根据类型标签实现电网数据的分类,并基于分类结果为电网数据匹配对应的数据传输通道。
47.服务器通过数据建模模块利用随机矩阵对电网同步数据进行建模,服务器通过历史数据分析模块对记录存储的历史电网同步数据进行分析处理,服务器通过分布界限图构建模块基于分析处理结果构建关于历史电网同步数据特征值的分布界限图,服务器通过特征分布图构建模块构建关于实时电网同步数据特征值的特征分布图,服务器通过对比分析模块对特征分布图、分布界限图进行比较分析,并基于分析结果判断当前电网运行状态。
48.数据建模模块根据电网潮流方程,建立电网同步数据的观测值和电网运行状态之间的关系,即电网同步数据的随机矩阵表示。根据电网的运行状态可以将电网划分为四种,分别为:拓扑结构不变、拓扑结构变化、供电源不变和供电源变化。
49.历史数据分析模块将记录存储的历史电网同步数据平均分为多个时间段数据,并进行归一化处理。
50.分布界限图构建模块计算历史电网同步数据的特征值分布函数,并得到特征值分布函数的上分布界限函数、下分布界限函数,建立关于历史电网同步数据特征值的分布界限图。
51.特征分布图构建模块计算实时电网同步数据的特征值分布函数,并建立关于实时电网同步数据特征值的特征分布图。
52.对比分析模块按照统一标准对分布界限图、特征分布图进行图像合并,如果特征分布图位于分布界限图内部,则电网运行状态稳定;否则电网运行状态异常。
53.本技术技术方案中,分布界限图构建模块建立关于历史电网同步数据特征值的分布界限图,特征分布图构建模块建立关于实时电网同步数据特征值的特征分布图,通过对分布界限图、特征分布图的合并比较,实现对电网运行状态地准确分析。
54.以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。