1.本发明涉及电力系统技术领域,具体涉及一种基于密度空间聚类的信息流异常数据监测方法及装置。
背景技术:2.随着国家电网公司不断提高供电可靠性、减少停电时间,提升电能服务能力的要求,势必要实现电力系统电能信息全覆盖、多维度的实时采集。新型电能信息交互设备由于其快速、实时、准确的特点而广泛用于电力系统的动态监测、自适应保护等领域。然而,随着电能信息交互设备的推广应用,因互感器误差,设备故障、时间同步偏差、通信系统中断等诸多因素,现场部分实测电能信息流数据容易出现丢失、跳变、偏差等数据异常问题。另外,随着现代电力系统交互信息不断融合,系统调控中心对实时量测数据的依赖程度越来越高,导致电能信息监测数据面临着较高的潜在网络攻击风险。同时,因信息交互主站利用卫星信号授时,容易受到许多内外因素的影响,例如信道干扰,卫星定位系统(gps或北斗导航系统)信号丢失和设备错误,都将大大降低系统的可观性,甚至影响电力系统的安全性和稳定性。
3.针对监测电力系统电能信息交互设备可能存在的信息流异常数据,目前业内存在很多方法,目前大致可以划分为基于系统拓扑状态估计和基于数据驱动的两类方法。其中,基于系统拓扑状态估计的方法需要预先掌握电力系统拓扑及状态参数,尽管其异常数据监测精度很高,但是当发生系统拓扑错误时,很容易引起误判。而随着数据挖掘技术的兴起,引申出一系列基于神经网络和深度学习的异常数据监测方法。这些方法在静态情况下取得了良好的异常数据监测效果。但是在动态条件(低频振荡、次同步振荡等)下,由于电能信息交互数据本身也在随时间发生振荡波动,导致其中某些不良数据与系统正常数据间仅存在细微差别。因此,在此类动态工况下,传统数据学习方法的在动态条件下误检率很高,难以大面积推广应用。
技术实现要素:4.本发明所要解决的技术问题是现有技术下传统的信息流异常数据监测方法普遍存在动态条件下无法放大并辨识异常数据细微特征,最终导致误检率大幅增高的问题。
5.基于此,本发明基于密度空间聚类(density
‑
based spatial clustering,dbsc)方法,提出了一种基于密度空间聚类的信息流异常数据监测方法及装置,该方法通过长短期记忆(long short
‑
term memory,lstm)神经网络有选择地使用电能信息采集数据,从相角斜率特征出发,通过计算残差值放大了异常数据的特征信息,最后通过dbsc对电能信息流数据幅值/相角特征进行聚类分析,有效解决动态条件下电能信息流数据幅值和相位角数据监测异常的问题。该方法通过长短期记忆lstm神经网络有选择地使用电能信息流数据,从电能信息测量值相角数据的斜率特征出发,通过计算残差值放大了异常数据的特征信息,最后通过基于密度空间聚类dbsc对电能信息幅值/相角特征进行聚类分析,有效解决
动态条件下电能信息流数据幅值和相位角数据监测异常的问题。根据实施例结果表明,本发明方法能够抑制外界干扰因素对异常数据监测的影响,大大提高了动态条件下监测和筛选异常数据的精度,满足现场实际应用的大部分需求。
6.本发明通过下述技术方案实现:
7.一方面,本发明提供了一种基于密度空间聚类的信息流异常数据监测方法,该方法包括以下步骤:
8.s1、实时采集电能信息交互设备上传主站电能量测数据,将电能测量数据分组为幅值量测数据和相角量测数据;
9.s2、将所述幅值量测数据的幅值序列分为训练集和测试集两类,采用长短期记忆lstm神经网络,并将所述训练集和测试集分别输入到所述长短期记忆lstm神经网络进行训练得到映射的神经网络特征,作为电能信息流交互数据幅值特征分量;
10.s3、对所述相角量测数据的相角序列进行相位变换计算新的相位差序列,计算相角斜率特征量,即角速度特征量,作为电能信息流交互数据相角特征分量;
11.s4、采用基于密度空间聚类dbsc监测模型,将所述幅值特征分量、相角特征分量分别输入基于密度空间聚类dbsc监测模型,并进行聚类分析以监测电能信息交互设备量测值中的幅值或相角异常数据,并输出监测结果。
12.进一步地,步骤s2中所述长短期记忆lstm神经网络的结构包括遗忘门、输入门、输出门和储存单元,所述遗忘门,用于电能量测数据的训练集数据输入口;所述输入门,用于电能量测数据的测试集数据输入口;所述储存单元,用于lstm神经网络模型训练过程中的中间数据存储;所述输出门,用于训练和测试结果的输出。
13.进一步地,步骤s2中利用长短期记忆lstm方法计算电能信息交互测量数据幅值特征分量的具体步骤如下:
14.s21:将前一时刻的电能信息测量数据幅值特征分量h
t
‑1和当前时刻的待训练的输入信号x
t
输入遗忘门模块,计算得到当前时刻遗忘门的状态参数f
t
:
15.f
t
=σ(w
f
·
[h
t
‑1,x
t
]+b
f
)
[0016]
其中:w
f
是遗忘门的权重系数矩阵;x
t
是待训练的输入信号,此处特指当前时刻的电压或电流采样数据;h
t
‑1是前一时刻的电能信息测量数据幅值特征分量,b
f
是遗忘门的偏项,σ是sigmoid函数,其表达式为:σ(x)=1/1+e
‑
x
;
[0017]
同时,通过将x
t
数据保存到输入门得到当前时刻输入门的状态参数i
t
:
[0018]
i
t
=σ(w
i
·
[h
t
‑1,x
t
]+b
i
)
[0019]
其中:w
i
是输入门的权重系数矩阵;b
i
是输入门的偏项;
[0020]
s22:利用激活函数计算当前时刻的记忆储存单元状态参数
[0021][0022]
其中:w
c
是长期记忆储存单元的权重系数矩阵;激活函数的表达式为tanh(x)=(e
x
‑
e
‑
x
)/(e
x
+e
‑
x
);b
c
是记忆储存单元的偏项;
[0023]
s23:假如定义符号“ο”表示不同状态的合成,长短期记忆lstm神经网络结合记忆储存单元状态参数和上一时刻长期记忆状态参数c
t
‑1联立求解得到当前时刻的长期记忆状态参数c
t
:
[0024][0025]
s24:输出门控制多个c
t
输出长短期记忆lstm神经网络的最终输出结果h
t
,即电能信息测量数据幅值特征分量:
[0026]
h
t
=o
t
οtanh(c
t
)
[0027]
其中:o
t
=σ(w
o
·
[h
t
‑1,x
t
]+b
o
);w
o
是输出门的权重系数矩阵;b
o
是输入门的偏项;
[0028]
s25:利用lstm网络强大的存储和抗噪功能,通过不断将电能信息流历史数据输入长短期记忆lstm神经网络,得到lstm神经网络训练模型,依次循环,迭代获得预测值将电能信息实际测量h0和预测数据用计算残差e,直至所述残差e达到预设值,得到最终的幅值特征分量h
t
;其中并通过残差值得到预设值来控制后续dbsc聚类模块监测幅值发生异常的电能信息数据。
[0029]
进一步地,步骤s3中利用斜率特征量计算电能信息数据相角特征分量,是利用两相邻采样时刻的相角测量值做差计算其变化率,即相角的角速度,以此作为电能信息数据相角特征分量ω(t
n
):
[0030][0031]
其中:为电能信息交互设备在t
n
时刻采集的相角测量值,为电能信息交互设备在t
n
‑1时刻采集的相角测量值;t
n
、t
n
‑1为两相邻采样时刻。
[0032]
进一步地,基于密度空间聚类dbsc与传统k
‑
means聚类方法不同,它是一种基于密度的聚类方法。本发明基于密度空间聚类dbsc法将现有数据点分为三类:
[0033]
第一类为核心点(core point):如果该对象的eps邻域至少包含最小数目minpts的对象,则称该对象为核心点;
[0034]
第二类为边界点(border point):如果该对象不是核心点,但落在某个核心点的eps邻域内,则称该对象为边界点;
[0035]
第三类为噪声点(noise point):不属于任何群集的点称为噪声点。
[0036]
其中:eps代表不同对象点的半径全局参数;minpts代表样本点密度全局参数。
[0037]
步骤s4包括以下子步骤:
[0038]
s41:从所述幅值特征分量、相角特征分量组成的数据集中随机选择一个数据作为对象点;
[0039]
s42:通过检查数据集中每个点的eps邻域来搜索簇,如果对象点的eps邻域包含的点多于minpts,则创建一个以该对象点为核心对象的簇;
[0040]
s43:如果所选数据对象是边界点,则继续选择另一个数据作为对象点;
[0041]
s44:重复步骤s41至s43,迭代地聚集从这些核心对象,直到遍历所有点,最终识别出电能信息测量值中的正常数据和异常数据,被聚在核心点簇的数据为正常数据,否则为异常数据(包括边界点和噪声点);
[0042]
另一方面,本发明还提供了一种基于密度空间聚类的信息流异常数据监测装置,该装置支持所述的一种基于密度空间聚类的信息流异常数据监测方法,该装置包括:
[0043]
获取单元,获取实时采集的电能信息交互设备上传主站电能量测数据,并将电能测量数据分组为幅值量测数据和相角量测数据;
[0044]
第一计算单元,将所述幅值量测数据的幅值序列分为训练集和测试集两类,利用长短期记忆lstm神经网络计算电能信息交互测量数据幅值特征分量;
[0045]
第二计算单元,对所述相角量测数据的相角序列进行相位变换计算新的相位差序列,计算相角斜率特征量,即角速度特征量,作为电能信息流交互数据相角特征分量;
[0046]
监测单元,根据所述幅值特征分量和相角特征分量,采用基于密度空间聚类dbsc监测模型进行聚类分析以监测电能信息交互设备量测值中的幅值或相角异常数据;
[0047]
输出单元,输出监测单元的监测结果。
[0048]
进一步地,所述第一计算单元中的长短期记忆lstm神经网络结构包括遗忘门、输入门、输出门和储存单元,所述遗忘门,用于电能量测数据的训练集数据输入口;所述输入门,用于电能量测数据的测试集数据输入口;所述储存单元,用于lstm神经网络模型训练过程中的中间数据存储;所述输出门,用于训练和测试结果的输出。
[0049]
进一步地,所述第一计算单元执行过程如下:
[0050]
将前一时刻的电能信息测量数据幅值特征分量h
t
‑1和当前时刻的待训练的输入信号x
t
输入遗忘门模块,计算得到当前时刻遗忘门的状态参数f
t
:
[0051]
f
t
=σ(w
f
·
[h
t
‑1,x
t
]+b
f
)
[0052]
其中:w
f
是遗忘门的权重系数矩阵;x
t
是待训练的输入信号,此处特指当前时刻的电压或电流采样数据;h
t
‑1是前一时刻的电能信息测量数据幅值特征分量,b
f
是遗忘门的偏项,σ是sigmoid函数,其表达式为:σ(x)=1/1+e
‑
x
;
[0053]
同时,通过将x
t
数据保存到输入门得到当前时刻输入门的状态参数i
t
:
[0054]
i
t
=σ(w
i
·
[h
t
‑1,x
t
]+b
i
)
[0055]
其中:w
i
是输入门的权重系数矩阵;b
i
是输入门的偏项;
[0056]
利用激活函数计算当前时刻的记忆储存单元状态参数
[0057][0058]
其中:w
c
是长期记忆储存单元的权重系数矩阵;激活函数的表达式为tanh(x)=(e
x
‑
e
‑
x
)/(e
x
+e
‑
x
);b
c
是记忆储存单元的偏项;
[0059]
假如定义符号“ο”表示不同状态的合成,长短期记忆lstm神经网络结合记忆储存单元状态参数和上一时刻长期记忆状态参数c
t
‑1联立求解得到当前时刻的长期记忆状态参数c
t
:
[0060][0061]
输出门控制多个c
t
输出长短期记忆lstm神经网络的最终输出结果h
t
,即电能信息测量数据幅值特征分量:
[0062]
h
t
=o
t
οtanh(c
t
)
[0063]
其中:o
t
=σ(w
o
·
[h
t
‑1,x
t
]+b
o
);w
o
是输出门的权重系数矩阵;b
o
是输入门的偏项;
[0064]
利用lstm网络强大的存储和抗噪功能,通过不断将电能信息流历史数据输入长短期记忆lstm神经网络,得到lstm神经网络训练模型,依次循环,迭代获得预测值将电能信
息实际测量h0和预测数据用计算残差e,直至所述残差e达到预设值,得到最终的幅值特征分量h
t
;其中并通过残差值得到预设值来控制后续dbsc聚类模块监测幅值发生异常的电能信息数据。
[0065]
进一步地,所述第二计算单元利用斜率特征量计算电能信息数据相角特征分量,是利用两相邻采样时刻的相角测量值做差计算其变化率,即相角的角速度,以此作为电能信息数据相角特征分量ω(t
n
):
[0066][0067]
其中:为电能信息交互设备在t
n
时刻采集的相角测量值,为电能信息交互设备在t
n
‑1时刻采集的相角测量值;t
n
、t
n
‑1为两相邻采样时刻。
[0068]
进一步地,所述监测单元执行过程如下:
[0069]
从所述幅值特征分量、相角特征分量组成的数据集中随机选择一个数据作为对象点;
[0070]
通过检查数据集中每个点的eps邻域来搜索簇,如果对象点的eps邻域包含的点多于minpts,则创建一个以该对象点为核心对象的簇;
[0071]
如果所选数据对象是边界点,则继续选择另一个数据作为对象点;
[0072]
重复上述过程,迭代地聚集从这些核心对象,直到遍历所有点,最终识别出电能信息测量值中的正常数据和异常数据,被聚在核心点簇的数据为正常数据,否则为异常数据;
[0073]
其中:eps代表不同对象点的半径全局参数;minpts代表样本点密度全局参数。
[0074]
本发明与现有技术相比,具有如下的优点和有益效果:
[0075]
1、本发明通过lstm神经网络进行训练得到电能信息测量数据幅值特征分量,通过相位变换计算新的相位差序列,计算相角斜率特征量,得到电能信息数据相角特征分量,放大了动态信号量测数据中异常数据与信号本身动态波动间存在的细微差别;
[0076]
2、本发明利用基于密度空间聚类方法,对计算、训练得到的幅值、相角特征分量进行聚类分析、判别,大大提高了动态条件下监测和筛选异常数据的精度;
[0077]
3、本发明在幅值、相角发生动态调制的工况下,相较于k
‑
means聚类和谱聚类方法,无论是单个或多个幅值、相角发生数据异常,均具有更高的监测精度,且能够至少抵抗60db高斯白噪声带来的干扰影响,满足现场实际应用的大部分需求。
附图说明
[0078]
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
[0079]
图1为本发明所采用的lstm神经网络结构示意图。
[0080]
图2为本发明利用斜率特征量计算电能信息数据相角特征分量的变化曲线图。
[0081]
图3为本发明基于密度空间聚类dbsc方法将现有数据点分为三类的示意图。
[0082]
图4为本发明一种基于密度空间聚类的信息流异常数据监测方法流程图。
[0083]
图5为本发明实施例仿真结果图。
[0084]
图6为本发明基于密度空间聚类法、现有谱聚类法和现有k
‑
means聚类法进行对比和分析示意图一。
[0085]
图7为本发明基于密度空间聚类法、现有谱聚类法和现有k
‑
means聚类法进行对比和分析示意图二。
[0086]
图8为本发明基于密度空间聚类法、现有谱聚类法和现有k
‑
means聚类法进行对比和分析示意图三。
具体实施方式
[0087]
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
[0088]
在以下描述中,为了提供对本发明的透彻理解阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本发明。在其他实例中,为了避免混淆本发明,未具体描述公知的结构、电路、材料或方法。
[0089]
在整个说明书中,对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本发明至少一个实施例中。因此,在整个说明书的各个地方出现的短语“一个实施例”、“实施例”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合和、或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,在此提供的示图都是为了说明的目的,并且示图不一定是按比例绘制的。这里使用的术语“和/或”包括一个或多个相关列出的项目的任何和所有组合。
[0090]
在本发明的描述中,需要理解的是,术语“前”、“后”、“左”、“右”、“上”、“下”、“竖直”、“水平”、“高”、“低”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制。
[0091]
实施例1
[0092]
如图1至图8所示,本发明一种基于密度空间聚类的信息流异常数据监测方法,如图4所示,图4为本发明一种基于密度空间聚类的信息流异常数据监测方法流程图。
[0093]
该方法包括以下步骤:
[0094]
s1、实时采集电能信息交互设备上传主站电能量测数据,将电能测量数据分组为幅值量测数据和相角量测数据;
[0095]
s2、将所述幅值量测数据的幅值序列分为训练集和测试集两类,采用长短期记忆lstm神经网络,并将所述训练集和测试集分别输入到所述长短期记忆lstm神经网络进行训练得到映射的神经网络特征,作为电能信息流交互数据幅值特征分量;
[0096]
s3、对所述相角量测数据的相角序列进行相位变换计算新的相位差序列,计算相角斜率特征量,即角速度特征量,作为电能信息流交互数据相角特征分量;
[0097]
s4、采用基于密度空间聚类dbsc监测模型,将所述幅值特征分量、相角特征分量分别输入基于密度空间聚类dbsc监测模型,并进行聚类分析以监测电能信息交互设备量测值中的幅值或相角异常数据,并输出监测结果。
[0098]
本实施例中,步骤s2中所述长短期记忆lstm神经网络的结构如图1所示,它由四个关键结构组成,分别是:遗忘门(forget gate)、输入门(input gate)、输出门(output gate)和储存单元(cell state);所述遗忘门,用于电能量测数据的训练集数据输入口;所述输入门,用于电能量测数据的测试集数据输入口;所述储存单元,用于lstm神经网络模型训练过程中的中间数据存储;所述输出门,用于训练和测试结果的输出。
[0099]
本实施例中,步骤s2中利用长短期记忆lstm方法计算电能信息交互测量数据幅值特征分量的具体步骤如下:
[0100]
s21:将前一时刻的电能信息测量数据幅值特征分量h
t
‑1和当前时刻的待训练的输入信号x
t
输入遗忘门模块,计算得到当前时刻遗忘门的状态参数f
t
:
[0101]
f
t
=σ(w
f
·
[h
t
‑1,x
t
]+b
f
)
[0102]
其中:w
f
是遗忘门的权重系数矩阵;x
t
是待训练的输入信号,此处特指当前时刻的电压或电流采样数据;h
t
‑1是前一时刻的电能信息测量数据幅值特征分量,b
f
是遗忘门的偏项,σ是sigmoid函数,其表达式为:σ(x)=1/1+e
‑
x
;
[0103]
同时,通过将x
t
数据保存到输入门得到当前时刻输入门的状态参数i
t
:
[0104]
i
t
=σ(w
i
·
[h
t
‑1,x
t
]+b
i
)
[0105]
其中:w
i
是输入门的权重系数矩阵;b
i
是输入门的偏项;
[0106]
s22:利用激活函数计算当前时刻的记忆储存单元状态参数
[0107][0108]
其中:w
c
是长期记忆储存单元的权重系数矩阵;激活函数的表达式为tanh(x)=(e
x
‑
e
‑
x
)/(e
x
+e
‑
x
);b
c
是记忆储存单元的偏项;
[0109]
s23:假如定义符号“ο”表示不同状态的合成,长短期记忆lstm神经网络结合记忆储存单元状态参数和上一时刻长期记忆状态参数c
t
‑1联立求解得到当前时刻的长期记忆状态参数c
t
:
[0110][0111]
s24:输出门控制多个c
t
输出长短期记忆lstm神经网络的最终输出结果h
t
,此处特指电能信息测量数据幅值特征分量:
[0112]
h
t
=o
t
οtanh(c
t
)
[0113]
其中:o
t
=σ(w
o
·
[h
t
‑1,x
t
]+b
o
);w
o
是输出门的权重系数矩阵;b
o
是输入门的偏项;
[0114]
s25:利用lstm网络强大的存储和抗噪功能,通过不断将电能信息流历史数据输入长短期记忆lstm神经网络,得到lstm神经网络训练模型,依次循环,迭代获得预测值将电能信息实际测量h0和预测数据用计算残差e,直至所述残差e达到预设值,得到最终的幅值特征分量h
t
;其中并通过残差值得到预设值来控制后续dbsc聚类模块监测幅值发生异常的电能信息数据。
[0115]
本实施例中,如图2所示,电能信息相角量测数据通常在
‑
180
°
和180
°
之间呈锯齿形变化,并且其波动范围相对较大。因此,当电能信息测量数据出现相角异常时,相角差的响应会远大于相角本身的应激响应,这样的方法变放大了二者之间的差异使其更加容易监
测。
[0116]
基于此,步骤s3中利用斜率特征量计算电能信息数据相角特征分量,是利用两相邻采样时刻的相角测量值做差计算其变化率,即相角的角速度,以此作为电能信息数据相角特征分量ω(t
n
):
[0117][0118]
其中:为电能信息交互设备在t
n
时刻采集的相角测量值,为电能信息交互设备在t
n
‑1时刻采集的相角测量值;t
n
、t
n
‑1为两相邻采样时刻。
[0119]
本实施例中,基于密度空间聚类dbsc与传统k
‑
means聚类方法不同,它是一种基于密度的聚类方法。如图3所示,本发明基于密度空间聚类dbsc法将现有数据点分为三类:
[0120]
第一类为核心点(core point):如果该对象的eps邻域至少包含最小数目minpts的对象,则称该对象为核心点;
[0121]
第二类为边界点(border point):如果该对象不是核心点,但落在某个核心点的eps邻域内,则称该对象为边界点;
[0122]
第三类为噪声点(noise point):不属于任何群集的点称为噪声点。
[0123]
其中:eps代表不同对象点的半径全局参数;minpts代表样本点密度全局参数。
[0124]
步骤s4包括以下子步骤:
[0125]
s41:从所述幅值特征分量、相角特征分量组成的数据集中随机选择一个数据作为对象点;
[0126]
s42:通过检查数据集中每个点的eps邻域来搜索簇,如果对象点的eps邻域包含的点多于minpts,则创建一个以该对象点为核心对象的簇;
[0127]
s43:如果所选数据对象是边界点,则继续选择另一个数据作为对象点;
[0128]
s44:重复步骤s41至s43,迭代地聚集从这些核心对象,直到遍历所有点,最终识别出电能信息测量值中的正常数据和异常数据,被聚在核心点簇的数据为正常数据,否则为异常数据(包括边界点和噪声点);
[0129]
实施时,仿真实验如下:
[0130]
为了验证本发明方法的有效性,利用标准的幅值调制和相角调制两种动态信号来测试本发明所提出的基于密度空间聚类的信息流异常数据监测方法分别识别幅值和相角异常数据的准确度。
[0131]
采用幅值+相角调制模型来模拟动态变化下的电力振荡信号,其表达式如下:
[0132][0133]
其中:x
m
是幅值初始值,这里取220v;λ是幅值调制深度,这里取0.6%;f
m
是幅值调制频率,这里取5hz;是幅值调制的初相角,这里取0
°
;f0是电力系统的标称额定频率,这里取50hz;x
k
是相角调制深度,这里取6
°
;f
a
是幅值调制频率,这里取5hz;是动态信号的初相角,这里取60
°
。
[0134]
a、幅值调制动态信号下的仿真
[0135]
对于上述动态调制信号,添加了具有0.5%幅值偏差的异常数据,并添加了60db高
斯白噪声作为干扰分量测试方法的监测精度和抗干扰性能。
[0136]
从图5中的仿真结果可以看出,当设置dbsc模块中eps=0.5,minpts=3时,实时电能信息实际测量中出现单个较小幅度的异常数据时。本发明提出的方法可以准确监测到单个幅值发生异常的数据(图5中“ο”标记为异常数据)。
[0137]
而当先后设置了十个幅值由0.5%变化到3%的异常数据,并添加了60db高斯白噪声时。采用k
‑
means聚类法和谱聚类法与本发明所提方法进行对比和分析,如图6所示。当设置dbsc模块中eps=0.15,minpts=3时,电能信息测量数据中出现多个较小幅度的异常数据时。本发明所提的dbsc监测方法具有比其他两种对比方法更高的异常数据监测精度。(图6中“ο”标记为异常数据)。
[0138]
b、相角调制动态信号下的仿真
[0139]
对于上述动态调制信号,添加了具有单个0.2%相角偏差的异常数据,并添加了60db高斯白噪声作为干扰分量。
[0140]
通常,电能信息交互数据中的相角异常由于波动较小且差异细微而难以监测,从图7中的仿真结果可以看出,当设置dbsc模块中eps=0.12,minpts=3时,本发明提出的方法可以准确监测到单个相角发生异常的数据,而k
‑
means聚类和谱聚类方法则很难区分(图7中“ο”标记为异常数据)。
[0141]
而当先后设置了十个相角由0.2%变化到1%的异常数据,并添加了60db高斯白噪声时。如图8所示。设置dbsc模块中eps=0.01,minpts=3时,电能信息测量数据中出现多个较小幅度的相角异常数据。本发明提出的dbsc方法可以准确监测到全部10个相角数据发生异常,而k
‑
means聚类和谱聚类方法同样很难区分(图8中“ο”标记为异常数据)。
[0142]
本发明方法通过长短期记忆lstm神经网络有选择地使用电能信息流数据,从电能信息测量值相角数据的斜率特征出发,通过计算残差值放大了异常数据的特征信息,最后通过基于密度空间聚类dbsc对电能信息幅值/相角特征进行聚类分析,有效解决动态条件下电能信息流数据幅值和相位角数据监测异常的问题。根据实施例结果表明,本发明方法能够抑制外界干扰因素对异常数据监测的影响,大大提高了动态条件下监测和筛选异常数据的精度,满足现场实际应用的大部分需求。
[0143]
本发明方法对于提高电能信息交互数据质量,确保电力系统安全稳定运行中起着至关重要的作用。
[0144]
实施例2
[0145]
如图1至图8所示,本实施例与实施例1的区别在于,本实施例提供了一种基于密度空间聚类的信息流异常数据监测装置,该装置支持实施例1所述的一种基于密度空间聚类的信息流异常数据监测方法,该装置包括:
[0146]
获取单元,获取实时采集的电能信息交互设备上传主站电能量测数据,并将电能测量数据分组为幅值量测数据和相角量测数据;
[0147]
第一计算单元,将所述幅值量测数据的幅值序列分为训练集和测试集两类,利用长短期记忆lstm神经网络计算电能信息交互测量数据幅值特征分量;
[0148]
第二计算单元,对所述相角量测数据的相角序列进行相位变换计算新的相位差序列,计算相角斜率特征量,即角速度特征量,作为电能信息流交互数据相角特征分量;
[0149]
监测单元,根据所述幅值特征分量和相角特征分量,采用基于密度空间聚类dbsc
监测模型进行聚类分析以监测电能信息交互设备量测值中的幅值或相角异常数据;
[0150]
输出单元,输出监测单元的监测结果。
[0151]
进一步地,所述第一计算单元中的长短期记忆lstm神经网络结构包括遗忘门、输入门、输出门和储存单元,所述遗忘门,用于电能量测数据的训练集数据输入口;所述输入门,用于电能量测数据的测试集数据输入口;所述储存单元,用于lstm神经网络模型训练过程中的中间数据存储;所述输出门,用于训练和测试结果的输出。
[0152]
进一步地,所述第一计算单元执行过程如下:
[0153]
将前一时刻的电能信息测量数据幅值特征分量h
t
‑1和当前时刻的待训练的输入信号x
t
输入遗忘门模块,计算得到当前时刻遗忘门的状态参数f
t
:
[0154]
f
t
=σ(w
f
·
[h
t
‑1,x
t
]+b
f
)
[0155]
其中:w
f
是遗忘门的权重系数矩阵;x
t
是待训练的输入信号,此处特指当前时刻的电压或电流采样数据;h
t
‑1是前一时刻的电能信息测量数据幅值特征分量,b
f
是遗忘门的偏项,σ是sigmoid函数,其表达式为:σ(x)=1/1+e
‑
x
;
[0156]
同时,通过将x
t
数据保存到输入门得到当前时刻输入门的状态参数i
t
:
[0157]
i
t
=σ(w
i
·
[h
t
‑1,x
t
]+b
i
)
[0158]
其中:w
i
是输入门的权重系数矩阵;b
i
是输入门的偏项;
[0159]
利用激活函数计算当前时刻的记忆储存单元状态参数
[0160][0161]
其中:w
c
是长期记忆储存单元的权重系数矩阵;激活函数的表达式为tanh(x)=(e
x
‑
e
‑
x
)/(e
x
+e
‑
x
);b
c
是记忆储存单元的偏项;
[0162]
假如定义符号“ο”表示不同状态的合成,长短期记忆lstm神经网络结合记忆储存单元状态参数和上一时刻长期记忆状态参数c
t
‑1联立求解得到当前时刻的长期记忆状态参数c
t
:
[0163][0164]
输出门控制多个c
t
输出长短期记忆lstm神经网络的最终输出结果h
t
,即电能信息测量数据幅值特征分量:
[0165]
h
t
=o
t
οtanh(c
t
)
[0166]
其中:o
t
=σ(w
o
·
[h
t
‑1,x
t
]+b
o
);w
o
是输出门的权重系数矩阵;b
o
是输入门的偏项。
[0167]
利用lstm网络强大的存储和抗噪功能,通过不断将电能信息流历史数据输入长短期记忆lstm神经网络,得到lstm神经网络训练模型,依次循环,迭代获得预测值将电能信息实际测量h0和预测数据用计算残差e,直至所述残差e达到预设值,得到最终的幅值特征分量h
t
;其中并通过残差值得到预设值来控制后续dbsc聚类模块监测幅值发生异常的电能信息数据。
[0168]
进一步地,所述第二计算单元利用斜率特征量计算电能信息数据相角特征分量,是利用两相邻采样时刻的相角测量值做差计算其变化率,即相角的角速度,以此作为电能信息数据相角特征分量ω(t
n
):
[0169][0170]
其中:为电能信息交互设备在t
n
时刻采集的相角测量值,为电能信息交互设备在t
n
‑1时刻采集的相角测量值;t
n
、t
n
‑1为两相邻采样时刻。
[0171]
进一步地,所述监测单元执行过程如下:
[0172]
从所述幅值特征分量、相角特征分量组成的数据集中随机选择一个数据作为对象点;
[0173]
通过检查数据集中每个点的eps邻域来搜索簇,如果对象点的eps邻域包含的点多于minpts,则创建一个以该对象点为核心对象的簇;
[0174]
如果所选数据对象是边界点,则继续选择另一个数据作为对象点;
[0175]
重复上述过程,迭代地聚集从这些核心对象,直到遍历所有点,最终识别出电能信息测量值中的正常数据和异常数据,被聚在核心点簇的数据为正常数据,否则为异常数据;
[0176]
其中:eps代表不同对象点的半径全局参数;minpts代表样本点密度全局参数。
[0177]
本装置通过lstm神经网络进行训练得到电能信息测量数据幅值特征分量,通过相位变换计算新的相位差序列,计算相角斜率特征量,得到电能信息数据相角特征分量,放大了动态信号量测数据中异常数据与信号本身动态波动间存在的细微差别;本发明利用基于密度空间聚类方法,对计算、训练得到的幅值、相角特征分量进行聚类分析、判别,大大提高了动态条件下监测和筛选异常数据的精度;本发明在幅值、相角发生动态调制的工况下,相较于k
‑
means聚类和谱聚类方法,无论是单个或多个幅值、相角发生数据异常,均具有更高的监测精度,且能够至少抵抗60db高斯白噪声带来的干扰影响,满足现场实际应用的大部分需求。
[0178]
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。