一种基于时频特征与长短期记忆网络的窃电行为识别方法与流程

文档序号:30449447发布日期:2022-06-18 01:32阅读:78来源:国知局
一种基于时频特征与长短期记忆网络的窃电行为识别方法与流程

1.本发明涉及电网用户窃电行为识别领域,具体为一种基于时频特征与长短期记忆网络的窃电行为识别方法。


背景技术:

2.目前,窃电事件层出不穷,窃电手段也日新月异,窃电事件的发生无论对于电力系统还是社会发展都危害极大。为规范用电用户管理、推动电力工业良性发展,及时地识别窃电行为势在必行。
3.近年来,随着电网信息化的不断推进,利用电网历史数据进行窃电行为检测成为了研究的热点。相关研究学者利用智能算法建立电网历史数据与窃电行为的关联性,部分研究学者提出了将逻辑回归应用到窃电检测的思想,但该方法因涉及多次迭代计算而十分冗杂;另有部分研究学者通过增加特征输入提升模型的准确度,但选取哪些特征仍存在较大争议;一些研究学者结合多特征的聚类算法建立窃电行为检测模型,但该模型阈值最佳值的确定缺乏理想的算法来实现;也有研究学者提出利用深度学习的算法完成窃电行为的检测,但其特征如何选取仍不明确,在样本数量不足、参数不合适的情况下难以取得准确的检测结果。综上所述,目前缺乏简单易行且准确可靠的窃电行为识别方法。


技术实现要素:

4.针对现有技术中存在的问题,本发明提供一种基于时频特征与长短期记忆网络的窃电行为识别方法,该方法简单易行且准确可靠,在用户用电量时序数据中提取相应的瞬时频率信号与谱熵信号,并建立基于长短期记忆网络的分类模型,将该瞬时频率信号与谱熵信号作为分类模型的二维特征输入,用户窃电与否的信息作为分类模型的输出结果。
5.本发明是通过以下技术方案来实现:
6.一种基于时频特征与长短期记忆网络的窃电行为识别方法,包括如下步骤:
7.步骤1,采集正常用户与窃电用户的用电量时序数据;
8.步骤2,在正常用户与窃电用户的用电量时序数据中提取瞬时频率信号与谱熵信号,形成二维时序数据,并对每组数据对应的用户类型进行编码,得到用户类型编码,其中正常用户类型编码为0;窃电用户类型编码为1;所述二维时序数据与每组数据对应的用户类型编码形成训练样本;
9.步骤3,建立基于长短期记忆网络的分类模型,以步骤2中的二维时序数据作为长短期记忆网络的分类模型的训练集输入,以二维时序数据对应的用户类型编码作为训练集输出,展开分类模型训练以确定系数矩阵与偏执矩阵并计算出长短期记忆网络输出;
10.步骤4,取得待识别的用户的用电量时序数据,并在待识别的用户的用电量时序数据中提取瞬时频率信号与谱熵信号,形成二维时序数据,将二维时序数据输入至步骤3中的长短期记忆网络的分类模型中,长短期记忆网络的分类模型经计算后输出用户类型编码,通过用户类型编码识别窃电行为。
11.优选的,步骤1中,正常用户的用电量时序数据与窃电用户的用电量时序数据的样本数量相等。
12.优选的,用户的用电量为用户实时的用电功率数据或用户一段时间内用户用电量累计值。
13.优选的,步骤2中,正常用户与窃电用户的用电量时序数据中提取瞬时频率信号为随时间变化的参数,与信号演变过程中出现的频率平均值对应,计算方法如下:
14.估计正常用户与窃电用户的用电量信号的功率谱s(t,f):
[0015][0016][0017]
其中,x(t)为用户用电量信号,r
x
(τ)为用户用电量信号的自相关函数;t为时移长度;g(τ-t)为傅里叶变换的窗口函数;f为频率;s(t,f)为功率谱;
[0018]
将瞬时频率估计为输入信号时频分布的条件谱矩,通过正常用户与窃电用户的用电量信号的功率谱s(t,f),计算估计瞬时频率:
[0019][0020]
其中,t为时间;f为频率;f
inst
(t)为瞬时频率;s(t,f)为功率谱。
[0021]
优选的,步骤2中,正常用户与窃电用户的用电量时序数据中提取谱熵信号为对信号谱功率分布的度量,谱熵信号将信号在频域中的归一化功率分布视为概率分布,并计算其信息熵,计算方法如下:
[0022]
计算时间t处的概率分布,公式如下:
[0023][0024]
其中,p(t,m)为概率分布;s(t,m)为;s(t,f)为功率谱;
[0025]
根据时间t处的概率分布,计算时间t处的瞬时谱熵信号,公式如下:
[0026][0027]
其中,h(t)为信号的瞬时谱熵;p(t,m)为概率分布。
[0028]
优选的,步骤2中,二维时序数据与每组数据对应的用户类型编码所形成训练样本进行定期更新,若更新获取有新的用户用电时序数据,则对新的用户用电时序数据提取瞬时频率信号与谱熵信号,形成二维时序数据,并对每组数据对应的用户类型进行编码,得到用户类型编码,并增加到原来的样本数据集中,再重新导入长短期记忆网络的分类模型训练;若没有更新新的用户用电时序数据,则训练样本直接导入长短期记忆网络的分类模型训练。
[0029]
优选的,步骤3中,基于长短期记忆网络的分类模型利用遗忘门、输入门以及输出门的原理在每一单元内进行信息时序信息读取、传递与筛选并对时序数据进行模式识别。
[0030]
优选的,步骤3中,长短期记忆网络输出的计算公式如下:
[0031][0032]
其中:为t时刻的长短期记忆网络的输出,wy为输出更新的系数矩阵, by为输出更新的偏置矩阵;h(t)为本单元的隐藏状态;σ为sigmoid激活函数。
[0033]
与现有技术相比,本发明具有以下有益的技术效果:
[0034]
本发明提供了一种基于时频特征与长短期记忆网络的窃电行为识别方法,先采集已知的正常用户与窃电用户的用电量时序数据,并将正常用户与窃电用户的用电量时序数据中提取瞬时频率信号与谱熵信号,形成二维时序数据,并对每组数据对应的用户类型进行编码,通过建立基于长短期记忆网络的分类模型,以二维时序数据作为长短期记忆网络的分类模型的训练集输入,以二维时序数据对应的用户类型编码作为训练集输出,形成分类模型,对待识别的用户的用电量时序数据提取瞬时频率信号与谱熵信号得到二维时序数据,直接输入至分类模型,通过输出的用户类型编码对窃电行为进行识别,提高了对窃电行为识别的效率与准确性。
附图说明
[0035]
图1为本发明中正常用户与窃电用户的用电量时序数据生成的曲线图;
[0036]
图2为本发明中长短期记忆网络结构图;
[0037]
图3为本发明中基于时频特征与长短期记忆网络的窃电行为识别流程图。
具体实施方式
[0038]
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0039]
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0040]
下面结合附图对本发明做进一步详细描述:
[0041]
本发明一个实施例中,提供了本发明提供一种基于时频特征与长短期记忆网络的窃电行为识别方法,该方法简单易行且准确可靠,在用户用电量时序数据中提取相应的瞬
时频率信号与谱熵信号,并建立基于长短期记忆网络的分类模型,将该瞬时频率信号与谱熵信号作为分类模型的二维特征输入,用户窃电与否的信息作为分类模型的输出结果。
[0042]
具体的,根据图3所示,该窃电行为识别方法,包括如下步骤:
[0043]
步骤1,采集正常用户与窃电用户的用电量时序数据;
[0044]
具体的,正常用户的用电量时序数据与窃电用户的用电量时序数据的样本数量相等。
[0045]
具体的,用户的用电量为用户实时的用电功率数据或用户一段时间内用户用电量累计值,其中,图1为正常用户与窃电用户的用电量时序数据生成的曲线实例,用电量为每半小时累计得到。
[0046]
步骤2,在正常用户与窃电用户的用电量时序数据中提取瞬时频率信号与谱熵信号,形成二维时序数据,并对每组数据对应的用户类型进行编码,得到用户类型编码,其中正常用户类型编码为0;窃电用户类型编码为1;所述二维时序数据与每组数据对应的用户类型编码形成训练样本;
[0047]
具体的,提取瞬时频率信号与谱熵信号的方式能够获取到正常用户与窃电用户之间的明显差异性信息,有助于分类模型精准度的提高。
[0048]
其中,正常用户与窃电用户的用电量时序数据中提取瞬时频率信号为随时间变化的参数,与信号演变过程中出现的频率平均值对应,计算方法如下:
[0049]
估计正常用户与窃电用户的用电量信号的功率谱s(t,f):
[0050][0051][0052]
其中,x(t)为用户用电量信号,r
x
(τ)为用户用电量信号的自相关函数;t为时移长度;g(τ-t)为傅里叶变换的窗口函数;f为频率;s(t,f)为用户用电量信号的功率谱;
[0053]
将瞬时频率估计为输入信号时频分布的条件谱矩,通过正常用户与窃电用户的用电量信号的功率谱s(t,f),计算估计瞬时频率:
[0054][0055]
其中,t为时间;f为频率;f
inst
(t)为瞬时频率;s(t,f)为功率谱。
[0056]
其中,正常用户与窃电用户的用电量时序数据中提取谱熵信号为对信号谱功率分布的度量,谱熵信号将信号在频域中的归一化功率分布视为概率分布,并计算其信息熵,在这种情况下,信息熵称为信号的谱熵,信号的不确定性与无序性随着谱熵值的增加而增加。从信号形式上看,谱熵代表了信号的平坦度,如白噪声信号因具有平坦频谱而存在高谱熵,正弦波信号则具有低谱熵。
[0057]
计算方法如下:
[0058]
为了计算给定时频功率谱图s(t,f)的瞬时谱熵,首先求得时间t的概率分布为:
[0059][0060]
式中:p(t,m)为概率分布;s(t,m)为;s(t,f)为给定时频功率谱;
[0061]
时间t处的谱熵为:
[0062][0063]
式中:h(t)为信号的瞬时谱熵;p(t,m)为概率分布。
[0064]
具体的,二维时序数据与每组数据对应的用户类型编码所形成训练样本进行定期更新,若更新获取有新的用户用电时序数据,则对新的用户用电时序数据提取瞬时频率信号与谱熵信号,形成二维时序数据,并对每组数据对应的用户类型进行编码,得到用户类型编码,并增加到原来的样本数据集中,再重新导入长短期记忆网络的分类模型训练;若没有更新新的用户用电时序数据,则训练样本直接导入长短期记忆网络的分类模型训练。
[0065]
步骤3,建立基于长短期记忆网络的分类模型,以步骤2中的二维时序数据作为长短期记忆网络的分类模型的训练集输入,以二维时序数据对应的用户类型编码作为训练集输出,展开分类模型训练以确定系数矩阵与偏执矩阵并计算出长短期记忆网络输出;
[0066]
具体的,基于长短期记忆网络的分类模型输入为瞬时频率信号与谱熵信号组成的二维特征,其具体形式如表1所示:
[0067][0068]
表1 瞬时频率信号与谱熵信号组成的二维特征
[0069]
为进一步探究瞬时频率与谱熵数据中蕴含的规律,将所求得的用户瞬时频率数据与谱熵数据求平均值,如表2所示。均值结果反映出常用户与窃电用户存在的明显差异,窃电用户用电量信号的瞬时频率与谱熵均值显著升高。相比正常用户,瞬时频率的升高能够很好地解释窃电用户的重复性行为,而谱熵值的增加表明了窃电量的不确定性。综上所述,瞬时频率与谱熵能够反映正常用户与窃电用户的用电行为活动,为长短期记忆网络提供辨识度。
[0070] 正常用户1正常用户2窃电用户1窃电用户2瞬时频率(hz)0.0000610.0000540.0000770.000076谱熵0.8780.8510.90.893
[0071]
表2 用户瞬时频率数据与谱熵数据求平均值
[0072]
具体的,根据图2所示,基于长短期记忆网络的分类模型利用遗忘门、输入门以及输出门的原理在每一单元内进行信息时序信息读取、传递与筛选并对时序数据进行模式识别。
[0073]
所述的遗忘门能够对上一单元细胞状态c(t-1)进行选择性遗忘,其具体过程为:上一单元的隐藏状态h(t-1)、本层输入的序列数据x(t)与系数矩阵相乘后经激活函数映射后得到f(t),f(t)与c(t-1)对应位置相乘以实现上一层细胞状态 c(t-1)的遗忘或保留。如下式所示:
[0074]
f(t)=σ(wfh(t-1)+ufx(t)+bf);
[0075]
式中:wf为上一单元的隐藏状态的系数矩阵、uf为本层输入序列数据的系数矩阵;bf为遗忘门的偏置;σ为sigmoid激活函数。
[0076]
所述的输入门具备双通道。第一通道中上一单元的隐藏状态h(t-1)与本层输入的序列数据x(t)、系数相乘后经激活函数映射后得到i(t);第二通道中上一单元的隐藏状态h(t-1)、本层输入的序列数据x(t)与系数相乘后经激活函数映射后得到a(t),x(t)与a(t)对应位置相乘后得到的向量用来更新遗忘门的输出。其运算如下式所示:
[0077]
i(t)=σ(wih(t-1)+uix(t)+bi);
[0078]
a(t)=tanh(wah(t-1)+uax(t)+ba);
[0079]
式中:wi为上一单元的隐藏状态的系数矩阵、ui为本层输入序列数据的系数矩阵;bi为第一通道的偏置;σ为sigmoid激活函数;wa为上一单元的隐藏状态的系数矩阵、ua为本层输入序列数据的系数矩阵;ba为第二通道的偏置; tanh为反正切激活函数。
[0080]
所述的细胞状态c(t)的更新过程为遗忘门结果与输入门结果的加法运算:
[0081]
c(t)=c(t-1)

f(t)+i(t)

a(t)
[0082]
式中:

为hadamard积运算;f(t)为遗忘门输出结果;i(t)为输入门第一通道的输出结果;a(t)为输入门第二通道的输出结果;c(t-1)为上一单元的细胞状态。
[0083]
所述的输出门由两部分组成,第一部分中上一单元的隐藏状态h(t-1)、本层输入的序列数据x(t)与系数相乘后经激活函数映射后得到o(t);第二部分为细胞状态c(t)经激活函数映射后得到结果。h(t)由o(t)与第二部分映射结果对应位置相乘得到:
[0084]
o(t)=σ(woh(t-1)+uox(t)+bo)
[0085]
h(t)=o(t)

tanh(c(t))
[0086]
式中:wo为上一单元的隐藏状态的系数矩阵、uo本层输入序列数据的系数矩阵,bo为输出门的偏置;h(t-1)为上一单元的隐藏状态;x(t)为本层输入的序列数据;tanh为反正切激活函数;c(t)为本层细胞状态;h(t)为本单元的隐藏状态;o(t)为输出门第一部分输出。
[0087]
具体的,长短期记忆网络输出的计算公式如下:
[0088][0089]
其中:为t时刻的长短期记忆网络的输出,wy为输出更新的系数矩阵, by为输出更新的偏置矩阵;h(t)为本单元的隐藏状态;σ为sigmoid激活函数。
[0090]
所述长短期记忆网络设定如表3所示:
[0091][0092]
表3 长短期记忆网络设定
[0093]
所述的系数矩阵与偏置矩阵的更新方式为:在模型训练过程中,采用反向传播算法通过数据训练更新并最终确定长短期记忆网络中系数矩阵与偏置矩阵。反向传播算法引入交叉熵损失函数:
[0094]
[0095][0096]
式中:yi为第i个预测输出分量,li为i个预测输出分量的交叉熵损失,l为损失函数。
[0097]
引入定义:
[0098][0099][0100]
这里以wf为例给出结果,由推导可知其梯度为:
[0101]
式中:δc(t) 为损失函数对细胞状态的偏导数;

为hadamard积运算;c(t-1)为上一层的细胞状态;f(t)为遗忘门输出;h(t-1)
t
为上一单元隐藏状态的转置。
[0102]
步骤4,取得待识别的用户的用电量时序数据,并在待识别的用户的用电量时序数据中提取瞬时频率信号与谱熵信号,形成二维时序数据,将二维时序数据输入至步骤3中的长短期记忆网络的分类模型中,长短期记忆网络的分类模型经计算后输出用户类型编码,通过用户类型编码识别窃电行为。
[0103]
其中,当长短期记忆网络的分类模型经计算后输出用户类型编码为0时,为正常用电用户;当长短期记忆网络的分类模型经计算后输出用户类型编码为 1时,为窃电用户。
[0104]
综上所述,本发明提供了一种基于时频特征与长短期记忆网络的窃电行为识别方法,先采集已知的正常用户与窃电用户的用电量时序数据,并将正常用户与窃电用户的用电量时序数据中提取瞬时频率信号与谱熵信号,形成二维时序数据,并对每组数据对应的用户类型进行编码,通过建立基于长短期记忆网络的分类模型,以二维时序数据作为长短期记忆网络的分类模型的训练集输入,以二维时序数据对应的用户类型编码作为训练集输出,形成分类模型,对待识别的用户的用电量时序数据提取瞬时频率信号与谱熵信号得到二维时序数据,直接输入至分类模型,通过输出的用户类型编码对窃电行为进行识别,提高了对窃电行为识别的效率与准确性。
[0105]
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1