一种基于深度CNN-HMM的非侵入式负荷辨识方法

文档序号:27200426发布日期:2021-11-03 13:33阅读:288来源:国知局
一种基于深度CNN-HMM的非侵入式负荷辨识方法
一种基于深度cnn

hmm的非侵入式负荷辨识方法
技术领域
1.本发明属于非侵入式负荷辨识技术领域,具体涉及一种基于深度cnn

hmm的非侵入式负荷辨识方法。


背景技术:

2.先进且有效的需求侧管理技术能够为智能电网发展提供安全性和可靠性的保障,为了提高用户终端负荷的能源利用效率,减少电量消耗和电力需求,促进用户参与需求侧管理或实现远程优化控制,电力负荷的在线监测是必不可少的。电力负荷的监测方法主要有侵入式负荷监测和非侵入式负荷监测两种,由于传统的侵入式负荷监测存在投入成本高、维护难度大、居民接受程度低等问题,因此硬件结构简单、便于安装和维护的非侵入式负荷监测具有明显的优势。
3.负荷辨识是负荷监测的核心内容,负荷辨识的方法可分为三大类,即优化方法、监督学习方法和无监督学习方法。优化方法是负荷辨识最直接的方法,将提取的负荷特征数据与模板库中的特征数据进行对比,采用优化算法最小化误差,找到匹配度最高的电气设备状态组合,常用的优化算法包括动态时间弯曲(dtw)算法、遗传算法、粒子群优化算法等,但优化方法进行负荷辨识普遍需要根据历史信息提前建立负荷特征模板库。监督学习方法需要已知电气设备的特定运行信息,进行模型的初始训练,且算法的性能很大程度取决于模型学习的数据标签,基本上是将负荷辨识问题转换为分类学习问题进行解决,主要方法有贝叶斯分类器、支持向量机(svm)和人工神经网络(ann)。无监督学习方法可以在没有任何先验信息的情况下运行,相较于监督学习方法减少了训练步骤的干扰性,主要算法有隐马尔可夫模型(hmm)及其扩展,如因子隐马尔可夫模型(fhmm)和隐式半马尔可夫模型(hsmm)均被应用到负荷辨识中。卷积神经网络(cnn)具有很强的特征提取能力,常被应用于负荷辨识,但由于cnn本身不具有时序建模能力,所以其对时序数据的感知范围仅能停留在所选取的时间窗长度之内,导致cnn的辨识结果中经常存在非连续性问题,如图1所示。


技术实现要素:

4.针对cnn算法辨识结果中存在的非连续性问题,本发明提出一种基于深度cnn

hmm的非侵入式负荷辨识方法。首先通过深度cnn提取负荷的多维特征,进行负荷的初辨识;然后根据负荷状态的时间依赖性,利用hmm模型解决负荷的二分类状态再辨识,减少cnn辨识结果中出现的状态断点现象,提高辨识准确率。
5.本发明通过以下技术手段解决上述问题:
6.一种基于深度cnn

hmm的非侵入式负荷辨识方法,包括以下步骤:
7.步骤1:采用互信息算法对总负荷数据进行特征选择,削弱无关特征和冗余特征对负荷辨识模型精度的影响,并进行差分处理以强化特征的表达能力;
8.步骤2:根据待辨识负荷的电流有效值的大小确定其运行状态,生成设备的标签数据;
9.步骤3:将步骤1所得的负荷特征数据与步骤2所得的标签数据合成模型的训练数据集,为了解决深度网络中存在的梯度消失和退化问题,选择残差神经网络resnet

50作为深度卷积神经网络(cnn)的基础架构,并训练深度cnn模型;
10.步骤4:将深度cnn网络的初辨识结果作为观测序列,训练隐马尔可夫模型(hmm)的参数,从而优化cnn算法辨识结果中的非连续性问题;
11.步骤5:得到完整的深度cnn

hmm非侵入式负荷辨识模型,实现对工商业电力负荷的有效辨识。
12.进一步地,步骤1中利用互信息算法进行特征选择的方法如下:
13.互信息计算相关性的公式如下:
[0014][0015]
其中,i(x,y)是随机变量x和y的互信息值大小,随机变量x={x1,x2,

,x
t
}表示总负荷数据中任意一种特征的差值时间序列,随机变量y={y1,y2,

,y
t
}表示待辨识负荷的运行状态序列,p(x)和p(y)分别是随机变量x和y的边缘概率密度函数,p(x,y)则是x和y的联合概率密度函数。互信息值越大,表明随机变量之间的相关性越强。
[0016]
互信息进行特征选择的具体步骤包括:
[0017]
(1)计算每个负荷特征与待辨识负荷运行状态之间的互信息值;
[0018]
(2)按照互信息的大小对所有特征按从大到小进行排序;
[0019]
(3)选择前n个互信息最大的特征,构成负荷辨识的初始特征集合{f1,f2,

,f
n
};
[0020]
(4)计算f
i
与f
j
,(i<j)之间的互信息大小,若f
i
与某个特征f
j
的互信息值大于阈值μ
th
,则将f
j
移除特征子集,并按照顺序添加新的特征;
[0021]
(5)重新计算新的特征子集中特征之间的互信息值,重复筛选直到两两特征之间的互信息值皆小于阈值,并构建新的特征集合。
[0022]
进一步地,步骤1中采集的任一负荷特征数据,可用时间序列r={r0,r1,r2…
,r
t
}表示,其中t是负荷数据的时间长度,进行差分处理可得到负荷的差值特征序列x={x1,x2,

,x
t
},其中x
t
=r
t

r
t
‑1(1≤t≤t)。给定时间窗口长度w,负荷特征个数n,可生成模型的输入负荷数据input={η1,h2,

,h
l
},其中},其中代表第j种负荷特征的第i个窗口的差值时间序列,其中1≤i≤t

w+1,1≤j≤n。
[0023]
进一步地,步骤2中采集的待辨识负荷数据,以其电流有效值irms的大小为标准,生成设备的标签状态集target={y1,y2,

,y
l
},其中y
i
表示第i个时间窗口内的i+w/2时刻点的负荷的运行状态,
[0024]
进一步地,步骤4中hmm模型的参数λ={u,v,a,b,π}定义如下:
[0025]
隐含状态集合u={u1,u2,

,u
n
},其中n为隐含状态数目,系统在t时刻的隐含状态q
t
∈u;
[0026]
观测状态集合v={v1,v2,

,v
m
},其中m是每一个隐含状态可能输出的不同的观测值的数目,系统在t时刻的观测状态s
t
∈v;
[0027]
状态转移概率矩阵a={a
ij
},a
ij
表示在t时刻状态为u
i
的条件下,在t+1时刻状态为u
j
的概率,a
ij
=p(q
t+1
=u
j
|q
t
=u
i
),其中1≤i,j≤n,
[0028]
观测状态转移概率矩阵b={b
i
(k)},b
i
(k)表示在t时刻隐含状态为u
i
的条件下,观测状态为v
k
的概率,b
i
(k)=p(s
t
=v
k
|q
t
=u
i
),其中1≤i≤n,1≤k≤m,
[0029]
初始状态概率矩阵π={π
i
},是t=1时刻初始状态的概率分布,π
i
=p(q1=u
i
),其中1≤i≤n,
[0030]
与现有技术相比,本发明的有益效果至少包括:
[0031]
本发明公开了一种基于深度cnn

hmm的非侵入式负荷辨识方法,在获取电力系统的总负荷数据后,首先采用互信息算法进行特征选择,去除负荷特征数据中的无关特征和冗余特征,提高负荷辨识的准确率,另一方面,特征选择在很大程度上降低数据维度,减少了模型的运算量;然后采用残差神经网络构建深度cnn网络架构,解决深度网络训练过程中出现的梯度消失和退化问题;进一步地,采用hmm模型优化cnn辨识结果中的非连续性问题,深度cnn网络和hmm模型的结合,完成了对负荷深层隐含特征的提取和辨识结果非连续性的优化,能够有效辨识工商业用电负荷,具有较好的准确率和辨识精度。
附图说明
[0032]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]
图1是cnn辨识结果中存在的非连续性问题示意图。
[0034]
图2是深度cnn

hmm模型的算法流程图。
[0035]
图3是时间窗口长度和特征数目对负荷辨识准确率的影响。
[0036]
图4是电梯负荷的有功功率曲线图。
[0037]
图5是resnet

50网络训练过程中的损失函数收敛曲线图。
[0038]
图6是对比算法的负荷辨识结果。
具体实施方式
[0039]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合附图和具体的实施例对本发明的技术方案进行详细说明。需要指出的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0040]
本发明提供一种基于深度cnn

hmm的非侵入式负荷辨识方法,该负荷辨识方法采用互信息进行特征选择,既可以降低数据维度,减少运算量,又能去除负荷特征数据中的无关特征和冗余特征,提高负荷辨识的准确率;一方面,基于深度卷积神经网络(cnn)的强特
征提取能力,提取负荷的隐含特征,拟合总负荷数据与负荷状态之间的非线性映射关系,另一方面,针对深度cnn辨识结果中存在的状态断点问题,考虑隐马尔可夫模型(hmm)对负荷状态的转移概率描述,从而优化深度cnn辨识结果的非连续性,实现对工商业负荷的高精度辨识。
[0041]
按照本发明发明内容完整方法实施的实施例情况如下:
[0042]
图2为本发明实施例所提出的基于深度cnn

hmm的非侵入式负荷辨识方法的流程图,该辨识方法包括以下步骤:
[0043]
步骤1:采用互信息算法对总负荷数据进行特征选择,削弱无关特征和冗余特征对负荷辨识模型精度的影响,并进行差分处理以强化特征的表达能力。
[0044]
互信息的计算公式如下:
[0045][0046]
其中,i(x,y)是随机变量x和y的互信息值大小,随机变量x={x1,x2,

,x
t
}表示总负荷数据中任意一种特征的差值时间序列,随机变量y={y1,y2,

,y
t
}表示待辨识负荷的运行状态序列,p(x)和p(y)分别是随机变量x和y的边缘概率密度函数,p(x,y)则是x和y的联合概率密度函数。互信息值越大,表明随机变量之间的相关性越强。
[0047]
采用互信息算法进行特征选择的具体步骤包括:
[0048]
(1)计算每个负荷特征与待辨识负荷运行状态之间的互信息值;
[0049]
(2)按照互信息的大小对所有特征按从大到小进行排序;
[0050]
(3)选择前n个互信息最大的特征,构成负荷辨识的初始特征集合{f1,f2,

,f
n
};
[0051]
(4)计算f
i
与f
j
,(i<j)之间的互信息大小,若f
i
与某个特征f
j
的互信息值大于阈值μ
th
,则将f
j
移除特征子集,并按照顺序添加新的特征;
[0052]
(5)重新计算新的特征子集中特征之间的互信息值,重复筛选直到两两特征之间的互信息值皆小于阈值,并构建新的特征集合。
[0053]
本实施例中,采用互信息算法进行特征选择的目的之一是降低数据维度,减少模型的运算量。表1记录了特征选择的数目与resnet

50网络每轮训练时间之间的关系,模型的训练时间会随着特征数目的减少而缩短。
[0054]
表1 resnet

50网络每轮的训练时间
[0055]
特征数目3040506070训练时间2

57
″3′
12
″3′
33
″3′
50
″4′
24

[0056]
本实施例中,采用互信息算法进行特征选择的目的之二是剔除无关特征和冗余特征,提高负荷辨识的准确率。图3是时间窗口长度和负荷特征数目与模型辨识准确率的关系,最终选取的参数取值分别为:时间窗口长度w=60,负荷特征个数n=40,此时负荷辨识模型能够获得最佳的辨识效果。
[0057]
本实施例中,以差分方式处理模型输入数据的目的是增强负荷特征的表达能力。总负荷数据中的任一特征数据,可用时间序列r={r0,r1,r2…
,r
t
}表示,其中t是负荷数据的时间长度,进行差分处理可得到负荷的差值特征序列x={x1,x2,

,x
t
},其中x
t
=r
t

r
t
‑1(1≤t≤t)。给定时间窗口长度w,负荷特征个数n,可生成模型的输入负荷数据input=
{η1,h2,

,h
l
},其中},其中代表第j种负荷特征的第i个窗口的差值时间序列,其中1≤i≤t

w+1,1≤j≤n。
[0058]
步骤2:根据待辨识负荷的电流有效值的大小确定其运行状态,生成设备的标签数据。
[0059]
本实施例中,采用电梯负荷作为待辨识负荷,图4是电梯负荷的有功功率曲线图。以电梯负荷的电流有效值irms的大小为标准,生成设备的标签状态集target={y1,y2,

,y
l
},其中y
i
表示第i个时间窗口内的i+w/2时刻点的负荷的运行状态,
[0060]
步骤3:将步骤1所得的负荷特征数据与步骤2所得的标签数据合成模型的训练数据集,为了解决深度网络中存在的梯度消失和退化问题,选择残差神经网络resnet

50作为深度卷积神经网络(cnn)的基础架构,并训练深度cnn模型,使其学习拟合特征数据与标签之间的非线性映射关系。
[0061]
本实施例中,采用resnet

50网络的目的是缓解深度网络训练过程中存在的梯度消失和退化问题,提高负荷辨识算法的准确率。将训练数据集中的80%用于模型训练,其余20%用于模型评估,从而选择出效果最佳的模型。训练过程中,采用adam优化器加快模型的收敛速度,初始学习率设置为0.001,用交叉熵函数作为损失函数计算误差。图5是损失函数值随迭代次数的收敛曲线图。
[0062]
步骤4:将深度cnn网络的初辨识结果作为观测序列,训练隐马尔可夫模型(hmm)的参数,从而优化cnn算法辨识结果中的非连续性问题。
[0063]
hmm模型的五元组参数λ={u,v,a,b,π}定义如下:
[0064]
隐含状态集合u={u1,u2,

,u
n
},其中n为隐含状态数目,系统在t时刻的隐含状态q
t
∈u;对于电梯负荷,其隐含状态数目n=2,只有工作状态和非工作状态,即u={0,1}。
[0065]
观测状态集合v={v1,v2,

,v
m
},其中m是每一个隐含状态可能输出的不同的观测值的数目,系统在t时刻的观测状态s
t
∈v;对于电梯负荷,观测状态数目m=2,v={0,1}。
[0066]
状态转移概率矩阵a={a
ij
},a
ij
表示在t时刻状态为u
i
的条件下,在t+1时刻状态为u
j
的概率,a
ij
=p(q
t+1
=u
j
|q
t
=u
i
),其中1≤i,j≤n,
[0067]
观测状态转移概率矩阵b={b
i
(k)},b
i
(k)表示在t时刻隐含状态为u
i
的条件下,观测状态为v
k
的概率,b
i
(k)=p(s
t
=v
k
|q
t
=u
i
),其中1≤i≤n,1≤k≤m,
[0068]
初始状态概率矩阵π={π
i
},是t=1时刻初始状态的概率分布,π
i
=p(q1=u
i
),其中1≤i≤n,
[0069]
本实施例中,引入hmm模型的目的是提高负荷辨识的准确率,所述hmm算法的具体流程如下:
[0070]
(1)初始化hmm的模型参数λ0'={a,b,π};
[0071]
(2)根据深度cnn的初辨识结果生成观测序列s={s1,s2,

,s
l
};
[0072]
(3)迭代更新参数λ',直到观测序列出现的概率p(s|λ')达最大值;
[0073]
(4)通过最优参数λ'和观测序列s,采用维特比算法求使得可能性p(q|s,λ')最大的状态序列q={q1,q2,

,q
l
},即为电梯负荷的最终辨识结果。
[0074]
步骤5:得到完整的深度cnn

hmm非侵入式负荷辨识模型,实现对工商业电力负荷的有效辨识。
[0075]
本实施例中,将几种常用的非侵入式负荷辨识算法作为对比算法同样进行负荷辨识,包括knn算法、随机森林(rf)、hmm模型、长短期记忆网络(lstm)、cnn以及cnn

lstm模型。表2是负荷辨识的结果,包括负荷辨识的准确率acc、精确度p、召回率r、调和平均评价指标f
score
四种评价指标的值,图6为几种算法在相同一段时间内的辨识结果。表2和图6表明,本发明提出的方法在具有较高精度的同时,有效减少了cnn算法识别误差导致的辨识结果的非连续性。虽然在精确度p和召回率r上,cnn

hmm算法并非是最优的,但是在综合反映辨识结果可靠程度的f
score
上取得了0.9879的最高值,并且相较于其它对比算法,具有最高的辨识准确率。
[0076]
表2对比算法负荷辨识结果
[0077]
算法p/%r/%f
score
acc/%knn93.4191.600.924986.33rf91.3598.360.947390.75hmm93.7393.760.937588.23lstm96.9896.880.969394.00cnn100.0095.430.976695.60cnn

lstm96.9499.220.980696.50cnn

hmm98.5099.070.987997.90
[0078]
本发明采用互信息算法进行特征选择,去除负荷特征数据中的无关特征和冗余特征,提高了负荷辨识的准确率,同时在很大程度上降低数据维度,减少了模型的运算量。该方法采用残差神经网络解决深度网络训练过程中出现的梯度消失和退化问题,并采用hmm模型优化cnn辨识结果中的非连续性问题,融合了深度cnn网络对负荷深层隐含特征的提取能力和hmm模型对辨识结果非连续性的优化能力,能够有效辨识工商业电力负荷,具有较好的准确率和辨识精度。
[0079]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1