一种智能电能表寿命预测方法

文档序号:31366376发布日期:2022-08-31 15:51阅读:309来源:国知局
一种智能电能表寿命预测方法

1.本发明属于人工智能的数据挖掘领域,具体的是一种基于寿命特征生成和生存风险损失的mk-mmd域自适应智能电能表寿命预测方法。


背景技术:

2.智能电能表承载着保证用户用电安全、支撑智能电网建设、助力资产管理的重要功能。智能电能表造价比传统计量电能表更高,具有安装数量大、市场前景好、技术复杂的特点。智能电能表寿命预测可以尽可能延续智能电能表使用寿命,实现智能电能表最大价值,如何精准进行智能电能表寿命预测是智能电能表最大化价值的首要问题之一。


技术实现要素:

3.本发明提出的是一种智能电能表寿命预测方法,其目的旨在通过生成具有丰富寿命信息的寿命特征,通过生存风险损失引导模型对预测寿命结果的生存风险进行计算,并加入了域自适应方法缩小域分布差异,实现更加精准的智能电能表寿命预测。
4.本发明通过如下技术手段加以实现:
5.一种智能电能表寿命预测方法,包括如下步骤:
6.步骤1,收集智能电能表数据并标注,建立数据集;
7.步骤2,寿命特征生成;
8.步骤3,生存风险损失;
9.步骤4,基于mk-mmd实现域自适应方法;
10.步骤5,构建基于寿命特征生成和生存风险损失的mk-mmd域自适应方法的网络模型。
11.所述步骤1具体包括以下步骤:
12.1-1、从用电信息采集系统中提取智能电能表相关数据。
13.1-2、使用数据处理的相关方法进行数据的清洗、处理;
14.1-3、对电压异常事件表进行特征提取;
15.1-4、合并表项和生成标签信息;
16.所述步骤1-1具体过程包括如下:从智能电能表资产信息表d_meter、电压异常事件表erec_10中提取具有相同标识的智能电能表记录:
17.所述步骤1-2具体过程包括如下:分别对步骤1-1提取的样本数据进行规则清洗、空缺值处理;
18.所述步骤1-3具体过程包括如下:选择一个多表共有智能电能表标识符meter_id,从经过处理后的erec_10表中抽取此智能电能表的电压异常事件记录,对一段时间间隔t内异常事件情况进行分类统计,作为电压异常事件特征提取结果;
19.所述步骤1-4具体过程包括如下:通过智能电能表唯一标识符meter_id合并电压异常事件特征和智能电能表资产信息表特征,然后生成样本的剩余寿命标签d
m-rm,dm是智
能电能表第m个样本的报废时间,此时间记录于智能电能表资产信息表中,rm是对应样本电压异常事件统计记录结束时间。
20.所述步骤2具体包括以下步骤:
21.步骤2-1、将原样本按特征值分成不同子集;
22.步骤2-2、针对不同子集,使用极大似然估计对样本子集求解威布尔分布参数;
23.步骤2-3、基于求得的威布尔分布参数生成该批次寿命特征。
24.所述步骤2-1中,所述的样本中的原始特征值都是离散值,按照特征值划分为不同的子集;
25.所述步骤2-2具体过程包括如下:根据样本子集和极大似然估计原理得到似然函数,此似然函数是关于威布尔分布参数的函数。接着对似然函数取对数和求偏导得到了一组关于威布尔分布参数的超越方程。因为超越方程很难求出形式解。本发明使用非线性方程组数值解法的newton-raphson算法求解分布参数η和β;
26.步骤2-3中所述的寿命特征为威布尔分布下的平均寿命,公式表述为ηγ(1+1/β)。
27.所述步骤3包括以下步骤:
28.步骤3-1、使用极大似然估计求出智能电能表源域样本(训练集)总体寿命的威布尔分布参数;
29.步骤3-2、确定生存风险损失的具体形式;
30.所述步骤3-1具体过程包括如下:使用步骤2所述的极大似然估计法求解智能电能表源域样本寿命服从的威布尔分布参数η和β。
31.所述步骤3-2中具体过程包括如下:利用步骤3-1求解的威布尔分布参数确定样本服从的威布尔分布生存风险函数形式:
[0032][0033]
式中yc是预测寿命;
[0034]
进而就可以确定适用于智能电能表寿命预测的生存风险损失具体形式;
[0035][0036]
式中yc是预测寿命,y是真实寿命,jc(yc,y)是预测损失。
[0037]
所述步骤4中首先使用特征提取网络提取源域样本和目标域样本的源域特征和目标域特征,而后再基于mk-mmd计算域分布差异;
[0038]
所述步骤5具体过程为:首先,源域和目标域数据经过寿命特征生成模块生成寿命特征,再将生成的寿命特征和原始特征合并共同送入特征提取网络提取特征,然后将提取的特征送入到域自适应模块中,并对源域和目标域特征使用mk-mmd方法计算域差异损失,接着将源域特征送入预测模块对智能电能表寿命进行预测,对预测值进行常规预测损失计算,并将预测值送入到生存风险损失模块中计算出生存风险损失,将三种损失叠加作为总的损失指导模型参数更新,进行更加精准的寿命预测。
[0039]
本发明与现有技术相比,具有以下有益效果:
[0040]
1)使用寿命特征生成方法,基于统计学威布尔分布生成了包含丰富寿命信息的寿命特征,增强智能电能表特征与其寿命的关联关系,提升检测精度。
[0041]
2)提出生存风险损失,设计了生存风险损失来优化损失函数,引导模型通过对预测寿命结果进行风险计算,使得损失函数符合实际应用场景,更好地指导模型训练。
附图说明
[0042]
附图1是本发明方法中一种基于寿命特征生成和生存风险损失的mk-mmd域自适应智能电能表寿命预测方法网络结构图。
[0043]
附图2是本发明方法中基于威布尔分布的寿命特征生成算法流程。
[0044]
附图3是本发明方法中基于生存风险损失和寿命特征生成的mk-mmd域自适应算法流程。
具体实施方式
[0045]
下面通过具体的例子对本发明进行详细说明:
[0046]
本发明涉及一种基于寿命特征生成和生存风险损失的mk-mmd域自适应智能电能表寿命预测方法,该方法包括如下步骤:
[0047]
步骤1,收集智能电能表数据并标注,建立数据集;
[0048]
步骤2,寿命特征生成;
[0049]
步骤3,生存风险损失;
[0050]
步骤4,基于mk-mmd实现域自适应方法;
[0051]
步骤5,构建基于寿命特征生成和生存风险损失的mk-mmd域自适应方法的网络模型。
[0052]
所述步骤1收集智能电能表数据并标注,建立数据集,具体包括以下步骤:
[0053]
1-1、从用电信息采集系统江苏省部分数据(包括智能电能表资产信息表(d_meter)、电压异常事件表(erec_10))中提取智能电能表相关数据。
[0054]
1-2、使用数据处理的相关方法进行数据的清洗、处理;
[0055]
1-3、对电压异常事件表进行特征提取。
[0056]
1-4、合并表项和生成标签信息。
[0057]
所述步骤1-1从用电信息采集系统江苏省部分数据(包括智能电能表资产信息表(d_meter)、电压异常事件表(erec_10))中提取智能电能表相关数据的具体过程如下:
[0058]
1)确定多表中共同具有的智能电能表样本,所有表中智能电能表样本都有唯一标识字段meter_id,通过该字段确定多张表中共同具有的智能电能表标识符集合:
[0059]
2)根据前面确定的共有智能电能表标识符集合,分别从不同表中提取相关数据:
[0060]
所述步骤1-2使用数据处理的相关方法进行数据的清洗、处理;的具体过程如下:对提取的数据进行规则清洗、空缺值处理。
[0061]
所述步骤1-3对电压异常事件表进行特征提取的具体过程如下:
[0062]
1)选定要进行特征提取的电压表唯一标识符meter_id;
[0063]
2)从电压异常事件表中抽取此meter_id的异常事件记录:
[0064]
3)异常事件记录起始时间点t,选取一个时间间隔t,统计各种异常出现频次作为电压表电压异常事件表的特征提取结果:
[0065]
假设现在要对一个智能电能表进行其电压异常事件的特征提取。首先,确定要进
行特征提取的智能电能表的标识符meter_id;然后,从电压异常事件表中提取所有meter_id等于该值的电压异常事件记录;接着,确定一个异常事件记录起始时间点t,取一个时间间隔t。假设从时间t到时间t+t共有k个记录,这些记录组成y,记作:
[0066]
y={y1,y2,...,yk}(3)
[0067]
异常状况记录标识exception_sign是三位布尔型变量,全零是非法状态,所以共有七种不同的异常情况记录,将异常事件记作如下:
[0068]fi
(x=bi)=ai(4)
[0069]
式中,bi表示第i种异常情况,ai表示该智能电能表第i中情况的记录数量,同时要满足:
[0070][0071]
将每种异常情况的描述作为一个特征,智能电能表就得到了新的记录异常情况的七个特征列,其值是每种异常情况对应的记录数量。经过上面操作就完成了对智能电能表电压异常事件的特征提取。
[0072]
所述步骤1-4合并表项和生成标签信息的具体过程如下:
[0073]
1)使用智能电能表的标识符将电压表资产信息表和电压表电压异常事件表提取的特征合并成样本特征:
[0074]
2)生成样本标签,样本标签生成使用样本记录中的报废时间(特征标签是descard_date)减去电压异常事件统计的最后截止时间,公式如下:
[0075]
labelm=d
m-rm(6)
[0076]dm
是智能电能表第m个样本的报废时间,记录于智能电能表资产信息表中,rm是电压异常事件统计记录结束时间,也就是上面t+t。
[0077]
所述步骤2寿命特征生成具体包括以下步骤:
[0078]
步骤2-1、将原样本分成不同子集;
[0079]
步骤2-2、针对不同子集,使用极大似然估计对样本子集求解威布尔分布参数;
[0080]
步骤2-3、基于求得的分布参数生成该批次寿命特征。
[0081]
所述步骤2-1将原样本分成不同子集的具体过程如下:
[0082]
假设智能电能表样本总体为x={f1,f2,...,fn},其中fn是指样本的第n个特征,此特征有m个值,依据值的不同将样本集划分为不同批次,可以得到m个批次。比如当前样本集合中,hard_ver是样本的一个硬件特征,该特征共有3个特征值,对该特征本发明就将每个特征值看作一个批次,共可以得到3个批次,分别对批次进行威布尔参数的求解,然后在此基础上计算其相应的寿命特征。
[0083]
批次划分完毕之后,可以将此批次的数据记为:
[0084][0085]
式中,表示第i个特征第j个特征值,是表示总体样本中第i个特征值等于的样本的集合,显然它是总体样本的一个子集。
[0086]
假设是一个具有k个样本的集合,将其对应的寿命标签数据提取出来,构成该批
次进行威布尔参数求解的寿命分布集合,将集合视为y,记为:
[0087]
y={y1,y2,...,yk}(8)
[0088]
yk是智能电能表在此批次中第k个样本对应的寿命标签数据。对该批次样本按照升序对寿命标签数据进行排序得到有序集合t,记为:
[0089]
t={t1,t2,...,tk}(9)
[0090]
所述步骤2-2针对不同子集,使用极大似然估计对样本子集求解威布尔分布参数,具体包括以下步骤:
[0091]
根据有序集合t,确定似然函数:
[0092][0093]
对此似然函数取对数:
[0094][0095]
对上式两边求β和η偏导,并令两边都等于零:
[0096][0097]
解出上式就可以得到β和η的估计值和对上面方程进行求解要采用数值解法,因为此方程是超越方程很难求出形式解。在本章中使用非线性方程组的newton-raphson算法。newton-raphson算法求解过程如下:
[0098]
假设有一组非线性方程组:
[0099][0100]
在该非线性方程组中至少存在一个是关于x的非线性函数。x=(x1,x2,...,xn)
t
是方程组的解,x是实数。可以将方程组记为
[0101]
f(x)=(f1(x),f2(x),...,fn(x))
t
=0(14)
[0102]
假设x
*
是方程组的解,x
(a)
表示第a次迭代之。将fi在x
(a)
出进行一阶泰勒展开,可以近似地看作每个分量函数值为0,fi(x
(a)
)=0,则有:
[0103][0104]
整体简化记为:
[0105][0106]
详细可以写成如下:
[0107][0108]
进而就可以求得x
*
的近似解,作为下一次的迭代值。
[0109]
x
(a+1)
=x
(a)-[f'(xa)]-1
f(xa)(18)
[0110]
根据上面的newton-raphson迭代算法方法,可以得到关于威布尔分布参数的非线性方程组:
[0111][0112]
于是就得到了分布参数的jacobi矩阵:
[0113][0114]
矩阵中各项如下:
[0115][0116]
接下来就可以按照newton-raphson迭代算法进行多次迭代后就可以求解出威布尔分布的相关参数。
[0117]
所述步骤2-3基于求得的分布参数生成该批次寿命特征,具体包括以下步骤:
[0118]
采用上面的极大似然估计方法上面求解威布尔分布参数,得到了威布尔分布参数η和β。其中η是尺度参数,β是形状参数。威布尔分布下的平均寿命反映了批次每个个体样本理论上具有的寿命,也是本章生成的寿命特征。记为:
[0119][0120]
所述步骤3生存风险损失具体包括以下步骤:
[0121]
步骤3-1、使用极大似然估计求出智能电能表源域样本(训练集)总体寿命的威布尔分布参数;
[0122]
步骤3-2、确定生存风险损失的具体形式;
[0123]
所述步骤3-1使用极大似然估计求出智能电能表源域样本(训练集)总体寿命的威布尔分布参数,具体包括以下步骤:
[0124]
1)取出源域智能电能表样本集的寿命标签作为求解威布尔分布参数的集合;
[0125]
2)使用步骤2的极大似然估计方法求解对应的威布尔分布:η和β;
[0126]
所述步骤3-2确定生存风险损失的具体形式,具体包括以下步骤:
[0127]
1)根据求出的威布尔分布参数确定生存风险函数;
[0128][0129]
2)写出融入了生存风险函数的生存风险损失函数;
[0130][0131]
所述步骤4基于mk-mmd实现域自适应方法,具体包括以下步骤:
[0132]
步骤4-1、提取源域样本(训练集)和目标域样本(测试集)的源域特征和目标域特征;
[0133]
步骤4-2、基于mk-mmd计算域分布差异;
[0134]
所述步骤4-1提取源域样本(训练集)和目标域样本(测试集)的源域特征和目标域特征,具体包括以下步骤:
[0135]
1)使用特征提取网络提取源域智能电能表样本的特征构成源域特征;
[0136]
2)使用特征提取网络提取目标域智能电能表样本的特征构成目标域特征;
[0137]
假设特征提取网络是一个k层网络,第k+1层是输出层,由此添加了域自适应层的网络就变成了k+2层。前k层依然是特征提取网络,k+1层为域自适应层,k+2层是输出层。提取特征具体表述如下:
[0138][0139]
其中,xs是源域样本集,x
t
是目标域样本集,f
k+1
(xs)表示源域样本在域自适应层的输出,f
k+1
(x
t
)表示目标域样本在域自适应层的输出,ds是源域特征,d
t
是目标域特征。
[0140]
本发明所述步骤4-2基于mk-mmd计算域分布差异,具体包括以下步骤:使用多个核函数将特征映射到不同的希尔伯特核空间,在多个空间里分别计算域差异,通过平均加权得到了基于多核最大平均差异(mk-mmd)的域差异。
[0141]
具体是,最大平均差异(mmd)是一种广泛使用的非参数方法,用于衡量源域和目标
域之间的分布差异。当源域和目标域的mmd足够小的,则认为它们是同分布的。mmd的经验估计值可表示如下:
[0142][0143]
φ(
·
)是关于k(ds,d
t
)=《φ(ds),φ(d
t
)》的特征映射。它可以将源域和目标域的特征表示映射到再生核希尔伯特空间(reproducing kernel hilbert space,rkhs),在这里可以计算两个域之间的分布差异。源域ds∈ds和目标域d
t
∈d
t
。k(ds,d
t
)是核函数,可以通过核函数求解mmd距离,不需要预先知道映射和特征空间。
[0144]
多核最大平均差异(mk-mmd)是在mmd的基础上发展起来的,它由使用单一核的mmd改为多核同时使用。由于单一核函数不可避免固定化选择了希尔伯特空间的一组基函数,导致mmd应用效果直接与核函数对于本问题的适用性紧密相连,易受到核函数敏感性影响产生不利结果。而mk-mmd使用不同核函数将特征映射到不同再生希尔伯特核空间中,优化mmd对核函数高敏感性问题。因此,本发明使用mk-mmd方法度量域分布差异,它是多个核函数的凸组合,相比于mmd,它统计数据的高阶统计量,降低mmd选择单一非最优核对模型性能的不利影响。
[0145]
类似地,mk-mmd的经验估计值可表示如下:
[0146][0147]
此公式与mmd相似。只是φk(
·
)是关于kk(ds,d
t
)=《φk(ds),φk(d
t
)》的特征映射。kk(ds,d
t
)定义为m个核的凸组合,从而优化内核选择,最终的核函数如下:
[0148][0149]ki
是mk-mmd的第i个内核,αi是内核ki的权重。所有内核的权重加起来应该是1。
[0150]
要最小化源域和目标域之间的距离的方法是最大程度地减小损失函数:
[0151][0152]
其中,jc(yc,y)表示预测损失,y为实际值,yc是预测值。表示源域xs和目标域x
t
之间的分布差异,λ为超参数。
[0153]
所述步骤5构建基于寿命特征生成和生存风险损失的mk-mmd域自适应方法的网络模型,具体包括以下步骤:首先,源域和目标域数据经过寿命特征生成模块生成寿命特征,再将生成的寿命特征和原始特征合并共同送入特征提取网络提取特征,然后将提取的特征送入到域自适应模块中,并对源域和目标域特征使用mk-mmd方法计算域差异损失,接着将源域特征送入预测模块对智能电能表寿命进行预测,对预测值进行常规预测损失计算,并将预测值送入到生存风险损失模块中计算出生存风险损失,将三种损失叠加作为总的损失指导模型参数更新,进行更加精准的寿命预测。
[0154]
具体来说,首先,将智能电能表x={xs,x
t
}样本送入寿命特征生成模块进行寿命特征生成,并将生成的寿命特征和原特征进行拼接合并得到包含丰富寿命信息的数据集记
作:
[0155]
x
l
={x
sl
,x
tl
}(30)
[0156]
源域数据样本对应的寿命标签集合y:
[0157]ys
={y1,y2,...,ym}(31)
[0158]
使用极大似然估计求解对应的威布尔分布参数:
[0159][0160]
假设特征提取网络是一个k层网络,k+1层为域自适应层,域自适应层之后是模型的输出。将提取到的智能电能表样本特征送入域自适应层,得到:
[0161][0162]
其中,x
sl
是源域样本集,x
st
是目标域样本集,f
k+1
(x
sl
)表示源域样本在域自适应层的输出,f
k+1
(x
tl
)表示目标域样本在域自适应层的输出,d
sl
是源域特征,d
tl
是目标域特征。
[0163]
基于生存风险损失和域自适应的损失函数如下:
[0164]
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1