异常能耗检测方法、装置、设备及存储介质与流程

文档序号:25358088发布日期:2021-06-08 15:12阅读:121来源:国知局
异常能耗检测方法、装置、设备及存储介质与流程

1.本发明涉及设备能耗技术领域,尤其涉及一种异常能耗检测方法、装置、设备及存储介质。


背景技术:

2.目前的楼宇信息控制系统可以做到设备能耗的实时采集,但无法对采集到的设备能耗数据做进一步潜在故障分析。对于一些普遍存在用电浪费的设施、设备,楼宇信息控制系统不能进行有效的能耗监测与管控,且控制系统在面对多个被控设备(公共照明、中央空调等设备)时,无法对这些被控设备能耗进行智能化分析和预警,从而造成被控设备能耗过多的情况。
3.现有的异常能耗数据检测方法主要有两类:一种是传统的统计学方法,一种是基于聚类的离群点检测方法。传统的统计学方法大多采用固定阈值来判断异常数据,会造成较多误判的情况;而基于聚类的离群点检测则会忽略时序特征,只适用于判断某些异常数据点,而对长时间设备老化或者损坏引起的异常数据难以检测。
4.上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。


技术实现要素:

5.本发明的主要目的在于提供一种异常能耗检测方法、装置、设备及存储介质,旨在解决现有技术中对长时间设备老化或者损坏引起的异常数据难以检测的技术问题。
6.为实现上述目的,本发明提供了一种异常能耗检测方法,所述方法包括以下步骤:
7.获取原始数据集;
8.根据所述原始数据集通过长短时记忆自编码网络进行数据重建,得到与时间关联的重建数据集;
9.根据所述重建数据集以及所述原始数据集确定异常分数计算模型;
10.根据所述重建数据集与原始数据集确定分数特征集,并根据所述分数特征集通过所述异常分数计算模型进行计算,得到异常分数,以通过所述异常分数确定异常能耗数据。
11.可选地,所述根据所述原始数据集通过长短时记忆自编码网络进行数据重建,得到与时间关联的重建数据集,包括:
12.将所述原始数据集进行归一化,获得归一化数据集;
13.对所述归一化数据集进行重采样,获得预设长度的重采样数据集;
14.根据所述归一化数据集以及所述重采样数据集,确定重采样特征集;
15.通过所述长短时记忆自编码网络以及所述重采样特征集确定重建模型;
16.通过所述重建模型进行数据重建,得到与时间关联的重建数据集。
17.可选地,所述通过所述长短时记忆自编码网络确定重建模型,包括:
18.将所述重采样特征集按照预设比例划分为训练集以及验证集;
19.根据长短时记忆自编码网络建立初始模型;
20.根据所述训练集对所述初始模型进行训练,获得训练模型;
21.根据所述验证集对所述训练模型进行验证,获得重建模型。
22.可选地,所述根据所述重采样特征集通过所述重建模型进行数据重建,得到与时间关联的重建数据集,包括:
23.确定所述重采样特征集的数据重建起点;
24.根据数据重建起点逆向重建所述训练集,获得所述重建数据集。
25.可选地,所述根据所述重建数据集以及所述原始数据集确定异常分数计算模型,包括:
26.确定所述重建数据集与原始数据集的余弦相似度;
27.根据所述重采样数据集确定分数特征信息;
28.根据所述余弦相似度与所述分数特征信息确定分数特征集;
29.根据所述分数特征集确定异常分数计算模型。
30.可选地,所述根据所述分数特征集确定所述异常分数计算模型,包括:
31.对所述分数特征集进行采样,获得分数计算训练集;
32.根据所述分数计算训练集确定所述异常分数计算模型。
33.可选地,所述根据所述分数特征集通过所述异常分数计算模型进行计算,得到异常分数,以通过所述异常分数确定异常能耗数据,包括:
34.通过所述异常分数计算模型确定所述分数特征集的平均特征值;
35.根据所述平均特征值确定所述分数特征集的异常分数;
36.根据所述异常分数确定所述异常能耗数据。
37.此外,为实现上述目的,本发明还提出一种异常能耗检测装置,所述异常能耗检测装置包括:
38.获取模块,用于获取原始数据集;
39.重建模块,用于根据所述原始数据集通过长短时记忆自编码网络进行数据重建,得到与时间关联的重建数据集;
40.确定模块,用于根据所述重建数据集以及所述原始数据集确定异常分数计算模型;
41.计算模块,用于根据所述重建数据集与原始数据集确定分数特征集,并根据所述分数特征集通过所述异常分数计算模型进行计算,得到异常分数,以通过所述异常分数确定异常能耗数据。
42.此外,为实现上述目的,本发明还提出一种异常能耗检测设备,所述异常能耗检测设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的异常能耗检测程序,所述异常能耗检测程序配置为实现如上文所述的异常能耗检测方法的步骤。
43.此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有异常能耗检测程序,所述异常能耗检测程序被处理器执行时实现如上文所述的异常能耗检测方法的步骤。
44.本发明通过获取原始数据集;根据所述原始数据集通过长短时记忆自编码网络进行数据重建,得到与时间关联的重建数据集;根据所述重建数据集以及所述原始数据集确
定异常分数计算模型;根据所述重建数据集与原始数据集确定分数特征集,并根据所述分数特征集通过所述异常分数计算模型进行计算,得到异常分数,以通过所述异常分数确定异常能耗数据。通过上述方式,将原始能耗数据进行归一化,并通过长短时记忆自编码网络重建与时间顺序相关的重建数据集,且增加多个与时间相关的特征,更进一步考虑时间的影响因素,最后通过异常分数计算模型对数据进行分数计算,根据得分来判断用电设备是否存在长时间老化或者损坏引起的异常能耗数据。
附图说明
45.图1是本发明实施例方案涉及的硬件运行环境的异常能耗检测设备的结构示意图;
46.图2为本发明异常能耗检测方法第一实施例的流程示意图;
47.图3为本发明异常能耗检测装置第一实施例的结构框图。
48.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
49.应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
50.参照图1,图1为本发明实施例方案涉及的硬件运行环境的异常能耗检测设备结构示意图。
51.如图1所示,该异常能耗检测设备可以包括:处理器1001,例如中央处理器(central processing unit,cpu),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(wireless

fidelity,wi

fi)接口)。存储器1005可以是高速的随机存取存储器(random access memory,ram)存储器,也可以是稳定的非易失性存储器(non

volatile memory,nvm),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
52.本领域技术人员可以理解,图1中示出的结构并不构成对异常能耗检测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
53.如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及异常能耗检测程序。
54.在图1所示的异常能耗检测设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明异常能耗检测设备中的处理器1001、存储器1005可以设置在异常能耗检测设备中,所述异常能耗检测设备通过处理器1001调用存储器1005中存储的异常能耗检测程序,并执行本发明实施例提供的异常能耗检测方法。
55.本发明实施例提供了一种异常能耗检测方法,参照图2,图2为本发明一种异常能耗检测方法第一实施例的流程示意图。
56.本实施例中,所述异常能耗检测方法包括以下步骤:
57.步骤s10:获取原始数据集。
58.需要说明的是,本实施例的执行主体可为终端设备,例如电脑,终端设备中运行有执行本方法的程序。
59.可以理解的是,原始数据集为楼宇间某一用电设备的能耗数据集,能耗数据集为基于时间顺序的一组能耗数据,例如:时间间隔可为1小时、10小时、1天等。每经过一段时间间隔对用电设备当前的能耗数据进行记录。用电设备可为公共照明、中央空调等。在用电设备与终端设备进行通信连接后,形成楼宇间用电设备能耗数据的通信网络,可以实时采样用电设备的能耗数据。
60.步骤s20:根据所述原始数据集通过长短时记忆自编码网络进行数据重建,得到与时间关联的重建数据集。
61.可以理解的是,因为能耗数据在采样时可能会因为异常情况而采样不完全,导致某些时间点的没有能耗数据,此时使用均值法补全缺失值,使得原始数据集完整,良好地进行后续的数据处理。
62.进一步地,步骤s20包括:将所述原始数据集进行归一化,获得归一化数据集;对所述归一化数据集进行重采样,获得预设长度的重采样数据集;根据所述归一化数据集以及所述重采样数据集,确定重采样特征集;通过所述长短时记忆自编码网络以及所述重采样特征集确定重建模型;通过所述重建模型进行数据重建,得到与时间关联的重建数据集。
63.应理解的是,归一化是将原始数据集中的能耗数据转换为[0,1]的区间内获得归一化数据集,归一化可使用robustscaler方法:
[0064][0065]
其中,x
i
为归一化数据集中的第i个数据,x
j
为原始数据集中的第j个数据,i=j,x
i
与x
j
为对应关系。median为中位数,iqr为四分距。
[0066]
可以理解的是,归一化是让不同维度之间的特征在数值上有一定比较性,可以大大提高分类器的准确性。
[0067]
需要说明的是,根据归一化数据集进行重采样可使用滑动窗口算法,例如:滑动窗口算法处理中设定每个子数组长度为50,滑动窗口大小为30,对归一化数据集重采样后可获得若干长度为50的重采样数据集,本实施例不做限制。
[0068]
可以理解的是,为每个重采样数据集增加增加平均值、最大值、最小值、季节性分解、峰度、最大方差等特征,再加上本身重采样数据特征,获得重采样特征集。
[0069]
需要说明的是,“季节性分解”过程可将一个序列分解成一个季节性成分、一个组合趋势和循环的成分和一个“误差”成分。峰度又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。加入季节性分解特征可以进一步考虑能耗数据基于时间因素的影响,进一步地提高本实施例异常能耗检测的准确性。
[0070]
进一步地,所述通过所述长短时记忆自编码网络确定重建模型,包括:将所述重采样特征集按照预设比例划分为训练集以及验证集;根据长短时记忆自编码网络建立初始模型;根据所述训练集对所述初始模型进行训练,获得训练模型;根据所述验证集对所述训练模型进行验证,获得重建模型。
[0071]
需要说明的是,长短时记忆自编码网络会基于数据的时间顺序对数据进行处理。
长短时记忆自编码网络是一种自监督深度学习算法,在建立长短时记忆自编码网络模型时,设置编码器,使用一层长短期记忆网络(lstm,long short

term memory),隐藏神经元个数设置为300,前向传播使用dropout层;设置解码器,使用一层lstm,隐藏神经元个数设置为300,前向传播使用dropout层;训练过程优化器可使用adam优化算法,损失函数可使用均方损失函数,训练完成后,解码器以重采样特征集末端为起点,反向重建重采样特征集,获得重建数据集。
[0072]
可以理解的是,在对长短时记忆自编码网络模型训练时,需要将重采样特征集划分为预设比例的训练集以及验证集,例如预设比例可为8:2,本实施例不做限制,利用训练集对模型进行拟合即训练,利用验证集调整模型的超参数和用于对模型的能力进行初步评估,获得最终的长短时记忆自编码网络模型,即重建模型。
[0073]
进一步地,所述根据所述重采样特征集通过所述重建模型进行数据重建,得到与时间关联的重建数据集,包括:确定所述重采样特征集的数据重建起点;根据数据重建起点逆向重建所述训练集,获得所述重建数据集。
[0074]
需要说明的是,利用长短时记忆自编码网络模型对重采样特征集进行数据重建时,以重采样特征集的末端为起点,逆向重建数据,获得重建数据集。
[0075]
步骤s30:根据所述重建数据集以及所述原始数据集确定异常分数计算模型。
[0076]
进一步地,所述根据所述重建数据集以及所述原始数据集确定异常分数计算模型,包括:确定所述重建数据集与原始数据集的余弦相似度;根据所述重采样数据集确定分数特征信息;根据所述余弦相似度与所述分数特征信息确定分数特征集;根据所述分数特征集确定异常分数计算模型。
[0077]
可以理解的是,余弦相似度可以衡量两个个体之间的差异大小,因为重建数据集与原始数据集都是数组形式,可以将数组转化为对应的向量,再进行余弦相似度的计算。
[0078]
需要说明的是,分数特征信息包括自相关系数、峰值、赫斯特系数、曲率等特征,分数特征信息由重采样数据集计算得到。将分数特征信息与余弦相似度组合可以得到分数特征。分数特征作为异常分数计算模型的输入数据。
[0079]
可以理解的是,自相关系数度量的是同一事件在两个不同时期之间的相关程度,用于度量用电设备过去的能耗数据对现在的影响。赫斯特系数可以作为判断时间序列数据遵从随机游走还是有偏的随机游走过程的指标。通过引入上述特征,可以更进一步针对用电设备能耗数据基于时间的影响进行分析。
[0080]
进一步地,所述根据所述分数特征集确定所述异常分数计算模型,包括:对所述分数特征集进行采样,获得分数计算训练集;根据所述分数计算训练集确定所述异常分数计算模型。
[0081]
可以理解的是,所述异常分数计算模型可为孤立森林模型,在对孤立森林模型进行训练时,对分数特征集进行子采样获得分数计算训练集,利用分数计算训练集构建多棵二叉树(isolation tree,itree)获得孤立森林(isolation forest,iforest),即异常分数计算模型。
[0082]
步骤s40:根据所述重建数据集与原始数据集确定分数特征集,并根据所述分数特征集通过所述异常分数计算模型进行计算,得到异常分数,以通过所述异常分数确定异常能耗数据。
[0083]
进一步地,步骤s40包括:通过所述异常分数计算模型确定所述分数特征集的平均特征值;根据所述平均特征值确定所述分数特征集的异常分数;根据所述异常分数确定所述异常能耗数据。
[0084]
可以理解的是,在对分数特征集进行异常分数计算时,先要估算每条分数特征集x在每棵itree中的路径长度。具体的,先沿着一棵itree,从根节点开始按不同特征的取值从上往下,直到到达某叶子节点。假设itree的训练样本中同样落在x所在叶子节点的样本数为t.size,则数据x在这棵itree上的路径长度h(x),计算公式为:
[0085]
h(x)=e+c(t.size)
ꢀꢀꢀ
公式2;
[0086]
其中,e表示数据x从itree的根节点到叶节点过程中经过的边的数目,c(t.size)可以认为是一个修正值,它表示在一棵用t.size条样本数据构建的二叉树的平均路径长度,即平均特征值,c(n)的计算公式为:
[0087][0088]
其中,h(n

1)可用ln(n

1)+ξ估算,ξ为欧拉常数。数据x最终的异常分值s(x)综合了多棵itree的结果:
[0089][0090]
其中,e(h(x))表示数据x在多棵itree的路径长度的均值,ψ表示单棵itree的训练样本的样本数,c(ψ)表示用ψ条数据构建的二叉树的平均路径长度。
[0091]
需要说明的是,如果数据x在多棵itree中的平均路径长度越短,得分越接近1,表明数据x越异常;如果数据x在多棵itree中的平均路径长度越长,得分越接近0,表示数据x越正常;如果数据x在多棵itree中的平均路径长度接近整体均值,则分数会在0.5附近。
[0092]
可以理解的是,不同的用电设备的用电功率不同,因此为了每台用电设备的具体情况,在对不同的用电设备进行检测时,需要重新进行上述的步骤。
[0093]
本实施例通过获取原始数据集;根据所述原始数据集通过长短时记忆自编码网络进行数据重建,得到与时间关联的重建数据集;根据所述重建数据集以及所述原始数据集确定异常分数计算模型;根据所述重建数据集与原始数据集确定分数特征集,并根据所述分数特征集通过所述异常分数计算模型进行计算,得到异常分数,以通过所述异常分数确定异常能耗数据。通过上述方式,将原始能耗数据进行归一化,并通过长短时记忆自编码网络重建与时间顺序相关的重建数据集,且增加多个与时间相关的特征,更进一步考虑时间的影响因素,最后通过异常分数计算模型对数据进行分数计算,根据得分来判断用电设备是否存在长时间老化或者损坏引起的异常能耗数据。
[0094]
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有异常能耗检测程序,所述异常能耗检测程序被处理器执行时实现如上文所述的异常能耗检测方法的步骤。
[0095]
参照图3,图3为本发明异常能耗检测装置第一实施例的结构框图。
[0096]
如图3所示,本发明实施例提出的异常能耗检测装置包括:
[0097]
获取模块10,用于获取原始数据集。
[0098]
重建模块20,用于根据所述原始数据集通过长短时记忆自编码网络进行数据重建,得到与时间关联的重建数据集。
[0099]
确定模块30,用于根据所述重建数据集以及所述原始数据集确定异常分数计算模型。
[0100]
计算模块40,用于根据所述重建数据集与原始数据集确定分数特征集,并根据所述分数特征集通过所述异常分数计算模型进行计算,得到异常分数,以通过所述异常分数确定异常能耗数据。
[0101]
进一步地,所述重建模块20,还用于将所述原始数据集进行归一化,获得归一化数据集;对所述归一化数据集进行重采样,获得预设长度的重采样数据集;根据所述归一化数据集以及所述重采样数据集,确定重采样特征集;通过所述长短时记忆自编码网络以及所述重采样特征集确定重建模型;根据所述重采样特征集通过所述重建模型进行数据重建,得到与时间关联的重建数据集。
[0102]
进一步地,所述重建模块20,还用于将所述重采样特征集按照预设比例划分为训练集以及验证集;根据长短时记忆自编码网络建立初始模型;根据所述训练集对所述初始模型进行训练,获得训练模型;根据所述验证集对所述训练模型进行验证,获得重建模型。
[0103]
进一步地,所述重建模块20,还用于将所述重采样特征集按照预设比例划分为训练集以及验证集;根据长短时记忆自编码网络建立初始模型;根据所述训练集对所述初始模型进行训练,获得训练模型;根据所述验证集对所述训练模型进行验证,获得重建模型。
[0104]
进一步地,所述重建模块20,还用于确定所述重采样特征集的数据重建起点;根据数据重建起点逆向重建所述训练集,获得所述重建数据集。
[0105]
进一步地,所述确定模块30,还用于确定所述重建数据集与原始数据集的余弦相似度;根据所述重采样数据集确定分数特征信息;根据所述余弦相似度与所述分数特征信息确定分数特征集;根据所述分数特征集确定异常分数计算模型。
[0106]
进一步地,所述确定模块30,还用于对所述分数特征集进行采样,获得分数计算训练集;根据所述分数计算训练集确定所述异常分数计算模型。
[0107]
进一步地,所述计算模块40,还用于通过所述异常分数计算模型确定所述分数特征集的平均特征值;根据所述平均特征值确定所述分数特征集的异常分数;根据所述异常分数确定所述异常能耗数据。
[0108]
应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。
[0109]
本实施例通过获取原始数据集;根据所述原始数据集通过长短时记忆自编码网络进行数据重建,得到与时间关联的重建数据集;根据所述重建数据集以及所述原始数据集确定异常分数计算模型;根据所述重建数据集与原始数据集确定分数特征集,并根据所述分数特征集通过所述异常分数计算模型进行计算,得到异常分数,以通过所述异常分数确定异常能耗数据。通过上述方式,将原始能耗数据进行归一化,并通过长短时记忆自编码网络重建与时间顺序相关的重建数据集,且增加多个与时间相关的特征,更进一步考虑时间的影响因素,最后通过异常分数计算模型对数据进行分数计算,根据得分来判断用电设备是否存在长时间老化或者损坏引起的异常能耗数据。
[0110]
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范
围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
[0111]
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的异常能耗检测方法,此处不再赘述。
[0112]
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
[0113]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0114]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(read only memory,rom)/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0115]
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1