一种基于双预测误差的用电异常实时检测方法

文档序号:35165923发布日期:2023-08-18 13:22阅读:36来源:国知局
一种基于双预测误差的用电异常实时检测方法

本发明涉及用电异常检测,尤其涉及一种基于双预测误差的用电异常实时检测方法。


背景技术:

1、异常用电行为的实时检测是能源管理的重要内容,对节能减排,“双碳”目标的实现具有重要意义。近年来,大量建筑能耗监测管理系统的建立为实时发现用电异常提供了重要的数据支撑,然而传统方法无法挖掘海量数据中的潜在信息,导致建筑用电数据的应用局限于简单的数据统计,不能通过数据发现异常用电情况。如何使用新兴的机器学习方法挖掘海量用电数据中的有用信息,及时发现用电异常数据成为目前耗能建筑管理中亟待解决的问题。

2、当前,常用的基于机器学习的实时建筑用电异常检测方法为基于预测的方法。基于预测的方法是训练出用电预测模型后,对目标值进行预测,根据预测值与真实值的偏差大小来判断是否为异常,因此挖掘用电量与其他因素的相关关系并建立高精度的预测模型是至关重要的。在影响因素上,用电量既有时序依赖性,即当前用电量与历史用电量高度相关,也有特征关联性,即与时间、天气等外部因素相关。由此,从模型考虑的影响因素上划分,用电量预测模型分为基于时序依赖的预测模型与基于特征关联的预测模型。

3、在基于时序依赖的预测模型中,常用的基础模型为lstm及其变体(如gru),但实验楼用电时序具有非平稳性,而lstm对非平稳时序的预测效果不如对非平稳时序的预测效果。针对这一问题,“chou s y,dewabharata a,zulvia f e,et al.forecasting buildingenergy consumption using ensemble empirical pattern decomposition,wavelettransformation,and long short-term memory algorithms[j].energies,2022,15(3):1035.”中使用小波变换与经验模式分解对原始序列进行分解,使分解后的子序列具有更高的平稳性,最后使用lstm对分解后的各序列分别进行预测,效果优于直接使用原始序列进行预测。但这种方法存在“数据泄露”问题,数据泄露又名特征穿越,指的是在建模过程中的数据收集、处理时不小心将未来信息引入到训练集中。当把未来信息引入到训练集中时,模型训练的效果往往非常好,但真实的预测效果会大打折扣。若将序列分解作为数据预处理步骤,那么除最后一个数据外,对任何时间点数据的分解必然会使用到这个时间点之后的信息,虽然在离线情境下能取得更高的精度,但在实时应用中是与现实情况相矛盾的。目前还未有用电量预测研究针对数据泄露问题对此种方法进行改进。

4、在基于特征关联的预测模型中,常用的基础模型为树模型(如决策树)以及集成的树模型(如随机森林、xgboost)等。不同的应用场景下模型的特征构造也不尽相同,常见的特征有天气、时间、历史用电量等。高校实验楼的用电特征具有特殊性,如受是否在学期中、是否供暖等因素的影响,因此无法直接使用其他场景下的特征构造方法,并且目前未有针对高校实验楼的特征构造的方法。

5、基于时序依赖的预测模型与基于关联特征的预测模型从不同的角度对用电量进行建模,因此在检测用电异常上二者都具有重要的、不可相互替代的参考价值。现有技术方法多是只根据其中一种预测模型的预测结果对异常进行检测,因此考虑并不全面,漏报率高。


技术实现思路

1、本发明要解决的技术问题是针对耗能建筑设计实时用电异常检测方法。为解决这一问题,本发明提供了一种基于双预测误差的用电异常实时检测方法,实现对检测建筑用电量的自动实时异常检测。

2、本发明的技术方案如下:一种基于双预测误差的用电异常实时检测方法,包括步骤如下:

3、步骤(1)、基于时序依赖预测用电量;

4、建立分解-合成-lstm模型,通过用电量历史大数据优化分解-合成-lstm模型参数,训练好的分解-合成-lstm模型对待检测时段的用电量进行预测;

5、步骤1.1:用电量历史数据预处理;

6、获取目标建筑的历史用电量数据,删除无效零值,遍历所有历史时段;对于每一时段i,该时段及与之相连的l个历史时段的用电量数据皆为有效值时,则使用该时段用电量及与之相连的l个历史时段的用电量组成一条数据,否则,跳过该时段;长度为l的历史用电量时序为特征变量数据,该时段用电量为目标变量数据;所有满足上述条件的特征变量-目标变量数据对共同组成数据集,将数据集打乱排序,按比例分为训练集和测试集;

7、步骤1.2:训练分解-合成-lstm模型;

8、所述分解-合成-lstm模型包括序列分解模块、隐向量提取模块和双通道预测模块;模型输入为即过去l个时段内的用电时序,模型输出为与与为当前时段用电量的预测值;

9、随机初始化分解-合成-lstm模型各网络参数;在训练集数据上使用自适应矩阵估计adam调整网络参数使损失函数ltotal最小化,在达到最大迭代次数后停止训练,使用测试集数据判断分解-合成-lstm模型有效性,获得训练好的分解-合成-lstm模型;

10、所述网络参数有

11、步骤1.3:训练好的分解-合成-lstm模型预测待检测时段的用电量;

12、获取待检测时段j之前l个时段的用电量数据,组成特征向量将输入分解-合成-lstm模型,训练好的分解-合成-lstm模型输出为待检测时段用电量的基于时序依赖预测值

13、步骤(2)、基于特征关联预测用电量;

14、步骤2.1:关联特征数据预处理;

15、获取目标建筑的历史用量数据,删除无效零值,遍历所有时段,对于每一个时段i,获取该时段的各输入特征的原始数据,构造该时段的输入特征变量向量该时段用电量为目标变量数据;所有满足上述条件的特征变量-目标变量数据对共同组成数据集,将数据集打乱排序,按比例分为训练集和测试集;

16、步骤2.2:训练随机森林模型;

17、使用步骤2.1中的训练集训练随机森林模型并使用网格搜索优化模型超参数,保留最优超参数下训练出的随机森林模型作为用于预测目标建筑用电量的预测模型;

18、步骤2.3:使用训练好的随机森林模型预测待检测时段的用电量;

19、获取待检测时段j的输入特征的原始数据,构造该时段的输入特征变量向量将输入随机森林模型,随机森林模型的输出为待检测时段用电量的基于特征关联预测值

20、(3)基于双预测误差判别用电异常;

21、基于分解-合成-lstm模型的预测结果计算时序依赖异常得分,基于随机森林模型的预测结果计算特征关联异常得分,融合时序依赖异常得分与特征关联异常得分计算综合异常得分,根据综合异常得分与阈值的大小关系判别是否为异常用电数据;

22、步骤3.1:设置异常阈值

23、设定异常阈值θ;

24、步骤3.1:计算时序依赖异常得分;

25、根据基于时序依赖预测值果真实用电量分解-合成-lstm模型在训练集数据上的最大百分比误差s_max1,采用时序依赖异常得分计算方法计算时序依赖异常得分

26、

27、

28、

29、步骤3.2:计算特征关联异常得分;

30、根据基于特征关联预测值真实用电量随机森林模型在训练集数据上的最大百分比误差s_max2,计算时序依赖异常得分

31、

32、

33、

34、步骤3.3:计算综合异常得分

35、根据时序依赖异常得分特征关联异常得分计算综合异常得分sj;

36、

37、步骤3.4:判别异常

38、当si>θ,θ为异常阈值,i时段的用电量被判别为异常用电;否则,i时段的用电量被判别为正常用电。

39、所述分解-合成-lstm模型的具体运行流程如下:输入至分解-合成-lstm模型后,进入序列分解模块,通过滑动平均分解为季节子序列与趋势子序列季节子序列的计算公式为趋势子序列的计算公式为

40、趋势子序列输入至隐向量提取模块;隐向量提取模块包括堆叠的3层lstm神经网络、一个回归层、一个加和层,将转化为的过程中生成隐向量;隐向量提取模块中堆叠lstm网络的第1层第t个lstm神经元的输出为:其中,θ1,t为第1层第t个lstm神经元的参数;堆叠lstm网络中第2层第t个lstm神经元的输出为:其中,θ2,t为第2层第t个lstm神经元的参数;堆叠lstm网络中第3层第t个lstm神经元的输出为:其中,θ3,t为第3层第t个lstm神经元的参数;即为所求隐向量;将输入到回归层中,回归层输出为表达式为其中,为回归层在t时刻的权重,为偏差向量;连接与组成转换后的季节子序列向量输入至隐向量提取模块,则隐向量提取模块对第t时刻的最终输出为为整个分解-合成-lstm模型的第一个输出;分解-合成-lstm模型在隐向量提取模块的损失函数lrecon的计算公式为:

41、趋势子序列隐向量与季节子序列输入至双通道预测模块;双通道预测模块依次包括堆叠lstm网络层、回归层、加和层;

42、将趋势子序列隐向量输入2层堆叠lstm中;第1层第t时刻的lstm神经元的输出为:其中,为双通道预测模块第1层第t个lstm神经元的参数;第2层第t时刻的lstm神经元的输出为:其中,为第2层第t个lstm神经元的参数;设为第2层lstm网络在第l时刻的短期记忆,将投入回归层得到趋势序列预测值为:其中wt,h为回归层权重,为偏差向量;将季节子序列投入2层堆叠lstm中;第1层第t时刻的lstm神经元的输出为:其中,为双通道预测模块第1层第t个lstm神经元的参数;第2层第t时刻的lstm神经元的输出为:其中,为第2层第t个lstm神经元的参数;为双通道预测模块第2层lstm网络在第l时刻的短期记忆,将输入至回归层得到季节序列预测值为:其中ws,h为回归层权重,为偏差向量;

43、季节子序列经过堆叠lstm与回归层得到季节子序列预测值,趋势子序列经过堆叠lstm与回归层得到趋势序列预测值;将与相加得到作为对下一时刻用电量的预测,;双通道预测模块的损失为:lpre越小,模型对用电量的预测能力越强。分解-合成-lstm模型总损失函数为双通道预测模块损失函数与隐向量提取模块损失函数的和:ltotal=lpre+lrecon。

44、所述输入特征变量向量根据输入特征确定,所述输入特征包括时、是否为周末、季节、是否为节假日、是否在学期中、气温、特殊天气类型、上一时段的用电量、是否供暖。

45、基于时序依赖预测用电量是通过分解-合成-lstm模型挖掘用电量的时序依赖性以达到精准预测用电量的目的;基于特征关联预测用电量是通过构造科学的输入特征集合并使用随机森林模型挖掘用电量与其他因素的特征关联性以达到精准预测用电量的目的;基于双预测误差判别用电异常判别综合考虑时序依赖异常与特征关联异常,检出综合异常得分高于阈值的用电量数值,达到实时检测用电异常的目的。

46、基于时序依赖预测用电量是计算时序依赖异常得分的基础。基于特征关联预测用电量是计算特征关联异常得分的基础。

47、本发明的有益效果:

48、本发明提供一种基于双预测误差的用电异常实时检测方法,可以区分目标建筑中正常用电数据和异常用电数据,提升用电管理效率。

49、(1)设计一种基于分解-合成-lstm模型的用电量预测方法,基于时序依赖预测用电量,通过引入序列分解与隐向量提取增强了时间序列的可预测性,提高用电量预测精度并避免了“数据泄露”问题。

50、(2)设计一种基于随机森林的用电量预测方法与相应的输入特征构造方法,基于特征关联预测用电量,面向目标建筑预测问题有针对性地构造输入特征,以随机森林模型为基础构造其用电量预测模型,提高了预测精度。

51、(3)设计一种基于双预测误差的用电异常判别方法,兼顾时序依赖异常与特征关联异常,降低了漏报率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1