多任务负荷监测与激励的用电优化方法、装置、介质及设备与流程

文档序号:33741982发布日期:2023-04-06 10:17阅读:53来源:国知局
多任务负荷监测与激励的用电优化方法、装置、介质及设备与流程

本技术涉及用电管理,特别是涉及一种多任务负荷监测与激励的用电优化方法、装置、存储介质及电力设备。


背景技术:

1、随着透明配电网的建设与智能家居技术的发展,智能电表的应用逐渐普及,分布广、总量大的用户侧可调负荷有望加入需求响应,充分发挥其节能效益与调峰作用,助力“双碳”目标的实现。得益于量测数据的增多,负荷监测技术成为研究热点,即实现由电表的聚合数据感知用户家庭内的电器级能耗信息。同时,分时电价的实施,促进了用户最优用电方法的研究,即同时考虑外部需求响应信息与内部用户的用电需要,自动地求取最优用电方案,在不过分影响用户舒适度奖励的前提下尽可能地减少用电成本奖励。

2、经过多年的发展,两种技术的局限性阻碍了家庭负荷可调潜力的发掘,一是负荷监测技术与下游应用联系紧密程度较低,难以进一步利用感知的负荷信息;二是用户最优用电方法缺少对用户可调负荷的感知能力,依赖于用户告知电器信息与使用需求,无法应对激励型用户中只能获得入户电表数据的实际应用场景。因此,负荷监测技术与用户最优用电技术的结合成为用户侧可调负荷参与需求响应的关键。

3、然而,现有绝大多数用户最优用电方法缺少对用户可调负荷的感知能力,依托于昂贵的智能家居平台或依赖于用户告知电器信息与使用需求,无法应用于仅能获得电表数据的激励型用户,且难以自动检测变化并调整策略。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种无需依托昂贵的智能家居平台或依赖于用户告知电器信息与使用需求,能够应用于仅能获得电表数据的激励型用户,且能够自动检测变化并调整策略的多任务负荷监测与激励的用电优化方法、装置、存储介质及电力设备。

2、本发明实施例提供了一种多任务负荷监测与激励的用电优化方法,所述方法包括以下步骤:

3、获取可调负荷的粗标注电表数据集,并对所述粗标注电表数据集进行预处理,得到预处理电表数据集;

4、构建多任务负荷监测模型,将所述预处理电表数据集划分为训练集及验证集,并将所述多任务负荷监测模型在所述训练集上训练至验证集上所述多任务负荷监测模型的损失函数值收敛;

5、将训练完成的多任务负荷监测模型部署至用户端,并分析用电周期的电表数据得到用户可调负荷的种类、平均功率以及各调度时段的可调负荷运行概率;

6、将用户可调负荷的种类、平均功率、以及外部信息作为观测量,综合各调度时段的可调负荷运行概率设置用电奖励,构建并训练基于a2c的用户最优用电模型;

7、将训练完成的用户最优用电模型投入应用,当多任务负荷监测模型监测到用户可调负荷的平均功率大小或种类发生改变时,重新触发用户最优用电模型训练过程,更新可调负荷的各时段运行概率与用户可调负荷的种类向量,修改用电奖励。

8、进一步地,所述可调目标负荷包括空调、电动车、以及洗碗机;所述粗标注电表数据集为具有负荷设备投入与切除时间戳的智能电表有功功率数据集;对所述粗标注电表数据集进行预处理,具体包括:

9、根据投入与切除时间戳生成各可调负荷对应每个采样点的开关状态0、1序列;

10、计算所述粗标注电表数据集中有功功率的均值μ与标准差δ,各采样点减去均值后再除以方差,完成数据的归一化操作;

11、以宽度为w,滑动步长为s的滑动窗将所述粗标注电表数据集以及开关状态0、1序列滑动切割成多个片段;

12、根据开关状态0、1序列在每个片段内计算各可调负荷的平均有功功率p。

13、进一步地,构建多任务负荷监测模型,具体包括:

14、输入片段式电表数据经过一维卷积层初步提取相邻采样点间的内在关系;

15、由双向门控循环网络提取负荷设备运行中的长期模式,再由多种可调负荷对应的各全连接层实现该片段内的各种可调负荷有功功率平均值的映射;

16、将各种可调负荷有功功率平均值乘以所述粗标注电表数据集中有功功率的标准差δ,再加上所述粗标注电表数据集中有功功率的均值μ,完成反归一化,得到多任务负荷监测模型。

17、进一步地,所述多任务负荷监测模型的损失函数loss为:

18、

19、式中n为可调负荷的种类数,numi为第i种可调负荷的片段样本数,yij为第i种可调负荷中第j条片段样本的平均有功功率值,xij为第i种可调负荷中第j条片段样本归一化后的有功功率序列,fθ(·)指所构建的多任务负荷监测模型。

20、进一步地,将训练完成的多任务负荷监测模型部署至用户端,并分析用电周期的电表数据得到用户可调负荷的种类、平均功率以及各调度时段的可调负荷运行概率,具体包括:

21、将所述预处理电表数据集输入多任务负荷监测模型,得到各种可调负荷在各片段中的平均有功功率;

22、分别对各片段中的平均有功功率求均值,得到该用户家庭中各种可调负荷的总平均有功功率pm

23、判断各总平均有功功率pm若大于阈值tp,则用户可调负荷的种类向量对应位置上置1,否则置0;其中,第i种可调负荷的第z个调度时段的可调负荷运行概率proiz的计算如下式所示:

24、

25、式中pidz为第i种可调负荷在用电周期的第d天中第z个调度时段内的平均有功功率;i(·)为判断函数,若括号内的条件成立则值为1,否则为0。

26、进一步地,所述外部信息包括室外与室内的温度信息、分时电价、各可调负荷的历史启停数据、以及用户用车信息;所述用电奖励包括用电成本奖励、室内温度奖励、用户舒适度奖励、设备运行限制奖励、以及用电需求奖励,所述设备运行限制奖励包括不可中断负荷的运行限制奖励,所述用电需求奖励为最优用电模型给出可调负荷启停建议后,若多任务负荷监测模型检测到用户采纳对应建议,则各种可调负荷分别获取相应正奖励,否则获得相应负奖励;其中,

27、所述用电成本奖励奖励rewardpri的计算如下式所示:

28、rewardpri=-prinext·pmain

29、式中prinext指下一个调度时刻的分时电价,pmain指下一个调度时刻中的电表总线的输入有功功率;

30、所述室内温度奖励奖励rewardtem的计算如下式所示:

31、

32、式中temnext为下一个调度时段的室内摄氏度值;

33、所述用户舒适度奖励奖励rewardcom的计算如下式所示:

34、

35、式中acti为用户最优用电方法得到的下一调度时段中第i种可调负荷的动作,acti为1时代表开启第i种可调负荷,否则为关闭;z指下一调度时段的对应索引;i(·)为判断函数,若括号内的条件成立则值为1,否则为0。

36、进一步地,所述用户最优用电模型包括演员网络与评论家网络;

37、所述演员网络的优化目标如下式所示:

38、

39、式中b为单次参数更新中参与梯度计算的经验数;为第q条经验在第z个调度时段的观测下做出动作的奖励,表示第q条经验在第z+1个调度时段的观测;pπ(·)为演员网络的参数化模型,π表示对应模型参数;vφ(·)为评论家网络的参数化模型,φ表示对应模型参数;

40、所述评论家网络的优化目标如下式所示:

41、

42、式中vφ'(·)表示本次参数更新前的评论家网络,φ'表示对应冻结的模型参数,在优化过程中作为常量;γ为折扣因子。

43、本发明的另一实施例提出一种多任务负荷监测与激励的用电优化装置,所述装置包括:

44、数据预处理模块,用于获取可调负荷的粗标注电表数据集,并对所述粗标注电表数据集进行预处理,得到预处理电表数据集;

45、模型训练模块,用于构建多任务负荷监测模型,将所述预处理电表数据集划分为训练集及验证集,并将所述多任务负荷监测模型在所述训练集上训练至验证集上所述多任务负荷监测模型的损失函数值收敛;

46、数据分析模块,用于将训练完成的多任务负荷监测模型部署至用户端,并分析用电周期的电表数据得到用户可调负荷的种类、平均功率以及各调度时段的可调负荷运行概率;

47、模型构建模块,用于将用户可调负荷的种类、平均功率、以及外部信息作为观测量,综合各调度时段的可调负荷运行概率设置用电奖励,构建并训练基于a2c的用户最优用电模型;

48、模型优化模块,用于将训练完成的用户最优用电模型投入应用,当多任务负荷监测模型监测到用户可调负荷的平均功率大小或种类发生改变时,重新触发用户最优用电模型训练过程,更新可调负荷的各时段运行概率与用户可调负荷的种类向量,修改用电奖励。

49、本发明的另一个实施例还提出一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行如上所述的多任务负荷监测与激励的用电优化方法。

50、本发明的另一个实施例还提出一种电力设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如上所述的多任务负荷监测与激励的用电优化方法。

51、上述多任务负荷监测与激励的用电优化方法,获取可调负荷的粗标注电表数据集,并对所述粗标注电表数据集进行预处理,得到预处理电表数据集;构建多任务负荷监测模型,将所述预处理电表数据集划分为训练集及验证集,并将所述多任务负荷监测模型在所述训练集上训练至验证集上所述多任务负荷监测模型的损失函数值收敛;将训练完成的多任务负荷监测模型部署至用户端,并分析用电周期的电表数据得到用户可调负荷的种类、平均功率以及各调度时段的可调负荷运行概率;将用户可调负荷的种类、平均功率、以及外部信息作为观测量,综合各调度时段的可调负荷运行概率设置用电奖励,构建并训练基于a2c的用户最优用电模型;将训练完成的用户最优用电模型投入应用,当多任务负荷监测模型监测到用户可调负荷的平均功率大小或种类发生改变时,重新触发用户最优用电模型训练过程,更新可调负荷的各时段运行概率与用户可调负荷的种类向量,修改用电奖励。相比现有技术,本发明无需依托昂贵的智能家居平台或依赖于用户告知电器信息与使用需求,能够应用于仅能获得电表数据的激励型用户,且能够自动检测变化并调整策略,满足了实际应用需求。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1