一种配电网动态经济调度方法及系统与流程

文档序号:37278494发布日期:2024-03-12 21:14阅读:17来源:国知局
一种配电网动态经济调度方法及系统与流程

本发明涉及配电网系统优化调度,具体是一种配电网动态经济调度方法及系统。


背景技术:

1、在大规模新能源并网的趋势下,风电(wind turbine,wt)、光伏(photovoltaic,pv)等间歇性电源出力的不确定性给电网调度运行带来了挑战,例如,传统基于模型的配电网优化调度问题属于大规模混合整数非凸非线性随机或鲁棒优化问题。并且,求解复杂度随配电网拓扑规模与可调度设备数量增加呈现指数增长,属于非确定性多项式(non-deterministic polynomial,np)难题。根据经济调度是否考虑不同时间段之间的联系,可分为静态经济调度和动态经济调度。静态经济调度不考虑实时时间段之间的联系,而动态经济调度需要计及实时时间段之间的联系,可在调度环境和任务存在不可预测扰动的情况下实现灵活性调度。

2、随着光伏、风电等间歇性能源和负荷的不确定性的逐步增强,并且微型燃气轮机设备的调度决策具有时间耦合特性,而传统优化调度方法局限于精确的物理模型及参数设定,难以适应源荷的不确定性,并存在无法连续做出动态决策等问题。


技术实现思路

1、为了解决上述问题,本发明提出了一种计及风光的随机波动性和微型燃气轮机出力的时间耦合特性的配电网动态经济调度方法及系统,降低了对物理模型的依赖程度,在不确定性环境下具有可行性和优越性。

2、为了达到上述目的,本发明是通过以下技术方案来实现的:

3、本发明是一种配电网动态经济调度方法,包括如下操作:

4、建立满足约束条件下的,以配电网运行经济成本最小为目标函数的新能源配电网的动态经济调度模型;

5、将动态经济调度模型表述为马尔可夫决策过程,并确定相应的状态空间、动作空间以及奖励函数;

6、通过深度强化学习算法求解被表述为马尔可夫决策过程的动态经济调度模型,得到自适应风光不确定性的动态调度策略。

7、本发明的进一步改进在于:所述动态经济调度模型的目标函数为:

8、

9、其中,e(·)为随机变量的期望值,t为调度周期时长,cgrid(t)为主网购电成本,cmt(t)为t时刻的微型燃气轮机的调度运行成本,cba(t)为t时刻的分布式电池储能系统的调度运行成本,ct为t时刻的总成本。

10、本发明的进一步改进在于:所述约束条件具体包括:

11、功率平衡约束:

12、

13、其中,pgrid,t为t时刻配电网从主网购买的电功率,为t时刻分布式光伏发电机组k1实际的有功功率,为t时刻分布式风力发电机组k2实际的有功功率,为t时刻分布式电池储能系统k3实际的有功功率,pload,t为t时刻的负荷出力,k1、k2和k3分别为分布式光伏发电机组、分布式风力发电机组和分布式电池储能系统的总数;

14、系统节点电压约束:

15、vmin≤vi≤vmax;

16、其中,vi为节点i的电压幅值,vmin为系统允许的电压最小值,vmax为系统允许的电压最大值;

17、传输容量极限约束:

18、

19、其中,pj,t为支路j在t时刻所传输的有功功率,qj,t为支路j在t时刻所传输的无功功率,sj,max为支路j的上限视在功率;

20、分布式光伏发电机组、分布式风力发电机组以及微型燃气轮机的有功出力约束:

21、

22、

23、

24、其中,分别为第k1个分布式光伏发电机组的出力最小值和最大值,分别为第k2个分布式风力发电机组的出力最小值和最大值,分别为第k4个微型燃气轮机组的出力最小值和最大值,为t时刻微型燃气轮机组k4实际的有功功率;

25、爬坡约束:

26、

27、其中,分别为第k4个微型燃气轮机的最大上爬坡功率的最大下爬坡功率,为t-1时刻微型燃气轮机组k4实际的有功功率;

28、分布式电池储能系统的有功出力约束:

29、

30、其中,分别为第k3个分布式电池储能系统的有功出力的最大值和最小值;

31、分布式电池储能系统的荷电状态约束:

32、

33、

34、其中,为第k3个分布式电池储能系统初始的荷电状态,为第k3个分布式电池储能系统在整个配电网调度周期结束时的荷电状态,分别为第k3个分布式电池储能系统的荷电状态的下限值和上限值,为第k3个分布式电池储能系统在t时刻的荷电状态;

35、分布式电池储能系统的时序耦合运行约束:

36、

37、其中,分别表示第k3个分布式电池储能系统在t时刻的分布式储能充放电状态变量,均取值为0或1,分布式电池储能系统充电时分布式电池储能系统放电时分别为第k3个分布式电池储能系统的充电效率和放电效率,为第k3个分布式电池储能系统的额定容量,δt为调度时间间隔。

38、本发明的进一步改进在于:所述将动态经济调度模型表述为马尔可夫决策过程,并确定相应的状态空间、动作空间以及奖励函数中,状态空间s为:

39、

40、其中,为微型燃气轮机组有功出力,为光伏出力预测值,为风电出力预测值,pload,t为t时刻的负荷出力,λbuy(t)为配电网的购电价格;动作空间a为:

41、

42、其中,为t时刻分布式光伏发电机组k1实际的有功功率,为t时刻分布式风力发电机组k2实际的有功功率,为t时刻分布式电池储能系统k3实际的有功功率,为t时刻微型燃气轮机组k4实际的有功功率;

43、奖励函数:

44、整个调度周期t的累计奖励函数为:

45、

46、其中,

47、

48、

49、其中,cgrid(t)为主网购电成本,cmt(t)为t时刻的微型燃气轮机的调度运行成本,cba(t)为t时刻的分布式电池储能系统的调度运行成本,fv,t为系统节点电压越限的惩罚,rt为智能体在状态st下选择动作at之后,得到的即时奖励,-ev,t为惩罚系数,vi,t为t时刻节点i的电压幅值,rt为智能体在调度周期内获得的累积奖励,γ为折扣因子,表示未来奖励相对于当前的重要程度。

50、本发明的进一步改进在于:所述深度强化学习算法包括动作网络、评价网络和策略网络,所述动作网络和评价网络的输入均为状态st;

51、深度强化学习算法的目标函数为:

52、

53、其中,为动作网络的参数,为新旧策略的相对概率,为优势函数,ε为介于0和1之间的超参数,clip为函数,为期望;

54、评价网络的损失函数为:

55、

56、

57、其中,l(θ)为评价网络的损失函数,e(·)为期望函数,vθ(st)为当前的价值函数,即评价网络的输出,vθ(st+1)为下一时刻的价值函数,vtargetθ(st)为评估评价网络输出准确性的目标价值函数;

58、根据评价网络的损失函数,对评价网络进行梯度更新:

59、

60、其中,θ′为更新后的评价网络的参数,ηθ为评价网络的学习率,表示为评价网络损失函数关于评价网络的参数θ的梯度;

61、策略网络训练:

62、

63、vθ(st)=e(rt|st=s;π);

64、其中,为优势函数,表示在状态st下采取动作at相对于遵循策略π的平均性能的优势,rt为智能体在调度周期内获得的累积奖励,qθ(st,at)为动作价值函数,即在状态st下按照策略π执行动作at的奖励期望,用于量化风-光-荷以及调度计划方案的改变对运行经济性的影响,s为状态;

65、动作网络的参数更新为:

66、

67、其中,为动作网络的动态学习率,为更新后的动作网络的参数,为策略网络的损失函数关于评价网络的参数θ的策略梯度。

68、本发明的进一步改进在于:所述动作网络的动态学习率表达式为:

69、

70、其中,为动作网络的基准学习率,和分别为对新策略πθ(at,st)和旧策略πθold(at,st)的采样概率,clip为函数,ε为介于0和1之间的超参数。

71、本发明的一种配电网动态经济调度系统,包括:

72、所述模型构建模块,用于构建满足约束条件下的,以配电网运行经济成本最小为目标函数的新能源配电网的动态经济调度模型,其中,约束条件包括:功率平衡约束,系统节点电压约束,传输容量极限约束,分布式光伏发电机组、分布式风力发电机组以及微型燃气轮机的有功出力约束,爬坡约束,分布式电池储能系统的有功出力约束,分布式电池储能系统的荷电状态约束和分布式电池储能系统的时序耦合运行约束;

73、所述模型优化模块,用于将动态经济调度模型表述为马尔可夫决策过程,并确定相应的状态空间、动作空间以及奖励函数;

74、所述求解模块,用于通过深度强化学习算法求解被表述为马尔可夫决策过程的动态经济调度模型,得到自适应风光不确定性的动态调度策略。

75、本发明的进一步改进在于:目标函数的表达式为:

76、

77、其中,e(·)表示随机变量的期望值,t为调度周期,cgrid(t)为主网购电成本,cmt(t)为t时刻的内微型燃气轮机的调度运行成本,cba(t)为t时刻的分布式电池储能系统的调度运行成本,ct为t时刻的总成本。

78、本发明的电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述所述一种配电网动态经济调度方法的步骤。

79、本发明的一种计算机存储介质,所述计算机存储介质存储有配电网动态经济调度的程序,所述配电网动态经济调度的程序被至少一个处理器执行时实现上述所述一种配电网动态经济调度方法的步骤。

80、本发明的有益效果是:本发明计及风光的随机波动性和微型燃气轮机出力的时间耦合特性,建立以主网购电成本、微型燃气轮机运行成本以及分布式电池储能系统的运行成本总和最小的动态经济调度模型,避免对复杂随机变量建模,并可适应源荷预测偏差的不确定性。本发明能够从历史数据中学习到风光和负荷的概率分布,从而在期望的角度给出最优的动态经济调度策略。在线执行时,只需要将所观察到的状态输入到训练好的智能体当中便可快速输出调度决策结果,有效地减少了决策时间,可实现配电网的实时动态经济调度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1