本发明属于电力系统自动化,具体涉及一种通信与电气耦合下主配协同电压优化控制方法及设备。
背景技术:
1、随着我国新能源发电规模呈现爆发式增长,且具有分布式、集中式并重的特点。然而随着新能源渗透率的不断提高,其量大分散、波动性强的特点也为配电网的运行控制带来了严峻的挑战。发电功率与负荷需求间的不平衡会改变配电网的潮流分布,造成局部消纳困难的同时,也会使得末端电压抬升和网损增加,由电压越限导致的电源脱网和供电中断的风险加剧,配电网的感知与运行变得更为复杂,需要传输的运行与控制数据呈指数倍增,这对5g网络中通信资源分配提出了挑战。
2、主动配电网的电压控制分为集中式控制,局部控制和分布式控制。集中式控制需要通信网络进行协调,配电网有限的带宽和突发的通信干扰会影响其性能和稳定性。时间延迟会导致控制信号滞后,降低动态性能,特别是在可再生能源接入的低惯性电网中。不同的通信信道,如光纤、无线等,提供的通信服务具有不同的时延,时延从几十毫秒到几百毫秒不等。局部控制被认为是处理快速电压波动且具有通信独立性和快速响应的主要解决方案。但在某些情况下,它们可能无法确保电压保持在可接受的范围内,而且不协调的相互作用甚至可能加剧稳定性和电网安全问题。分布式控制与相邻的智能体交换信息,可以充分利用光伏的快速响应能力。
3、数据驱动的方法能够用于解决模型不完整或难以依靠数学方法构建的问题,同时在决策速度上优势显著。多智能体强化学习可将各个调节装置独自视为智能体,并通过其之间完全合作的方式寻找最优动作策略。相关论文研究了将多区域协调电压/无功控制优化问题重构为部分可观测马尔可夫博弈,并利用调整后的多智能体深度确定性策略梯度算法来求解,但是未考虑通信传输延迟对于配电网分布式电压控制的影响,并不适配可调控资源耦合下的分布式电压控制。
技术实现思路
1、本发明提出的一种通信与电气耦合下主配协同电压优化控制方法及设备,可至少解决背景技术中的技术问题之一。
2、为实现上述目的,本发明采用了以下技术方案:
3、一种通信与电气耦合下主配协同电压优化控制方法,包括以下步骤:
4、s100、基于主动配电网拓扑结构进行区域划分,通过设备采集各分区的网络参数,构建配电网潮流模型以及电压灵敏度矩阵;
5、s200、构建基于可变延迟的通信传输网络;
6、s300、根据配电网潮流模型、通信传输网络及电压灵敏度矩阵,构建通信与电力耦合的分布式电压控制模型,建立以节点电压扰动偏差以及控制成本最小的优化目标,并设定控制约束;
7、s400、将分布式电压控制模型分解为相邻分区信息交互、多个分区并行控制优化的子模型,并对子模型利用部分可观测马尔可夫模型重构;
8、s500、对重构后的模型采用多智能体强化学习算法进行离线训练,确定电压控制方法。
9、进一步地,本发明的步骤s100中配电网潮流模型以及电压灵敏度矩阵构建方法包括:
10、s110、假设第个节点上有负载和光伏,构建z约束方程;
11、主动配电网潮流约束方程如下:
12、
13、其中,表示第个节点上光伏的有功功率,表示第个节点上光伏的无功功率;表示第个节点上负载的有功功率,表示第个节点上负载的无功功率;与分别表示第个节点与第个节点的电压;与分别表示为第个节点与第个节点之间的电导和电纳的实部与虚部;表示第个节点与第个节点之间电压相角差;
14、s120、根据主动配电网潮流约束方程,求解节点电压对光伏有功功率的灵敏度矩阵和节点电压对光伏无功功率的灵敏度矩阵:
15、
16、其中,、分别为节点电压幅值对于有功、无功的偏导阵。
17、进一步地,本发明的步骤s200中通信传输网络构建方法包括:
18、s210、选择多个具有不同恒定延迟的传输通道;
19、假设资源有限的通信网络是可变延迟的传输服务器;
20、用表示多个具有不同恒定延迟的传输通道,具体公式如下:
21、
22、其中,表示具有有界延迟的通道;
23、s220、根据不同恒定延迟的传输通道,求解通信网络传输能力约束;
24、(4)
25、其中,表示通道的传输能力。
26、进一步地,本发明的步骤s300中构建通信与电力耦合的分布式电压控制模型方法如下:
27、搭建第个调控周期的控制变量数学模型,具体数学模型如下:
28、(5)
29、(6)
30、其中,(t)表示在第个调控周期所有传输延迟的集合,表示第个控制指令的传输延迟,表示控制指令在第个调控周期通过第个通道传送到个光伏节点上的延迟;在第个调控周期传输延迟为(t)的控制变量集合,表示第个调控周期传输延迟为时第个光伏节点的控制动作,,为主动配电网光伏节点集合,,分别表示考虑传输延迟的所有光伏节点的有功与无功功率的变化量的集合;表示转置;
31、由第个调控周期的节点电压运行状态为初始值,构建考虑传输延迟的电压预测模型:
32、
33、
34、其中,v(t+1)为第t+1调控周期的节点电压,v(t)为第t个调控周期的节点电压,为系统控制矩阵,为灵敏度矩阵,为参数不确定矩阵;
35、传输通道的切换利用系统控制矩阵构建考虑通信传输通道调度和电压控制耦合模型:
36、
37、其中,表示随传输通道切换变化的系统控制矩阵,,表示传输通道切换产生的不同组合的总数;表示传输通道调度指令,表示调度指令约束,具体公示如下:
38、
39、
40、构建区域中节点电压扰动偏差以及控制成本最小的目标函数:
41、
42、其中,为参考电压,表示与控制变量相关的权重矩阵,w表示与节点电压相关的权重矩阵,为调控周期集合;
43、构建目标函数的节点电压约束:
44、
45、式(12)中,表示电压的下界,分别表示电压的上界;表示绝对值;
46、构建通信传输通道调度和电压控制耦合模型中光伏逆变器功率的约束条件:
47、
48、
49、
50、
51、其中,表示节点上光伏有功功率的下界,表示节点上光伏有功功率的上界,表示节点上光伏无功功率的下界,分别表示节点上光伏无功功率的上界,表示节点上光伏额定功率,表示光伏容量因数。
52、进一步地,本发明的步骤s400中对子模型利用部分可观测马尔可夫模型重构方法包括:
53、以第t个周期为例:
54、多智能体集合表示为,每个智能体管理一个主动配电网的分区;
55、电压控制的部分可观测马尔可夫模型中的状态空间;
56、
57、其中,表示上一时刻传输延迟为时在节点上的光伏无功控制指令,表示第个智能体内光伏节点的集合;
58、电压控制的部分可观测马尔可夫模型中的动作空间;
59、
60、
61、其中,表示第个智能体的动作空间,表示传输延迟为时在节点上的光伏无功控制指令;
62、电压控制的部分可观测马尔可夫模型中的局部观测集合;
63、
64、
65、
66、其中,表示在区域中的局部观测集合,表示在区域中测量的主动配电网运行状态;
67、电压控制的部分可观测马尔可夫模型中的奖励函数;
68、。
69、进一步地,本发明的步骤s500中多智能体强化学习算法进行离线训练方法包括:
70、1)输入配电网基本信息;
71、2)设置训练超参数,各配电网分区智能体随机初始化网络参数,共享经验回放池初始化;
72、3)设置最大训练回合与单个回合训练时间步,设置当前训练回合;
73、4)初始化当前训练时间步;
74、5)各配电网区域智能体分别获取本区域内的配电网当前状态;
75、6)各配电网区域智能体根据第5)步的配电网状态,给出动作,并通过本区域内分布式光伏逆变器无功出力来执行动作;
76、7)利用式(23)确定奖励,利用式(17)-(19)确定状态和动作;
77、8)配电网各区域进入下一状态,各配电网区域智能体将本地经验[]储存至共享经验回放池中;
78、9)各配电网区域智能体从共享经验回放池进行采样,使用反向梯度传播算法更新网络参数;
79、10)若,则,并返回5),否则进入下一步;
80、其中,表示训练时步;
81、11)计算各配电网区域智能体收敛指标,并保存:
82、
83、其中,表示折扣因子;
84、12)若<,则=+1,并返回步骤4),否则进入下一步;
85、13)比较每个回合的。
86、又一方面,本发明还公开一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。
87、再一方面,本发明还公开一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上方法的步骤。
88、由上述技术方案可知,本发明提出“模型预测滚动优化框架+部分可观测马尔可夫决策过程”的联合建模方法,将主配网协同电压控制问题分解为相邻分区信息交互与多分区并行优化子问题,并在状态空间、动作空间中嵌入通信延迟,实现通信网络与电气系统的动态耦合建模。