1.一种含新能源电网各区域的协同控制方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述第一算法的设定,包括:
3.如权利要求2所述的方法,其特征在于,所述值函数更新约束,按下式表示:
4.如权利要求2所述的方法,其特征在于,所述值函数更新式,按下式表示:
5.如权利要求2所述的方法,其特征在于,所述权重函数的设定,包括:引入权重参数并结合动作值探索产生的动作值最大值和动作值最小值设定权重函数;
6.如权利要求5所述的方法,其特征在于,所述权重函数,按下式表示:
7.如权利要求2所述的方法,其特征在于,所述存储值函数基于所述状态量、动作值和时间差分误差构建;所述时间差分误差基于延时更新策略产生。
8.如权利要求7所述的方法,其特征在于,所述存储值函数,按下式表示:
9.如权利要求2所述的方法,其特征在于,状态量对应的奖励值的生成,包括:
10.如权利要求9所述的方法,其特征在于,所述奖励函数的设定,包括:
11.如权利要求10所述的方法,其特征在于,所述奖励函数,按下式表示:
12.如权利要求2所述的方法,其特征在于,所述基于所述运行信息,利用预设的第一算法生成所述运行信息对应的控制信号,包括:
13.如权利要求12所述的方法,其特征在于,所述利用权重函数确定所述存储值函数的动作值探索方式,并以奖励值累积最大化为目标,基于所述状态量利用所述动作值探索方式对所述状态量对应的动作值进行探索,包括:
14.一种含新能源电网各区域的协同控制智能体,其特征在于,所述智能体设置于含新能源电网的各区域中,所述智能体包括:感知模块和控制模块;
15.如权利要求14所述的智能体,其特征在于,所述控制模块中第一算法的设定,包括:
16.一种计算机可读存储介质,其特征在于,其上存有计算机程序,所述计算机程序被执行时,实现如权利要求1至13中任一项的一种含新能源电网各区域的协同控制方法。