本发明涉及光伏并网点电压控制,并且更具体地,涉一种基于演员-评论家机制的光伏并网点电压控制方法及系统。
背景技术:
1、光伏发电系统是目前广泛应用于能源领域的一种可再生能源发电方式,它利用太阳能将光能转化为电能,光伏发电系统的关键问题之一是如何将产生的电能并网,即将发电系统的电能与电网进行有效的连接,然而,光伏发电系统的电压波动较大,可能会对电网造成影响。
2、现有的光伏并网点电压存在其经常会出现波动情况,此时电压波动可能会导致光伏发电系统输出的电能质量下降,影响电网稳定运行,电压波动还可能引起电力设备的故障,进而影响电能的传输和分配,同时电压波动会导致光伏电池的工作状态不稳定,从而降低发电效率,长期存在的电压波动会导致光伏发电系统发电量减少,增加了能源的浪费的问题。
技术实现思路
1、针对上述问题,本发明提出了一种用于光伏并网点的电压控制方法,包括:
2、对光伏并网点进行实时监测,以获取所述光伏并网点的电网状态数据及光伏输出数据;
3、通过演员网络根据所述实电网状态数据及光伏输出数据,生成控制策略,通过评论家网络对所述控制策略进行效用值评估,基于评估结果,对所述控制策略进行更新,生成更新策略;
4、以所述更新策略生成行动方式,以所述行动方式执行控制动作,对所述光伏并网点的电压进行控制。
5、可选的,电网状态数据,包括:电压数据及功率数据。
6、可选的,光伏输出数据,包括:逆变器状态数据。
7、可选的,通过评论家网络对所述控制策略进行效用值评估,包括:
8、通过评论家网络对实时电网状态和期望电网状态进行对比,获取对比结果,基于所述对比结果,确定所述控制策略的效用值。
9、可选的,通过光伏并网点的状态及行动,确定奖励,基于确定的奖励更新演员网络和评论家网络。
10、可选的,确定奖励的奖励函数公式如下:
11、r=-α|v-vtarget|-β|ploss|-γδv
12、其中,r为奖励,α、β、γ为权重系数,v为光伏并网点当前电压,vtarget为目标电压值,δv为电压波动率,ploss为台区线损。
13、再一方面,本发明还提出了一种用于光伏并网点的电压控制系统,包括:
14、实时监测单元,用于对光伏并网点进行实时监测,以获取所述光伏并网点的电网状态数据及光伏输出数据;
15、演员评论家单元,用于通过演员网络根据所述实电网状态数据及光伏输出数据,生成控制策略,通过评论家网络对所述控制策略进行效用值评估,基于评估结果,对所述控制策略进行更新,生成更新策略;
16、控制单元,用于以所述更新策略生成行动方式,以所述行动方式执行控制动作,对所述光伏并网点的电压进行控制。
17、可选的,电网状态数据,包括:电压数据及功率数据。
18、可选的,光伏输出数据,包括:逆变器状态数据。
19、可选的,通过评论家网络对所述控制策略进行效用值评估,包括:
20、通过评论家网络对实时电网状态和期望电网状态进行对比,获取对比结果,基于所述对比结果,确定所述控制策略的效用值。
21、可选的,演员评论加单元通过光伏并网点的状态及行动,确定奖励,基于确定的奖励更新演员网络和评论家网络。
22、可选的,确定奖励的奖励函数公式如下:
23、r=-α|v-vtarget|-β|ploss|-γδv
24、其中,r为奖励,α、β、γ为权重系数,v为光伏并网点当前电压,vtarget为目标电压值,δv为电压波动率,ploss为台区线损。
25、再一方面,本发明还提供了一种计算设备,包括:一个或多个处理器;
26、处理器,用于执行一个或多个程序;
27、当所述一个或多个程序被所述一个或多个处理器执行时,实现如上述所述的方法。
28、再一方面,本发明还提供了一种计算机可读存储介质,其上存有计算机程序,所述计算机程序被执行时,实现如上述所述的方法。
29、与现有技术相比,本发明的有益效果为:
30、本发明提供了一种用于光伏并网点的电压控制方法,包括:对光伏并网点进行实时监测,以获取所述光伏并网点的电网状态数据及光伏输出数据;通过演员网络根据所述实电网状态数据及光伏输出数据,生成控制策略,通过评论家网络对所述控制策略进行效用值评估,基于评估结果,对所述控制策略进行更新,生成更新策略;以所述更新策略生成行动方式,以所述行动方式执行控制动作,对所述光伏并网点的电压进行控制。本发明的应用,提高了能源的利用效率。
1.一种基于演员-评论家机制的光伏并网点电压控制方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述电网状态数据,包括:电压数据及功率数据。
3.根据权利要求1所述的方法,其特征在于,所述光伏输出数据,包括:逆变器状态数据。
4.根据权利要求1所述的方法,其特征在于,所述通过评论家网络对所述控制策略进行效用值评估,包括:
5.根据权利要求1所述的方法,其特征在于,通过光伏并网点的状态及行动,确定奖励,基于确定的奖励更新演员网络和评论家网络。
6.根据权利要求5所述的方法,其特征在于,所述确定奖励的奖励函数公式如下:
7.一种基于演员-评论家机制的光伏并网点电压控制系统,其特征在于,包括:
8.根据权利要求7所述的系统,其特征在于,所述电网状态数据,包括:电压数据及功率数据。
9.根据权利要求7所述的系统,其特征在于,所述光伏输出数据,包括:逆变器状态数据。
10.根据权利要求7所述的系统,其特征在于,所述通过评论家网络对所述控制策略进行效用值评估,包括:
11.根据权利要求7所述的系统,其特征在于,所述演员评论加单元通过光伏并网点的状态及行动,确定奖励,基于确定的奖励更新演员网络和评论家网络。
12.根据权利要求11所述的系统,其特征在于,所述确定奖励的奖励函数公式如下:
13.一种计算机设备,其特征在于,包括:
14.一种计算机可读存储介质,其特征在于,其上存有计算机程序,所述计算机程序被执行时,实现如权利要求1-6中任一所述的方法。