本发明属于智能电网中电压调节领域,尤其涉及一种基于transformer-rnn模型的电压调控方法、电子设备、介质。
背景技术:
1、随着智能电网技术的快速发展,电网的稳定性和效率成为了研究的重点。智能电网中电压调控是保证电网稳定运行的关键技术之一。传统的电压调控方法主要依赖于集中式控制策略,这种策略在处理复杂的电网环境和应对突发事件时往往显得不够灵活和及时。此外,随着分布式发电资源的广泛接入,电网结构变得更加复杂,单一的电压调控策略已经难以满足智能电网的需求。因此,如何有效地整合和协调电网中的多种资源,实现更加精细化和智能化的电压调控,成为了当前研究的热点问题。
2、近年来,多智能体系统因其在分布式决策和协调控制方面的优势而被广泛研究。在智能电网电压调控领域,通过构建多智能体模型,将电网中的各个组成部分视为独立的智能体,利用多智能体之间的协作实现更加高效和稳定的电压调控策略,已经显示出了巨大的潜力。然而,如何设计高效的多智能体学习算法,以快速适应电网环境的变化并做出准确的决策,仍然是一个挑战。特别是在大规模智能体协作和复杂环境条件下,传统的强化学习算法往往面临维数灾难和学习效率低下的问题。
技术实现思路
1、为了克服现有技术中电压调控方法在处理复杂电网环境和应对突发事件时的不足,本发明提出了一种基于transformer-rnn模型的电压调控方法、电子设备、介质。
2、第一方面,本发明实施例提供了一种基于transformer-rnn模型的电压调控方法,所述方法具体为:
3、通过并行的多智能体利用预先训练好的变换器-rnn模型处理多智能体观测值,所述多智能体观测值包括电网中每个节点上的电压、有功功率、无功功率,得到电压调控策略;
4、其中,transformer-rnn模型的训练过程为:
5、定义多智能体优化目标函数,将多智能体优化目标函数分解为每一智能体优化目标函数,基于每一智能体优化目标函数采用自注意力机制训练transformer模型;
6、根据训练好的transformer模型获取奖励函数,基于奖励函数通过rnn模型推断每一智能体的动作。
7、第二方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述的基于transformer-rnn模型的电压调控方法。
8、第三方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的基于transformer-rnn模型的电压调控方法。
9、第四方面,本发明实施例提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述的基于transformer-rnn模型的电压调控方法。
10、与现有技术相比,本发明的有益效果为:
11、本发明通过定义多智能体优化目标函数,将多智能体优化目标函数分解为每一智能体优化目标函数,基于每一智能体优化目标函数采用自注意力机制训练transformer模型;根据训练好的transformer模型获取奖励函数,基于奖励函数通过rnn模型推断每一智能体的动作。基于并行处理和自注意力机制,显著提高了多智能体学习的效率和准确性,能够快速响应电网状态的变化。
1.一种基于transformer-rnn模型的电压调控方法,其特征在于,所述方法具体为:
2.根据权利要求1所述的一种基于transformer-rnn模型的电压调控方法,其特征在于,多智能体优化目标函数的表达式为:
3.根据权利要求1所述的一种基于transformer-rnn模型的电压调控方法,其特征在于,将多智能体优化目标函数分解为每一智能体优化目标函数,所述每一智能体优化目标函数的表达式如下:
4.根据权利要求1所述的一种基于transformer-rnn模型的电压调控方法,其特征在于,所述方法还包括:定义一多智能体优势函数,用于解决信用分配问题;所述多智能体优势函数的表达式如下:
5.根据权利要求4所述的一种基于transformer-rnn模型的电压调控方法,其特征在于,将多智能体优势函数分别为单个智能体单独贡献度的总和,所述单个智能体单独贡献度的表达式如下:
6.根据权利要求1所述的一种基于transformer-rnn模型的电压调控方法,其特征在于,根据训练好的transformer模型获取奖励函数,所述奖励函数的表达式如下:
7.根据权利要求1所述的一种基于transformer-rnn模型的电压调控方法,其特征在于,所述方法还包括:
8.一种电子设备,包括存储器和处理器,其特征在于,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述权利要求1-7任一项所述的基于transformer-rnn模型的电压调控方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的基于transformer-rnn模型的电压调控方法。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1-7中任一所述的基于transformer-rnn模型的电压调控方法。