基于深度强化学习的移动能源网络实时能量管理方法及系统

文档序号：35022360发布日期：2023-08-04 18:00阅读：来源：国知局

技术特征：

1.一种基于深度强化学习的移动能源网络实时能量管理方法，其特征在于，包括：

2.根据权利要求1所述的基于深度强化学习的移动能源网络实时能量管理方法，其特征在于，所述状态空间采用：

3.根据权利要求1所述的基于深度强化学习的移动能源网络实时能量管理方法，其特征在于，所述q网络模型采用：

4.根据权利要求1所述的基于深度强化学习的移动能源网络实时能量管理方法，其特征在于，所述步骤s2采用：

5.根据权利要求1所述的基于深度强化学习的移动能源网络实时能量管理方法，其特征在于，所述步骤s2.4采用：

6.一种基于深度强化学习的移动能源网络实时能量管理系统，其特征在于，包括：

7.根据权利要求6所述的基于深度强化学习的移动能源网络实时能量管理系统，其特征在于，所述状态空间采用：

8.根据权利要求6所述的基于深度强化学习的移动能源网络实时能量管理系统，其特征在于，所述q网络模型采用：

9.根据权利要求6所述的基于深度强化学习的移动能源网络实时能量管理系统，其特征在于，所述模块m2采用：

10.根据权利要求6所述的基于深度强化学习的移动能源网络实时能量管理系统，其特征在于，所述模块m2.4采用：

技术总结
本发明提供了一种基于深度强化学习的移动能源网络实时能量管理方法及系统，包括：步骤S1：基于马尔科夫决策过程表征全电力船舶的实时能量调控过程，包括：状态空间、动作空间以及奖励函数；步骤S2：构建表示动作价值函数的Q网络模型，并利用状态空间、动作空间以及奖励函数采用DQN算法训练Q网络模型；步骤S3：基于当前状态空间通过训练后的Q网络模型选择决策动作，实现船舶的实时能量管理智能决策；所述Q网络模型是通过神经网络的输入输出拟合船舶期望做出最优能量管理智能决策的这一行为过程，实现了从状态空间到动作空间的映射，达到了依据船舶运行的实时状态进行最优能量管理的目的。

技术研发人员：文书礼,顾明昌,叶惠丽,朱淼,董晊兴,马建军,江昇,潘春阳,徐莉婷
受保护的技术使用者：上海交通大学
技术研发日：
技术公布日：2024/1/14

完整全部详细技术资料下载

当前第2页1 2