一种充电调度方法、装置、设备及存储介质与流程

文档序号:26847169发布日期:2021-10-09 00:47阅读:来源:国知局

技术特征:
1.一种充电调度方法,其特征在于,包括:根据充电站的额定响应容量进行等分区间,构建状态空间;根据充电站的额定放电功率构建动作空间;确定所述状态空间中的当前状态元素,以及所述动作空间中的当前动作策略,构建当前状态动作对;根据电动汽车群的削峰填谷程度、充放电程度和违反运行约束的惩罚数据,确定所述当前状态动作对对应的奖励值,并确定所述状态空间中的下一状态元素;基于强化学习算法,根据每个当前状态动作对对应的奖励值,确定各所述当前状态动作对的得分数据,并根据各所述当前状态动作对的得分数据,从所述动作空间中选取目标动作策略。2.根据权利要求1所述的方法,其特征在于,所述根据充电站的额定响应容量进行等分区间,构建状态空间,包括:分别将弹性计划充电和转移性计划充电的电动汽车群响应容量的状态进行等分,并结合充电站的调度周期,生成至少一个状态元素;根据所述至少一个状态元素,构建所述状态空间。3.根据权利要求1所述的方法,其特征在于,所述根据充电站的额定放电功率构建动作空间,包括:根据所述充电站的调度频率和预设离散数量,对所述充电站的额定放电功率进行离散化处理,得到离散化尺度;根据所述离散化尺度,分别生成第一设定数量的弹性计划充电的弹性动作策略,以及第二设定数量的转移性计划充电的转移性动作策略;根据所述弹性动作策略和所述转移性动作策略,构建所述动作空间。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据配电网在当前时段的负荷功率、所述计划性充电的电动汽车群在所述当前时段的总充放电功率、以及所述配电网在所述当前时段的负荷功率平均值,确定所述电动汽车群的所述削峰填谷程度。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述计划性充电的电动汽车群在所述当前时段的总充放电功率和所述充电站的额定响应容量,确定所述电动汽车群的所述充放电程度。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:分别确定所述电动汽车群的容量约束惩罚数据、功率约束惩罚数据和倒送功率约束惩罚数据;根据所述容量约束惩罚数据、所述功率约束惩罚数据和所述倒送功率约束惩罚数据,确定所述违反运行约束的惩罚数据。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:根据所述当前时段的弹性计划充电和转移性计划充电的电动汽车群分别对应的蓄电池总容量的上下限数据和充放电功率、以及所述当前时段的相邻历史时段的弹性计划充电和转移性计划充电的电动汽车群分别对应的蓄电池总容量,确定所述电动汽车群的所述容量约束惩罚数据。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:根据弹性计划充电和转移性计划充电的电动汽车群分别在所述当前时段的充放电功率上限值和充放电功率,确定所述电动汽车群的所述功率约束惩罚数据。9.根据权利要求6所述的方法,其特征在于,所述方法还包括:根据所述弹性计划充电的电动汽车群在所述当前时段的充放电功率倒送功率最大限值,确定所述电动汽车群的所述倒送功率约束惩罚数据。10.一种充电调度装置,其特征在于,包括:状态空间构建模块,用于根据充电站的额定响应容量进行等分区间,构建状态空间;动作空间构建模块,用于根据充电站的额定放电功率构建动作空间;策略选取模块,用于确定所述状态空间中的当前状态元素,以及所述动作空间中的当前动作策略,构建当前状态动作对;奖励值确定模块,用于根据电动汽车群的削峰填谷程度、充放电程度和违反运行约束的惩罚数据,确定所述当前状态动作对对应的奖励值,并确定所述状态空间中的下一状态元素;目标策略选取模块,用于基于强化学习算法,根据每个当前状态动作对对应的奖励值,确定各所述当前状态动作对的得分数据,并根据各所述当前状态动作对的得分数据,从所述动作空间中选取目标动作策略。11.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1

9中任一项所述的一种充电调度方法。12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1

9中任一项所述的一种充电调度方法。

技术总结
本申请实施例公开了一种充电调度方法、装置、设备及存储介质,所述方法包括:根据充电站的额定响应容量进行等分区间,构建状态空间;根据充电站的额定放电功率构建动作空间;确定状态空间中的当前状态元素,以及动作空间中的当前动作策略,构建当前状态动作对;根据电动汽车群的削峰填谷程度、充放电程度和违反运行约束的惩罚数据,确定当前状态动作对对应的奖励值,并确定状态空间中的下一状态元素;基于强化学习算法,根据每个当前状态动作对对应的奖励值,确定各当前状态动作对的得分数据,并根据各当前状态动作对的得分数据,从动作空间中选取目标动作策略;通过上述技术方案,实现了对电动汽车群充放电行为的快速实时优化。了对电动汽车群充放电行为的快速实时优化。了对电动汽车群充放电行为的快速实时优化。


技术研发人员:张文杰 黄惠广 张文彪 朱晖煌 叶振江 邱上哲
受保护的技术使用者:广东电网有限责任公司惠州供电局
技术研发日:2021.07.29
技术公布日:2021/10/8
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1