本发明属于区域供暖热电综合利用领域,具体涉及一种用于区域供暖的氢热电联产优化调度方法及系统。
背景技术:
1、区域供暖是指通过集中供热系统向一定区域内的多个用户提供热量的方式,具有节能、环保、安全等优点。区域供暖系统通常由热源、热网和热用户三部分组成。热源是区域供暖系统的核心部分,决定了供暖系统的能耗、效率和环境影响。目前,常见的热源有燃煤、燃气、生物质、太阳能、地热等。
2、然而,传统的热源存在一些问题,如燃煤造成大量的碳排放和污染物排放,燃气受限于资源储备和价格波动,生物质受限于原料来源和运输成本,太阳能和地热受限于地理条件和季节变化等。因此,如何选择合适的热源并进行优化调度,以满足区域供暖的用热需求,同时提高能源利用效率和环境友好性,是一个亟待解决的问题。
3、氢能是一种清洁、高效、可再生的能源,具有广阔的应用前景。氢能可以通过电解水制氢、储氢、氢转电及储氢燃烧等方式实现氢热电联产,即同时产生电力和热量。氢热电联产可以有效提高氢能利用率和供暖效率,降低碳排放,并且可以根据用电和用热需求进行灵活调节。氢能通过热与电还可以与热泵技术结合,更充分地利用所在区域的资源禀赋和环境余热。
4、然而,氢能也存在一些挑战,如电解水制氢需要大量的电力输入,储氢需要高压或低温条件,氢转电及储氢燃烧需要高效且安全的装置等。因此,如何利用智能算法对氢能进行优化调控,以满足区域供暖的实时热负荷曲线,并与其他热源协同配合,是一个有价值的课题。
技术实现思路
1、本发明的目的是提供一种用于区域供暖的氢热电联产优化调度方法及系统,利用深度确定性策略梯度算法(ddpg)对多方热源进行智能调控,使其满足实时热负荷曲线的用热需求的同时提高氢能利用率和供暖效率,降低碳排放。
2、为了解决上述技术问题,本发明的技术方案是:
3、本发明提供了一种用于区域供暖的氢热电联产优化调度方法,包括以下步骤:
4、(1)建立区域供暖的热负荷预测模型,根据历史数据和实时数据对热负荷进行预测,并形成实时热负荷曲线;
5、(2)配置多方热源,包括:
6、电解槽利用低价电进行电解水制氢,产生第一热源;
7、将制取的氢气进行储存,储氢经燃料电池转化为电能和热,形成第二热源;
8、热泵利用转化的电能回收环境余热,产生第三热源;
9、将储氢经燃氢机组燃烧,产生第四热源;
10、周边燃煤或传统机组作为补充热源,形成第五热源;
11、(3)以区域供暖的热负荷需求和实际低价电输出量为约束条件,以第五热源用量最低为目标函数,采用ddpg深度确定性策略梯度算法设计对第一热源、第二热源、第三热源、第四热源和第五热源的优化调度模型,求解最优的负荷分配方式及控制参数;包括对制氢、储氢、氢转电及储氢燃烧的优化调控;在这里,实际低价电输出量是根据电价调峰情况,通过配电设备将低价电输出至电解槽装置;
12、(4)根据控制参数和热源利用优先级,对多方热源进行动态调节,以满足区域供暖的热负荷需求,并尽可能减少第五热源的使用,提高氢能利用率和供暖效率,降低碳排放。
13、进一步地,所述步骤(1)具体步骤如下:
14、1.1采集区域供暖的历史数据和历史相关因素数据;其中,所述历史数据包括但不限于用热量、用热时间、用热地点、用热类型;所述相关因素数据包括但不限于气温、湿度、风速、日照、节假日;
15、1.2对历史数据和历史相关因素数据进行预处理,包括但不限于缺失值处理、异常值处理、归一化处理;
16、1.3利用lstm算法作为热负荷预测模型,将预处理后的历史数据和历史相关因素数据划分为训练集和测试集;用训练集训练热负荷预测模型,并用测试集评估模型的准确性和泛化能力;
17、1.4采集区域供暖的实时数据和实时相关因素数据,对实时数据和实时相关因素数据进行步骤1.2中历史数据和历史相关因素数据相同的预处理;
18、1.5将预处理后的实时数据和实时相关因素数据输入热负荷预测模型,得到实时热负荷预测值;
19、1.6将实时热负荷预测值绘制成实时热负荷曲线,并输出显示。
20、特别地,步骤1.3中所述的采用lstm算法作为热负荷预测模型,具体包括如下:
21、1)构建lstm网络结构,包括输入层、隐藏层和输出层;其中输入层接收历史数据和相关因素数据作为特征向量,隐藏层采用多层lstm单元,输出层输出热负荷预测值;
22、2)初始化lstm网络的参数,包括权重矩阵和偏置向量;
23、3)利用均方误差(mse)定义损失函数,基于梯度的优化算法定义优化器;
24、4)将训练集分成多个小批量(mini-batch),每个小批量包含定量的连续时间序列数据;
25、5)对每个小批量,将特征向量输入lstm网络,得到热负荷预测值,并与真实值比较,计算损失值;
26、6)利用反向传播算法,根据损失值计算lstm网络参数的梯度,并利用优化器更新参数;
27、7)重复上述步骤直到损失值收敛或达到预设条件,并用测试集评估lstm网络的准确性和泛化能力,如计算均方根误差(rmse)、平均绝对百分比误差(mape)等指标。
28、进一步地,所述步骤(3)利用ddpg深度确定性策略梯度算法设计对第一热源、第二热源、第三热源、第四热源和第五热源的优化调度模型,具体步骤如下:
29、3.1定义状态空间、动作空间和奖励函数;
30、其中,状态空间为多方热源的各项参数,包括但不限于:电解槽的电压、电流、温度、压力;储氢装置的储氢量、压力、温度;燃料电池装置的输出功率、电压、电流、温度;热泵机组的输出功率、温度、压力;燃氢机组的输出功率、温度、压力;周边燃煤或传统机组的输出功率、温度、压力;
31、动作空间为多方热源的控制参数,包括但不限于:电解槽的电压调节量、电流调节量;储氢装置的储氢开关、放氢开关;燃料电池装置的输出功率调节量;燃氢装置的输出功率调节量;热泵机组的冷凝侧流量调节;周边燃煤或传统机组的输出功率调节量;
32、奖励函数为多方热源的综合效益,包括但不限于:满足区域供暖需求的程度、减少碳排放的程度、提高氢能利用率和供暖效率的程度及整个系统运行成本;
33、3.2构建深度神经网络作为行为者网络和评论者网络;
34、其中,行为者网络用于根据当前状态输出最优动作;评论者网络用于根据当前状态和动作评估奖励值;
35、行为者网络和评论者网络分别由输入层、隐藏层和输出层组成,输入层接收状态空间和动作空间;隐藏层采用多层感知(mlp)结构,输出层输出动作空间和奖励值;
36、3.3初始化目标网络和经验回放池;
37、其中,目标网络为行为者网络和评论者网络的副本,用于提供稳定的目标值,定期更新与主网络同步;经验回放池为大小固定的缓存区,用于存储历史经验,即状态-动作-奖励-下一状态(s-a-r-s’)四元组;
38、3.4进行交互学习和离线学习;
39、其中,所述交互学习是根据当前状态通过行为者网络选择动作,并执行该动作,观察下一状态和奖励,并将经验存入经验回放池;
40、所述离线学习是从经验回放池中随机抽取一批经验,并根据目标网络计算目标值,并利用梯度下降法更新主网络的参数,并定期更新目标网络与主网络同步;
41、3.5重复上述步骤直到收敛或达到预设条件。
42、收敛指行为者网络和评论者网络能够稳定地输出最优动作和最大奖励值,或达到预设条件指达到最大迭代次数或最大学习时间等。
43、进一步地,所述多方热源的各项状态参数是基于机理仿真映射模型获取,具体如下:
44、首先建立区域供暖多方热源系统结构的机理映射模型,通过有限试验工况运行的状态参数数据对模型进行辨识修正,得到修正后的高精度机理映射模型;
45、构建所需多工况条件,采用仿真系统运行高精度机理映射模型获得拓展的多工况运行的状态参数数据。
46、依据高精度机理映射模型获取优化调度模型的状态空间各项参数,有效避免大量历史数据的采集,提高系统运行效率。
47、进一步地,步骤(4)中所述热源利用优先级是在运行步骤(3)中所述的优化调度模型时设置热源利用优先级机制,使其优化调度满足实时热负荷曲线的用热需求的同时热源利用优先级依次为第一热源、第二热源、第三热源、第四热源和第五热源。
48、特别地,所述热源利用优先级机制具体规则如下:
49、首先利用第一热源,即电解水制氢产生的热量,来满足用热负荷需求,如果第一热源不足,则调节电解槽的电压和电流,增加制氢量和产热量;
50、其次在第一热源无法满足用热负荷需求时,增加利用第二热源,即储氢经燃料电池产生的电力和余热,来满足用热需求,如果第二热源不足,则调节储氢装置的放氢开关和燃料电池装置的输出功率,增加放氢量和产电量及余热量;
51、其次,在第一热源和第二热源累计仍不满足用热负荷需求时,增加利用第三热源,即热泵机组利用储氢经燃料电池产生的电力通过热泵回收环境余热,来满足用热需求,如果第三热源不足,则调节热泵机组的输出功率,增加余热回收量;
52、再次,在第一热源、第二热源和第三热源累计仍不满足用热负荷需求时,增加利用第四热源,即储氢经燃烧产生的热量,来满足用热负荷需求,如果第四热源不足,则调节储氢装置的放氢开关和燃氢装置的输出功率,增加放氢量和产热量;
53、最后在第一热源、第二热源、第三热源和第四热源累计仍不满足用热负荷需求时,增加第五热源即周边燃煤或传统机组产生的补充热量,调节周边燃煤或传统机组的输出功率,满足用热负荷需求;
54、如果第五热源必须使用,则调节周边燃煤或传统机组的输出功率,使其刚好满足剩余的用热需求。
55、进一步地,步骤(4)根据控制参数和热源利用优先级,对多方热源进行动态调节,对多方热源进行动态调节,以满足区域供暖的热负荷需求,具体步骤如下:
56、4.1读取实时热负荷曲线,确定当前时刻的用热需求;
57、4.2经机理映射模型获取多方热源的各项参数,构成当前状态;
58、4.3将当前状态输入行为者网络,得到最优动作,即控制参数;
59、4.4根据控制参数和热源利用优先级机制,对多方热源进行动态调节;
60、4.5执行动作后,读取下一时刻的多方热源的各项参数和奖励值,构成下一状态和奖励值;
61、4.5将当前状态、动作、奖励值和下一状态组成经验样本,存入经验回放池;
62、4.6从经验回放池中随机抽取一批经验样本,并根据目标网络计算目标值,并利用梯度下降法更新主网络的参数,并定期更新目标网络与主网络同步;
63、4.7重复上述步骤直到满足区域供暖需求。
64、在这里,梯度下降法是一种基于梯度的优化算法,用于寻找函数的最小值或最大值。梯度下降法的基本思想是,从一个初始点开始,沿着函数的负梯度方向(即下降最快的方向)移动一定步长,直到达到一个局部最小值或全局最小值。
65、梯度下降算法的具体步骤如下:
66、1)初始化参数,如学习率、迭代次数、误差阈值等;
67、2)随机选择一个初始点作为当前点;
68、3)计算当前点处的函数值和梯度值;
69、4)根据学习率和梯度值,更新当前点,使其沿着负梯度方向移动一定距离;
70、5)判断是否达到终止条件,如达到最大迭代次数或误差小于阈值等;
71、6)如果达到终止条件,则停止迭代,输出当前点作为最优解;否则,重复上述步骤。
72、进一步地,一种用于区域供暖的氢热电联产优化调度系统,包括:
73、热负荷预测模块,用于建立区域供暖的热负荷预测模型,并根据历史数据和实时数据对热负荷进行预测,并形成实时热负荷曲线;
74、多方热源模块,包括:
75、电解槽,用于利用低价电进行电解水制氢,产生第一热源;
76、储氢装置,用于将制取的氢气进行储存;
77、燃料电池装置,用于将储氢经燃料电池转化为电能和热,形成第二热源;
78、热泵机组,用于利用燃料电池装置产生的电能回收环境余热,产生第三热源;
79、燃氢机组,用于将储氢经燃烧产生第四热源;
80、周边燃煤或传统机组,作为补充热源,形成第五热源;
81、优化调度模块,以实时热负荷曲线的用热需求和实际低价电输出量为约束条件,第五热源用量最低为目标函数,采用ddpg深度确定性策略梯度算法设计对第一热源、第二热源、第三热源、第四热源和第五热源的优化调度模型,并求解最优的控制参数;
82、控制执行模块,用于根据控制参数和热源利用优先级机制,对多方热源进行动态调节,以满足区域供暖的热负荷需求,并尽可能减少第五热源的使用,提高氢能利用率和供暖效率,降低碳排放。
83、本发明的有益效果是:
84、1.利用lstm网络建立区域供暖的热负荷预测模型,能够准确地预测未来的用热需求,并形成实时热负荷曲线;
85、2.利用ddpg算法设计对多方热源的优化调度模型,能够根据实时热负荷曲线的用热需求,求解最优的控制参数,包括对制氢、储氢、氢转电及储氢燃烧的优化调控,实现氢热电联产的高效管理;
86、3.采用深度学习和强化学习的方法,能够自适应地学习和优化多方热源的调度策略,适应不同的场景和需求,具有智能性和灵活性
87、4.根据控制参数和热源利用优先级,对多方热源进行动态调节,以满足区域供暖的热负荷需求,并尽可能减少第四热源即传统燃煤机组的使用,提高氢能利用率和供暖效率,降低碳排放,实现区域供暖的节能环保。
88、其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
89、为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。