一种小型一体化反应堆运行多目标优化决策方法

文档序号:37349682发布日期:2024-03-18 18:28阅读:61来源:国知局
一种小型一体化反应堆运行多目标优化决策方法

本发明涉及一种决策方法,具体是一种小型一体化反应堆运行多目标优化决策方法。


背景技术:

1、随着核电的发展,为提高反应堆的性能,对于反应堆的优化研究成为重点。对核动力装置的重量、体积的优化设计可提高装置载体的载荷且更好布置反应堆,但目前对于反应堆的优化均为对于核动力装置中设备的设计优化研究,而对于同样可以提高反应堆性能的运行过程的决策优化研究还未开展。当前的反应堆运行过程中仍需操作员进行决策,在运行过程中可能出现的故障工况和某些瞬态工况(小型一体化反应堆的自然循环与强迫循环转换)需经验丰富的操作员参考运行手册结合经验并手动操作。可见反应堆不同于常规动力装置,对于能够提升运行性能的优化研究是很必要的。

2、结合人工智能的相关算法构建基于多目标优化决策的反应堆辅助运行决策系统,构建决策环境代理模型,并对核动力装置运行过程进行优化决策并进行决策结果验证工况转换过程是否超限,可对反应堆运行过程做出综合全面的决策。因此进行基于多目标优化决策问题和人工智能的反应堆运行决策算法研究是很有必要的,可在小型一体化反应堆的运行过程中辅助操作员进行实时决策,并实现无人化小型一体化反应堆运行优化决策。


技术实现思路

1、本发明的目的在于提供一种小型一体化反应堆运行多目标优化决策方法,以解决上述背景技术中提出的问题。

2、为实现上述目的,本发明提供如下技术方案:

3、一种小型一体化反应堆运行多目标优化决策方法,具体包括以下步骤:

4、s101、设定核动力装置运行限值和初始运行工况;

5、s201、建立多目标优化目标函数及其加权值;

6、s301、构建递归函数,建立多目标优化目标函数值与多目标优化可行解之间的定量关系;

7、s401、设计小型一体化反应堆运行多目标优化决策算法mo-a3c,并通过此算法获得最优稳态运行工况。

8、作为本发明进一步的方案:所述s101步骤具体包括:

9、s1011、设定核动力装置运行限值;

10、s1012、设定核动力装置初始工况下的稳态运行相关变量。

11、作为本发明进一步的方案:所述s201步骤具体包括:

12、s2011、建立安全性目标函数,考虑冷却剂出口温度和蒸汽过热度对反应堆和蒸汽发生器安全运行的影响;

13、s2012、建立经济性目标函数,考虑蒸汽温度和蒸汽流量对经济性的影响;

14、s2013、建立灵活性目标函数,考虑堆功率的相应性能;

15、s2014、根据不同的运行计划,参考成对比较法,对安全性、经济性、灵活性的考虑成都进行量化,设定目标函数的加权值。

16、作为本发明进一步的方案:所述s301步骤具体包括:

17、s3011、从实际系统或虚拟机中获取各个稳态运行工况下的训练数据集;

18、s3012、采用最小二乘法对训练数据集进行拟合,因变量分别对堆功率、蒸汽发生器出口蒸汽温度和堆芯出口冷却剂温度,自变量为蒸汽发生器蒸汽流量、冷却剂平均温度、稳压器压力、蒸汽压力以及故障信息;

19、s3013、递归函数基于多项式拟合,如下式所示:

20、

21、式中θ为多项式的各项系数;n为多项式阶数;

22、训练数据集内各数据点的误差平方和如下式所示:

23、

24、式中m为样本维度。

25、作为本发明进一步的方案:所述s401步骤具体包括:

26、s4011、状态输入部分为当前核动力设备的运行状态,该状态由小型一体化反应堆的堆芯冷却剂出口温度、堆功率、冷却剂平均温度、蒸汽温度、蒸汽流量、蒸汽发生器饱和温度参数所组成;

27、s4012、行动者网络actor与环境做互动来采样,输入为当前的状态st,输出为策略π(μ,σ|st;θ),其中θ为网络本身的参数,即在状态st下动作μ、σ的概率,σ范围在0-1之间,使用这两个参数构建正态分布,对这个正态分布横坐标进行采样后乘以动作范围得到行动者网络的预测动作,行动者网络actor的损失函数如下式所示:

28、

29、s4013、批判者critic网络使用q-value评价行动者网络产生动作的好坏,批判者网络的输入为状态st,输出为当前输入状态下的安全性、经济性、灵活性评价函数的权值,批判者网络的输出与评价指标相乘得到这个状态下安全性、经济性、灵活性评价函数的值,如下式所示:

30、

31、式中i多目标优化的目标函数个数;为目标i批判者critic的输出权值;为目标i的评价函数,其输入为状态;

32、mo-a3c算法中奖励制定为在行动者网络输出动作后转换到新状态的总优化目标函数减去当前状态总优化目标函数,如下式所示:

33、r=q(st+1,at+1)-q(st,at)

34、式中,q(st,at)为当前状态下总优化目标函数,q(st+1,at+1)为新状态下总优化目标函数;

35、批判者网络critic的损失函数如下式所示:

36、

37、与现有技术相比,本发明基于a3c架构,在其批判者网络后加以评价函数网络,以批判者网络输出为多目标优化总目标函数权值,开发出基于a3c算法的多目标优化决策算法mo-a3c,一定程度上使用数据驱动方法减弱了认为主观性对优化结果的影响;另外,基于多项式拟合设计了递归函数,加快了本研究中小型一体化反应堆多目标优化决策算法的训练速度,实现对小型一体化反应堆实时优化决策。



技术特征:

1.一种小型一体化反应堆运行多目标优化决策方法,其特征在于,具体包括以下步骤:

2.根据权利要求1所述的小型一体化反应堆运行多目标优化决策方法,其特征在于,所述s101步骤具体包括:

3.根据权利要求2所述的小型一体化反应堆运行多目标优化决策方法,其特征在于,所述s201步骤具体包括:

4.根据权利要求3所述的小型一体化反应堆运行多目标优化决策方法,其特征在于,所述s301步骤具体包括:

5.根据权利要求4所述的小型一体化反应堆运行多目标优化决策方法,其特征在于,所述s401步骤具体包括:


技术总结
本发明涉及一种决策方法,并具体公开了一种小型一体化反应堆运行多目标优化决策方法,具体包括以下步骤:S101、设定核动力装置运行限值和初始运行工况;S201、建立多目标优化目标函数及其加权值;S301、构建递归函数,建立多目标优化目标函数值与多目标优化可行解之间的定量关系;S401、设计小型一体化反应堆运行多目标优化决策算法MO‑A3C,并通过此算法获得最优稳态运行工况。基于A3C架构,在其批判者网络后加以评价函数网络,以批判者网络输出为多目标优化总目标函数权值,开发出基于A3C算法的多目标优化决策算法MO‑A3C,一定程度上使用数据驱动方法减弱了认为主观性对优化结果的影响。

技术研发人员:张博文,马浩宸,严辰星,成守宇,顾承炎,苏轲
受保护的技术使用者:哈尔滨工程大学
技术研发日:
技术公布日:2024/3/17
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1