基于增强pi控制的污水处理控制方法
技术领域
1.本发明涉及污水处理过程控制技术领域,具体涉及一种基于增强pi控制的污水处理控制方法。
背景技术:2.工业的发展以及人类生活水平的不断提高导致对水资源的需求量不断扩大,由此产生的废水对生态环境造成了巨大破坏,生存环境日趋严峻。因此提高污水处理过程中出水质量,实现淡水资源的持续利用和良性循环,一直是相关热门研究课题。
3.近些年来,我国污水行业有了较快的发展,但是由于缺少对污水处理过程的精确建模以及有效的优化控制,广泛存在着能耗高且效果差的问题。同时相关企业为保证在最恶劣的环境状况下排水达标,相关处理指标在初始规划时设定较高,导致建厂成本显著增加,日常运转时不能满负载运行,浪费大量有效产能。同时现阶段污水处理过程主要控制方法依然是传统的pid控制,针对污水工况波动较大的问题,很难保证达到污水处理的相关指标要求。针对污水过程的优化控制问题,有下述相关方案。
4.专利《一种基于动态多目标粒子群算法的城市污水处理过程优化控制方法》(公开号cn110161995a)实现对溶解氧so和硝态氮sno浓度的优化控制;该优化控制方法通过动态多目标粒子群优化算法对建立的污水处理过程优化目标进行优化,获得溶解氧so和硝态氮sno浓度的优化设定值,结合比例积分微分控制器对溶解氧so和硝态氮sno的优化设定值进行跟踪控制;解决了污水处理过程动态优化控制的问题,促进污水处理厂高效稳定运行。
5.专利《基于强化学习粒子群算法的污水处理优化控制方法》(公开号cn111290275a)包括下述步骤:(1)构建基于强化学习的污水处理过程智能体四要素:状态、环境、奖励及行动;(2)建立基于强化学习粒子群算法的污水处理优化控制流程:首先由神经网络模型预测浓度设定值调整趋势,加权至标准粒子群算法位置与速度更新公式,迭代更新,将全局最优作为硝态氮及溶解氧浓度设定值;然后获取进步粒子,记录其浓度设定值及调整趋势,训练神经网络模型;最后对神经网络模型进行评估与更新。
6.专利《pid
‑
lssvm稳态估计污水溶解氧控制方法》(公开号cn110412865a)中针对污水处理do控制滞后问题,提出了一种基于比例积分微分(pid)和最小二乘支持向量机(lssvm)稳态估计的控制方法;首先通过采集pid控制下各种状态数据,用lssvm来学习拟合出各初始状态与该状态下的pid控制器稳态输出值的关系,然后采用训练后的lssvm估计稳态输出和比例积分微分控制器相结合的方法进行do控制,当误差小于等于某预定值时,引入积分控制项,改善控制精度。
7.上述专利报道的方法以及其他相关文献提出的一些针对污水过程的先进控制方法,具有一定的效果,但是上述方案存在着一个主要问题就是计算量较大,而相关污水处理过程中,环境恶劣散热差,导致相关符合要求的设备造价昂贵,实用性较差。如采用专利《基于强化学习粒子群算法的污水处理优化控制方法》(公开号cn111290275a)方案:首先建立基于强化学习的污水处理过程智能体四要素:状态、环境、奖励及行动,其次建立基于强化
学习粒子群算法的污水处理优化控制流程,通过上述方案改善污水厂出水质量。而这种方案存在着计算量较大,污水现场环境较差难以满足计算需求。
8.为解决上述方案中计算量较大的问题,专利《一种基于边缘计算的污水分析处理方法和系统》(公开号cn110704497a)中在每个污水处理终端安装边缘计算终端,边缘计算终端与污水处理终端的排水口和入水口直接相连;边缘计算终端实时监测所连接的污水处理终端出入污水质量和污水处理量,并对出入污水质量和污水处理量进行存储、分析,得到第一分析结果,发送至数据中心;对所述边缘计算终端的第一分析结果进行历史数据统计和区域统计分析,得到第二分析结果,根据第二分析结果调整指定污水处理终端的配置。但是上述这种方案存在的主要问题在于原有的pid控制回路无法利用,且需要停产改建现有的污水设备,工期较长且费用较大,因此上述专利方案适合在新建污水处理厂时采用。但是实际中,存在大量采用pid控制回路的老旧污水处理厂,如何有效的改善这些污水处理厂的出水质量,同时最大限度的降低成本,已成为现实中亟待解决的重要难题。
9.为解决在污水处理过程中由于过程的耦合性和非线性较强,导致一般pid控制方案的效果较差,而如专利《基于动态多目标粒子群算法的城市污水处理过程优化控制方法》(公开号cn110161995a)中的基于动态多目标粒子群算法的城市污水处理过程优化控制方法,或者专利《基于强化学习粒子群算法的污水处理优化控制方法》(公开号cn111290275a)中的一种基于强化学习粒子群算法的污水处理优化控制方法,上述方案均需要停产改建设备导致成本较高,在实际生成中并不适用。
技术实现要素:10.针对现有技术的不足,本发明提出一一种基于增强pi控制的污水处理控制方法,包括:
11.步骤一:采集污水处理过程中的实时数据,所述实时数据包括硝态氮浓度s
no,2
、溶解氧浓度d
o,5
、溶解氧转换系数k
la,5
、内回流量q
a
;
12.步骤二:数据预处理,利用噪声尖峰滤波算法剔除实时数据中的噪声尖峰跳变数据,得到预处理后的实时数据;
13.步骤三:根据预处理后的实时数据构建基于rbf神经网络优化补偿输入的增强pi控制器,利用增强pi控制器输出溶解氧转换系数k
la,5
、内回流量q
a
的实时控制值;
14.步骤四:根据溶解氧转换系数k
la,5
、内回流量q
a
的实时控制值控制污水处理过程中硝态氮浓度s
no,2
、溶解氧浓度d
o,5
实时跟踪设定值,达到污水净化的目的。
15.所述步骤三包括:
16.步骤1:根据硝态氮浓度s
no,2
和溶解氧浓度d
o,5
的控制误差,采用pi控制器求取控制输入u
1k
;
17.步骤2:构建污水处理过程的非线性过程模型,利用扩展卡尔曼滤波技术估计模型的内部状态变量;
18.步骤3:将通过扩展卡尔曼滤波技术得到的估计状态向量作为rbf神经网络的输入,利用rbf神经网络优化pi控制器的补偿值;
19.步骤4:将得到的补偿值与pi控制器的控制输入u
1k
相结合,实现对pi控制器的增强,得到增强pi控制器,利用增强pi控制器输出溶解氧转换系数k
la,5
、内回流量q
a
的实时控
制值。
20.所述步骤1中的控制输入u
1k
表示为:
21.u
1k
=k
p
e
k
+k
i
z
k
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
22.式中:k
p
为pi控制器中的比例系数,k
i
为pi控制器中的积分系数,e
k
为控制误差,e
k
=r
‑
y
k
,z
k
为误差的积分,z
k
=z
k
‑1+e
k
,y
k
为采集到的硝态氮浓度s
no,2
和溶解氧浓度d
o,5
,r为硝态氮浓度s
no,2
和溶解氧浓度d
o,5
的设定值。
23.所述步骤2包括:
24.步骤2.1:建立污水处理过程的非线性过程模型:
[0025][0026]
式中,x
k
为k时刻的内部状态变量,y
k
为k时刻的控制输出量,即硝态氮浓度s
no,2
和溶解氧浓度d
o,5
,x
k
‑1为k
‑
1时刻的内部状态变量,w
k
为k时刻的过程噪声,u
k
‑1为k
‑
1时刻的控制输入量,即溶解氧转换系数k
la,5
、内回流量q
a
,v
k
为k时刻的测量噪声,f(
·
)为过程模型,h(
·
)为测量模型;
[0027]
步骤2.2:对公式(2)进行线性化处理求取函数的雅克比矩阵,得到相应的转移权值:
[0028][0029]
式中,为k时刻的先验方差矩阵,a
k
‑1为k
‑
1时刻下x
k
‑1的转移权值矩阵,p
k
‑1为k
‑
1时刻的方差矩阵,f
k
‑1为k
‑
1时刻下w
k
‑1的转移权值矩阵,q
k
‑1为k
‑
1时刻的过程噪声的方差,为f
k
‑1矩阵的转置,为k时刻状态变量的先验估计值,f
k
‑1(
·
)为k
‑
1时刻的过程模型,为污水处理过程中k
‑
1时刻状态变量的估计值;
[0030]
步骤2.3:根据公式(4)进行卡尔曼滤波器中状态变量的更新:
[0031][0032]
式中,k
k
为k时刻增益矩阵,为k时刻下x
k
的转移权值矩阵,z
k
为k时刻下v
k
的转移权值矩阵,为k时刻状态变量的估计值,r
k
为k时刻测量噪声的方差,h
k
(
·
)为k时刻的测量模型,i为单位矩阵,为后验估计方差矩阵。
[0033]
所述步骤3包括:
[0034]
步骤3.1:采用梯度下降算法优化rbf神经网络的权值向量,所述rbf神经网络的损失函数为:
[0035][0036]
式中,j
k
为k时刻损失函数的值,v
ik
为第i个输出误差的信息势,m为输出向量个数,
e
i
为第i个输出的跟踪误差,e(
·
)为取均值函数,r1、r2、r3为常数,u
2k
为补偿输入;
[0037]
步骤3.2:采用k均值聚类算法计算rbf神经网络中数据的中心向量;
[0038]
步骤3.3:采用梯度下降算法修正rbf神经网络内部的权值向量;
[0039]
步骤3.4:训练rbf神经网路,当达到最大迭代次数时停止运算,将最终的输出值作为pi控制器的补偿值。
[0040]
所述步骤3.2包括:
[0041]
步骤3.2.1:初始化聚类中心,设定聚类的总类数为n,从估计状态向量中随机选取n个对象为初始的聚类中心;
[0042]
步骤3.2.2:设定迭代终止条件,设置最大迭代次数为m,设置聚类中心的变化误差为
[0043]
步骤3.2.3:更新样本对象所属类,根据欧式距离准则将数据对象分配到距离聚类中心距离最小的类中,划分为n个类;
[0044]
步骤3.2.4:更新类的中心位置,将每一类的平均向量作为下次迭代的聚类中心;
[0045]
步骤3.2.5:重复步骤3.2.3~3.2.4直到达到最大迭代次数停止运算,将最后输出的聚类中心作为神经网络中数据的中心向量。
[0046]
所述步骤3.3包括:
[0047]
步骤3.3.1:初始化权值向量,设置精准度为设置学习速率为η;
[0048]
步骤3.3.2:通过差分法求解梯度值即其中,j
k'
为k时刻的损失函数,w
k
为k时刻的权值向量;
[0049]
步骤3.3.3:如果则将w
k
作为最优的权值向量,结束训练,否则执行步骤3.3.4;
[0050]
步骤3.3.4:更新权值向量,令
[0051]
步骤3.3.5:迭代次数加1,重复执行步骤3.3.2~步骤3.3.4直到达到最大迭代次数停止运算,输出权值向量的最优值。
[0052]
本发明的有益效果是:
[0053]
本发明提出了一种基于增强pi控制的污水处理控制方法,现有的污水处理流程大多数依然采用是传统pi控制器结构,导致控制精度不高,当污水处理过程的状态发生较大变化时,出水质量也跟着有较大起伏,容易导致出水质量不达标。相关厂家为避免这种状况,在建厂之初往往设计较多的冗余量来提高污水处理过程的控制效果,这导致在日常时刻工厂不能在有效负载下充分运行,浪费大量资源。而本方法提出的增强补偿算法能有效提高污水出水水质,降低污水处理过程中的波动,提高相关控制精度,显著提升了污水处理过程的效率,提升了能源利用率。且本方案实施过程中无需对现有的设备进行较大的改动,只是通过加入增强补偿信号来提高控制精度,降低控制误差的熵。
附图说明
[0054]
图1为本发明实施例中基于增强pi控制的污水处理控制方法流程图;
[0055]
图2为本发明实施例中基于增强pi控制的污水处理控制方法的控制原理图;
[0056]
图3为本发明实施例中污水处理过程的示意图;
[0057]
图4为本发明实施例中基于增强pi控制的污水处理控制方法的控制结果图,(a)为仿真步长前300时未加入补偿的结果图,(b)为仿真步长后300时加入补偿的结果图;
具体实施方式
[0058]
下面结合附图和具体实施实例对发明做进一步说明。本方法针对一类使用pid控制回路的污水处理厂,由于污水过程较强的非线性耦合性导致pid控制效果较差的问题,在不拆除现有设备停产改建的基础上,仅通过加入补偿输入信号来提高控制精度,改善出水水质,具体方案如下所述,目前国内外还没有针对污水处理过程的增强pi控制方法及系统。本发明提出了一种基于增强pi控制的污水处理控制方法,主要是通过rbf神经网络求取一个最优的补偿输入来提高控制精度降低控制误差的波动,rbf神经网络的内部权值参数以降低损失函数为标准通过梯度下降算法进行修正,而神经网络的输入为通过扩展卡尔曼滤波技术求取的系统状态变量的后验估计值。
[0059]
如图1所示,一种基于增强pi控制的污水处理控制方法,包括:
[0060]
步骤一:采集污水处理过程中的实时数据,所述实时数据包括硝态氮浓度s
no,2
、溶解氧浓度d
o,5
、溶解氧转换系数k
la,5
、内回流量q
a
;
[0061]
如图3所示一种污水处理过程的示意图,图3中1、2、3、4为四个仪器,1为采集生化反应池二区硝态氮浓度的硝态氮浓度分析仪(型号为tno3g
‑
3062x),2为采集五区回流至二区的内回流量的流量测试仪(型号为thwater
‑
1),3为采集溶解氧转换系数的溶解氧转换系数测试仪(型号为pp
‑
201),4为采集好氧区第五区溶解氧浓度的溶解氧浓度测试仪(型号为bdo
‑
200a),5为控制总线,6为服务器(型号为poweredge r940xa),通过服务器构建增强pi控制器,对污水处理过程生化反应池二区硝态氮浓度和五区溶解氧浓度进行控制;其中,以五区溶解氧转换系数和五区回流至二区的内回流量为输入变量,利用增强pi控制器输出溶解氧转换系数k
la,5
、内回流量q
a
的实时控制值,通过控制总线传输给五区充氧泵控制阀、内回流泵控制阀,实现对硝态氮浓度s
no,2
、溶解氧浓度d
o,5
的实时控制,控制原理图如图2所示。
[0062]
仪器1采集当前时刻污水处理过程中生化池厌氧区第二单元硝态氮浓度s
no,2
;仪器4测量计算好氧区第五单元溶解氧浓度d
o,5
,上述第二单元硝态氮浓度s
no,2
和第五单元溶解氧浓度d
o,5
为被控输出变量,即y1=s
no,2
,y2=d
o,5
,y=[y
1 y2]
t
。仪器2测量计算五区回流至二区的内回流量q
a
,通过仪器3测量计算五区溶解氧转换系数k
la,5
。上述五区溶解氧转换系数和五区回流至二区的内回流量为输入变量,u1=q
a
,u2=k
la,5
,为总体输入为u=[u1,u2]。
[0063]
即主要通过五区溶解氧转换系数和五区回流至二区的内回流量来调节第二单元硝态氮浓度和第五单元溶解氧浓度。而五区溶解氧转换系数主要通过鼓风机进行调节,五区回流至二区的内回流量主要通过流量泵进行调节。
[0064]
步骤二:数据预处理,由于污水处理过程的不稳定和检测设备不精确造成的跳变
数据,利用噪声尖峰滤波算法剔除实时数据中的噪声尖峰跳变数据,得到预处理后的实时数据,避免产生较大误差,影响控制效果的稳定性;
[0065]
污水五区溶解氧转换系数和五区回流至二区的内回流量为控制输入变量,u1=q
a
,u2=k
la,5
,本方案即通过求取控制输入使得第二单元硝态氮浓度s
no,2
和第五单元溶解氧浓度d
o,5
跟踪设定值变化,以此改善污水出水质量。
[0066]
pid控制器中,比例环节的作用是成比例地反映控制系统的偏差信号,偏差一旦产生,立即产生控制作用以减小偏差。比例控制器的输出u(t)与输入偏差e(t)成正比,能迅速反映偏差,从而减小偏差,但不能消除静差。而控制器中积分环节的作用就是为了消除自控系统的余差而设置的。所谓积分,就是随时间进行累积的意思,即当有偏差输入e存在时,积分控制器就要将偏差随时间不断累积起来,也就是积分累积的快慢与偏差e的大小和积分速度成正比。只要有偏差e存在,积分控制器的输出就要改变,也就是说积分总是起作用的,只有偏差不存在时,积分才会停止。微分环节的作用能反映偏差信号的变化趋势(变化速率),并能在偏差信号的值变得太大之前,在系统中引入一个有效的早期修正信号,从而加快系统的动作速度,减小调节时间。积分控制作用的引入虽然可以消除静差,但是降低了系统的响应速度,特别是对于具有较大惯性的被控对象,用pi控制器很难得到很好的动态调节品质,系统会产生较大的超调和振荡,这时可以引入微分作用。针对污水处理过程中的特点,本专利中仅采用比例环节和积分环节来计算基本的控制输入u
1k
。
[0067]
步骤三:根据预处理后的实时数据构建基于rbf(径向基)神经网络优化补偿输入的增强pi控制器,利用增强pi控制器输出溶解氧转换系数k
la,5
、内回流量q
a
的实时控制值;包括:
[0068]
步骤1根据硝态氮浓度s
no,2
和溶解氧浓度d
o,5
的控制误差,采用pi控制器求取控制输入u
1k
表示为:
[0069]
u
1k
=k
p
e
k
+k
i
z
k
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0070]
式中:k
p
为pi控制器中的比例系数,k
i
为pi控制器中的积分系数,e
k
为控制误差,e
k
=r
‑
y
k
,z
k
为误差的积分,z
k
=z
k
‑1+e
k
,y
k
为采集到的生化池厌氧区第二单元硝态氮浓度s
no,2
和好氧区第五单元溶解氧浓度d
o,5
,r为生化池厌氧区第二单元硝态氮浓度s
no,2
和好氧区第五单元溶解氧浓度d
o,5
的设定值。
[0071]
考虑到rbf神经网络能够逼近任意的非线性函数,可以处理系统内的难以解析的规律性,具有良好的泛化能力,并有很快的学习收敛速度,已成功应用于非线性函数逼近、时间序列分析、数据分类、模式识别、信息处理、图像处理、系统建模、控制和故障诊断等,由于污水处理过程较强的非线性以及耦合特性,同时考虑到计算复杂度,因此选择rbf神经网络用来求取最优的补偿输入。
[0072]
采用扩展卡尔曼滤波技术计算系统当前状态估计值,采用rbf神经网络获取针对降低控制误差的补偿输入值。由于污水处理过程非线性多耦合的关系,传统的pid控制技术仅利用输入输出信息进行控制,难以满足更高精度的控制要求。因此这里通过引入系统的内部状态信息改善控制效果,而污水处理过程中相关变量难以测量因此首先通过扩展卡尔曼滤波技术估计系统的内部状态变量,具体步骤如下所示:
[0073]
卡尔曼滤波(kalman filter)是一种高效率的递归滤波器(自回归滤波器),它能够从一系列的不完全及包含噪声的测量中,估计动态系统的状态。卡尔曼滤波会根据各测
量在不同时间下的值,考虑各时间下的联合分布,再产生对未知变数的估计,因此会比只以单一测量为基础的估计方式要准。但是卡尔曼滤波一般只针对线性系统,而污水处理过程是一个典型的非线性系统,因此,通过扩展卡尔曼滤波技术估计系统的当前状态向量。
[0074]
步骤2:构建污水处理过程的非线性过程模型,利用扩展卡尔曼滤波技术估计模型的内部状态变量;包括:
[0075]
步骤2.1:建立污水处理过程的非线性过程模型:
[0076][0077]
式中,x
k
为k时刻的内部状态变量,y
k
为k时刻的控制输出量,即硝态氮浓度s
no,2
和溶解氧浓度d
o,5
,x
k
‑1为k
‑
1时刻的内部状态变量,w
k
为k时刻的过程噪声,u
k
‑1为k
‑
1时刻的控制输入量,即溶解氧转换系数k
la,5
、内回流量q
a
,v
k
为k时刻的测量噪声,f(
·
)为过程模型,h(
·
)为测量模型;扩展卡尔曼滤波针对非线性系统具有较好的估计效果,其主要分为预测和更新过程,其中预测过程主要通过模型预测系统状态变量的先验估计值。
[0078]
步骤2.2:对公式(2)进行线性化处理求取函数的雅克比矩阵,得到相应的转移权值:
[0079][0080]
式中,为k时刻的先验方差矩阵,a
k
‑1为k
‑
1时刻下x
k
‑1的转移权值矩阵,p
k
‑1为k
‑
1时刻的方差矩阵,f
k
‑1为k
‑
1时刻下w
k
‑1的转移权值矩阵,q
k
‑1为k
‑
1时刻的过程噪声的方差,为f
k
‑1矩阵的转置,为k时刻状态变量的先验估计值,f
k
‑1(
·
)为k
‑
1时刻的过程模型,为污水处理过程中k
‑
1时刻状态变量的估计值;
[0081]
实际测量值可以用来修正状态变量的预测值以提高精度,则更新过程如下:
[0082]
步骤2.3:根据公式(4)进行卡尔曼滤波器中状态变量的更新:
[0083][0084]
式中,k
k
为k时刻增益矩阵,为k时刻下x
k
的转移权值矩阵,z
k
为k时刻下v
k
的转移权值矩阵,为k时刻针对污水处理过程的状态变量的估计值,r
k
为k时刻测量噪声的方差,h
k
(
·
)为k时刻的测量模型,i为单位矩阵,为后验估计方差矩阵。
[0085]
采用扩展卡尔曼滤波技术获得污水处理过程中多元信息融合的状态变量,作为求取补偿输入的基础。
[0086]
步骤3:将通过扩展卡尔曼滤波技术得到的估计状态向量作为rbf神经网络的输入,利用rbf神经网络优化pi控制器的补偿值;包括:
[0087]
步骤3.1:采用梯度下降算法优化rbf神经网络的权值向量,所述rbf神经网络的损失函数为:
[0088][0089]
式中,j
k
为k时刻损失函数的值,r1为常数,v
ik
为第i个输出误差的信息势,m为输出向量个数,e
i
为第i个输出的跟踪误差,e(
·
)为取均值函数,r1、r2、r3为常数,u
2k
为补偿输入;
[0090]
rbf神经网络的输入为由扩展卡尔曼滤波技术得到的系统估计状态向量,神经网络的输出则为补偿输入,神经网络的输入为:
[0091][0092]
rbf神经网络训练步骤分为无监督学习和有监督学习两个部分,其中无监督学习主要是训练神经网络的隐藏层输出,如下所示:
[0093][0094][0095]
式中:为rbf神经网络的隐藏层输出,c
j
为数据的中心向量,σ为径向基核函数的核大小。具体的针对上述隐藏层输出,采用k均值聚类算法求取数据的中心向量c
j
,并以此确定rbf神经网络的隐藏层输出。
[0096]
步骤3.2:采用k均值聚类算法计算rbf神经网络中数据的中心向量;包括:
[0097]
步骤3.2.1:初始化聚类中心,设定聚类的总类数为n,从估计状态向量中随机选取n个对象为初始的聚类中心;
[0098]
步骤3.2.2:设定迭代终止条件,设置最大迭代次数为m,设置聚类中心的变化误差为
[0099]
步骤3.2.3:更新样本对象所属类,根据欧式距离准则将数据对象分配到距离聚类中心距离最小的类中,划分为n个类;
[0100]
步骤3.2.4:更新类的中心位置,将每一类的平均向量作为下次迭代的聚类中心;
[0101]
步骤3.2.5:重复步骤3.2.3~3.2.4直到达到最大迭代次数停止运算,将最后输出的聚类中心作为神经网络中数据的中心向量。
[0102]
有监督学习部分确定了rbf神经网络的隐藏层输出,之后通过修正神经网络输出层权值向量,输出层权值向量如下所示:
[0103][0104]
通过修正该权值向量获得最优的神经网络输出,而修正准则为降低损失函数,修正方法为通过梯度下降法。梯度下降法是最常用的最优算法之一。当目标函数是凸函数时,梯度下降法的解是全局解。一般情况下,其解不保证是全局最优解,梯度下降法的速度也未
必是最快的。同时还需要假设函数是可微的,否则无法获得封闭解(即给出任意的自变量就可以求出其因变量)。梯度下降法是一阶优化算法(因为只利用到了函数的一阶导数信息),其思想是用当前位置负梯度方向作为搜索方向,移动与当前位置负梯度成比例的一段步长。因为该方向为当前位置的最快下降方向,所以也被称为是最速下降法。
[0105]
步骤3.3:采用梯度下降算法修正rbf神经网络内部的权值向量;包括:
[0106]
步骤3.3.1:初始化权值向量,设置精准度为设置学习速率为η;
[0107]
步骤3.3.2:通过差分法求解梯度值即其中,j
k'
为k时刻的损失函数,w
k
为k时刻的权值向量;
[0108]
步骤3.3.3:如果则将w
k
作为最优的权值向量,结束训练,否则执行步骤3.3.4;
[0109]
步骤3.3.4:更新权值向量,令
[0110]
步骤3.3.5:迭代次数加1,重复执行步骤3.3.2~步骤3.3.4直到达到最大迭代次数停止运算,输出权值向量的最优值。
[0111]
步骤3.4:训练rbf神经网路,当达到最大迭代次数时停止运算,将最终的输出值作为pi控制器的补偿值。
[0112]
求取最优的权值向量后可以获得神经网络的输出,同时神经网络的输出即为最优的补偿输入,如下所示:
[0113][0114]
式中:为待优化的神经网络的权值向量,为通过扩展卡尔曼滤波技术得到的系统状态向量的估计值,u
2k
为增强补偿信号。通过将上述pi控制器求取的基本控制输入,和由补偿器求取的最优补偿输入结合在一起获得最终的控制输入,即u
k
=u
1k
+u
2k
。
[0115]
步骤4:将得到的补偿值和pi控制器的控制输入u
1k
相结合,实现对pi控制器的增强,得到增强pi控制器,利用增强pi控制器输出溶解氧转换系数k
la,5
、内回流量q
a
的实时控制值。
[0116]
步骤四:根据溶解氧转换系数k
la,5
、内回流量q
a
的实时控制值控制污水处理过程中硝态氮浓度s
no,2
、溶解氧浓度d
o,5
实时跟踪设定值,达到污水净化的目的。
[0117]
将得到的内回流量q
a
和五区溶解氧转换系数k
la,5
的值传递给实际污水处理厂中对应的控制阀,通过实时更新控制阀的值得到期望的二区硝态氮s
no,2
浓度和五区溶解氧d
o,5
浓度;将由增强pi控制器得到的内回流量q
a
的值传递给内回流泵控制阀,通过实时改变回流泵阀的开合将q
a
的值传递给污水处理过程进行生化反应;将由增强pi控制器得到的五区溶解氧转换系数k
la,5
的值传递给五区充氧泵控制阀,通过实时改变充氧泵阀的开合将k
la,5
的值传递给污水处理过程进行生化反应;通过控制内回流泵阀和充氧泵阀的开合,控制污水处理生化反应,可进一步实现对二区硝态氮s
no,2
浓度和五区溶解氧d
o,5
浓度的控制,得到期望的s
no,2
浓度和d
o,5
浓度值,达到污水净化的目的。
[0118]
为验证本发明方法的有效性,采用c#高级语言进行编程实现,所用数据均为实际
的污水处理过程中采集的数据,训练数据为500组历史样本,通过测试集进行模型评估,模拟了污水处理过程中在本发明方法下的效果图,如图4所示,其中仿真步长前300时未加入补偿输入,后300时加入补偿输入。从图4可以看出在本发明所提供的方法下污水处理后的硝态氮浓度和溶解氧浓度的控制精度有效提高。