一种神经网络优化控制器及控制方法

文档序号：6323386阅读：925来源：国知局

专利名称：一种神经网络优化控制器及控制方法
技术领域：
本发明涉及一种神经网络优化控制器及控制方法。
背景技术：
神经网络控制属于智能控制。它物理实现简单，与其它类型智能控制相比，较为实用，目前已在倒立摆控制、机械手控制及水下遥控机器人纵向姿态调节中获得成功应用。但是，在缺乏数学模型的复杂过程控制如工业过程控制等应用未见报导。
神经网络控制代表性结果之一为Nguyen1990年(Derrick H，Nguyen，et al.Neural Networks for Self-learning Control Systems.IEEE Cont.Sys.Mag.1990，(4)18-23)所提方法。该文采用一个多层前馈网络辨识被控对象，采用另一个神经网络作为控制器，通过学习控制对象仿真器训练神经网络控制器，解决优化控制中的终态控制问题，并给出卡车倒退定位控制仿真结果。这个思想对于解决复杂过程对象优化控制问题具有一定参考价值，因为复杂过程对象普遍缺乏精确数学模型，使得优化控制无法实现。但是，采用此方法解决复杂过程控制，需要解决以下问题1)神经网络控制器训练结构与算法都是基于状态空间模型确定，要求状态变量可以测量，但是，在一般复杂过程控制中，状态变量或者不存在或者无法测量，并且主要使用输入输出模型；2)没有考虑控制量存在约束情况，而复杂过程控制中控制变量有约束；3)仅仅解决了单目标优化控制问题，而复杂过程控制中还需要考虑多目标优化控制问题。

发明内容
针对上述现有方法中存在的缺点，本发明所要解决的问题是提供基于输入输出模型的一种神经网络优化控制器及控制方法，实现对于复杂过程对象进行约束控制作用下的多目标优化控制。
本发明解决其技术问题所采用的技术方案是一种神经网络优化控制器，包括控制器神经网络装置、训练结构装置、训练算法装置，控制器神经网络装置用于根据复杂过程对象输出信号序列计算出优化控制信号序列，使得复杂过程对象在该控制信号序列作用下，得到优化控制效果；训练结构装置，用于将优化控制律综合问题转化为由控制器神经网络和复杂过程对象仿真器神经网络组成的组合网络训练问题；训练算法装置，用于训练所述组合网络。
一种神经网络优化控制方法，包括控制器神经网络，用于根据复杂过程对象输出信号序列计算出优化控制信号序列；训练结构，用于将优化控制律综合问题转化为由控制器神经网络和复杂过程对象仿真器神经网络组成的组合网络训练问题；训练算法，推导组合网络内不同控制器神经网络和复杂过程对象仿真器神经网络之间连接处等效误差计算公式，用于训练所述组合网络，得到优化控制器神经网络；所述训练结构通过将整个控制过程时间分割成至少2个时间单元，将至少2个时间单元的神经网络按输入输出信号对应关系连接起来形成组合网络；所述训练算法包括，组合网络输出与理想输出一致性衡量函数设定；控制器神经网络输出层神经元作用函数设定；控制器神经网络与所述复杂过程对象仿真器神经网络之间互相连接的等效误差计算。
本发明具有下述优点1、本发明的神经网络优化控制器适用于控制复杂过程对象，因为神经网络优化控制器是基于输入输出模型生成控制信号，通过输出反馈而不是状态反馈实现优化控制，通常情况下对于复杂过程对象来说不一定存在状态空间模型，但总可以用输入输出模型描述该对象；此外，复杂过程对象一般来说不存在精确数学模型，这样就无法实现传统的基于被控对象精确数学模型的优化控制，本发明的控制器不需要精确数学模型，只要提供一个已经辨识了复杂过程对象的即已经训练成功的对象仿真器神经网络，就可以实现优化控制。
2、本发明用智能方法综合优化控制律，实现单目标优化控制。通过将整个控制过程时间分割成多个时间单元，降低复杂过程对象输入输出之间关系以及输出反馈控制器输入输出之间关系中的动态成分，然后利用多层前馈网络表现所述输入输出关系，将不同时间单元的神经网络按输入输出信号对应关系连接起来形成组合网络，用所述组合网络表现优化控制过程，将神经网络训练时的网络输出与理想输出一致性衡量函数设定为优化控制的指标函数形式，这样将通常困难的优化控制律综合问题巧妙地转化为组合网络训练问题，进一步推导出组合网络等效误差计算公式，解决了组合网络训练问题即组合网络中控制器神经网络训练问题，通过神经网络训练得到优化控制律；与传统的用分析的手段综合优化控制律相比，这是通过智能手段自动得到优化控制律。
3、在实现单目标优化控制基础上，本发明通过修改神经网络训练时的网络输出与理想输出一致性衡量函数，体现多目标优化控制指标函数，修改控制器神经网络输出层神经元作用函数，体现控制量存在约束情况，然后推导出组合网络等效误差计算公式，解决了更为复杂的多目标有约束控制的优化控制问题。

下面结合附图对本发明进行作进一步详细说明，图1是本发明优选实施例的感应加热神经网络优化控制系统控制器神经网络结构图。
图2是本发明优选实施例的感应加热神经网络优化控制系统组合网络训练结构图。
图3是本发明优选实施例的感应加热温度神经网络优化控制系统组成示意图。
图4是本发明优选实施例的感应加热温度神经网络优化控制系统原理图。
图5是本发明优选实施例的感应加热温度神经网络优化控制系统中频电源调功部分修改电路图。
图6是本发明优选实施例的感应加热温度神经网络优化控制系统组合网络训练流程图。
图7是本发明优选实施例的感应加热温度神经网络优化控制系统组合网络等效误差计算流程图。
图8是本发明优选实施例的感应加热温度神经网络优化控制系统控制流程图。
图9是本发明优选实施例的感应加热温度神经网络优化控制结果。
图10是本发明的神经网络优化控制方法流程图。
图11是本发明神经网络优化控制器结构图。
具体实施例方式
实施例1一种神经网络优化控制方法，包括控制器神经网络，用于根据复杂过程对象输出信号序列计算出优化控制信号序列；训练结构，用于将优化控制律综合问题转化为由控制器神经网络和复杂过程对象仿真器神经网络组成的组合网络训练问题；训练算法，推导组合网络内不同控制器神经网络和复杂过程对象仿真器神经网络之间连接处等效误差计算公式，用于训练所述组合网络，得到优化控制器神经网络；所述训练结构通过将整个控制过程时间分割成至少2个时间单元，将至少2个时间单元的神经网络按输入输出信号对应关系连接起来形成组合网络；
所述训练算法包括，组合网络输出与理想输出一致性衡量函数设定；控制器神经网络输出层神经元作用函数设定；控制器神经网络与所述复杂过程对象仿真器神经网络之间互相连接的等效误差计算。
上述方法流程如图10所示。一种神经网络优化控制器结构如图11所示，其中C0、C1、C2、CT分别表示0单元到T单元控制器神经网络，u0、u1、u2、uT分别表示0单元到T单元控制器神经网络输出的优化控制信号，yp0表示复杂过程对象初始输出值，yp1、yp2、ypT、ypT+1分别表示0单元到T单元复杂过程对象在控制信号作用下的输出值，yd表示在优化控制信号作用下对复杂过程对象输出期望值。
第一步将控制过程时间细分为多个时间单元，如分割成至少2个时间单元，以降低对复杂对象建模的动态性要求并增加控制量分辨率；用神经网络对复杂对象的时间单元特性建模并生成优化控制律，称为单元网络；所述组合网络装置是由多个或至少2个单元网络连接组成，所述单元网络数目等于控制过程所包含的时间单元数目。
第二步所述单元网络装置包括一个所述复杂过程对象仿真器神经网络Ek，用于表示该时间单元内的复杂过程对象的输入输出特性ykP=F[yk-1P,···,yk-nP,uk-1,···,uk-m]]]>其中k表示单元时间序号，ykP、yk-1P、yk-nP、uk-1、uk-m分别为复杂过程对象在k、k-1、k-n时间单元的输出信号以及在k-1、k-m时间单元对复杂过程对象施加的控制信号，n、m分别为输出信号与控制信号的阶次；所述复杂过程对象仿真器神经网络装置输出信号为yk，是复杂过程对象在相同时间单元的输出信号ykP的仿真值，输入层神经元为占位单元，输入层神经元数目等于m+n，输入信号端为yk-1，…，yk-n，uk-1，…，uk-m；所述复杂过程对象仿真器神经网络装置采用复杂过程对象阶跃响应信号完成训练后，辅助所述控制器神经网络装置进行训练。
第三步设计控制器神经网络Ck，用于计算k时间单元优化控制量。如图1所示，所述控制器神经网络装置，输入层神经元为占位单元，隐层神经元作用函数为Sigmoid函数，输出层神经元作用函数为线性函数；所述输入层神经元输入端在所述控制器神经网络装置训练时连接所述复杂过程对象仿真器神经网络输出信号端，记为yk，用于通过误差反传进行训练，在所述控制器神经网络装置实施控制时连接复杂过程对象输出信号端，记为ykP，参见图11中yp0、yp1、yp2、ypT，用于对所述复杂过程对象输出信号进行神经计算处理；所述输出层神经元输出信号记为uk，在所述控制器神经网络装置训练时用于产生前向信号，在所述控制器神经网络装置实施控制时，用于控制所述复杂过程对象，参见图11中u0、u1、u2、uT。
第四步不同时间单元网络Ek、Ck构成组合网络。
所述复杂过程对象仿真器神经网络装置Ek的输出信号yk，与下一个时间单元的单元网络中控制器神经网络装置输入端相连，输入信号端yk-1，…，yk-n，uk-1，…，uk-m，分别与其他单元网络中复杂过程对象仿真器神经网络装置输出信号端以及控制器神经网络装置输出信号端中具有相同标记的信号端相连接。
第五步用组合网络等效误差公式训练控制器网络；或用误差反传(BP)算法训练控制器网络，所述反向传播算法的等效误差计算包括单个所述控制器神经网络装置或者所述复杂过程对象仿真器神经网络装置内部连接的等效误差计算，所述控制器神经网络装置与所述复杂过程对象仿真器神经网络装置之间互相连接的等效误差计算。
所述控制器神经网络装置与所述复杂过程对象仿真器神经网络装置之间互相连接的等效误差计算公式包括单目标优化控制情况下的计算公式和多目标且控制量存在约束的优化控制情况下的计算公式。
所述单目标优化控制情况下的计算公式为δTE(yT+1)=yd-yT+1---(1)]]> 其中，T为实施控制过程对应的时间单元数最大值，要求既大于m又大于nh为时间单元数变量，变化范围是0～Tyd为优化控制终态目标值，也是训练所述组合网络装置的期望输出值δTE(yT+1)为T时间单元复杂过程对象仿真器神经网络装置输出信号端点yT+1等效误差δT-hC(uT-h)为T-h时间单元控制器神经网络装置输出信号端点uT-h等效误差δT-iE(uT-h)为T-i时间单元复杂过程对象仿真器神经网络装置输入信号端点uT-h的等效误差δT-h+iE(uT-h)为T-h+i时间单元复杂过程对象仿真器神经网络装置输入信号端点uT-h的等效误差δT-hE(yT-h+1)为T-h时间单元复杂过程对象仿真器神经网络装置输入信号端点yT-h+1等效误差δT-h+1C(uT-h+1)为T-h+1时间单元控制器神经网络装置输出信号端点uT-h+1等效误差δT-iE(yT-h+1)为T-i时间单元复杂过程对象仿真器神经网络装置输入信号端点yT-h+1等效误差δT-h+iE(yT-h+1)为T-h+i时间单元复杂过程对象仿真器神经网络装置输入信号端点yT-h+1等效误差训练时由h＝0开始计算，体现误差反传；所述单目标优化控制的计算公式是在所述控制器神经网络装置与所述复杂过程对象仿真器神经网络装置输入层神经元为占位单元条件、所述控制器神经网络装置与所述复杂过程对象仿真器神经网络装置之间互相连接均为直接相连即连接权值等于1以及将神经网络训练时的网络输出与理想输出一致性衡量函数设定为12[yd-yT+1]2---(4)]]>的条件下，根据求全导数法则推导得出；根据所述单目标优化控制的计算公式训练所述组合网络即训练其中的控制器神经网络装置成功后，运用该控制器神经网络装置控制复杂过程对象，可以实现性能指标函数为12[yd-yT+1]2]]>的单目标优化控制。
所述多目标且控制量存在约束的优化控制情况下的计算公式为δTE(yT+1)=α(yd-yT+1)---(5)]]>
其中，α、β为多目标优化控制性能指标函数中多项指标的加权因子A、B分别为约束控制量的下界与上界uh为h时间单元控制器神经网络装置输出信号值uT-h为T-h时间单元控制器神经网络装置输出信号值训练时由h＝0开始计算，体现误差反传；为了推导所述多目标且控制量存在约束的优化控制的计算公式，需将神经网络装置训练时的网络输出与理想输出一致性衡量函数设定为12[α×(yd-yT+1)2+β×Σh=0Tuh2]---(8)]]>另外，作为用数学形式表现控制量存在约束的一个优选方案，将所述控制器神经网络装置输出层神经元作用函数设定为uh=A-B1+exp(-Nnet(h))+B---(9)]]>其中exp(·)为指数函数，Nnet(h)为h时间单元控制器神经网络装置输出神经元的输入信号值；根据所述多目标且控制量存在约束优化控制的计算公式训练所述组合网络即训练其中的控制器神经网络装置成功后，运用该控制器神经网络装置控制复杂过程对象，可以实现性能指标函数为12[α×(yd-yT+1)2+β×Σh=0Tuh2]]]>的多目标优化控制，且控制量满足如下约束A≤uh≤B
第六步训练成功判断，成功运行到第七步；不成功运行到第五步。
第七步由各时间单元的控制器神经网络得到优化控制律。
第八步应用所述控制器神经网络装置实施优化控制，参见图11。
实施例2感应加热涉及磁、电、热传导等物理过程，因机理复杂难以提出准确数学模型，无法实现传统优化控制，采用神经网络优化控制方法，可以实现加热升温过程优化控制，控制系统如图3所示。
根据本发明实施的感应加热神经网络优化控制系统参照图1-图8设计。根据被控对象确定输入输出模型结构为n＝1，m＝3，对象仿真器网络为4输入1输出神经网络；控制器神经网络结构为π(1×4×1)，如图1所示；控制过程时间单元数为5。组合网络及其训练结构如图2所示，其中C0、C1、C2、C3、C4分别表示0时间单元到4时间单元控制器神经网络，E0、E1、E2、E3、E4分别表示0时间单元到4时间单元对象仿真器神经网络，u0、u1、u2、u3、u4分别表示0时间单元到4时间单元控制器神经网络输出信号，y1、y2、y3、y4、y5分别表示0时间单元到4时间单元对象仿真器神经网络输出信号，y0为对象仿真器神经网络输出信号初始值，u-1、u-2表示控制器神经网络输出信号初始值，设置为零，不同时间单元对象仿真器神经网络以及控制器神经网络输入输出信号之间连接关系用相应信号间的连接实线表示。
参见图6，图6是感应加热温度神经网络优化控制系统组合网络训练流程图。
第一步设置循环变量初值为0；第二步若训练周期数目未达到要求，则继续训练，进入下一步；第三步组合网络由0时间单元到4时间单元进行前向计算；第四步至第八步在n＝1、m＝3、T＝4条件下，按公式(8)计算指标函数值；
第九步若指标函数值小于等于预定值，则跳到第二十步；第十步若指标函数值大于预定值，则进行组合网络误差反向传播计算；第十一步组合网络中控制器神经网络计算权值调整量；第十二步至第十四步如果未检测到敲击“ALT_C”键，则跳到第二十步；第十五步至第十七步如果检测到敲击“ALT_C”键，则提示神经网络训练已中断及其原因，显示已进行训练的周期数及指标函数值，提示是否继续训练；第十八步如果不继续训练，则跳到第二十三步；第十九步如果继续训练，则进入下一步；第二十步循环变量值加1后，若小于训练周期数最大值，则跳到第三步；第二十一步循环变量值加1后，若大于等于训练周期数最大值，则将经过训练得到的控制器神经网络权值存入数据文件，以备实施控制时使用；第二十二步提示已经达到最大训练周期数并显示指标函数值；第二十三步结束程序参见图7，图7是感应加热温度神经网络优化控制系统组合网络等效误差计算流程图。
第一步在n＝1、m＝3、T＝4条件下，按公式(5)计算4时间单元对象仿真器神经网络输出端等效误差；第二步通过误差反向传播计算4时间单元对象仿真器神经网络输入层神经元等效误差；第三步至第四步在n＝1、m＝3、T＝4以及控制量是否存在约束条件下，按公式(6)计算4时间单元控制器神经网络输出端等效误差；第五步通过误差反向传播计算4时间单元控制器神经网络输入层神经元等效误差；第六步在n＝1、m＝3、T＝4条件下，按公式(7)计算3时间单元对象仿真器神经网络输出端等效误差；第七步通过误差反向传播计算3时间单元对象仿真器神经网络输入层神经元等效误差；第八步至第九步在n＝1、m＝3、T＝4以及控制量是否存在约束条件下，按公式(6)计算3时间单元控制器神经网络输出端等效误差；第十步通过误差反向传播计算3时间单元控制器神经网络输入层神经元等效误差；第十一步至第十八步采用循环程序，依次计算2时间单元、1时间单元以及0时间单元的对象仿真器神经网络与控制器神经网络输出端等效误差。
参见图8，图8是感应加热温度神经网络优化控制系统控制流程图。
第一步设置循环变量初值为0；第二步如果循环变量小于5，则进入下一步；第三步通过启动模/数(A/D)转换器工作，采样加热工件表面温度值；第四步根据采样温度值，通过循环变量对应时间单元控制器神经网络前向计算，得到优化控制量；第五步将优化控制量输出到数/模(D/A)转换器，控制温度；第六步至第八步等待下一个时间单元；第九步循环变量值加1后，若小于5，则跳到第三步；第十步循环变量值加1后，若大于等于5，则采样加热工件表面温度值并显示；
第十一步控制程序结束。
参见图4，图4是感应加热温度神经网络优化控制系统原理图。其中可控硅中频电源型号为KGPS250-8.0，额定功率250Kw，频率8Khz；感应器(铜质、单匝)内径56mm，高度100mm；加热工件(不锈钢管)外径22mm，壁厚3mm；红外温度计单元型号为0Q06-11C，规格为35P1200，透镜孔径为35mm，配用多卡电子信号处理单元型号为2M-Q06-11C，分度号为Q202C，选用“输出1”端为测温输出端，与A/D转换器信号输入端相连；A/D、D/A转换器采用PC总线A/D板SS34；经过改造的中频电源调功电路参见图5，其中优化控制量数值经过数/模(D/A)转换成为电压信号，经过放大电路，控制可控硅触发角。加热工件表面温度由红外温度计单元检测，经过多卡电子信号处理单元放大成为标准电信号，经过A/D转换成为数字量送入工业控制计算机，由软件实现的神经网络优化控制算法，通过对温度数字量进行处理得到优化控制信号，经过D/A转换成为电压信号，调节中频电源产生的电磁波频率及功率，达到控制加热工件温度目的。
针对升温准确性，准确加节能，有约束控制等不同情况，进行升温控制实验，实验参数为实验1 y0＝626℃，yd＝680℃，α＝1，β＝0；实验2 y0＝626℃，yd＝680℃，α＝1，β＝50；实验3 y0＝626℃，yd＝680℃，α＝1，β＝50.B＝0.2V，A＝1.9V.
实验结果为实验1 终态温度偏差1.34℃，能量2.549；实验2 终态温度偏差0.23℃，能量2.487(优)；实验3 终态温度偏差-0.26℃，能量2.624.
终态温度偏差为实际升温与给定温度之差。
控制实验中控制量以及温度值变化曲线参见图9，图中三角点为控制量值，圆圈点为温度值。
权利要求
1.一种神经网络优化控制器，其特征在于包括控制器神经网络装置、训练结构装置、训练算法装置，控制器神经网络装置用于根据复杂过程对象输出信号序列计算出优化控制信号序列，使得复杂过程对象在该控制信号序列作用下，得到优化控制效果；训练结构装置，用于将优化控制律综合问题转化为由控制器神经网络和复杂过程对象仿真器神经网络组成的组合网络训练问题；训练算法装置，用于训练所述组合网络。
2.根据权利要求1的所述的一种神经网络优化控制器，其特征在于所述训练结构装置通过将整个控制过程时间分割成至少2个时间单元，将不同时间单元的神经网络按输入输出信号对应关系连接起来形成组合网络；所述训练算法装置包括，组合网络输出与理想输出一致性衡量函数设定；控制器神经网络输出层神经元作用函数设定；控制器神经网络与所述复杂过程对象仿真器神经网络之间互相连接的等效误差计算。
3.一种神经网络优化控制方法，包括控制器神经网络，用于根据复杂过程对象输出信号序列计算出优化控制信号序列；训练结构，用于将优化控制律综合问题转化为由控制器神经网络和复杂过程对象仿真器神经网络组成的组合网络训练问题；训练算法，推导组合网络内不同控制器神经网络和复杂过程对象仿真器神经网络之间连接处等效误差计算公式，用于训练所述组合网络，得到优化控制器神经网络；其特征在于所述训练结构通过将整个控制过程时间分割成至少2个时间单元，将不同时间单元的神经网络按输入输出信号对应关系连接起来形成组合网络；所述训练算法包括，组合网络输出与理想输出一致性衡量函数设定；控制器神经网络输出层神经元作用函数设定；控制器神经网络与所述复杂过程对象仿真器神经网络之间互相连接的等效误差计算。
4.根据权利要求3的所述的一种神经网络优化控制方法，其特征在于，所述的组合网络输出与理想输出一致性衡量函数设定，设定的函数形式为12[α×(yd-yT+1)2+β×Σh=0Tuh2].]]>
5.根据权利要求3的所述的一种神经网络优化控制方法，其特征在于，控制器神经网络输出层神经元作用函数设定，设定的函数形式为uh=A-B1+exp(-Nnet(h))+B.]]>
6.根据权利要求3的所述的一种神经网络优化控制方法，其特征在于，所述的等效误差计算公式包括单目标优化控制情况下的计算公式和多目标且控制量存在约束的优化控制情况下的计算公式，所述单目标优化控制情况下的计算公式为δTE(yT+1)=yd-yT+1]]> 所述多目标且控制量存在约束的优化控制情况下的计算公式为δTE(yT+1)=α(yd-yT+1)]]>
全文摘要
一种神经网络优化控制器及控制方法，包括控制器神经网络，用于根据复杂过程对象输出信号序列计算出优化控制信号序列；训练结构装置，用于将优化控制律综合问题转化为由控制器神经网络和复杂过程对象仿真器神经网络组成的组合网络训练问题；训练算法装置，推导组合网络内不同控制器神经网络和复杂过程对象仿真器神经网络之间连接等效误差计算公式，用于训练所述组合网络，得到优化控制器神经网络。本发明控制方法将神经网络训练时的网络输出与理想输出一致性衡量函数设定为优化控制的指标函数形式，具有用智能手段、在有约束控制条件下、对于不存在精确数学模型的复杂过程对象实现多目标优化控制的优点。
文档编号G05B13/00GK1598719SQ200410009608
公开日2005年3月23日申请日期2004年9月27日优先权日2004年9月27日
发明者朱刚, 姜丽君, 赵冬梅, 谢永斌申请人:北京交通大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱刚;姜丽君;赵冬梅;谢永斌
技术所有人：北京交通大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、唐老师：1.高效节能装备 2.流动稳定性 3.汽车流场分析和淀粉糖工艺技术。
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、王老师：电子信息处理、先进检测方法和智能化仪表
4、周老师：1.智能电网 2.新能源利用 3.泛在电力物联网
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。