本发明涉及的是一种欠驱动无人艇航迹跟踪控制方法,具体地说是一种基于rbf辨识的ica-cmac神经网络的欠驱动无人艇航迹跟踪控制方法。
背景技术:
无人艇(usv)是一种能够在实际海洋环境下安全自主航行,完成各种任务的海上智能运动平台,可搭载传感器、通讯装置等,并且其具有操纵灵活、自动驾驶等特点,适合在各种恶劣环境下,执行诸如水域勘察、海洋资源探测、海岸防护、编队控制等不同任务,因此研究无人艇的航迹跟踪控制有重要的意义。
欠驱动usv缺少横向驱动力,不受brockett定理条件的约束,目前非完整系统发展起来的很多方法难以直接应用于usv的航迹跟踪控制问题。同时欠驱动usv动态还存在强非线性、强耦合性、参数摄动以及复杂外干扰等特性,因此欠驱动usv的航迹跟踪控制问题极具挑战性,研究欠驱动usv航迹跟踪控制方法更具有实际意义。近年来,神经网络以其强大的非线性映射能力、并行处理能力和自学习能力成为当今人工智能领域研究的热点之一。其中径向基函数(radialbasisfunction,rbf)是局部逼近神经网络,所需调整的权值参数较少,可以在一个紧凑集和任意精度逼近任意非线性函数;小脑模型神经网络(cerebellarmodelarticulationcontroller,cmac)是一种模拟小脑控制肢体功能的自适应神经网络,具有更好的非线性逼近能力,学习速度快,不会陷入局部极小值,硬件实现较为方便,适用于复杂环境下的非线性实时控制。此外实际usv航迹跟踪控制过程中存在不确定模型参数和未知外界干扰,难以建立精确的usv模型,同时控制系统的动态特性比较复杂,传统控制算法的鲁棒性和自适应性较差。
技术实现要素:
本发明的目的在于提供一种能够实现不确定外界干扰下usv的航迹跟踪在线学习控制,可以降低对精确数学模型的依赖性,增强系统的自适应调整能力和抗干扰能力的基于rbf辨识的ica-cmac神经网络的欠驱动无人艇航迹跟踪控制方法。
本发明的目的是这样实现的:
(1)、初始化rbf和ica-cmac神经网络参数,包括:辨识器基宽向量b、学习速率λ,λ0、网络权值wj,wl、泛化参数c、平衡学习常数k0和pid控制参数初值;
(2)采样得到期望输入信号r(k)和usv实际输出信号y(k),计算艇体坐标系下的控制误差e(k)及e(1),e(2),e(3);
(3)、计算jacobian辨识信息和rbf辨识网络的输出ym(k);
(4)、计算pid控制器的输出τp(k),rbf性能指标函数e(k),采用梯度下降法调整pid控制参数δkp,δki,δkd;
(5)、利用rbf辨识的pid控制器,由rbf网络来辨识usv模型,在线自适应的整定控制器参数,直到控制指标达到最好;
(6)、ica-cmac神经网络在线进行学习,训练权值,计算ica-cmac输出τn(k),网络调整的性能指标函数j(k)和ica权值调整δw(k);
(7)、usv的总控制输出τ(k)为pid控制器输出τp(k)和ica-cmac输出τn(k)之和;
(8)、令k=k+1,返回循环,满足条件时停止。
本发明针对欠驱动usv航迹跟踪控制问题,将ica-cmac(improvedcreditassignment-ica)神经网络与积分分离式pid控制相结合,提出了一种基于rbf辨识的ica-cmac神经网络的控制方法,可以实现不确定外界干扰下usv的航迹跟踪在线学习控制。采用ica-cmac神经网络与pid并行控制方法;其中rbf网络用来辨识usv系统模型,在线自适应的整定控制参数,实现pid反馈控制;ica-cmac神经网络实现前馈控制,用以辨识被控对象的逆动态模型,实现在线学习控制;上述两种神经网络算法可以降低对精确数学模型的依赖性,增强系统的自适应调整能力和抗干扰能力,提高算法的在线学习速度和航迹跟踪精度。本发明提出的控制方法融合上述两种神经网络的优点。
本发明的基于rbf辨识的ica-cmac神经网络的欠驱动无人艇航迹跟踪控制方法,实现不确定外界干扰下usv的航迹跟踪在线学习控制,同时可以降低对精确数学模型的依赖性,增强系统的自适应调整能力和抗干扰能力,提高算法的学习速度和航迹跟踪精度。
本发明的基于rbf辨识的ica-cmac神经网络的欠驱动usv航迹跟踪控制方法的主要特征包括:
一、获取usv的位置和姿态参数
用位置参考系统测得usv的位置信息,用姿态参考系统测得usv的艏向姿态信息;对获取的usv的姿态及位置信号进行滤波及时空对准,得到当前usv精确位置及姿态。
二、利用rbf辨识的自适应积分分离式pid控制
rbf神经网络用于逼近被控对象,得到usv输出对输入的jacobian辨识信息,进行pid控制参数的在线调整,参数整定后控制器的输出成为被控对象的输入,rbf调整的性能指标函数是辨识输出和实际输出差值的平方。
三、ica-cmac神经网络与积分分离式pid的并行控制
ica-cmac神经网络作为前馈控制,通过引入平衡学习常数改进可信度分配,提高在线学习速度,根据调整指标和σ学习规则辨识usv逆模型,产生的输出作为usv输入的一部分,在每个控制周期内,与usv的总控制输入进行比较,并通过网络权值的调整来减小两者之间的差值。
本发明包括以下有益效果:
1、本发明将位置及姿态传感器采集的数据,进行滤波及时空对准提高了数据的精度,对控制效果产生了较好的影响。
2、本发明引入rbf辨识的自适应积分分离式pid进行usv航迹跟踪控制器的初步设计,实现控制器参数的在线自整定。
3、本发明所述的ica-cmac神经网络控制算法,可以提高学习速度和航迹跟踪精度,用以取得响应迅速且输出平滑的控制效果。
附图说明
图1为本发明的系统结构图;
图2为本发明的控制结构图;
图3为rbf神经网络结构图;
图4为ica-cmac神经网络结构图;
图5为本发明的流程图。
具体实施方式
下面结合附图举例对本发明作进一步详细的说明。
具体实施方式一、
步骤一、获取usv的位置和姿态参数
用位置参考系统测得usv的位置信息,用姿态参考系统测得usv的艏向姿态信息;对获取的usv姿态及位置信号进行滤波及时空对准,得到当前usv精确位置及姿态。
步骤二、利用rbf辨识的自适应积分分离式pid控制
rbf神经网络用于逼近被控对象,得到usv输出对输入的jacobian辨识信息,进行pid控制参数的在线调整,参数整定后的控制器的输出成为被控对象的输入,rbf调整的性能指标函数是辨识输出和实际输出差值的平方。
步骤三、ica-cmac神经网络与积分分离式pid的并行控制
ica-cmac神经网络作为前馈控制,通过引入平衡学习常数改进可信度分配,提高在线学习速度,根据调整指标和σ学习规则辨识usv逆模型,产生的输出作为usv输入的一部分,在每个控制周期内,与usv的总控制输入进行比较,并通过网络权值的调整来减小两者之间的差值。
本实施方式包括以下有益效果:
1、本实施方式将位置及姿态传感器采集的数据,进行了滤波及时空对准提高了数据的精度,对控制效果产生了较好的影响。
2、利用rbf辨识过程中提供的jacobian信息在线调整控制器参数,同时pid控制器起到反馈控制作用,完成自动调节功能,抑制扰动,保证稳定性,初步实现了pid航迹跟踪控制。
3、ica-cmac神经网络作为前馈控制,实现usv的逆动态模型,对不确定性外界干扰和系统滞后的有良好的鲁棒性。
4、在cmac学习过程中引入平衡学习常数改进可信度的分配,提高算法的学习速度和航迹跟踪精度。
具体实施方式二、本实施方式是对具体实施方式一所述的一种基于rbf辨识的ica-cmac神经网络的欠驱动usv航迹跟踪控制方法的进一步说明。
步骤一中所述的位置参考系统及姿态参考系统由集成位姿传感器采集数据信息,采用卡尔曼滤波或无迹信息滤波方式来滤除信号中的野值及高频噪声,对获取的usv姿态及位置信号采用曲线拟合的方式进行时间对准,并对不同坐标系下的数据进行空间对准,得到当前usv精确位置及姿态。
具体实施方式三、本实施方式是对具体实施方式一至二之所述的一种基于rbf辨识的ica-cmac神经网络的欠驱动usv航迹跟踪控制方法的进一步说明。
usv艇体坐标系下误差方程的建立包括:
其中,η=[x,y,ψ]t、υ=[u,ν,r]t、τ=[τu,0,τr]t分别表示北东坐标系下的位置、速度和推进力,x,y,ψ分别表示北向位置、东向位置和艏向角,u,ν,r分别表示纵向速度、横向速度和艏摇角速度,τu,τr分别表示纵向力和转艏力矩,
usv的期望航迹r(k)=(xd,yd,ψd)t由虚拟usv产生,期望航向角
其中,
具体实施方式四、本实施方式是对具体实施方式一至三之所述的一种基于rbf辨识的ica-cmac神经网络的欠驱动usv航迹跟踪控制方法的进一步说明。
结合图1和图3,利用rbf辨识的自适应积分分离式pid控制的具体过程为:
usv的艏向和纵向各对应一组rbf辨识pid控制器,建立usv的辨识模型,通过观测jacobian信息在线调整pid控制参数,增强系统的自适应调整能力。
输入层、隐含层和输出层的连接:实现从x→h→ym。设在rbf网络结构中,输入向量表示成x=[x1,x2,x3]t,径向基向量函数表示成h=[h1,h2,…,hj,…hm]t,hj为隐含层激励(高斯基)函数:
其中,cj=[cj1,cj2,…,cji,…cjn]表示神经网络中第j个节点的中心矢量,表达式中i=1,2,…,n,b=[b1,b2,…,bm]t表示的是神经网络的基宽向量,bj表示的是大于零的基函数围绕中心点的宽度参数,m为隐含层节点个数。
网络权向量:w=[w1,w2,…,wj,…wm]t,权值和高斯基函数加权即可得辨识的输出为:
ym(k)=w1h1+w2h2+…+wmhm
rbf网络权值及pid控制参数调整:取辨识性能指标函数为
wj(k)=wj(k-1)+λ0(y(k)-ym(k))hj+α0(wj(k-1)-wj(k-2))
bj(k)=bj(k-1)+λ0δbj+α0(bj(k-1)-bj(k-2))
cji(k)=cji(k-1)+λ0δcji+α0(cji(k-1)-cji(k-2))
其中,y(k)表示usv的实际输出,r(k)表示usv的期望输入,λ0表示学习速率,α0表示动量因子,δ表示差值。
对于积分分离式pid控制器,跟踪控制误差为e(k),pid的三项输入为:
e(1)=e(k)-e(k-1)
e(2)=e(k)
e(3)=e(k)-2e(k-1)+e(k-2)
积分分离式pid控制输出为:
τp(k)=τp(k-1)+kp(e(k)-e(k-1))+kie(k)+kd(e(k)-2(e(k-1)+e(k-2))
由于无人艇模型具有不确定性,jacobian阵可做如下近似处理:
其中,x1=δτp(k)。
rbf网络整定控制器性能指标函数为:
采用梯度下降法在线调整控制参数kp、ki、kd:
具体实施方式五、本实施方式是对具体实施方式一至四之所述的一种基于rbf辨识的ica-cmac神经网络的欠驱动usv航迹跟踪控制方法的进一步说明。
结合图1和图4,ica-cmac神经网络与积分分离式pid的并行控制具体过程为:
usv的艏向和纵向各对应一组ica-cmac神经网络与pid并行控制器,学习数据存储在交叠的存储单元中,考虑学习过程中不同的单元对训练样本有不同的可信度,把存储单元学习次数作为可信度,校正误差根据存储单元的可信度进行分配,同时引入平衡学习常数k0进行可信度分配。经过一定数量的样本训练后,ica-cmac成为被控对象的逆动态模型,即ica-cmac的输出与期望输出所需要的输入相近似。
设初始状态网络的所有权值为o,将系统的当前误差量化后作为地址输入到ica-cmac神经网络,对于ica-cmac概念映射,把输入空间s在区间[smin,smax]上划分成n+2c个量化区间,smin,smax分别代表输入空间所能取到的最小值和最大值,则概念映射方法为:
ν1…νc=smin
νg=νg-1+δνg(g=c+1,…,c+n)
νn+c+1…νn+2c=smax
ica-cmac神经网络的控制输出及控制器总输出为:
τ(k)=τn(k)+τp(k)
ica-cmac神经网络采用有导师的学习算法,控制器的训练环节在导师信号的指引下进行网络训练,以总控制输入与ica-cmac神经网络输出之差最小为目的,在学习过程中利用τn(k)、τ(k)的差值,不断调整连接权值。τ(k)作为导师信号,训练学习方式为σ学习规则。ica-cmac网络调整的性能指标函数为:
w(k)=w(k-1)+δw(k)+α(w(k)-w(k-1))
其中,αg表示二进制选择向量,α表示学习常数,λ表示网络学习速率,α,λ∈(0,1),泛化参数为c,pid控制器输出为τp(k),ica-cmac网络输出为τn(k),usv的总控制输出τ(k),k0表示平衡学习常数,f(g)是第g个单元的学习次数,f(q)是第q个单元的学习次数,c是状态激活的存储单元数,n为根据情况和要求选取的常数。
基于以上的分析,结合图5,基于rbf辨识的ica-cmac神经网络的欠驱动usv航迹跟踪控制方法的算法流程如下:
1、初始化rbf和ica-cmac神经网络各参数,辨识器基宽向量b、学习速率λ,λ0、网络权值wj,wl、泛化参数c、平衡学习常数k0和pid控制参数初值等;
2、采样得到期望输入信号r(k)和usv实际输出信号y(k),计算艇体坐标系下的控制误差e(k)及e(1),e(2),e(3);
3、计算jacobian辨识信息和rbf辨识网络的输出ym(k);
4、计算pid控制器的输出τp(k),rbf性能指标函数e(k),采用梯度下降法调整pid控制参数δkp,δki,δkd;
5、利用rbf辨识的pid控制器,由rbf网络来辨识usv模型,在线自适应的整定控制器参数,直到控制指标达到最好;
6、ica-cmac神经网络在线进行学习,训练权值,计算ica-cmac输出τn(k),网络调整的性能指标函数j(k)和ica权值调整δw(k);
7、usv的总控制输出τ(k)为pid控制器输出τp(k)和ica-cmac输出τn(k)之和;
8、令k=k+1,返回循环
满足条件时算法停止。
本发明适用于存在不确定外界干扰的欠驱动usv航迹跟踪控制情况,采用ica-cmac神经网络与积分分离式pid并行控制方法;其中rbf网络用来辨识usv模型,在线自适应的整定控制器参数,实现pid反馈控制;ica-cmac神经网络实现前馈控制,用以辨识被控对象的逆动态模型,引入平衡学习常数进行可信度分配,对不确定外界干扰有良好的鲁棒性,同时提高算法的在线学习速度和航迹跟踪精度;用以取得响应迅速且输出平滑的航迹跟踪控制效果。