
1.本发明属于倒立钟摆系统技术领域,具体涉及一种用于倒立钟摆系统的非线性控制方法。
背景技术:2.倒立钟摆系统作为研究控制理论的一种典型的实际应用,具有成本低廉、结构简单、物理参数和结构易于调整的优点,其结构如图1所示。倒立钟摆系统本身具有高阶次、多变量、不稳定、非线性和强耦合性等特点,是一个绝对不稳定系统,必须采用有效的控制策略才能使之稳定。倒立钟摆系统是研究变结构控制、非线性控制、目标定位控制和智能控制等控制方法的理想实验平台。
3.倒立钟摆的种类很多,目前研究的均为二维空间即平面内摆动。倒立钟摆的工作原理大体相同,即采用一种控制方法,控制摆杆的速度,使摆杆始终跟随设定好的参考轨迹。
4.随着对倒立钟摆系统控制方法研究的不断深入,越来越多的理论被成功运用于倒立钟摆系统的控制,如线性控制方法、非线性控制方法、基于能量的控制方法、基于h
∞
的控制方法、基于增强式学习的控制方法、基于滑模理论的控制方法、基于遗传算法的控制方法、基于模糊逻辑的控制方法、基于神经网络理论以及模糊逻辑与神经网络相结合的控制方法等。
5.倒立钟摆系统本身是不稳定的,在控制过程中能有效地反映控制中的许多问题,如镇定问题、非线性问题、鲁棒性问题、随动问题以及跟踪问题等。作为被控对象,它是一个高阶次、不稳定、多变量、非线性、强耦合系统,只有设计一个控制器使之稳定。
6.工程中的很多控制对象都具有与倒立钟摆系统类似的结构,如空间飞行器和各类伺服云台、海上钻井平台的稳定控制、卫星发射架的稳定控制、火箭姿态控制、飞机安全着陆、化工过程控制都属于这类问题。因此对倒立钟摆控制系统的研究具有重要的理论和实际意义。
7.目前对于倒立钟摆控制系统的研究主要集中在两个方面:一是研究控制器使倒立钟摆稳定并可以定位在特定位置;二是倒立钟摆的起摆控制。控制器的设计是倒立钟摆系统的核心内容,由于倒立钟摆是一个绝对不稳定的系统,需要设计控制器以实现倒立钟摆的稳定控制和抑制干扰。目前典型的控制器有pid控制、状态反馈控制、云模型控制等。pid控制是通过机理分析建立非线性模型,并在平衡点进行线性化,得到系统的状态方程和输出方程,进而设计pid反馈控制器进行稳定控制;状态反馈控制是基于倒立钟摆系统的状态空间描述,采用状态反馈理论设计控制器;利用云模型实现对倒立钟摆的控制,是用云模型构成语言值,用语言值构成规则,形成一种定性的推理机制,这种拟人的控制不要求给出被控对象精确的数学模型,仅仅依据人的经验、感受和逻辑判断,将人用自然语言表达的控制经验,通过语言原子和云模型转换到语言控制规则器中,解决非线性问题和不确定问题。
8.神经网络控制能够任意充分地逼近复杂的非线性关系,学习和适应严重不确定性
系统的动态特性,所有定量或定性的信息按等势分布储存于网络内的神经元,有很强的鲁棒性和容错性,也可将学习算法和bp神经网络有效结合,实现状态未离散化的倒立钟摆无模型学习控制;自适应控制主要为倒立钟摆设计各种自适应控制器,如自适应模糊控制器、自适应pid控制器和自适应模糊pid控制器等。
9.用现代控制理论的方法实现倒立钟摆系统的稳定控制,必须将倒立钟摆系统的非线性模型进行线性化处理,再根据对系统控制所提出的性能指标进行分析与综合得到控制器,但对于倒立钟摆这种非线性较强、模型较为复杂的多变量系统,线性系统设计方法具有局限性,而云模型和神经网络控制等方法需要大量的数据,实现过程复杂,不易于在线控制。
技术实现要素:10.本发明提供了一种用于倒立钟摆系统的非线性控制方法,用以解决将倒立钟摆系统进行线性化处理造成的实现过程复杂、不易于在线控制的问题。
11.为解决上述技术问题,本发明所包括的技术方案以及技术方案对应的有益效果如下:
12.本发明提供了一种用于倒立钟摆系统的非线性控制方法,包括如下步骤:
13.1)构造改进的基于自适应神经网络反步控制器,过程如下:
14.1.1)建立倒立钟摆系统的数学模型,进而利用倒立钟摆系统的数学模型建立倒立钟摆系统的状态空间模型;
15.1.2)利用构建的预定性能函数ξ(t),将系统跟踪误差j1(t)转换为不受约束变量m1(t),进而将状态空间模型进行如下所示坐标转换以得到系统的误差方程,所述系统的误差方程为:
[0016][0017]
其中,xi为系统状态;zi为系统状态误差;ηi为误差补偿系统;为补偿误差信号;为一阶命令滤波器的输出信号,且一阶命令滤波器的输入信号为αi(t),并称αi(t)为虚拟控制律;
[0018]
1.3)利用第一补偿误差信号和第一神经网络未知参数的估计误差构造第一李雅普诺夫函数v1:r1为正常数;设计使系统稳定的第二虚拟控制律α2和第一神经网络未知参数θ1的自适应律其中,w
i*
为神经网络的最优权值向量,wi为神经网络的权值向量;
[0019]
1.4)根据步骤2)的坐标变换关系,并利用第二补偿误差信号和第二神经网络未知参数θ2的估计误差构造第二李雅普诺夫函数v2:r2为正常数;
设计使系统稳定的第三虚拟控制律α3和第二神经网络未知参数θ2的自适应律
[0020]
2)根据构造的所述改进的基于自适应神经网络反步控制器,对倒立钟摆系统进行控制。
[0021]
上述技术方案的有益效果为:本发明基于自适应神经网络反步控制器,并对其进行改进,将其应用于倒立钟摆系统中,在确定系统的误差方程之间先将系统跟踪误差转换为不受约束变量以解决受约束的跟踪误差,进而构造两个李雅普诺夫函数并设计相应的虚拟控制律和参数自适应律,完成倒立钟摆系统的轨迹跟踪,整个过程无需将倒立钟摆系统线性化,控制精度更高,易于在线控制。
[0022]
进一步的,步骤1.2)中,所述预定性能函数ξ(t)为:
[0023][0024]
其中,ε1,ε2为正常数;a、t0分别代表着与收敛速度、性能函数的最终界、收敛时间有关的参数,且满足t0》0和
[0025]
进一步的,步骤1.2)中,所述不受约束变量m1(t)为:
[0026][0027]
进一步的,为了解决一阶命令滤波器带来的误差影响,步骤1.3)之前,还需利用引入误差补偿机制来解决一阶命令滤波器的滤波误差的影响,所述误差补偿机制为:
[0028][0029][0030]
其中,k
11
、k
12
、k
21
、k
22
均为正常数;η1为第一误差补偿信号;η2为第二误差补偿信号;为第一系统状态误差的导数;x2为第二系统状态;yd为参考信号;z2为第二系统状态误差;f1表示在定义域内充分光滑的非线性函数,;x1为第一
系统状态,且f1(x1)=0。
[0031]
进一步的,为了实现系统稳定,步骤1.3)中,设计的第二虚拟控制律α2为:
[0032][0033]
其中,a
11
为正常数;s1为第一神经网络的基函数;|| ||表示向量的欧几里得范数;a
12
为正常数;为预定性能函数ξ的一阶导数;为参考信号yd的一阶导数;
[0034]
设计的第一神经网络未知参数θ1的自适应律为:
[0035][0036]
其中,c1均为正常数。
[0037]
进一步的,步骤1.4)中,构造第二李雅普诺夫函数v2时,还需结合所述误差补偿机制,结合所述误差补偿机制后得到的第二补偿误差信号的一阶导数为:
[0038][0039]
其中,f2表示在定义域内充分光滑的非线性函数,x2为第二系统状态,且m为摆杆的质量l为摆杆转动轴心到杆质心长度,k为未知的摩擦系数;为第二系统状态误差z2的一阶导数;为第二误差补偿系统η2的一阶导数;η1为第一误差补偿系统;为第二虚拟控制信号α2对应的一阶命令滤波器的输出信号的一阶导数。
[0040]
进一步的,为了实现系统稳定,设计的第三虚拟控制律α3为:
[0041][0042]
其中,a
21 a
21
为正常数;s2为第二神经网络的基函数;z2为第二系统状态误差,且a
22
为正常数;η1为第一误差补偿信号;
[0043]
设计的第二神经网络未知参数θ2的自适应律为:
[0044][0045]
其中,c2均为正常数。
[0046]
进一步的,为了减轻通信负担、节约通讯资源的浪费,步骤1.4)中,还建立基于相对阈值的事件触发控制策略使构造的第二李雅普诺夫函数v2有界;所述基于相对阈值的事件触发控制策略为:
[0047]
[0048]
u(t)=v(tk),
[0049]
t
k+1
=inf{t∈r||p(t)|≥τ|u(t)|+μ2}
[0050]
其中,p(t)为事件触发误差且p(t)=v(t)-u(t),μ2为正常数,均为设置的参数且τ为设计参数,且0《τ《1;tk,k∈z
+
代表输入更新时间;μ1、μ2、ρ均为正常数,且inf{}表示下确界;r表示实数。
[0051]
进一步的,为了准确表达倒立钟摆系统,步骤1.1)中,所述倒立钟摆系统的数学模型为:
[0052][0053]
其中,φ和分别为角度和角速度;u为控制量;m为摆杆的质量;l为摆杆转动轴心到杆质心长度;g为重力加速度;k为未知的摩擦系数。
[0054]
进一步的,所述倒立钟摆系统的状态空间模型为:
[0055][0056]
其中,f1(x1)=0;g1(x1)=1;g2(x2)=1;f1(x1)、f2(x2)、g1(x1)和g2(x2)都是在定义域内充分光滑的非线性函数,且满足g1(x1)≠0和g2(x2)≠0。
附图说明
[0057]
图1是本发明的倒立钟摆系统的结构和受力分析图;
[0058]
图2是本发明的用于倒立钟摆系统的非线性控制方法的流程图;
[0059]
图3是本发明的倒立钟摆系统的控制框图;
[0060]
图4是本发明的倒立钟摆与参考信号的跟踪轨迹图;
[0061]
图5是本发明的系统跟踪误差及预定上下边界图。
具体实施方式
[0062]
本发明基于自适应神经网络反步控制策略,并将自适应事件触发的固定时间命令滤波器与预定性能相结合应用到倒立钟摆非线性系统,以实现本发明的一种用于倒立钟摆系统的非线性控制方法,其控制框图如图3所示。整体设计目标是设计控制器u,使得输出y能够渐进跟踪参考信号yd,并且保证跟踪误差j1在固定时间间隔内收敛到零的小的残差集内,有效减小计算量,加快收敛速度。整个流程如图2所示,下面具体介绍。
[0063]
步骤一,根据倒立钟摆系统的如图1所示的结构图,建立倒立钟摆系统的数学模型;进而根据倒立钟摆系统的数学模型建立倒立钟摆系统的状态空间模型。具体的:
[0064]
1、建立的倒立钟摆系统的数学模型为:
[0065][0066]
其中,φ和分别为角度和角速度;u为控制量;m为摆杆的质量;l为摆杆转动轴心到杆质心长度;g为重力加速度;k为未知的摩擦系数。
[0067]
2、考虑倒立钟摆的摆角φ,令倒立钟摆控制系统状态向量其中,系统状态x1=φ,系统状态令倒立钟摆控制系统的输出为y=φ,则倒立钟摆控制系统非线性模型(即状态空间模型)可表示为如下形式:
[0068][0069]
其中,f1(x1)=0;g1(x1)=1;g2(x2)=1;f1(x1)、f2(x2)、g1(x1)和g2(x2)都是在定义域内充分光滑的非线性函数,且满足g1(x1)≠0和g2(x2)≠0。
[0070]
步骤二,利用构建的预定性能函数ξ(t),将系统跟踪误差j1(t)转换为不受约束变量m1(t),进而将状态空间模型进行如下所示坐标转换以得到系统的误差方程,解决受约束的跟踪误差。
[0071]
具体的:
[0072]
1、令j1(t)=y(t)-yd(t)代表输出跟踪误差,yd(t)为参考信号,为了满足实际应用中对误差系统的稳准快要求,引入了如下预定性能函数ξ(t)来达到对系统中的收敛速度、超调量以及收敛时间等性能要求:
[0073][0074]
其中,ε1和ε1为正常数;a、t0》0分别代表着收敛速度、性能函数的最终界、收敛时间,并且满足
[0075]
而且,考虑预定性能问题,设定如下限制ω
j1
={j1(t)∈r|-ξ(t)《j1(t)《ξ(t)}。
[0076]
2、通过引入坐标变换把受约束的跟踪误差j1转化为不受约束变量m1:
[0077][0078]
其中,ξ(t)为给定的预定性能函数。
[0079]
对式(2)转换可得并对其求导可得:
[0080][0081]
其中,f1(x1)=1。
[0082]
上式转换后可得:
[0083][0084]
其中,
[0085]
得到后,进行如下坐标变换,以得到系统的误差方程:
[0086][0087]
其中,xi为系统状态;zi为系统状态误差,ηi为误差补偿系统;为补偿误差信号;为一阶命令滤波器的输出信号,且一阶命令滤波器的输入信号为αi(t),并称αi(t)为虚拟控制信号。
[0088]
3、本实施例中引入一阶命令滤波器来克服基于自适应反步法控制框架中对虚拟控制信号αi的重复微分问题来减少相应的计算负担。引入如下的误差补偿机制解决无虑误差的影响,其中为一阶滤波器输出信号,αi为一阶滤波器输入信号,βi》0是一个时间常数。其中,下式(7)中误差补偿机制里的与下式(8)中的相消,以有效解决滤波误差的影响。
[0089][0090][0091]
[0092]
其中,k
11
、k
12
均为正常数;k
21
、k
22
均为正常数;η1为第一误差补偿信号;η2为第二误差补偿信号;为第一系统状态误差的导数;z2为第二系统状态误差。
[0093]
步骤三,利用第一补偿误差信号和第一神经网络未知参数θ1的估计误差构造第一李雅普诺夫函数v1,并设计使系统稳定的第二虚拟控制律α2和第一神经网络未知参数θ1的自适应律具体的:
[0094]
1、构造第一李雅普诺夫函数其中r1为正常数,为参数估计误差,w
i*
为神经网络的最优权值向量,wi为神经网络的权值向量,且具体定义了
[0095]
2、对第一李雅普诺夫函数v1求导可得:
[0096][0097]
其中,为第一补偿误差信号;为第二补偿误差信号。
[0098]
3、利用神经网络逼近未知函数f1并通过杨氏不等式处理可得:
[0099][0100][0101]
其中,δ1(z)为第一神经网络的最小逼近误差;s1(z)为第一神经网络的基函数;w
1*
为第一神经网络的最优权值向量;a
11
为正常数;θ1为未知参数。
[0102]
将上式代替可得:
[0103][0104]
其中,a
12
为正常数。
[0105]
4、设计第二虚拟控制律α2、以及第一神经网络未知参数θ1的自适应律分别为:
[0106]
[0107][0108]
其中,a
11
、k
11
、k
12
、r1、c1、均为正常数。
[0109]
5、将设计的虚拟控制律和参数自适应律代入可得:
[0110][0111]
其中,
[0112]
步骤四,基于第一李雅普诺夫函数、步骤二中的坐标变换关系以及误差补偿机制,利用第二补偿误差信号和第二神经网络未知参数θ2的估计误差构造第二个保证钟摆系统稳定性的李雅普诺夫函数(即第二李雅普诺夫函数),并设置相应的虚拟控制律和参数自适应律。
[0113]
具体的:
[0114]
1、结合倒立钟摆系统的状态空间模型与坐标变换引入误差补偿信号解决滤波误差的影响:
[0115][0116]
其中,
[0117]
2、构造的第二李雅普诺夫函数为:r2为正常数,并对v2进行求导可得:
[0118][0119]
3、使用神经网络对未知函数进行逼近如下:
[0120][0121][0122]
其中,s2(z)为第二神经网络的基函数;δ2(z)为第二神经网络的最小逼近误差;a
21
为正常数;a
22
为正常数。
[0123]
并将相应公式替换可得:
[0124][0125]
其中,
[0126]
4、在设置实际事件触发控制器u前,设置了如下的第三虚拟控制律α3和第二神经网络未知参数θ2的自适应律
[0127][0128][0129]
其中,为正常数;c2为正常数。
[0130]
步骤五,在上述步骤的基础上,引入事件触发策略使构造的第二李雅普诺夫函数v2有界,以减轻通讯负担,使得系统满足实际固定时间稳定,完成倒立钟摆系统的轨迹跟踪控制。具体的:
[0131]
1、先详细介绍基于相对阈值的事件触发控制策略:
[0132][0133]
其中,定义事件触发误差p(t)=v(t)-u(t);0《τ《1;ρ,μ1,μ2均为正常数,并且满足tk,k∈z
+
表示输入更新时间;inf{}表示下确界;r表示实数。
[0134]
在时间t∈[tk,t
k+1
),u可以视作常量v(tk),每当t
k+1
=inf{t∈r||p(t)|≥τ|u(t)|+μ2}被触发时,常量将被标记为t
k+1
,实际控制输入u(t
k+1
)将被应用到系统中。因此,可以求出满足下列方程的参数
[0135][0136]
其中,
[0137]
因此可得控制器为:
[0138][0139]
2、在间隔时间[tk,t
k+1
)中,基于事件触发控制策略可得|v(t)-u(t)|≥τ|u(t)|+μ2,控制器u设置为其中进
而可得:
[0140][0141]
由于和可得代入可得:
[0142][0143]
基于引理1:ψ∈r,此处ψ赋值为和
[0144][0145]
其中,
[0146]
基于引理2:此处赋值为
[0147]
其中,
[0148]
基于引理3:hn∈r,i=1,...,n,κ∈[0,1],(|h1|+
…
+|hn|)
κ
≤|h1|
κ
+
…
+|hn|
κ
,此处hn赋值为κ赋值为
[0149]
其中,
[0150]
鉴于及引理4:x1、y2代表着任意变量,k1、k2、b表示任意常数,可得:此处τ1=0.11。
[0151]
则第二李雅普诺夫函数的微分函数可表示为:
[0152][0153]
其中,
[0154]
基于和通过以下杨氏不等式相消处理:
[0155][0156]
其中,ν为正常数;rj为正常数;cj为正常数。
[0157]
可得满足:
[0158][0159]
其中,
[0160]
定义可得:
[0161][0162]
根据并同上引用引理2和3,上式可转换为:
[0163][0164]
其中,
[0165]
根据引理5:假如v(x)是一个正定函数,同时具有如下形式:
[0166][0167]
其中,φ1、φ2、α、β、γ均表示正常数,同时满足αγ∈(0,1),βγ∈(1,∞),ρ》0。
[0168]
则可证明系统的原点达到了实际固定时间稳定(对比渐近稳定或有限时间稳定,本发明选择的实际固定时间稳定的优点具有不考虑初始条件的情况下,可以正常预测到收敛时间)。
[0169]
其中,参数选择如下β=2,γ=1便于实际设计。
[0170]
因此可得倒立钟摆系统满足实际固定时间稳定。
[0171]
步骤六,在按照步骤一至步骤五的方法,便可设计出本发明的改进的基于自适应神经网络反步控制器,将该控制器应用于倒立钟摆系统中对倒立钟摆系统进行控制。将本发明方法应用于倒立钟摆系统中,其与参考信号的跟踪轨迹如图4所示,跟踪误差及预定上下边界图如图5所示,可以看出跟踪性能较佳。
[0172]
综上,本发明方法具有如下特点:
[0173]
1)本发明利用固定时间命令滤波方法,通过结合神经网络的逼近能力和预定性能的方法,建立了一个固定时间自适应控制器,使得跟踪误差可以在固定时间严格收敛到预定边界范围内。
[0174]
2)本发明将基于相对阈值的事件触发控制与具有预定性能的自适应神经网络固定时间命令滤波控制方案相结合,不仅减轻了通信负担,而且也大大节约了通讯资源的浪费,更普遍适用于实际工程。
[0175]
3)本发明提出了一种新型的固定时间命令滤波器,它不仅可以成功地规避了“计算复杂性”的问题,而且也引入了一种改进的误差补偿机制有效的减轻了一阶滤波器所带来的误差影响,该方法具有广泛的适用性和更大的研究价值。
[0176]
4)在解决具有非线性、强耦合的倒立钟摆轨迹跟踪控制问题时,与有限时间算法相比,具有更快的收敛速度;与一般的自适应反步控制相比,能够处理通讯负担的问题,减小计算量,加快收敛速度,因此具有较高的工程实用价值
[0177]
5)对于未知函数的处理,本发明选用神经网络逼近未知项,逼近能力较佳。