一种数据驱动的动态内模控制技术

文档序号:29913215发布日期:2022-05-06 02:25阅读:123来源:国知局
一种数据驱动的动态内模控制技术
一种数据驱动的动态内模控制技术
1.本发明属于智能控制技术领域,更具体地,涉及一种数据驱动的动态内模控制技术。


背景技术:

2.内模控制方法具有抑制扰动和模型失配的作用,能有效提高系统的鲁棒性。内模控制的主要思想是:构建一个被控系统的模型,称为内模,通过对内模求逆,得到逆控制器,逆控制器通过系统输出和目标输出之间的差,产生使系统输出跟踪目标输出的控制量。如果内模和系统模型准确匹配的话,跟踪效果和抑制扰动的效果都会是理想的,因此对于内模控制系统来说,关键问题在于获得系统模型和系统模型的逆。
3.目前针对线性系统的内模控制方法是较为完善的,但实际中绝大多数系统本质上是非线性的。针对非线性系统,目前存在一些基于模型的内模控制方法,然而随着系统的日益复杂,获得系统机理模型变得越来越困难,针对这一问题,有学者提出使用神经网络或模糊系统对系统进行辨识从而得到内模模型的方法,然而这些方法需要的数据量和计算量都比较大,有时还需要在线的训练来保证模型的准确性,而且神经网络或者模糊模型的结构是根据不同系统而异的。
4.本发明针对离散时间非线性非仿射系统,提出了一种数据驱动的动态内模控制方法,使用由输入、输出数据构建的动态线性化数据模型作为内模,其中只包含一个需要进行估计的时变参数,控制器包括一个用来使系统输出跟踪上参考轨迹的标称控制器和一个对模型失配和扰动进行补偿的补偿控制器;在所提出的方法中,控制器的设计和分析都是在数据驱动的框架下进行的,只需要输入、输出数据即可有效抑制扰动,实现较好的跟踪效果,具有易于实现、运算量小的优点,以上是本发明的重要创新之处。


技术实现要素:

5.本发明公开的一种数据驱动的动态内模控制方法要解决的问题是,只利用系统输入、输出数据,提高未知的非线性非仿射系统对于不确定性和扰动的处理能力。
6.本发明的目的通过以下技术方案实现:
7.本发明针对未知非线性非仿射系统,在数据驱动的框架下提出一种数据驱动的动态内模控制方法。所提出的数据驱动的动态内模控制方法只利用输入、输出数据即可实现较好的抑制扰动以及跟踪效果。
8.本发明公开的一种数据驱动的动态内模控制技术,所述方法包括以下步骤:
9.步骤1、建立离散时间非线性非仿射系统的动态线性化数据模型;
10.步骤2、设计参数更新律对线性数据模型中的未知伪偏导数参数进行估计;
11.步骤3、设计能使系统输出跟踪目标轨迹的标称控制器;
12.步骤4、设计不确定性补偿控制器对扰动以及实际系统和内模模型之间的失配进行补偿;
13.进一步地,步骤1中所述的建立离散时间非线性非仿射系统的动态线性化数据模
型主要包括以下步骤:
14.步骤1.1、考虑一个离散时间非线性非仿射系统:
15.y(k+1)=f(y(k),

,y(k-ny),u(k),

,u(k-nu))
16.其中,y(k)∈r表示k时刻系统的输出;u(k)∈r表示k时刻系统的输入;nu与ny是两个未知的正整数,表示系统输入和输出的阶数;f(
·
)表示未知的非线性函数;
17.该系统满足:
18.对于任意时刻,非线性函数f(
·
)关于u(k)的偏导数存在且连续;系统满足广义李普希兹条件,即对于任意两个时刻k1≠k2,如果u(k1)≠u(k2),则有|y(k1+1)-y(k2+1)|≤b
θ
|u(k1)-u(k2)|,b
θ
是一个大于0的常数;
19.步骤1.2、将上述非线性系统通过动态线性化的方法转化为等价的线性数据模型:
20.y(k+1)=y(k)+θ(k)δu(k)
21.其中,θ(k)表示线性数据模型的伪偏导数参数;δ表示差分算子,即δu(k)=u(k)-u(k-1);
22.进一步地,步骤2中所述的设计参数更新律对线性数据模型中的未知伪偏导数参数进行估计,主要包括以下步骤:
23.步骤2.1、设计参数更新律对线性数据模型中的未知伪偏导数参数进行估计:
[0024][0025]
其中,表示对梯度参数的估计;η表示步长因子,且满足0<η<2;μ表示一个正的权重系数,且满足μ>0;
[0026]
步骤2.2、设计参数更新律的重置算法:
[0027][0028]
其中,是的初值;ε是一个很小的正数;
[0029]
重置算法使得参数更新律有更强的跟踪能力;
[0030]
步骤2.3、得到存在外部扰动时非线性非仿射系统的估计模型:
[0031][0032]
其中,v(k)=ξ(k)+d(k),表示不确定性的总和;表示估计模型和实际系统的误差;d(k)表示有界的外部扰动;
[0033]
进一步地,步骤3中所述的设计能使系统输出跟踪目标轨迹的标称控制器,步骤如下所示:
[0034]
步骤4.1、设计总的控制增量:
[0035]
δu(k)=δun(k)+δuc(k)
[0036]
其中,δun(k)表示标称控制增量;δuc(k)表示不确定性补偿控制增量;
[0037]
步骤4.2、设计标称控制增量:
[0038]
[0039]
其中,α∈(0,1)表示一个控制增益;r(k+1)表示k+1时刻的目标输出;c1是一个正的常数,防止(7)的分母过于接近0;
[0040]
进一步地,步骤4中所述的设计不确定性补偿控制器对扰动以及实际系统和内模模型之间的失配进行补偿,主要包括以下步骤:
[0041]
步骤4.1、设计不确定性补偿控制器对扰动以及实际系统和内模模型之间的失配进行补偿:
[0042][0043]
其中,β表示一个正的控制增益;c2是一个正的常数,防止(8)的分母过于接近0;f(z)表示一个用来增强鲁棒性的滤波器;
[0044]
步骤4.2、结合步骤2-4,得到总体的控制方案:
[0045][0046]
可以看出,所提出的控制方法不需要模型信息,只需要系统输入和输出数据,计算量小,便于实现。
[0047]
有益效果:
[0048]
1、在本发明提出的方法中,只有一个时变参数需要进行估计,而且内模的逆模型可以直接得到,故所提出数据驱动的动态内模控制方法计算量小,易于实现;
[0049]
2、在本发明提出的方法中,利用系统的输入、输出数据,使用了自适应的方法来对内模模型中的时变参数进行估计,保证了较好的控制效果;
[0050]
3、在本发明提出的方法中,控制器的设计和分析都是在数据驱动的框架下完成的,在该框架中,没有用到系统的任何模型信息,只利用了测量到的输入、输出数据;
[0051]
结合附图阅读本发明的具体实施方式后,本发明的其他特点和优点将变得更加清楚。
附图说明
[0052]
图1为本发明提出的数据驱动的动态内模标称方法在例1中没有外部扰动时的输出跟踪效果图、估计模型效果图、输入图以及时变参数的估计图;
[0053]
图2为本发明提出的数据驱动的动态内模控制方法和无模型自适应控制方法在例1中没有外部扰动时的跟踪性能比较图;
[0054]
图3为本发明提出的数据驱动的动态内模控制方法在例1中存在阶梯型扰动时的输出跟踪效果图、估计模型效果图、输入图以及时变参数的估计图;
[0055]
图4为本发明提出的数据驱动的动态内模控制方法和无模型自适应控制方法在例1中存在阶梯型扰动时的跟踪性能比较图;
[0056]
图5为本发明提出的数据驱动的动态内模控制方法在例1中存在正弦型扰动时的输出跟踪效果图、估计模型效果图、输入图以及时变参数的估计图;
[0057]
图6为本发明提出的数据驱动的动态内模控制方法和无模型自适应控制方法在例1中存在正弦型扰动时的跟踪性能比较图;
[0058]
图7为本发明提出的数据驱动的动态内模控制方法在例2中没有外部扰动时的输出跟踪效果图、估计模型效果图、输入图以及时变参数的估计图;
[0059]
图8为本发明提出的数据驱动的动态内模控制方法和无模型自适应控制方法在例2中没有外部扰动时的跟踪性能比较图;
[0060]
图9为本发明提出的数据驱动的动态内模控制方法在例2中存在阶梯型扰动时的输出跟踪效果图、估计模型效果图、输入图以及时变参数的估计图;
[0061]
图10为本发明提出的数据驱动的动态内模控制方法和无模型自适应控制方法在例2中存在阶梯型扰动时的跟踪性能比较图;
[0062]
图11为本发明提出的数据驱动的动态内模控制方法在例2中存在正弦型扰动时的输出跟踪效果图、估计模型效果图、输入图以及时变参数的估计图;
[0063]
图12为本发明提出的数据驱动的动态内模控制方法和无模型自适应控制方法在例2中存在正弦型扰动时的跟踪性能比较图;
具体实施方式
[0064]
为了更好地说明本发明的目的和优点,下面结合实施例和相应附图对发明内容做进一步详细说明。
[0065]
考虑一个离散时间非线性非仿射系统:
[0066]
y(k+1)=f(y(k),

,y(k-ny),u(k),

,u(k-nu))
ꢀꢀꢀ
(a1)
[0067]
其中,
[0068]
y(k)∈r表示k时刻系统的输出;
[0069]
u(k)∈r表示k时刻系统的输入;
[0070]nu
与ny分别表示系统输入和输出的阶数,是两个未知的正整数;
[0071]
表示未知的非线性函数;
[0072]
上述离散时间非线性非仿射系统(a1)需要满足以下几个假设条件:
[0073]
假设1:对于任意时刻,非线性函数f(
·
)关于u(k)的偏导数存在且连续;
[0074]
假设2:系统(a1)满足广义李普希兹条件,即对于任意两个时刻k1≠k2,如果u(k1)≠u(k2),则有|y(k1+1)-y(k2+1)|≤b
θ
|u(k1)-u(k2)|,b
θ
是一个大于0的常数;
[0075]
使用动态线性化的方法,将上述非线性系统(a1)转化为等价的线性数据模型:
[0076]
y(k+1)=y(k)+θ(k)δu(k)
ꢀꢀꢀ
(a2)
[0077]
其中,
[0078]
θ(k)表示线性数据模型的伪偏导数参数;
[0079]
δ表示差分算子,即δu(k)=u(k)-u(k-1);
[0080]
设计参数更新律对线性数据模型中的未知伪偏导数参数进行估计:
[0081][0082]
其中,
[0083]
表示对梯度参数的估计;
[0084]
η表示步长因子,且满足0<η<2;
[0085]
μ表示一个正的权重系数,且满足μ>0;
[0086]
为了使参数更新律(a3)有更强的跟踪能力,设计如下的重置算法:
[0087][0088]
其中,
[0089]
是的初值;
[0090]
ε是一个很小的正数;
[0091]
存在外部扰动时,非线性非仿射系统的估计模型为:
[0092][0093]
其中,
[0094]
v(k)=ξ(k)+d(k),表示不确定性的总和;
[0095]
表示估计模型和实际系统的误差;
[0096]
d(k)表示有界的外部扰动;
[0097]
设计如下的控制增量:
[0098]
δu(k)=δun(k)+δuc(k)
ꢀꢀꢀ
(a6)
[0099]
其中,
[0100]
δun(k)表示标称控制增量;
[0101]
δuc(k)表示不确定性补偿控制增量;
[0102]
之后设计标称控制增量;忽略外部扰动和模型失配,系统模型为:
[0103][0104]
对(a7)直接求逆,得到标称控制增量:
[0105][0106]
其中,
[0107]
α∈(0,1)表示一个控制增益;
[0108]
r(k+1)表示k+1时刻的目标输出;
[0109]
c1是一个正的常数,防止(a8)的分母过于接近0;
[0110]
这样得到如下的数据驱动的动态内模标称控制方法:
[0111][0112]
考虑非线性非仿射系统(a1)如果满足假设1-2,且控制器参数调节在允许范围内,那么提出的数据驱动的动态内模标称控制方法(a9)可以保证:对于调节任务,系统的跟踪误差e(k)能随时间收敛到零。
[0113]
之后,设计不确定性补偿控制增量δuc(k)对扰动以及实际系统和内模模型之间的失配进行补偿:
[0114][0115]
上式意味着:
[0116][0117]
对(a11)直接求逆,得到:
[0118][0119]
由(a5),得到:
[0120][0121]
把(a13)带入(a12)中,并令之为因果的,得到:
[0122][0123]
其中,
[0124]
β表示一个正的控制增益;
[0125]
c2是一个正的常数,防止(a14)的分母过于接近0;
[0126]
f(z)表示一个用来增强鲁棒性的线性时不变滤波器;
[0127]
总结上面的控制器设计过程,得到数据驱动的动态内模控制方案:
[0128][0129]
考虑非线性非仿射系统(a1)如果满足假设1-2,且控制器参数调节在允许范围内,那么提出的数据驱动的动态内模控制方法(a15)可以保证:对于调节任务,系统的跟踪误差e(k)能随时间收敛到一个界。
[0130]
为了验证本发明方法的正确性,对本发明的方法进行了以下仿真:
[0131]
实施例子1:考虑一个离散时间非线性非仿射系统:
[0132][0133]
其中,a(k)=1+round(0.02k);
[0134]
期望轨迹为:
[0135][0136]
情况一:没有外部扰动;
[0137]
控制器参数设置为η=1,μ=1,ε=10-7
,α=0.3,c1=0.1,输入和输出的初值分别是u(0)=0和y(0)=-1;应用所提出的数据驱动的动态内模标称控制方法(a9),仿真结果如图1所示;图1中分别显示了输出跟踪性能、控制输入、参数估计值以及动态线性内模对系统的估计能力,从图1可以看出所提出的数据驱动的动态内模标称控制方法能实现较好的跟踪性能,控制输入总是有界的,动态线性内模能准确地对非线性系统进行估计;
[0138]
此外,将所提出的方法和如下所示无模型自适应控制方法进行对比;
[0139][0140]
其中,ρ∈(0,1)是步长因子,λ>0是权重系数;
[0141]
控制器参数设置为:η=1,μ=1,ε=10-7
,ρ=0.6,λ=0.8,输入和输出的初值分别是u(0)=0和y(0)=-1;应用无模型自适应控制方法(a18),仿真结果和所提出的数据驱动的动态内模标称控制方法的对比如图2所示,可以看出无模型自适应控制方法也能达到满意的控制效果;为了更准确地进行比较,以所有时刻的误差绝对值之和(sum of absolute values of errors,sae)作为评价跟踪性能的标准,即t是最大运行时间;对于提出的数据驱动的动态内模标称控制方法,sae=17;对于无模型自适应控制方法,sae=39.7;可以看出所提出的方法比无模型自适应控制方法好一些,因为内模控制对于模型失配的处理能力更强;
[0142]
情况二:存在阶梯型扰动;
[0143]
控制器参数设置为η=1,μ=1,ε=10-7
,α=0.3,β=0.6,c1=0.1,c2=0.1,输入和输出的初值分别是u(0)=0和y(0)=-1,滤波器选为f(z)=(1-r1)/(1-r1z-1
),r1=0.5;应用所提出的数据驱动的动态内模标称控制方法(a15),仿真结果如图3所示;可以看出在存在阶梯型扰动时,所提出的方法能实现较好的跟踪性能,控制输入总是有界的,并且动态线性内模能准确地对非线性系统进行估计;之后将所提出的方法和无模型自适应控
制方法进行对比,无模型自适应控制(a18)的参数选为:η=1,μ=1,ε=10-7
,ρ=0.6,λ=0.8;仿真结果如图4所示,对于所提出的方法,sae=22.7;对于无模型自适应控制方法,sae=40.8;所提出的方法控制效果更好,这是因为所提出的方法中含有对于扰动和模型失配的补偿机制;
[0144]
情况三:存在正弦型扰动;
[0145]
扰动为d(k)=0.1sin(0.1k);控制器参数设置为η=1,μ=1,ε=10-7
,α=0.3,β=0.8,c1=0.1,c2=0.01,输入和输出的初值分别是u(0)=0和y(0)=-1,滤波器选为f(z)=(1-r1)/(1-r1z-1
),r1=0.3;应用所提出的数据驱动的动态内模标称控制方法(a15),仿真结果如图5所示;可以看出在存在正弦型扰动时,所提出的方法能实现较好的跟踪性能,控制输入总是有界的,并且动态线性内模能准确地对非线性系统进行估计;之后将所提出的方法和无模型自适应控制方法进行对比,无模型自适应控制(a18)的参数选为:η=1,μ=1,ε=10-7
,ρ=0.6,λ=0.8;仿真结果如图6所示,对于所提出的方法,sae=25.4;对于无模型自适应控制方法,sae=68.3;所提出的方法控制效果更好;
[0146]
实施例子2:考虑一个热交换器:
[0147][0148]
其中,d(k)表示扰动;
[0149]
参考轨迹为:
[0150][0151]
情况一:没有外部扰动;
[0152]
控制器参数设置为η=1,μ=1,ε=10-7
,α=0.2,c1=0.001,输入和输出的初值分别是u(0)=0和y(0)=1;应用所提出的数据驱动的动态内模标称控制方法(a9),仿真结果如图7所示;图7中分别显示了输出跟踪性能、控制输入、参数估计值以及动态线性内模对系统的估计能力,从图7可以看出所提出的数据驱动的动态内模标称控制方法能实现较好的跟踪性能,控制输入总是有界的,动态线性内模能准确地对非线性系统进行估计;之后将所提出的方法和无模型自适应控制方法进行对比,无模型自适应控制(a18)的参数选为:η=1,μ=1,ε=10-7
,ρ=0.8,λ=0.5;仿真结果如图8所示,对于所提出的方法,sae=7.56;对于无模型自适应控制方法,sae=13.28;所提出的方法控制效果更好;
[0153]
情况二:存在阶梯型扰动;
[0154]
控制器参数设置为η=1,μ=1,ε=10-7
,α=0.35,β=1,c1=0.001,c2=2,输入和输出的初值分别是u(0)=0和y(0)=1,滤波器选为截至频率为0.65π的低通滤波器;应用所提出的数据驱动的动态内模标称控制方法(a15),仿真结果如9所示;可以看出在存在阶梯型扰动时,所提出的方法能实现较好的跟踪性能,控制输入总是有界的,并且动态线性内模能准确地对非线性系统进行估计;之后将所提出的方法和无模型自适应控制方法
进行对比,无模型自适应控制(a18)的参数选为:η=1,μ=1,ε=10-7
,ρ=0.8,λ=0.5;仿真结果如图10所示,对于所提出的方法,sae=19.6;对于无模型自适应控制方法,sae=21.16;所提出的方法控制效果更好,这是因为所提出的方法中含有对于扰动和模型失配的补偿机制;
[0155]
情况三:存在正弦型扰动;
[0156]
扰动为d(k)=0.2sin(0.1k);控制器参数设置为η=1,μ=1,ε=10-7
,α=0.3,β=1,c1=0.001,c2=1,输入和输出的初值分别是u(0)=0和y(0)=1,滤波器选为截止频率为0.6π的低通滤波器;应用所提出的数据驱动的动态内模标称控制方法(a15),仿真结果如图11所示;可以看出在存在正弦型扰动时,所提出的方法能实现较好的跟踪性能,控制输入总是有界的,并且动态线性内模能准确地对非线性系统进行估计;之后将所提出的方法和无模型自适应控制方法进行对比,无模型自适应控制(a18)的参数选为:η=1,μ=1,ε=10-7
,ρ=0.8,λ=0.5;仿真结果如图12所示,对于所提出的方法,sae=19.12;对于无模型自适应控制方法,sae=26.04;所提出的方法控制效果更好;
[0157]
以上所述的具体描述,对发明的目的、技术方案和有益效果进行了进一步的详细说明,所应理解的是,实施例仅用于解释本发明,并不用于限定本发明的保护范围,凡与本发明在相同原理和构思条件下修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1