一种空间机械臂与未知环境接触过程的智能柔顺操控方法

文档序号:31050294发布日期:2022-08-06 06:51阅读:来源:国知局

技术特征:
1.一种空间机械臂与未知环境接触过程的智能柔顺操控方法,其特征在于,包括以下步骤:第一步,根据凯恩方程与多体动力学理论,建立空间机械臂系统的通用动力学模型,并对环境接触模型进行数学表征;第二步,忽略环境位置信息,将环境接触模型简化为一般的最优跟踪模型,设计最优性能函数与基于状态反馈及模型信息的积分强化学习算法;第三步,设计状态重构观测器,与积分强化学习算法结合,利用输入输出数据实现系统的无模型最优阻抗控制;第四步,根据简化前的数学模型,将第三步中提出的积分强化学习算法进行修正,将该算法应用于空间机械臂的智能柔顺操控。2.根据权利要求1所述的空间机械臂与未知环境接触过程的智能柔顺操控方法,其特征在于:所述第一步具体实现如下:利用凯恩方程进行多体动力学建模的一般形式可以写为:其中和分别表示系统第k阶广义主动力和广义惯性力,n是系统所有广义速率写成分量列阵形式,分量列阵的个数,选取空间机械臂系统的广义速率为:其中,和分别表示基座的速度和角速度在基座本体坐标系中的分量,表示第i个机械臂关节的角速度。通过凯恩方程进行规范化推导,可以得到空间机械臂系统的动力学模型为:其中为υ的导数,η为系统全局质量阵,f
non
为系统全局非线性项,f
a
表示广义主动力为:其中f0是基座受到的推力在基座本体坐标系中的分量列阵,r
b
是f0作用点在基座本体坐标系中的矢径,t0是基座受到的力矩在基座本体坐标系中的分量列阵,t
i
是第i个电机转子的驱动力矩,0矩阵具有其对应的广义速率相容的维数;下标“i-1”和“2m-i”分别表示有i-1和2m-i个0矩阵,上标“t”表示矩阵的转置;对于任意三维列向量χ=[χ
1 χ
2 χ3]
t
,上标“~”的定义为其中标量χ1、χ2、χ3为向量χ中的元素;对于目标位置固定的抓捕任务中,空间机械臂末端与环境的接触力f
e
的数学模型可表征为:式中,g
e
表示环境模型的刚度系数,c
e
为阻尼系数,m
e
为质量系数,x表示机械臂末端位
置在惯性系中的分量,分别表示x的一阶导数和二阶导数,x
e
表示目标位置在惯性系中的分量;阻抗控制模型的表达式为:式中,m
d
、c
d
、g
d
分别表示阻抗模型的期望惯量、阻尼、刚度参数,x
d
表示机械臂末端的期望位置;将环境模型与阻抗模型相加,得到:其中,f=g
d
(x-x
d
)为控制输入;取状态变量控制输入取u=f,则可以得到阻抗控制模型的线性状态方程形式:其中表示x的导数,r
e
=x
e
表示环境位置输入,c=[0 ι]。3.根据权利要求1所述的空间机械臂与未知环境接触过程的智能柔顺操控方法,其特征在于:所述第二步具体实现如下:首先忽略环境位置r
e
的影响,针对一般的线性系统:参考轨迹通过以下轨迹生成器产生:其中f是常值矩阵,用于生成轨迹;取性能函数为:其中q0≥0和r>0分别为相应的对称权重矩阵,γ为折扣因子,t表示当前时间;然后构造增广系统的状态为得到增广系统为:从而性能函数可改写为:其中i表示与c维数一致的三维矩阵,
从而得到的基于状态反馈的值迭代积分强化学习算法为:a)初始化:给定任意初始控制策略u0;b)策略评估:对当前时刻i的控制策略u
i
,利用以下bellman方程求解i+1时刻的正定对称矩阵p
i+1
;其中p
i
表示i时刻的正定对称矩阵,δt表示系统采样周期;c)策略改进:更新控制策略;d)收敛条件:如果满足||p
i+1-p
i
||≤ε则停止迭代,否则设置i=i+1并转到策略评估步骤。4.根据权利要求1所述的空间机械臂与未知环境接触过程的智能柔顺操控方法,其特征在于:所述第三步具体实现如下:增广系统的状态可以通过输入输出数据重构,表达式为:其中为可观测的历史数据,由t-δt时刻到t-nδt时刻的输入数据集和输出数据集以及t-nδt时刻的期望轨迹r(t-nδt)组成,m为重构矩阵,表示为:其中u
n
、v
n
、φ
n
均表示参数矩阵,表示φ
n
的伪逆,的伪逆,将重构状态表达式代入基于状态反馈的值迭代积分强化学习算法,并定义为正定对称矩阵,其中p0、p
u
、p
y
、p
r
均为矩阵中的元素,“*”表示与控制无关的矩阵元素,则可得到基于输入输出数据的无模型值迭代积分强化学
习算法:a)初始化:任意初始控制策略由初始时刻的给出;b)策略评估:对于当前的控制策略u
i
,利用接下来的bellman方程求解矩阵p
*
在i+1时刻的值的值其中,p
i*
表示i时刻的矩阵p
*
;c)策略改进:更新控制策略;其中分别为i+1时刻p0、p
u
、p
y
、p
r
的值;d)收敛条件:如果满足则停止迭代,否则设置i=i+1并转到策略评估步骤。5.根据权利要求1所述的空间机械臂与未知环境接触过程的智能柔顺操控方法,其特征在于:所述第四步具体实现如下:第三步中算法是针对系统π2和π3提出的,没有考虑目标位置的影响,为使算法在空间机械臂阻抗控制中的应用具有通用性,需要针对系统π1对算法进行改进,首先修正的状态重构表达式为:其中为可观测的历史数据,相对于第三步中的增加了r
e
,由于本发明研究的阻抗控制问题中,环境位置r
e
和期望位置r均为常值,因此在实现过程中取任意时刻均可;m

为修正的重构矩阵,表示为:其中v
n
、φ
n
、的定义均与第三步相同;重新定义则修正后的控制策略为:
其中分别为i+1时刻p0、p
u
、p
y
、p
r1
、p
r2
的值。

技术总结
本发明涉及一种空间机械臂与未知环境接触过程的智能柔顺操控方法,首先,利用凯恩方程和多体动力学理论建立空间机械臂系统的动力学模型,对机械臂末端与目标的环境接触模型进行数学表征;其次,将接触模型简化为最优跟踪模型,设计性能函数和基于部分模型信息及状态反馈的积分强化学习算法;然后,将状态观测器与积分强化学习算法融合,提出基于输入输出数据的无模型最优控制方法;最后针对简化前的接触模型,将提出的算法进行修正,应用于空间机械臂抓捕未知目标的最优阻抗控制。本发明能够通过自主学习实现部分状态可测情况下的无模型最优控制,可用于空间机械臂抓捕非合作目标的安全柔顺接触控制。标的安全柔顺接触控制。标的安全柔顺接触控制。


技术研发人员:胡庆雷 吴晗 邵小东 郑建英 郭雷
受保护的技术使用者:北京航空航天大学
技术研发日:2022.04.26
技术公布日:2022/8/5
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1