基于图像识别的机械臂多任务自主学习控制方法及系统与流程

文档序号:23992294发布日期:2021-02-20 13:51阅读:280来源:国知局
基于图像识别的机械臂多任务自主学习控制方法及系统与流程

[0001]
本发明涉及机器臂控制技术领域,具体涉及一种基于图像识别的机械臂多任务自主学习控制方法及系统。


背景技术:

[0002]
随着“工业4.0”的提出与机械臂应用的领域的不断扩展,人们对机械臂智能化程度的要求也越来越高,不仅希望通过多个机器人以协作的方式来执行分配的复杂任务并从工作任务中学习、存储、利用经验知识,以提高机器人的工作效率与工作质量,而且希望机器人能根据当前工作任务需要实现自主控制的能力。然而,现有的机器人控制技术仅能实现单个工作任务的高性能控制,无法采用一种控制技术实现多个工作任务的高精度自主控制。
[0003]
近年来,分布式协同学习、宽度学习理论快速发展。协同学习能够解决一组具有相同非线性不确定动态的机器人在各自不同参考轨迹下,利用机器人间的无向拓扑通信,实现非线性不确定动态的经验知识获取、表达和应用问题,协同学习有效提升了多机器人间对各自工作任务的信息交互能力,使得每个机器人具备完成组内机器人的工作任务的能力。与此同时,机械臂随着应用场景日渐丰富,与模式识别结合应用的趋势日益明显,以进一步提升机械臂的智能化水平。在机器视觉领域中,为了提高函数逼近和模式分类的精度,网络结构不断朝着深度方向拓展,由此带来了网络训练时间长和速度慢、硬件性能要求高等问题。为了提高网络训练和模式识别的速度,宽度学习理论以宽度方式扩展包括特征映射节点和增强节点的神经元,然后通过岭回归算法计算输出权重的网络模型,给出了一种高效的机器学习与模式识别的学习框架,有效克服了深度网络结构带来的训练时间长、速度慢的问题。分布式协同学习和宽度学习理论分别在多任务控制和模式识别领域各自具有突出的优势。分布式协同学习可以为机械臂控制系统提供可完成多任务的控制器设计,宽度学习系统可以对外部图像进行分类,两种学习技术的结合可以实现机械臂在执行任务的过程中实时监测并切换工作任务,保证控制性能,实现机械臂的多任务自主智能控制。


技术实现要素:

[0004]
为了克服现有技术存在的缺陷与不足,本发明提供一种基于图像识别的机械臂多任务自主学习控制方法,本发明针对不同控制任务,基于分布式协同学习,设计可完成不同控制任务的常值神经网络控制器;通过识别控制任务轨迹,构建一类基于卷积神经网络的宽度学习系统作为图像分类器,建立映射表将图像的类别与控制任务的轨迹建立一一对应关系,使外界图像的变化能被常值神经网络控制器响应,在执行控制任务过程中,当机械臂检测到工作任务发生变化,调用常值神经网络控制器实现机械臂多任务自主控制。
[0005]
为了达到上述目的,本发明采用以下技术方案:
[0006]
本发明提供一种基于图像识别的机械臂多任务自主学习控制方法,包括下述步骤:
[0007]
在辨识阶段构建一组同构机械臂的运动学模型、动力学模型和多个期望回归的笛卡尔空间轨迹模型,定义每种期望回归轨迹为一种工作任务;
[0008]
在辨识阶段,根据构建的机械臂逆运动学模型将笛卡尔空间轨迹映射为机械臂关节空间回归轨迹,通过构建通讯拓扑结构,在关节空间联合轨迹下实现一组同构机械臂神经网络权值在线经验分享,设计自适应神经网络协同学习控制器为:
[0009][0010][0011]
其中,c
i,2
为设计的正常数控制增益矩阵,为理想神经网络权值的估计值,s(ψ
i
)是以向量ψ
i
为输入的高斯径向基函数,a
ij
为机械臂间通讯拓扑的邻接矩阵元素,z
i,p
为误差变量,γ
i
为设计的正定对角矩阵,σ
i
为常数;ρ为协同增益系数;
[0012]
在协同学习控制后闭环系统一致收敛的时间段[t1,t2]内,选取常值神经网络权值形式为:
[0013][0014]
利用经验权值设计常值神经网络控制器:
[0015][0016]
在辨识阶段利用卷积神经网络的特征提取和泛化能力,训练图像经过卷积池化操作进行特征提取得到特征层,所述特征层再经过卷积池化操作,将特征泛化得到增强层,特征层与增强层全链接于输出层,构建一类基于卷积神经网络的宽度学习系统作为图像分类器;
[0017]
在辨识阶段将图像分类器中图像的类别和多个工作任务设置映射表,建立一一对应关系,表示为:
[0018]
f:κ

σ
y
[0019]
其中,κ∈{1,2,...,k}是图像分类的标签,σ
y
是机械臂组可完成的所有工作任务;
[0020]
在识别阶段摄像头实时监测环境变化,获得图像标签;
[0021]
在识别阶段通过建立好的映射表切换到所述图像标签对应工作任务;
[0022]
机械臂在识别阶段调用常值神经网络控制器,完成机械臂多任务自主控制。
[0023]
作为优选的技术方案,在辨识阶段构建一组同构机械臂的运动学模型,具体步骤包括:
[0024]
正运动学表示机械臂从关节空间到笛卡尔空间的映射:
[0025]
χ=t(q)
[0026]
逆运动学表示机械臂从笛卡尔空间到关节空间的映射:
[0027]
q=invt(χ)
[0028]
其中,χ=[x,y,z]
t
为机械臂末端在笛卡尔空间的位置,q=[θ1,θ2,...,θ
n
]
t
为机械臂在关节空间的角位移,n对应着机械臂的关节数,t(
·
)为正运动学映射关系,invt(
·
)为
正运动学映射关系。
[0029]
作为优选的技术方案,所述一组同构机械臂的动力学模型表示为:
[0030][0031]
其中,x
i,1
=[x
i,1,1
,x
i,1,2
,

,x
i,1,n
]
t
、x
i,2
=[x
i,2,1
,x
i,2,2
,

,x
i,2,n
]
t
分别为机械臂关节角位移和关节角速度,m(x
i,1
)为机械臂的惯性矩阵,c(x
i,1
,x
i,2
)为向心力矩阵,g(x
i,1
)为重力项,f(x
i,2
)为摩擦力向量,u
i
为控制力矩。
[0032]
作为优选的技术方案,所述笛卡尔空间轨迹模型表示为:
[0033][0034]
其中,分别为工作任务κ下的机械臂末端在笛卡尔空间下的期望回归轨迹,分别为已知的连续可导周期函数。
[0035]
作为优选的技术方案,所述根据构建的机械臂逆运动学模型将笛卡尔空间轨迹映射为机械臂关节空间回归轨迹,具体表示为:
[0036]
q
d
=invt(χ
d
)
[0037]
其中,χ
d
表示笛卡尔空间轨迹,q
d
表示机械臂关节空间回归轨迹,invt(
·
)表示正运动学映射关系。
[0038]
作为优选的技术方案,所述训练图像经过卷积池化操作进行特征提取得到特征层,具体步骤包括:
[0039]
对训练数据集中第j个输入图像image
j
=r
w0
×
h0
进行以下卷积和池化操作:
[0040][0041]
t
ip
=pooling(t
ic
,p
f
,s
pf
)∈r
w2
×
h2
[0042]
其中,t
ic
和t
ip
分别代表卷积conv(
·
)和池化pooling(
·
)操作的输出图像,为第i个通道随机生成的尺寸为θ
f
×
θ
f
的卷积核,i=1,2,...,η
f
,η
f
为卷积核通道总数,为第i个通道对应的偏置项,s
cf
、s
pf
分别为卷积和池化操作选择的步幅,p
f
为池化窗口,w1
×
h1、w2
×
h2分别为进行卷积和池化操作输出图像的尺寸;
[0043]
将{t
ip
|i=1,2,...,η
f
}重塑为特征节点数为的特征向量的特征向量训练样本经卷积池化操作得到特征层ξ(
·
)为tanh或sigmoid激活函数,l为训练样本个数。
[0044]
作为优选的技术方案,所述特征层再经过卷积池化操作,将特征泛化得到增强层,具体步骤包括:
[0045]
卷积和池化操作的输出图像表示为:
[0046][0047][0048]
其中,和分别代表卷积和池化操作的输出图像,conv(
·
)表示卷积操作,pooling(
·
)表示池化操作,为第i个通道随机生成的尺寸为θ
e
×
θ
e
的卷积核,i=1,2,...,η
e
,η
e
为卷积核通道总数,为第i个通道对应的偏置项,s
ce
、s
pe
分别为卷积和池化操作选择的步幅,p
e
为池化窗口,w3
×
h3、w4
×
h4分别为进行卷积和池化操作输出图像的尺寸;
[0049]
将重塑为特征节点数为的特征向量的特征向量最终得到增强层其中,l为训练样本个数,ξ(
·
)为tanh或sigmoid激活函数。
[0050]
作为优选的技术方案,所述特征层与增强层全链接于输出层,构建一类基于卷积神经网络的宽度学习系统作为图像分类器,具体步骤包括:
[0051]
将特征节点与增强节点合并成a=[z|e],在训练阶段,利用岭回归算法计算a的伪逆值:
[0052][0053]
其中,i是跟矩阵a
t
a同大小的单位矩阵,λ是岭回归算法中的正则项系数;
[0054]
由y=aw可得输出层的权值:
[0055]
w=a
+
y
[0056]
其中,y∈r
l*k
为训练集的输出矩阵,l是样本数,k是图像标签数。
[0057]
作为优选的技术方案,所述摄像头实时监测环境变化,获得图像标签,具体步骤包括:
[0058]
摄像头捕获指示图像;
[0059]
对捕获图像进行预处理,所述预处理包括区域选定、二值化和维度调整步骤;
[0060]
将预处理后的图像作为训练好的图像分类器的输入,获得该图像的标签。
[0061]
本发明还提供一种基于图像识别的机械臂多任务自主学习控制系统,包括:模型构建模块、空间轨迹映射模块、控制器构建模块、训练模块、映射表设置模块、图像信息采集模块、工作任务切换模块和控制信号输出模块;
[0062]
所述模型构建模块用于在辨识阶段构建一组同构机械臂的运动学模型、动力学模型和多个期望回归的笛卡尔空间轨迹模型,定义每种期望回归轨迹为一种工作任务;
[0063]
所述空间轨迹映射模块用于在辨识阶段根据构建的机械臂逆运动学模型将笛卡尔空间轨迹映射为机械臂关节空间回归轨迹;
[0064]
所述控制器构建模块用于通过构建通讯拓扑结构,在关节空间联合轨迹下实现一组同构机械臂神经网络权值在线经验分享,设计自适应神经网络协同学习控制器为:
[0065]
[0066][0067]
其中,c
i,2
为设计的正常数控制增益矩阵,为理想神经网络权值的估计值,s(ψ
i
)是以向量ψ
i
为输入的高斯径向基函数,a
ij
为机械臂间通讯拓扑的邻接矩阵元素,z
i,p
为误差变量,γ
i
为设计的正定对角矩阵,σ
i
为常数;ρ为协同增益系数;
[0068]
在协同学习控制后闭环系统一致收敛的时间段[t1,t2]内,选取常值神经网络权值形式为:
[0069][0070]
利用经验权值设计常值神经网络控制器:
[0071][0072]
所述训练模块用于在辨识阶段利用卷积神经网络的特征提取和泛化能力,训练图像经过卷积池化操作进行特征提取得到特征层,所述特征层再经过卷积池化操作,将特征泛化得到增强层,特征层与增强层全链接于输出层,构建一类基于卷积神经网络的宽度学习系统作为图像分类器;
[0073]
所述映射表设置模块用于在辨识阶段将图像分类器中图像的类别和多个工作任务设置映射表,建立一一对应关系,表示为:
[0074]
f:κ

σ
y
[0075]
其中,κ∈{1,2,...,k}是图像分类的标签,σ
y
是机械臂组可完成的所有工作任务;
[0076]
所述图像信息采集模块在识别阶段通过摄像头实时监测环境变化,获得图像标签;
[0077]
所述工作任务切换模块用于在识别阶段通过建立好的映射表切换到所述图像标签对应工作任务;
[0078]
所述控制信号输出模块用于输出控制信号,机械臂在识别阶段调用常值神经网络控制器,完成机械臂多任务自主控制。
[0079]
本发明与现有技术相比,具有如下优点和有益效果:
[0080]
(1)本发明构建基于卷积神经网络的宽度学习系统作为图像分类器,与现有的深度神经网络算法相比,极大减少了模型训练时间,与宽度学习算法相比,提高了图像识别准确度。
[0081]
(2)本发明采用了协同学习技术方案,解决了复杂工作环境下机械臂多种工作任务的自主控制问题,达到了机械臂采用一种学习控制方案实现了多种工作任务的精准控制效果。
[0082]
(3)本发明的机械臂不仅能够从复杂的工作任务中获取和调用经验知识,而且能够通过视觉传感器对外界工作任务进行实时监测,实现了机械臂在多种工作任务下的智能自主控制。
附图说明
[0083]
图1为本实施例1的基于图像识别的机械臂多任务自主学习控制方法的流程图;
[0084]
图2为本实施例1的机械臂系统结构示意图;
[0085]
图3为本实施例1的3个机械臂协同学习控制通讯拓扑网络图;
[0086]
图4为本实施例1的工作界面俯视画面图;
[0087]
图5为本实施例1仿真场景中机械臂末端轨迹的示意图;
[0088]
图6为本实施例1基于卷积神经网络与宽度学习的图像分类器框架图;
[0089]
图7为本实施例1的3个机械臂的rbf神经网络权值范数一致收敛曲线图;
[0090]
图8为本实施例1的机械臂关节角位移跟踪误差变化曲线图;
[0091]
图9为本实施例1的机械臂关节角位移跟踪变化曲线图。
具体实施方式
[0092]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0093]
实施例1
[0094]
如图1所示,本实施例提供一种基于图像识别的机械臂多任务自主学习控制方法,包括下述步骤:
[0095]
s1:辨识阶段,构建一组同构机械臂的运动学和动力学模型和若干期望回归的笛卡尔空间轨迹模型,定义每种期望回归轨迹为一种工作任务;
[0096]
如图2所示,本实施例机械臂采用三连杆机械臂,连杆长度分别为a1=75mm,a2=245mm,a1=240mm,joint 1、joint 2和joint 3为发明实施例中三连杆机械臂的关节1、关节2和关节3;
[0097]
设笛卡尔空间上的一点为p(p
x
,p
y
,p
z
),其对应的关节角位移为q,为了简化书写,约定c
i
=cosθ
i
,s
i
=sinθ
i
,c
ij
=cos(θ
i

j
),s
ij
=sin(θ
i

j
),根据关节的几何关系,其正运动学关系为:
[0098]
p
x
=c1(a2c2+a3c
23
)
[0099]
p
y
=s1(a2c2+a3c
23
)
[0100]
p
z
=a1+a2s2+a3s
23
[0101]
基于正运动学关系式,可求解机械臂的逆运动学关系,
[0102]
求解关节3角位移θ3:根据机械臂的几何关系,得到:
[0103][0104][0105]
故θ
31
=a tan2(s3,c3),θ
32
=-a tan2(s3,c3)
[0106]
求解关节2角位移θ2:利用关节角θ3以及正运动学关系,可得
[0107]
[0108][0109]
根据三角函数性质,当时,
[0110][0111][0112]
当时,
[0113][0114][0115]
求解关节1角位移θ1:由空间几何关系可得
[0116]
θ
11
=a tan(p
x
,p
y
)
[0117]
θ
12
=a tan(-p
x
,-p
y
)
[0118]
其中,atan(
·
)为改进的反正切函数,其值域可以满足机械臂逆运动学算法求解的角度范围θ
g
∈[-π,π],g=1,2,3。
[0119]
机械臂末端在位置p的4组逆解分别为(θ
11

21

31
),(θ
11

23

32
),(θ
12

22

31
),(θ
12

24

32
),在笛卡尔空间转换入关节空间时,从4个逆解中按照前后关节角距离最近和转角之和最小的原则选取一个逆解q=(θ1,θ2,θ3),即完成机械臂的逆运动学映射:
[0120]
q=invt(p)
[0121]
建立一组包含3个同构三连杆机械臂的动力学模型:
[0122][0123]
其中,x
i,1
=[x
i,1,1
,x
i,1,2
,x
i,1,3
]
t
、x
i2
=[x
i,2,1
,x
i,2,2
,x
i,2,3
]
t
分别为机械臂关节角位移和关节角速度,m(x
i,1
)为机械臂的惯性矩阵,c
m
(x
i,1
,x
i,2
)为向心力矩阵,g(x
i,1
)为重力项,f(x
i,2
)为摩擦力向量,u
i
=[u
i,1
,u
i,2
,u
i,3
]
t
表示系统的控制输入。
[0124]
本实施例中给定三种期望回归轨迹模型为:
[0125][0126]
其中,分别为工作任务k下的机械臂末端在笛卡尔空间下的期望回归轨迹,分别为已知的连续可导周期函数。本实施例中给定三种工作任务模式的周期一致,t=8s,且在一个周期中的参考轨迹给定如下:
[0127][0128][0129]
s2:辨识阶段,基于构建的机械臂逆运动学,将笛卡尔空间轨迹映射为机械臂关节空间回归轨迹,即
[0130][0131]
基于分布式协同学习控制算法,3个同构机械臂利用构造的通讯拓扑,在关节空间的联合轨迹q=[q1,q2,q3]下,实现神经网络权值在线经验分享,得到自适应神经网络协同学习控制器:
[0132][0133][0134]
其中,c
i,2
为设计的正常数控制增益矩阵,为理想神经网络权值的估计值,s(ψ
i
)是以向量为输入的高斯径向基函数;a
ij
为机械臂间通讯拓扑的邻接矩阵元素;z
i,p
(p=1,2)为设计控制器过程的误差变量;γ
i
为设计的正常数对角矩阵;σ
i
为提高控制器鲁棒性所设计的小常数;ρ为协同增益系数。在本实施例中,c
1,1
=c
2,1
=4,c
1,2
=c
2,2
=38,γ
i
=7.5,ρ=0.8,σ
i
=0.0004,如图3所示,本实施例在自适应神经网络协同学习控制训练中采用3个机械臂进行三种工作任务的训练,根据3个机械臂协同学习控制的通讯拓扑网络可知,由邻接矩阵元素a
ij
组成的机械臂组邻接矩阵为:
[0135][0136]
在协同学习后闭环系统一致收敛的时间段[t1,t2]内,选取常值神经网络权值形式为:
[0137][0138]
利用经验权值设计常值神经网络控制器:
[0139]
[0140]
s3:辨识阶段,利用卷积神经网络优秀的特征提取和泛化能力,训练图像经过卷积池化操作进行特征提取,得到特征层:
[0141]
对训练数据集中第j个输入图像image
j
=r
w0
×
h0
卷积和池化,得到:
[0142][0143]
t
ip
=pooling(t
ic
,p
f
,s
pf
)∈r
w2
×
h2
[0144]
其中,t
ic
和t
ip
分别表示卷积conv(
·
)和池化pooling(
·
)操作的输出图像,为第i个通道随机生成的尺寸为θ
f
×
θ
f
的卷积核,i=1,2,...,η
f
,η
f
为卷积核通道总数,为第i个通道对应的偏置项,s
cf
、s
pf
分别为卷积和池化操作选择的步幅,p
f
为池化窗口,w1
×
h1、w2
×
h2分别为进行卷积和池化操作输出图像的尺寸;
[0145]
将重塑为特征节点数为的特征向量的特征向量将l个训练样本都进行上述操作,得到特征层ξ(
·
)为tanh或sigmoid激活函数;
[0146]
本实施例在验证基于卷积神经网络的宽度学习分类器效果中,在建立的轨迹数据集中进行分类器的训练和测试,数据集中包括“圆”、“花”与“心”三类标签。训练集中包含50幅轨迹图,测试集包含10幅轨迹图,每个图像尺寸为32
×
32,特征层选取的卷积核通道数η=2,尺寸θ=5,卷积、池化操作的步幅s
c
=1,s
p
=2,p为2
×
2的均值池化窗口,因此计算可知,卷积和池化操作输出图像的尺寸w1
×
h1和w2
×
h2分别为28
×
28和14
×
14,最后的特征节点数本实施例的ξ(
·
)选择了tanh激活函数。
[0147]
如图4、图5所示,在系统运行时间段内,视觉传感器先后获得形状“圆-花-心”的图像,机械臂根据视觉传感器观察的图像,其末端描绘出对应的形状。
[0148]
在本实施例步骤s3中,将得到特征层的进一步经过卷积池化操作,将特征泛化得到增强层:
[0149][0150][0151]
其中,和分别代表卷积conv(
·
)和池化pooling(
·
)操作的输出图像,为第i个通道随机生成的尺寸为θ
e
×
θ
e
的卷积核,i=1,2,...,η
e
,η
e
为卷积核通道总数,为第i个通道对应的偏置项,s
ce
、s
pe
分别为卷积和池化操作选择的步幅,p
e
为池化窗口,w3
×
h3、w4
×
h4分别为进行卷积和池化操作输出图像的尺寸;
[0152]
将重塑为增强节点数为的特征向量的特征向量将l个训练样本都进行上述操作,得到增强层ξ(
·
)为tanh或sigmoid激活函数;
[0153]
在本实施例中,增强选取的卷积核通道数η=10,尺寸θ=3,卷积、池化操作的步幅s
c
=1,s
p
=2,p为2
×
2的均值池化窗口,因此计算可知,卷积和池化操作输出图像的尺寸w1
×
h1和w2
×
h2分别为12
×
12和6
×
6,最后的特征节点数本实施例的ξ(
·
)选择了
tanh激活函数。
[0154]
在本实施例中,特征层与增强层全链接于输出层,如图6所示,构建基于卷积神经网络的宽度学习系统作为图像分类器为:
[0155]
将特征节点与增强节点合并成a=[z|e],在训练阶段,利用岭回归算法计算a的伪逆值:
[0156][0157]
其中,i是跟矩阵a
t
a同大小的单位矩阵,λ是脊回归算法中的正则项系数;
[0158]
由y=aw可得输出层的权值:
[0159][0160]
其中y∈r
l*k
为训练集的输出矩阵,n是样本数,k是图像标签数。
[0161]
s4:将步骤s3获得的宽度学习系统中图像的类别和步骤s2的若干关节空间轨迹设置映射表,建立一一对应关系:
[0162]
f:κ

σ
y
[0163]
其中,κ∈{1,2,3}是图像分类的标签,σ
y
是机械臂可完成的所有工作任务;
[0164]
s5:摄像头实时捕获图像指示,获得图像标签κ:
[0165]
s51:摄像头捕获指示图像;
[0166]
s52:对捕获图像进行区域选定、二值化、维度调整等预处理;
[0167]
s53:对预处理后的图像作为步骤s3中训练好的宽度学习分类器的输入,获得该图像的标签。
[0168]
s6:识别阶段,通过步骤s4建立好的映射表找到该图像标签对应的工作任务;
[0169]
s7:识别阶段,机械臂调用该模式的常值神经网络协同学习控制器。
[0170]
在本实施例中,x1、x2的初始值为x1(0)=[0,1.1829,-2.3055]
t
,x2(0)=[0,0,0]
t
,神经网络的节点数为12500,其中心点均匀分布在[-0.6,0.6]
×
[0.5,0.8]
×
[-2.9,-1.7]
×
[-1,1]
×
[-0.2,0.2]
×
[-1,1]上,宽度为width=[0.375,0.125,0.375,0.625,0.125,0.625]
t

[0171]
为了说明本发明利用卷积所构建的宽度学习系统作为图像分类器的有效性和快速性,本实施例对建立的轨迹数据集进行了训练和测试,分别进行3次独立的实验,其准确率和训练时间下如表1所示。
[0172]
表1宽度学习图像分类器3次实验结果表
[0173]
实验次数准确率/%训练时间/s11000.033121000.028931000.0317平均1000.0312
[0174]
由上表可知,在3次独立分类实验中,准确率均达到100%,并且训练时间均较短,因此,基于卷积神经网络的宽度学习系统作为图像分类器,满足实际工程中应用需求,在图像较为复杂的条件下仍能达到较好的分类能力。
[0175]
如图7所示,得到3个机械臂的rbf神经网络权值范数一致收敛曲线;如图8所示,得
到机械臂关节角位移跟踪误差变化曲线,机械臂的三个关节跟踪误差均在
±
0.025rads之间;如图9所示,得到机械臂在仿真场景中关节角位移与期望角位移变化曲线,由此可知,机械臂末端可根据视觉传感器的信息描绘出相应的图像,体现了机械臂可自主完成多工作任务的能力。
[0176]
实施例2
[0177]
本实施例提供一种基于图像识别的机械臂多任务自主学习控制系统,包括:模型构建模块、空间轨迹映射模块、控制器构建模块、训练模块、映射表设置模块、图像信息采集模块、工作任务切换模块和控制信号输出模块;
[0178]
在本实施例中,模型构建模块用于在辨识阶段构建一组同构机械臂的运动学模型、动力学模型和多个期望回归的笛卡尔空间轨迹模型,定义每种期望回归轨迹为一种工作任务;
[0179]
在本实施例中,空间轨迹映射模块用于在辨识阶段根据构建的机械臂逆运动学模型将笛卡尔空间轨迹映射为机械臂关节空间回归轨迹;
[0180]
在本实施例中,控制器构建模块用于通过构建通讯拓扑结构,在关节空间联合轨迹下实现一组同构机械臂神经网络权值在线经验分享,设计自适应神经网络协同学习控制器为:
[0181][0182][0183]
其中,c
i,2
为设计的正常数控制增益矩阵,为理想神经网络权值的估计值,s(ψ
i
)是以向量ψ
i
为输入的高斯径向基函数,a
ij
为机械臂间通讯拓扑的邻接矩阵元素,z
i,p
为误差变量,γ
i
为设计的正定对角矩阵,σ
i
为常数;ρ为协同增益系数;
[0184]
在协同学习控制后闭环系统一致收敛的时间段[t1,t2]内,选取常值神经网络权值形式为:
[0185][0186]
利用经验权值设计常值神经网络控制器:
[0187][0188]
在本实施例中,训练模块用于在辨识阶段利用卷积神经网络的特征提取和泛化能力,训练图像经过卷积池化操作进行特征提取得到特征层,特征层再经过卷积池化操作,将特征泛化得到增强层,特征层与增强层全链接于输出层,构建一类基于卷积神经网络的宽度学习系统作为图像分类器;
[0189]
在本实施例中,映射表设置模块用于在辨识阶段将图像分类器中图像的类别和多个工作任务设置映射表,建立一一对应关系,表示为:
[0190]
f:κ

σ
y
[0191]
其中,κ∈{1,2,...,k}是图像分类的标签,σ
y
是机械臂组可完成的所有工作任务;
[0192]
在本实施例中,图像信息采集模块在识别阶段通过摄像头实时监测环境变化,获得图像标签;
[0193]
在本实施例中,工作任务切换模块用于在识别阶段通过建立好的映射表切换到图像标签对应工作任务;
[0194]
在本实施例中,控制信号输出模块用于输出控制信号,机械臂在识别阶段调用常值神经网络控制器,完成机械臂多任务自主控制。
[0195]
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1