一种基于高斯过程在线学习的机器人控制方法

文档序号:29324438发布日期:2022-03-19 23:11阅读:来源:国知局

技术特征:
1.一种基于高斯过程在线学习的机器人控制方法,其特征在于,包括:通过低增益的比例-微分控制,获取初始数据,根据所述初始数据构建初始高斯过程在线学习模型,所述初始高斯过程在线学习模型用于对机器人进行初步控制;在每个控制周期内轮转更新高斯过程在线学习模型;将期望的位置、速度和加速作为输入,根据最新的高斯过程在线学习模型预测得到多个力矩,将所述力矩作为机器人控制的前馈输入,以对所述机器人进行控制。2.根据权利要求1所述的一种基于高斯过程在线学习的机器人控制方法,其特征在于,所述通过低增益的比例-微分控制,获取初始数据,根据所述初始数据构建初始高斯过程在线学习模型,包括:配置初始化超参数;其中,所述初始化超参数包括比例和微分增益、基向量集大小、核函数、模型噪声、方差阈值以及遗忘速度参数;根据所述初始化超参数进行低增益的比例-微分控制;根据所述比例-微分控制获取初始数据;根据所述初始数据构建初始高斯过程在线学习模型,将所述高斯过程在线学习模型输出的预测力矩为前馈项。3.根据权利要求1所述的一种基于高斯过程在线学习的机器人控制方法,其特征在于,所述在每个控制周期内轮转更新高斯过程在线学习模型,包括:将再生希尔伯特空间范数作为衡量数据点的标准,以衡量新数据点距离原空间的距离;当新的数据点计算得到的距离大于预设阈值,将该数据点加入基向量集并且更新对应的辅助变量;当所述基向量集大于预设大小,将所述基向量集中的无用点删除。4.根据权利要求3所述的一种基于高斯过程在线学习的机器人控制方法,其特征在于,所述当新的数据点计算得到的距离大于预设阈值,将该数据点加入基向量集并且更新对应的辅助变量这一步骤中,当数据点无法进入基向量集时,根据所述数据点对所述基向量集进行调整,使得所述数据点能够进入调整后的基向量集,并且不增加所述基向量集的大小。5.根据权利要求3所述的一种基于高斯过程在线学习的机器人控制方法,其特征在于,所述当所述基向量集大于预设大小,将所述基向量集中的无用点删除,包括:配置计数器和遗忘条件,当所述基向量集中新加入数据点时,所述计数器加1;当所述计数器的数值达到预设数值时,将最旧的数据点删除,并将所述计数器置零。6.根据权利要求5所述的一种基于高斯过程在线学习的机器人控制方法,其特征在于,所述当所述基向量集大于预设大小,将所述基向量集中的无用点删除,还包括:当所述计数器的数值没有达到预设数值时,将当前基向量集中距离最近的点作为无用点删除。7.根据权利要求1所述的一种基于高斯过程在线学习的机器人控制方法,其特征在于,所述将期望的位置、速度和加速作为输入,根据最新的高斯过程在线学习模型预测得到多个力矩,将所述力矩作为机器人控制的前馈输入;对于新的数据点,计算所述数据点的预测均值和预测方差;
将所述预测均值作为控制力矩的前馈项;将所述前馈项结合对应的反馈项得到控制命令;将所述控制命令输入所述机器人,对所述机器人进行控制。8.一种基于高斯过程在线学习的机器人控制装置,其特征在于,包括:第一模块,用于通过低增益的比例-微分控制,获取初始数据,根据所述初始数据构建初始高斯过程在线学习模型,所述初始高斯过程在线学习模型用于对机器人进行初步控制;第二模块,用于在每个控制周期内轮转更新高斯过程在线学习模型;第三模块,用于将期望的位置、速度和加速作为输入,根据最新的高斯过程在线学习模型预测得到多个力矩,将所述力矩作为机器人控制的前馈输入,以对所述机器人进行控制。9.一种电子设备,其特征在于,包括处理器以及存储器;所述存储器用于存储程序;所述处理器执行所述程序实现如权利要求1至7中任一项所述的方法。10.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1至7中任一项所述的方法。

技术总结
本发明公开了一种基于高斯过程在线学习的机器人控制方法,包括通过低增益的比例-微分控制,获取初始数据,根据所述初始数据构建初始高斯过程在线学习模型,所述初始高斯过程在线学习模型用于对机器人进行初步控制;在每个控制周期内轮转更新高斯过程在线学习模型;将期望的位置、速度和加速作为输入,根据最新的高斯过程在线学习模型预测得到多个力矩,将所述力矩作为机器人控制的前馈输入,以对所述机器人进行控制。本发明能够提高跟踪精度并且能够降低模型更新频率,可广泛应用于机器人控制技术领域。制技术领域。制技术领域。


技术研发人员:潘永平 李威
受保护的技术使用者:中山大学
技术研发日:2022.01.25
技术公布日:2022/3/18
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1