1.一种基于模型的机器人操作技能参数学习方法,其特征在于,包括单一技能的策略学习模块、任务技能的参数学习模块;
2.根据权利要求1所述的基于模型的机器人操作技能参数学习方法,其特征在于,所述的单一技能的策略学习模块,利用表征学习对环境中各物体进行空间关系的表征,训练得到面向物体的表征模型,并借助表征模型中的编码器来编码环境观测,使用强化学习方法训练智能体,使其能以用户给定的单一语义技能目标为条件生成对应任务的动作参数,得到多个策略模型;
3.根据权利要求2所述的基于模型的机器人操作技能参数学习方法,其特征在于,
4.根据权利要求3所述的基于模型的机器人操作技能参数学习方法,其特征在于,所述的面向物体的表征模型训练方法包括如下步骤:
5.根据权利要求4所述的基于模型的机器人操作技能参数学习方法,其特征在于,所述的以语义目标为条件的策略模型包括如下步骤:
6.根据权利要求3所述的基于模型的机器人操作技能参数学习方法,其特征在于,所述的隐式状态转移方程学习模块包括如下步骤:
7.根据权利要求4或5或6所述的基于模型的机器人操作技能参数学习方法,其特征在于,所述的技能参数在线规划模块包括如下步骤: