专利名称:基于韵律模式的机器人未知环境下行走学习信息处理方法
技术领域:
本发明涉及一种机器人行走学习信息处理方法,尤其是涉及一种基于韵律模式的机器人未知环境下行走学习信息处理方法。
背景技术:
有足机器人由于其运动机构的高自由度和灵活性,因而相比于轮式机器人对地形环境具有更好的适应性,在优良的运动控制下,有足机器人将会比轮式机器人适用于更加广泛的领域。然而,另一方面正是由于有足机器人的运动机构的高自由度和高耦合性,快速、稳定的有足机器人行走控制成为一件非常困难的问题,尤其是不确定性的行走表面上的行走控制更是如此。而且有足机器人的行走性能对行走表面的特性十分敏感,且通常在特定环境下表现不错的行走控制,其性能在新的行走表面上也会发生显著的下降,甚至会使机器人无法行走或发生翻倒。针对如何使有足机器人在不同行走环境下的行走控制和行走适应问题,国际上已有许多学者做出过大量的研究工作。有人解决方向放在对有足机器人腿部的机械设计上, 以使机器人可以适应任何行走表面,但这些研究并没把机器人的行走速度的提升着重考虑。事实上,许多情况下不仅是要求机器人可以行走,而是能尽可能快的行走,如机器人足球赛,运动物体的跟踪等任务。有些学者采用如进化算法、策略梯度下降等学习算法和一些新颖的学习策略实现让有足机器人自我调整以适应新的行走表面,并取得了不错的效果。 然而在他们的方法中主要是通过机器视觉的方法对候选控制参数的性能进行评估的,而目前机器视觉的技术主要是通过环境数据采样、特征提取,然后进行模式匹配的方法进行视觉物体识别的,这就要求需对环境有一定的预先的了解,或至少是视觉上的环境是已知的, 这就在一定程度上限制了以上有足机器人行走学习的方法在不确定环境下的应用,特别是视觉环境未知或无法用目前已有机器视觉技术获取所需信息的情况。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种提高有足机器人对环境的适应能力的基于韵律模式的机器人未知环境下行走学习信息处理方法。本发明的目的可以通过以下技术方案来实现一种基于韵律模式的机器人未知环境下行走学习信息处理方法,其特征在于,包括以下步骤1)将机器人放置在一个先验知识已知的环境中,将先验知识信息作为行走学习的评估函数,控制机器人学习一组稳定快速的行走参数,同时机器人利用位于身体内的加速度传感器采集该行走参数控制下机器人行走状态信息,处理器根据该行走状态信息计算行走韵律模式(WRP)特征向量并记录下来,作为基准模型M。m;2)当机器人处于先验知识未知的环境时,机器人通过先前设定行走参数行走一定的步数,计算当前的WRP特征向量,如果该WRP与Mom匹配度低于设定值,则将当前行走参数作为第一代个体输入到遗传算法学习模块开始行走再学习;3)遗传算法学习模块根据行走参数对应的WRP特征向量与M。m之间的匹配程度来排序,淘汰劣势个体,并通过变异和交叉来产生新个体,进行循环,直到种群中个体的平均适应度在一定迭代后没有明显的改进时,执行步骤4);4)将最优种群中的最优个体作为最终的行走参数,并将该行走参数发送给机器人运动模块。所述的WRP特征向量计算过称如下1)对输入的加速度传感器数据窗口化为相互重叠的数据块,窗口的宽度为 _3] Wd = fwdPgTffl (1)每次窗口移动宽度为Wsd = fwsdPgTffl (2)其中,Tm为动作模块中每单位处理帧所用的时间;Pg为行走控制中机器人每半步所用的动作帧数(LF) ;fwd = 2为窗口宽度因子,控制窗口的宽度;fwsd= 1为窗口移动因子, 由于传感器采样周期Ts和动作帧Tm为常数,因而可得到每窗中的三个方向传感器采样点数量为
f PTNi = wd g “‘ , k e {AccelX, AccelY, AccelZ} (3)其中上标k表示不同方向的传感器数据;使用Harming窗将每帧的输入数据窗口化为Skw (n) = St (η) χ Wliann (n),0< <iV*-l(4)其中,紀(《)为原始传感器输入数据,Wllann(η)为Harming窗口函数,Wflann ( ) = 0.5 - 0.5οο3(2π(η^°·5))(5)2)对窗口化的数据计算功率谱,先对每帧数据做长度为Nfft快速傅里叶变换 (FFT),FFT输入数据为
权利要求
1.一种基于韵律模式的机器人未知环境下行走学习信息处理方法,其特征在于,包括以下步骤1)将机器人放置在一个先验知识已知的环境中,将先验知识信息作为行走学习的评估函数,控制机器人学习一组稳定快速的行走参数,同时机器人利用位于身体内的加速度传感器采集该行走参数控制下机器人行走状态信息,处理器根据该行走状态信息计算WRP特征向量并记录下来,作为基准模型M。m ;2)当机器人处于先验知识未知的环境时,机器人通过先前设定行走参数行走一定的步数,计算当前的WRP特征向量,如果该WRP与Mom匹配度低于设定值,则将当前行走参数作为第一代个体输入到遗传算法学习模块开始行走再学习;3)遗传算法学习模块根据行走参数对应的WRP特征向量与M。m之间的匹配程度来排序, 淘汰劣势个体,并通过变异和交叉来产生新个体,进行循环,直到种群中个体的平均适应度在一定迭代后没有明显的改进时,执行步骤4);4)将最优种群中的最优个体作为最终的行走参数,并将该行走参数发送给机器人运动模块。
2.根据权利要求1所述的一种基于韵律模式的机器人未知环境下行走学习信息处理方法,其特征在于,所述的WRP特征向量计算过称如下1)对输入的加速度传感器数据窗口化为相互重叠的数据块,窗口的宽度为Wd — f WdPgTm (1)每次窗口移动宽度为Wsd — fwsdPgTm ⑵其中,Tm为动作模块中每单位处理帧所用的时间;Pg为行走控制中机器人每半步所用的动作帧数(LF) ;fwd = 2为窗口宽度因子,控制窗口的宽度;fwsd= 1为窗口移动因子,由于传感器采样周期Ts和动作帧Tm为常数,因而可得到每窗中的三个方向传感器采样点数量为f PTK - W" g ‘“ , k e {AccelX,AccelY,AccelZ} (3)J S其中上标k表示不同方向的传感器数据;使用Harming窗将每帧的输入数据窗口化为
3.根据权利要求1所述的一种基于韵律模式的机器人未知环境下行走学习信息处理方法,其特征在于,所述的步骤3)中的WRP特征向量与M。m之间的匹配程度计算如下 Y = 100/Nspec*exp (-(vc- μ om)T Σ。;1 (vc- μ。m))其中ν。为当前行走参数的WRP特征向量,μ。m = Mean(Vftat)为基准模型M。m的WRP特征向量平均值,σ。m = Var(Vfeat)为各WRP特征向量的方差,Σ。m = diag{o J。
全文摘要
本发明涉及一种基于韵律模式的机器人未知环境下行走学习信息处理方法,包括以下步骤1)在环境知识已知的情况下,获取基准模型Mom;2)当机器人处于先验知识未知的环境时,机器人通过先前设定行走参数行走一定的步数,计算当前的行走韵律模式(WRP)特征向量,如果该WRP与Mom匹配度低于设定值,则将当前行走参数作为第一代个体输入到遗传算法学习模块开始行走再学习;3)遗传算法学习模块进行排序,淘汰劣势个体,并通过变异和交叉来产生新个体,进行循环,直到种群中个体的平均适应度在一定迭代后没有明显的改进时,执行步骤4);4)将最优种群中的最优个体作为最终的行走参数。与现有技术相比,本发明具有提高有足机器人对环境的适应能力等优点。
文档编号G05B13/02GK102375412SQ20101025277
公开日2012年3月14日 申请日期2010年8月13日 优先权日2010年8月13日
发明者许涛, 陈启军 申请人:同济大学