一种多Agent围捕‑觅食行为控制方法与流程

文档序号:12662275阅读:来源:国知局
技术总结
本发明涉及一种多Agent围捕‑觅食行为控制方法,包括以下步骤:1)对多Agent和猎物当前所处位置形成的状态空间进行划分;2)设计奖赏函数;3)根据步骤1)划分的状态空间及步骤2)的奖赏函数进行强化学习,控制各Agent进行相应的原子动作,实现对猎物的围捕,在满足围捕成功条件时停止,达到觅食效果。与现有技术相比,本发明具有围捕效率高等优点。

技术研发人员:康琦;冯书维;张凯
受保护的技术使用者:同济大学
文档号码:201710107633
技术研发日:2017.02.27
技术公布日:2017.06.13

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1