一种多Agent围捕‑觅食行为控制方法与流程

文档序号：12662275阅读：来源：国知局

技术总结
本发明涉及一种多Agent围捕‑觅食行为控制方法，包括以下步骤：1)对多Agent和猎物当前所处位置形成的状态空间进行划分；2)设计奖赏函数；3)根据步骤1)划分的状态空间及步骤2)的奖赏函数进行强化学习，控制各Agent进行相应的原子动作，实现对猎物的围捕，在满足围捕成功条件时停止，达到觅食效果。与现有技术相比，本发明具有围捕效率高等优点。

技术研发人员：康琦;冯书维;张凯
受保护的技术使用者：同济大学
文档号码：201710107633
技术研发日：2017.02.27
技术公布日：2017.06.13