一种应用于救援环境的多机器人任务搜索方法

文档序号:35283332发布日期:2023-09-01 03:49阅读:来源:国知局

技术特征:

1.一种应用于救援环境的多机器人任务搜索方法,其特征在于,所述机器人硬件组成包括激光雷达,机器人车载机,以及移动机器人本体;所述方法包括如下步骤:

2.根据权利要求1所述的一种应用于救援环境的多机器人任务搜索方法,其特征在于,所述由救援环境和参与搜索的机器人信息,构建面向对象的多机部分可观测马尔科夫决策模型来描述任务搜索问题,具体为:

3.根据权利要求1或2所述的一种应用于救援环境的多机器人任务搜索方法,其特征在于,所述每个机器人对自己当前状态进行判断自己是否受困,具体地,每个机器人根据模拟构建蒙特卡罗树,机器人判断蒙特卡罗树所有的奖励都小于零,则机器人受困,则判断机器人受困,否则判断机器人没有受困。

4.根据权利要求1或2所述的一种应用于救援环境的多机器人任务搜索方法,其特征在于,所述若机器人受困,则首先根据自适应方法确定阈值,然后对信念值在自适应区间的点进行聚类,进而采用a*方法进行引导决策,确定当前执行动作,具体为:

5.根据权利要求4所述的一种应用于救援环境的多机器人任务搜索方法,其特征在于,所述机器人根据原始信念和观测分别更新每个对象的信念,具体为:

6.根据权利要求5所述的一种应用于救援环境的多机器人任务搜索方法,其特征在于,根据最大最小方法同步所有机器人的信念,同步过程具体为:


技术总结
本发明公开了一种应用于救援环境的多机器人任务搜索方法,能够在任务位置未知,传感器噪声的不确定情况下实现多机器人协同,完成高效、完备的任务搜索。该方法包括以下步骤:离散化救援环境并根据救援环境和参与搜索的机器人信息,构建面向对象的多机部分可观测马尔科夫决策模型来描述任务搜索问题。每个机器人对自己当前状态进行判断自己是否受困,如果受困则采用基于自适应阈值的信念聚类和路径规划的引导决策,反之则根据生成树最大奖励进行决策。每个机器人执行当前执行动作,获得环境观测和奖励值,更新每个对象的信念,并根据所有机器人的信念,确定每个对象在每个位置上最可能的状态,指导机器人下一时刻的自主决策。

技术研发人员:彭志红,尚沛桥,陈杰,李利华,何辉
受保护的技术使用者:北京理工大学
技术研发日:
技术公布日:2024/1/14
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1