一种基于改进Q学习的AGV路径规划方法

文档序号:38594763发布日期:2024-07-10 15:41阅读:来源:国知局

技术特征:

1.一种基于改进q学习的agv路径规划方法,其特征在于,过程包括:

2.根据权利要求1所述的一种基于改进q学习的agv路径规划方法,其特征在于,利用改进的人工势场法与莱维飞行分布法对q表进行初始化的步骤如下:

3.根据权利要求2所述的一种基于改进q学习的agv路径规划方法,其特征在于,step3.7对全部的解进行更新通过公式(5)进行:

4.根据权利要求2所述的一种基于改进q学习的agv路径规划方法,其特征在于,当q表利用随机探索来进行二次初始化的时候,遵循莱维飞行分布的搜索算法按照公式(6)进行更新:

5.根据权利要求1所述的一种基于改进q学习的agv路径规划方法,其特征在于,q学习过程中需要采用增加蚁群信息素与修改ε-greedy策略两种方式加速q学习在运行阶段的收敛速度;


技术总结
一种基于改进Q学习的AGV路径规划方法,属于强化学习与路径规划领域。主要包含下列两个过程:过程1:基于人工势场法对Q表进行初始化,并利用莱维飞行分布与死区逃脱机制,使Q表的初始值在具有一定的引导倾向的同时最大限度避免将AGV间接引入死角。过程2:在Q学习对地图进行探索的同时引入蚁群算法,利用蚁群信息素的经验导向的特点在后期对Q学习的收敛速度进行加快,弥补Q学习收敛性不足的缺点。并改进ε‑greedy策略,使其前期扩大搜索范围,后期向最优方向快速迭代,避免陷入局部最优解。所提出的Imp‑Q算法,在具有较高成功率的前提下,有着更快的迭代速度以及更好的效果,AGV可以快速绕开障碍物,不容易陷入死区。

技术研发人员:费中阳,屈轩宇,吴迪,孙希明,徐昌一,高永峰
受保护的技术使用者:大连理工大学
技术研发日:
技术公布日:2024/7/9
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1