基于DQN的不确定车间环境下物料配送实时优化方法

文档序号:25894151发布日期:2021-07-16 20:04阅读:来源:国知局
技术总结
本发明公开了一种基于DQN的不确定车间环境下物料配送实时优化方法,包括以下步骤:对不确定车间环境进行建模,建立物料需求动态时间窗方程及路径实时路阻系数方程;将不确定车间环境下物料配送实时决策优化问题转化为半马尔科夫决策问题,设计状态空间、全局动作空间、局部动作空间和奖励函数等关键模型要素;使用全连接神经网络来设计DQN的两个Q网络;DQN不断与环境交互进行试错学习直到Q值网络训练稳定;将实时感知到的车间关键状态数据和环境模型计算得到的扰动数据传输到训练稳定的DQN中;DQN计算出当前状态下的最佳的安全动作,然后传输给AGV,指导AGV在不确定车间环境下实时响应扰动并做出合适的动作选择,以较小的成本快速完成物料配送任务。的成本快速完成物料配送任务。的成本快速完成物料配送任务。


技术研发人员:袁逸萍 任年鲁 巴智勇 熊攀
受保护的技术使用者:新疆大学
技术研发日:2021.04.23
技术公布日:2021/7/15

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1