技术编号:29128161
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。.本发明涉及多智能体强化学习领域,特别是涉及一种多智能体强化学习方法。背景技术.同一环境中的多个人工智能体相互影响,并通过协调它们的行动获得利益。许多任务对于单个智能体来说是非常棘手的,这时就需要一个协作团队。如,搜索和救援、多机器人巡逻、供应链管理等。在许多情况下,利益相关者可以选择与之合作的合作伙伴。.在有限的议价和环境中,夏普利值与核心和竞争均衡或纳什均衡之间存在多种联系。当特定类别的竞争性市场被建模为多人博弈以及交易者的集合均匀扩展时,夏普利值收敛到竞争均衡状态。虽然这些适用于各种...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。