技术总结
本发明公开了一种基于平衡探索与利用的蒙特卡洛树搜索方法,包括:S01:选择阶段:从搜索树的根结点开始,根据节点的uct值向下寻找未扩展完全的节点;S02:扩展阶段:从就绪队列中随机选择一个任务,选择可以执行的处理器,以此作为扩展节点;S03:模拟阶段:从扩展节点开始,随机从就绪队列中选择任务,贪心地选择处理器,直到就绪队列中任务为空为止;S04:回传阶段:根据模拟阶段获得的makespan值,回传更新从根节点到新的扩展节点之间的所有节点;S05:重复上述步骤S01‑S04,直到满足迭代次数限制或时间限制,最终返回一个最小的makespan值。本发明实质性效果为:在实际的树搜索中加速寻找到较优的makespan值,使搜索树加速收敛,有效地降低了时间开销,提升了系统效率。
技术研发人员:程雨夏;吴志伟;刘奎;吴卿
受保护的技术使用者:杭州电子科技大学
技术研发日:2019.05.17
技术公布日:2019.09.20