一种基于分层强化学习的可迁移三维重建方法及系统

文档序号:34108976发布日期:2023-05-10 21:28阅读:来源:国知局

技术特征:

1.一种基于分层强化学习的可迁移三维重建方法,其特征在于,包括:

2.如权利要求1所述的基于分层强化学习的可迁移三维重建方法,其特征在于,步骤s1包括:

3.如权利要求1所述的基于分层强化学习的可迁移三维重建方法,其特征在于,步骤s2中待编辑三维形状为:

4.如权利要求1所述的基于分层强化学习的可迁移三维重建方法,其特征在于,步骤s3包括:

5.如权利要求1所述的基于分层强化学习的可迁移三维重建方法,其特征在于,步骤s4包括:

6.如权利要求1所述的基于分层强化学习的可迁移三维重建方法,其特征在于,步骤s5中的终止状态为执行了预设步后的状态。

7.一种基于分层强化学习的可迁移三维重建系统,其特征在于,包括:

8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被执行时实现如权利要求1至6中任一项权利要求所述的方法。

9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6中任一项权利要求所述的方法。


技术总结
本发明公开了一种基于分层强化学习的可迁移三维重建方法及系统,属于三维重建领域。通过简化动作空间从而增加重建的准确度,同时使得训练出来的代理在不同类别间更具有可迁移性。分层强化学习将对同一个Loop操作的动作进行聚合,从而将任务分解给不同的代理进行处理。顶层代理能够在全局上对整体形状进行把握,选择出最需要进行调整的Loop,并将其交给对应的子代理去处理。使用基于状态空间增强的子代理(ASS‑Sub‑Agent)替代传统方法中的一组子代理,ASS‑Sub‑Agent能够共享原子代理的训练过程并且拥有更少的训练参数,能够加速子代理的训练过程,更多样的状态空间又促进了ASS‑Sub‑Agent的迁移性。

技术研发人员:何发智,李兰,罗锦坤
受保护的技术使用者:武汉大学
技术研发日:
技术公布日:2024/1/12
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1