一种基于分层强化学习的可迁移三维重建方法及系统

文档序号：34108976发布日期：2023-05-10 21:28阅读：来源：国知局

技术特征：

1.一种基于分层强化学习的可迁移三维重建方法，其特征在于，包括：

2.如权利要求1所述的基于分层强化学习的可迁移三维重建方法，其特征在于，步骤s1包括：

3.如权利要求1所述的基于分层强化学习的可迁移三维重建方法，其特征在于，步骤s2中待编辑三维形状为：

4.如权利要求1所述的基于分层强化学习的可迁移三维重建方法，其特征在于，步骤s3包括：

5.如权利要求1所述的基于分层强化学习的可迁移三维重建方法，其特征在于，步骤s4包括：

6.如权利要求1所述的基于分层强化学习的可迁移三维重建方法，其特征在于，步骤s5中的终止状态为执行了预设步后的状态。

7.一种基于分层强化学习的可迁移三维重建系统，其特征在于，包括：

8.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被执行时实现如权利要求1至6中任一项权利要求所述的方法。

9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6中任一项权利要求所述的方法。

技术总结
本发明公开了一种基于分层强化学习的可迁移三维重建方法及系统，属于三维重建领域。通过简化动作空间从而增加重建的准确度，同时使得训练出来的代理在不同类别间更具有可迁移性。分层强化学习将对同一个Loop操作的动作进行聚合，从而将任务分解给不同的代理进行处理。顶层代理能够在全局上对整体形状进行把握，选择出最需要进行调整的Loop，并将其交给对应的子代理去处理。使用基于状态空间增强的子代理(ASS‑Sub‑Agent)替代传统方法中的一组子代理，ASS‑Sub‑Agent能够共享原子代理的训练过程并且拥有更少的训练参数，能够加速子代理的训练过程，更多样的状态空间又促进了ASS‑Sub‑Agent的迁移性。

技术研发人员：何发智,李兰,罗锦坤
受保护的技术使用者：武汉大学
技术研发日：
技术公布日：2024/1/12

完整全部详细技术资料下载

当前第2页1 2