结合联邦学习和强化学习的事物资源信息分配方法及系统

文档序号：24711727发布日期：2021-04-16 13:49阅读：来源：国知局

技术总结
本发明属于深度学习技术领域，公开了一种结合联邦学习和强化学习的事物资源信息分配方法及系统，需要待分配事物的需求个体有多个，他们需要待分配事物来满足自己的利益或要求，个体带有一定计算能力以及通信能力的设备；该事物的管理和分配由管理者进行统一分配，且该事物并不能在数量上同时满足所有个体；管理者设计深度强化学习模型，并分发给每一个个体，个体使用该模型对事物进行选择；管理者通过联邦学习产生新的全局模型。本发明在事物拥有大量的个体来训练。即使每一个个体都进行了非常小量的训练，其最后产生的模型仍然适用于绝大部分的个体。可以将训练安排给空闲的设备，当个体的设备空闲时再让设备执行对强化学习的训练。化学习的训练。化学习的训练。

技术研发人员：董学文游志超张文李麒麟沈玉龙底子杰强洁丹郭校杰
受保护的技术使用者：西安电子科技大学
技术研发日：2020.12.25
技术公布日：2021/4/17

完整全部详细技术资料下载

当前第3页1 2 3