基于深度强化学习的动态云制造服务组合方法和系统

文档序号:36224661发布日期:2023-11-30 12:15阅读:来源:国知局

技术特征:

1.一种基于深度强化学习的动态云制造服务组合方法,其特征在于,包括:

2.如权利要求1所述的动态云制造服务组合方法,其特征在于,所述s2中的马尔科夫决策模型包括:

3.如权利要求2所述的动态云制造服务组合方法,其特征在于,每一个制造子任务存在3种服务选择状态值,表示为{-1,0,fi};

4.如权利要求2所述的动态云制造服务组合方法,其特征在于,所述奖励值的获取过程如下:

5.如权利要求4所述的动态云制造服务组合方法,其特征在于,所述s3包括:

6.一种基于深度强化学习的动态云制造服务组合系统,其特征在于,包括:

7.一种存储介质,其特征在于,其存储有用于基于深度强化学习的动态云制造服务组合的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1~5任一项所述的动态云制造服务组合方法。

8.一种电子设备,其特征在于,包括:


技术总结
本发明提供一种基于深度强化学习的动态云制造服务组合方法、系统、存储介质和电子设备,涉及云制造技术领域。本发明中将多任务动态云制造服务组合问题构建马尔可夫决策模型,选取五个具有代表性的服务质量非功能属性构建奖励函数,为改进后的深度Q网络算法的目标Q值求解提供计算依据。较Q学习算法和传统的深度Q网络算法而言,引入卷积长短期记忆网络利于降低数据复杂性、防止过拟合问题、有效筛选更新关联数据,无需查表即可直接输出每个动作的Q值,便于解决连续大规模云制造服务组合问题。此外,引入经验回放单元便于重复利用过去经验以加快算法训练效率。综上,本发明有助于解决动态环境下的大规模服务组合问题。

技术研发人员:陆效农,宋美玉,彭张林,张强,朱克毓,李刘屹,张志
受保护的技术使用者:合肥工业大学
技术研发日:
技术公布日:2024/1/16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1