本技术涉及移动边缘计算,尤其涉及一种任务卸载决策方法、装置、设备、存储介质及计算机程序产品。
背景技术:
1、随着移动设备和物联网技术的快速发展,移动边缘计算(mobile edgecomputing,mec)已成为提高移动服务处理效率和可靠性的关键技术。
2、移动边缘计算通过将计算任务从本地终端卸载到网络边缘的边缘服务器上,通过在边缘服务器上计算和存储资源为本地终端提供类似云端计算功能和环境的服务,具备超低时延、超高带宽、超强计算和超安全等特点。然而,如何合理地进行计算任务的卸载,特别是在面临时延和能耗挑战时,需要一个高效的决策方式来权衡这些因素,而传统的任务卸载决策无法灵活的在时延和能耗之间进行权衡,容易出现本地终端算力不足和云服务器端时延较大等情况,造成系统应用服务质量较差的问题。
3、综上,如何在制定任务卸载决策时对时延和能耗进行权衡,以提高系统应用服务质量,俨然已成为本领域亟需解决的技术问题。
技术实现思路
1、本技术的主要目的在于提供一种任务卸载决策方法、装置、设备、存储介质及产品,旨在在制定任务卸载决策时对时延和能耗进行权衡,以提高系统应用服务质量。
2、为实现上述目的,本技术提供一种任务卸载决策方法,所述任务卸载决策方法包括:
3、基于工业系统中各终端任务的状态信息,构建以最小化任务时延和任务能耗为优化目标的系统开销模型;
4、基于所述系统开销模型构建包含基于注意力机制的长短期记忆网络的卸载决策模型;
5、将实时获得的各所述终端任务的当前状态信息输入到所述卸载决策模型中,得到任务卸载决策动作。
6、可选地,所述基于所述系统开销模型构建包含基于注意力机制的长短期记忆网络的卸载决策模型的步骤,包括:
7、基于所述系统开销模型建立马尔科夫决策过程;
8、基于所述马尔科夫决策过程的交互对象和模型要素构建包含基于注意力机制的长短期记忆网络的初始卸载决策模型,其中,所述交互对象为所述工业系统中的工业终端和工业边缘网络环境;
9、对所述初始卸载决策模型进行迭代训练,得到训练好的卸载决策模型。
10、可选地,所述初始卸载决策模型包括所述工业边缘网络环境、经验回放池和包含所述基于注意力机制的长短期记忆网络的深度q网络,其中,所述深度q网络包括q网络和目标q网络;
11、所述对所述初始卸载决策模型进行迭代训练,得到训练好的卸载决策模型的步骤,包括:
12、从所述经验回放池中依次抽取多组经验样本;
13、将多组所述经验样本依次输入至所述目标q网络中,得到多个目标值;
14、基于多个所述目标值建立损失函数,并基于所述损失函数对所述目标q网络的模型参数进行更新;
15、将更新后的所述模型参数同步至所述q网络,以基于更新后的所述模型参数对所述初始卸载决策模型进行迭代训练,得到训练好的卸载决策模型。
16、可选地,在所述从所述经验回放池中依次抽取多组经验样本的步骤之前,所述方法还包括:
17、初始化所述q网络、所述目标q网络和所述经验回放池;
18、确定第一时刻的第一环境状态,并将所述第一环境状态输入至所述q网络中,得到所述第一环境状态对应的动作;
19、基于所述第一环境状态和所述动作,得到第二时刻的第二环境状态和所述第一时刻的奖励值;
20、将所述第一环境状态、所述动作、所述奖励值和所述第二环境状态作为一组经验数据存入所述经验回放池;
21、将所述第二环境状态作为所述第一环境状态,并循环执行所述确定第一时刻的第一环境状态,并将所述第一环境状态输入至所述q网络中,得到所述第一环境状态对应的动作的步骤以及后续步骤,直至所述经验回放池中的经验数据达到预设的数据数量。
22、可选地,在所述基于工业系统中各终端任务的状态信息,构建以最小化任务时延和任务能耗为优化目标的系统开销模型的步骤之前,所述方法还包括:
23、根据工业系统的结构特性构建移动边缘计算模型架构,其中,所述移动边缘计算模型架构包括云层、边缘层和工业设备层,所述工业设备层包括生成各终端任务的工业终端;
24、从所述移动边缘计算模型架构中获取各所述终端任务的状态信息,其中,所述状态信息包括任务分割形式、任务量和计算参数。
25、可选地,所述基于工业系统中各终端任务的状态信息,构建以最小化任务时延和任务能耗为优化目标的系统开销模型的步骤,包括:
26、基于工业系统中各终端任务的状态信息确定各所述终端任务的任务类型,其中,所述任务类型包括本地计算任务、部分卸载任务和全部卸载任务;
27、确定各所述终端任务各自的时延权重参数因子和能耗权重参数因子;
28、以所述时延权重参数因子与所述能耗权重参数因子之和为一、所述任务类型为所述本地计算任务、所述部分卸载任务和所述全部卸载任务中的一个、卸载比例在预设范围内作为约束条件,构建以最小化任务时延和任务能耗为优化目标的系统开销模型。
29、此外,为实现上述目的,本技术还提供一种任务卸载决策装置,所述任务卸载决策装置包括:
30、系统开销模型构建模块,用于基于工业系统中各终端任务的状态信息,构建以最小化任务时延和任务能耗为优化目标的系统开销模型;
31、卸载决策模型构建模块,用于基于所述系统开销模型构建包含基于注意力机制的长短期记忆网络的卸载决策模型;
32、卸载决策模块,用于将实时获得的各所述终端任务的当前状态信息输入到所述卸载决策模型中,得到任务卸载决策动作。
33、此外,为实现上述目的,本技术还提供一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的任务卸载决策程序,所述任务卸载决策程序被所述处理器执行时实现如上所述的任务卸载决策方法的步骤。
34、此外,为实现上述目的,本技术还提出一种存储介质,所述存储介质为计算机可读存储介质,所述存储介质上存储有任务卸载决策程序,所述任务卸载决策程序被处理器执行时实现如上所述的任务卸载决策方法的步骤。
35、此外,为实现上述目的,本技术还提供一种计算机程序产品,所述计算机程序产品包括任务卸载决策程序,所述任务卸载决策程序被处理器执行时实现如上文所述的任务卸载决策方法的步骤。
36、本技术实施例提出的一种任务卸载决策方法、装置、设备、存储介质及计算机程序产品,该任务卸载决策方法包括:基于工业系统中各终端任务的状态信息,构建以最小化任务时延和任务能耗为优化目标的系统开销模型;基于所述系统开销模型构建包含基于注意力机制的长短期记忆网络的卸载决策模型;将实时获得的各所述终端任务的当前状态信息输入到所述卸载决策模型中,得到任务卸载决策动作。
37、相比于传统的任务卸载决策方法,本技术通过根据工业系统中各个终端任务的状态信息构建以最小化任务时延和任务能耗为优化目标的系统开销模型,然后,基于系统开销模型构建包含attention lstm网络(基于注意力机制的长短期记忆网络)的卸载决策模型,通过将实时获得的当前各终端任务的当前状态信息输入到该卸载决策模型中,输出得到最优卸载决策结果,按照输出结果执行任务卸载决策动作,实现了工业系统中各终端任务在移动边缘计算层的快速处理和响应回传,保证工业系统的低能耗和低时延,从而保证了工业系统的整体性能,提高了系统应用服务质量。