本发明属于边缘计算网络,具体涉及一种无线供能边缘计算网络中的时间资源分配方法。
背景技术:
1、近年来,随着无线通信和硬件计算技术的发展,越来越多的无线物联网(iot)设备被部署在日常生活和工业场景中,为人们带来便利,提高生产效率。然而,有限的计算能力和能量可能导致物联网设备的寿命短和不可接受的延迟。为了应对物联网设备中大量数据的处理,并满足设备在能量有限的情况下的低延迟要求,射频能量采集与移动边缘计算(mec)的结合应运而生。
2、mec是目前解决物联网设备的计算能力的有前途的解决方案。设备产生的数据将被发送到无线接入网络边缘的附近的、具有更强计算能力的服务器上。一方面,与本地处理数据相比,部署在蜂窝基站和wifi接入点(ap)上的边缘服务器具有更高的计算速率。另一方面,与传统云计算模型相比,边缘服务器消除了长回传时延并降低了设备能耗。如何在时分复用的条件下分配设备的数据传输时间从而高效处理设备产生的数据,成为当今边缘计算领域的研究方向之一。
3、目前对于时间片资源的分配,大部分分配方案采用传统的优化方法进行求解,其计算所花费的时间较长,例如文献[1]c.you,k.huang,h.chae,and b.-h.kim,“energyefficient resource allocation for mobile-edge computation offloading,”ieee transactions on wireless communications,vol.16,no.3,pp.1397–1411,2017.考虑了在移动边缘计算卸载(meco)场景下将密集的移动计算卸载到位于蜂窝网络边缘的云上以最小化网络的加权能耗之和,然而在进行时分复用(tdma)技术进行资源分配时采用了多次二分迭代进行求解这大大增加了求解最佳资源分配的时间。又如在文献[2]j.wang,l.zhao,j.liu,and n.kato,“smart resource allocation for mobile edge computing:a deep reinforcement learning approach,”ieee transactions on emerging topicsin computing,vol.9,no.3,pp.1529–1541,2021.中,采用了dqn的方式对网络中的计算资源进行了分配。然而dqn方法需要对所有的情况进行遍历,之后选择使得q值最大的动作进行执行,因此在面对节点多的网络场景时,其所需要遍历的复杂度将大幅度增加,这对于一些对于具有较大规模的时延敏感的设备是不合适的。
技术实现思路
1、本发明的目的在于提供一种无线供能边缘计算网络中的时间资源分配方法,通过对于时间片资源的分配,达到较高的计算速率。
2、为实现上述目的,本发明所采取的技术方案为:
3、一种无线供能边缘计算网络中的时间资源分配方法,所述无线供能边缘计算网络包括一个可接入点以及多个无线设备,所述无线供能边缘计算网络中的时间资源分配方法,包括:
4、获取当前时间片下所有无线设备的信道增益;
5、根据所有无线设备的信道增益,基于神经网络输出各无线设备的数据传输时长系数;
6、根据各无线设备的数据传输时长系数得到当前时间片下的能量捕获时长系数,所述能量捕获时长系数与数据传输时长系数用于供各无线设备完成在当前时间片下的能量捕获以及数据卸载;
7、基于所述能量捕获时长系数与数据传输时长系数,计算所有无线设备的第一计算速率总和;
8、利用迭代算法得到当前时间片下的参考能量捕获时长系数与参考数据传输时长系数,并根据所述参考能量捕获时长系数与参考数据传输时长系数,计算所有无线设备的第二计算速率总和;
9、以所述第一计算速率总和与第二计算速率总和得到归一化计算速率,并根据归一化计算速率更新所述神经网络的参数,完成当前时间片下的时间资源分配。
10、以下还提供了若干可选方式,但并不作为对上述总体方案的额外限定,仅仅是进一步的增补或优选,在没有技术或逻辑矛盾的前提下,各可选方式可单独针对上述总体方案进行组合,还可以是多个可选方式之间进行组合。
11、作为优选,所述根据所有无线设备的信道增益,基于神经网络输出各无线设备的数据传输时长系数,包括:
12、令无线设备的个数为n个,则获取的信道增益集合为g=[g1,g2,…,gn],其中gi为第i个无线设备的信道增益,1≤i≤n;
13、将信道增益集合g输入神经网络,得到神经网络输出的数据传输时长系数集合τ=[τ1,τ2,…,τn],其中τi为第i个无线设备的数据传输时长系数,0≤τi≤1且
14、作为优选,根据各无线设备的数据传输时长系数得到当前时间片下的能量捕获时长系数,包括:
15、令所述能量捕获时长系数关于所述数据传输时长系数的表达式为:
16、
17、式中,f(a)为能量捕获时长系数关于所述数据传输时长系数的表达式,a为能量捕获时长系数,b为无线供能边缘计算网络的总带宽,v为卸载数据时产生的额外数据开销系数,μ为能量捕获效率,p为可接入点的射频能量发射功率,n0为信道中的高斯白噪声;
18、利用二分法在0~1之间采用迭代求解的方法,计算出a使得f(a)满足对于a的一阶导数等于0,计算得到能量捕获时长系数a且0≤a≤1。
19、作为优选,所述利用二分法在0~1之间采用迭代求解的方法,计算出a使得f(a)满足对于a的一阶导数等于0,包括:
20、1)随机初始化0≤a≤1,amin=0,amax=1,且f(a)关于a的一阶导数为f′(a);
21、2)将a代入一阶导数f′(a),比较f′(a)与0的大小关系;
22、3)若f′(a)<0,则令amin=a,且a=(amin+amax)/2,并重新执行步骤2);若f′(a)>0,则令amax=a,且a=(amin+amax)/2,并重新执行步骤2);否则,输出a的值,并结束循环。
23、作为优选,所述无线设备,执行在当前时间片下的能量捕获以及数据卸载,包括:
24、在时间片开始时,n个无线设备同时进行能量捕获,且能量捕获时长均为能量捕获时长系数与时间片时长的乘积;
25、在能量捕获结束后,n个无线设备依次进行数据卸载,且每个无线设备的数据卸载时长为,该无线设备的数据传输时长系数与时间片时长去除所述能量捕获时长后的乘积。
26、作为优选,基于所述能量捕获时长系数与数据传输时长系数,计算所有无线设备的第一计算速率总和,包括:
27、首先,计算第i个无线设备的计算速率:
28、
29、
30、
31、式中,ri为第i个无线设备的计算速率,bi为第i个无线设备在数据卸载时发送给可接入点的原始数据量,t为时间片时长,b为无线供能边缘计算网络的总带宽,a为能量捕获时长系数,v为卸载数据时产生的额外数据开销系数,pi为第i个无线设备的发射功率,n0为信道中的高斯白噪声,ei为第i个无线设备在当前时间片下捕获到的能量;
32、然后,得到第一计算速率总和如下:
33、
34、式中,rnn为第一计算速率总和。
35、作为优选,所述利用迭代算法得到当前时间片下的参考能量捕获时长系数与参考数据传输时长系数,包括:
36、1)随机初始化参考能量捕获时长系数a′,中间系数a*,并设置参考能量捕获时长系数a′的迭代精度δa′=1;
37、2)当δa′不满足δa′<0.001时,执行步骤3);否则执行步骤7);
38、3)令式中,f′(τ′)为函数f(τ′)关于τ′的一阶导数,n为无线设备的个数,b为无线供能边缘计算网络的总带宽,v为卸载数据时产生的额外数据开销系数,μ为能量捕获效率,p为可接入点的射频能量发射功率,gi为第i个无线设备的信道增益,n0为信道中的高斯白噪声,τi′为第i个无线设备的参考数据传输时长系数,0≤τi′≤1且
39、4)根据给定的a′计算τi′使得f′(τ′)=0;
40、5)根据计算出的τi′,在给定τi′的情况下计算a*使得f(a*)关于a*的一阶导数f′(a*)=0,其中
41、6)更新δa′=|a*-a′|,并返回步骤2);
42、7)输出参考能量捕获时长系数a′=a*,并结束。
43、作为优选,所述以所述第一计算速率总和与第二计算速率总和得到归一化计算速率,包括:
44、
45、式中,r为归一化计算速率,rnn为第一计算速率总和,ropt为第二计算速率总和。
46、作为优选,所述神经网络的参数更新方式如下:
47、
48、式中,θt+1为t+1时刻的神经网络的参数,θt为t时刻的神经网络的参数,β为神经网络的学习率,l(θ)为损失函数,且损失函数表达式如下:
49、
50、式中,τi为第i个无线设备在当前时间片下的数据传输时长系数,ri为第i个无线设备在当前时间片下的计算速率,ravg为在当前时间片下所有无线设备的计算速率平均值。
51、作为优选,所述根据归一化计算速率更新所述神经网络的参数,包括:
52、若所述归一化计算速率大于阈值,则不更新所述神经网络的参数;否则更新所述神经网络的参数。
53、本发明提供的在面对复杂的时变的信道环境的情况下,本发明使用了策略梯度的方法将时间资源进行分配,从而能够自适应地根据信道的环境,计算出合理的时间资源分配方案,达到较高的计算速率。相较于传统的通过数值迭代的方法对资源进行分配的方式,本发明提出的基于策略梯度的方法相较于迭代方法能够使用后者近千分之一的时间达到后者近90%的效果。
54、另一方面,本发明根据归一化计算速率对神经网络的参数进行了更新,归一化计算速率被用来衡量当前时隙下提出的基于神经网络的卸载决策效果相较于迭代方法效果的优劣程度。归一化计算速率能够准确地对本发明提出的算法效果进行衡量,其值越大,说明本发明算法的效果越接近最优值,同时将其作为神经网络更新的门限值,即,根据归一化计算速率的值选择是否更新神经网络。当归一化计算速率的值大于某一阈值(如0.9)时,说明神经网络已经能达到较好的效果,此时停止对神经网络的更新,用于进一步节省资源分配的时间;反之,则将神经网络的参数进行更新,以进一步提升卸载决策效果。