一种基于匹配学习的泛在电力物联网接入方法与流程

文档序号:20763932发布日期:2020-05-15 18:36阅读:214来源:国知局
一种基于匹配学习的泛在电力物联网接入方法与流程

本发明涉及电力物联网,特别是涉及一种基于匹配学习的泛在电力物联网接入方法。



背景技术:

第四次工业革命旨在通过先进制造技术与工业物联网的无缝集成,实现制造过程和系统的互联响应、智能化和自优化。在这种新的模式中,将部署数十亿台机器类型的设备(mtds),用于持续执行各种任务,如监视、计费和保护等等。然而,资源有限的mtd和计算密集型任务之间的矛盾已经成为提供可靠服务的瓶颈。

将计算密集型任务从资源有限的mtd转移到功能强大的边缘服务器上,为适应快速增长的计算需求提供了一个很有前途的解决方案。在传统的云计算中,远程云服务器通常位于距离mtd很远的地方,长距离的数据传输会带来很多问题,包括连接不稳定、网络拥塞和无法忍受的延迟。相比之下,边缘计算将计算能力从远程云转移到无线接入网中的边缘服务器,是降低延迟、缓解拥塞和延长电池寿命的一个有前途的范例。

但是,尽管边缘计算提供了一种很有前途的方式来利用边缘服务器丰富的计算资源,但是由于有限的频谱资源、容量受限的电池和上下文不能感知等问题,它的性能可能会受到严重影响。首先,为了实时地将大量任务从mtds交付到边缘服务器,通道选择必须根据时变的上下文参数(如通道状态信息(csi)、能源状态信息(esi)、服务器负载和服务可靠性需求)进行动态优化。传统的集中优化方法依赖于一个共同的假设,即存在一个中心节点,如基站,它拥有所有上下文参数的完全信息。考虑到信令开销对于收集整个网络信息的高昂成本,这种假设在实际实现中十分困难。因此,一个分布式优化方法,其中每个mtd单独优化其基于本地信息的渠道选择策略是更可取的。然而,当mtds的数量远远超过可用信道的数量时,多个mtds争夺同一信道,选择冲突就会频繁发生,从而使得不同mtds之间的信道选择策略耦合。其次,由于电池容量有限,当电池能量耗尽时,mtd将停止使用。因此,短期的渠道选择策略也耦合了长期的能量预算。最后但并非最不重要的是,工业应用程序常常需要保证一定的服务可靠性。如何在有限的资源和信息下满足严格的可靠性要求带来了另一个方面的困难。

匹配理论为解决信道选择、任务选择、服务器选择等组合问题提供了一种灵活、低复杂度、高效的工具。然而,它需要全局状态信息(gsi)的完全知识来构造偏好列表,它指定了基本的匹配标准。已有一些基于匹配和博弈论的渠道选择优化研究尝试。然而,它们依赖于不确定的上下文参数,如果不确定因素的实际概率分布与假定的统计模型不一致,可能会遭受严重的性能损失。



技术实现要素:

本发明的目的在于克服现有技术的不足,提供一种基于匹配学习的泛在电力物联网接入方法,能够通过学习与匹配实现在信道选择上的最优,进而实现吞吐量的最大化。

本发明的目的是通过以下技术方案来实现的:一种基于匹配学习的泛在电力物联网接入方法,包括以下步骤:

s1.构建系统模型;

s2.对模型进行细化,得到任务/数据传输模型、能量消耗模型、时延模型和服务可靠性模型;

s3.最大化长期的吞吐量,确定优化问题;

s4.基于虚拟队列的理论和lyapunov优化理论,对优化问题进行转化;

s5.通过学习与匹配实现在信道选择上的最优,进而实现吞吐量的最大化。

优选地,所述泛在电力物联网接入方法还包括泛在电力物联网接入步骤:在步骤s5实现信道选择上的最优后,通过该信道接入泛在电力物联网,并完成数据传输。

进一步地,所述步骤s1中构建的系统模型包括:

设一个基站服务小区内,包含有一个基站和一个边缘服务器,两者相近分布,其中基站为小区内的k个mtd提供连接服务,边缘服务器提供计算服务;其中k个mtds定义为:m={m1,…,mk,…,mk};

一共有j个正交的子信道,定义为:c={c1,…,cj,…,cj};

模型采用了时隙模型,即将整个的优化时间划分为t个长度为τ的小时间间隔,将所有的时隙定义为:t={1,…,t,…,t};

在该模型中,在每一个时隙内,信道的信息保持不变;而在不同的时隙之间信道的信息则会发生改变;

在每一个时隙,每个mtd都要独立的决定它的信道选择策略;特别的是,每一个mtd都会面临j+1个选择,即选择j个子信道中的一个或者保持休眠。

进一步地,所述步骤s2中细化得到任务数据/传输模型的过程包括:

每一个设备m在每个时隙都会产生新的数据,这些数据暂时存储在设备m本地的存储器中,这样在每一个设备m上就形成了一个数据队列:

qk(t+1)=max{qk(t)-uk(t),0}+γk-ak(t)+yk(t)

其中qk(t)为当前时隙设备mk存储器上存储的数据量,uk(t)为当前时隙卸载到边缘服务器上的数据量,ak(t)和γk分别是设备mk产生数据的速率和产生的数据的平均大小,两项乘积代表新产生的数据量,yk(t)代表由于误码的存在而需要重新传输的数据量;

每一个时隙设备m又会卸载一定的数据到边缘服务器上,数据的卸载速率是由设备m当前时隙选择的信道决定的,根据选择的信道j得到信噪比和信息的传输速率:

信噪比为:

信息传输速率为:

其中δ2是噪声功率,ptx是传输功率,hk,j,t表示在第t个时隙,设备mk和基站之间的子信道cj的信道增益,bj代表传输带宽,由此便得到了设备mk的吞吐量:

zk,j,t=min{qk(t),τrk,j,t}.

吞吐量已知之后,得到当前时隙设备mk传输到边缘服务器的数据量:

其中xk,j,t记录了每一个设备在每一个时隙对信道的选择情况,当xk,j,t=1时,则代表设备mk在时隙t内选择了信道j;

根据信噪比获取传输的误码率:

根据得到的误码率得出需要重传的数据量:

进一步地,所述步骤s2中细化得到能量消耗模型的过程包括:

设备mk在第t时隙选择信道j传输数据所消耗的能量为:

其中ptx代表传输功率,表示要传输的数据总量除以数据传输速率,即传输完成所有的数据需要花费的时间;τ表示一个时隙的长度,即只能在一个时隙内进行数据传输;所以表示实际上的传输时间;ptx与相乘则表示传输消耗的能量;若选中第j+1个信道,则表示设备mk在当前时隙保持休眠状态,即不传送数据,所以能量消耗为0;

基于电池容量的受限,得到设备mk长期的能量约束:

其中ek,max代表设备mk电池的容量约束。

所述步骤s2中细化得到时延模型的过程包括:

将时延从整体上分为两部分,第一部分是传输时延,即在数据传输上消耗的时间;第二部分是计算时延,即在数据处理上消耗的时间,具体如下:

传输时延的具体模型如下:

当设备mk处于休眠状态时,不进行数据传输,所以传输时延为无穷大;

计算时延的具体模型如下:

其中,λk,t表示设备mk传输的数据的计算强度,单位为cpu周期每比特,据此得出计算完设备mk传送来的数据一共需要zk,j,tλk,tcpu周期;ξk,t代表设备mk可用的计算资源;当设备mk处于休眠状态时,没有数据传输,从服务可靠性的角度来看,没有数据传输时不符合满足服务的要求,所以此处将设备休眠时的计算时延定义为无穷大。

所述步骤s2中细化得到服务可靠性模型的过程包括:

假定时延要求为d,如果这样则表示任务卸载失败,那么可用得到在t个时隙内设备mk成功完成任务卸载的次数:

其中ii{x}表示:如果x为真,那么ii{x}=1,反之,如果x为假,那么ii(x)=0;;

基于成功卸载次数,定义服务可靠性为:

其中,ηk为提出的服务可靠性要求。

进一步地,所述步骤s3中构建的优化为题为p1:

p1

s.t.c1:

c2:

c3:

c4:

其中,优化的变量为所有设备长期的吞吐量;约束条件c1和c2代表信道选择上的约束,即每一个设备只能够同时选择一个信道,且一个信道也只能同时被一个设备选择;约束条件c2和c3为能量约束和服务可靠性约束。

进一步地,所述步骤s4包括:

首先基于虚拟队列的理论,将上述c2和c3两个约束条件转换为虚拟队列:

这两个队列分别代表了能量约束以及服务可靠性约束;

然后基于lyapunov优化理论,结合建立的虚拟队列,把长期的能效优化问题转化为在每一个时隙最大化能效和服务可靠性以及最小化能量消耗的问题,得到优化问题p2:

p2:

s.t.c1~c2.

即将优化问题p1中的c2和c3约束转化到优化目标之中,实现对能耗和服务可靠性的感知。

进一步地,所述步骤s5包括:

第一步:对于任一设备mk属于m={m1,…,mk,…,mk},将其与信道cj属于c={c1,…,cj,…,cj}临时进行匹配,并观察其吞吐量、能耗和时延性能;

第二步:首先设备mk根据以下公式估计它对第j个子信道的偏好程度,并构建它的偏好列表

其中表示截至到当前时隙t,优化变量θk,j,t的平均值;表示设备mk截至到时隙t-1为止选择信道cj的次数;ρk,j表示设备mk选择信道cj所要付出的代价;

然后设备mk将该偏好列表传输给边缘服务器,接下来所有的mtd基于定价匹配理论与信道进行匹配,渐渐地每个mtd都选择到自己的信道;

第三步:根据第二部选择的信道,解决优化问题p2;

第四步、令t=t+1,按照步骤s1~s5计算更新得到新的uk(t),yk(t),qk(t+1),nk(t+1)和fk(t+1),再次进行信道优化;以此类推,每次使得t的取值加1,进行不断的学习,从而实现在信道选择上的最优,实现吞吐量的最大化。

本发明的有益效果是:本发明将机器学习应用于信道选择,使得不需要全局的信息便可以完成信道选择的最优决策,成本较低;通过学习与匹配实现在信道选择上的最优,进而实现吞吐量的最大化;基于mab理论、lyapunov优化理论和匹配理论,能量感知和服务可靠性感知与机器学习结合了起来,从而达到能量利用率和服务可靠性的最大与最优。

附图说明

图1为本发明的方法流程图;

图2为本发明构建的系统模型示意图。

具体实施方式

下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。

如图1所示,一种基于匹配学习的泛在电力物联网接入方法,包括以下步骤:

s1.构建系统模型:

如图2所示:在一个基站服务小区内,包含有一个基站和一个边缘服务器,两者相近分布。其中基站为小区内的k个mtds提供连接服务,边缘服务器提供计算服务。其中k个mtds定义为:m={m1,…,mk,…,mk};

一共有j个正交的子信道,定义为:c={c1,…,cj,…,cj}

此处采用了时隙模型,即将整个的优化时间划分为t个长度为τ的小时间间隔,将所有的时隙定义为:t={1,…,t,…,t}

在该模型中,在每一个时隙内,信道的信息保持不变;而在不同的时隙之间信道的信息则会发生改变。

在每一个时隙,每个mtd都要独立的决定它的信道选择策略;特别的是,每一个mtd都会面临j+1个选择,即选择j个子信道中的一个或者保持休眠(空闲,不传输数据)

s2.对模型进行细化,得到任务/数据传输模型、能量消耗模型、时延模型和服务可靠性模型;

a.任务/数据传输模型

每一个设备m在每个时隙都会产生新的数据,这些数据暂时存储在设备m本地的存储器中,这样在每一个设备m上就形成了一个数据队列:

qk(t+1)=max{qk(t)-uk(t),0}+γkak(t)+yk(t)

其中qk(t)为当前时隙设备mk存储器上存储的数据量,uk(t)为当前时隙卸载到边缘服务器上的数据量,ak(t)和γk分别是设备mk产生数据的速率和产生的数据的平均大小,两项乘积代表新产生的数据量,yk(t)代表由于误码的存在而需要重新传输的数据量。

每一个时隙设备m又会卸载一定的数据到边缘服务器上,数据的卸载速率(传输速率)是由设备m当前时隙选择的信道决定的,根据选择的信道j得到信噪比和信息的传输速率:

信噪比为:

信息传输速率为:

其中δ2是噪声功率,ptx是传输功率,hk,j,t表示在第t个时隙,设备mk和基站之间的子信道cj的信道增益,bj代表传输带宽,由此便得到了设备mk的吞吐量:

zk,j,t=min{qk(t),τrk,j,t}.

吞吐量已知之后,便可以得到当前时隙设备mk传输到边缘服务器的数据量:

其中xk,j,t记录了每一个设备在每一个时隙对信道的选择情况,当xk,j,t=1时,则代表设备mk在时隙t内选择了信道j。

同时根据信噪比可以得到传输的误码率:

此处以bpsk调制方式为例,不同的调制方式,相应的公式有所不同。

根据上述得到的误码率可以得出需要重传的数据量:

b.能量消耗模型

设备mk在第t时隙选择信道j传输数据所消耗的能量为:

其中ptx代表传输功率,表示要传输的数据总量除以数据传输速率,即传输完成所有的数据需要花费的时间;τ表示一个时隙的长度,即只能在一个时隙内进行数据传输;所以表示实际上的传输时间;ptx与相乘则表示传输消耗的能量;若选中第j+1个信道,则表示设备mk在当前时隙保持休眠状态,即不传送数据,所以能量消耗为0;

在前者的基础上,由于电池容量的受限,我们可以得到设备mk长期的能量约束:

其中ek,max代表设备mk电池的容量约束

c.时延模型

时延整体上分为两部分,第一部分是传输时延,即在数据传输上消耗的时间;第二部分是计算时延,即在数据处理上消耗的时间。具体如下:

传输时延的具体模型如下:

当设备mk处于休眠状态时,不进行数据传输,所以传输时延为无穷大。

计算时延的具体模型如下:

其中,λk,t表示设备mk传输的数据的计算强度,单位为cpu周期每比特,所以可以得出计算完设备mk传送来的数据一共需要zk,j,tλk,tcpu周期;ξk,t代表设备mk可用的计算资源;当设备mk处于休眠状态时,没有数据传输,从服务可靠性的角度来看,没有数据传输时不符合满足服务的要求,所以此处将设备休眠时的计算时延定义为无穷大。

d.服务可靠性模型

假定时延要求为d,如果这样则表示任务卸载失败,那么可用得到在t个时隙内设备mk成功完成任务卸载的次数:

其中ii{x}表示:如果x为真,那么ii{x}=1,反之,如果x为假,那么ii(x)=0;

基于上述成功卸载次数,定义服务可靠性为:

其中,ηk为提出的服务可靠性要求。

s3.最大化长期的吞吐量,确定优化问题p1:

p1:

s.t.c1:

c2:

c3:

c4:

其中,优化的变量为所有设备长期的吞吐量;约束条件c1和c2代表信道选择上的约束,即每一个设备只能够同时选择一个信道,且一个信道也只能同时被一个设备选择;约束条件c2和c3为之前提到的能量约束和服务可靠性约束。

s4.基于虚拟队列的理论和lyapunov优化理论,对优化问题进行转化:

首先基于虚拟队列的理论,我们将上述c2和c3两个约束条件转换为虚拟队列:

这两个队列分别代表了之前提出的能量约束以及服务可靠性约束。

然后基于lyapunov优化理论,结合前面建立的虚拟队列,我们把长期的能效优化问题转化为了在每一个时隙最大化能效和服务可靠性以及最小化能量消耗的问题(即把一个长期的优化问题转化为了多个短时的优化问题,也就是在每一个时隙实现最优,以在长期实现最优)。所以我们得到下面需要解决的问题p2:

p2:

s.t.c1~c2.

可以看到通过虚拟队列相关理论,我们将问题p1中的c2和c3约束转化到了我们的优化目标之中,从而实现了对能耗和服务可靠性的感知。

s5.通过学习与匹配实现在信道选择上的最优,进而实现吞吐量的最大化:

所述步骤s5包括:

第一步:对于任一设备mk属于m={m1,…,mk,…,mk},将其与信道cj属于c={c1,…,cj,…,cj}临时进行匹配,并观察其吞吐量、能耗和时延性能;

第二步:首先设备mk根据以下公式估计它对第j个子信道的偏好程度,并构建它的偏好列表

其中表示截至到当前时隙t,优化变量θk,j,t的平均值;表示设备mk截至到时隙t-1为止选择信道cj的次数;ρk,j表示设备mk选择信道cj所要付出的代价;

然后设备mk将该偏好列表传输给边缘服务器,接下来所有的mtd基于定价匹配理论与信道进行匹配,渐渐地每个mtd都选择到自己的信道;

第三步:根据第二部选择的信道,解决优化问题p2;

第四步、令t=t+1,按照步骤s1~s5计算更新得到新的uk(t),yk(t),qk(t+1),nk(t+1)和fk(t+1),再次进行信道优化;

以此类推,每次使得t的取值加1,进行不断的学习,从而实现在信道选择上的最优,实现吞吐量的最大化。

所述泛在电力物联网接入方法还包括泛在电力物联网接入步骤:在步骤s5实现信道选择上的最优后,通过该信道接入泛在电力物联网,并完成数据传输。

综上,本发明将学习算法用于信道选择,融合服务可靠性感知、能量感知和上下文感知,每个设备可以动态的选择信道进行数据传输,使得不需要全局信息便可以达到网络整体吞吐量最优;将mab问题、lyapunov优化理论以及匹配理论同机器学习结合起来,达到能量感知和服务可靠性感知的效果,从而提高网络能量利用率和服务的可靠性。

以上所述是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应该看作是对其他实施例的排除,而可用于其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1