本发明涉及低轨卫星网络,尤其涉及一种面向低轨卫星网络的任务调度和资源切片方法及系统。
背景技术:
1、随着5g、wi-fi6等新一代通信和网络技术蓬勃发展,涌现出的大量诸如车联网、vr/ar、4k/8k、智慧城市等新型用户业务,大大改善了人们的生活质量、促进了社会发展。然而,偏远地区由于基础设施的限制,传统的互联网访问通常面临困难。随着低地球轨道(leo)卫星技术的不断发展,低地球轨道卫星服务在通信、地球观测等领域展现出了巨大的潜力,卫星网络具有覆盖广、广播通信等特点,能够覆盖传统地面网络难以达到的偏远地带,为这些地区提供可靠的互联网连接。同时低轨星座能够以较低的信号传播延迟来提高服务质量,这意味着将低轨星座有潜力快速精确地处理来自移动用户的时延敏感型和计算密集型业务。随着卫星通信技术的日益完善,卫星网络正逐渐成为未来网络的重要组成部分。
2、虽然低轨卫星有望提供全球通信服务且具有传播延迟短的优点,但低轨卫星在处理用户计算服务时仍面临着许多挑战需要解决。首先,卫星高动态性导致链路频繁周期性中断,给通信稳定性带来显著的挑战。频繁的拓扑变化会影响到端到端数据传输,从而在实时应用和多媒体传输等方面显著影响到用户体验。同时由于卫星高动态性,需要动态地调整多业务流资源切片决策以满足业务需求,低轨卫星的分布式资源切片策略需要不断更新。此外,由于低轨卫星资源受限,传统静态的资源切片方式导致资源利用率低且难以灵活负载均衡,这带来对低轨卫星星座资源管理的挑战。
3、现有技术方案将低轨卫星、同步卫星和地面站引入资源切片的三层系统网络,如图1所示。在这个层次结构中,同步卫星分担卫星的计算任务,而低轨卫星、同步卫星和地面站则都是独立自主的个体,能够独立地处理用户生成的请求。这种三层系统为用户提供了更为灵活和高效的资源利用方式。研究低轨卫星、同步卫星和地面站的顺序决策,将这一资源切片问题建模为三层stackelberg博弈。在这个博弈中,地面站充当领导者,同步卫星充当追随者,卫星充当子追随者。这种模型考虑了各层次之间的层次性和相互影响,以更全面地理解和优化资源切片策略。研究方法包括应用多智能体强化学习算法,旨在搜索该博弈的纳什均衡,以学习最优的资源管理策略。通过这种智能学习的方式,系统能够自适应地优化资源的分配,以适应不断变化的卫星环境和用户需求。但该技术方案也存在至少以下三点缺陷:
4、(1)该技术方案对资源进行分配时过于依赖各组成部分间的资源监控决策,虽然用户计算任务可以直接获得卫星节点提供的服务,但低轨卫星资源切片决策还需要与全局拓扑中的地面站和空间站相配合决策。而且地面站充当领导者,同步卫星充当追随者,该方案在资源切片过程中过度依赖各组成部分间的资源监控决策。尽管用户计算任务能够直接获取卫星节点提供的服务,但在低轨卫星资源切片决策方面,必须与全局拓扑中的地面站和空间站相协同决策。由此,这一体系结构存在单点故障的风险,并且在增加链路冗余流量方面存在挑战。
5、(2)当业务运行在接近满载的低轨卫星节点上并且实际使用资源超出预分配量时,三层资源切片网络无法进行资源扩容,造成任务处理失败的同时会出现资源浪费的问题,无法对卫星节点资源进行动态资源切片以满足用户业务的需求。
6、(3)难以使用多智能体强化学习在多星分布式协同场景下处理计算密集型任务。低轨卫星在使用多智能体强化学习时资源切片机制非常复杂且需要考虑很多因素,例如所有卫星的可用计算资源和剩余能量、所有卫星之间的链路延迟和容量。同时,增加考虑对地面站和空间站进行优化时多智能体强化学习由于动作状态空间的增大会更加难以实现资源切片的策略学习。
技术实现思路
1、鉴于此,本发明实施例提供了一种面向低轨卫星网络的任务调度和资源切片方法及系统,以消除或改善现有技术中存在的一个或更多个缺陷,解决当前低轨卫星网络存在的计算存储资源浪费、资源切片资源利用效率低,卫星分布式协同效果差的问题。
2、一方面,本发明提供了一种面向低轨卫星网络的任务调度和资源切片方法,所述方法在低轨卫星网络中执行,所述低轨卫星网络呈现分布式结构,所述方法包括以下步骤:
3、接收终端用户发起的服务请求;
4、获取各卫星当前资源状态集合;所述资源状态集合至少包括任务生成状态、各卫星之间的通信状态、各卫星与地面之间的通信状态;
5、基于强化学习构建任务调度机制,以所述任务生成状态、数据队列状态、各卫星之间和各卫星与地面之间的通信状态构建状态空间,以各卫星执行的任务调度构建动作空间,以最小化任务处理成本构建奖励函数;采用经验回放的方式训练所述任务调度机制,以根据当前状态生成相应的任务调度策略;
6、获取各卫星当前资源分配集合并构建卫星资源切片效用函数;
7、基于启发式算法构建资源切片机制,将各卫星资源切片的候选解认作带有相同电荷的粒子,在一次迭代中,根据所述效用函数计算各候选解的适应度值以进行评估,适应度值较高的候选解接收较高电荷,适应度值较低的候选解接收较低电荷;根据整体卫星的最优适应度值和最差适应度值更新候选解,在多次迭代中,通过模拟电荷之间相互作用,使得电荷聚集在最优解附近,以得到最优解,生成资源切片策略;
8、根据所述任务调度策略和所述资源切片策略对各卫星进行任务调度和资源切片,任务完成处理后向所述终端用户反馈结果。
9、在本发明的一些实施例中,获取各卫星当前资源切片集合,所述集合定义为:
10、y=[y1,...,yv,...,yv];
11、
12、其中,y表示所有卫星的资源切片的候选解集合;γcom,v表示候选解v的通信资源切片比例;γcomp,v表示候选解v的计算资源切片比例;表示候选解v为第d种资源切片时的大小。
13、在本发明的一些实施例中,所述效用函数定义为:
14、bene=[bene1,...,benev,...,benev];
15、其中,bene由以下等式计算得到:
16、
17、其中,bene表示候选解v的效用值;ζj表示计算任务j的权重,j∈j;γj,m(t)表示卫星m的计算任务j生成状态;表示计算任务j是否从卫星m调度到卫星n的状态;xk,j,m(t)表示计算任务j的数据大小;表示计算资源切片比例;fn表示卫星n的总计算能力;表示卫星n到卫星m的传输速率。
18、在本发明的一些实施例中,根据所述效用函数计算各候选解的适应度值以进行评估,还包括:
19、各候选解对应的带电粒子在任意时间获得的最优适应度值的位置的计算式为:
20、
21、其中,表示在时间t+1维度d的粒子i获得的最优适应度值的位置;bene(·)表示所述效用函数;pv(t)表示在时间t全局最优适应值的位置;yv(t+1)表示在时间t+1的候选解v;表示在时间t+1候选解v为第d种资源切片时的大小。
22、在本发明的一些实施例中,所述方法还包括:
23、根据当前迭代次数和预设迭代总次数计算库伦常数,计算式为:
24、
25、其中,k(t)表示所述库伦常数;k0表示初始值;β表示常数;iteration表示所述当前迭代次数;max iteration表示所述预设迭代总次数;
26、根据所述库伦常数计算各粒子之间的库仑力,计算式为:
27、
28、其中,表示时间t维度d的粒子h作用于粒子i的库仑力;k(t)表示所述库伦常数;qi(t)表示粒子i的电荷;qh(t)表示粒子h的电荷;表示维度d粒子h的适应度值的位置;表示时间t粒子i为第d种资源切片时的大小;rih(t)表示粒子i和粒子h之间的欧几里德距离;ε表示很小的正常数;
29、计算各粒子受到的库仑力总和,计算式为:
30、
31、其中,表示时间t维度d的粒子i受到来自其他粒子的库仑力总和;rand(·)表示[0,1]中的均匀随机数;表示时间t维度d的粒子h作用于粒子i的库仑力。
32、在本发明的一些实施例中,所述方法还包括:
33、将所述粒子受到库仑力总和除以所述粒子的电荷,计算得到所述粒子的电场,计算式为:
34、
35、其中,表示时间t维度d的粒子i的电场;表示时间t维度d的粒子i受到来自其他粒子的库仑力总和;qi(t)表示粒子i的电荷;
36、根据牛顿第二定律,计算所述粒子的加速度,计算式为:
37、
38、其中,表示时间t维度d的粒子i的加速度;qi(t)表示粒子i的电荷;表示时间t维度d的粒子i的电场;mi(t)表示粒子i的质量。
39、在本发明的一些实施例中,在每次迭代中,所述粒子的速度与位置的更新表达式为:
40、
41、
42、其中,表示时间t维度d的粒子i的速度;rand(·)表示[0,1]中的均匀随机数;表示时间t维度d的粒子i的加速度;表示时间t维度d的粒子i的位置。
43、在本发明的一些实施例中,根据整体卫星的最优适应度值和最差适应度值更新候选解,还包括:
44、所述粒子的电荷函数定义为:
45、
46、其中,qi(t)表示时间t粒子i的电荷;benei(t)表示时间t粒子i的效用值;best(t)表示所述最优适应度值;worst(t)表示所述最差适应度值;
47、所述最优适应度值和所述最差适应度值的计算式分别为:
48、best(t)=max(benev(t)),i∈(1,2,...,v);
49、worst(t)=min(benev(t)),i∈(1,2,...,v);
50、其中,benev(t)表示时间t粒子v的效用值;
51、根据所述电荷函数,所述粒子的电荷更新表达式为:
52、
53、其中,qi(t)表示更新后的粒子i的电荷。
54、另一方面,本发明提供一种面向低轨卫星网络的任务调度和资源切片系统,所述系统被执行时实现如上文中提及的任意一项所述面向低轨卫星网络的任务调度和资源切片方法的步骤,所述系统包括:
55、终端用户,用于发起服务请求;
56、低轨卫星网络,由各卫星节点构成,设有任务调度机制和资源切片机制,用于根据所述低轨卫星网络状态生成任务调度策略和资源切片策略,对所述卫星节点进行任务调度和资源切片;并在任务处理完成后,向所述终端用户反馈结果。
57、另一方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中提及的任意一项所述方法的步骤。
58、本发明的有益效果至少是:
59、本发明提供一种面向低轨卫星网络的任务调度和资源切片方法及系统,包括:低轨卫星网络接收终端用户发起的服务请求;获取各卫星资源信息、计算任务状态信息等;基于强化学习构建小时间尺度的低轨卫星网络任务调度机制,使用马尔科夫决策过程实现对计算任务的最优调度,根据任务处理实际的能量损耗、时延等进行合理调度,解决传统任务处理方法中卫星高动态带来的计算任务服务需求不匹配、低轨卫星静态资源与计算任务任务需求之间的不匹配导致的资源浪费等问题,以尽量减少网络能耗和任务处理延迟,提高任务处理性能;同时,获取各卫星当前资源分配集合并构建卫星资源切片效用函数;基于启发式算法构建资源切片机制,将各卫星资源切片的候选解认作带有相同电荷的粒子,在一次迭代中,根据效用函数计算各候选解的适应度值以进行评估,适应度值较高的候选解接收较高电荷,适应度值较低的候选解接收较低电荷;根据整体卫星的最优适应度值和最差适应度值更新候选解,进行多次迭代,以得到最优解,生成资源切片策略;基于启发式算法通过分布式资源切片,能够灵活地调整资源分配,适应卫星高速移动和计算任务迅速变化的情况,最大化整体网络服务能力,同时,能够降低通信延迟,提高数据传输速度,降低系统能耗,提高全局处理效率和资源利用率。
60、本发明的附加优点、目的,以及特征将在下面的描述中将部分地加以阐述,且将对于本领域普通技术人员在研究下文后部分地变得明显,或者可以根据本发明的实践而获知。本发明的目的和其它优点可以通过在说明书以及附图中具体指出的结构实现到并获得。
61、本领域技术人员将会理解的是,能够用本发明实现的目的和优点不限于以上具体所述,并且根据以下详细说明将更清楚地理解本发明能够实现的上述和其他目的。