一种大规模低轨卫星网络拥塞感知和故障预测方法

文档序号:40187133发布日期:2024-12-03 11:35阅读:21来源:国知局
一种大规模低轨卫星网络拥塞感知和故障预测方法

本发明属于涉及卫星故障定位,尤其涉及一种大规模低轨卫星网络拥塞感知和故障预测方法


背景技术:

1、随着移动设备迅速增长,单纯的地面通信网络和昂贵的静止轨道卫星已经不足以满足未来的网络容量需求,低轨道卫星网络的构建已经迫在眉睫。然而复杂的太空环境对于维护卫星通信的稳定性带来了巨大挑战。大量的高能粒子和宇宙辐射可以损伤卫星上的电子设备,进而导致长时间的链路中断故障;而卫星非常有限的计算和存储资源可能导致节点频繁的拥塞故障。因此,低轨卫星网络亟需一种精确且高效的故障定位方法。

2、卫星网络设备在设计与性能上与地面网络设备有所区别,受到严苛的功率、重量和尺寸约束,这使得其运算和存储能力均受到一定程度的限制,星上通信、存储及计算所需能量全部来自太阳能供电板转化的电能。因此,相比于地面网络,卫星系统在处理数据流时会更频繁地发生拥塞现象。但卫星拥塞存在一定的规律性:1:由于大多数互联网用户位于北半球,对卫星的任务请求量较大,拥塞也应更容易发生在北纬区域;2:由于地面站连接着卫星网络和地面网络,拥塞更容易发生在靠近地面站的卫星附近。此外,低轨卫星网络的高动态性易引起星间通信链路故障,致使业务数据传输中断,无法保障终端用户的服务质量。但卫星围绕地球运动的时空周期性同样使得链路故障也存在一定的规律性,例如:由于天线跟踪的限制,卫星进入极地区域后的平面间链路将被切断并需要重新建链,信号捕获跟踪过程非常复杂,共由六个主要步骤组成,分别为开环指向、主动端扫描、被动端捕获、主动端捕获、双端捕获和稳定跟踪,卫星可能由于软件bug或计算资源过载而导致其中某个步骤计算错误或延迟,进而导致较长时间的链路中断。这些链路中断的规律性使得卫星故障的预测成为可能。此外,由于拥塞和链路故障在时间量级上的差异,对于预测得到的断路结果,很容易区分出是节点拥塞还是链路故障。

3、随着人工智能的发展,时间序列预测的方法也不断演进。传统的时间序列预测方法,如移动平均模型(ma)、整合移动平均自回归模型(arima)等长期以来被广泛地使用。近年来,深度学习模型由于其强大的功能和优秀的表现,成为时间序列预测的新宠。诸如循环神经网络(rnn)、长短期记忆网络(lstm)和门控循环单元(gru)等深度学习模型被应用于捕捉时间序列数据的复杂特征。informer模型是当前最新的一种基于transformer的深度学习模型。它引入了probspare自注意力机制来减少了计算复杂度,并通过自注意力蒸馏技术高效处理极长的输入序列。这些改进使informer模型在卫星故障预测场景下具有广大发展前景。


技术实现思路

1、本发明的目的是提供一种大规模低轨卫星网络拥塞感知和故障预测方法,能够实现大规模低轨卫星网络拥塞感知和故障预测,具有预测效率高、精度高和检测开销低的优点。

2、所述大规模低轨卫星网络中的大规模指低轨卫星数量大于4000颗。

3、本发明的目的是通过下述技术方案实现的。

4、本发明公开的一种大规模低轨卫星网络拥塞感知和故障预测方法,基于bfd协议在采集两个卫星间的链路信息;对链路信息进行数据规整,得到标准链路状态序列;根据断路起始位置和持续时间,对标准链路状态序列进行时空融合编码,得到链路状态矩阵,对不同组合下的链路状态矩阵进行比较,选出最优矩阵作为预测模型的输入。将链路状态矩阵输入informer模型,informer模型通过升维、位置编码和时间特征编码对链路状态矩阵进行嵌入操作,得到嵌入后的向量;嵌入后的向量在分别经过编码层、解码层和全连接层后得到预测的链路状态矩阵。编码器通过多头probsparse自注意力层和自注意力蒸馏层两部分提取长序列输入的健壮的远程依赖性;解码器通过掩蔽多头probsparse自注意力层和多头注意力层进行生成式预测,直接输出多步预测矩阵,避免传播过程可能存在的累计误差问题,提高预测速度。初始化故障检测参数,依据预测的链路状态矩阵判断发生断路的故障种类,故障种类分为节点拥塞和链路故障;依据测试集中预测的断路起始值和实际断路起始值的差异计算基于差值概率分布的故障检测间隔,在确保断路检测精度的同时降低检测报文的开销;依据测试集中的断路持续时间计算检测到断路后判断故障种类的反应时间。在每一次预测到断路后,根据步骤三设置的参数分别对节点拥塞和链路故障两种情况进行评估。对多种参数进行更新:基于断路起始点更新下一次预测到断路后的检测点{t1,...,ti,...,tw};基于一个卫星内存阈值记录节点拥塞的持续时间更新δt,基于断路持续时间更新δt′和δt″。将链路状态数据加入到原始链路状态序列经过数据预处理后输入informer模型训练并预测下一次断路。通过对故障检测参数的动态更新和预测到检测再到预测的循环,在降低检测开销的同时不断提升卫星节点拥塞感知和故障预测的精度。

5、本发明公开的一种大规模低轨卫星网络拥塞感知和故障预测方法,包括如下步骤:

6、步骤一、通过bfd协议在采集两个卫星间的链路信息;对链路信息进行数据规整得到,得到标准链路状态序列;根据断路起始位置和持续时间,对标准链路状态序列进行时空融合编码,得到链路状态矩阵,对不同组合下的链路状态矩阵进行比较,选出最优矩阵作为预测模型的输入。

7、步骤1.1:相邻两个卫星节点建立bfd会话后,在两卫星之间的通道上周期性地发送bfd报文,当一方在协商的检测时间内没有接收到bfd报文,则判定此通道上发生断路。bfd协议检测间隔设为b毫秒,通路记为1,断路记为0,原始链路状态序列记为x={x1,...,xf,...,xn},即采用双向转发检测bfd协议实现链路状态数据获取。将获取的链路状态数据划分为训练集和测试集。

8、步骤1.2:鉴于节点拥塞和链路故障在时间量级上的差距,根据式(1)保留原始链路状态序列中持续时间为1s-10s的断路和持续时间1min以上的断路:

9、

10、得到标准链路状态序列,记为x′={x1′,...,xf′,...,xn′}

11、步骤1.3:根据链路状态序列的冗余性和连续性,通过时空融合编码对标准链路状态序列进行压缩,降低链路状态序列稀疏性。

12、冗余性指,链路状态序列仅由数值断路0和通路1组成,且由于链路断路状态将作为少见异常出现,链路状态序列大部分为通路1,具有高度冗余性。

13、连续性指,链路的通路、断路状态会持续一段时间,所以序列的断路0和通路1具有连续性,不会交错出现。

14、根据式(2)设置标准链路状态序列统计的起始值z1:{z1,…zi…,zu}和时间间隔z2:{z′1,…z′i…,z′u}:

15、

16、其中,imin为标准链路状态序列中相邻连续断路的起始值的最小间隔,imax为标准链路状态序列中相邻连续断路的起始值的最大间隔,o为发生次数最多的拥塞持续时间,l为标准链路状态序列长度。此时,对于z1,z2有u2个组合(zi,z′i),根据z2将标准链路状态序列划分出s=[l/z2]个子序列,记录第j个子序列中持续断路的个数cj,断路起始位置和断路持续时间j∈[1,[l/z2]],将断路起始位置xjcj作为列向数对的第一个值,断路持续时间作为第二个值,列向数对形式即为通过将每个子序列包含的列向数对竖向排布,对标准链路状态序列进行升维,得到链路状态矩阵,形式如下:

17、

18、链路状态矩阵的维度为2max{cj}×s,鉴于每个子序列内存在的连续故障个数不等,对于cj<cmax的时间间隔列,缺失部分使用的形式补齐,但不包含故障信息,进而导致资源的浪费。为能使得在时间间隔z2尽可能大的情况下序列包含尽可能少的无用信息,计算每一种组合时空融合编码后的链路状态矩阵,并记录总列向数对个数和列向数对个数。先选出总列向数对最小的组合,再在这些组合里选出列向数对最小的组合,在该组合下输出的链路状态矩阵作为informer预测模型的输入。

19、步骤二、将链路状态矩阵输入informer模型,informer模型通过升维、位置编码和时间特征编码对链路状态矩阵进行嵌入操作,得到嵌入后的向量;嵌入后的向量在分别经过编码层、解码层和全连接层后得到预测的链路状态矩阵。编码器通过多头probsparse自注意力层和自注意力蒸馏层两部分提取长序列输入的健壮的远程依赖性;解码器通过掩蔽多头probsparse自注意力层和多头注意力层进行生成式预测,直接输出多步预测矩阵,避免传播过程产生的累计误差问题,提高预测速度。

20、步骤2.1:informer模型的升维是通过一维卷积将链路状态矩阵2max{cj}维向量转换为512维向量,采用transformer模型中的位置编码方法,通过使用固定的位移嵌入来保留时间序列数据中的时间顺序信息:

21、

22、

23、其中,dmodel为输入表示后的特征维度,为使得自注意力的相似度计算能够访问全局上下文,使用1-d的卷积滤波器将标量上下文投影到dmodel-维向量与升维、位置编码操作叠加后得到最终输入向量:

24、

25、步骤2.2:编码器通过多头probsparse自注意力层和自注意力蒸馏层两部分提取长序列输入,在多头probsparse自注意力层区分出贡献了主要的注意力少数点积;根据自注意力机制,第a个查询的注意力被定义为概率形式的核平滑器:

26、

27、基于式(6),第a个查询对所有键的注意度定义为概率p(ke∣qa),主导的点积对会促使相应查询的注意度概率分布远离均匀分布;根据kl散度公式(7)度量两种分布的距离:

28、

29、忽略常数项,将第a个查询的稀疏度指标定义为:

30、

31、根据式(6)(7)(8),多头probsparse自注意力机制允许每个键仅关注部分主导查询:

32、

33、基于多头probsparse自注意力机制为每个头部生成不同的稀疏查询对,从而避免严重的信息丢失;根据通过一维卷积对多头probsparse自注意力层的输出进行蒸馏,高效捕捉输出和输入之间的远程依赖耦合,具体形式如下:

34、

35、其中,表示注意力块,它包含多头概率稀疏自注意力矩阵和基本操作,elu为激活函数,maxpool为最大池化。

36、步骤2.3:解码器进行生成式预测,直接输出多步预测矩阵:解码器的输入形式为长度ntoken+noutput的序列,即目标序列起始token和目标序列占位符的拼接序列以及时间戳,占位符设置为0:

37、

38、在依次经过掩蔽多头probsparse自注意力层和多头注意力层后,得到(ntoken+noutput)×d的输出矩阵,d为嵌入的维度。矩阵再通过一个全连接层得到输出矩阵,即为预测的链路状态矩阵。

39、测试集的误差函数采用指标为归一化均方根误差nrmse和相对均方根误差rrmse衡量预测性能:

40、

41、

42、其中,yi是informer模型中测试集部分的真实值,测试集部分的预测值。

43、步骤三、初始化故障检测参数,依据预测的链路状态矩阵判断发生断路的故障种类,故障种类分为节点拥塞和链路故障;依据测试集中预测的断路起始值和实际断路起始值的差异计算基于差值概率分布的故障检测间隔,在确保断路检测精度的同时降低检测报文的开销;依据测试集中的断路持续时间计算检测到断路后判断故障种类的反应时间。

44、步骤3.1:初始化故障检测参数,依据预测的链路状态矩阵判断发生断路的故障种类,故障种类分为节点拥塞和链路故障;由于拥塞和链路故障的性质差异明显,预测结果在秒量级的断路定义为拥塞,预测结果在分钟量级的定义为链路故障。

45、步骤3.2:根据测试集中的数据,计算基于差值概率分布的故障检测间隔。在基于informer模型预测时间序列大致趋势后,为精准定位实际断路起始点,需要在预测起始点的周围不断的检测链路状态,采用基于差值概率分布的故障检测间隔在确保断路检测精度的同时降低检测报文的开销。测试集中的数据预测的断路起始点记为实际断路起始点记为则t′c和tc的间隔序列δt1=tc-t′c。

46、根据δt1的概率分布计算故障检测间隔,具体步骤如下:

47、采用基于密度的dbscan算法剔除δt1中存在的离群值,dbscan算法使用最小点数minpts和邻域半径eps两个参数进行聚类。任意选取数据集中的一个点来进行聚类,如果在eps的半径内至少有minpts个点,则将该点记为核心点并以该点为中心展开一个聚类;如果在eps的半径内存在少于minpts个点,但存在核心点,则将该点记为边界点并加入核心点的聚类;如果既不是核心点也不是边界点的点,则记为异常点。不断迭代minpts和eps,寻找异常值并剔除;直到访问所有点完成聚类。

48、在去除离群值后,将所有间隔从小到大排列并去除重复间隔得到间隔序列{δt1,...,δtg,...,δtn},统计δt1中间隔序列中每个间隔出现的概率,得概率分布p:{p1,...,pn};当设置w个检测点{t1,...,th,...,tw},预测的节点断路起始点为t0,第一个检测点t1=t0+δt1,最后一个检测点记为tw=t0+δtn,则根据下式确定概率分布不同时相邻检测点的间隔:

49、如果则第h个检测点

50、步骤3.3:依据标准链路状态序列中的断路持续时间初始化检测到断路后判断故障种类的三个反应时间。在检测到预测为节点拥塞的断路发生后,立即下发负载均衡策略,负载均衡策略为控制器选取出途径拥塞节点的流量需求偏大的所有流表的一半,在删除网络拓扑中的拥塞节点后,对相应流表的源节点重新采用最短路径算法重新计算路径并下发。如果断路原因是节点拥塞,那么节点拥塞在负载均衡策略的影响下快速恢复,否则负载均衡策略不会促使链路恢复。在检测到预测为链路故障的断路发生后,立即下发新路由策略,新路由策略为控制器去除该链路后的网络拓扑依据最短路径算更新原来的路由表。但如果实际断路原因是节点拥塞,则链路快速恢复。为进一步评估预测的故障种类准确性,记录标准链路状态序列中拥塞持续时间和链路故障持续时间,分别采用dbscan算法剔除异常值,将下发负载均衡策略后判定断路是否为节点拥塞的初始反应时间δt和下发新路由策略后系统判定断路是否为节点拥塞的反应时间δt′初始化为剔除异常值后的拥塞持续时间最小值,将下发新路由策略后判断断路是否为链路故障的反应时间δt″初始化为剔除异常值后的链路故障的最大持续时间。

51、步骤四:在每一次预测到断路后,根据步骤三设置的参数分别对节点拥塞和链路故障两种情况进行评估。对步骤三中的多种参数进行更新:基于断路起始点更新下一次预测到断路后的检测点{t1,...,tw};基于一个卫星内存阈值记录节点拥塞的持续时间更新δt,基于断路持续时间更新δt′和δt″。将链路状态数据加入到原始链路状态序列经过数据预处理后输入informer模型训练并预测下一次断路。通过对故障检测参数的动态更新和预测到检测再到预测的循环,在降低检测开销的同时不断提升卫星节点拥塞感知和故障预测的精度。

52、步骤4.1:对收集到的原始链路状态序列进行数据预处理后输入informer模型训练并预测得到链路状态矩阵,预测到断路后,在步骤三设置的故障检测点{t1,...,tw}依次发送检测报文,如果未检测到断路,则记录原始链路状态序列末尾到tw时刻的通路持续时间加入到原始链路状态序列重新训练并预测。如果检测到断路,根据预测的断路持续时间判断发生断路的故障种类,如果判定断路为节点拥塞,进行步骤4.2,如果判定断路为链路故障进行步骤4.2。为不断适应链路特性的变化,将本次预测的断路起始点和检测的断路起始点差值加入步骤3.2中δt1序列中重新计算故障检测间隔,更新下一次预测到断路后的检测点{t1,...,tw}。

53、步骤4.2:如果判断断路为节点拥塞,下发负载均衡策略。如果断路原因是节点拥塞,在负载均衡策略的影响下,节点接收流量大幅降低,缓存队列不断减少,节点拥塞快速缓解。

54、节点时刻监控队列占有率,在节点内存降低到一个合适的阈值后,表明此时节点进入一个不易拥塞的状态,记录该时刻并发送至控制器。为了获得上述机制预期的效果,阈值的设置至关重要,记为t1,为计算该值,加入一个表示节点缓存进入繁忙状态的值,记为t2。

55、t1和t2应能应对以下极端情况:当卫星检查缓存队列时,队列占有率接近但仍然低于t1,检查后,队列占有率恰好超过t1,但卫星需要等待检查间隔δtq才能检测到队列占有率的变化。为了确保在δtq期间队列占有率不会超过t2,t1和t2应满足:

56、(t2-t1)·l·s≥(i-o)max·δtq      (14)

57、其中,l表示缓冲队列的大小,s表示平均数据包大小,(i-o)max表示在这个期间节点的输入和输出流量的最大差值。

58、如果在一次检查后,队列占有率恰好超过t2,卫星也需要等待δtq来意识到队列占有率的变化。为了避免因缓冲溢出而丢弃数据包,t2应满足:

59、(1-t2)·l·s≥(i′-o′)max·δtq    (15)

60、根据式(15),得到:

61、

62、

63、考虑到极端情况,t1和t2设定为:

64、

65、

66、如果在δt时间内,拥塞节点监控到队列占有率下降至t1以下,表明对于断路持续时间的预测正确,并且节点拥塞已恢复。原拥塞节点需要反馈队列占有率下降至t1的时间点给控制器以更新故障检测参数δt,控制器将队列占有率下降至t1的时间点与检测到的断路起始点做差值即得到拥塞持续时间,δt取本次节点拥塞和上一次下发负载均衡策略后节点拥塞的持续时间的最大值。该拥塞持续时间作为增量数据加入原始链路状态序列中经过预处理后在informer模型中再次训练并预测。

67、如果在δt时间内,控制器未接收到节点通路通知,表明对于断路持续时间的预测错误。错误、断路原因是链路故障,下发新路由策略。相邻节点持续监测链路状态,记录故障持续时间,并返回informer模型重新训练并预测。

68、步骤4.3:如果判断断路为链路故障,下发新路由策略。如果在δt′内,控制器接收到节点通路通知,则表明对于断路持续时间的预测错误,断路原因是节点拥塞,新的路由表去除了断路链路,通过该链路进入节点的流量降为0,节点拥塞迅速缓解。δt′取本次节点拥塞和上一次下发新路由策略后节点拥塞的持续时间的最大值。并将拥塞持续时间加入原始链路状态序列中经过预处理后在informer模型中再次训练并预测。

69、如果δt″的时间范围内,控制器接收到节点通路通知,则表明预测结果正确,节点发生了链路故障。基于链路故障持续时间更新δt″,δt″取本次链路故障和上一次链路故障持续时间的最大值。将链路故障持续时间加入原始链路状态序列,输入informer模型再次训练并预测。

70、如果δt″的时间范围内,控制器未接收到节点通路通知,则判定节点出现永久无法恢复的硬件故障,此时控制中心收集故障节点告警信息,交付人工处理。

71、步骤四通过对故障检测参数的动态更新和预测到检测再到预测的循环,在降低检测开销的同时不断提升卫星节点拥塞感知和故障预测的精度。

72、有益效果:

73、1、本发明公开的一种大规模低轨卫星网络拥塞感知和故障预测方法,对链路状态序列进行时空融合编码,得到链路状态矩阵,降低链路状态信息的稀疏性。对不同组合下的链路状态矩阵进行比较,选出最优矩阵作为预测模型的输入,提高数据训练和预测效率。

74、2、本发明公开的一种大规模低轨卫星网络拥塞感知和故障预测方法,采用informer模型对链路状态序列进行训练并预测,通过多头probsparse自注意力层和自注意力蒸馏层两部分提取长序列输入的健壮的远程依赖性;解码器通过掩蔽多头probsparse自注意力层和多头注意力层进行生成式预测,直接输出多步预测矩阵,避免传播过程可能存在的累计误差问题,提高对故障预测的速度。

75、3、本发明公开的一种大规模低轨卫星网络拥塞感知和故障预测方法,基于差值概率分布的故障检测间隔计算方式,依据预测的断路起始值和实际断路起始值的差异,计算基于差值概率分布的故障检测间隔,在确保断路检测精度的同时降低检测报文的开销。

76、4、本发明公开的一种大规模低轨卫星网络拥塞感知和故障预测方法,在每一次预测到断路后,根据步骤三设置的参数分别对节点拥塞和链路故障两种情况进行评估。对多种参数进行更新,将链路状态数据加入到原始链路状态序列经过数据预处理后输入informer模型训练并预测下一次断路。通过对故障检测参数的动态更新和预测到检测再到预测的循环,在降低检测开销的同时不断提升卫星节点拥塞感知和故障预测的精度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1