流量的预测方法及装置与流程

文档序号:25089821发布日期:2021-05-18 21:48阅读:165来源:国知局
流量的预测方法及装置与流程

1.本说明书涉及通信技术领域,尤其涉及流量的预测方法及装置。


背景技术:

2.近年来,随着科技的发展,在日常工作生活中,人们开始追求智能化便捷化,网络链路承载的流量越来越大,当流量超过或达到企业在运营商处开通网络业务时开通的带宽时,就会造成网络拥堵或丢包,影响用户工作效率和使用体验。企业需要根据用户数和业务量的增加,对网络带宽使用率进行预测,当带宽使用率达到或接近100%时,升级更大的带宽,实现对网络容量的提前规划。
3.通过对过去一年或更长时间用户链路带宽使用率的分析处理,预测出用户接下来一季度或半年的带宽使用率,如果带宽使用率达到阈值就提示用户进行及时的扩容。这样可以做到对链路容量的智能化管理,避免了链路拥塞或过载,一方面可以为企业节省成本,另一方面极大的提升了用户的使用体验。
4.现有的方案的流量预测方法中对流量的预测通常需要大量的数据进行流量预测,处理速度慢。


技术实现要素:

5.为克服相关技术中存在的问题,本说明书提供了流量的预测方法及装置。
6.根据本说明书实施例的第一方面,提供一种流量的预测方法,所述方法包括:
7.对待检测链路的带宽利用率进行统计;
8.确定待检测链路处于预设的不同统计区间内的带宽利用率,所述统计区间是按照不同的利用率进行划分的;
9.获取待检测链路的带宽利用率在目标统计区间内的总时长,所述目标统计区间为带宽利用率超过预设阈值的统计区间;
10.获取待检测链路在多个统计周期内在目标统计区间的总时长的时间序列;
11.将所述时间序列输入至预设的流量预测模型中,对未来预设时长内待检测链路的带宽利用率在目标统计区间内总时长进行预测。
12.可选的,流量预测模型为差分整合移动平均自回归模型arima。
13.可选的,所述方法还包括:
14.对预测的在目标统计区间内总时长超过预设时长,则针对待检测链路生成告警信息,所述告警信息用于提示对该超过预设时长的链路进行扩容。
15.可选的,所述预测的在目标统计区间内总时长超过预设时长,则针对待检测链路生成告警信息包括:
16.若预测的在目标统计区间内的总时长大于一个统计周期内的统计总时长的60%,则生成告警信息。
17.可选的,在对待检测链路的带宽利用率进行统计之前,所述方法还包括:
18.若待检测链路为多个,则对带宽利用率小于等于预设的第一阈值的待检测链路进行剔除,以进行剔除操作后的待检测链路更新待检测链路;
19.对带宽利用率中的异常点进行剔除;
20.对待检测链路中缺失的数据进行补全。
21.根据本说明书实施例的第二方面,提供一种流量预测装置,所述装置包括:
22.统计模块,用于对待检测链路的带宽利用率进行统计;
23.确定模块,用于确定待检测链路处于预设的不同统计区间内的带宽利用率,所述统计区间是按照不同的利用率进行划分的;
24.获取模块,用于获取待检测链路的带宽利用率在目标统计区间内的总时长,所述目标统计区间为带宽利用率超过预设阈值的统计区间;
25.所述获取模块还用于获取待检测链路在多个统计周期内在目标统计区间的总时长的时间序列;
26.预测模块,用于将所述时间序列输入至预设的流量预测模型中,对未来预设时长内待检测链路的带宽利用率在目标统计区间内总时长进行预测。
27.可选的,所述预测模块采用的流量预测模型为差分整合移动平均自回归模型arima。
28.可选的,所述装置还包括:告警模块,用于在对预测的在目标统计区间内总时长超过预设时长,则针对待检测链路生成告警信息,所述告警信息用于提示对该超过预设时长的链路进行扩容。
29.可选的,所述告警模块具体用于当预测的在目标统计区间内的总时长大于一个统计周期内的统计总时长的60%,则生成告警信息。
30.可选的,所述装置,还包括:
31.数据清洗模块用于若待检测链路为多个,则对带宽利用率小于等于预设的第一阈值的待检测链路进行剔除,以进行剔除操作后的待检测链路更新待检测链路;
32.异常值处理模块,用于对带宽利用率中的异常点进行剔除;
33.数据补全模块,用于对待检测链路中缺失的数据进行补全。
34.本说明书的实施例提供的技术方案可以包括以下有益效果:该方法对待检测链路带宽利用率落入带宽利用率较高的目标统计区间内的总时长进行统计,无需像现有技术一样,针对待检测链路采集的全部的带宽利用率均输入至流量预测模型中,因此,减少了流量预测模型的计算量,后续可以更好的实现对带宽容量的规划,智能化的对链路网络带宽进行检测和管理。
35.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
附图说明
36.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。
37.图1是本说明书根据一示例性实施例示出的一种流量预测方法的流程图。
38.图2是本说明书根据一示例性实施例示出的一种流量预测方法的应用场景图。
39.图3是本说明书实施例又一示例性实施例示出的一种流量预测方法的流程图。
40.图4是本说明书根据一示例性实施例示出的一种流量预测装置的框图。
41.图5是本说明书根据另一示例性实施例示出的一种流量预测装置的框图。
42.图6本说明书根据一示例性实施例示出的另一种网络管理服务器的结构示意图。
具体实施方式
43.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
44.在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
45.应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
46.实施例一
47.接下来对本说明书实施例进行详细说明。
48.如图1所示,图1是本说明书根据一示例性实施例示出的一种流量预测方法的流程图,该流量预测方法可以应用于如图2所示的网络管理服务器,网络管理服务器可以通过简单网络管理协议(simplenetwork management protocol,简称snmp)按照预设的采集周期采集多台交换机中的每台交换机的多条链路的数据流量,采集周期可以为每间隔一分钟采集一次。具体的,本实施例提供的流量预测方法包括以下步骤:
49.步骤102、对待检测链路的带宽利用率进行统计。
50.其中待检测链路可以根据管理员指定的拓扑结构确定,也可以根据管理员指定。
51.网络管理软件可以按照预设采集周期对带宽利用率进行采集,例如,预设采集周期可以是一分钟。带宽利用率又可以包括上行带宽利用率和下行带宽利用率。上行可以为用户设备发往internet网络一侧的方向,下行为internet网络方向发往用户设备的方向;当然,上行和下行还可以依据其他的规则进行定义,本实施例中的上行和下行方向用于表征相反的两个方向。
52.进一步的,在将带宽利用率采集好之后,可以存储于数据库中,便于对带宽利用率进行统计。
53.针对其中的一个待检测链路采集的带宽利用率在数据库中存储的数据格式可以如表1所示:
54.表1
[0055][0056][0057]
步骤104、确定待检测链路处于预设的不同统计区间内的带宽利用率,所述统计区间是按照不同的带宽利用率进行划分的。
[0058]
其中,本实施例中的统计区间包括:
[0059]
range1[0,30%]、range2(30%,60%]、range3(60%,80%]、range4(80%,100%]。
[0060]
当然,统计区间的粒度可以根据实际需求划分的更加细致或者更加宽泛。
[0061]
例如,也可以将区间划分为[0,20%]、(20%,40%]、(40%,60%]、(60%,80%]、(80%,100%]。
[0062]
步骤106、获取待检测链路的带宽利用率在目标统计区间内的总时长,所述目标统计区间为带宽利用率超过预设阈值的统计区间。
[0063]
由于,带宽利用率超过80%会影响用户的上网体验,因此在对后续的带宽利用率进行预测时,可以只对带宽利用率超过80%的区间的总时长进行预测。即对落入range4中的带宽利用率的总时长进行预测。
[0064]
为了描述方便,本实施例中将带宽利用率超过80%的统计区间定义为目标统计区间。
[0065]
本实施例中以网络管理服务器的采集周期为1分钟为例进行说明,那么,对于待检测链路在一天中将会产生大概1440个数据。待检测链路的带宽利用率落入相应的统计区间,则该统计区间对应的时长统计加1分钟。
[0066]
举例来说,针对链路标识为1f6fd13b

e9fe

4a3c

b33b

abd4035bc8ae的待检测链路,在某一个采集周期到来时,采集到的带宽利用率为59%,则对于range2(30%,60%]的统计时长加1,在下一个采集周期到来时,采集到的带宽利用率为48%,则对于range2(30%,60%]的统计时长再加1。由此可以获取该待检测链路在每一天中带宽利用率在不同的统计区间内的总时长。
[0067]
应当理解的是,如果采集周期为5分钟,即每5分钟采集一次待检测链路的带宽利用率,如果某一个采集周期到来时,采集到的带宽利用率为89%,则range2(30%,60%]的统计时长加5,在下一个采集周期到来时,采集到的带宽利用率为70%,则对于range2(30%,60%]的统计时长再加5。
[0068]
可以将上述统计结果存储至数据库。
[0069]
步骤108、获取待检测链路的带宽利用率在多个统计周期内在目标统计区间的总时长的时间序列。
[0070]
其中,时间序列中包括多个序列元素组成;其中,统计周期即为相邻的两个序列元素之间时间的差值。
[0071]
具体的,以表2中的示例为例,对于待检测链路1f6fd13b

e9fe

4a3c

b33b

abd4035bc8ae在目标统计区间即range4的区间内的总时长为140,以统计周期为1天为例,那么下一统计周期到来时,统计到待检测链路1f6fd13b

e9fe

4a3c

b33b

abd4035bc8ae在目标统计区间即range4的区间内的总时长为100。采用相同的方式,即可以得到待检测链路的由60个统计周期(即60天)内在目标统计区间range4内的总时长构成的时间序列,具体的可以如表3所示,表3示出了一种待检测链路的时间序列的示意。
[0072]
表2
[0073]
link_id统计时间range1range2range3range41f6fd13b

e9fe

4a3c

b33b

abd4035bc8ae2018/5/15504503001401f6fd13b

e9fe

4a3c

b33b

abd4035bc8ae2018/5/2650350340100
[0074]
表3
[0075][0076][0077]
步骤110、将时间序列输入至预设的流量预测模型中,对未来预设时长内待检测链路的带宽利用率在目标统计区间内总时长进行预测。
[0078]
进一步的,将上述时间序列例如表3所示的时间序列输入至预设的流量预测算法中。
[0079]
流量预测算法可以采用线性回归模型、差分整合移动平均自回归模型arima(autoregressive integrated moving average mode)、时间序列分解法(time

series decomposition)、机器学习模型、深度学习模型等。对于预设的预测算法本实施例并不加以限定。
[0080]
本实施例以arima模型为例进行说明。arima是自回归差分移动平均模型,是目前最常用的拟合时间序列的模型。
[0081]
arima(p,d,q)主要的参数为p、d、q,其中,d表示使时间序列平稳需要做的差分次数。
[0082]
其中,对于平稳条件的选取可以选择不同的方式确定,例如选择自动方位搜寻器adf(automatic direction finder,缩写为adf),kpss(k wiatkowski,plillips,schmidt and shin等人提出的检验方法)等。
[0083]
举例来说,针对待检测链路1f6fd13b

e9fe

4a3c

b33b

abd4035bc8ae利用待检测链路在多个统计周期内目标统计区间内的总时长减去前一天该待检测链路在目标统计区间的总时长,即可得到第一阶差值序列如下:
[0084]
link_idday2

day1day3

day2
……
.day60

day591f6fd13b

e9fe

4a3c

b33b

abd4035bc8ae4030
……
30
[0085]
如果用上述第一阶差值序列的后一个元素值减去前一个元素值,则可以得到第二阶差值序列,依照上述方式,直至使得差值序列满足平稳条件,该满足平稳条件的序列对应的阶数,即为上述的差分次数d。
[0086]
如果时间序列不经过差分运算即满足平稳条件,那么差分次数d=0,当d=0时,arima模型退化成arma(p,q)模型;其中,arma(p,q)模型由ar(p)模型和ma(q)模型组合而成;p是ar(p)模型的阶数;q是ma(q)模型的阶数。
[0087]
具体的,p可以通过偏自相关函数(partial autocorrelation function,简称pacf)确定,q可以通过自相关函数(autocorrelation function,简称acf)确定。可以理解,p和q也可以通过其他方式确定,例如,p和q均可以通过最小化信息量准则(akaike informationcriterion,简称aic)确定,p和q也可以通过贝叶斯信息准则(bayesianinformationcriterion,简称bic)确定。参数p和q的具体确定方式不应该理解为是对本申请的限制。
[0088]
由此可以对未来预设时长内待检测链路的带宽利用率在目标统计区间内的总时长进行预测。
[0089]
其中,上述预设时长由统计周期的数量,也即历史数据的长度确定,例如历史数据只有60天的,可以预测接下来一周的带宽利用率;如果历史数据有2年的,可以预测接下来两个月内待检测链路的带宽利用率。arima模型可以进行多步预测,具体实现是通过把预测得到的结果当做训练数据,即把预测得到的结果继续作为输入至arima模型的时间序列的元素实现的。比如由60天历史数据,预测出第61天,再把第61天的预测数据当做历史数据进行第62天数据的预测,由此可以依次预测出接下来7天的数据。
[0090]
本公开实施例所提供的方法中,步骤102~步骤108实际上提供了一种预处理的算法,该方法对待检测链路带宽利用率落入带宽利用率较高的目标统计区间内的总时长进行统计,无需像现有技术一样,针对待检测链路采集的全部的带宽利用率均输入至流量预测模型中,因此,减少了流量预测模型的计算量,后续可以更好的实现对带宽容量的规划,智能化的对链路网络带宽进行检测和管理。
[0091]
实施例二
[0092]
在上述实施例的基础上,如果针对待检测链路预测的在目标统计区间内的总时长超过预设时长,则针对待检测链路生成告警信息,所述告警信息用于提示对该超过预设时长的链路进行扩容。
[0093]
在一种具体的实施方式中,如果预测的在目标统计区间内的总时长大于一个统计周期内的统计总时长的60%,则生成告警信息。
[0094]
实施例一中以一个统计周期为1天为例,其中一个统计周期包括1440分钟,那么当预测的时长超过1440的60%,则可以认为该待检测链路的带宽利用率过高,也就是需要进行扩容,因此,此时可以生成告警信息,提示针对该链路进行扩容。
[0095]
另外,图3提供了一种流量预测方法的流程示意图,如图3所示,对于采集到各个链路的带宽利用率的值都存储于数据库中,可以从数据库中将带宽利用率的数据提取出来,在执行本公开实施例一的方法之前,对于采集到的各个链路的带宽利用率的数据可以进行数据清洗、异常值处理、以及数据补全等。
[0096]
具体的,数据清洗指的是对于一些带宽利用率较低,带宽利用率小于等于第一预设阈值的待检测链路进行剔除,例如对很长一段时间的带宽利用率都为零的链路进行剔除,不使用该链路对应的带宽利用率进行带宽利用率的预测。以进行剔除操作后的待检测链路更新待检测链路,即步骤102中的待检测链路为进行数据清洗后的链路。
[0097]
进一步的,异常值处理指的是,对于计算、采集异常等导致的带宽利用率的异常值。对于异常值的剔除,可以采用三倍标准差算法进行找出。在剔除之后,可以进行平滑处理,即利用该异常值的前一采集周期和后一采集周期的数据的均值进行替代。
[0098]
数据补全,指的是对待检测链路中缺失的数据进行补全。举例来说,可能有连续几天的带宽利用率的数据丢失,为了保证数据的完备性,可以对数据进行补全,具体的补全方法可以采用均值法、中位数法、递增法、预测法等。
[0099]
实施例三
[0100]
在上述实施例一和实施例二的基础上,本实施例还提供一种流量预测装置,图4提供了一种流量预测装置的框图,如图4所示,该装置包括:
[0101]
统计模块401,用于对待检测链路的带宽利用率进行统计;
[0102]
确定模块402,用于确定待检测链路处于预设的不同统计区间内的带宽利用率,所述统计区间是按照不同的利用率进行划分的;
[0103]
获取模块403,用于获取待检测链路的带宽利用率在目标统计区间内的总时长,所述目标统计区间为带宽利用率超过预设阈值的统计区间;
[0104]
所述获取模块403还用于获取待检测链路在多个统计周期内在目标统计区间的总时长的时间序列;
[0105]
预测模块404,用于将所述时间序列输入至预设的流量预测模型中,对未来预设时长内待检测链路的带宽利用率在目标统计区间内总时长进行预测。
[0106]
本实施例提供的装置用于执行上述实施例一或二中的方法,具体的执行细节可以参照实施例或者实施例二,本实施例不再详细赘述。
[0107]
本实施例提供的装置中,对待检测链路带宽利用率落入带宽利用率较高的目标统计区间内的总时长进行统计,无需像现有技术一样,针对待检测链路采集的全部的带宽利用率均输入至流量预测模型中,因此,减少了流量预测模型的计算量,后续可以更好的实现对带宽容量的规划,智能化的对链路网络带宽进行检测和管理。
[0108]
在上述装置的实施例的基础上,在一种可选的实施方式中,所述预测模块404采用的流量预测模型为差分整合移动平均自回归模型arima。
[0109]
在另一种可选的实施方式中,图5是本说明书根据一示例性实施例示出的另一种装置的框图,在前述图4所示实施例的基础上,所述装置还包括:告警模块405,用于在对预测的在目标统计区间内总时长超过预设时长,则针对待检测链路生成告警信息,所述告警信息用于提示对该超过预设时长的链路进行扩容。
[0110]
可选的,所述告警模块405具体用于当预测的在目标统计区间内的总时长大于一
个统计周期内的统计总时长的60%,则生成告警信息。
[0111]
可选的,该装置还可以包括:
[0112]
数据清洗模块406用于若待检测链路为多个,则对带宽利用率小于等于预设的第一阈值的待检测链路进行剔除,以进行剔除操作后的待检测链路更新待检测链路;
[0113]
异常值处理模块407,用于对带宽利用率中的异常点进行剔除;
[0114]
数据补全模块408,用于对待检测链路中缺失的数据进行补全。
[0115]
如图6所示,图6是本说明书根据一示例性实施例示出的另一种装置的框图,
[0116]
本公开还提供一种服务器60,图6为本公开另一实施例提供的服务器的结构示意图,如图6所示,该服务器60包括处理器601和存储器602,所述存储器602用于存储程序指令,所述处理器601用于调用所述存储器中的存储的程序指令,当所述处理器601执行所述存储器602存储的程序指令时,用于执行上述实施例一或二中网络管理服务器所执行的方法。
[0117]
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0118]
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
[0119]
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的可读存储介质包括:u盘、移动硬盘、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0120]
应当理解的是,本说明书并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本说明书的范围仅由所附的权利要求来限制。
[0121]
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1