一种基于云计算环境的节约带宽资源租赁成本的方法与流程

文档序号:11842566阅读:388来源:国知局
一种基于云计算环境的节约带宽资源租赁成本的方法与流程
本发明涉及计算机的
技术领域
,特别是涉及一种基于云计算环境的节约带宽资源租赁成本的方法。
背景技术
:传统的互联网应用不仅需要完成软件开发工作,还需要进行购买服务器或租赁服务器、部署运行环境、寻找托管环境、维护服务器和应用、均衡用户负载、解决性能瓶颈和服务器扩展等诸多繁琐复杂的工作。云计算技术能够解决这些繁复的后续工作,减轻开发者的负担,故而成为现今部署和运行网络应用的一个重要平台选择。通常,互联网应用开发者租用这些云计算公司提供的虚拟机,在虚拟机上运行其开发的软件。在租赁虚拟机时需要租户提供所需要的资源大小,比如CPU个数、存储空间、带宽的大小以及其他诸如负载均衡、数据库等增值服务。租户需要按照所租赁资源的个数以及时间长短来付费。目前,国外的亚马逊的AWS、国内的阿里云、青云提供的虚拟机服务等都是按照类似的策略计费。在人们使用互联网应用的过程中,当网络流量巨大而带宽资源不足时,服务请求的延迟和丢包率会相应增加,严重影响用户体验。因此开发者尽可能租赁更多的带宽来保证服务质量。但是,人们使用互联网应用产生的流量多少是动态多变的。当流量很少所需的带宽资源也少时,租赁太多的资源显然使得资源利用率很低,造成不必要的成本开支。因此,预估未来带宽资源需求并进行适时调整,是一种节约带宽资源租赁成本的思路。技术实现要素:鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于云计算环境的节约带宽资源租赁成本的方法,通过使用ARIMA模型来预测下一时刻的流量的期望值,进而确定下次所要租赁的带宽值,从而减少带宽资源租赁的成本,同时保证服务质量不受影响。为实现上述目的及其他相关目的,本发明提供一种基于云计算环境的节约带宽资源租赁成本的方法,包括以下步骤:步骤S1、获取历史的流量数据;步骤S2、根据所述历史的流量数据预测下一时刻流量的均值和标准差;步骤S3、根据下一时刻流量的均值和标准差,确定下次所要租赁的带宽值。根据上述的基于云计算环境的节约带宽资源租赁成本的方法,其中:所述步骤S1中,每 隔一定的时间间隔,统计流量的均值,生成流量的时间序列,以获取历史的流量数据。根据上述的基于云计算环境的节约带宽资源租赁成本的方法,其中:所述步骤S2包括以下步骤:21)判断流量的时间序列是否为平稳序列,若是,转入23);若否,转入22);22)对流量的时间序列做若干次差分处理,使之成为平稳序列;23)进行ARIMA(r,d,m)模型的参数估计,其中AR表示自回归,r表示自回归项数,MA表示滑动平均,m表示滑动平均项数,d表示使时间序列成为平稳序列所作的差分阶数;24)构建ARIMA(r,d,m)模型;25)根据ARIMA(r,d,m)模型,预测下一时刻流量的均值和标准差。进一步地,根据上述的基于云计算环境的节约带宽资源租赁成本的方法,其中:ARIMA模型表示为:▿dXt=φ(B)▿dXt+Zt+θ(B)Zt]]>其中,Xt表示要分析的时间序列,φ(B)和θ(B)分别表示AR(r)模型中的r次多项式和MA(m)模型中的m次多项式,B表示后向移位算子,Zt表示服从均值为0,方差为的高斯分布,表示进行d次差分处理。进一步地,根据上述的基于云计算环境的节约带宽资源租赁成本的方法,其中:ARIMA(r,d,m)的阶数m和r从的自相关函数和偏自相关函数图形中观察拖尾和截尾的特征来确定。进一步地,根据上述的基于云计算环境的节约带宽资源租赁成本的方法,其中:步骤23)中,选取使AIC函数取值最小时所对应的r和m。进一步地,根据上述的基于云计算环境的节约带宽资源租赁成本的方法,其中:ARIMA模型支持单步预测和k步预测;所述k步预测是通过递归使用单步预测实现的。根据上述的基于云计算环境的节约带宽资源租赁成本的方法,其中:所述步骤S3中,采用μ+θσ数值作为下次所要租赁的带宽值;其中,θ为可选参数,μ和σ分别为下一时刻流量的均值和标准差。进一步地,根据上述的基于云计算环境的节约带宽资源租赁成本的方法,其中:θ=2。如上所述,本发明的基于云计算环境的节约带宽资源租赁成本的方法,具有以下有益效果:(1)有效提高了资源利用率;(2)降低了带宽资源租赁成本;(3)保证一定的服务质量指数。附图说明图1显示为本发明的基于云计算环境的节约带宽资源租赁成本的方法的流程图;图2显示为本发明的基于云计算环境的节约带宽资源租赁成本的仿真结果示意图。具体实施方式以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。在本发明的本发明的基于云计算环境的节约带宽资源租赁成本的方法中,按需调整带宽租赁大小的关键问题是如何预估未来时刻流量带宽的需求,以及如何根据预测值在保证服务质量的同时,确定下一段时间内该该租用多大的带宽。参照图1,本发明的基于云计算环境的节约带宽资源租赁成本的方法包括以下步骤:步骤S1、获取历史的流量数据。具体地,通过在虚拟机中使用Ganglia、nProbe等流量分析程序统计带宽资源使用情况,生成流量的时间序列。优选地,可每隔一定的时间间隔,统计流量的均值,并写入文件系统进行记录。步骤S2、使用ARIMA模型,根据历史的流量数据预测下一时刻流量的均值和标准差。具体地,本发明使用时间序列分析技术实现未来时刻流量需求的预测。长相关性、短相关性、大时间尺度下的自相似性以及小时间尺度下的多重分形性是网络流量重要的统计特征。差分整合移动平均自回归模型(AutoregressiveIntegratedMovingAverageModel,ARIMA)能够提供较好的数学模型,在对流量建立合理的模型之后可进行未来时刻流量需求的预测。ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。具体地,步骤S2包括以下步骤:21)判断流量的时间序列是否为平稳序列,若是,转入23);若否,转入22)。22)对流量的时间序列若干次差分处理,使之成为平稳序列。在ARIMA(r,d,m)模型中,AR表示自回归,r表示自回归项数,MA表示滑动平均,m表示滑动平均项数,d表示使时间序列成为平稳序列所作的差分阶数。ARIMA模型适用于平稳的时间序列,对于非平稳的随机过程,则要通过多次差分直到序列达到平稳,而差分的次数为参数d的取值。具体地,设定其中,Xt表示要分析的时间序列,Yt表示Xt经过d次差分后的序列。当d=1时,Yt=Xt-Xt-1当d=2时,Yt=(Xt-Xt-1)-(Xt-1-Xt-2)以此类推,即可获得Xt经过任意次差分后的序列。23)进行ARIMA(r,d,m)模型的参数估计。ARIMA模型可以表示为:▿dXt=φ(B)▿dXt+Zt+θ(B)Zt]]>其中,φ(B)和θ(B)分别表示AR(r)模型中的r次多项式和MA(m)模型中的m次多项式,B表示后向移位算子,即BjXt=Xt-j。Zt为服从均值为0,方差为的高斯分布,即表示进行d次差分处理。具体地,需要确定ARIMA(r,d,m)模型的阶数,然后对模型的各个参数进行估计,即确定φ(B)、θ(B)等多项式的系数。ARIMA(r,d,m)的阶数m和r可以从的自相关函数(ACF)和偏自相关函数(PACF)图形中观察拖尾和截尾的特征来确定。具体地,流量的时间序列经过平稳化处理后,ARIMA(r,d,m)模型的选择与自相关函数和偏自相关函数性质关系如表1所示。表1、ARIMA(r,d,m)模型选择与ACF/PACF关系ACF拖尾m阶截尾拖尾PACFr阶截尾拖尾拖尾选择模型AR(r)MA(m)ARMA(r,m)其中,自回归AR(r)模型可表示为:Xt=Σi=1rφi×iXt-i+Zt=φ(B)Xt+Zt,]]>其中φ(B)表示r次多项式,B表示后向移位算子。滑动平均MA(m)模型表示为:其中θ(B)表示m次多项式。ARMA(r,m)是d为0时的ARIMA(r,d,m)模型。对于计算机定阶,一般采用AIC、BIC准则定阶,也就是排列组合所有可能的r和m,通过AIC函数得到的值越小,那么说明那一组r和m最好,故选取对应的r和m。在上述模型识别的基础上,进行参数估计,通过样本矩估计法、极大似然法等确定模型中的各未知系数:▿dXt=φ(B)▿dXt+Zt+θ(B)Zt,]]>其中至此,完成了ARIMA模型中的参数估计。24)构建ARIMA(r,d,m)模型。25)根据ARIMA(r,d,m)模型,预测下一时刻流量的均值μ和标准差σ。具体地,建立了ARIMA模型之后,可以预测未来一个时间序列点的流量数学期望。ARIMA模型支持单步预测,也支持k步预测。k步预测是通过递归使用单步预测实现的。其中,预测值会包括下一时刻流量均值μ和标准差σ。步骤S3、根据下一时刻流量的均值和标准差,确定下次所要租赁的带宽值。具体地,采用μ+θσ数值作为下次所要租赁的带宽值。其中,θ为可选参数。根据不同互联网应用对服务质量的不同要求,选取不同的θ取值。以统计中常见的3σ原则为例,当θ=2时,可以保证实际带宽以95.44%的概率不超过预留带宽,落在置信区间[μ-2σ,μ+2σ]中。因此,优选地,可以将此区间的上界μ+2σ作为带宽预留值,即θ=2。下面根据具体实验来测试本发明的基于云计算环境的节约带宽资源租赁成本的方法的技术效果。具体地,采用欧洲某大学监测到的Dropbox应用流量公开数据进行模拟仿真。该公开数据包含了从4个监测点监测到的2012年3月24日至2012年5月5日期间的Dropbox应用相关网络流量日志。该数据经过匿名化处理保护用户的隐私。原始数据是由Tsat开源工具截取的与Dropbox应用相关的所有TCP数据包相关信息。由于该流量日志数据比较小,故将2012年3月24日至2012年5月5日之间所有监测数据归并为一天的流量数据用于实验,每10分钟统计一次平均流量,生成流量的时间序列,采用ARIMA(0,1,1)模型预测网络流,如图2所示。由图2可知,只有1.19%的预留值小于真实值;预留值比真实值平均多了30%。预留值能够随着实际值进行波动,若采用固定的带宽预留方式,那么至少应预留80Mbps才不会显著影响应用的服务质量。由上可知,根据蓝线申请带宽资源,相对于固定80Mpbs的方式,有效提高了资源利用率,降低了资源租赁成本。综上所述,本发明的基于云计算环境的节约带宽资源租赁成本的方法在保证一定的服务质量指数的前提下,有效提高了资源利用率,降低了带宽资源租赁成本。所以,本发明有效 克服了现有技术中的种种缺点而具高度产业利用价值。上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属
技术领域
中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1