基于线性相关性及分段性装箱理论的虚拟机资源整合方法

文档序号:9471226阅读:733来源:国知局
基于线性相关性及分段性装箱理论的虚拟机资源整合方法
【技术领域】
[0001] 本发明属于云计算技术领域,更为具体地讲,涉及一种基于线性相关性及分段性 装箱理论的虚拟机资源整合方法。
【背景技术】
[0002] 虚拟机资源整合算法是数据中心虚拟资源管理软件的核心策略。这类虚拟机资源 整合算法可以通过检测运行虚拟机中未使用的资源,重新将这些碎片资源回收到虚拟资源 池加入整合利用,从而达到资源节约的目的。因此,虚拟机资源整合的效率在很大的程度上 决定了数据中心的运行效率。
[0003] 通常,根据虚拟机资源利用率采样序列的不同,可以将对虚拟机某项资源的整合 算法分为静态整合和动态整合两类。静态资源整合算法使用一个静态的数值,即一个定值 来表征虚拟机在整个算法运行时间段内的资源利用率。根据系统对资源利用率和QoS性能 的不同要求,这个数值可以分别使用虚拟机资源利用均值,峰值或在假设资源利用率分布 服从正太分布的情况下使用y+2S表征。而动态资源整合算法要求以一定的时间均匀间 隔预测生成虚拟机在未来算法运行时间段内的资源利用率序列。因此,动态资源整合算法 的资源利用率是一个动态变化的随机序列。
[0004] 但是这现有的两类算法都具有明显的固有缺陷:静态整合类算法因为使用固定值 表征资源利用率,虽然这有利用于减小算法进行全局优化时的复杂度,但无法对资源利用 率峰谷时段的碎片资源进行有效利用。而动态整合类算法主要利用线性相关性分析等技术 手段搜寻系统内资源利用率峰谷互补性最好的虚拟机进行配对整合,使用这种类型的算法 进行的整合可以取得良好的局部资源互补效果。但动态整合类算法的整合过程只受线性相 关系数约束而缺乏对全局优化能力的约束和控制能力,在算法的后段可能会因为相关系数 的过大和整合中的整数线性规划问题提前中止算法的运行,因此资源整合效率的提升同样 有限。

【发明内容】

[0005] 本发明的目的在于克服现有技术的不足,提供一种基于线性相关性及分段性装箱 理论的虚拟机资源整合方法,通过分段式迭代线性相关性整合算法SICC能够提高虚拟机 的资源整合效率。
[0006] 为实现上述发明目的,本发明一种基于线性相关性及分段性装箱理论的虚拟机资 源整合方法,其特征在于,包括以下步骤:
[0007] (1)、生成各初始状态虚拟机(VM)在未来指定时间段的资源利用率时间序列
[0008] (I. 1)、定义一个标准VM所具有资源量,将其计为c;
[0009] 收集各VM在过去指定时间段内t次采样的历史原始资源使用量乂,k= 1,2,…,M,M表示系统中VM的总台数,t= 1,2, 一,IN表示过去指定时间段内采样的总次 数;
[0010] (I. 2)、计算各g占标准VM资源量C的百分率,并标记为VM历史状态原始资源利 用率;
[0011] (1.3)、利用步骤(I. 1)中各VM的历史原始资源使用量式构成采样序列《,再检 测序列C平稳性,并完成拟合模型选定和定阶;
[0012] (1. 4)、根据所得模型,采用1步递推预测法生成各VM未来指定时间段的资源利用 率时间序列灵;
[0013] (2)、求得各VM之间的相关系数矩阵Matrixecieff
[0014] (2. 1)、使用皮尔逊相关系数公式计算任意¥1^与VM,之间的相关系数ri,, i,je[1,M];
[0016] 其中,客.和名'分别代表VMjPIVM』的N位资源利用率序列,敵)和wcw?(S:)分 另IJ代表VMjPVM郝N位资源利用率序列的均值;
[0017] (2. 2)、利用步骤(2. 1)中的公式求得M(M-I)/2台VM的有效相关系数值&j,再组 成一个MXM阶相关系数矩阵Matrixccieff;
[0019](3)、定义一个动态整合算法ICMa
[0020] (3. 1)、每次从步骤(2. 2)描述的相关系数矩阵中寻找出一个不大于a的最小值, 标记为r_;
[0021] (3. 2)、将步骤(3. 1)选出的最小值4"对应的初始状态虚拟机VM种VM郝N个 资源利用率采样点进行合并配对测试;
[0023] 其中,将VM1对应的资源利用率时间序列记为5,,1中历史状态原始资源利用率 最大值记为Peak1,将VM,对应的资源利用率时间序列记为瓦s 1;中历史状态原始资源利 用率最大值记为Peakj;
[0024] (3. 3)、判断Peak值
[0025]如果步骤(3. 2)中Peak值不大于100%,则令a=-〇? 5,且将步骤(3. 2)中选出 的VMjPVM,组合配对,结果简化为如下的关系:
[0027]S卩:¥1^与VMj经动态算法整合成动态整合虚拟机DCVM,且DCVM的资源利用率序列 为定值的常数序列,并进入步骤(3.4);
[0028] 如果步骤(3. 2)中Peak值小于或等于100 %,,则将该种配对对应的Flj值改设为 无穷大,并再次返回步骤(3.1);
[0029] (3. 4)、从步骤(2.2)中描述的相关系数矩阵Matrixraeff中删除初始状态虚拟机 VM^VMj对应的数据项,并使用新生成的DCVM的数据与相关系数矩阵Matrixe°eff中除VM丄 和VMj以外的剩余虚拟机,重新生成新的相关系数矩阵;
[0030](3. 5)、重复步骤(3. 1)至(3. 4),直至满足退出条件:r_> -0? 5或M< 2 ;
[0031](4)、利用SICC算法进行虚拟机资源整合
[0032](4. 1)、将各VM的历史状态原始资源利用率求均值mean,再按照均值mean将所有 的VM分为三组,即:
[0033]
[0034] (4.2)、将三组VM按照步骤(3)所述的方式分别运行ICMAa算法,,将整合后的三 组DCVM集中在一起后按照步骤(3)所述的方式再次运行ICMa算法;
[0035] (4.3)、将步骤(4.2)运行后得到的DCVM按照(3.3)中所述的规则,设定静态资源 参数后运行降序首次适应算法(FirstFitDecreasing,FFD)进行静态阶段的整合,得到最 终整合状态的CVM;
[0036](4. 4)、将(4. 3)所得的最终状态CVM装填入物理服务器。
[0037] 本发明的发明目的是这样实现的:
[0038] 本发明基于线性相关性及分段性装箱理论的虚拟机资源整合方法,包括动态整合 和静态整合两个阶段,同时综合了两类算法的优点。第一阶段利用改进的动态整合算法对 系统内的初始状态虚拟机(VM)进行整合,尽可能地降低整合后虚拟机(CVM)的资源利用率 峰值-均值差。当系统内虚拟机资源利用率平均峰值-均值差低于一个特定预设的阈值 时,可以认为系统内任意CVM的资源利用率序列不再是动态的随机序列,而是一个常数值 序列。因此,在进行第二阶段静态合并过程前,使用各CVM的峰值资源利用率数值作为静态 参数运行静态算法的行为并不会造成新的附加资源浪费。本发明的第二阶段静态整合部分 选用降序首次适应(FirstFitDecreasing,FFD)算法。降序首次适应算法是当前综合性 能最优的离线Bin-Packing算法,能为本发明的整合过程提供足够的全局资源优化能力。 本发明综合以上两个阶段的算法优点,在整合过成中同时具有较强局部和全局优化能力, 能提供明显优于现有单一类别整合算法的整合能力。
【附图说明】
[0039] 图1是本发明一种基于线性相关性及分段性Bin-Packing理论的虚拟机资源整合 工具的流程图;
[0040] 图2是关于阈值a取值与生成DCVM平均峰值-均值差的关系研究;
[0041] 图3是SICC第一阶段动态整合完成后DCVM数量与初始状态VM数量对比;
[0042] 图4是SICC第二阶段完成后各DCVM峰值资源利用率与未进行改进的纯ICM动 态整合算法生成的峰值资源利用率PRU的对比;
[0043] 图5是100次SICC实验和纯ICMA实验对比。
【具体实施方式】
[0044] 下面结合附图对本发明的【具体实施方式】进行描述,以便本领域的技术人员更好地 理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许 会淡化本发明的主要内容时,这些描述在这里将被忽略。
[0045] 实施例
[0046] 为了方便描述,先对【具体实施方式】中出现的相关专业术语进行说明:
[0047] VM(VirtualMachine):虚拟机;
[0048] CVM(ConsolidatedVirtualMachine):已整合虚拟机;
[0049] DCVM(DynamicConsolidatedVirtualMachine):基于动态算法的已整合虚拟 机;
[0050] SICC(SegmentationIterationCorrelationConsolidation):分段式迭代线性 相关性整合算法;
[0051] ICMAQterativeCorrelationMatchAlgorithm):迭代相关配对算法。
[0052] 图1是本发明一种基于线性相关性及分段性装箱理论的虚拟机资源整合方法的 流程图。
[0053] 在本实施例中,如图1所示,本发明一种基于线性相关性及分段性装箱理论的虚 拟机资源整合方法,主要包括两大部分:动态虚拟机整合过程和静态虚拟机整合过程。
[0054] 下面针对两个阶段进行详细说明,具体如下:
[0055] Sl、虚拟机动态整合阶段
[0056] SI. 1、获取系统内虚拟机的有效历史资源利用率信息
[0057] 定义一个标准VM所具有资源量,将其计为c;
[0058] 收集各VM在过去指定时间段内t次采样的历史原始资源使用量p\,k= 1,2,…,M,M表示系统中VM的总台数,t= 1,2, 一,IN表示过去指定时间段内采样的总次 数;
[0059] 计算各M占标准VM资源量c的百分率,并标记为VM历史状态原始资源利用率;
[0060] SI. 2、检测序列平稳性并完成拟合模型识别、定阶和未来资源利用率序列生成
[0061] 利用步骤SI. 1中各VM中剩余的历史原始资源使用量g构成采样序列乾,并用自 相关函数法判定采样序列€是否平稳。并根据自相关函数和偏自相关函数的截尾性和拖 尾性判断采样序列C的拟合模型。在本实施例中,拟合模型可以根据情况选择自回归模型AR,滑动平均模型MA,以及自回归滑动平均模型ARM中的一种。选定模型后使用AIC法进 行定阶,进行各VM的未来指定时间段的资源利用率时间序列灵。因为预测误差与预测步数 有关,因此模型采用1步递推预测法进行序列预测。
[0062] SI. 3、求得各VM之间的相关系数矩阵Mecieff
[0063] 使用皮尔逊相关系数公式计算任意¥1^与VM;之间的相关系数rVi,jG[1,M];
[0065]其中,安和巧分别代表VMjPVM』的N位资源利用率序列,(交)和獅?(无)分 另IJ代表VMjPVM郝N位资源利用率序列的均值;
[0066] 再利用上述公式,求得M(M-I)/2台VM的有效相关系数值Flj
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1