本发明涉及云计算数据中心能效评估
技术领域:
,特别是对不同体系结构的云数据中心的多指标融合的能效定性评估方法。
背景技术:
:随着互联网的发展,全球数据总量持续增长,云数据中心的负荷也日益增加,由于物质条件的限制,云数据中心的能耗也越来越令人担忧。在全球倡导可持续发展的大背景下,有必要对云数据中心的能效进行评估,以更好地对云数据中心进行改进。在为人们提供更好的绿色服务的同时,又能够实现可持续发展。在目前的数据中心能效评估方面,已经有了相当多的能效评估指标。然而,这些指标有的仅仅关注云数据中心能效的某一个层面,有的指标则因无法精确测量而无法得到可进行评估的数据。此外,不同体系结构的云数据中心,由于内部结构的多样化,缺少一个统一的标准,不能对各种结构的数据中心体系形成一个统一的规范的定性评价的标准。简而言之,单个能效指标难以评估数据中心的真实情况,多个指标又可能会导致指标之间互相矛盾的评估结果。基于这些限制条件,目前的评估技术及评估标准无法客观地体现云数据中心的能效情况。通常,数据中心的能效指标之间互相关联又互相影响,存在着一种非线性的关系。不同的指标从不同的角度反映数据中心的能效情况,但部分指标之间也存在一定的相关性,如pue(数据中心电力使用效率)和ppue(数据中心局部电力使用效率)之间的正相关关系,pue和dcie(数据中心基础架构效率)之间的反比关系。主成分分析法能够把原来多个数据中心能效指标化为少数几个互不相关的综合指标,既能够反映数据中心能效指标体系的绝大部分信息又能够缩小待评估的指标集合,减轻后续步骤的计算复杂程度。rbf神经网络是一种不同于bp神经网络的人工神经网络,它没有反向传播的学习过程,因此,它的权值确定过程相对而言更快。rbf神经网络也是一种传统的神经网络模型,具有三层网络结构,即输入层,隐藏层和输出层所组成。它利用激活函数对输入层数据做了一个非线性的改变,利用权值将隐藏层和输出层之间连接起来。通过调整权值使得输出值与期望值一致,就可以得到一个初步的能效评估模型。这样一个完整的过程称之为rbf网络模型的训练过程,从而得到一个初步的能效评估模型。传统的数据中心能效评估通常只采用一个单一的指标(pue),前人所建立的能效指标体系中,指标数量少,且不具有代表性,并且缺乏可信的评估标准。云数据中心的结构越来越多样化,规模更是多达数十万台,已经不再适用于今天的数据中心。需要利用多个指标及更具有代表性的方式来综合评估数据中心的能效情况。为此,我们建立了一套新的能效指标体系,提出了一种多指标融合的能效定性评估技术。技术实现要素:本发明的目的在于克服已有的能效评估技术单一化的问题,或是多个指标导致的矛盾冲突的评估结果,提出了一种多指标融合的能效定性评估技术,结合专家知识选取参与能效定性评估的指标,对指标进行统一的标准化处理,然后通过径向基神经网络模型来得到评估值,根据评估值得到相应的分数。该分数能够较为直观得反映出数据中心的能效情况。步骤1、综合考虑数据中心的多场景、多层次、多粒度能效相关的关键特征,从现有的能效指标中选取一部分具有代表性且容易测量的能效指标,指标数量为p。1)所选取的指标需随着数据中心的状态改变而改变2)指标需以优化数据中心的性能为导向3)指标是可以测量的。若不可以测量,则至少可以准确估计4)指标的测量不可过分消耗资源5)指标需要独立于硬件设备6)指标需具有其独特性7)指标的测量尺度与粒度需满足实际评价需求8)指标需具有鲁棒性,不可以被轻易欺骗9)指标的测量不能影响正常的业务10)指标可以有效衡量跨云数据中心的性能步骤2、对步骤1中的指标数据进行标准化处理。数据的标准化采用常规的处理方法:min-max标准化方法。min-max标准化方法是对原始数据进行线性变换,设minx和maxx分别为数据中心能效指标x对应数值的最小值和最大值,将能效指标x的一个原始值x通过min-max标准化映射成在区间[0,1]中的值x’,其公式为:x’=(x-minx)/(maxx-minx)步骤3、对步骤2中标准化处理过的数据中心能效指标运用主成分分析法做进一步地处理。主成分分析法提取数据中心能效指标主要包括以下步骤:1)原始数据中心能效指标数据的标准化,对步骤2中处理过的数据采用z-score方法处理。采集n组p维的能效指标数据,构造成n组的p维随机变量数据。对于任意一个样本xi有p个特征(x1,x2,x3,……xp),对样本中的每一个数据做中心化处理得到(x′1,x′2,x′3,......xp′);z-score方法的公式为a)x表示指标的观测值,这里代表某个数据中心能效指标的某一个观测数据值;b)μ表示某一特征的总体数据的均值,这里代表某个数据中心指标样本数据的均值;c)δ表示某一特征的总体数据的标准差,这里代表某个数据中心指标样本数据的标准差,必须与μ中的总体是在同一个量级中进行计算的,即与μ是同一指标的同一个样本数据;2)设n组p维数据的协方差矩阵为r;这里,cov(x,y)=e(xy)-e(x)e(y)3)解样本相关矩阵r的特征方程|r-λx|=0,得到p个特征根及相应的特征向量;4)计算累积方差贡献率(λi为特征根);5)由步骤4)中计算的累积方差贡献率(一般取85%以上)确定主成分的个数(q),并求出主成分表达式。那么我们将得到下面几个能效特征。每一个yi是一个主成分,可以看作是新的特征。y1=a11x11+a12x12+a13x13+….+a1px1py2=a21x21+a22x22+a23x23+….+a2px2py3=a31x31+a32x32+a33x33+….+a3px3p……yq=aq1xq1+aq2xq2+aq3xq3+….+aqpxqp步骤4、利用rbf神经网络确定各能效指标的权重,其特征在于所述的网络建立还需要以下几个步骤:1)确定rbf神经网络各层节点数,输入层对应的是能效指标体系中经过降维的指标数目,输出层代表最终的评估结果,仅仅需要一个节点;2)选择合适的隐含层激活函数;3)所建立的指标体系各指标映于rbf神经网络的输入层,作为输入层的输入数据;4)利用激活函数对输入层数据做非线性处理,负责将指标体系中的多个指标进行融合;5)神经网络通过调整确定隐含层到输出层的权重,至此,完成了rbf神经网络的建立。步骤5、根据步骤4得到的结果建立多指标融合的能效评估模型。综上所述,本方法的优点在于:1)将多个能效指标进行融合评估数据中心的能效,弥补了单个指标评估不全面的缺点,同时又避免了不同指标同时评估可能出现的互相矛盾的评估结果。2)通过主成分分析对指标进行降维,能够在指标收集全面的同时保证评估结果的可靠性,同时使数据中心能效指标的评估问题得到简化。3)运用rbf神经网络建立评估模型,能够较好得处理指标之间的非线性关系和相互关联性,具有较好的适应性。附图说明图1是本发明多指标融合的能效定性评估方法流程图;图2是本发明采用的rbf神经网络流程图;图3是本发明的rbf神经网络模型结构图。具体实施方式如图1所示,本发明技术方案的具体步骤为:步骤1、基于云数据中心能效指标的选取标准,从中选取12个能效指标,构建如图2所示的评价指标体系。选取的12个指标如表1所示。表1能效指标评价体系代号能效指标简写能效指标具体名称x1cpe计算功率效率x2dcce数据中心计算效率x3dcep数据中心能源生产力x4dcie数据中心基础架构效率x5dcld数据中心照明密度x6dcpe数据中心性能效率x7itueit设备电力使用效率x8pde功率密度效率x9pue数据中心电力使用效率x10sce服务器计算效率x11tue数据中心总电力的使用效率x12ppue数据中心局部电力使用效率步骤2、根据步骤1中选取的能效指标,对各项指标进行标准化。设minx和maxx分别为指标x的最小值和最大值,利用公式:x’=(x-minx)/(maxx-minx),对能效指标进行数据处理,将指标的原始数据集中的每一个xi通过min-max标准化映射成在区间[0,1]中新的x′i值。步骤3、对步骤2中处理后的能效指标数据运用主成分分析方法进行降维处理。该方法降维主要包括下面几个步骤:1)原始能效指标数据的标准化。对步骤2中处理过的数据先采用z-score方法进行处理。采集n组p维的能效指标数据,构造成n组的p维随机变量数据。采集n组p维的能效指标数据(本发明中p可以确定为12),构造成n组的p维随机变量数据。对于任意一个样本xi有p个特征(x1,x2,x3,……xp),对数据中心能效指标样本中的每一个数据进行中心化((能效指标数据中心化的处理方法为)处理后得到(x′1,x′2,x′3,......xp′);z-score方法的公式为a)x表示指标的观测值,这里代表某个数据中心能效指标的某一个观测数据值;b)μ表示某一特征的总体数据的均值,这里代表某个数据中心指标样本数据的均值;c)δ表示某一特征的总体数据的标准差,这里代表某个数据中心指标样本数据的标准差,必须与μ中的总体是在同一个量级中进行计算的,即与μ是同一指标的同一个样本数据;2)设n组p维数据的协方差矩阵为r;注:cov(x,y)=e(xy)-e(x)e(y)3)解出样本相关矩阵r的特征方程|r-λx1=0,得到p个特征根及相应的特征向量;4)计算累积方差贡献率(λi为特征根);5)由累积方差贡献率确定主成分的个数(q),并求出主成分表达式。在本发明中,我们设定累积方差贡献率为95%,提取达到该贡献率的主成分,那么我们将得到下面几个特征。每一个yi是一个主成分,可以看作是新的特征。y1=a11x11+a12x12+a13x13+….+a1px1py2=a21x21+a22x22+a23x23+….+a2px2py3=a31x31+a32x32+a33x33+….+a3px3p……yq=aq1xq1+aq2xq2+aq3xq3+….+aqpxqp步骤4、将处理过的数据样本输入到rbf神经网络中进行训练,调整参数不断优化以得到理想的能效评估模型。1)根据步骤3的处理结果,将所选能效指标的个数设置为rbf网络中输入层节点的个数。数据中心能效指标体系经主成分分析处理后降维为q个特征,因此神经网络输入层网络节点个数可设置为q。2)确定了输入节点个数后为能效指标设定相应的指标权重,将各能效指标的信息传递到隐藏层。确定rbf神经网络的激励函数为高斯函数,如公式(1)所示。隐藏层的节点由高斯核函数构成,不需要确定具体的个数。i=1,2,...n,xi是每一维数据中心能效指标的具体观测值;ci是第i个基函数的中心,每一维数据中心的能效指标都对应着一个ci,它是与能效指标个数相同维数的向量;σi是第i个感知的变量,同时该参数是可以自由选择的,它决定的是该基函数围绕中心点的宽度;3)输入层(经主成分分析处理后的能效指标数据样本)到隐藏层之间实现从xi到ri(x)的非线性映射后,得到的值作为隐藏层的输出实现隐藏层(ri(x))到输出层(yi)的线性映射。如公式(2)所示。其中,p是输出节点数。wik是每一个ri(x)对应的权重。最终得到的yi即为当前评估的数据中心最终的得分。当前第1页1 2 3