基于模糊决策的gpu负载综合评判方法

文档序号:6620420阅读:322来源:国知局
基于模糊决策的gpu负载综合评判方法
【专利摘要】本发明实施例提供了一种基于模糊决策的GPU的负载评价方法,涉及计算机【技术领域】,可以正确对GPU的负载进行评价。所述方法包括:针对一个GPU来说,获得n时刻所述GPU的负载向量,然后计算获得n时刻评价负载用的评价负载向量L,综合所述评价负载向量L中的元素utilization,memory,pstates,以及occupancy进行模糊评判,获得模糊判决矩阵R;根据用户给出的诸因素权重分配为:W=(w1,w2,w3,w4)以及模糊判决矩阵计算获得综合评价A,对所述综合评价A进行归一化处理获得A′,根据最大隶属度原则获得所述GPU的负载情况。
【专利说明】基于模糊决策的GPU负载综合评判方法

【技术领域】
[0001 ] 本发明涉及计算机【技术领域】,尤其涉及一种基于模糊决策的GPU (Graphic Processing Unit,图形处理器)的负载评价方法。

【背景技术】
[0002] Ifepler GK110 (专为英伟达Tesla产品打造 CUDA计算架构)由71亿个晶体管组 成,可以提供超过每秒1万亿次双精度浮点计算的吞吐量,Kepler架构在电源效率方面,t匕 Fermi的性能/功率比提高了 3倍。完整Ifepler GK110实施包括15 SMX单元和六个64位 内存控制器。拥有192个单精度CUDA (Compute Unified Device Architecture,统一计算设 备架构)核,64个双精度单元。
[0003] C-RAN(新型无线接入网架构)白皮书指出传统的无线接入网面临的挑战有大量 基站导致高额能耗、潮汐效应导致基站利用率低下。把GPU作为资源池,进行基带处理,刚 好解决了这个问题。基带处理就要求GPU可以任务级别的并行处理每个用户的需求。
[0004] GPU虽然提供了非常强大的数据级并行计算能力,不过对于任务级别的并行有比 较大的限制。最新的kepler架构支持同时并发32个核函数。因此为了满足多任务的需求 就需要在一个主机上装备多块GPU。对于多GPU系统需要解决GPU之间的负载均衡,才能达 到最佳性能,因此正确评价某一个GPU的负载信息至关重要。


【发明内容】

[0005] 本发明的实施例提供一种基于模糊决策的GPU的负载评价方法,可以正确地对 的负载进行评价。
[0006] 为达到上述目的,本发明的实施例采用如下技术方案:
[0007] -种基于模糊决策的GPU的负载评价方法,包括:
[0008] 针对一个GPU来说,获得η时刻所述GPU的负载向量。
[0009] 所述GPU的负载向量表示如下:
[0010] Ln =< utilization, memory, pstates, occupancy >
[0011] 其中,utilization :过去一个样本时间内所述GPU运行一个或者多个核函数 的时间占总时间的百分比;memory :所述GPU已用全局内存占总的全局内存的百分比; pstates :艮P performance state 白勺 16 个等级,p0 (maximum performance) -pl5 (minimum performance) ;occupancy :即 achieved occupancy :所述 GPU 的每个 sm 中有多个 warp 调 度器,每个调度器有一个硬件性能计数器,用来计数每个时钟周期活跃warp数,每个调度 器计数结果之和除以sm活跃的总周期数,就可以得到这个sm的活跃warp数,除以sm理 论最大warp数就是kernel执行期间这个sm的occupancy,所有sm的平均值就是整体的 occupancy ;
[0012] 获得η时刻评价负载用的评价负载向量L,所述L满足以下公式:
[0013] L = 70% XLn+30% XL^ ;
[0014] 综合所述评价负载向量L中的元素 utilization, memory, pstates,以及 occupancy进行模糊评判,获得模糊判决矩阵:R = (ι^)4Χ3 ;
[0015] 根据用户给出的诸因素权重分配为:W = (W1,W2,W3,W4)以及模糊判决矩阵计算获 得综合评价A,所述A满足以下公式:
[0016] A = W · R = {al, a2, a3);
[0017] 对所述综合评价A进行归一化处理获得A',所述A'满足以下公式:
[0018] A' = (aysA/s^/s);其中,

【权利要求】
1. 一种基于模糊决策的图形处理器GPU负载评价方法,其特征在于,包括: 针对一个GPU来说,获得η时刻所述GPU的负载向量; 所述GPU的负载向量表示如下: Ln = < utilization, memory, pstates, occupancy > 其中,utilization :过去一个样本时间内所述GPU运行一个或者多个核函数的时间占 总时间的百分比;memory :所述GPU已用全局内存占总的全局内存的百分比;pstates :即 performance state 的 16 个等级,pO (maximum performance)-pl5 (minimum performance); occupancy :即整体achieved occupancy :所述GPU的每个sm中有多个warp调度器,每个 调度器有一个硬件性能计数器,用来计数每个时钟周期活跃warp数,每个调度器计数结果 之和除以sm活跃的总周期数,就可以得到这个sm的活跃warp数,除以sm理论最大warp 数就是kernel执行期间这个sm的occupancy,所有sm的平均值就是整体的occupancy ; 获得η时刻评价负载用的评价负载向量L,所述L满足以下公式: L = 70% XLn+30% XLn_!; 综合所述评价负载向量L中的元素 utilization,memory,pstates,以及occupancy进 行模糊评判,获得模糊判决矩阵:R = 0^_)4Χ3 ; 根据用户给出的诸因素权重分配为:W= (Wl,w2,w3,W4)以及模糊判决矩阵计算获得综 合评价A,所述A满足以下公式: A = W · R = (a17 a2, a3); 对所述综合评价A进行归一化处理获得A',所述A'满足以下公式: A' = (ai/^aj/sds/s);其中,
根据最大隶属度原则获得所述GPU的负载情况。
2. 根据权利要求1所述的方法,其特征在于,所述综合所述评价负载向量L中的元素 utilization, memory, pstates,以及occupancy进行模糊评判,获得模糊判决矩阵:R = (rij) 4X3,包括: utilization对轻载的隶属函数为:
utilization对适中的隶属函数为:
utilization对重载的隶属函数为:
memory对轻载的隶属函数为:
memory对适中的隶属函数为: M2 (memory) = sin ( n memory) (0 ^ memory ^ 1) memory对重载的隶属函数为:
,pstates对轻载,适中,重载的隶属函数可在下述表1中查找:
表1 occupancy对轻载的隶属函数为:
occupancy对适中的隶属函数为:
occupancy对重载的隶属函数为:
根据以上函数构造模糊判决矩阵R如下所示:
矩阵中R的L、M、H为查找表1获得的pstates的轻载、适中、重载函数。
【文档编号】G06F19/00GK104123452SQ201410341239
【公开日】2014年10月29日 申请日期:2014年7月18日 优先权日:2014年7月18日
【发明者】杨刚, 张策, 周兴社, 杜三盛 申请人:西北工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1