一种低功耗的片上网络任务映射方法
【专利摘要】本发明公开了一种低功耗的片上网络任务映射方法,包括如下步骤:S10:建立片上网络拓扑模型;S11:建立多任务模型;S12:确定约束条件;S13:建立映射集合;S14:进行任务与片上网络之间的映射。本发明一种低功耗的片上网络任务映射方法针对片上网络中多任务建立模型,分析多任务之间的关系,然后将任务在通信延迟和能耗的双重约束下进行映射,从而提高映射效率,降低映射功耗。
【专利说明】一种低功耗的片上网络任务映射方法
【技术领域】
[0001]本发明属于片上网络【技术领域】,涉及一种低功耗的片上网络任务映射方法。
【背景技术】
[0002]随着通用处理器的主频突破4GHz,人们发现单一提升主频的做法已经不能再有效地提高性能,反而却带来了功耗的急剧上涨,高频率的道路逐渐走到了尽头。于是对于计算机处理器的研究开始转向多处理核心的方向。早期的对称多处理器(SMP)多是采用在同一计算机上汇集一组CPU的方式,它们之间共享内存子系统以及总线结构。之后,由于纳米级制造工艺的引入,SMP开始转变为单芯片多处理器(Chip Multiprocessor, CMP),即在同一芯片上集成多个处理核心,形成了现在我们所说的多核处理器。处理器本身的结构关系到整个芯片的面积、功耗和性能。如何继承和发展传统处理器的成果直接影响到多核处理器的性能和实现周期。
[0003]多核处理器的各处理核执行的程序之间有时需要进行数据共享与同步,因此其硬件结构必须支持核间通信。高效的通信机制是多核处理器高性能的重要保障。目前片上高效通信机制通常有两种:基于共享总线的cache结构,基于片上网络的互连结构。基于共享总线的cache结构是指每个处理核拥有共享的二级或三级cache,用于保存比较常用的数据,并通过总线进行通信。这种系统的优点是结构简单,通信速度快;缺点是可扩展性差。
[0004]共享总线显然无法满足大规模系统的需要。把互连网络用于片上系统设计,解决片上组件之间的通讯问题,这就是片上网络。片上网络(-NetworkOn Chip, NoC)技术以其支持同时访问、可靠性高、可重用性高等特点被认为是更加理想的大规模CMP互连技术,其克服了总线结构可扩展性差的缺点,为10亿晶体管时代提供了一种可行的片上系统通讯机制。
[0005]在片上网络中,如何将任务映射到片上网络的处理器核上是非常重要的问题。一方面需要满足任务之间的通信延迟的约束;另一方面,由于片上网络中通信能耗较高,需要尽可能的降低通信能耗。现有的映射方法往往采用复杂的方法来进行映射,需要耗费大量的时间来进行映射过程的计算,这在某种程度上也增加了能耗。
【发明内容】
[0006]为解决上述问题,本发明的目的在于提供一种低功耗的片上网络任务映射方法。
[0007]为实现上述目的,本发明的技术方案为:
[0008]一种低功耗的片上网络任务映射方法,包括如下步骤:
[0009]SlO:建立片上网络拓扑模型;
[0010]Sll:建立多任务模型;
[0011]S12:确定约束条件;
[0012]S13:建立映射集合;
[0013]S14:进行任务与片上网络之间的映射。[0014]进一步地,步骤S14中,对任务集合T,按照任务的f值进行降序排序,如果两个或两个以上任务的f值相同,则按照任务的W值进行排序。
[0015]进一步地,步骤S14中,对处理器核集合C,按照处理器核的h值对处理器核进行降序排序。
[0016]进一步地 ,步骤S14中,从任务集合中取出第一个任务TC’,将其映射到所有处理器核中具有最大h值的处理器核。
[0017]相较于现有技术,本发明一种低功耗的片上网络任务映射方法针对片上网络中多任务建立模型,分析多任务之间的关系,然后将任务在通信延迟和能耗的双重约束下进行映射,从而提高映射效率,降低映射功耗。
【专利附图】
【附图说明】
[0018]图1是本发明的方法流程图示。
[0019]图2为本发明一实施例具有9个处理器核的片上网络的示意图。
[0020]图3为本发明一实施例对于6个任务的多任务模型通信关系图。
[0021]【具体实施方式】
[0022]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0023]如图1所示,本发明一种低功耗的片上网络任务映射方法包括如下步骤:
[0024]SlO:建立片上网络拓扑模型
[0025]对于片上网络,用N(C,P)表示,其中C是处理器核Cn的集合,P是通路Pij的集合;其中,Pij表示从处理器核Ci到处理器核Cj的一条通路。而S= I Ci —CjI表示从处理器核Ci到处理器核Cj所经过的片上网络路由器的数量;Ebit表示Ibit数据在两个相邻处理器核之间进行传输时的平均能耗表示Ibit数据在片上网络路由器上经过时的平均能耗;Lbit表示Ibit数据在两个相邻处理器核之间进行传输时的平均延迟表示Ibit数据在片上网络路由器上经过时的平均延迟;h(Ci)表示处理器核Ci在所有方向直接连接的处理器核的数量;C(Cj)表示与处理器核Ci具有直接连接的处理器核的集合。
[0026]则从处理器核Ci到处理器核Cj的能耗Eij为:
[0027]Ε^.= (8+1)*ΕΗ?+8*Εr(I)
[0028]从处理器核Ci到处理器核Cj的延迟Lij为:
[0029]^(s+D^+s*^(2)
[0030]Sll:建立多任务模型
[0031]对于多个任务建立多任务模型,用U(T,Q)表示,其中T是任务Tm的集合;Q是qmn的集合,qmn表示任务^和Tn之间存在着通信关系;而1^(1_)表示任务Tm和Tn之间的通信延迟要求;fm表示与任务Tm存在通信关系的其他任务的数量;wu表示任务Tm和Tn之间的通信带宽;T(Tm)表示所有与任务Tm具有通信关系的任务的集合;W(Tm)表示任务Tm总的通信带宽。
[0032]S12:确定约束条件
[0033]对T中任务Tm和Tn,分别映射到片上网络的处理器核Ci和Cj,满足通信延迟的约束条件为:
[0034]Lij ^ L(qJ(3)
[0035]所有任 务都映射到片上网络后,所有已被映射的处理器核之间通信能耗为:
[0036]E= Σ Wij^Eij(4)
[0037]则要使映射后的处理器核之间的通信能耗最小,即要使E最小;
[0038]S13:建立映射集合
[0039]为将要进行的映射,建立映射集合G,此时G中为空,为初始状态;
[0040]S14:进行任务与片上网络之间的映射
[0041]S140:对任务集合T,按照任务的f值进行降序排序,如果两个或两个以上任务的f值相同,则按照任务的W值进行排序;排序后新的任务集合为T’,T与T’之间的对应关系为 Map(T —T,);
[0042]S141:对处理器核集合C,按照处理器核的h值对处理器核进行降序排序;排序后新的任务集合为C’,C与C’之间的对应关系为Map (CT—C ’ );
[0043]S142:从T’中取出第一个任务IV,将其映射到所有处理器核中具有最大的h值的处理器核Cx’上,并将OV,Cx’ )加入到G中;
[0044]S143:从T’中取出第一个未被映射的任务Tn/,对于T (Tn/ )中已被映射的任务所在的处理器核,计算将Tm’映射到这些处理器核中未被映射的直接连接的处理器核上的所有E值,去掉按照公式(3)不满足延迟的约束条件的E值;如果有两个或者两个以上相同的E值,则取min(E)为处理器核编号最小的处理器核Cmin’的E值,使用min(E)表示所有E值中最小的E值;计算将Tm’映射到Cmin’上后,计算Cmin’和与其通信的处理器核的延迟,如果满足延迟的约束条件,进行映射,将(Tm’,Cmin’)加入到G中;如果不满足延迟的约束条件,贝1J在去掉当前的min (E)的所有E值当中重新找到新的min (E);直到找到满足延迟的约束条件的Cmin’,进行映射,将(Tm’,Cmin’ )加入到G中;如果T (Tm’ )中不存在已被映射的任务,则从C’中选择第一个未被映射的处理器核Ck’进行映射,将(Tm’,Ck’ )加入到G中;
[0045]S144:重复步骤S143,直到所有的任务均被映射到片上网络上;
[0046]S145:根据对应关系Map (T —— T’)和Map (C —— C’)将G中所有的映射对应到C和T上。
[0047]在本发明中,直接为片上网络和多任务建立模型,以更为简约的方式来进行映射,降低了映射方法的复杂性,提高了映射的速度;而通过任务之间的关系,来进行任务在片上网络中的映射,使得任务之间的通信延迟大大减少,从而有效的降低了片上网络的能耗。本发明适用于面向片上网络的任务映射,以片上网络的延迟为约束条件,将低功耗作为任务映射时的重要参数,既满足了片上网络对通信延迟的要求,又兼顾了通信时的功耗,从而在保证通信效率的情况下,降低了片上网络的功耗。
[0048]具体地,步骤SlO中,以具有9个处理器核的片上网络为例进行说明。对于具有9个处理器核的片上网络,可表示为N(C,P),其中处理器核集合C中为=Ctl, C1, C2, C3, C4, C5,C6, C7, C8 ;而P如图2所示,处理器核之间可以通过连线进行通信。所有的S如下表所示:
[0049]
【权利要求】
1.一种低功耗的片上网络任务映射方法,其特征在于,包括如下步骤: 510:建立片上网络拓扑模型; 511:建立多任务模型; 512:确定约束条件; 513:建立映射集合; 514:进行任务与片上网络之间的映射。
2.如权利要求1所述低功耗的片上网络任务映射方法,其特征在于,步骤S14中,对任务集合T,按照任务的f值进行降序排序,如果两个或两个以上任务的f值相同,则按照任务的W值进行排序。
3.如权利要求1所述低功耗的片上网络任务映射方法,其特征在于,步骤S14中,对处理器核集合C,按照处理器核的h值对处理器核进行降序排序。
4.如权利要求3所述低功耗的片上网络任务映射方法,其特征在于,步骤S14中,从任务集合中取出第一个任务T0’,将其映射到所有处理器核中具有最大h值的处理器核。
【文档编号】G06F15/163GK103678245SQ201310710421
【公开日】2014年3月26日 申请日期:2013年12月20日 优先权日:2013年12月20日
【发明者】胡威, 邹代坤, 郭宏, 黎文飞, 张凯, 江若成, 李伟强, 谭练, 张若凡, 徐景 申请人:武汉科技大学