确定在处理器中应保持活跃的执行核数量的装置及方法
【专利说明】确定在处理器中应保持活跃的执行核数量的装置及方法发明领域
[0001]发明领域主要涉及计算系统,更具体而言,涉及确定在处理器中应保持活跃的执行核数量的装置及方法。
[0002]置量
[0003]图1示出了示例性多核处理器100的架构。如图1中所见,处理器包括:1)多个处理核101_1至101_N ;2)互连网络102 ;3)末级缓存系统103 ;4)存储控制器104以及I/O中枢105。每个处理核包含一个或多个用以执行程序代码指令的指令执行流水线。互连网络102用于将核101_1至101_N中的每一个互连至彼此以及其他元件103、104、105。末级缓存系统103在指令和/或数据被放至系统存储器106之前用作处理器中的最后一层缓存。
[0004]存储器控制器104从/至系统存储器106读/写数据和指令。I/O中枢105管理处理器和“10”设备(如非易失性存储设备和/或网络接口)之间的通信。端口 107源自于互连网络102以连接多个处理器,使得具有超过N核的系统可以被实现。图形处理器108执行图形计算。功率管理电路109管理着处理器整体上(“封装级”)的性能和功率状态,以及处理器中独立单元(例如独立核101_1至101_N、图形处理器108等)的性能和功率状态的各方面。为方便起见,其他具有意义的功能模块,例如锁相环(PLL)电路,在图1中未被绘出。
[0005]随着计算机系统的功耗开始受到关注,大多现今的系统包括精巧的功率管理功能。一种常见的构架是同时定义“性能”状态和“功率”状态。进入和/或离开这些状态中的任何一个,可由,例如,功率管理电路109来进行控制。逻辑模块的性能对应着其在设定时间周期内的工作能力。也就是说,逻辑模块的性能状态越高,在设定时间周期内其所做的工作就越多。这里,对于一个逻辑模块的固定配置,决定逻辑模块性能的主要因素是其工作的频率。具体而言,应用于逻辑模块的时钟频率越高,其性能就越高。通常,为了在更高频率下正常工作,逻辑模块的供电电压也需要被提高。时钟速度和供电电压水平两者可在运行时(runtime)期间,例如由功率管理电路109进行调节。
[0006]另一个可以影响逻辑模块性能的因素是其可工作的内部单元中有多少被启用(enabled)。例如,一种典型的图形处理器108具有多个内部执行核120_1至120_Z,其中的每一个都被设计为实际执行代表计算机显示器上所呈现图像的图形程序代码的片段(shippets)。通常,图形处理器108被设计成支持对应于不同数量的被启用执行核的不同工作配置。例如,第一种配置可将所有执行核120_1至120_Z启用,而另一种配置可仅将一半的核启用。启用核的数量也影响了处理器工作的能力,并且因此也影响其性能。因此,图形处理器实际的“性能”是启用核数量和应用于核的时钟信号频率的复杂混合。
[0007]不幸的是,逻辑模块的功耗随其频率和性能而增加这一事实更加重了复杂度。
【附图说明】
[0008]本发明是以示例而非限制附图图形的方式进行说明,其中相同的参考指代类似的元素,而其中:
[0009]图1示出了一种处理器的实施例;
[0010]图2示出了对于一种图形处理器配置的作为频率的函数的功耗;
[0011]图3a示出了对于一对图形处理器配置的作为频率的函数的功耗;
[0012]图3b示出了对于一对图形处理器配置的作为功耗的函数的性能;
[0013]图4示出了对于M种不同图形处理器配置的作为频率的函数的功耗;
[0014]图5不出了一种功率管理方法。
[0015]详细说曰月
[0016]智能功率管理的目的在于,对于单位频率增量,以较少量的功率增加得到更多量的性能增长。就处理器而言,例如具有多个执行核的图形处理器,根据被启用的执行核的数量,该处理器基本表现出不同的性能/频率对(vs.)功率的曲线。也就是说,例如,具有第一种数量的启用执行核的图形处理器相比具有不同数量的启用核的同一个处理器会表现出不同的性能和功率曲线。
[0017]因此有见地的功率管理会试图将图形处理器的性能和功率曲线定义为其启用核的函数,并且,选择将被启用核的数量,该数量相比具有其他启用核数量的可选配置,会得到对于单位频率增量以较少量功率增加得到更多量的性能增长的图形处理器。
[0018]图2示出了一种图形处理器的功率对频率曲线200。图2中的曲线200对于任何启用执行核的数量是通用的。也就是说,具有特定数量启用核的任何配置应该有一个功率对频率的折衷,其表现出如图2中所见曲线200的大体形状。
[0019]处理器中的“性能”可假定随频率而缩放。这样,纵坐标也可被视作处理器的性能。曲线200由较低频率中的线性区201和较高频率中的非线性区202来表征。
[0020]线性区201中的动态功耗可被近似为:
[0021]Dyn_Pwr = CV2f 式 I
[0022]其中:1)C为处理器中的总开关电容,包括启用核的开关电容;2)V为加在图形处理器上的供电电压;以及,3)f为工作频率。在一种实施例中,至少在线性区201的较低的频率区域,供电电压不需要随递增的频率而增加。因此项V2在式I中作为常数。C也表现得像一个常数。因此,假设图形处理器的活跃等级保持为常数,式I基本对应于动态功率,表现出与频率f的线性关系。
[0023]在非线性区202中,供电电压V需要随增加的频率而增加,以支持合适的电路操作。因此,V2项表现得并不像是常数,这进而使得式I表现得更像是一个非线性的多项式。并且,更高频率所需的更高供电电压使得“泄露功率”开始产生明显的影响。在功率对频率曲线200的非线性区202中,该泄露功率导致更为非线性的行为。
[0024]回想一下,所希望的是工作在对于单位频率增量具有更高性能增益和更少功率增量的区域中,需要注意的是,线性区201相比非线性区202能更好地满足该条件。对现象的考查在开始处(in onset) 203被描绘,其比较了曲线在相同频率增量206_1和206_2下(即,频率增量206_1等于频率增量206_2),两个区域201、202功耗增量204、205的变化。非线性区202中的功耗增量205比线性区201中的功耗增量204更大。对于两个频率增量206_1、206_2将处理器性能增量近似估算是相同的,很明显,对于相同的性能增量,线性区201比非线性区202产生更少的功耗增量。这对应着更理想的工作区域。
[0025]图3a示出了两个不同图形处理器配置的一对曲线300_1及300_2。也就是说,每一条曲线对于特定数量的启用执行核来表示处理器的行为,其中,每一条曲线对应着不同的启用执行核的数量。曲线300_1对应着更少启用核的数量(例如,一半核被启用)而曲线300_2对应着更多的启用核数量,(例如,所有核被启用)。
[0026]对比两条曲线300_1、300_2,注意,对于相同的功耗水平,采用更多数量核的配置300_2比采用较少数量核的配置300_1具有更低的频率。这直接源于这样的事实,即采用更多核的配置具有更大的使用电路表面积,因此相比采用更少数量核的配置,可以在更慢的速度下做与有更少数量核的配置相同数量的工作。
[0027]这里,尽管可以说相对性能沿着任意特定曲线随频率而缩放,并不像图2中的分析那样,两条曲线300_1、300_2之间的处理器性能顺着横坐标(功耗)比顺着纵坐标(频率)更好地被观察。也就是说,两条曲线300_1、300_2之间的处理器性能可被视为在相同的功耗水平下(特别是当两条曲线在各自曲线中相同的线性或非线性区时)比在相同的频率水平下更有可比性。值得注意的是,使用更多执行核的曲线300_2比使用较少执行核的曲线300_1在更高的功耗/性能下保持在线性区。这与一观念相一致,即为了完成相同数量的工作,更多执行核不必与较少执行核工作得同样快。
[0028]回想一下,所希望的是保持处理器工作在线性区而不是非线性区,并且,认识到具有更多启用执行核的处理器配置会在更高的性能水平进入非线性区,因此,这也就是为什么对于任何特定的性能水平,智能功率管理方案会基于该准则决定合适的执行核的数量的原因。也就是说,智能功率管理方案会试图将线性区映射到处理器被设计要支持的每一个性能状态。针对性能状态被选择的线性区决定了对于该性能状态要被启用的执行核的数量。
[0029