电路和方法与流程

文档序号:31711456发布日期:2022-10-04 19:17阅读:104来源:国知局
电路和方法与流程
电路和方法


背景技术:

1.本公开涉及电路和方法。
2.数据处理电路可以被实施为所谓的执行单元集群。由执行处理指令的执行单元中的一个生成的输出可以被提供为输入操作数,以支持由执行单元或其中另一个执行单元执行处理指令。


技术实现要素:

3.在一个示例性布置中,提供了一种电路,该电路包括:
4.两个或更多个执行单元集群,每个集群包括一个或多个执行单元以执行处理指令;和
5.调度器电路,所述调度器电路用于保持处理指令的一个或多个队列,所述调度器电路包括挑选器电路以选择排队处理指令,从而发布至所述执行单元集群中的一个集群中的执行单元以用于执行;
6.其中:
7.所述调度器电路被配置为保持与每个排队处理指令相关联的依赖数据并且禁止发布所述排队处理指令直到所述排队处理指令的所有所需源操作数可用,并且被配置为响应到所述调度器电路的所述给定操作数作为源操作数以用于执行排队处理指令的可用性的指示,排队处理指令的所述依赖数据指示被要求在所述排队处理指令的执行中可用的任何源操作数;并且
8.所述调度器电路响应给定排队处理指令的一个或多个最后等待的源操作数的可用性的指示,以禁止由所述调度器电路将所述给定排队处理指令发布至除了包括生成至少一个最后等待的源操作数的执行单元的执行单元集群之外的执行单元集群中的执行单元。
9.在另一个示例性布置中,提供了一种方法,该方法包括:
10.保持处理指令的一个或多个队列;
11.选择排队处理指令以发布至两个或更多个执行单元集群中的一个集群中的执行单元以用于执行;
12.维护与每个排队处理指令相关联的依赖数据,排队处理指令的所述依赖数据指示被要求在所述排队处理指令的执行中可用的任何源操作数;
13.禁止发布所述排队处理指令,直到所述排队处理指令的所有所需源操作数是可用的;
14.提供所述给定操作数作为源操作数以用于执行排队处理指令的可用性的指示;以及
15.响应于给定排队处理指令的一个或多个最后等待的源操作数的可用性的指示,禁止将所述给定排队处理指令发布至除了包括生成所述最后等待的源操作数的执行单元的执行单元集群之外的执行单元集群中的执行单元。
16.本技术的另外的相应方面和特征由所附权利要求限定。
附图说明
17.将参考如附图所示的本发明的实施方案,仅以举例的方式进一步描述本技术,其中:
18.图1示意性地示出了示例性处理电路;
19.图2示意性地示出了执行单元集群的使用;
20.图3和图4示意性地示出了流水线操作;
21.图5示意性地示出了调度操作;并且
22.图6至图7是示出相应方法的示意性流程图。
具体实施方式
23.示例性处理电路
24.图1是示出处理电路的示例100的示意图。参考图1,2级高速缓存10与存储器系统(未示出)交接。1级指令高速缓存20提供处理指令的更本地化的高速缓存,并且1级数据高速缓存15提供要从存储器系统检索或存储到存储器系统的数据的更本地化的缓存。
25.提取电路30经由绘制的各种高速缓存从存储器系统提取程序指令并且将提取的程序指令提供给解码器电路40。解码器电路40解码提取的程序指令并且生成控制信号以控制处理单元70执行处理操作。
26.将解码的指令提供给维护一个或多个发布队列60的发布/调度器电路50,该一个或多个发布队列保持等待发布到处理单元70的指令。作为其操作的一部分,发布/调度器电路将指令保持在发布队列中,直到至少执行指令所需的所有源操作数准备就绪的阶段,也就是说它们已经通过执行较早执行的指令而生成。
27.注意,图1中所示的发布/调度器电路50涉及单个处理电路的示例(在此通过引入下面要论述的技术来描述)。在下文论述的示例中,调度和发布在执行单元或处理电路的多个集群之间发生,并且适用于此类布置的公共发布/调度器电路能够(至少原则上)将指令发布至集群中的任一个。
28.用作源操作数的结果的可用性(在此示例中)由处理单元70传送到发布/调度器电路50,例如通过示意性数据路径55。更一般地,在下面讨论的集群状布置中,可用性的这种指示可以由负责发布“生产者”指令(生成用作“消费者”指令所用的源操作数的结果的指令,并且在下文更详细地描述其)的发布/调度器电路生成并且广播到发布/调度器电路的所有实例。因此,示意性数据路径55可以源自一个或多个处理电路,或者源自发布/调度器电路的一个或多个实例或部分,但是用于通知发布/调度器电路50特定结果的可用性(或流水线系统中的即将到来的可用性)的目的,该特定结果是用作由排队指令所用的源操作数所需的。
29.一般而言,在这些示例中,(i)所述调度器电路和(ii)生成所述给定操作数的执行单元中的一者可被配置为提供所述给定操作数作为源操作数以用于执行排队处理指令的可用性的所述指示。
30.处理单元70可以包括各种部件,为了图的清楚起见,图1中仅示出了两个部件,即一组执行单元72和载入/存储电路74,其与i级数据高速缓存15通信以检索源数据并存储由处理单元70生成的结果。
31.用于在执行单元之间进行通信的一种技术(其将在下面进一步详细描述)是使用寄存器文件90,该寄存器文件响应于执行单元72中的一个生成结果而由回写电路80写入并且可以由执行单元72中的一个读取。
32.执行单元集群
33.在诸如旨在执行高通量数据处理的电路的处理电路中,一种方法是提供多个执行单元232(图2),例如包括被配置为根据连续执行时钟周期操作的一个或多个执行阶段。
34.执行单元之间的通信可以通过直接连接或第一数据路径或经由被配置为存储由执行单元(诸如寄存器文件90)生成的作为第二数据路径的操作数的一个或多个处理器寄存器进行。在一些示例中,所述第二数据路径延迟比所述第一数据路径延迟长。
35.这种通信与由解码器电路40从程序指令解码的所谓的消费者微操作(uop)相关。在此,术语“消费者”是指这些uop的性质,因为其可以要求由其他“生产者”uop生成的一个或多个结果作为源操作数。一般来说,消费者uop无法完成执行,直到已经由相关生产者uop生成或提供所有所需的源操作数。为了适应这种依赖性,该发布/调度器电路50被配置为维护与每个排队处理指令相关联的依赖数据并且禁止(或者实际上阻止)发布所述排队处理指令直到所述排队处理指令的所有所需源操作数可用,排队处理指令的所述依赖数据指示被要求在所述排队处理指令的执行中可用的任何源操作数。下面将参考图5更详细地讨论此类依赖数据的使用。
36.为了减轻这种较高的延迟,一种示例性方法可以是提供每个执行单元的输出与每个其他执行单元的输入之间的直接连接或第一数据路径,以便避免经由寄存器文件90在执行单元之间传递数据的需要。然而,随着处理电路的设计变得越来越大,每个附加执行单元成倍地增加实施第一数据路径所需的网络布线和所谓的逻辑焊盘延伸式布线。这可以达到最终导致物理定时和性能的净退化的复杂度。
37.因此,在图2的示例中,执行单元被分组为物理放置集群230、240,其中提供第一数据路径适用于特定集群内的本地连接。经由寄存器文件90处理集群之间的数据传递。
38.图2的示例示出了两个集群230(集群y)和240(集群z)。在其他示例中,可以使用不同数量的集群(至少两个)。在图2的示例中,每个集群包括五个执行单元,但是这仅仅是为了简化说明,并且实际上可以使用各种数量的执行单元(在每种情况下至少一个)。通常,本公开的实施方案设想每个集群可以仅包括一个执行单元,或者至少一些集群(例如,在一个或多个集群的子集到所有集群的范围内)可以包括两个或更多个执行单元。
39.在图2中,待排队的指令(诸如uop)由示意性解复用器210接收200并且例如根据其uop类型被提供至相应的指令队列。这允许根据uop类型将uop路由到专用执行单元。例如,uop类型可以是加载/存储操作,并且对应的专用执行单元可以提供载入/存储电路74的功能。在另一示例中,uop类型可以是划分操作,并且对应的专用执行单元可以提供划分功能。在图2的示例中,一个指令队列(队列0)处理特定类型(类型a)的uop,其在被发布时被路由到执行单元eu0(集群y中)或eu5(集群z中)。注意,在所示示例中,另一队列(队列1)也处理类型a的uop,但被布置成将其排队的uop路由到执行单元eu1和eu6。其他队列(队列2和队列3)处理类型b的uop,并且另外的队列(队列4)处理类型c的uop。注意,所列举的一组uop类型中的任何给定类型不必限于特定的uop指令,诸如划分操作。实际上,类型中的一个或多个可以涵盖一套或一组指令,或者在其他示例中,可以涵盖“所有uop,而不是针对其提供相应
队列的任何其他特定类型的uop”。
40.关于在这种布置中的发布/调度器电路50的实施,针对指令队列220中的每一个提供所谓的挑选器电路222、224。为了清楚起见,图2中由不同类型的阴影表示电路222、224。实际上,针对集群230、240中的每一个提供相应的挑选器电路(或至少提供相应的挑选器功能的电路)。因此,针对示例性指令队列诸如队列0,存在将来自队列0的指令提供到集群y 230的挑选器功能222以及将来自队列0的指令提供到集群z 240的挑选器功能224。因此,受制于以下讨论的考虑和潜在约束,由队列0保持的任何指令可以被挑选并且提供给集群230、240中的任一个以用于执行。
41.尽管电路220、222、224可以统称为发布/调度器电路,但是将它们视为发布/调度器电路的单独实例也是有用的,使得负责发布给定生产者uop的发布/调度器电路的单个实例(例如,与图2的队列220中的一个相关联的电路的一部分)也负责向所有发布/调度器电路广播指示所述uop的结果可以或将来可以由消费者uop用作源操作数的指示。
42.数据传递延迟
43.在图2的示例中,每个给定执行单元集群230、240包括第一数据路径234(该集群内执行单元之间的直接连接),所述第一数据路径被配置为在给定时钟周期期间将由所述集群中的执行单元生成的操作数传递到所述给定执行单元集群中的所有执行单元的输入,所述第一数据路径在生成所述操作数与完成将所述操作数传递到所述给定集群中的所有执行单元的所述输入之间具有第一数据路径延迟。例如,所述第一数据路径延迟可能使得所述给定集群中的执行单元能够执行处理指令,所述处理指令需要由所述第一数据路径在所述给定时钟周期之后的下一个时钟周期期间传递的操作数。
44.图3示出了示例性情况,其针对四个任意连续时钟周期1

4中的每一个示出了一组排队指令、正在被执行的指令和经由寄存器文件90进行的回写操作。
45.在第一时钟周期1中,执行指令a,并且队列保持取决于指令a的结果的指令b和取决于指令b的结果的指令c。
46.在图3的示例中,执行全部在相同集群内,使得第一数据路径或直接连接用于传递指令执行的结果以用于由随后执行的指令用作源操作数。因此,在下一个时钟周期2中,可以执行指令b;在下一个时钟周期3中,可以执行指令c,以此类推。
47.相似地,在图2的示例中,所述两个或更多个执行单元集群包括第二数据路径(经由寄存器文件90),所述第二数据路径被配置为在给定时钟周期期间将由执行单元生成的操作数传递到所述两个或更多个执行单元集群中的所有执行单元的输入,所述第二数据路径在生成所述操作数与完成将所述操作数传递到所述两个或更多个执行单元集群中的所有执行单元的所述输入之间具有第二数据路径延迟。例如,所述第二数据路径延迟可以使得所述给定集群中的执行单元能够执行处理指令,所述处理指令需要由所述第二数据路径不早于所述给定时钟周期之后的至少两个时钟周期传递的操作数。
48.图4示意性地示出了使用第二数据路径的示例,在该示例中,其定义用于经由寄存器文件90传送执行结果以用作随后执行的指令的源操作数的一个周期延迟。再次,在第一时钟周期1中,执行指令a,同时使指令b和指令c排队。直到时钟周期2结束才完成经由寄存器文件90传递指令a的结果,因此直到时钟周期3才能够执行指令b。类似地,直到时钟周期5才能够执行指令c(其取决于经由寄存器文件90传递的指令b的结果)。
49.下文所述的技术可以通过允许潜在地更大地使用第一数据路径来至少部分地减小第二数据路径的较高延迟。
50.在示例性布置中,挑选器电路(作为与每个执行单元集群相关联的合适功能的示例)可以根据基本优先级选择具有最终剩余的一个或多个依赖生产者结果的相应队列中的最旧的还未执行的消费者uop,该相应队列完成所述周期并且来自所述集群。在消费者uop的最终源输入由不同集群执行的生产者生成的情况下,消费者uop(至少暂时地)被排除在选择之外,使得其无法被该挑选器电路选择,直到惩罚延迟过期,以允许有时间使源数据到达共享或公共寄存器文件。
51.在与集群相关联的挑选器电路没有来自相同本地集群的且其最终源准备就绪的可用的消费者uop的情况下,其可以另选最旧的“准备就绪”的uop,其所有输入在共享或公共寄存器文件90处可用。
52.作为这组技术中的第三(可选)链,为了避免多个挑选器默认完全相同的最旧的准备就绪的uop具有在寄存器文件90中可用的源,可以将排除在寄存器文件90中具有源的最旧的准备就绪的消费者uop的掩模应用于挑选器的子集,这将在另一挑选器处通过默认条件挑选。
53.因此,此挑选布置可以:(i)通过选择用于由执行一个或多个最后剩余生产者uop的相同集群执行的消费者uop来潜在地减少依赖执行延迟;(ii)选择在寄存器文件90中具有其源的最旧的可用消费者uop;以及(iii)采用掩模诸如预先计算的掩模或其他掩模来禁止或取消默认最旧公共源准备就绪uop,其将是另一集群挑选器的可能的默认选择。
54.发布/调度器电路示例
55.现在参考图5,示出了包括图2的发布队列220中的一个的发布/调度器电路的一个实例510以及分别适用于集群y和z的挑选器222、224的相应示例520、530的示例。如上文所述,队列510可由每个挑选器520、530访问,使得考虑到下文所述的任何约束,每个挑选器520、530可以挑选或选择排队指令并且将其提供给该挑选器的相应集群中的执行单元以用于执行。
56.一般而言,发布电路50包括调度器电路,所述调度器电路用于保持处理指令的一个或多个队列,所述调度器电路包括挑选器电路以选择排队处理指令,从而发布至所述执行单元集群中的一个集群中的执行单元以用于执行。
57.注意,如前所述,可能存在多于两个集群,在这种情况下,将存在对应数量的挑选器,每个挑选器能够访问由队列510保持的任何指令。如图所示的本示例涉及两个执行单元集群。为了描述清楚,每个集群包括用于执行处理指令的两个或更多个执行单元,以及两个挑选器。然而,如上所述,集群中的一个或多个可仅具有一个执行单元。
58.每个队列条目由图5的表示中的水平行表示。由队列保持的指令由指令标识符(instr id)字段识别,并且与一组零个或更多个所需操作数相关联。“准备就绪”指示(例如由一个或多个浮子提供的)指示所有所需操作数是否已经准备好或者将在当前周期期间可用作执行结果。下文将论述适用于每个挑选器520、530的掩模字段。
59.通用指示被示出为框540以说明由负责发布生产者uop(或在执行单元执行此类生产者uop的其他示例中)的发布/调度电路的实例广播指示现在由于该生产者uop的执行而变得可用的操作数的信息。该信息由发布/调度器控制电路500(形成发布电路50的一部分)
使用以检测是否针对任何排队指令设置“准备就绪”指示。
60.排队uop需要通过执行生产者uop生成的特定操作数,但是该uop仍然需要其他尚不可用的源操作数。在这种情况下,“准备就绪”指示不被设置为指示针对该排队uop“准备就绪”。出于下文讨论的目的,仅通过执行该生产者uop生成的操作数不被认为是该特定排队uop的“最后等待的源操作数”,因为该排队uop仍然等待一个或多个其他操作数。
61.另一方面,可能的情况是通过执行生产者uop生成的特定操作数实际上是该特定排队uop的最后等待的源操作数。在这种情况下,“准备就绪”指示被设置为指示排队操作数准备好进行发布以用于执行。注意,在给定周期中,等待两个或更多个源操作数的排队操作数由于所有这两个或更多个最后等待的源操作数在给定周期中变为可用而准备就绪。这可能是由于这两个或更多个操作数由单个生产者指令或由多个生产者指令生成,例如由相同集群执行。在一些示例中,如果给定排队指令的最后两个源操作数可由不同集群使用,则可以应用此情形,此情形可以是给定排队指令不符合用于通过第一数据路径挑选数据转发的周期。针对只有经由寄存器文件(第二数据路径)才可用的其他源,每个挑选器将需要等待额外的周期。
62.一般而言,发布/调度器电路被配置为响应到该调度器电路的该给定操作数作为源操作数以用于执行排队处理指令的可用性的指示。
63.因此,禁止(例如预防)发布排队指令,直到“准备就绪”指示被设置,而“准备就绪”指示在(基于生产者指令的执行)接收到针对排队指令的所有源操作数是可用的或者在当前处理周期将是可用的的指示之前不会被设置。
64.换句话讲,所述调度器电路被配置为将指示准备就绪以用于发布的准备就绪数据与所有所述源操作数可用的排队处理指令相关联,所述指令挑选器电路被配置为选择其所述准备就绪数据指示准备就绪以用于发布的排队处理指令。
65.一旦指令已被挑选和发布,其将被从指令队列中移除。
66.已发布指令的路由
67.一般而言,该调度器电路响应给定排队处理指令的一个或多个最后等待的源操作数的可用性的指示,以禁止由该调度器电路将该给定排队处理指令发布至除了包括生成至少一个最后等待的源操作数的执行单元的执行单元集群之外的执行单元集群中的执行单元。例如,所述调度器电路可包括相应的指令挑选器电路,以选择排队处理指令用于发布至所述两个或更多个执行单元集群中的执行单元。
68.如上所述,可以通过可以单独或组合使用的各种技术来实现禁止发布至“另一”集群。
69.在一些示例中,可以约束挑选器电路520、530,以便从不选择(用于发布至其相应集群)由不同集群针对其生成一个或多个最后等待的操作数的排队指令。该约束可以由挑选器电路实施,该挑选器电路响应于来自发布/调度器控制电路500和/或发布队列510的指示以及来自执行单元的广播可用性。在示例中,当指令变为准备就绪时,关于排队指令可以通过发布/调度器控制电路500“唤醒”挑选器520、530,使得只有对应于其最后等待的操作数可用的集群的挑选器被首先唤醒。
70.例如,可以例如分别通过门控电路522、532(以出于清楚地解释本说明的目的,该电路被示意性地示出为单独的电路,但在实际具体实施中,其可以结合在发布/调度器控制
电路500内)对“准备就绪”指示进行门控。门控电路可以例如响应于掩模数据字段。
71.可以将掩码数据设置为保持控制位。当设置为第一位值时,所述控制位使门控电路禁止所述准备就绪指示被提供以唤醒所述相应挑选器,但是当被设置为第二位值时允许将所述准备就绪指示提供给所述挑选器。掩模数据字段可以被布置成在一个周期(或更一般地,等于第二数据路径的延迟与第一数据路径之间的差值的多个周期)中将控制位保持在第一位值。关于能够挑选特定消费者uop的所有挑选器而不是针对生成该消费者uop的一个或多个最后保留的操作数的相应集群的挑选器,可以将掩模数据设置为第一位值。
72.这提供了一个示例,其中所述调度器电路被配置为禁止将所述给定排队处理指令发布至除包括生成所述源操作数的所述最后等待的源操作数的所述执行单元的所述执行单元集群之外的执行单元集群中的执行单元,直到接收到所述源操作数中的所述最后等待的源操作数的可用性的指示之后至少预定非零数目的时钟周期。
73.因此,该准备就绪指示的门控能够禁止与除包括生成所述最后等待的源操作数的所述执行单元的所述执行单元集群之外的执行单元集群相关联的所述指令挑选器电路检测所述给定排队处理指令的所述准备就绪数据。
74.通过这种技术,针对生成一个或多个最后剩余操作数的集群的挑选器被唤醒并且能够挑选在一个或多个最后剩余操作数的可用性之后在下一周期中执行的消费者uop。这对应于图3中所示的情况,例如当在指令a生成其最后剩余操作数之后,在下一周期中执行指令b时。注意,为了图的清楚性,示出了对指令a的依赖的指示,而不是列出被等待的特定操作数。另一方面,不同集群的任何其他挑选器不被唤醒以便能够挑选消费者uop直到一个周期后。此时,消费者uop当然可能已经由接收用于所述消费者uop的较早准备就绪指示的其他挑选器发布。然而,如果指令仍然等待发布,那么唤醒其他挑选器中的一个的额外延迟意味着源操作数现在将经由较长的延迟第二数据路径(即经由寄存器文件90)可用。
75.可能存在多于一个排队指令可用于由给定挑选器挑选。在这些情况下,挑选器可以使用仲裁方案来决定挑选哪一个。例如,所述挑选器可以被配置为选择其准备就绪数据指示准备就绪以用于发布的排队时间最长的或最旧的处理指令。然而,可以使用其他仲裁方案,诸如轮询方案。
76.掩模示例
77.现在将讨论图5的掩模字段。
78.在一些示例中,掩模字段可以用于控制到单个挑选器的准备就绪指示的门控或可用性。例如,掩模字段可以针对每个适用的挑选器包含一位,其中该位被设置为特定值以禁止将准备就绪指示提供给该挑选器。
79.掩模字段可以包含预先计算的信息,其实际上可以取消或防止特定挑选器挑选给定uop。针对该给定uop,寄存器文件90(第二数据路径)提供最后剩余操作数。这可以在此类uop将是另一集群挑选器的可能的默认选择的情况下执行。
80.因此,在一些示例中,该调度器电路可以被配置为生成数据掩模以禁止检测所述给定排队处理指令准备好发布至除包括生成所述源操作数的所述最后等待的源操作数的所述执行单元的所述执行单元集群之外的执行单元集群中的执行单元。
81.掩模数据可以被预先计算并且留在适当位置,以便禁止由特定挑选器挑选给定排队指令。
82.在其他示例中,如上文所述,掩模数据可以是瞬态的,使得例如它可以在生成最后等待的一个源操作数之后的预定数量的时钟周期被移除。这可以提供延迟除对应于“相同集群”的挑选器之外的挑选器选择新准备就绪的排队指令的机会的功能。
83.作为瞬态掩模数据的示例,可以生成掩模(例如,由发布/调度器控制电路500),因为生成所述掩模的电路利用所有其准备就绪的源检测最旧或排队时间最长的指令,并且应用掩模以排除来自挑选器中的一个(双挑选器布置中)或来自除了一个之外所有挑选器(更一般地)的指令,使得该(掩盖的)挑选器然后挑选其第二最旧的指令其他挑选器将挑选最旧的指令,从而避免挑选冲突。这提供了另一示例,其中所述调度器电路被配置为生成数据掩模以禁止检测所述给定排队处理指令准备好发布至除包括生成所述源操作数的所述最后等待的源操作数的所述执行单元的所述执行单元集群之外的执行单元集群中的执行单元。
84.流程图示例
85.图6是表示上文所述过程的一些方面的示意性流程图。流程图表示由包括如图5所示的挑选器电路的发布/调度器电路50执行的步骤。
86.在步骤600处,接收由生产者指令生成的一个或多个处理结果的广播可用性。在步骤610处,如果针对任何排队指令的所有源操作数都可用,则控制进行到步骤620。否则,控制返回到步骤600以等待下一个广播可用性。
87.参考挑选操作,在步骤620处,如果一个或多个最后操作数由特定挑选器将向其路由新准备好的指令的相同集群生成,则该指令可以在步骤640处由挑选器选择用于发布并且在步骤650处发布。如果不是相同集群,则在步骤660处,由该挑选器进行的挑选被推迟一个周期(或更一般地,第二数据路径与第一数据路径之间的延迟的差值)。
88.方法
89.通过上文讨论的技术的概述,图7是示出方法(其可例如由上述电路实施)的示意性流程图,该方法包括:
90.(在步骤700处)维护处理指令的一个或多个队列;
91.(在步骤710处)选择排队处理指令以发布至两个或更多个执行单元集群中的一个集群中的执行单元以用于执行;
92.(在步骤720处)维护与每个排队处理指令相关联的依赖数据,排队处理指令的所述依赖数据指示被要求在所述排队处理指令的执行中可用的任何源操作数;
93.(在步骤730处)禁止发布所述排队处理指令,直到所述排队处理指令的所有所需源操作数是可用的;
94.(在步骤740处)提供所述给定操作数作为源操作数以用于执行排队处理指令的可用性的指示;以及
95.响应于给定排队处理指令的一个或多个最后等待的源操作数的可用性的指示,(在步骤750处)禁止将所述给定排队处理指令发布至除了包括生成所述最后等待的源操作数的执行单元的执行单元集群之外的执行单元集群中的执行单元。
96.常规事项
97.在本技术中,字词“被配置为...”用于意指装置的元件具有能够执行所限定的操作的配置。在该上下文中,“配置”意指硬件或软件的互连的布置或方式。例如,该装置可具
有提供所限定的操作的专用硬件,或者可对处理器或其他处理设备进行编程以执行该功能。“被配置为”并不意味着装置元件需要以任何方式改变以便提供所限定的操作。
98.虽然本文已结合附图详细描述了本发明技术的示例性实施方案,但应当理解,本发明技术并不限于那些精确的实施方案,并且在不脱离所附权利要求书所限定的本发明技术的范围和实质的前提下,本领域的技术人员可在其中实现各种变化、增加和修改。例如,在不脱离本发明技术的范围的情况下,从属权利要求的特征可与独立权利要求的特征一起进行各种组合。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1