专利名称:柔性可重构任务处理单元结构的制作方法
技术领域:
本发明涉及一种高效能计算系统的可重构任务处理结构, 特别涉及一种柔性可重构任务处理单元结构。
(二) 背景技术:
随着可配置器件(如FPGA)规模和性能的不断提高,基 于可配置器件的可重构超级计算机正在兴起,高效能计算机正从"通用"和"专 用"走向体现通专结合的"可重构"。从国际高性能计算机最近几年的研究进展 中可以看到,超级计算机系统研制明显呈现出多核化、高效能、可重构等发展 趋势。可重构高性能计算技术结合了传统硬件和软件实现方案的优点,既具有 硬件并行计算的高性能,又具有软件的灵活性,它为以低代价进行超级计算提 供了一条可能的途径。
当前在研的可重构计算系统往往由一个或几个可重构逻辑器件以协处理器 的方式和一个通用处理器耦合而成,可重构逻辑器件是系统定制的或商业化的 部件(如FPGA芯片),对可重构逻辑器件进行的配置可以使它实现相应的功能, 能够以准ASIC的计算速度对应用中的计算密集部分给予加速执行以提高整个 应用的执行性能,系统中的通用处理器主要负责对可重构逻辑器件进行资源管 理和任务调度。
可重构计算系统的这种协处理模式,其并行处理方式和可重构资源不能根 据不同的并行应用问题而合理匹配。并行可重构计算系统结构要比传统的分布 式并行系统复杂很多,将一个高效运行应用在可重构计算系统上,首先需要对 应用进行软/硬件任务划分,将软/硬件任务分别映射到通用处理器和可重构逻辑 器件上并行执行。可重构资源的规模和可重构逻辑器件与通用处理器之间的耦 合关系将直接影响到应用的执行效能,特别是针对大规模应用中的硬件任务无 法一次性配置到可重构单元上的情况,可能还涉及到软/硬件任务迁移和重载。 目前在根据任务规模和并行执行机制进行动态资源配置和结构重组方面,还缺 乏有力的技术支持。此外,现在的可重构计算系统并没有给应用开发者提供统一的应用开发模 型。可重构计算系统中有软件和硬件任务的区分,而软件程序员往往缺乏对硬 件平台的深入理解和编写硬件任务的能力,从而导致利用可重构计算技术时困 难重重。这就要求可重构计算系统的底层实现对应用开发者透明化,通过给应 用开发者提供统一的应用开发模型,使他们能够按照问题的固有特点进行开发, 经过可重构系统集成开发环境处理后,可以直接在相应的可重构计算系统上运 行。
由此可见,现有的可重构技术还缺少柔性,不能做到通专融合和实现真正 意义上的高效能,因此有必要深入研究柔性可重构技术及其在高效能计算系统 应用。
发明内容
本发明要解决的技术问题是针对现有技术不足,提供一种柔性可重构任 务处理单元结构,通过该结构可有效提高高效能计算机对不同任务流的适用性 和高效性。
本发明的技术方案
一种柔性可重构任务处理单元结构RcTPU,它能根据任务功能、资源、形 态、存储、通信特性以及任务间的相关性,通过多重并行机制的柔性重构,满
足对不同任务的适用性和对特定任务的高效性需求,它含有n个通用处理器和m 个可重构处理器,n和m大于等于2,它还含有p个存储控制器和q个存储器以 及交叉开关、交换网络,通用处理器和可重构处理器的开关端口与交叉开关连 接,n个通用处理器和m个可重构处理器的存储端口直接与p个存储控制器连 接,或者通过r个网络接口与交换网络连接,存储控制器的通讯端口直接与交换 网络连接,或者通过网络接口与交换网络连接,存储控制器的数据端口与存储 器连接,p、 q和r大于等于l。
p与q相等;n个通用处理器和m个可重构处理器的存储端口直接与p个存 储控制器连接时, 一个存储控制器与至少一个通用处理器连接;n个通用处理器 和m个可重构处理器通过r个网络接口与交换网络连接时, 一个网络接口与至 少一个通用处理器连接。通用处理器含有单核处理器或多核处理器,可重构处理器含有大容量现场
可编程逻辑器件或可配置的专用宏单元器件或ASIC专用处理器,ASIC专用处 理器为根据用户需要定制的单核或多核处理器,或者为完成某特定功能的专门 处理单元。
交叉开关含有单层开关阵列或多层开关阵列,多层开关阵列中的各层开关 阵列通过级连的方式连接。
单层开关阵列分别以n和m为列数和行数,多层开关阵列含有至少两层开 关阵列,每层开关阵列的行数的乘积为m,所有最低层开关阵列的列数的和为n。
对于单层开关阵列和多层开关阵列还可以描述为单层开关阵列分别以n 和m为行数和列数,多层开关阵列含有至少两层开关阵列,每层开关阵列的列 数的乘积为m,所有最低层开关阵列的行数的和为n。
n和m为等于2或大于2的自然数;p、 q和r为等于1或大于1的自然数。
图1中的柔性可重构任务处理单元结构说明了 n个通用处理器和m个可重 构处理器的存储端口直接与存储控制器连接时的情况,交叉开关为单层开关, 以n个通用处理器为主构成的n个任务处理部件通过交换网络实施通信。
图2中的柔性可重构任务处理单元结构说明了 n个通用处理器和m个可重 构处理器的存储端口通过网络接口与交换网络连接时的情况,交叉开关为单层 开关,以n个通用处理器为主构成的n个任务处理部件通过交换网络实施内存 共享访问。
图3中的柔性可重构任务处理单元结构说明了 kxn个通用处理器和kxm 个可重构处理器的存储端口直接与存储控制器连接时的情况,存储控制器的通 讯端口通过网络接口与交换网络连接,交叉开关为两层开关阵列,含有k个一级 交叉开关和一个二级交叉开关,以通用处理器为主构成的k个任务处理部件通过 交换网络实施通信。
本发明的有益效果
1、 本发明含通用处理器、可重构处理器、存储控制器、存储器、交叉 开关和交换网络,可根据任务流的不同对整个高效能计算机系统的资源进行重 新合理配置,提高了整个高效能计算机系统的适用性和高效性。2、 本发明的交叉开关含有多层开关阵列,多层开关阵列中的各层开关 阵列通过级连的方式连接,这样,当通用处理器和可重构处理器的数量较多时, 不仅能使交叉开关的电路简化,还可减少设备量。
3、 本发明中的通用处理器和可重构处理器的存储端口直接与存储控制 器连接,或者通过网络接口与交换网络连接,这样可为通用处理器和可重构处 理器提供尽可能高的存储访问带宽和I/O带宽,实现高效能计算机系统内高带宽 存储共享访问。
(四)
图1为柔性可重构任务处理单元结构的结构说明示意图之一;
图2为柔性可重构任务处理单元结构的结构说明示意图之二;
图3为柔性可重构任务处理单元结构的结构说明示意图之三;
图4为柔性可重构任务处理单元结构的示意图之一;
图5为柔性可重构任务处理单元结构的示意图之二;
图6为柔性可重构任务处理单元结构的示意图之三;
图7为柔性可重构任务处理单元结构的示意图之四;
图8为柔性可重构任务处理单元结构的示意图之五;
图9为柔性可重构任务处理单元结构的示意图之六;
图10为柔性可重构任务处理单元结构的示意图之七;
(五) 具体实施例方式
实施例一参见图4,图中,柔性可重构任务处理单元结构RcTPU含有两 个通用处理器1、 2和两个可重构处理器1、 2,它还含有两个存储控制器1、 2 和两个存储器1、 2以及交叉开关A、交换网络,通用处理器1、 2和可重构处 理器1、 2的开关端口与交叉开关A连接,通用处理器1和可重构处理器1的存 储端口直接与存储控制器1连接,存储控制器1的通讯端口与交换网络连接, 存储控制器1的数据端口与存储器1连接,通用处理器2和可重构处理器2的 存储端口直接与存储控制器2连接,存储控制器2的通讯端口与交换网络连接, 存储控制器2的数据端口与存储器2连接。通用处理器l、 2含有单核处理器,可重构处理器l、 2含有ASIC专用处理 器,ASIC专用处理器为根据用户需要定制的单核处理器。 交叉开关A为2x2单层开关阵列。
通用处理器1、可重构处理器1、存储控制器1和存储器1构成一个任务处 理部件,通用处理器2、可重构处理器2、存储控制器2和存储器2构成另一个 任务处理部件,两个任务处理部件通过交换网络实施通信。
实施例二参见图5,图中,柔性可重构任务处理单元结构RcTPU含有两 个通用处理器l、 2和四个可重构处理器1、 2、 3、 4,它还含有两个存储控制器 1、 2和两个存储器1、 2以及交叉开关A、交换网络,通用处理器l、 2和可重 构处理器l、 2、 3、 4的开关端口与交叉开关A连接,通用处理器l和可重构处 理器1、 2的存储端口直接与存储控制器1连接,存储控制器1的通讯端口与交 换网络连接,存储控制器1的数据端口与存储器1连接,通用处理器2和可重 构处理器3、 4的存储端口直接与存储控制器2连接,存储控制器2的通讯端口 与交换网络连接,存储控制器2的数据端口与存储器2连接。
通用处理器l、 2含有单核处理器,可重构处理器l、 2、 3、 4含有ASIC专 用处理器,ASIC专用处理器为根据用户需要定制的单核处理器。
交叉开关A为2x4单层开关阵列。
通用处理器1、可重构处理器1、 2和存储控制器1、存储器1构成一个任 务处理部件,通用处理器2、可重构处理器3、 4和存储控制器2、存储器2构 成另一个任务处理部件,两个任务处理部件通过交换网络实施通信。
实施例三参见图6,图中,柔性可重构任务处理单元结构RcTPU含有三 个通用处理器l、 2、 3和九个可重构处理器1、 2、 3、 4、 5、 6、 7、 8、 9,它还 含有三个存储控制器1、 2、 3和三个存储器1、 2、 3以及交叉开关A、交换网 络,通用处理器1、 2、 3和可重构处理器1、 2、 3、 4、 5、 6、 7、 8、 9的开关 端口与交叉开关A连接,通用处理器l和可重构处理器l、 2、 3的存储端口直 接与存储控制器1连接,存储控制器1的通讯端口与交换网络连接,存储控制 器1的数据端口与存储器1连接,通用处理器2和可重构处理器4、 5的存储端 口直接与存储控制器2连接,存储控制器2的通讯端口与交换网络连接,存储控制器2的数据端口与存储器2连接,通用处理器3和可重构处理器6、 7、 8、 9的存储端口直接与存储控制器3连接,存储控制器3的通讯端口与交换网络连 接,存储控制器3的数据端口与存储器3连接。
通用处理器1、 2、 3含有单核处理器,可重构处理器1、 2、 3、 4、 5、 6、 7、 8、 9含有ASIC专用处理器,ASIC专用处理器为根据用户需要定制的单核处理 器。
交叉开关A为3x9单层开关阵列。
通用处理器l、可重构处理器l、 2、 3和存储控制器1、存储器l构成第一 个任务处理部件,通用处理器2、可重构处理器4、 5和存储控制器2、存储器2 构成第二个任务处理部件,通用处理器3、可重构处理器6、 7、 8、 9和存储控 制器3、存储器3构成第三个任务处理部件,三个任务处理部件通过交换网络实 施通信。
实施例四参见图7,图中,柔性可重构任务处理单元结构RcTPU含有两 个通用处理器1、 2和两个可重构处理器1、 2,它还含有一个存储控制器1和一 个存储器l以及交叉开关A、交换网络,通用处理器l、 2和可重构处理器1、 2 的开关端口与交叉开关A连接,通用处理器1的存储端口通过网络接口 1与交 换网络连接,通用处理器2、可重构处理器l、 2的存储端口通过网络接口2与 交换网络连接,存储控制器1的通讯端口与交换网络连接,存储控制器1的数 据端口与存储器l连接。
通用处理器l、 2含有单核处理器,可重构处理器l、 2含有ASIC专用处理 器,ASIC专用处理器为根据用户需要定制的单核处理器。
交叉开关A为2x2单层开关阵列。
通用处理器1和网络接口 1构成一个任务处理部件,通用处理器2、可重构 处理器l、 2和网络接口 2构成另一个任务处理部件,两个任务处理部件通过交 换网络实施内存共享访问。
实施例五参见图8,图中,柔性可重构任务处理单元结构RcTPU含有两 个通用处理器l、 2和四个可重构处理器1、 2、 3、 4,它还含有一个存储控制器 1和一个存储器1以及交叉开关A、交换网络,通用处理器l、 2和可重构处理器l、 2、 3、 4的开关端口与交叉开关A连接,通用处理器1和可重构处理器1 的存储端口通过网络接口 l与交换网络连接,通用处理器2、可重构处理器2、 3、 4的存储端口通过网络接口 2与交换网络连接,存储控制器1的通讯端口与 交换网络连接,存储控制器1的数据端口与存储器1连接。
通用处理器l、 2含有单核处理器,可重构处理器l、 2、 3、 4含有ASIC专 用处理器,ASIC专用处理器为根据用户需要定制的单核处理器。
交叉开关A为2x4单层开关阵列。
通用处理器1、可重构处理器1和网络接口 1构成一个任务处理部件,通用 处理器2、可重构处理器2、 3、 4和网络接口2构成另一个任务处理部件,两个 任务处理部件通过交换网络实施内存共享访问。
实施例六参见图9,图中,柔性可重构任务处理单元结构RcTPU含有三 个通用处理器l、 2、 3和九个可重构处理器1、 2、 3、 4、 5、 6、 7、 8、 9,它还 含有一个存储控制器1和一个存储器1以及交叉开关A、交换网络,通用处理 器1、 2、 3和可重构处理器1、 2、 3、 4、 5、 6、 7、 8、 9的开关端口与交叉开 关A连接,通用处理器1和可重构处理器1、 2的存储端口通过网络接口 1与交 换网络连接,通用处理器2、可重构处理器3、 4、 5的存储端口通过网络接口 2 与交换网络连接,通用处理器3、可重构处理器6、 7、 8、 9的存储端口通过网 络接口 3与交换网络连接,存储控制器1的通讯端口与交换网络连接,存储控 制器1的数据端口与存储器1连接。
通用处理器l、 2、 3含有单核处理器,可重构处理器l、 2、 3、 4、 5、 6、 7、 8、 9含有ASIC专用处理器,ASIC专用处理器为根据用户需要定制的单核处理
器o
交叉开关A为3x9单层开关阵列。
通用处理器1、可重构处理器1、 2和网络接口 1构成第一个任务处理部件, 通用处理器2、可重构处理器3、 4、 5和网络接口2构成第二个任务处理部件, 通用处理器3、可重构处理器6、 7、 8、 9和网络接口 3构成第三个任务处理部 件,三个任务处理部件通过交换网络实施内存共享访问。
实施例七参见图IO,图中,柔性可重构任务处理单元结构RcTPU含有八个通用处理器1 8和十六个可重构处理器1 16,它还含有四个存储控制器1、 2、 3、 4和四个存储器1、 2、 3、 4以及四个一级交叉开关B、 一个二级交叉开 关C和交换网络,通用处理器1 8和可重构处理器1 16的开关端口与一级交 叉开关B连接,通用处理器l、 2和可重构处理器1、 2、 3、 4的存储端口直接 与存储控制器1连接,存储控制器1的通讯端口通过网络接口 1与交换网络连 接,存储控制器l的数据端口与存储器l连接,通用处理器3、 4和可重构处理 器5、 6、 7、 8的存储端口直接与存储控制器2连接,存储控制器2的通讯端口 通过网络接口 2与交换网络连接,存储控制器2的数据端口与存储器2连接, 通用处理器5、 6和可重构处理器9、 10、 11、 12的存储端口直接与存储控制器 3连接,存储控制器3的通讯端口通过网络接口 3与交换网络连接,存储控制器 3的数据端口与存储器3连接,通用处理器7、 8和可重构处理器13、 14、 15、 16的存储端口直接与存储控制器4连接,存储控制器4的通讯端口通过网络接 口 4与交换网络连接,存储控制器4的数据端口与存储器4连接。
通用处理器1 8含有单核处理器,可重构处理器1 16含有ASIC专用处 理器,ASIC专用处理器为根据用户需要定制的单核处理器。
一级交叉开关B为2x4单层开关阵列,二级交叉开关C为4x4单层开关阵 列, 一级交叉开关B和二级交叉开关C通过级连的方式连接。
通用处理器1、 2和可重构处理器1、 2、 3、 4和存储控制器1、存储器1和 网络接口 l构成第一个任务处理部件,通用处理器3、 4和可重构处理器5、 6、 7、 8和存储控制器2、存储器2和网络接口 2构成第二个任务处理部件,通用 处理器5、 6和可重构处理器9、 10、 11、 12和存储控制器3、存储器3和网络 接口 3构成第三个任务处理部件,通用处理器7、 8和可重构处理器13、 14、 15、 16和存储控制器4、存储器4和网络接口 4构成第四个任务处理部件,四个任 务处理部件通过交换网络实施通信。
权利要求
1、一种柔性可重构任务处理单元结构,它能根据任务功能、资源、形态、存储、通信特性以及任务间的相关性,通过多重并行机制的柔性重构,满足对不同任务的适用性和对特定任务的高效性需求,它含有n个通用处理器和m个可重构处理器,n和m大于等于2,其特征是还含有p个存储控制器和q个存储器以及交叉开关、交换网络,通用处理器和可重构处理器的开关端口与交叉开关连接,n个通用处理器和m个可重构处理器的存储端口直接与p个存储控制器连接,或者通过r个网络接口与交换网络连接,存储控制器的通讯端口直接与交换网络连接,或者通过网络接口与交换网络连接,存储控制器的数据端口与存储器连接,p、q和r大于等于1。
2、 根据权利要求1所述的柔性可重构任务处理单元结构,其特征是所 述p与q相等;所述n个通用处理器和m个可重构处理器的存储端口直接与p 个存储控制器连接时, 一个存储控制器与至少一个通用处理器连接;所述n个 通用处理器和m个可重构处理器通过r个网络接口与交换网络连接时, 一个网 络接口与至少一个通用处理器连接。
3、 根据权利要求2所述的柔性可重构任务处理单元结构,其特征是所 述通用处理器含有单核处理器或多核处理器,所述可重构处理器含有大容量现 场可编程逻辑器件或可配置的专用宏单元器件或ASIC专用处理器,所述ASIC 专用处理器为根据用户需要定制的单核或多核处理器,或者为完成某特定功能 的专门处理单元。
4、 根据权利要求1或2或3所述的柔性可重构任务处理单元结构,其特 征是所述交叉开关含有单层开关阵列或多层开关阵列,多层开关阵列中的各 层开关阵列通过级连的方式连接。
5、 根据权利要求4所述的柔性可重构任务处理单元结构,其特征是所 述单层开关阵列分别以n和m为列数和行数,所述多层开关阵列含有至少两层 开关阵列,每层开关阵列的行数的乘积为m,所有最低层开关阵列的列数的和 为n。
6、 根据权利要求4所述的柔性可重构任务处理单元结构,其特征是所 述单层开关阵列分别以n和m为行数和列数,所述多层开关阵列含有至少两层 开关阵列,每层开关阵列的列数的乘积为m,所有最低层开关阵列的行数的和 为n。
7、 根据权利要求5或6所述的柔性可重构任务处理单元结构,其特征是: 所述n和m为等于2或大于2的自然数;所述p、 q和r为等于1或大于1的自然数。
全文摘要
本发明涉及一种高效能计算系统的可重构任务处理结构,特别涉及一种柔性可重构任务处理单元结构;柔性可重构任务处理单元结构RcTPU含有n个通用处理器和m个可重构处理器,还含有p个存储控制器和q个存储器以及交叉开关、交换网络,通用处理器和可重构处理器的开关端口与交叉开关连接,n个通用处理器和m个可重构处理器的存储端口直接与p个存储控制器连接,或者通过r个网络接口与交换网络连接,一个存储控制器或一个网络接口与至少一个通用处理器连接,交叉开关含有单层开关阵列或多层开关阵列,多层开关阵列中的各层开关阵列通过级连的方式连接;本发明可有效提高高效能计算机对不同任务流的适用性和高效性。
文档编号G06F15/16GK101620587SQ200810140460
公开日2010年1月6日 申请日期2008年7月3日 优先权日2008年7月3日
发明者宋明武, 蒋烈辉, 邬江兴, 韩国栋 申请人:中国人民解放军信息工程大学