SmartNIC中的网络附接的MPI处理架构的制作方法

文档序号:36323688发布日期:2023-12-09 06:18阅读:179来源:国知局
SmartNIC的制作方法

本公开的示例总体涉及用于智能网络接口卡(smartnic)的消息传递接口(mpi)外壳。


背景技术:

1、数据和向外扩展的工作负载/应用的爆炸给现代数据中心带来越来越多的可扩展性和性能挑战。为了给现代应用提供低延迟、高吞吐量和低功率消耗,数据中心通常将其计算任务置于分布式和联网设置中。例如,数据中心可包括经由网络连接的多个节点,其中架构中的每个节点包括具有多核中央处理单元(cpu)的主机和asic(专用集成电路)、fpga(现场可编程门阵列)或gpu(图形处理单元)形式的硬件加速器。

2、mpi广泛部署在跨各种领域(诸如科学计算、遗传计算和机器学习)的许多分布式应用中。数十年来,它已经是用于开发并行和分布式计算的事实上的编程模型。mpi提供各种原语,诸如点对点通信以及全局和同步操作。节点之间的数据通信(发送/接收)经由网络进行。在计算卸载到加速器上的传统mpi应用中,从网络接收的数据首先存储在主机的存储器中,并且随后经由pcie(外围组件互连高速)总线复制到加速器的存储器(以下称为设备存储器)以用于计算加速度。在计算之后,结果通常被再次复制回主机的存储器。几个数据副本的开销使这种以cpu为中心的解决方案具有显著较低的系统性能并且导致高延迟。换句话讲,当经由网络从另一节点接收任务时,接收节点上的cpu必须首先处理数据,并且随后将数据发送到对应于节点中的加速器的存储器。一旦完成,加速器就在节点最终将经处理的数据传输到请求节点之前将数据传输回cpu的存储器。因此,在mpi环境中使用加速器可产生显著的开销,因为数据在用于cpu的存储器与加速器之间传输。


技术实现思路

1、一个实施方案描述了包括一种网络接口卡(nic),该nic包括消息传递接口(mpi)外壳,该mpi外壳包括电路,该电路被配置为:嗅探从网络接收的分组以识别mpi消息,并且将mpi消息中包含的数据转发到计算电路以进行处理,而无需首先将mpi消息中包含的数据复制到对应于中央处理单元(cpu)的存储器中。此外,cpu设置在与nic相同的计算节点中。

2、本文所述的另一个实施方案是一种nic,该nic包括硬件计算电路和mpi外壳,该mpi外壳包括电路,该电路被配置为:嗅探从网络接收的分组以识别mpi消息,将mpi消息中包含的数据转发到计算电路以进行处理,并且从nic外部的cpu接收指令,该指令指示计算电路处理mpi消息中包含的数据。

3、本文所述的另一个实施方案是一种nic,该nic包括接口外壳,该接口外壳包括电路,该电路被配置为:嗅探从网络接收的分组以识别对应于分布式计算系统的消息,其中使用消息在分布式计算系统中的节点之间传输任务,并且将消息中包含的数据转发到硬件计算电路以进行处理,而无需首先将消息中包含的数据复制到对应于cpu的存储器中。此外,cpu设置在与nic相同的计算节点中。



技术特征:

1.一种网络接口卡(nic),所述nic包括:

2.根据权利要求1所述的nic,其中所述mpi外壳被配置为在没有cpu参与的情况下针对所述mpi消息中包含的所述数据执行标签匹配和地址转换,其中所述mpi外壳还包括:

3.一种nic,所述nic包括:

4.一种nic,所述nic包括:

5.根据权利要求1、3或4所述的nic,其中所述计算电路设置在所述nic中。

6.根据权利要求4所述的nic,其中所述计算电路和所述接口外壳设置在所述nic中的相同集成电路上。

7.根据权利要求4所述的nic,其中所述接口外壳被配置为在没有cpu参与的情况下针对所述消息中包含的所述数据执行标签匹配和地址转换。

8.根据权利要求4所述的nic,其中所述接口外壳被配置为从所述cpu接收指令,所述指令指示所述计算电路处理包含在所述消息中的所述数据。

9.根据权利要求1和3所述的nic,其中所述计算电路和所述mpi外壳设置在所述nic中的相同集成电路上。

10.根据权利要求1和3所述的nic,其中所述mpi外壳被配置为在没有cpu参与的情况下针对所述mpi消息中包含的所述数据执行标签匹配和地址转换。

11.根据权利要求10所述的nic,其中所述mpi外壳还包括:

12.根据权利要求11所述的nic,其中所述mpi外壳还包括:

13.根据权利要求12所述的nic,其中所述mpi外壳还包括:

14.根据权利要求3所述的nic,其中所述mpi外壳被配置为在没有cpu参与的情况下针对所述mpi消息中包含的所述数据执行标签匹配和地址转换,其中所述mpi外壳还包括:


技术总结
本文的实施方案描述了SmartNIC中的接口外壳,该接口外壳减少了依赖于硬件计算引擎(其可包括一个或多个加速器)的以CPU为中心的解决方案中的数据复制开销。该接口外壳在没有CPU参与的情况下卸载标签匹配和地址转换。此外,该接口外壳使得该计算引擎能够直接从网络读取消息,而无需额外的数据复制,即,无需首先将该数据复制到该CPU的存储器中。

技术研发人员:钟冠文,胡成辰,G·J·布雷伯纳
受保护的技术使用者:赛灵思公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1