一种兼容不同gpu的管理系统及其设计方法
【专利摘要】本发明提供一种兼容不同GPU的管理系统及其设计方法,系统包括CPU芯片、南桥芯片、BMC芯片、PCIE插槽、排针、错误指示灯和手持终端;CPU芯片通过南桥芯片和BMC芯片连接,所述BMC芯片通过以太网或串口与手持终端连接,PCIE插槽通过SMB总线与BMC芯片连接,BMC芯片同时与排针连接;错误指示灯通过错误指示信号线连接BMC芯片。本发明提供的管理系统中BMC芯片能够智能地识别PCIE插槽上所插入的GPU板卡类型,并自动地调用相关的程序建立起与此GPU相适配的通信协议,实现BMC芯片对GPU板卡有效的管理。BMC芯片利用LPC总线能够实现从BIOS中读取GPU板卡信息;BMC芯片也能通过SMB总线读取GPU板卡的信息;通过对比两方面得到的信息,实现GPU板卡的监控管理、故障报警等功能。
【专利说明】一种兼容不同GPU的管理系统及其设计方法
【技术领域】
[0001] 本发明属于计算机【技术领域】,具体涉及一种兼容不同GPU的管理系统及其设计方 法。
【背景技术】
[0002] NVIDIA公司在1999年发布GeForce256图形处理芯片时首先提出GPU的概念。GPU 能够从硬件上支持T&L(TransformandLighting,多边形转换与光源处理)的显示芯片,因 为T&L是3D渲染中的一个重要部分,其作用是计算多边形的3D位置和处理动态光线效果, 也可以称为"几何处理"。一个好的T&L单元,可以提供细致的3D物体和高级的光线特效; 只不过大多数PC中,T&L的大部分运算是交由CPU处理的(这就也就是所谓的软件T&L), 由于CPU的任务繁多,除了 T&L之外,还要做内存管理、输入响应等非3D图形处理工作,因 此在实际运算的时候性能会大打折扣,常常出现显卡等待CPU数据的情况,其运算速度远 跟不上今天复杂三维游戏的要求。即使CPU的工作频率超过3GHz或更高,对它的帮助也不 大,由于这是PC本身设计造成的问题,与CPU的速度无太大关系。
[0003] GPU (Graphic Processing Unit,图形处理器),在现代计算机中应用得越来越广, 一是应用在图形处理领域,二是应用在HPC (High Performance Computing)领域。目前主 要有两大产品系列Intel GPU和NVIDIA GPU。这两种厂商的GPU带外管理功能都可以采 用PCIE(PCI Express Bus)规范中定义的可选的SMBus总线作为带外管理信号,但采用的 管理协议不同。
【发明内容】
[0004] 为了克服上述现有技术的不足,本发明提供一种兼容不同GPU的管理系统及其设 计方法,其中的BMC芯片能够智能地识别PCIE插槽上所插入的GPU板卡类型,并自动地调 用相关的程序建立起与此GPU相适配的通信协议,实现BMC芯片对GPU板卡有效的管理。
[0005] 为了实现上述发明目的,本发明采取如下技术方案:
[0006] 本发明提供一种兼容不同GPU的管理系统,所述系统包括CPU芯片、南桥芯片、BMC 芯片、PCIE插槽、排针、错误指示灯和手持终端;所述CPU芯片通过南桥芯片和BMC芯片连 接,所述BMC芯片通过以太网或串口与手持终端连接,所述PCIE插槽通过SMB总线与BMC 芯片连接,所述BMC芯片同时与排针连接;所述错误指示灯通过错误指示信号线连接BMC芯 片。
[0007] 所述CPU芯片与南桥芯片之间通过DMI2总线连接,所述南桥芯片与BMC之间通过 LPC总线连接。
[0008] 所述BMC芯片通过南桥芯片读取BIOS中所检测到的GPU板卡信息。
[0009] 所述BMC芯片采用SMB总线连接PCIE插槽的SMB总线针脚,对PCIE插槽上所插 入的GPU板卡进行管理。
[0010] 所述SMB总线包括SMB时钟信号线BMC_SMB_CLK和SMB数据信号线BMC_SMB_SDA。
[0011] 所述排针用于标识GPU板卡类型,排针通过GPU板卡身份信号线GPU_TYPE_ID连 接BMC芯片的GPI0针脚。
[0012] 通过排针把GPU板卡身份信号GPU_TYPE_ID拉为高电平,表明PCIE插槽所插入板 卡为Intel GPU板卡;把GPU板卡身份信号线GPU_TYPE_ID拉为低电平,表明是NVIDIA GPU 板卡;所述BMC芯片则根据检测GPU板卡身份信号线GPU_TYPE_ID的高低电平来判断PCIE 插槽所插入的GPU板卡类型。
[0013] 所述排针的ΡΙΝΙ通过阻值为4. 7K欧姆的上拉电阻连接到3. 3V辅助电源;PIN2通 过GPU板卡身份信号线GPU_TYPE_ID连接到BMC芯片的GPI0针脚;ΡΙΝ3接地。
[0014] 本发明还提供一种兼容不同GPU的管理系统的设计方法,所述方法包括以下步 骤:
[0015] 步骤1 :在BMC芯片的程序数据库中编写适配于Intel和NVIDIA两种GPU板卡的 监控程序;
[0016] 步骤2 :把编写好的监控程序通过编译工具生成二进制烧录文件,烧录进BMC芯片 的Firmware芯片;
[0017] 步骤3 :根据PCIE插槽插入GPU板卡的类型设置标识GPU板卡排针的电平;
[0018] 步骤4 :插入主板电源线缆,即主板存在辅助电源但未开机时,BMC芯片正常工作;
[0019] 步骤5 :BMC芯片通过GPU板卡身份信号线GPU_TYPE_ID检测标识GPU板卡的排针 的电平;GPU板卡身份信号线GPU_TYPE_ID为高电平时调用Intel GPU板卡的监控子程序, 为低电平时调用NVIDIA GPU板卡的监控子程序;
[0020] 步骤6 :主板开机上电,使主板正常工作;
[0021] 步骤7 :主板开机完成后,BMC芯片与GPU板卡正常通讯,取得GPU板卡相关信息, BMC芯片通过LPC总线读取主板BIOS和0S信息,从中得到GPU板卡的相关信息;
[0022] 步骤8 :BMC芯片对比分析来自两方面的信息;若信息一致,BMC芯片持续监控GPU 板卡;若信息不一致,BMC芯片通过错误指示信号线ERR_C0NTR0L控制错误指示灯亮红灯告 警,并通过以太网络或串口与手持终端通讯,以友好直观的界面向用户报警或者显示监控 信息。
[0023] 与现有技术相比,本发明的有益效果在于:
[0024] 1) BMC芯片能够智能地识别PCIE插槽上所插入的GPU板卡类型,并自动地调用相 关的程序建立起与此GPU相适配的通信协议,实现BMC芯片对GPU板卡有效的管理。
[0025] 2) BMC芯片利用LPC总线能够实现从BIOS中读取GPU板卡信息;
[0026] 3) BMC芯片也能通过SMB (System Management Bus)总线读取GPU板卡的信息;通 过对比两方面得到的信息,可以实现GPU板卡的监控管理、故障报警等功能。
【专利附图】
【附图说明】
[0027] 图1是本发明实施例中兼容不同GPU的管理系统结构图;
[0028] 图2是本发明实施例中兼容不同GPU的管理系统设计方法流程图。
【具体实施方式】
[0029] 下面结合附图对本发明作进一步详细说明。
[0030] 如图1,本发明提供一种兼容不同GPU的管理系统,所述系统包括CPU芯片、南桥芯 片、BMC芯片、PCIE插槽、排针、错误指示灯和手持终端;所述CPU芯片通过南桥芯片和BMC 芯片连接,所述BMC芯片通过以太网或串口与手持终端连接,所述PCIE插槽通过SMB总线 与BMC芯片连接,所述BMC芯片同时与排针连接;所述错误指示灯通过错误指示信号线连接 BMC芯片。
[0031] CPU芯片采用Intel公司的Haswell-EP CPU ;南桥芯片采用Intel公司的 Wellsburg C610 ;BMC 芯片采用 ASPEED 公司的 AST2400。
[0032] 所述CPU芯片与南桥芯片之间通过DMI2总线连接,所述南桥芯片与BMC之间通过 LPC总线连接。
[0033] 所述BMC芯片通过南桥芯片读取BIOS (Basic Input Output System)中所检测到 的GPU板卡信息。
[0034] 所述BMC芯片采用SMB总线连接PCIE插槽的SMB总线针脚,对PCIE插槽上所插 入的GPU板卡进行管理。
[0035] 所述SMB总线包括SMB时钟信号线BMC_SMB_CLK和SMB数据信号线BMC_SMB_SDA。
[0036] 所述排针用于标识GPU板卡类型,排针通过GPU板卡身份信号线GPU_TYPE_ID连 接 BMC 芯片的 GPIO (General Purpose Input Output,通用输入 / 输出)针脚。
[0037] 通过排针把GPU板卡身份信号GPU_TYPE_ID拉为高电平,表明PCIE插槽所插入板 卡为Intel GPU板卡;把GPU板卡身份信号线GPU_TYPE_ID拉为低电平,表明是NVIDIA GPU 板卡;所述BMC芯片则根据检测GPU板卡身份信号线GPU_TYPE_ID的高低电平来判断PCIE 插槽所插入的GPU板卡类型。
[0038] 所述排针的ΡΙΝΙ通过阻值为4. 7K欧姆的上拉电阻连接到3. 3V辅助电源;PIN2通 过GPU板卡身份信号线GPU_TYPE_ID连接到BMC芯片的GPI0针脚;ΡΙΝ3接地。
[0039] 如图2,本发明还提供一种兼容不同GPU的管理系统的设计方法,所述方法包括以 下步骤:
[0040] 步骤1 :在BMC芯片的程序数据库中编写适配于Intel和NVIDIA两种GPU板卡的 监控程序;
[0041] 步骤2 :把编写好的监控程序通过编译工具生成二进制烧录文件,烧录进BMC芯片 的Firmware芯片;
[0042] 步骤3 :根据PCIE插槽插入GPU板卡的类型设置标识GPU板卡排针的电平;
[0043] 步骤4 :插入主板电源线缆,即主板存在辅助电源但未开机时,BMC芯片正常工作;
[0044] 步骤5 :BMC芯片通过GPU板卡身份信号线GPU_TYPE_ID检测标识GPU板卡的排针 的电平;GPU板卡身份信号线GPU_TYPE_ID为高电平时调用Intel GPU板卡的监控子程序, 为低电平时调用NVIDIA GPU板卡的监控子程序;
[0045] 步骤6 :主板开机上电,使主板正常工作;
[0046] 步骤7 :主板开机完成后,BMC芯片与GPU板卡正常通讯,取得GPU板卡相关信息, BMC芯片通过LPC总线读取主板BIOS和0S信息,从中得到GPU板卡的相关信息;
[0047] 步骤8 :BMC芯片对比分析来自两方面的信息;若信息一致,BMC芯片持续监控GPU 板卡;若信息不一致,BMC芯片通过错误指示信号线ERR_C0NTR0L控制错误指示灯亮红灯告 警,并通过以太网络或串口与手持终端通讯,以友好直观的界面向用户报警或者显示监控 信息。
[0048] 最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,所 属领域的普通技术人员参照上述实施例依然可以对本发明的【具体实施方式】进行修改或者 等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发 明的权利要求保护范围之内。
【权利要求】
1. 一种兼容不同GPU的管理系统,其特征在于:所述系统包括CPU芯片、南桥芯片、BMC 芯片、PCIE插槽、排针、错误指示灯和手持终端;所述CPU芯片通过南桥芯片和BMC芯片连 接,所述BMC芯片通过以太网或串口与手持终端连接,所述PCIE插槽通过SMB总线与BMC 芯片连接,所述BMC芯片同时与排针连接;所述错误指示灯通过错误指示信号线连接BMC芯 片。
2. 根据权利要求1所述的兼容不同GPU的管理系统,其特征在于:所述CPU芯片与南 桥芯片之间通过DMI2总线连接,所述南桥芯片与BMC之间通过LPC总线连接。
3. 根据权利要求2所述的兼容不同GPU的管理系统,其特征在于:所述BMC芯片通过 南桥芯片读取BIOS中所检测到的GPU板卡信息。
4. 根据权利要求1所述的兼容不同GPU的管理系统,其特征在于:所述BMC芯片采用 SMB总线连接PCIE插槽的SMB总线针脚,对PCIE插槽上所插入的GPU板卡进行管理。
5. 根据权利要求1或4所述的兼容不同GPU的管理系统,其特征在于:所述SMB总线 包括SMB时钟信号线BMC_SMB_CLK和SMB数据信号线BMC_SMB_SDA。
6. 根据权利要求1所述的兼容不同GPU的管理系统,其特征在于:所述排针用于标识 板卡类型,排针通过GPU板卡身份信号线GPU_TYPE_ID连接BMC芯片的GPI0针脚。
7. 根据权利要求6所述的兼容不同GPU的管理系统,其特征在于:通过排针把GPU板 卡身份信号GPU_TYPE_ID拉为高电平,表明PCIE插槽所插入板卡为Intel GPU板卡;把GPU 板卡身份信号线GPU_TYPE_ID拉为低电平,表明是NVIDIA GPU板卡;所述BMC芯片则根据 检测GPU板卡身份信号线GPU_TYPE_ID的高低电平来判断PCIE插槽所插入的GPU板卡类 型。
8. 根据权利要求6或7所述的兼容不同GPU的管理系统,其特征在于:所述排针的ΡΙΝΙ 通过阻值为4. 7Κ欧姆的上拉电阻连接到3. 3V辅助电源;ΡΙΝ2通过GPU板卡身份信号线 GPU_TYPE_ID连接到BMC芯片的GPI0针脚;PIN3接地。
9. 一种兼容不同GPU的管理系统的设计方法,其特征在于:所述方法包括以下步骤: 步骤1 :在BMC芯片的程序数据库中编写适配于Intel和NVIDIA两种GPU板卡的监控 程序; 步骤2 :把编写好的监控程序通过编译工具生成二进制烧录文件,烧录进BMC芯片的 Firmware 芯片; 步骤3 :根据PCIE插槽插入GPU板卡的类型设置标识GPU板卡排针的电平; 步骤4 :插入主板电源线缆,即主板存在辅助电源但未开机时,BMC芯片正常工作; 步骤5 :BMC芯片通过GPU板卡身份信号线GPU_TYPE_ID检测标识GPU板卡的排针的电 平;GPU板卡身份信号线GPU_TYPE_ID为高电平时调用Intel GPU板卡的监控子程序,为低 电平时调用NVIDIA GPU板卡的监控子程序; 步骤6 :主板开机上电,使主板正常工作; 步骤7 :主板开机完成后,BMC芯片与GPU板卡正常通讯,取得GPU板卡相关信息,BMC 芯片通过LPC总线读取主板BIOS和OS信息,从中得到GPU板卡的相关信息; 步骤8 :BMC芯片对比分析来自两方面的信息;若信息一致,BMC芯片持续监控GPU板 卡;若信息不一致,BMC芯片通过错误指示信号线ERR_C0NTR0L控制错误指示灯亮红灯告 警,并通过以太网络或串口与手持终端通讯,以友好直观的界面向用户报警或者显示监控
【文档编号】G06F11/32GK104111886SQ201410290190
【公开日】2014年10月22日 申请日期:2014年6月25日 优先权日:2014年6月25日
【发明者】郑臣明, 刘文君, 柳胜杰 申请人:曙光信息产业(北京)有限公司