一种板卡的故障测试方法以及故障测试卡的制作方法

文档序号:6375846阅读:347来源:国知局
专利名称:一种板卡的故障测试方法以及故障测试卡的制作方法
技术领域
本发明涉及计算机技术领域,更具体地,涉及一种基于无限带宽InfiniBand技术设计的板卡的故障测试方法以及一种故障测试卡。
背景技术
InfiniBand技术是一种开放标准的高带宽、高速网络互联技术,广泛应用于服务器与服务器(比如复制,分布式工作等),服务器和存储设备(比如存储区域网络SAN和直接存储附件)以及服务器和网络之间(比如LAN、WAN和因特网)的通信。目前服务器领域Infiniband技术的数据速率已经发展到QDR(Quad Data Rate,4倍数据倍率)和FDR(Fourteen Data Rate, 14 倍数据速率),分别为每端口 40Gbps 和 56Gbps。然而,对于这些高速的Infiniband网卡、交换机等,在制造生产时非常容易出现·板卡硬件故障,目前针对此类硬件维修的方法只有硬件分析常规流程查看故障原因,费事费力,而且工作效率很低,经常需要有经验的故障分析人员花很多时间来判断、分析故障。传统的Infiniband板卡的维修方法需要按照步骤操作,一般测量、分析一块板子至少需要30分钟,而且需要有经验的人员才能较快分析问题,并且还容易出现人工疏漏问题。在服务器领域,Infiniband网卡和交换机板卡等基本都是大规模量产的,如果在分析维修板卡过程中继续采用人工,那么耗费的时间和成本是巨大的。因此,有必要提供一种能够降低时间和成本的故障测试方法。

发明内容
为解决现有技术存在的问题,本发明提供了一种板卡的故障测试方法以及故障测试卡,使得能够快速检测板卡是否基本故障,从而提供板卡的故障检测效率。根据本发明的一方面,提供了一种板卡的故障测试方法,所述板卡是基于无限带宽InfiniBand技术设计的板卡,所述故障测试方法包括电压采集模块对所述板卡中的预设电压测试点进行电压采集并将采集到的电压数据传送给电压比较模块;所述电压比较模块判断采集到的电压数据是否在预设定的电压范围内,如果不是,则输出电压坏指示;时钟信号采集模块对所述板卡的时钟信号测试点进行信号采集,主控制模块在所述时钟信号采集模块未采集到时钟信号时输出时钟信号不存在指示;串行外设接口 SPI信号采集模块对闪存Flash存储器的SPI信号测试点进行信号采集,所述主控制模块在所述SPI信号采集模块未采集到SPI信号时输出SPI信号不存在指示;重置信号采集模块对所述板卡的重置信号测试点在预设的信号采集周期内持续进行信号采集,所述主控制模块判断出在所述信息采集周期内采集的重置信号具有高电平时,输出重置不成功指示。
在可选实施例中,所述故障测试方法还包括四通道小型可插拔QSFP接口环回模块从所述板卡的QSFP接口发送端接收数据信号,并将所述数据信号发送给所述板卡的QSFP接口接收端;以及所述QSFP接口环回模块在接收所述数据信号和发送所述数据信号正常时,输出连接正常指示,否则输出连接不正常指示。在可选实施例中,所述电压采集模块采集的电压包括3. 3V、2. 5V、1. 8V、12V、1. 2V、I. OV或者0. 9V,或者它们的任意组合。根据本发明实施例,还提供了一种故障测试卡,所述故障测试卡包括电压采集模块,用于对基于无限带宽InfiniBand技术设计的板卡中的预设电压 测试点进行电压采集;电压比较模块,用于接收所述电压采集模块采集到的电压数据,并且判断所述采集到的电压数据是否在预设定的电压范围内,如果不是,则输出电压坏指示;时钟信号采集模块,用于对所述板卡的时钟信号测试点进行信号采集,主控制模块用于在所述时钟信号采集模块未采集到时钟信号时输出时钟信号不存在指示;串行外设接口 SPI信号采集模块,用于对所述板卡中的闪存Flash存储器的SPI信号测试点进行信号采集,所述主控制模块还用于在所述SPI信号采集模块未采集到SPI信号时输出SPI信号不存在指示;重置信号采集模块,用于对所述板卡的重置信号测试点在预设的信号采集周期内持续进行信号采集,所述主控制模块还用于在判断出所述信息采集周期内采集的重置信号具有低电平时,输出重置不成功指示。 在可选实施例中,所述故障测试卡还包括四通道小型可插拔QSFP接口环回模块,用于从所述板卡的QSFP接口发送端接收数据信号,并将所述数据信号发送给所述板卡的QSFP接口接收端;以及在接收所述数据信号和发送所述数据信号正常时,输出连接正常指示,否则输出连接不正常指示。在可选实施例中,所述故障测试卡还包括电源提供模块,用于为所述电压采集模块、电压比较模块和主控制模块提供电能;或者,为所述电压采集模块、电压比较模块、主控制模块和QSFP接口环回模块提供电倉泛。在可选实施例中,所述故障测试卡还包括显示模块,用于显示部分或全部指示。在可选实施例中,所述电压采集模块采集的电压包括3. 3V、2. 5V、1. 8V、12V、1. 2V、I. OV或者0. 9V,或者它们的任意组合。在可选实施例中,所述故障测试卡包括以下之一或任意组合所述电压比较模块判断出采集到的电压数据在预设定的电压范围内时输出电压好指示;所述主控制模块在所述时钟信号采集模块采集到时钟信号时输出时钟信号存在指示;所述主控制模块在所述SPI信号采集模块采集到SPI信号时输出SPI信号存在指示;所述主控制模块判断出所述重置信号采集模块在所述信息采集周期内采集的重置信号都为低电平时,输出重置成功指示。在可选实施例中,所述主控制模块在接收到所述电压比较模块采集到的电压好指示、以及确定出时钟信号存在、SPI信号存在以及重置成功时,输出所述板卡测试通过指示。采用本发明实施例的板卡的故障测试方法以及故障测试卡,可以替代常规的测试流程,并快速定位出基本的板卡故障,从而能够大大减少测试人员的劳动量。而且,使得没有InfiniBand板卡知识的测试人员也可以轻松判断出板卡的问题故障


图I是根据本发明一实施例的测试InfiniBand板卡的故障测试卡的结构示意图。图2是根据本发明另一实施例的测试InfiniBand板卡的故障测试卡的结构示意 图。图3是根据本发明一实施例的对InfiniBand板卡进行故障测试的方法流程示意图。
具体实施例方式下面结合附图对本发明进行详细说明。图I是根据本发明一实施例的测试InfiniBand板卡的故障测试卡的结构示意图。如图I所示,本发明实施例的故障测试卡包括电压采集模块10、电压比较模块12、时钟信号采集模块20、串行外设接口 SPI信号采集模块30、重置信号采集模块40和主控制模块50。电压采集模块10,用于对基于无限带宽InfiniBand技术设计的板卡中的预设电压测试点进行电压采集。其中,电压采集模块可以是模拟/数字信号(A/D)转换模块。具体地,对于Infiniband板卡中必需测量的电压,在Infiniband板卡的相应电路上设置电压测试点,然后A/D转换模块可以采集这样电压测试点的电压。针对现有的Infiniband板卡,主要需要采集的电压可以有3. 3V、2.5V、L8V、12V、I. 2V、1. OV,O. 9V。电压比较模块12与电压采集模块10和主控制模块50连接。电压比较模块可以是比较器。电压比较模块12用于接收电压采集模块10采集到的电压数据,并且判断采集到的电压数据是否在预设定的电压范围内,如果不是,则输出电压不良指示;如果是,则输出电压良好指示。在可选实施例中,预设定的电压范围一般是在每个测试点对应的电压上加入5%的量程,如对于3. 3V的电压,那么预设定的电压范围在3. 315V-3. 465V之间。如果从测试点测得的电压在此之间,则会向主控制模块50输出一个3. 3V电压好的信号;反之则会输出一个3. 3V电压坏的信号。在一可选实施例中,主控制模块50将相应的指令传递给显示模块显示。在另一可选实施例中,主控制模块在接收到电压坏指示时发出声音报警信号。在可选实施例中,也是可以是电压比较模块12直接将电压坏指示或者电压坏指示传递给显示模块。时钟信号采集模块20,用于对所述板卡的时钟信号测试点进行信号采集,主控制模块50在所述时钟信号采集模块未采集到时钟信号时输出时钟信号不存在指示。
时钟Clock信号米集模块20用于将时钟Clock信号米集出来。在一实施例中,Clock信号采集模块20可以是A/D转换模块,由于Infiniband板卡中的Clock信号频率一般非常高,例如50MHz、IOOMHz、156. 25MHz。因此这里的A/D转换模块采集不能很准确,只能验证Clock信号是否有输出。主控制模块50在验证了 Clock信号存在后会向显示模块发送一个Clock存在信号;否则发送Clock不存在信号。串行外设接口 SPI信号采集模块30,用于对所述板卡中的闪存Flash存储器的SPI信号测试点进行信号采集,主控制模块50在所述SPI信号采集模块未采集到SPI信号时输出SPI信号不存在指示。SPI信号采集类似于Clock信号采集,也可以通过A/D转换模块完成。SPI信号一般在板卡上电或下电时存在,如果抓取SPI信号存在则主控制模块50会向显示模块发送SPI存在信号,否则发送SPI不存在信号。重置Reset信号采集模块40,用于对所述板卡的重置信号测试点在预设的信号采集周期内持续进行信号采集,主控制模块50判断出在所述信息采集周期内重置信号都为 低电平时,输出重置不成功指示。其中,信号采集周期可以是大于100毫秒。类似地,Reset信号采集模块也可以是A/D转换模块。由于Infiniband板卡的特殊规定,因此Reset信号采集模块采集Reset信号需要持续时间大于100ms。而且,Reset信号不但要A/D转换模块采样出低电平有效,还要保证在大于IOOrns的时间内全部是低电平,同样的,主控制模块50会在信号采集周期内测得的Reset信号都为低电平时向显示模块发送Reset成功信号;否则发送Reset不成功信号。在本发明实施例中,主控制模块50是指为整个数据采集和分析提供数据处理能力以及与显示模块通信的模块;为了增加处理数据的能力,主控制模块50可以采用ARM等高性能芯片。图2是根据本发明另一实施例的测试InfiniBand板卡的故障测试卡的结构示意图。在本发明实施例中,故障测试卡包括图I示出的电压采集模块10、电压比较模块12、时钟信号采集模块20、串行外设接口 SPI信号采集模块30、重置信号采集模块40和主控制模块50。此外,故障测试卡还包括四通道小型可插拔QSFP接口环回模块60,用于从板卡的QSFP接口发送端接收数据信号,并将数据信号发送给所述板卡的QSFP接口接收端;以及在接收所述数据信号和发送所述数据信号正常时,输出连接正常指示,否则输出连接不正常指示。这样,当故障测试卡的一接口与板卡的QSFP接口发送端相连接时以及另一接口与板卡的QSFP接口接收端相连接,可以将板卡的数据信号回环起来并进行测试。而现有技术中,为测试该功能,需要将被测试板卡通过Infiniband线缆与另一 Inf iniband板卡连接来进行测试。这进一步提高了测试效率和减少了不必要的成本。在可选实施例中,故障测试卡还包括电源提供模块70,用于为所述电压采集模块、电压比较模块和主控制模块和QSFP接口环回模块等提供电能。在可选实施例中,主控制模块在接收到所述电压比较模块采集到的电压好、以及确定出时钟信号存在、SPI信号存在以及重置成功时,输出所述板卡测试通过指示。图3是根据本发明一实施例的对InfiniBand板卡进行故障测试的方法流程示意图。参考图3,该故障测试的方法包括S101,电压采集模块对所述板卡中的预设电压测试点进行电压采集并将采集到的电压数据传送给电压比较模块。S102,电压比较模块判断采集到的电压数据是否在预设定的电压范围内,如果不是,则输出电压坏指示。可选地或另外,电压比较模块还可以在判断出采集到的电压数据在预设定的电压范围内是时,输出电压好指示。S103,时钟信号采集模块对所述板卡的时钟信号测试点进行信号采集,主控制模块在所述时钟信号采集模块未采集到时钟信号时输出时钟信号不存在指示。可选地或另夕卜,主控制模块在时钟信号采集模块采集到时钟信号时输出时钟信号存在指示。S104,串行外设接口 SPI信号采集模块对板卡中的闪存Flash存储器的SPI信号 测试点进行信号采集,所述主控制模块在所述SPI信号采集模块未采集到SPI信号时输出SPI信号不存在指示。可选地或另外,主控制模块在SPI信号采集模块采集到SPI信号时输出SPI信号存在指示。S105,重置信号采集模块对所述板卡的重置信号测试点在预设的信号采集周期内持续进行信号采集,主控制模块判断出在信息采集周期内采集的重置信号具有高电平时,输出重置不成功指示。可选地或另外,主控制模块判断出在信息采集周期内采集的重置信号都为低电平时,输出重置成功指示。上述各模块以及下面描述涉及的模块的具体工作请参看本说明书中对故障测试卡进行描述的部分,在此不再赘述。在可选实施例中,所述故障测试方法还包括四通道小型可插拔QSFP接口环回模块从所述板卡的QSFP接口发送端接收数据信号,并将所述数据信号发送给所述板卡的QSFP接口接收端;以及所述QSFP接口环回模块在接收所述数据信号和发送所述数据信号正常时,输出连接正常指示,否则输出连接不正常指示。在可选实施例中,所述电压采集模块采集的电压包括3. 3V、2. 5V、1. 8V、12V、1. 2V、I. OV或者0. 9V,或者它们的任意组合。采用本发明实施例的板卡的故障测试方法以及故障测试卡,可以替代常规的测试流程,并快速定位出基本的板卡故障,并能够将测试结果显示出来。这种故障测试方法以及故障测试卡能够大大减少测试人员的劳动量,而且,可使得没有InfiniBand板卡知识的测试人员也可以轻松判断出板卡的问题故障以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种板卡的故障测试方法,所述板卡是基于无限带宽InfiniBand技术设计的板卡,所述故障测试方法包括 电压采集模块对所述板卡中的预设电压测试点进行电压采集并将采集到的电压数据传送给电压比较模块; 所述电压比较模块判断采集到的电压数据是否在预设定的电压范围内,如果不是,则输出电压坏指示; 时钟信号采集模块对所述板卡的时钟信号测试点进行信号采集,主控制模块在所述时钟信号采集模块未采集到时钟信号时输出时钟信号不存在指示; 串行外设接口 SPI信号采集模块对板卡中的闪存Flash存储器的SPI信号测试点进行信号采集,所述主控制模块在所述SPI信号采集模块未采集到SPI信号时输出SPI信号不存在指不; 重置信号采集模块对所述板卡的重置信号测试点在预设的信号采集周期内持续进行信号采集,所述主控制模块判断出所述信息采集周期内采集的重置信号具有高电平时,输出重置不成功指示。
2.根据权利要求I所述的故障测试方法,其特征在于,所述故障测试方法还包括 四通道小型可插拔QSFP接口环回模块从所述板卡的QSFP接口发送端接收数据信号,并将所述数据信号发送给所述板卡的QSFP接口接收端; 所述QSFP接口环回模块在接收所述数据信号和发送所述数据信号正常时,输出连接正常指示,否则输出连接不正常指示。
3.根据权利要求I所述的故障测试方法,其特征在于,所述电压采集模块采集的电压包括3. 3V、2. 5V、1. 8V、12V、1. 2V、1. OV或者0. 9V,或者它们的任意组合。
4.一种故障测试卡,所述故障测试卡包括 电压采集模块,用于对基于无限带宽InfiniBand技术设计的板卡中的预设电压测试点进行电压采集; 电压比较模块,用于接收所述电压采集模块发送的采集到的电压数据,并且判断所述采集到的电压数据是否在预设定的电压范围内,如果不是,则输出电压坏指示; 时钟信号采集模块,用于对所述板卡的时钟信号测试点进行信号采集,主控制模块用于在所述时钟信号采集模块未采集到时钟信号时输出时钟信号不存在指示; 串行外设接口 SPI信号采集模块,用于对所述板卡中的闪存Flash存储器的SPI信号测试点进行信号采集,所述主控制模块还用于在所述SPI信号采集模块未采集到SPI信号时输出SPI信号不存在指示; 重置信号采集模块,用于对所述板卡的重置信号测试点在预设的信号采集周期内持续进行信号采集,所述主控制模块还用于在判断出所述信息采集周期内采集的重置信号具有高电平时,输出重置不成功指示。
5.根据权利要求4所述的故障测试卡,其特征在于,所述故障测试卡还包括 四通道小型可插拔QSFP接口环回模块,用于从所述板卡的QSFP接口发送端接收数据信号,并将所述数据信号发送给所述板卡的QSFP接口接收端;以及在接收所述数据信号和发送所述数据信号正常时,输出连接正常指示,否则输出连接不正常指示。
6.根据权利要求4或5所述的故障测试卡,其特征在于,所述故障测试卡还包括电源提供模块,用于为所述电压采集模块、电压比较模块和主控制模块提供电能;或者 为所述电压采集模块、电压比较模块、主控制模块和QSFP接口环回模块提供电能。
7.根据权利要求4或5所述的故障测试卡,其特征在于,所述故障测试卡还包括显示模块,用于显示部分或全部指示。
8.根据权利要求4所述的故障测试卡,其特征在于,所述电压采集模块采集的电压包括3. 3V、2. 5V、1. 8V、12V、1. 2V、1. OV或者0. 9V,或者它们的任意组合。
9.根据权利要求4所述的故障测试卡,其特征在于,所述故障测试卡包括以下之一或任意组合 所述电压比较模块判断出采集到的电压数据在预设定的电压范围内时输出电压好指示; 所述主控制模块在所述时钟信号采集模块采集到时钟信号时输出时钟信号存在指示; 所述主控制模块在所述SPI信号采集模块采集到SPI信号时输出SPI信号存在指示;所述主控制模块判断出所述重置信号采集模块在所述信息采集周期内采集的重置信号都为低电平时,输出重置成功指示。
10.根据权利要求9所述的故障测试卡,其特征在于,所述主控制模块在接收到所述电压比较模块采集到的电压好指示、以及确定出时钟信号存在、SPI信号存在以及重置成功时,输出所述板卡测试通过指示。
全文摘要
本发明公开的故障测试卡包括电压采集模块,用于对InfiniBand板卡中的电压测试点进行电压采集;电压比较模块,用于接收并判断采集到的电压数据是否在预设定的电压范围内,如果不是,则输出电压坏指示;时钟信号采集模块,用于对板卡的时钟信号测试点进行信号采集,主控制模块在未采集到时钟信号时输出时钟信号不存在指示;SPI信号采集模块,用于对Flash SPI信号测试点进行信号采集,主控制模块在未采集到SPI信号时输出SPI信号不存在指示;重置信号采集模块,用于对重置信号测试点在预设的信号采集周期内持续进行信号采集,主控制模块判断出采集的重置信号具有高电平时,输出重置不成功指示。本发明还公开了一种故障测试卡。采用本发明,可以提高InfiniBand板卡检测效率。
文档编号G06F11/267GK102819477SQ20121031170
公开日2012年12月12日 申请日期2012年8月28日 优先权日2012年8月28日
发明者赵振伟, 王卫钢, 陈进 申请人:曙光信息产业(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1