本发明涉及服务器系统体系结构设计技术领域,具体涉及一种基于串口的整机自动化PCIE通信质量测试方法。
背景技术:
高端服务器单机支持PCIE槽位越来越多,原始的服务器开关机过程中PCIE槽位速度稳定性是在linux系统下通过运行专用测试程序进行测试。由于固定时间内的有效测试次数受到环境搭建时间,系统安装时间,开机时间,进系统时间,系统下运行程序时间三方面影响。
如何能在固定时间内对整机所有PCIE槽位进行有效、自动、批量、高效的测试,以评测开关机过程中PCIE槽位通信质量,是目前系统体系结构设计中非常关注的问题。
技术实现要素:
本发明要解决的技术问题是:本发明针对以上问题,提供一种基于串口的整机自动化PCIE通信质量测试方法。
本发明所采用的技术方案为:
一种基于串口的整机自动化PCIE通信质量测试方法,所述测试方法基于服务器POST过程中初始化PCIE槽位总线的速度为依据,利用串口重定向功能,将POST过程中初始化信息与设定的PCIE标准总线速度对比,以判定PCIE源端的通信质量。
测试过程中的重启是基于服务器BMC,通过ipmi命令控制服务器自动化,利用VI测试软件指定串口传输的端口号与待测机台的BMC IP地址生成测试数据,在指定的机台和串口号上进行PCIE槽位速度检测测试,通过自动化的串口信息遍历测试,来评测待测机台开关机过程中所有PCIE槽位通信质量。
PCIE槽位上搭配满足槽位长度的PCIE 3.0的外插卡。
所述外插卡优选PCIE 3.0的HCA卡。
所述测试方法步骤如下:
1)在待测服务器的所有PCIE槽位上插上PCIE 3.0 HCA卡,将待测服务器与Client端通过串口线和网线互联;
2)准备好Client端,Client端安装Windows系统,将labview程序运行环境和VI测试软件包以及ipmi工具“ipmitool.exe”拷贝到C:\Windows下;
3)在Client端安装VI测试软件包,安装完成后重启Client端;
4)在Client端打开cmd命令窗口,通过ping bmcip地址命令检查client端与BMC端的联通性;
5)在Client端运行VI测试软件,在对应栏里填写检测环境配置信息;
6)在Client端点击“开始”程序开始自动运行,运行结果记录在VI测试软件界面的Result栏下,检测项包括3个:1、BMC联通性检查,2、主板开机检查,3、PCIE通信质量检查。
步骤4)中填写检测环境配置信息内容包括:
1)在BMCIP栏输入待测机台IP地址;
2)项目名称栏填写待测板卡名称;
3)COM口栏选择Client端系统下识别到的与待测机台连接的串口号;
4)在Key栏中填入需要检测的PCIE标准总线速度。
待测服务器与Client端的连接方式如下:待测服务器的串口通过串口线与Client端连接,待测服务器的BMC网口通过网线与Client端连接。
所述测试方法通过VI测试软件总计数器和PASS栏查看总体测试结果,如果总计数器数目=PASS栏计数次数,测试PASS,如果总计数器数目>PASS栏计数次数,测试FAIL。
如果测试FAIL,通过log日志批量检查具体报错位置。
整个测试过程中保存待测机台所有开关机过程中所有PCIE槽位link speed数据。
本发明的有益效果为:
本发明方法,可以只通过串口线和网线连接Client测试端,实现被测机器在无系统无外设无特殊设置的前提下,通过自动化的串口信息遍历测试,来评测待测机台开关机过程中所有PCIE槽位通信质量,增进系统PCIE槽位稳定性,提高测试效率和产品竞争力。
以高端8路服务器(支持24个PCIE槽位),硬件环境到位,12小时测试时间为例,原始的服务器开关机过程中PCIE槽位通信质量是在linux系统下运行专用测试程序进行测试,操作系统全安装需1.5小时,开机进系统进行程序检测到下次重启至少需要5分钟,12小时最多运行126次测试;使用基于串口的整机自动化PCIE通信质量测试方法后,无需安装操作系统,开机检测POST自检信息到下次重启只需2.5分钟,12小时可运行288次测试;从实验数据看,本发明在同等时间下测试效率至少提高了2.3倍,极大的提高了测试效率。
附图说明
图1为PXE server网络环境配置图;
图2为测试方法流程图。
具体实施方式
根据说明书附图,结合具体实施方式对本发明进一步说明:
实施例1:
一种基于串口的整机自动化PCIE通信质量测试方法,所述测试方法基于服务器POST过程中初始化PCIE槽位总线速度为依据,利用串口重定向功能,将POST过程中初始化信息与设定的PCIE标准总线速度对比,以判定PCIE源端的通信质量。
实施例2
在实施例1的基础,本实施例整个测试的重启是基于服务器BMC,通过ipmi命令控制服务器自动化,利用VI测试软件指定串口传输的端口号与待测机台的BMC IP地址生成测试数据,在指定的机台和串口号上进行PCIE槽位速度检测测试,通过自动化的串口信息遍历测试,来评测待测机台开关机过程中所有PCIE槽位通信质量。
实施例3
在实施例2的基础,本实施例利用PCIe 3.0与旧版PCIe架构的向下兼容的特性,PCIE槽位上搭配任何满足槽位长度的PCIE 3.0的外插卡都可以实现PCIE槽位总线速度测试。
实施例4
在实施例3的基础,本实施例推荐对PCIE信号质量要求较高的PCIE 3.0的HCA卡
实施例5
如图2所示,在实施例3的基础,本实施例所述测试方法步骤如下:
1)在待测服务器的所有PCIE槽位上插上PCIE 3.0 HCA卡,将待测服务器与Client端通过串口线和网线互联;
2)准备好Client端,Client端必须是Windows系统,将labview程序运行环境和VI测试软件包以及ipmi工具“ipmitool.exe”拷贝到C:\Windows下;
3)Client端安装VI测试软件包,安装完成后重启Client端;
4)Client端打开cmd命令窗口,通过ping bmcip地址命令检查client端与BMC端的联通性,举例:当前待测服务器BMCIP为192.168.0.104,通过命令行窗口执行ping 192.168.0.104,网络联通;
5)Client端运行VI测试软件,在对应栏里填写检测环境配置信息;通过填写必要参数,运行测试,确保Infiniband对外互联的端口连接正常;
6)Client端点击“开始”程序开始自动运行,运行结果记录在VI测试软件界面的Result栏下,检测项包括3个:1、BMC联通性检查,2、主板开机检查,3、PCIE Check(PCIE通信质量检查)。
InfiniBand架构是一种支持多并发链接的"转换线缆"技术,在这种技术中,每种链接都可以达到2.5 Gbps的运行速度。这种架构在一个链接的时候速度是500 MB/秒,四个链接的时候速度是2 GB/秒,12个链接的时候速度可以达到6 GB /秒。
实施例6
在实施例5的基础,本实施例步骤4)中填写检测环境配置信息内容包括:
1)在BMCIP栏输入待测机台IP地址:192.168.0.104;
2)项目名称栏填写待测板卡名称,如YZCA-00589-101;
3)COM口栏选择Client端系统下识别到的与待测机台连接的串口号,如COM3;
4)在Key栏中填入需要检测的PCIE标准总线速度。
实施例7
如图1所示,在实施例5的基础,本实施例待测服务器与Client端的连接方式如下:待测服务器的串口,通过串口线与Client端连接,待测服务器的BMC网口通过网线与Client端连接。系统连接完毕后,确保待测机台与Client端连接通路正常,client的设备管理器下可以正常识别串口连接。
实施例8
在实施例6或7的基础,本实施例所述测试方法通过VI测试软件总计数器和PASS栏查看总体测试结果,如果总计数器数目=PASS栏计数次数,测试PASS,如果总计数器数目>PASS栏计数次数,测试FAIL。
实施例9
在实施例8的基础,本实施例如果测试FAIL,通过log日志批量检查具体报错位置。
例:
Skt[0], D[2]:F[2] Link up as x08 Gen3!
Skt[0], D[2]:F[1] Link Down!
解析:
Skt[n]:代表第n个CPU槽位下对应的PCIE槽位;
D[n]:F[n]:是PCIE槽位的device ID和FunctionID号,结合CPU槽位位置,可以定位到具体的PCIE槽位;
Link up as x08 Gen3!:如果测试的是PCIE GEN3槽位,此处显示Gen3是PASS,显示Gen2和Gen1是FAIL;如果测试的是PCIE Gen2槽位,此处显示Gen2是PASS,显示Gen3和Gen1是FAIL ;没有完全中是否存在Gen2和Gen1,Link up as x08 Gen2;
Link Down!:该槽位没有安装PCIE设备
实施例10
在实施例9的基础,本实施例整个测试过程保存待测机台所有开关机过程中所有PCIE槽位link speed数据,便于后期的分析。
实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。