一种服务器RAS功能测试的方法、装置、设备和介质与流程

文档序号:26672484发布日期:2021-09-17 23:09阅读:372来源:国知局
一种服务器ras功能测试的方法、装置、设备和介质
技术领域
:1.本技术涉及网络服务
技术领域
:,特别是涉及一种服务器ras功能测试的方法、装置、设备和计算机可读存储介质。
背景技术
::2.服务器是网络系统以及计算平台的核心,用于存储众多重要的数据和运行网络服务。随着高科技的发展,对服务器的安全性能、稳定性能等要求非常高。服务器的安全性能要求主要体现在ras性能上,ras性能指的是机器的可靠性(reliability)、可用性(availability)和可服务性(serviceability)。3.cpu(centralprocessingunit,中央处理器)作为服务器的运算和控制核心,是信息处理、程序运行的最终执行单元。内存、内存储器和主存储器,用于暂时存放cpu中的运算数据,以及硬盘等外部存储器交换的数据,是外存与cpu进行沟通的桥梁。cpu和内存作为服务器重要的数据处理和运算中心,其稳定性及性能的强弱直接影响服务器的ras性能。为了使服务器能更加稳定的工作,就需要在cpu和内存出现错误时,能快速的诊断、纠正错误,这就需要测试人员前期做好注错测验工作。4.对于国产海光平台来说,通常采用的注错方法就是手动反复操作执行各种注错命令,人工注错的方式使得注错测验工作的测试效率低下、易出错。5.可见,如何提升注错测验工作的测试效率,是本领域技术人员需要解决的问题。技术实现要素:6.本技术实施例的目的是提供一种服务器ras功能测试的方法、装置、设备和计算机可读存储介质,可以提升注错测验工作的测试效率。7.为解决上述技术问题,本技术实施例提供一种服务器ras功能测试的方法,包括:8.预先将各设备的错误类型对应的注错程序集成于基板管理控制器的管理页面;9.接收注错指令;10.根据所述注错指令指示的注错设备和测试方式,从所述管理页面中调用相应的目标注错程序,以执行错误注入操作。11.可选地,所述根据所述注错指令指示的注错设备和测试方式,从所述管理页面中调用相应的目标注错程序,以执行错误注入操作包括:12.在所述注错指令指示的注错设备为cpu,所述测试方式包括多种错误类型顺序测试的情况下,按照多种错误类型顺序依次从所述管理页面中调用所述cpu的多种错误类型各自相应的目标注错程序,以执行错误注入操作。13.可选地,所述根据所述注错指令指示的注错设备和测试方式,从所述管理页面中调用相应的目标注错程序,以执行错误注入操作包括:14.在所述注错指令指示的注错设备为cpu,所述测试方式包括目标错误类型n次测试的情况下,从所述管理页面中调用所述cpu的目标错误类型相应的目标注错程序,以循环执行n次错误注入操作。15.可选地,所述根据所述注错指令指示的注错设备和测试方式,从所述管理页面中调用相应的目标注错程序,以执行错误注入操作包括:16.在所述注错指令指示的注错设备为内存,所述测试方式包括错误注入模式和目标错误类型的情况下,从所述管理页面中调用所述内存的目标错误类型相应的目标注错程序;17.清除所述内存对应的寄存器中的信息;18.按照所述错误注入模式执行所述目标注错程序,并将生成的错误信息存储至所述寄存器。19.可选地,所述根据所述注错指令指示的注错设备和测试方式,从所述管理页面中调用相应的目标注错程序,以执行错误注入操作包括:20.在所述注错指令指示的注错设备为pcie的目标端口,所述测试方式包括目标错误类型、重试次数和重试时间间隔的情况下,从所述管理页面中调用所述pcie的目标错误类型相应的目标注错程序;21.按照所述重试时间间隔,启动所述目标注错程序对所述pcie的目标端口执行错误注入操作;直至对所述pcie的目标端口执行错误注入操作的次数达到所述重试次数,则结束错误注入操作。22.可选地,在根据所述注错指令指示的注错设备和测试方式,从所述管理页面中调用相应的目标注错程序,以执行错误注入操作之后还包括:23.在所述基板管理控制器的管理页面上显示执行错误注入操作生成的错误信息;其中,所述错误信息包括错误注入是否成功、错误类型和错误地址。24.本技术实施例还提供了一种服务器ras功能测试的装置,包括集成单元、接收单元和注错单元;25.所述集成单元,用于预先将各设备的错误类型对应的注错程序集成于基板管理控制器的管理页面;26.所述接收单元,用于接收注错指令;27.所述注错单元,用于根据所述注错指令指示的注错设备和测试方式,从所述管理页面中调用相应的目标注错程序,以执行错误注入操作。28.可选地,所述注错单元用于在所述注错指令指示的注错设备为cpu,所述测试方式包括多种错误类型顺序测试的情况下,按照多种错误类型顺序依次从所述管理页面中调用所述cpu的多种错误类型各自相应的目标注错程序,以执行错误注入操作。29.可选地,所述注错单元用于在所述注错指令指示的注错设备为cpu,所述测试方式包括目标错误类型n次测试的情况下,从所述管理页面中调用所述cpu的目标错误类型相应的目标注错程序,以循环执行n次错误注入操作。30.可选地,所述注错单元包括调用子单元、清除子单元、执行子单元和存储子单元;31.所述调用子单元,用于在所述注错指令指示的注错设备为内存,所述测试方式包括错误注入模式和目标错误类型的情况下,从所述管理页面中调用所述内存的目标错误类型相应的目标注错程序;32.所述清除子单元,用于清除所述内存对应的寄存器中的信息;33.所述执行子单元,用于按照所述错误注入模式执行所述目标注错程序;34.所述存储子单元,用于将生成的错误信息存储至所述寄存器。35.可选地,所述注错单元用于在所述注错指令指示的注错设备为pcie的目标端口,所述测试方式包括目标错误类型、重试次数和重试时间间隔的情况下,从所述管理页面中调用所述pcie的目标错误类型相应的目标注错程序;按照所述重试时间间隔,启动所述目标注错程序对所述pcie的目标端口执行错误注入操作;直至对所述pcie的目标端口执行错误注入操作的次数达到所述重试次数,则结束错误注入操作。36.可选地,还包括展示单元;37.所述展示单元,用于在所述基板管理控制器的管理页面上显示执行错误注入操作生成的错误信息;其中,所述错误信息包括错误注入是否成功、错误类型和错误地址。38.本技术实施例还提供了一种服务器ras功能测试的设备,包括:39.存储器,用于存储计算机程序;40.处理器,用于执行所述计算机程序以实现如上述任意一项所述服务器ras功能测试的方法的步骤。41.本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述服务器ras功能测试的方法的步骤。42.由上述技术方案可以看出,预先将各设备的错误类型对应的注错程序集成于基板管理控制器的管理页面;接收注错指令;根据注错指令指示的注错设备和测试方式,从管理页面中调用相应的目标注错程序,以执行错误注入操作。在该技术方案中,通过将注错程序集成在基板管理控制器的管理页面,在需要对设备进行注错测验时,直接调用对应的目标注错程序按照测试方式对设备进行注错测验即可,无需人工手动反复操作执行各种注错命令,提升了注错测验工作的测试效率。并且调用目标注错程序的方式,只需测试人员输入注错指令即可,不需要测试人员非常熟悉注错操作、注错类型,降低了对人员的专业性要求,进一步降低了测试的执行难度。附图说明43.为了更清楚地说明本技术实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。44.图1为本技术实施例提供的一种服务器ras功能测试的方法的流程图;45.图2为本技术实施例提供的一种服务器ras功能测试的装置的结构示意图;46.图3为本技术实施例提供的一种服务器ras功能测试的设备的结构示意图。具体实施方式47.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本技术保护范围。48.为了使本
技术领域
:的人员更好地理解本技术方案,下面结合附图和具体实施方式对本技术作进一步的详细说明。49.接下来,详细介绍本技术实施例所提供的一种服务器ras功能测试的方法。图1为本技术实施例提供的一种服务器ras功能测试的方法的流程图,该方法包括:50.s101:预先将各设备的错误类型对应的注错程序集成于基板管理控制器的管理页面。51.设备可以为影响服务器性能的设备,如cpu、内存、pcie(peripheralcomponentinterconnectexpress,高速串行计算机扩展总线标准)设备等。52.每种设备对应的错误类型有所差异,例如,cpu对应的错误类型可以包括处理器可修复(processorcorretable)、处理器不能修复的非致命(processoruncorrectablenon‑fatal)、处理器不能修复的致命(processoruncorrectablefat)等。内存对应的错误类型可以包括单比特位可修复(single‑bitcorrectable)、多比特位可修复(multi‑bitcorrectableerror)和多比特位不可修复(multi‑bituncorrectableerror)等。pcie对应的错误类型可以包括lcrc_tx、lcrc_rx、ecrc_tx、ecrc_rx、acs_fatal、acs_nonfatal等。53.注错程序可以用于实现对设备执行某个错误类型的错误注入操作。54.在本技术实施例中,可以将注错程序集成于基板管理控制器(baseboardmanagementcontroller,bmc)的管理页面即web页面,方便测试人员调用注错程序,以执行注错测验工作。55.s102:接收注错指令。56.在实际应用中,测试人员可以在bmcweb页面直接选择需要注入的故障,相当于输入注错指令。系统通过执行相应的注错程序可以实现故障注入操作。57.s103:根据注错指令指示的注错设备和测试方式,从管理页面中调用相应的目标注错程序,以执行错误注入操作。58.注错设备可以为cpu、内存或pcie等。测试方式可以包括错误类型,以及执行错误注入的方式等。59.下面将以设备的几种常见注错方式为例展开介绍。以注错指令指示的注错设备为cpu,测试方式包括多种错误类型顺序测试为例,在具体实现中,可以按照多种错误类型顺序依次从管理页面中调用cpu的多种错误类型各自相应的目标注错程序,以执行错误注入操作。60.举例说明,假设需要对cpu依次执行processorcorretable、processoruncorrectablenon‑fatal和processoruncorrectablefat这三种错误类型的错误注入操作,系统可以首先调用processorcorretable对应的注错程序;在完成processorcorretable注错之后,再调用processoruncorrectablenon‑fatal对应的注错程序;在完成processoruncorrectablenon‑fatal注错之后,最后调用processoruncorrectablefat对应的注错程序。61.以注错指令指示的注错设备为cpu,测试方式包括目标错误类型n次测试为例,在具体实现中,可以从管理页面中调用cpu的目标错误类型相应的目标注错程序,以循环执行n次错误注入操作。62.其中,n为正整数,其具体取值可以依据实际需求设置,在此不做限定。63.目标注错程序指的是当前所需执行错误注入操作的错误类型。目标注错程序可以为一种错误类型对应的注错程序,也可以为多种错误类型对应的所有注错程序。当目标注错程序为多种错误类型对应的所有注错程序时,可以依次执行各错误类型对应的注错程序。64.通过设置测试次数,从管理页面中调用一次目标注错程序,便可以实现对同一设备在目标错误类型下的多次测试,无需测试人员多次输入注错指令,简化了测试人员的工作。65.以注错指令指示的注错设备为内存,测试方式包括错误注入模式和目标错误类型为例,在具体实现中,可以从管理页面中调用内存的目标错误类型相应的目标注错程序;清除内存对应的寄存器中的信息;按照错误注入模式执行目标注错程序,并将生成的错误信息存储至寄存器。66.内存对应的错误注入模式可以包括持续注入模式(persisttent)、单次注入模式(one‑shot)、基于地址注入模式(address‑base)等。67.内存对应的寄存器一般为umc(unifymemorycontroller,统一内存控制器,)或mca(machinecheckarchetecture,硬件错误检查系统)状态(status)寄存器。68.在本技术实施例中,为了有效的记录执行目标注错程序后生成的错误信息,需要先将内存对应的寄存器中的信息清除,然后再按照错误注入模式执行目标注错程序,从而可以将生成的错误信息存储至寄存器。69.以注错指令指示的注错设备为pcie的目标端口,测试方式包括目标错误类型、重试次数和重试时间间隔为例,在具体实现中,可以从管理页面中调用pcie的目标错误类型相应的目标注错程序;按照重试时间间隔,启动目标注错程序对pcie的目标端口执行错误注入操作;直至对pcie的目标端口执行错误注入操作的次数达到重试次数,则结束错误注入操作。70.pcie有多个端口,目标端口指的是当前需要执行错误注入操作的端口。71.重试时间间隔可以是对pcie的目标端口每执行完一次错误注入操作与下一次执行错误注入操作的时间间隔。重试次数可以是执行错误注入操作的次数。72.重试时间间隔和重试次数可以根据实际需求设置,在此不做限定。73.在本技术实施例中,为了便于测试人员了解当前的测试情况,可以在根据注错指令指示的注错设备和测试方式,从管理页面中调用相应的目标注错程序,以执行错误注入操作之后,在基板管理控制器的管理页面上显示执行错误注入操作生成的错误信息;其中,错误信息可以包括错误注入是否成功、错误类型和错误地址。74.错误类型指的是对注错设备执行错误注入操作的错误类型。错误地址指的是出现故障的设备。75.由上述技术方案可以看出,预先将各设备的错误类型对应的注错程序集成于基板管理控制器的管理页面;接收注错指令;根据注错指令指示的注错设备和测试方式,从管理页面中调用相应的目标注错程序,以执行错误注入操作。在该技术方案中,通过将注错程序集成在基板管理控制器的管理页面,在需要对设备进行注错测验时,直接调用对应的目标注错程序按照测试方式对设备进行注错测验即可,无需人工手动反复操作执行各种注错命令,提升了注错测验工作的测试效率。并且调用目标注错程序的方式,只需测试人员输入注错指令即可,不需要测试人员非常熟悉注错操作、注错类型,降低了对人员的专业性要求,进一步降低了测试的执行难度。76.图2为本技术实施例提供的一种服务器ras功能测试的装置的结构示意图,包括集成单元21、接收单元22和注错单元23;77.集成单元21,用于预先将各设备的错误类型对应的注错程序集成于基板管理控制器的管理页面;78.接收单元22,用于接收注错指令;79.注错单元23,用于根据注错指令指示的注错设备和测试方式,从管理页面中调用相应的目标注错程序,以执行错误注入操作。80.可选地,注错单元用于在注错指令指示的注错设备为cpu,测试方式包括多种错误类型顺序测试的情况下,按照多种错误类型顺序依次从管理页面中调用cpu的多种错误类型各自相应的目标注错程序,以执行错误注入操作。81.可选地,注错单元用于在注错指令指示的注错设备为cpu,测试方式包括目标错误类型n次测试的情况下,从管理页面中调用cpu的目标错误类型相应的目标注错程序,以循环执行n次错误注入操作。82.可选地,注错单元包括调用子单元、清除子单元、执行子单元和存储子单元;83.调用子单元,用于在注错指令指示的注错设备为内存,测试方式包括错误注入模式和目标错误类型的情况下,从管理页面中调用内存的目标错误类型相应的目标注错程序;84.清除子单元,用于清除内存对应的寄存器中的信息;85.执行子单元,用于按照错误注入模式执行目标注错程序;86.存储子单元,用于将生成的错误信息存储至寄存器。87.可选地,注错单元用于在注错指令指示的注错设备为pcie的目标端口,测试方式包括目标错误类型、重试次数和重试时间间隔的情况下,从管理页面中调用pcie的目标错误类型相应的目标注错程序;按照重试时间间隔,启动目标注错程序对pcie的目标端口执行错误注入操作;直至对pcie的目标端口执行错误注入操作的次数达到重试次数,则结束错误注入操作。88.可选地,还包括展示单元;89.展示单元,用于在基板管理控制器的管理页面上显示执行错误注入操作生成的错误信息;其中,错误信息包括错误注入是否成功、错误类型和错误地址。90.图2所对应实施例中特征的说明可以参见图1所对应实施例的相关说明,这里不再一一赘述。91.由上述技术方案可以看出,预先将各设备的错误类型对应的注错程序集成于基板管理控制器的管理页面;接收注错指令;根据注错指令指示的注错设备和测试方式,从管理页面中调用相应的目标注错程序,以执行错误注入操作。在该技术方案中,通过将注错程序集成在基板管理控制器的管理页面,在需要对设备进行注错测验时,直接调用对应的目标注错程序按照测试方式对设备进行注错测验即可,无需人工手动反复操作执行各种注错命令,提升了注错测验工作的测试效率。并且调用目标注错程序的方式,只需测试人员输入注错指令即可,不需要测试人员非常熟悉注错操作、注错类型,降低了对人员的专业性要求,进一步降低了测试的执行难度。92.图3为本技术实施例提供的一种服务器ras功能测试的设备30的结构示意图,包括:93.存储器31,用于存储计算机程序;94.处理器32,用于执行计算机程序以实现如上述任意一项服务器ras功能测试的方法的步骤。95.本技术实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述任意一项服务器ras功能测试的方法的步骤。96.以上对本技术实施例所提供的一种服务器ras功能测试的方法、装置、设备和计算机可读存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本
技术领域
:的普通技术人员来说,在不脱离本技术原理的前提下,还可以对本技术进行若干改进和修饰,这些改进和修饰也落入本技术权利要求的保护范围内。97.专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。98.结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd‑rom、或
技术领域
:内所公知的任意其它形式的存储介质中。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1