一种双控存储产品测试方法、系统、终端及存储介质与流程

文档序号:24187611发布日期:2021-03-09 14:07阅读:142来源:国知局
一种双控存储产品测试方法、系统、终端及存储介质与流程

1.本发明涉及存储产品技术领域,具体涉及一种双控存储产品测试方法、系统、终端及存储介质。


背景技术:

2.双控jbof(存储在线)产品是一款高密度、高稳定且双控冗余的2u25全闪扩展柜,双控jbof前端需要搭配双控主柜存储产品,在存储主柜运行mcs系统(管理控制软件)来管理当前的双控jbof;存储双控jbof系统本身由psx(可编程芯片管理控制单元)来管理,mcs上层软件通过pcie接口与psx进行通信来设置和获取jbof相关信息;因此双控jbof产品本身硬盘可靠性的测试需要依赖主柜存储管理控制软件来进行。
3.当前对双控jbof产品硬盘可靠性进行测试,需要搭配双控主柜存储产品,在主柜存储上查看jbof硬盘相关状态信息。当前方案对存储主柜产品具有强依赖性,实际测试执行有局限性。


技术实现要素:

4.针对现有技术的上述不足,本发明提供一种双控存储产品测试方法、系统、终端及存储介质,以解决上述技术问题。
5.第一方面,本发明提供一种双控存储产品测试方法,包括:
6.通过串口登录制待测双控存储产品的管理控制单元;
7.预先设定测试次数,并根据所述测试次数控制所述管理控制单元循环重启;
8.在所述管理控制单元每次重启后,从所述管理控制单元采集芯片上行端口状态信息和下行端口状态信息;
9.将所述上行端口状态信息和下行端口状态信息保存至测试日志,并标记当前重启次数;
10.分析所述测试日志中的硬盘端口速率,获取测试结果。
11.进一步的,所述在所述管理控制单元每次重启后从所述管理控制单元采集芯片上行端口状态信息和下行端口状态信息,包括:
12.通过端口查看命令查看芯片上行端口状态信息和所有下行端口的状态信息,所述上行端口连接存储主柜,所述下行端口连接硬盘。
13.进一步的,所述分析测试日志中的硬盘端口速率获取测试结果,包括:
14.通过关机字段从所述测试日志中提取每次重启后的硬盘端口速率;
15.若所述硬盘端口速率为异常速率,则查看状态机字段,通过所述状态机字段获取当前链路对应的状态机状态。
16.第二方面,本发明提供一种双控存储产品测试系统,包括:
17.管理登录单元,配置用于通过串口登录制待测双控存储产品的管理控制单元;
18.次数设定单元,配置用于预先设定测试次数,并根据所述测试次数控制所述管理
控制单元循环重启;
19.信息采集单元,配置用于在所述管理控制单元每次重启后,从所述管理控制单元采集芯片上行端口状态信息和下行端口状态信息;
20.日志保存单元,配置用于将所述上行端口状态信息和下行端口状态信息保存至测试日志,并标记当前重启次数;
21.结果获取单元,配置用于分析所述测试日志中的硬盘端口速率,获取测试结果。
22.进一步的,所述信息采集单元包括:
23.采集模块,配置用于通过端口查看命令查看芯片上行端口状态信息和所有下行端口的状态信息,所述上行端口连接存储主柜,所述下行端口连接硬盘。
24.进一步的,所述结果获取单元包括:
25.速率提取模块,配置用于通过关机字段从所述测试日志中提取每次重启后的硬盘端口速率;
26.异常分析模块,配置用于若所述硬盘端口速率为异常速率,则查看状态机字段,通过所述状态机字段获取当前链路对应的状态机状态。
27.第三方面,提供一种终端,包括:
28.处理器、存储器,其中,
29.该存储器用于存储计算机程序,
30.该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
31.第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
32.本发明的有益效果在于,
33.本发明提供的双控存储产品测试方法、系统、终端及存储介质,可以依靠双控jbof产品本身对硬盘的可靠性进行测试,摆脱了对存储主柜的依赖;而且当硬盘出现故障时,当前方案可以直观体现出故障硬盘pcie链路状态机的当前故障状态,有助于研发快速精准定位故障原因;而且统计日志中硬盘故障发生的次数,可以统计硬盘故障发生的概率。
34.此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
35.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
36.图1是本发明一个实施例的方法的示意性流程图。
37.图2是本发明一个实施例的系统的示意性框图。
38.图3为本发明实施例提供的一种终端的结构示意图。
具体实施方式
39.为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施
例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
40.图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种双控存储产品测试系统。
41.如图1所示,该方法包括:
42.步骤110,通过串口登录制待测双控存储产品的管理控制单元;
43.步骤120,预先设定测试次数,并根据所述测试次数控制所述管理控制单元循环重启;
44.步骤130,在所述管理控制单元每次重启后,从所述管理控制单元采集芯片上行端口状态信息和下行端口状态信息;
45.步骤140,将所述上行端口状态信息和下行端口状态信息保存至测试日志,并标记当前重启次数;
46.步骤150,分析所述测试日志中的硬盘端口速率,获取测试结果。
47.具体的,所述双控存储产品测试方法包括:
48.(1)通过串口登录psx管理控制单元
49.(2)通过命令topo 0来查看双控jbof的pm8546芯片上行端口和各下行端口状态,pm8546上行端口连接存储主柜,pm8546下行端口连接双控jbof设备上硬盘,因此可以通过pm8546下行口状态看出jbof设备上硬盘状态,以如下命令查询结果为例:
50.logical port id:1
51.physical port id:16(stk2.0)
52.port type:dsp
53.max link rate:vector(3)
54.neg link rate:g3
55.bif link width:2
56.cfg link width:2
57.neg link width:2
58.ltssm:l0

l0
59.通过该命令查询结果可以看出硬盘物理槽位信息physical port id、当前端口的pcie链路的速率neg link rate和ltssm状态机的当前状态
60.(3)通过日志记录下来topo 0命令查询结果
61.(4)通过reset命令重启psx
62.(5)延时等待20s
63.(6)重复执行步骤1
‑564.(7)分析步骤3中topo 0命令查询结果日志,分析可靠性测试执行结果
65.通过neg link rate字段查看硬盘端口速率,如果硬盘速率g3代表硬盘正常,当硬盘端口速率未g2或g1时代表硬盘出现故障。
66.当硬盘出现故障时可以查看ltssm字段,该字段显示当前pcie链路状态,通过该字段可以看出当前链路处于ltssm状态机的哪个状态,而不用研发人员通过chiplink工具再
次查看故障硬盘的端口状态,方便研发进行问题定位;
67.ltssm状态机涵盖了11个状态,包括detect,polling,configuration,recovery,l0,l0s,l1,l2,hot reset,loopback,disable。正常的pcie链路训练状态转换流程依次是,detect

>polling

>configuration

>l0.l0是pcie链路可以正常工作的电源状态
68.如图2所示,该系统200包括:
69.管理登录单元210,配置用于通过串口登录制待测双控存储产品的管理控制单元;
70.次数设定单元220,配置用于预先设定测试次数,并根据所述测试次数控制所述管理控制单元循环重启;
71.信息采集单元230,配置用于在所述管理控制单元每次重启后,从所述管理控制单元采集芯片上行端口状态信息和下行端口状态信息;
72.日志保存单元240,配置用于将所述上行端口状态信息和下行端口状态信息保存至测试日志,并标记当前重启次数;
73.结果获取单元250,配置用于分析所述测试日志中的硬盘端口速率,获取测试结果。
74.可选地,作为本发明一个实施例,所述信息采集单元包括:
75.采集模块,配置用于通过端口查看命令查看芯片上行端口状态信息和所有下行端口的状态信息,所述上行端口连接存储主柜,所述下行端口连接硬盘。
76.可选地,作为本发明一个实施例,所述结果获取单元包括:
77.速率提取模块,配置用于通过关机字段从所述测试日志中提取每次重启后的硬盘端口速率;
78.异常分析模块,配置用于若所述硬盘端口速率为异常速率,则查看状态机字段,通过所述状态机字段获取当前链路对应的状态机状态。
79.图3为本发明实施例提供的一种终端300的结构示意图,该终端300可以用于执行本发明实施例提供的双控存储产品测试方法。
80.其中,该终端300可以包括:处理器310、存储器320及通信单元330。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
81.其中,该存储器320可以用于存储处理器310的执行指令,存储器320可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。当存储器320中的执行指令由处理器310执行时,使得终端300能够执行以下上述方法实施例中的部分或全部步骤。
82.处理器310为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器320内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(integrated circuit,简称ic)组成,例如可以由单颗封装的ic所组成,也可以由连接多颗相同功能或不同功能的封装ic而组成。举例来说,处理器310可以仅包括中央处理器(central processing unit,简称cpu)。在本发明实施方式中,cpu可以是单运算核心,也可
以包括多运算核心。
83.通信单元330,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
84.本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read

only memory,简称:rom)或随机存储记忆体(英文:random access memory,简称:ram)等。
85.因此,本发明可以依靠双控jbof产品本身对硬盘的可靠性进行测试,摆脱了对存储主柜的依赖;而且当硬盘出现故障时,当前方案可以直观体现出故障硬盘pcie链路状态机的当前故障状态,有助于研发快速精准定位故障原因;而且统计日志中硬盘故障发生的次数,可以统计硬盘故障发生的概率,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
86.本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如u盘、移动硬盘、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
87.本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
88.在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
89.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
90.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
91.尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1