一种cpu测试方法、系统、设备以及存储介质
技术领域
1.本发明涉及测试领域,具体涉及一种cpu测试方法、系统、设备以及存储介质。
背景技术:2.bmc(baseboard manager controller,基板管理控制器)是服务器上的基板管理系统,其负责服务器的资产信息显示、硬件监控、散热调控、系统配置、远程监控、日志收集、故障诊断、系统维护等重要功能。bmc与主处理器和板上各元件相连接,监控并且在一定程度上管理各物理组件的状态。
3.随着信息化技术的发展,服务器内部的元器件密集程度越来越高;随着信息量的急剧增加,cpu需要处理的数据也越来越多,其功耗和温度也变得越来越高。bmc需要随时监控cpu的温度,如果因cpu温度过高导致降频、关机,bmc要产生相应的告警信息,便于及时发现和解决问题。
4.bmc目前关于cpu prohot和thermaltrip的测试,主要是通过使用吹风机或热风枪手动加热cpu的方式来触发cpu降频或关机。该方法需要手持吹风机或热风枪进行操作,如果温度控制不合理或操作不当,容易造成温度过高损伤器件。另外,使用该方法需要手持式工具操作,无法实现自动化,影响测试效率。
技术实现要素:5.有鉴于此,为了克服上述问题的至少一个方面,本发明实施例提出一种cpu测试方法,包括以下步骤:
6.获取预设寄存器地址;
7.向所述预设寄存器地址中写入第一预设命令以使所述cpu触发所述第一预设命令对应的故障;
8.利用bmc获取触发日志;
9.向所述预设寄存器地址中写入第二预设命令以使所述cpu解除所述故障;
10.利用bmc获取解除日志;
11.判断所述bmc中是否存在所述触发日志和所述解除日志;
12.响应于所述bmc中存在所述触发日志和所述解除日志,确定测试通过。
13.在一些实施例中,还包括:
14.响应于所述bmc中不存在所述触发日志或所述解除日志,确定测试失败。
15.在一些实施例中,向所述预设寄存器地址中写入第一预设命令以使所述cpu触发所述第一预设命令对应的故障,进一步包括:
16.向所述预设寄存器中写入使所述cpu触发降频的命令以使所述cpu触发降频,或,
17.向所述预设寄存器中写入使所述cpu触发关机的命令以使所述cpu触发关机。
18.在一些实施例中,向所述预设寄存器地址中写入第二预设命令以使所述cpu解除所述故障,进一步包括:
19.向所述预设寄存器中写入使所述cpu解除降频的命令以使所述cpu解除降频,或,
20.向所述预设寄存器中写入使所述cpu解除关机的命令以使所述cpu解除关机。
21.基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种cpu测试系统,包括:
22.获取模块,配置为获取预设寄存器地址;
23.第一写入模块,配置为向所述预设寄存器地址中写入第一预设命令以使所述cpu触发所述第一预设命令对应的故障;
24.第一日志模块,配置为利用bmc获取触发日志;
25.第二写入模块,配置为向所述预设寄存器地址中写入第二预设命令以使所述cpu解除所述故障;
26.第二日志模块,配置为利用bmc获取解除日志;
27.判断模块,配置为判断所述bmc中是否存在所述触发日志和所述解除日志;
28.第一响应模块,配置为响应于所述bmc中存在所述触发日志和所述解除日志,确定测试通过。
29.在一些实施例中,还包括第二响应模块,配置为:
30.响应于所述bmc中不存在所述触发日志或所述解除日志,确定测试失败。
31.在一些实施例中,第一写入模块还配置为:
32.向所述预设寄存器中写入使所述cpu触发降频的命令以使所述cpu触发降频,或,
33.向所述预设寄存器中写入使所述cpu触发关机的命令以使所述cpu触发关机。
34.在一些实施例中,第二写入模块还配置为:
35.向所述预设寄存器中写入使所述cpu解除降频的命令以使所述cpu解除降频,或,
36.向所述预设寄存器中写入使所述cpu解除关机的命令以使所述cpu解除关机。
37.基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机设备,包括:
38.至少一个处理器;以及
39.存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时执行以下步骤:
40.获取预设寄存器地址;
41.向所述预设寄存器地址中写入第一预设命令以使所述cpu触发所述第一预设命令对应的故障;
42.利用bmc获取触发日志;
43.向所述预设寄存器地址中写入第二预设命令以使所述cpu解除所述故障;
44.利用bmc获取解除日志;
45.判断所述bmc中是否存在所述触发日志和所述解除日志;
46.响应于所述bmc中存在所述触发日志和所述解除日志,确定测试通过。
47.在一些实施例中,还包括:
48.响应于所述bmc中不存在所述触发日志或所述解除日志,确定测试失败。
49.在一些实施例中,向所述预设寄存器地址中写入第一预设命令以使所述cpu触发所述第一预设命令对应的故障,进一步包括:
50.向所述预设寄存器中写入使所述cpu触发降频的命令以使所述cpu触发降频,或,
51.向所述预设寄存器中写入使所述cpu触发关机的命令以使所述cpu触发关机。
52.在一些实施例中,向所述预设寄存器地址中写入第二预设命令以使所述cpu解除所述故障,进一步包括:
53.向所述预设寄存器中写入使所述cpu解除降频的命令以使所述cpu解除降频,或,
54.向所述预设寄存器中写入使所述cpu解除关机的命令以使所述cpu解除关机。
55.基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时执行以下步骤:
56.获取预设寄存器地址;
57.向所述预设寄存器地址中写入第一预设命令以使所述cpu触发所述第一预设命令对应的故障;
58.利用bmc获取触发日志;
59.向所述预设寄存器地址中写入第二预设命令以使所述cpu解除所述故障;
60.利用bmc获取解除日志;
61.判断所述bmc中是否存在所述触发日志和所述解除日志;
62.响应于所述bmc中存在所述触发日志和所述解除日志,确定测试通过。
63.在一些实施例中,还包括:
64.响应于所述bmc中不存在所述触发日志或所述解除日志,确定测试失败。
65.在一些实施例中,向所述预设寄存器地址中写入第一预设命令以使所述cpu触发所述第一预设命令对应的故障,进一步包括:
66.向所述预设寄存器中写入使所述cpu触发降频的命令以使所述cpu触发降频,或,
67.向所述预设寄存器中写入使所述cpu触发关机的命令以使所述cpu触发关机。
68.在一些实施例中,向所述预设寄存器地址中写入第二预设命令以使所述cpu解除所述故障,进一步包括:
69.向所述预设寄存器中写入使所述cpu解除降频的命令以使所述cpu解除降频,或,
70.向所述预设寄存器中写入使所述cpu解除关机的命令以使所述cpu解除关机。
71.本发明具有以下有益技术效果之一:本发明提出的方案通过修改寄存器的方式模拟触发故障,有利于提高测试效率,减少资源浪费,避免安全隐患。
附图说明
72.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
73.图1为本发明的实施例提供的cpu测试方法的流程示意图;
74.图2为本发明的实施例提供的cpu测试系统的结构示意图;
75.图3为本发明的实施例提供的计算机设备的结构示意图;
76.图4为本发明的实施例提供的计算机可读存储介质的结构示意图。
具体实施方式
77.为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
78.需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
79.根据本发明的一个方面,本发明的实施例提出一种cpu测试方法,如图1所示,其可以包括步骤:
80.s1,获取预设寄存器地址;
81.s2,向所述预设寄存器地址中写入第一预设命令以使所述cpu触发所述第一预设命令对应的故障;
82.s3,利用bmc获取触发日志;
83.s4,向所述预设寄存器地址中写入第二预设命令以使所述cpu解除所述故障;
84.s5,利用bmc获取解除日志;
85.s6,判断所述bmc中是否存在所述触发日志和所述解除日志;
86.s7,响应于所述bmc中存在所述触发日志和所述解除日志,确定测试通过。
87.本发明提出的方案通过修改寄存器的方式模拟触发故障,有利于提高测试效率,减少资源浪费,避免安全隐患。
88.在一些实施例中,还包括:
89.响应于所述bmc中不存在所述触发日志或所述解除日志,确定测试失败。
90.在一些实施例中,向所述预设寄存器地址中写入第一预设命令以使所述cpu触发所述第一预设命令对应的故障,进一步包括:
91.向所述预设寄存器中写入使所述cpu触发降频的命令以使所述cpu触发降频,或,
92.向所述预设寄存器中写入使所述cpu触发关机的命令以使所述cpu触发关机。
93.在一些实施例中,向所述预设寄存器地址中写入第二预设命令以使所述cpu解除所述故障,进一步包括:
94.向所述预设寄存器中写入使所述cpu解除降频的命令以使所述cpu解除降频,或,
95.向所述预设寄存器中写入使所述cpu解除关机的命令以使所述cpu解除关机。
96.具体的,可以首先通过bmc管理员权限用户登录bmc os,首先通过修改寄存器的方式,将对应的信号拉低,模拟触发cpu降频或关机的情况,查看bmc log是否记录prohot和thermal trip触发日志及对应的触发信号,然后将对应的信号拉高,模拟解除cpu降频或关机的情况,查看bmc log是否记录prohot和thermal trip解除日志,依次覆盖所有的信号,bmc均可正常记录prohot和thermal trip触发解除日志,则测试通过,否则测试不通过。
97.下面以模拟irq_pvccin_cpu0_vrhot_lvc3_n信号触发cpu0降频为例,简述一下测试方法:
98.step1,ssh登录bmc,执行i2c-test-b 9-s 0x10-w-d 0xff 0x7f 0xff 0xfc 0xff 0xff 0xff,模拟触发cpu0 prohot状态
99.step2,查看bmc log是否记录cpu0 prohot触发日志,并记录详细触发信号:rq_pvccin_cpu0_vrhot_lvc3_n
100.step3,ssh登录bmc,执行i2c-test-b 9-s 0x10-w-d 0xff 0xff 0xff 0xfc 0xff 0xff 0xff,模拟解除cpu0 prohot状态
101.step4,查看bmc log是否记录cpu0 prohot解除日志
102.同理,可模拟其余信号对应触发cpu prohot和thermal trip。
103.本发明是通过修改寄存器的方式模拟触发cpu降频或关机的情况。首先通过修改寄存器的值来模拟cpu0触发降频或关机,检查bmc记录对应prohot和thermal trip触发日志,然后通过修改寄存器的值来解除cpu0降频或关机,检查bmc记录对应prohot和thermal trip解除日志,依次覆盖所有的信号,bmc均可正常记录prohot和thermal trip触发解除日志,则测试通过,否则测试不通过。
104.基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种cpu测试系统400,如图2所示,包括:
105.获取模块401,配置为获取预设寄存器地址;
106.第一写入模块402,配置为向所述预设寄存器地址中写入第一预设命令以使所述cpu触发所述第一预设命令对应的故障;
107.第一日志模块403,配置为利用bmc获取触发日志;
108.第二写入模块404,配置为向所述预设寄存器地址中写入第二预设命令以使所述cpu解除所述故障;
109.第二日志模块405,配置为利用bmc获取解除日志;
110.判断模块406,配置为判断所述bmc中是否存在所述触发日志和所述解除日志;
111.第一响应模块407,配置为响应于所述bmc中存在所述触发日志和所述解除日志,确定测试通过。
112.在一些实施例中,还包括第二响应模块,配置为:
113.响应于所述bmc中不存在所述触发日志或所述解除日志,确定测试失败。
114.在一些实施例中,第一写入模块402还配置为:
115.向所述预设寄存器中写入使所述cpu触发降频的命令以使所述cpu触发降频,或,
116.向所述预设寄存器中写入使所述cpu触发关机的命令以使所述cpu触发关机。
117.在一些实施例中,第二写入模块404还配置为:
118.向所述预设寄存器中写入使所述cpu解除降频的命令以使所述cpu解除降频,或,
119.向所述预设寄存器中写入使所述cpu解除关机的命令以使所述cpu解除关机。
120.基于同一发明构思,根据本发明的另一个方面,如图3所示,本发明的实施例还提供了一种计算机设备501,包括:
121.至少一个处理器520;以及
122.存储器510,存储器510存储有可在处理器上运行的计算机程序511,处理器520执行程序时执行以下步骤:
123.获取预设寄存器地址;
124.向所述预设寄存器地址中写入第一预设命令以使所述cpu触发所述第一预设命令对应的故障;
125.利用bmc获取触发日志;
126.向所述预设寄存器地址中写入第二预设命令以使所述cpu解除所述故障;
127.利用bmc获取解除日志;
128.判断所述bmc中是否存在所述触发日志和所述解除日志;
129.响应于所述bmc中存在所述触发日志和所述解除日志,确定测试通过。
130.在一些实施例中,还包括:
131.响应于所述bmc中不存在所述触发日志或所述解除日志,确定测试失败。
132.在一些实施例中,向所述预设寄存器地址中写入第一预设命令以使所述cpu触发所述第一预设命令对应的故障,进一步包括:
133.向所述预设寄存器中写入使所述cpu触发降频的命令以使所述cpu触发降频,或,
134.向所述预设寄存器中写入使所述cpu触发关机的命令以使所述cpu触发关机。
135.在一些实施例中,向所述预设寄存器地址中写入第二预设命令以使所述cpu解除所述故障,进一步包括:
136.向所述预设寄存器中写入使所述cpu解除降频的命令以使所述cpu解除降频,或,
137.向所述预设寄存器中写入使所述cpu解除关机的命令以使所述cpu解除关机。
138.基于同一发明构思,根据本发明的另一个方面,如图4所示,本发明的实施例还提供了一种计算机可读存储介质601,计算机可读存储介质601存储有计算机程序610,计算机程序610被处理器执行时执行以下步骤:
139.获取预设寄存器地址;
140.向所述预设寄存器地址中写入第一预设命令以使所述cpu触发所述第一预设命令对应的故障;
141.利用bmc获取触发日志;
142.向所述预设寄存器地址中写入第二预设命令以使所述cpu解除所述故障;
143.利用bmc获取解除日志;
144.判断所述bmc中是否存在所述触发日志和所述解除日志;
145.响应于所述bmc中存在所述触发日志和所述解除日志,确定测试通过。
146.在一些实施例中,还包括:
147.响应于所述bmc中不存在所述触发日志或所述解除日志,确定测试失败。
148.在一些实施例中,向所述预设寄存器地址中写入第一预设命令以使所述cpu触发所述第一预设命令对应的故障,进一步包括:
149.向所述预设寄存器中写入使所述cpu触发降频的命令以使所述cpu触发降频,或,
150.向所述预设寄存器中写入使所述cpu触发关机的命令以使所述cpu触发关机。
151.在一些实施例中,向所述预设寄存器地址中写入第二预设命令以使所述cpu解除所述故障,进一步包括:
152.向所述预设寄存器中写入使所述cpu解除降频的命令以使所述cpu解除降频,或,
153.向所述预设寄存器中写入使所述cpu解除关机的命令以使所述cpu解除关机。
154.最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。
155.此外,应该明白的是,本文的计算机可读存储介质(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。
156.本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
157.以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
158.应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
159.上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
160.本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
161.所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。