本申请涉及数据监控,特别是涉及一种监控方法、装置、设备和存储介质。
背景技术:
1、随着经济社会的高速发展,我国即将迎来互联网+时代,互联网+时代的来临伴随着服务器产业的迅速崛起,海量数据正以前所未有的增长趋势冲击着各个行业,服务器凭借其优良的性能广泛应用于云计算、大数据处理、网络平台等领域,受到市场的青睐。而bmc(baseboardmanagementcontroller,基板管理控制器)属于独立于服务器系统的一个用于管理和控制的子系统,可以对服务器内各设备进行监控,即可实现对故障状态下pcieswtich(pcie扩展设备)内相关寄存器的监控、故障分析、故障定位以及故障上报等功能。
2、pcieswtich可以提供扩展或聚合能力,允许更多的其他设备通过pcie总线连接到一个pcie端口。pcie(pci-express,总线)是一种通用的总线规格,它由intel所提倡和推广,其目的是取代现有电脑系统内部的总线传输接口,不仅包括显示接口,还囊括了cpu、pci、hdd、network等多种应用接口。
3、目前,在基于bmc实现对pcieswtich中寄存器的监控时,主要是通过i2c(inter-integratedcircuit,串行通信总线)直接和pcieswtich连接,使得bmc可以直接访问pcieswtich中的寄存器,以根据寄存器的内容读取监控数据。
4、然而,由于pcieswtich自身一直处于工作状态,在工作过程中会对寄存器进行控制,而bmc在监控过程中读取寄存器的数据时也会对寄存器进行操作,从而导致对寄存器的访问存在冲突,使得pcieswtich工作不稳定,进而影响服务器的整体工作运行状态。
技术实现思路
1、基于此,本申请提供了一种监控方法、装置、设备和存储介质,以确保bmc能够稳定安全的访问pcie扩展设备,且不与pcie扩展设备内部发生冲突,进而达到提高服务器的整体运行稳定性的效果。
2、第一方面,提供一种监控方法,该方法包括:
3、根据预设周期对多个pcie扩展设备进行轮询监控;
4、调用扫描函数对各pcie扩展设备进行扫描操作,得到扫描信息;扫描信息包括pcie扩展设备扫描数量;
5、将pcie扩展设备扫描数量与基板管理控制器中pcie扩展设备安装数量进行比对;
6、在扫描数量等于安装数量时,获取各pcie扩展设备的监控数据,以及根据监控数据确定各pcie扩展设备的工作状态。
7、根据本申请实施例中一种可实现的方式,扫描信息还包括各pcie扩展设备的物理地址;在扫描数量等于安装数量时,获取各pcie扩展设备的监控数据,包括:
8、在扫描数量等于安装数量时,将各pcie扩展设备的物理地址与基板管理控制器中各pcie扩展设备的硬件地址进行比对;
9、在各pcie扩展设备的物理地址与各pcie扩展设备的硬件地址均对应相同时,获取各pcie扩展设备的监控数据。
10、根据本申请实施例中一种可实现的方式,该方法还包括:
11、在其中任意一个或多个pcie扩展设备的物理地址与各pcie扩展设备的硬件地址均不同时,退出对与各pcie扩展设备的硬件地址均不同的pcie扩展设备的监控操作。
12、根据本申请实施例中一种可实现的方式,该方法还包括:
13、在扫描数量小于安装数量时,将扫描到的各pcie扩展设备的物理地址与各pcie扩展设备的硬件地址进行比对,得到比对结果;
14、根据比对结果确定未被扫描到的pcie扩展设备,将未被扫描到的pcie扩展设备的监控数据设置为异常值,以及获取被扫描到的pcie扩展设备的监控数据。
15、根据本申请实施例中一种可实现的方式,获取各pcie扩展设备的监控数据,以及根据监控数据确定各pcie扩展设备的工作状态,包括:
16、在各pcie扩展设备的监控数据均获取成功时,将各监控数据进行记录,并根据记录的监控数据确定各pcie扩展设备的工作状态;
17、在其中任意一个或多个pcie扩展设备的监控数据获取失败时,将获取失败的pcie扩展设备的监控数据设置为异常值。
18、根据本申请实施例中一种可实现的方式,调用扫描函数对各pcie扩展设备进行扫描操作的步骤之前,还包括:
19、确定当前监控服务器是否处于上电状态;
20、若处于上电状态,则调用扫描函数对各述pcie扩展设备进行扫描操作;
21、若处于未上电状态,则退出当前监控操作,以及将各pcie扩展设备的监控数据均设置为异常值。
22、根据本申请实施例中一种可实现的方式,监控数据包括温度数据、版本号数据、端口数数据、各端口链路状态数据、各端口类型数据、各端口速率数据、各端口宽度数据、各端口异常状态数据以及pcie扩展设备异常计数数据中的任意一个或多个。
23、第二方面,提供了一种监控装置,该装置包括:
24、监控模块,用于根据预设周期对多个pcie扩展设备进行轮询监控;
25、扫描模块,用于调用扫描函数对各pcie扩展设备进行扫描操作,得到扫描信息;扫描信息包括pcie扩展设备扫描数量;
26、比对模块,用于将pcie扩展设备扫描数量与基板管理控制器中pcie扩展设备安装数量进行比对;
27、确定模块,用于在扫描数量等于安装数量时,获取各pcie扩展设备的监控数据,以及根据监控数据确定各pcie扩展设备的工作状态。
28、第三方面,提供了一种计算机设备,包括:
29、至少一个处理器;以及
30、与至少一个处理器通信连接的存储器;其中,
31、存储器存储有可被至少一个处理器执行的计算机指令,计算机指令被至少一个处理器执行,以使至少一个处理器能够执行上述第一方面中涉及的方法。
32、第四方面,提供了一种计算机可读存储介质,其上存储有计算机指令,其特征在于,计算机指令用于使计算机执行上述第一方面中涉及的方法。
33、根据本申请实施例所提供的技术内容,根据预设周期对多个pcie扩展设备进行轮询监控;调用扫描函数对各pcie扩展设备进行扫描操作,得到扫描信息;扫描信息包括pcie扩展设备扫描数量;将pcie扩展设备扫描数量与基板管理控制器中pcie扩展设备安装数量进行比对;在扫描数量等于安装数量时,获取各pcie扩展设备的监控数据,以及根据监控数据确定各pcie扩展设备的工作状态。上述操作,基于得到的扫描信息,获取各pcie扩展设备的监控数据,以确保bmc能够稳定安全的访问pcie扩展设备,且不与pcie扩展设备内部发生冲突,进而达到提高服务器的整体运行稳定性的效果。
1.一种监控方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述扫描信息还包括各所述pcie扩展设备的物理地址;所述在所述扫描数量等于所述安装数量时,获取各所述pcie扩展设备的监控数据,包括:
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述获取各所述pcie扩展设备的监控数据,以及根据所述监控数据确定各所述pcie扩展设备的工作状态,包括:
6.根据权利要求1所述的方法,其特征在于,所述调用扫描函数对各所述pcie扩展设备进行扫描操作的步骤之前,还包括:
7.根据权利要求1-6任意一项所述的方法,所述监控数据包括温度数据、版本号数据、端口数数据、各端口链路状态数据、各端口类型数据、各端口速率数据、各端口宽度数据、各端口异常状态数据以及pcie扩展设备异常计数数据中的任意一个或多个。
8.一种监控装置,其特征在于,所述装置包括:
9.一种计算机设备,包括:
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令用于使计算机执行权利要求1至7中任一项所述的方法。