1.一种云平台故障探测方法,其特征在于,包括:
在每个探测周期内,在达到设定的故障探测触发条件时,确定当前待探测的一个或多个硬件资源,及每个硬件资源对应的探测方式和探测方法;
针对每个硬件资源,根据该硬件资源对应的探测方式,启动探测进程或者探测虚拟机;
通过所述探测进程或者所述探测虚拟机使用该硬件资源对应的探测方法对该硬件资源进行故障探测;
根据探测结果,确定该硬件资源是否存在故障。
2.根据权利要求1所述的云平台故障探测方法,其特征在于,所述在达到设定的故障探测触发条件时,确定当前待探测的一个或多个硬件资源,及每个硬件资源对应的探测方式和探测方法,包括:
在达到设定的目标探测时间点时,根据预设的覆盖策略,确定当前待探测的一个或多个硬件资源,及每个硬件资源对应的探测方式和探测方法,所述目标探测时间点为所述探测周期包含的一个或多个探测时间点中的任意一个探测时间点,依据在一个探测周期内,完成对云平台中所有硬件资源的故障探测的原则设定所述覆盖策略。
3.根据权利要求1所述的云平台故障探测方法,其特征在于,所述在达到设定的故障探测触发条件时,确定当前待探测的一个或多个硬件资源,及每个硬件资源对应的探测方式和探测方法,包括:
在捕获到云平台的异常事件时,对所述异常事件进行分析,预测所述异常事件对应的故障类型;
根据所述故障类型,确定当前待探测的一个或多个硬件资源,及每个硬件资源对应的探测方式和探测方法。
4.根据权利要求1至3任一项所述的云平台故障探测方法,其特征在于,还包括:
在每个探测周期结束时,注销所述探测进程或者所述探测虚拟机。
5.根据权利要求4所述的云平台故障探测方法,其特征在于,在确定该硬件资源存在故障时,还包括:
将故障上报给云平台的设定系统。
6.一种云平台故障探测装置,其特征在于,包括:
探测相关确定模块,用于在每个探测周期内,在达到设定的故障探测触发条件时,确定当前待探测的一个或多个硬件资源,及每个硬件资源对应的探测方式和探测方法;
启动模块,用于针对每个硬件资源,根据该硬件资源对应的探测方式,启动探测进程或者探测虚拟机;
故障探测模块,用于通过所述探测进程或者所述探测虚拟机使用该硬件资源对应的探测方法对该硬件资源进行故障探测;
故障确定模块,用于根据探测结果,确定该硬件资源是否存在故障。
7.根据权利要求6所述的云平台故障探测装置,其特征在于,所述探测相关确定模块,具体用于:
在达到设定的目标探测时间点时,根据预设的覆盖策略,确定当前待探测的一个或多个硬件资源,及每个硬件资源对应的探测方式和探测方法,所述目标探测时间点为所述探测周期包含的一个或多个探测时间点中的任意一个探测时间点,依据在一个探测周期内,完成对云平台中所有硬件资源的故障探测的原则设定所述覆盖策略。
8.根据权利要求6所述的云平台故障探测装置,其特征在于,所述探测相关确定模块,具体用于:
在捕获到云平台的异常事件时,对所述异常事件进行分析,预测所述异常事件对应的故障类型;
根据所述故障类型,确定当前待探测的一个或多个硬件资源,及每个硬件资源对应的探测方式和探测方法。
9.根据权利要求6至8任一项所述的云平台故障探测装置,其特征在于,还包括:
注销模块,用于在每个探测周期结束时,注销所述探测进程或者所述探测虚拟机。
10.根据权利要求9所述的云平台故障探测装置,其特征在于,还包括:
故障上报模块,用于在确定该硬件资源存在故障时,将故障上报给云平台的设定系统。