本技术实施例涉及存储设备,尤其涉及存储设备的故障预测方法、装置、设备及存储介质。
背景技术:
1、随着信息化时代的快速发展,存储设备已成为信息系统中至关重要的组成部分。存储设备的性能和可靠性直接影响到系统的稳定性和用户体验,因此对其进行故障预测和寿命管理具有重要意义,从而能够提前识别潜在的故障风险,避免数据丢失和设备损坏。
2、在相关技术中,故障预测通常监控存储设备中物理块的情况(如坏块数量、读取错误、写入次数等)来判断存储设备是否存在失效风险。然而,这些预测方法仅关注存储设备是否处于正常(“好”)或故障(“坏”)状态,忽视了存储设备内部组件寿命下降的问题,从而难以满足应用场景的读写速度或稳定性要求。因此,现有技术中的存储设备故障预测方法缺乏全面性和准确性。
技术实现思路
1、基于上述问题,本技术实施例提供了存储设备的故障预测方法、装置、设备及存储介质,目的是及时识别性能下降趋势,提升存储设备故障预测的全面性和准确性。
2、第一方面,本技术实施例提供了存储设备的故障预测方法,包括:
3、获取所述存储设备中各个电子器件在每一时刻的工作状态数据;其中,同一所述电子器件下不同数据采样类型对应不同的工作状态数据;
4、根据各个所述电子器件在每一时刻的所述工作状态数据计算所述存储设备的状态评价结果;
5、根据所述存储设备的状态评价结果,确定所述存储设备的故障程度。
6、在一实施例中,所述电子器件包括内存存储器,串行接口,闪存存储器,总线接口,片上系统,电容器中的至少一个;所述内存存储器的数据采样类型包括错误计数和持续工作时长中的至少一个;所述串行接口的数据采样类型包括擦写次数、温度和持续工作时长中的至少一个;所述闪存存储器的数据采样类型包括擦写次数、温度和持续工作时长中的至少一个;所述总线接口的数据采样类型包括信号传输错误次数;所述片上系统(soc,system on chip)的数据采样类型包括重启次数和温度中的至少一个;所述电容器的数据采样类型包括电容量和电容瞬时状态值。
7、在一实施例中,所述根据各个所述电子器件在每一时刻的所述工作状态数据计算所述存储设备的状态评价结果,包括:
8、基于每一所述电子器件的每一所述数据采样类型,在各个时刻的所述工作状态数据中确定出数值最大的目标工作状态数据;
9、基于每一所述电子器件中每个所述数据采样类型的所述目标工作状态数据和每个所述数据采样类型的权重,得到每一所述电子器件的状态评价样本;
10、根据各个所述电子器件的所述状态评价样本和各个所述电子器件的权重进行计算,得到所述存储设备的状态评价结果。
11、在一实施例中,所述根据各个所述电子器件在每一时刻的所述工作状态数据计算所述存储设备的状态评价结果,包括:
12、基于每一所述电子器件的每一所述数据采样类型,计算每两个相邻时刻所述工作状态数据的数据变化率,得到数据变化率集合;
13、在所述数据变化率集合中确定出数值最大的目标数据变化率;
14、基于每一所述电子器件中每个所述数据采样类型的所述目标数据变化率和每个所述数据采样类型的权重,得到每一所述电子器件的状态评价样本;
15、根据各个所述电子器件的所述状态评价样本和各个所述电子器件的权重进行计算,得到所述存储设备的状态评价结果。
16、在一实施例中,所述根据各个所述电子器件在每一时刻的所述工作状态数据计算所述存储设备的状态评价结果,包括:
17、所述根据各个所述电子器件在每一时刻的所述工作状态数据计算所述存储设备的状态评价结果,包括:
18、基于每一所述电子器件的每一所述数据采样类型,在各个时刻的所述工作状态数据中确定出数值最大的目标工作状态数据;
19、基于每一所述电子器件中每个所述数据采样类型的所述目标工作状态数据和每个所述数据采样类型的权重,得到每个所述电子器件的第一状态评价样本;
20、根据各个所述电子器件的所述第一状态评价样本和各个所述电子器件的权重进行计算,得到所述存储设备的第一评价结果;
21、基于每一所述电子器件的每一所述数据采样类型,计算每两个相邻时刻所述工作状态数据的数据变化率,得到数据变化率集合;
22、在所述数据变化率集合中确定出数值最大的目标数据变化率;
23、基于每一所述电子器件中每个所述数据采样类型的所述目标数据变化率和每个所述数据采样类型的权重,得到每个所述电子器件的第二状态评价样本;
24、根据各个所述电子器件的所述第二状态评价样本和各个所述电子器件的权重进行计算,得到所述存储设备的第二评价结果;
25、根据所述第一评价结果和所述第二评价结果,确定所述存储设备的状态评价结果。
26、在一实施例中,所述根据所述存储设备的状态评价结果,确定所述存储设备的故障程度,包括:
27、根据多个预设状态评价结果阈值划分的多个区间范围,选择所述状态评价结果的所属区间范围;其中,每个所述区间范围对应一个预设故障程度;
28、将所述状态评价结果的所属区间范围对应的预设故障程度作为所述存储设备的故障程度。
29、在一实施例中,所述方法还包括:
30、根据所述存储设备的故障程度,确定是否执行故障定位;
31、若所述故障程度超过预设故障程度阈值,则根据每个所述电子器件的最大数据变化率对应的加权结果确定待维护的电子器件;
32、根据所述待维护的电子器件,执行与所述待维护的电子器件对应的维护策略。
33、第二方面,本技术实施例还提供了一种存储设备的故障预测装置,包括:
34、获取单元,用于获取所述存储设备中各个电子器件在每一时刻的工作状态数据;其中,同一所述电子器件下不同数据采样类型对应不同的工作状态数据;
35、计算单元,用于根据各个所述电子器件在每一时刻的所述工作状态数据计算所述存储设备的状态评价结果;
36、确定单元,用于根据所述存储设备的状态评价结果,确定所述存储设备的故障程度。
37、第三方面,本技术实施例还提供了一种存储设备,包括:
38、中央处理器,存储器,输入输出接口;
39、所述存储器为短暂存储存储器或持久存储存储器;
40、所述中央处理器配置为与所述存储器通信,并执行所述存储器中的指令操作以执行上述任意一项所述存储设备的故障预测方法。
41、第四方面,本技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,执行上述任意一项所述存储设备的故障预测方法。
42、从以上技术方案可以看出,本技术实施例具有以下优点:
43、本技术实施例通过获取存储设备中各个电子器件在每一时刻的工作状态数据;其中,同一电子器件下不同数据采样类型对应不同的工作状态数据;根据各个电子器件在每一时刻的工作状态数据计算存储设备的状态评价结果,基于状态评价结果确定存储设备的故障程度。本技术实施例不仅判断存储设备是否处于“好”或“坏”的状态,还通过分析不同电子器件下不同数据采样类型的工作状态数据来更全面、精确地评估每个电子器件的健康状况,从而显著提高故障预测的精度,同时也能提前识别存储设备性能下降的趋势,预防因性能劣化导致的读写失败风险。