本发明属于硬盘故障预测,特别涉及一种硬盘故障预测的方法、系统、设备和介质。
背景技术:
1、ssd是具有能够提供高级服务的内部控制器的高级组件。这些服务包括监控、日志记录和错误处理服务,这些服务提供对非易失性存储器(例如,nand闪存)和闪存转换层(fti.)状态的可见性;其中ssd:固态硬盘。nand闪存密度的不断增长以及使用3d光刻技术向三级单元(tlc)和四级单元(qlc)的转变对固态硬盘提出了新的挑战。这些新的挑战包括但不限于坏块的积累、高错误率、裸片故障等。未能解决这些挑战会导致ssd的故障率增加。另一方面,分解和软件定义存储(sds)促进了由中央管理实体管理和协调的基于基础结构的体系结构。典型的ssd数据中心架构正在从“封闭盒子”(例如存储设备)转向分解环境。分解环境的概念是指将ssd从设备中分解以形成分布式存储“池”,其中单个存储设备的软件被替换为中央管理设备来管理分布式存储池。中央管理设备可以划分虚拟卷,并将池中的这些虚拟卷分配给各个计算节点。目前,此类分配基于容量和可靠性执行,涉及独立磁盘冗余阵列(raid)和服务质量(qos)。
2、ssd设备或驱动器可以包括用于非易失性存储器的控制器,通常是nand闪存,以实现存储器的管理,纠错,ftl,磨损均衡,垃圾收集等。由于ssd的复杂性,控制器可以收集和维护反映ssd内部状态的各种参数。在某些实现中,会收集有关ssd的遥测信息。此类遥测信息包括但不限于耐久性信息、ecc信息、错误率、利用率信息、温度、工作负载信息等。现有技术中关于硬盘故障预测通常采用人工测试的方式,还做不到从系统级别上整体提高ssd的可靠性。
技术实现思路
1、为了解决上述技术问题,本发明提出了一种吊车取力器控制系统和控制方法。通过预先预测ssd故障和将数据迁移到其他ssd来减少故障开销,从而在系统级别上提高ssd的可靠性。
2、为实现上述目的,本发明采用以下技术方案:
3、一种硬盘故障预测的方法,包括以下步骤:
4、获取固态硬盘的遥测信息历史数据集;所述遥测信息包括闪存设备内部状态信息、工作负载信息和环境信息;根据所述闪存设备内部状态信息确定闪存设备危险信息;
5、基于所述遥测信息和闪存设备危险信息建立用于固态硬盘预测的卡尔曼滤波模型;
6、利用所述卡尔曼滤波模型对当前固态硬盘故障进行实时预测,以及在进行预测时实时更新所述卡尔曼滤波模型。
7、进一步的,所述内部状态信息包括:擦除计数、闪存设备写入、介质写入、利用率、坏块计数、误码率直方图和固态硬盘设备温度;
8、所述工作负载信息包括读取输入输出计数、写入输入输出计数、总写入和总读取量;
9、所述环境信息包括机箱温度和平台功耗。
10、进一步的,所述闪存设备危险信息包括:危险类型、危险时间和设备指示器标识;所述危险类型包括闪存设备故障、磨损状态、闪存设备数据利用率状态和必然延迟;所述危险时间为确定危险信息的时刻;所述设备指示器标识用于确定危险信息的固态硬盘设备。
11、进一步的,所述基于所述遥测信息和闪存设备危险信息建立用于固态硬盘预测的卡尔曼滤波模型的过程包括:
12、将遥测信息和闪存设备危险信息作为输入,则危险状态符合以下公式:
13、dk=adk-1; (1)
14、其中,dk为第k时刻危险信息的实际值;dk-1为第k-1时刻危险信息的实际值;a为第一系数;
15、第k时刻危险信息的测量值为:zk=dk+vk; (2);
16、其中,zk为第k时刻危险信息的测量值;vk为第k时刻的测量噪声;
17、公式(1)采用如下公式表示为:dk=adk-1+buk; (3);
18、其中,uk是第k时刻的输入值,b为第二系数;
19、采用buk处理噪声:
20、其中,代表第k时刻危险信息的估计值;代表第k-1时刻危险信息的估计值;gk代表卡尔曼增益;
21、所述gk采用如下的公式进行迭代:
22、
23、pk=(1-gk)pk-1 (6)
24、r表示噪声平均值;pk表示第k时刻的预测误差。
25、进一步的,所述尔曼滤波模型进行预测的过程为:
26、
27、pk=apk-1at+q (8)
28、其中,a是状态转移矩阵,b噪声系数矩阵;q为协方差。
29、进一步的,所述尔曼滤波模型更新的过程包括:
30、gk=pkht(hpkht+r)-1 (9)
31、
32、pk=(1-gkh)pk-1 (11)
33、其中,r为实际噪声值;是k时刻危险信息对应的缩放系数。
34、进一步的,所述利用所述卡尔曼滤波模型对当前固态硬盘故障进行实时预测的过程包括:
35、接收当前待需要预测固态硬盘的遥测信息,利用所述卡尔曼滤波模型进行预测,如果预测第一台固态硬盘没有危险,则进行参数更新;如果有危险,将第一台固态硬盘存储的数据迁移到第二台固态硬盘。
36、本发明还提出了一种硬盘故障预测的系统,包括获取模块、建立模块和预测模块;
37、所述获取模块用于获取固态硬盘的遥测信息历史数据集;所述遥测信息包括闪存设备内部状态信息、工作负载信息和环境信息;根据所述闪存设备内部状态信息确定闪存设备危险信息;
38、所述建立模块用于基于所述遥测信息和闪存设备危险信息建立用于固态硬盘预测的卡尔曼滤波模型;
39、所述预测模块用于利用所述卡尔曼滤波模型对当前固态硬盘故障进行实时预测,以及在进行预测时实时更新所述卡尔曼滤波模型。
40、本发明还提出了一种设备,包括:
41、存储器,用于存储计算机程序;
42、处理器,用于执行所述计算机程序时实现所述的方法步骤。
43、本发明还提出了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的方法步骤。
44、
技术实现要素:
中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
45、本发明提出了一种硬盘故障预测的方法、系统、设备和介质,该方法包括以下步骤:获取固态硬盘的遥测信息历史数据集;所述遥测信息包括闪存设备内部状态信息、工作负载信息和环境信息;根据所述闪存设备内部状态信息确定闪存设备危险信息;基于遥测信息和闪存设备危险信息建立用于固态硬盘预测的卡尔曼滤波模型;利用卡尔曼滤波模型对当前固态硬盘故障进行实时预测,以及在进行预测时实时更新所述卡尔曼滤波模型。基于一种硬盘故障预测的方法,还提出了一种硬盘故障预测的系统、设备和介质。本发明用于解决ssd的数据中心中存在的技术问题,通过检测危险并提前解决这些危险来减少ssd故障,从而提供预测性解决方案。
46、本发明通过预先预测ssd故障和将数据迁移到其他ssd来减少故障开销,从而在系统级别上提高ssd的可靠性。利用卡尔曼滤波算法来解决非计算机化分析中的缺陷,实现自动化了现有技术中未自动化的预测过程。