一种优化硬盘使用寿命的方法及其系统与流程

文档序号:19216776发布日期:2019-11-26 01:45阅读:193来源:国知局
一种优化硬盘使用寿命的方法及其系统与流程

本发明涉及计算机硬盘技术领域,特别涉及一种优化硬盘使用寿命的方法及其系统。



背景技术:

随着云计算的飞速发展,出现了各种各样的分布式计算方式,尤其是分布式存储计算的发展,其极大地节省了过去集中式、共享式存储的成本。但是,互联网目前还没彻底改变的是,目前还是在底层使用x86的服务器架构,分布式存储还是需要使用服务器的硬盘去构建。

分布式存储在互联网上基本都是使用ceph的开源项目去优化和推行自身的存储,ceph就是使用多台服务器构成一个存储集群。实际上具体的数据、副本都是在物理硬盘上。随着时间推移,读写数据的增加,配件的老化,慢慢硬盘就会损坏或老化。

而其中,硬盘的老化是无法避免的,但是在如此多台服务器若干个硬盘情况下,如果让硬盘寿命的周期基本上一致、达到一起退下的效果,而不是某天某一个硬盘损坏,我们发现一个处理一个,这样是很难做到的。



技术实现要素:

本发明要解决的技术问题在于,提供一种优化硬盘使用寿命的方法及其系统,对集群存储进行优化,使各个硬盘得到统一监控和调度,实现硬盘群集的寿命保持一致性。

为解决上述技术问题,本发明提供如下技术方案:一种优化硬盘使用寿命的方法,包括以下步骤:

s1、对集群硬盘中的每个硬盘均增加监控点,并测试每个硬盘上监控点的测试参数;

s2、收集并录入测试参数的数值,将数值和预先设置的测试参数阈值进行对比;

s3、对数值达到了测试参数阈值的硬盘,在集群硬盘中把此硬盘的osd角色移除下线,使用其他硬盘接替其工作;

s4、重复步骤s1至s3,当集群硬盘中的各个硬盘都已经达到测试参数阈值时,将集群硬盘中移除下线的所有硬盘重新上线。

优选地,所述步骤s1的测试参数为:启动次数、重映射扇区数、硬盘通电次数、通电时间累计、主轴起旋重试次数、硬盘校准重试次数、底层数据读取错误率、奇偶校验错误率、写入错误率、读写次数、读写容量以及硬盘温度中的一种或多种。

优选地,所述测试参数阈值是根据选定的测试参数类型预先设置好,测试参数阈值的设置方式为:用户自行根据需求来设置测试参数阈值的具体数值。

优选地,所述测试参数的具体数值采用smartctl工具进行收集。

本发明的另一目的是提供一种优化硬盘使用寿命的系统,包括:

监控模块,用于设置集群硬盘中的每个硬盘上监控点,并对监控点进行监控;

测试模块,用于对监控点上的测试参数进行测试;

测试参数收集模块,用于收集并录入所述测试模块测试得到的测试参数具体数值;

测试参数阈值预设模块,用于对测试参数阈值进行预先设置并保存;

对比模块,用于对所述测试参数收集模块收集的测试参数具体数值与所述测试参数阈值预设模块预先设置的测试参数阈值进行对比判断;

移除硬盘下线模块,用于对测试参数的具体数值达到了测试参数阈值的硬盘进行移除下线;

以及重上线模块,用于:当集群硬盘中所有硬盘均被所述移除硬盘下线模块移除下线后,重上线模块将集群硬盘中的所有硬盘重新上线使用。

优选地,所述测试参数收集模块采用smartctl工具。

采用上述技术方案后,本发明至少具有如下有益效果:本发明通过收集测试参数并匹配测试参数阈值,一个个下线达到阈值的硬盘,当所有硬盘被下线后在重新上线使用,使得所有的硬盘能够保持寿命一致;当被下线的硬盘,其工作任务在其他硬盘中得到承接,从而降低了到达阈值的硬盘使用,减少了个别硬盘损坏得过快的可能。

附图说明

图1为本发明实施例1一种优化硬盘使用寿命的方法的步骤流程图;

图2为本发明实施例4一种优化硬盘使用寿命的系统的结构框图。

具体实施方式

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本申请作进一步详细说明。

实施例1

ceph分布式存储中(即硬盘集群),都是使用一个个硬盘做osd存储对象,让数据、副本都分别写到存储中。这样就对一批在同一个硬盘集群中,有了一个统一调度和监控的平面。本发明主要是通过底层硬盘的:寿命、读写状态、坏道情况等等一系列的测试参数,对硬盘集群中的硬盘进行上线和重下线处理,目标是协调硬盘响应的指标一致性,最终达到延长寿命的问题。

如图1所示,本实施例提供了一种优化硬盘使用寿命的方法,步骤包括:

s1、对集群硬盘中的每个硬盘均增加监控点,并测试每个硬盘上监控点的测试参数;一般地,测试参数的具体数值采用优先smartctl工具进行收集;

s2、收集并录入测试参数的数值,将数值和预先设置的测试参数阈值进行对比;所述测试参数阈值是根据选定的测试参数类型预先设置好,测试参数阈值的设置方式为:用户自行根据需求来设置测试参数阈值的具体数值

s3、对数值达到了测试参数阈值的硬盘,在集群硬盘中把此硬盘的osd角色移除下线,使用其他硬盘接替其工作;

s4、重复步骤s1至s3,当集群硬盘中的各个硬盘都已经达到测试参数阈值时,将集群硬盘中移除下线的所有硬盘重新上线,达到了集群硬盘中所有硬盘的寿命保持一致性的目的。

其中,测试参数包括启动次数、重映射扇区数、硬盘通电次数、通电时间累计、主轴起旋重试次数、硬盘校准重试次数、底层数据读取错误率、奇偶校验错误率、写入错误率、读写次数、读写容量以及硬盘温度,在实际测试应用中,测试参数采用上面中一种或多种都可以,具体根据用户的需求决定。

实施例2

本实施例是在实施例1的基础上,使用硬盘温度作为测试参数进行具体方法的说明。一种优化硬盘使用寿命的方法,步骤包括:

s11、对集群硬盘中的每个硬盘均增加监控点,并测试每个硬盘上监控点的硬盘温度;

s12、收集并录入每个硬盘的实时硬盘温度,将实时硬盘温度的数值和预先设置的硬盘温度阈值进行对比;这里的硬盘温度阈值优先设置为50℃;

s13、对硬盘温度的数值达到了或超过50℃,在此硬盘的osd角色移除下线,使用其他硬盘接替其工作;

s14、重复步骤s11至s13对集群硬盘中的硬盘进行硬盘温度的对比,当集群硬盘中的所有硬盘的硬盘温度都已经达到50℃并被下线后,再将集群硬盘中的所有硬盘重新上线。

剩下的测试参数,例如启动次数、重映射扇区数、硬盘通电次数、通电时间累计、主轴起旋重试次数、硬盘校准重试次数、底层数据读取错误率、奇偶校验错误率、写入错误率、读写次数、读写容量,均可单一作为测试参数进行阈值判断,然后达到阈值的逐一下线并重新全部硬盘一起上线,达到了集群硬盘中所有硬盘的寿命保持一致性的目的。

实施例3

本实施例公开了一种优化硬盘使用寿命的方法,其也是在实施例1的基础上进行优化,具体是将预先设置的阈值去掉,让集群硬盘系统程序自行处理所有测试参数。本实施例一种优化硬盘使用寿命的方法,步骤包括:

s21、对集群硬盘中的每个硬盘均增加监控点,并测试每个硬盘上监控点的测试参数;

s22、收集并录入测试参数的数值,把相同测试参数的数值相加后,除以相同测试参数的硬盘个数,得出测试参数的平均值;

s23、对数值高出平均值的硬盘,在集群硬盘中把此硬盘的osd角色移除下线,使用其他硬盘接替其工作;

s24、重复步骤s22、s23,不断得到不同的测试参数的平均值,并且平均值会不断地升高;当测试参数的平均值升高后,那些被下线的硬盘就会慢慢地恢复上线,直至所有硬盘的测试参数趋向一致,然后全部硬盘都重新一起上线工作,这样硬盘寿命也可以到达一致性,减少了个别硬盘损坏得过快的可能。

实施例4

如图2所示,本实施例提供了一种优化硬盘使用寿命的系统,系统包括:

监控模块,用于设置集群硬盘中的每个硬盘上监控点,并对监控点进行监控;

测试模块,用于对监控点上的测试参数进行测试;

测试参数收集模块,用于收集并录入所述测试模块测试得到的测试参数具体数值;优选地,测试参数收集模块采用smartctl工具

测试参数阈值预设模块,用于对测试参数阈值进行预先设置并保存;

对比模块,用于对所述测试参数收集模块收集的测试参数具体数值与所述测试参数阈值预设模块预先设置的测试参数阈值进行对比判断;

移除硬盘下线模块,用于对测试参数的具体数值达到了测试参数阈值的硬盘进行移除下线;

以及重上线模块,用于:当集群硬盘中所有硬盘均被所述移除硬盘下线模块移除下线后,重上线模块将集群硬盘中的所有硬盘重新上线使用。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解的是,在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种等效的变化、修改、替换和变型,本发明的范围由所附权利要求及其等同范围限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1