一种集群震荡的优化方法及系统与流程

文档序号:39618136发布日期:2024-10-11 13:32阅读:11来源:国知局
一种集群震荡的优化方法及系统与流程

本发明属于计算机,尤其涉及一种集群震荡的优化方法及系统。


背景技术:

1、随着云计算、大数据时代的到来,分布式存储系统凭借优良的存储性能及低廉的构建成本逐渐代替传统存储系统。分布式存储系统一般将存储数据分别储存于不同节点中,同时使用冗余策略保证数据的安全性,当数据出错时采用容错机制恢复失效的数据;而当数据更新时则通过冗余策略将数据存储至不同的物理服务器节点。每个物理服务器节点上存在多块hdd磁盘以及1-2块nvme固态磁盘。当随着服务器运行时间的增加,磁盘读写时间的增加,磁盘故障的概率也会随之增加。但磁盘故障不是一蹴而就的,一般是先从部分坏道开始,如果不及时处理坏道的数量会不断增多,造成整个磁盘不可用。因此分布式存储系统一般对故障磁盘提前更换,但是在更换之前频繁访问到该故障磁盘的坏道的情况下,会导致该故障磁盘服务频繁up和down,导致集群一直处于数据同步恢复的震荡状态。因此如何更好地实现集群震荡的优化成为亟待解决的问题。


技术实现思路

1、鉴于以上现有技术的不足,发明的目的在于提供一种集群震荡的优化方法及系统,该方法优化了集群的运行状态,提高集群的稳定性和性能。

2、本发明的第一方面,提出了一种集群震荡的优化方法,包括:s1,获取被分布式存储管理的目标磁盘;s2,基于预故障诊断工具判断所述目标磁盘中是否存在故障,在所述目标磁盘出现故障的情况下,获取所述目标磁盘的服务标识;s3,在确定所述目标磁盘的服务可以停止的情况下,基于所述服务标识将所述目标磁盘的数据迁移至非故障磁盘。

3、进一步地,基于预故障诊断工具判断所述目标磁盘中是否存在故障,包括:基于预故障诊断工具判断所述目标磁盘中是否存在坏道;根据所述目标磁盘中是否存在坏道判断所述目标磁盘中是否存在故障。

4、进一步地,基于预故障诊断工具判断所述目标磁盘中是否存在坏道,包括:基于预故障诊断工具,确定所述目标磁盘中的重分配扇区计数、当前带映射扇区数或当前挂起扇区数、纠错后未能成功修复的错误数量、无法自动恢复的错误数量和特定命令的超时时间;根据所述重分配扇区计数、所述当前带映射扇区数或当前挂起扇区数、所述纠错后未能成功修复的错误数量、所述无法自动恢复的错误数量、所述特定命令的超时时间与目标阈值,判断所述目标磁盘中是否存在坏道;其中,所述目标阈值包括第一阈值、第二阈值、第三阈值、第四阈值和第五阈值,在所述重分配扇区计数大于所述第一阈值,和/或所述当前带映射扇区数或当前挂起扇区数大于所述第二阈值,和/或所述纠错后未能成功修复的错误数量大于所述第三阈值,和/或所述无法自动恢复的错误数量大于所述第四阈值,和/或所述特定命令的超时时间大于所述第五阈值的情况下,确定所述目标磁盘中存在坏道。

5、进一步地,在所述重分配扇区计数大于所述第一阈值、所述当前带映射扇区数或当前挂起扇区数大于所述第二阈值、所述纠错后未能成功修复的错误数量大于所述第三阈值、所述无法自动恢复的错误数量大于所述第四阈值、所述特定命令的超时时间大于所述第五阈值中存在目标数量的满足条件的情况下,确定所述目标磁盘存在故障。

6、进一步地,获取所述目标磁盘的服务标识,包括:接收标识查询请求;根据所述标识查询请求获取所述目标磁盘的所述服务标识。

7、进一步地,确定所述目标磁盘的服务可以停止,包括:获取所述目标磁盘的关联磁盘;判断所述关联磁盘是否存在故障;在所述关联磁盘未存在故障的情况下,确定所述目标磁盘的服务可以停止。

8、进一步地,获取所述目标磁盘的关联磁盘,包括:根据所述目标磁盘的目标数据,获取所述被分布式存储管理中的其他磁盘中存在所述目标数据的磁盘;将存在所述目标数据的所述磁盘作为关联磁盘。

9、本发明的第二方面,提出了一种集群震荡的优化系统,包括:获取模块,用于获取被分布式存储管理的目标磁盘;判断模块,用于基于预故障诊断工具判断所述目标磁盘中是否存在故障,在所述目标磁盘出现故障的情况下,获取所述目标磁盘的服务标识;迁移模块,用于在确定所述目标磁盘的服务可以停止的情况下,基于所述服务标识将所述目标磁盘的数据迁移至非故障磁盘。

10、本发明的第三方面,提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明第一方面中任一项所述的方法。

11、本发明的第四方面,提出了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本发明第一方面中任一项所述的方法。

12、本发明有益效果如下:

13、本发明所述的集群震荡的优化方法及系统,获取被分布式存储管理的目标磁盘;基于预故障诊断工具判断所述目标磁盘中是否存在故障,在所述目标磁盘出现故障的情况下,获取所述目标磁盘的服务标识;在确定所述目标磁盘的服务可以停止的情况下,基于所述服务标识将所述目标磁盘的数据迁移至非故障磁盘。该方法通过使用预故障诊断工具对目标磁盘进行检测,可以提前发现潜在的硬盘问题和故障,从而及时采取措施避免数据丢失或损坏;可以在发现故障后及时将数据迁移至非故障磁盘,从而优化集群的运行状态,提高集群的稳定性和性能。



技术特征:

1.一种集群震荡的优化方法,其特征在于,包括:

2.根据权利要求1所述的集群震荡的优化方法,其特征在于,基于预故障诊断工具判断所述目标磁盘中是否存在故障,包括:

3.根据权利要求2所述的集群震荡的优化方法,其特征在于,基于预故障诊断工具判断所述目标磁盘中是否存在坏道,包括:

4.根据权利要求3所述的集群震荡的优化方法,其特征在于,在所述重分配扇区计数大于所述第一阈值、所述当前带映射扇区数或当前挂起扇区数大于所述第二阈值、所述纠错后未能成功修复的错误数量大于所述第三阈值、所述无法自动恢复的错误数量大于所述第四阈值、所述特定命令的超时时间大于所述第五阈值中存在目标数量的满足条件的情况下,确定所述目标磁盘存在故障。

5.根据权利要求1所述的集群震荡的优化方法,其特征在于,获取所述目标磁盘的服务标识,包括:

6.根据权利要求1所述的集群震荡的优化方法,其特征在于,确定所述目标磁盘的服务可以停止,包括:

7.根据权利要求6所述的集群震荡的优化方法,其特征在于,获取所述目标磁盘的关联磁盘,包括:

8.一种集群震荡的优化系统,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1至7中任一项所述的方法。


技术总结
本发明涉及一种集群震荡的优化方法及系统,属于计算机技术领域,该方法包括:获取被分布式存储管理的目标磁盘;基于预故障诊断工具判断所述目标磁盘中是否存在故障,在所述目标磁盘出现故障的情况下,获取所述目标磁盘的服务标识;在确定所述目标磁盘的服务可以停止的情况下,基于所述服务标识将所述目标磁盘的数据迁移至非故障磁盘。该方法通过使用预故障诊断工具对目标磁盘进行检测,可以提前发现潜在的硬盘问题和故障,从而及时采取措施避免数据丢失或损坏;可以在发现故障后及时将数据迁移至非故障磁盘,从而优化集群的运行状态,提高集群的稳定性和性能。

技术研发人员:李博奇,刘飞龙,王宜燕,李佳徐,刘伟锋,杨堃
受保护的技术使用者:中电信数智科技有限公司
技术研发日:
技术公布日:2024/10/10
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1