一种双控存储产品单点故障的掉电保护方法与流程

文档序号:21694065发布日期:2020-07-31 22:22阅读:474来源:国知局
一种双控存储产品单点故障的掉电保护方法与流程

本发明涉及存储产品领域,具体涉及一种双控存储产品单点故障的掉电保护方法。



背景技术:

当前的双控存储产品bbu和psu是一体化设计,在更换bbu的时候,需要把psu拔出来。在当前的设计方案下,单控bbu出现故障或者被拔出后,双控保持writeback模式进行数据下发,此时另外一颗bbu出现故障,有数据丢失的风险,五分钟后存储产品将单控运行,前端主机io按照write-throuth的方式下发,此时的读写性能将下降很多,同时导致主机端路径切换,冗余性丢失;单点bbu故障或者拔出后,存储设备单控运行,设备可靠性没有保障,当psu1和bbu2交叉离位时会导致存储宕机,不符合任意单点故障存储不宕机的设计。



技术实现要素:

为解决上述问题,本发明提供一种双控存储产品单点故障的掉电保护方法,保障用户数据安全,提高产品可靠性。

本发明的技术方案是:一种双控存储产品单点故障的掉电保护方法,包括以下步骤:

a控psu拔出时,若bbu同时也被拔出或者bbu出现故障,则双控进入writethrough模式;

bbu更换后,存储系统恢复正常状态;

若双控进入writethrough模式运行预设时间后,bbu仍未被更换,则a控进入service模式,b控保持writethrough模式单控制器运行。

进一步地,预设时间为一周。

进一步地,该方法还包括:

若bbu更换后,a控再次出现bbu故障或psu故障或psu掉电,或b控控制器故障,则双控停止业务。

进一步地,该方法还包括:

若bbu更换后,a控出现控制器故障或者发生raid降级,则a控停止服务,b控单控writethrough模式工作。

进一步地,存储系统恢复正常状态是指双控以writeback模式工作。

进一步地,writeback模式的写操作过程为:

前端主机下发io执行一次写操作,先是将数据写入缓存,然后从缓存再写入硬盘,硬盘返回指令写返回到缓存,然后到前端主机,前端主机收到写返回的指令,表示数据已经写入硬盘,此次写操作完成。

进一步地,writethrough模式的写操作过程为:

前端主机下发一次io,执行写操作指令,不经过缓存分区,直接写入硬盘,数据落盘后,硬盘返回指令写返回,前端主机收到写返回指令,表示数据已经写入硬盘,此次写操作完成。

进一步地,a控psu拔出时,若bbu同时也被拔出或者bbu出现故障,存储系统还发出告警。

进一步地,bbu更换后,告警恢复。

本发明提供的一种双控存储产品单点故障的掉电保护方法,a控psu拔出时,若bbu同时也被拔出或者bbu出现故障,则双控进入writethrough模式;bbu更换后,存储系统恢复正常状态;若双控进入writethrough模式运行预设时间后,bbu仍未被更换,则a控进入service模式,b控保持writethrough模式单控制器运行。该方法可保证数据在任何情况都是安全的,最大程度上保障客户数据的安全,提供更好的产品可靠性。

附图说明

图1是本发明具体实施例方法流程示意图。

图2是writeback模式的写操作过程流程示意图。

图3是writethrough模式的写操作过程流程示意图。

具体实施方式

下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。

本实施例提供一种双控存储产品单点故障的掉电保护方法,具体实现思路如下:

a控psu拔出时,bbu同时也被拔出或者bbu出现故障,存储系统出现告警,此时双控进入writethrough模式,前端主机下发的io数据直接写入存储数据盘,避免了数据丢失的风险,此种情况设备保持双控运行一周,保障存储设备的冗余性;此时运维人员及时进行bbu更换,告警恢复,系统恢复为以前状态;

如果故障一直存在,双控保持writethrough模式运行一周后,a控进入service模式,b控保持writethrough模式单控制器运行,该种模式下,前端数据直接写入存储数据盘,数据安全是有保障的,但需要及时处理,否则设备宕机,影响客户业务。

如图1所示,具体实施时,本方法包括以下步骤:

s1,a控psu拔出时,若bbu同时也被拔出或者bbu出现故障,则双控进入writethrough模式;

需要说明的是,若bbu同时也被拔出或者bbu出现故障,存储系统发出告警,提醒运维人员及时处理。

s2,bbu更换后,存储系统恢复正常状态;

需要说明的是,存储系统的正常状态是指writeback模式的。

s3,若双控进入writethrough模式运行预设时间后,bbu仍未被更换,则a控进入service模式,b控保持writethrough模式单控制器运行;

需要说明的是,预设时间可以是一周,即双控保持writethrough模式运行一周后,a控进入service模式,b控保持writethrough模式单控制器运行,该种模式下,前端数据直接写入存储数据盘,数据安全是有保障的,但需要及时处理,否则设备宕机,影响客户业务。

bbu更换后,可能发生二次故障,此时可进行如下处理:

若bbu更换后,a控再次出现bbu故障或psu故障或psu掉电,或b控控制器故障,则双控停止业务;需要说明的是,此时前端数据完整无丢失。

若bbu更换后,a控出现控制器故障或者发生raid降级,则a控停止服务,b控单控writethrough模式工作。

如图2所示,writeback模式的写操作过程为:

前端主机下发io执行一次写操作,先是将数据写入缓存,然后从缓存再写入硬盘,硬盘返回指令写返回到缓存,然后到前端主机,前端主机收到写返回的指令,表示数据已经写入硬盘,此次写操作完成。

如图3所示,writethrough模式的写操作过程为:

前端主机下发一次io,执行写操作指令,不经过缓存分区,直接写入硬盘,数据落盘后,硬盘返回指令写返回,前端主机收到写返回指令,表示数据已经写入硬盘,此次写操作完成。

write-through意思是写操作根本不使用缓存。数据总是直接写入磁盘。关闭写缓存,不为写操作分配缓存空间,可释放缓存用于读操作。

以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。



技术特征:

1.一种双控存储产品单点故障的掉电保护方法,其特征在于,包括以下步骤:

a控psu拔出时,若bbu同时也被拔出或者bbu出现故障,则双控进入writethrough模式;

bbu更换后,存储系统恢复正常状态;

若双控进入writethrough模式运行预设时间后,bbu仍未被更换,则a控进入service模式,b控保持writethrough模式单控制器运行。

2.根据权利要求1所述的双控存储产品单点故障的掉电保护方法,其特征在于,预设时间为一周。

3.根据权利要求1或2所述的双控存储产品单点故障的掉电保护方法,其特征在于,该方法还包括:

若bbu更换后,a控再次出现bbu故障或psu故障或psu掉电,或b控控制器故障,则双控停止业务。

4.根据权利要求3所述的双控存储产品单点故障的掉电保护方法,其特征在于,该方法还包括:

若bbu更换后,a控出现控制器故障或者发生raid降级,则a控停止服务,b控单控writethrough模式工作。

5.根据权利要求1、2或4所述的双控存储产品单点故障的掉电保护方法,其特征在于,存储系统恢复正常状态是指双控以writeback模式工作。

6.根据权利要求5所述的双控存储产品单点故障的掉电保护方法,其特征在于,writeback模式的写操作过程为:

前端主机下发io执行一次写操作,先是将数据写入缓存,然后从缓存再写入硬盘,硬盘返回指令写返回到缓存,然后到前端主机,前端主机收到写返回的指令,表示数据已经写入硬盘,此次写操作完成。

7.根据权利要求6所述的双控存储产品单点故障的掉电保护方法,其特征在于,writethrough模式的写操作过程为:

前端主机下发一次io,执行写操作指令,不经过缓存分区,直接写入硬盘,数据落盘后,硬盘返回指令写返回,前端主机收到写返回指令,表示数据已经写入硬盘,此次写操作完成。

8.根据权利要求1、2、4、6或7所述的双控存储产品单点故障的掉电保护方法,其特征在于,

a控psu拔出时,若bbu同时也被拔出或者bbu出现故障,存储系统还发出告警。

9.根据权利要求8所述的双控存储产品单点故障的掉电保护方法,其特征在于,

bbu更换后,告警恢复。


技术总结
本发明公开一种双控存储产品单点故障的掉电保护方法,A控PSU拔出时,若BBU同时也被拔出或者BBU出现故障,则双控进入write Through模式;BBU更换后,存储系统恢复正常状态;若双控进入write Through模式运行预设时间后,BBU仍未被更换,则A控进入service模式,B控保持write through模式单控制器运行。该方法可保证数据在任何情况都是安全的,最大程度上保障客户数据的安全,提供更好的产品可靠性。

技术研发人员:房永昌;刘雪姣
受保护的技术使用者:苏州浪潮智能科技有限公司
技术研发日:2020.03.11
技术公布日:2020.07.31
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1