本发明涉及存储产品领域,具体涉及一种双控存储产品单点故障的掉电保护方法。
背景技术:
当前的双控存储产品bbu和psu是一体化设计,在更换bbu的时候,需要把psu拔出来。在当前的设计方案下,单控bbu出现故障或者被拔出后,双控保持writeback模式进行数据下发,此时另外一颗bbu出现故障,有数据丢失的风险,五分钟后存储产品将单控运行,前端主机io按照write-throuth的方式下发,此时的读写性能将下降很多,同时导致主机端路径切换,冗余性丢失;单点bbu故障或者拔出后,存储设备单控运行,设备可靠性没有保障,当psu1和bbu2交叉离位时会导致存储宕机,不符合任意单点故障存储不宕机的设计。
技术实现要素:
为解决上述问题,本发明提供一种双控存储产品单点故障的掉电保护方法,保障用户数据安全,提高产品可靠性。
本发明的技术方案是:一种双控存储产品单点故障的掉电保护方法,包括以下步骤:
a控psu拔出时,若bbu同时也被拔出或者bbu出现故障,则双控进入writethrough模式;
bbu更换后,存储系统恢复正常状态;
若双控进入writethrough模式运行预设时间后,bbu仍未被更换,则a控进入service模式,b控保持writethrough模式单控制器运行。
进一步地,预设时间为一周。
进一步地,该方法还包括:
若bbu更换后,a控再次出现bbu故障或psu故障或psu掉电,或b控控制器故障,则双控停止业务。
进一步地,该方法还包括:
若bbu更换后,a控出现控制器故障或者发生raid降级,则a控停止服务,b控单控writethrough模式工作。
进一步地,存储系统恢复正常状态是指双控以writeback模式工作。
进一步地,writeback模式的写操作过程为:
前端主机下发io执行一次写操作,先是将数据写入缓存,然后从缓存再写入硬盘,硬盘返回指令写返回到缓存,然后到前端主机,前端主机收到写返回的指令,表示数据已经写入硬盘,此次写操作完成。
进一步地,writethrough模式的写操作过程为:
前端主机下发一次io,执行写操作指令,不经过缓存分区,直接写入硬盘,数据落盘后,硬盘返回指令写返回,前端主机收到写返回指令,表示数据已经写入硬盘,此次写操作完成。
进一步地,a控psu拔出时,若bbu同时也被拔出或者bbu出现故障,存储系统还发出告警。
进一步地,bbu更换后,告警恢复。
本发明提供的一种双控存储产品单点故障的掉电保护方法,a控psu拔出时,若bbu同时也被拔出或者bbu出现故障,则双控进入writethrough模式;bbu更换后,存储系统恢复正常状态;若双控进入writethrough模式运行预设时间后,bbu仍未被更换,则a控进入service模式,b控保持writethrough模式单控制器运行。该方法可保证数据在任何情况都是安全的,最大程度上保障客户数据的安全,提供更好的产品可靠性。
附图说明
图1是本发明具体实施例方法流程示意图。
图2是writeback模式的写操作过程流程示意图。
图3是writethrough模式的写操作过程流程示意图。
具体实施方式
下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。
本实施例提供一种双控存储产品单点故障的掉电保护方法,具体实现思路如下:
a控psu拔出时,bbu同时也被拔出或者bbu出现故障,存储系统出现告警,此时双控进入writethrough模式,前端主机下发的io数据直接写入存储数据盘,避免了数据丢失的风险,此种情况设备保持双控运行一周,保障存储设备的冗余性;此时运维人员及时进行bbu更换,告警恢复,系统恢复为以前状态;
如果故障一直存在,双控保持writethrough模式运行一周后,a控进入service模式,b控保持writethrough模式单控制器运行,该种模式下,前端数据直接写入存储数据盘,数据安全是有保障的,但需要及时处理,否则设备宕机,影响客户业务。
如图1所示,具体实施时,本方法包括以下步骤:
s1,a控psu拔出时,若bbu同时也被拔出或者bbu出现故障,则双控进入writethrough模式;
需要说明的是,若bbu同时也被拔出或者bbu出现故障,存储系统发出告警,提醒运维人员及时处理。
s2,bbu更换后,存储系统恢复正常状态;
需要说明的是,存储系统的正常状态是指writeback模式的。
s3,若双控进入writethrough模式运行预设时间后,bbu仍未被更换,则a控进入service模式,b控保持writethrough模式单控制器运行;
需要说明的是,预设时间可以是一周,即双控保持writethrough模式运行一周后,a控进入service模式,b控保持writethrough模式单控制器运行,该种模式下,前端数据直接写入存储数据盘,数据安全是有保障的,但需要及时处理,否则设备宕机,影响客户业务。
bbu更换后,可能发生二次故障,此时可进行如下处理:
若bbu更换后,a控再次出现bbu故障或psu故障或psu掉电,或b控控制器故障,则双控停止业务;需要说明的是,此时前端数据完整无丢失。
若bbu更换后,a控出现控制器故障或者发生raid降级,则a控停止服务,b控单控writethrough模式工作。
如图2所示,writeback模式的写操作过程为:
前端主机下发io执行一次写操作,先是将数据写入缓存,然后从缓存再写入硬盘,硬盘返回指令写返回到缓存,然后到前端主机,前端主机收到写返回的指令,表示数据已经写入硬盘,此次写操作完成。
如图3所示,writethrough模式的写操作过程为:
前端主机下发一次io,执行写操作指令,不经过缓存分区,直接写入硬盘,数据落盘后,硬盘返回指令写返回,前端主机收到写返回指令,表示数据已经写入硬盘,此次写操作完成。
write-through意思是写操作根本不使用缓存。数据总是直接写入磁盘。关闭写缓存,不为写操作分配缓存空间,可释放缓存用于读操作。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。
1.一种双控存储产品单点故障的掉电保护方法,其特征在于,包括以下步骤:
a控psu拔出时,若bbu同时也被拔出或者bbu出现故障,则双控进入writethrough模式;
bbu更换后,存储系统恢复正常状态;
若双控进入writethrough模式运行预设时间后,bbu仍未被更换,则a控进入service模式,b控保持writethrough模式单控制器运行。
2.根据权利要求1所述的双控存储产品单点故障的掉电保护方法,其特征在于,预设时间为一周。
3.根据权利要求1或2所述的双控存储产品单点故障的掉电保护方法,其特征在于,该方法还包括:
若bbu更换后,a控再次出现bbu故障或psu故障或psu掉电,或b控控制器故障,则双控停止业务。
4.根据权利要求3所述的双控存储产品单点故障的掉电保护方法,其特征在于,该方法还包括:
若bbu更换后,a控出现控制器故障或者发生raid降级,则a控停止服务,b控单控writethrough模式工作。
5.根据权利要求1、2或4所述的双控存储产品单点故障的掉电保护方法,其特征在于,存储系统恢复正常状态是指双控以writeback模式工作。
6.根据权利要求5所述的双控存储产品单点故障的掉电保护方法,其特征在于,writeback模式的写操作过程为:
前端主机下发io执行一次写操作,先是将数据写入缓存,然后从缓存再写入硬盘,硬盘返回指令写返回到缓存,然后到前端主机,前端主机收到写返回的指令,表示数据已经写入硬盘,此次写操作完成。
7.根据权利要求6所述的双控存储产品单点故障的掉电保护方法,其特征在于,writethrough模式的写操作过程为:
前端主机下发一次io,执行写操作指令,不经过缓存分区,直接写入硬盘,数据落盘后,硬盘返回指令写返回,前端主机收到写返回指令,表示数据已经写入硬盘,此次写操作完成。
8.根据权利要求1、2、4、6或7所述的双控存储产品单点故障的掉电保护方法,其特征在于,
a控psu拔出时,若bbu同时也被拔出或者bbu出现故障,存储系统还发出告警。
9.根据权利要求8所述的双控存储产品单点故障的掉电保护方法,其特征在于,
bbu更换后,告警恢复。