一种故障处理系统、方法及装置与流程

文档序号:34744295发布日期:2023-07-12 23:22阅读:17来源:国知局
一种故障处理系统、方法及装置与流程

本发明涉及大数据领域,尤其涉及一种故障处理系统、方法及装置。


背景技术:

1、可用区指电力和网络互相独立的物理区域。不同可用区之间可以实现故障隔离,即如果一个可用区出现故障,则不会影响其他可用区的正常运行。当自然灾害、断电等极端不可抗情况造成底层基础设备故障时,可能会造成可用区故障,从而影响可用区内所有的数据不可用。

2、目前,大数据云平台承担了银行的部分核心业务。当可用区发生故障时,大数据云平台需要进行故障处理。然而,现阶段大数据云平台需要对各个受影响的数据服务进行单独故障处理,而这种方法缺乏普适性,导致处理故障需要消耗较长时间,影响大数据云平台的正常使用。

3、综上,目前暨需一种故障处理系统,用以提高可用区发生故障时大数据云平台处理故障的速度与效率。


技术实现思路

1、本发明提供一种故障处理系统、方法及装置,用以提高可用区发生故障时大数据云平台处理故障的速度与效率。

2、第一方面,本发明提供一种故障处理系统,包括可用区管理模块、可用区支持模块和业务服务模块,其中,可用区管理模块用于获取可用区的可用状态以及可用区内包含的各个集群的可用状态,其中,任一集群中包含至少一个数据资源;接着,可用区支持模块用于根据获取到的可用区的可用状态以及可用区内包含的各个集群的可用状态,来确定预设的数据资源集中包含的各个数据资源的可用状态,其中,各个数据资源分为主数据资源和至少一个备用数据资源;以及,当主数据资源为不可用状态时,将处于可用状态的备用数据资源确定为该数据资源集中的新的主数据资源。之后,业务服务模块用于根据新的主数据资源执行数据服务。

3、上述方法中,当某一可用区发生故障后,可用区管理模块会获取到该可用区处于不可用状态以及该可用区内各集群处于不可用状态,可以理解的是,当集群处于不可用状态时,存储于该集群的所有数据资源也处于不可用状态。接着,可用区支持模块会确定各预设的数据资源集中各个数据资源的可用状态,当某个数据资源处于不可用状态,且该数据资源为某一个数据资源集的主数据资源,则可用区支持模块会该数据资源集中处于可用状态的备用数据资源确定为新的主数据资源。在这之后,业务服务模块根据该新的主数据资源执行数据服务。由此,通过在系统中设置可用区支持模块,可用区支持模块可以统一确认所有的数据资源集中各个数据资源的可用状态,进而自动将数据资源集中不可用的主数据资源替换为处于可用状态的备用数据资源,也即对受影响的数据服务进行统一地故障处理,而不是现有技术中需要对各个受影响的数据服务进行单独故障处理,这有助于提高可用区发生故障后处理故障的速度与效率。

4、可选地,主数据资源是通过如下方式确定的:可用区支持模块,还用于按照优先级的顺序,对数据资源集中包含的所有数据资源进行排序,优先级最高的数据资源作为主数据资源。

5、通过使用上述方法,可以选出优先级最高的数据资源作为其所属数据资源集的主数据资源,使得业务服务模块是基于优先级最高的数据资源来执行数据服务,从而提高业务服务模块的服务效率与服务质量。

6、可选地,可用区支持模块还用于对于任一数据资源集,若该数据资源集的备用数据资源恢复为可用状态时,比较备用数据资源的优先级与新的主数据资源的优先级;若备用数据资源的优先级高于新的主数据资源的优先级,将备用数据资源更新为新的主数据资源。

7、上述方法中,当发生故障的可用区恢复正常后,原先数据资源集中处于不可用的主数据资源也恢复为正常,通过选优先级最高的数据资源作为其所属数据资源集的主数据资源,也即将备用的原主数据资源确定为主数据资源,从而提高业务服务模块的服务效率与服务质量。

8、可选地,可用区支持模块还用于记录处于不可用状态的数据资源集,其中,记录用于外界组件排查受影响的数据资源。

9、上述方法中,通过记录处于不可用状态的数据资源集,可以帮助外界组件排查受影响的数据资源,从而解决恢复故障的可用区后,有些数据资源被丢失或不完整的问题。

10、可选地,数据资源集包括复合资源组以及复合数据源;复合资源组包括一个主资源组以及至少一个备用资源组;复合数据源包括一个主数据源以及至少一个备用数据源。

11、第二方面,本发明提供一种故障处理方法,适用于故障处理系统,所述方法包括:获取可用区的可用状态以及所述可用区内包含的各个集群的可用状态,任一集群中包含至少一个数据资源;根据所述可用区的可用状态以及所述可用区内包含的各个集群的可用状态,确定预设的数据资源集中包含的各个数据资源的可用状态,所述各个数据资源分为主数据资源和至少一个备用数据资源,当所述主数据资源为不可用状态时,将处于可用状态的备用数据资源确定为所述数据资源集中的新的主数据资源;根据所述新的主数据资源执行数据服务。

12、可选地,所述主数据资源是通过如下方式确定的:按照优先级的顺序,对所述数据资源集中包含的所有数据资源进行排序,优先级最高的数据资源作为主数据资源。

13、可选地,所述方法还包括:对于任一数据资源集,若该数据资源集的备用数据资源恢复为可用状态时,比较所述备用数据资源的优先级与所述新的主数据资源的优先级;若所述备用数据资源的优先级高于所述新的主数据资源的优先级,将所述备用数据资源更新为所述新的主数据资源。

14、可选地,所述方法还包括:记录处于不可用状态的数据资源集,其中,所述记录用于外界组件排查受影响的数据资源。

15、可选地,所述数据资源集包括复合资源组以及复合数据源;所述复合资源组包括一个主资源组以及至少一个备用资源组;所述复合数据源包括一个主数据源以及至少一个备用数据源。

16、第三方面,本发明提供了一种故障处理装置,该数据处理装置包括:获取单元,用于获取可用区的可用状态以及所述可用区内包含的各个集群的可用状态,任一集群中包含至少一个数据资源;处理单元,用于根据所述可用区的可用状态以及所述可用区内包含的各个集群的可用状态,确定预设的数据资源集中包含的各个数据资源的可用状态,所述各个数据资源分为主数据资源和至少一个备用数据资源,当所述主数据资源为不可用状态时,将处于可用状态的备用数据资源确定为所述数据资源集中的新的主数据资源;根据所述新的主数据资源执行数据服务。

17、可选的,所述处理单元,具体用于按照优先级的顺序,对所述数据资源集中包含的所有数据资源进行排序,优先级最高的数据资源作为主数据资源。

18、可选的,所述处理单元,具体用于对于任一数据资源集,若该数据资源集的备用数据资源恢复为可用状态时,比较所述备用数据资源的优先级与所述新的主数据资源的优先级;若所述备用数据资源的优先级高于所述新的主数据资源的优先级,将所述备用数据资源更新为所述新的主数据资源。

19、可选的,所述处理单元,具体用于记录处于不可用状态的数据资源集,其中,所述记录用于外界组件排查受影响的数据资源。

20、可选的,所述数据资源集包括复合资源组以及复合数据源;所述复合资源组包括一个主资源组以及至少一个备用资源组;所述复合数据源包括一个主数据源以及至少一个备用数据源。

21、第四方面,本发明提供了一种计算设备,包括至少一个处理器以及至少一个存储器,其中,所述存储器存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行上述第二方面任一所述的故障处理方法。

22、第五方面,本发明还提供了一种计算机可读存储介质,所述存储介质存储有程序,当所述程序在计算机上运行时,使得计算机实现执行上述第二方面任意所述的故障处理方法。

23、第六方面,本发明还提供一种计算机程序产品,包括计算机可读指令,当计算机可读指令被处理器执行时,使得上述第二方面的任一种可能的设计中所述的方法实现。

24、上述第二方面至第六方面的有益效果,具体请参照上述第一方面中相应设计可以达到的技术效果,这里不再重复赘述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1