本发明涉及分布式数据库,具体涉及一种分布式数据库的健康检查方法及相关设备。
背景技术:
1、分布式数据库目前正在银行业大规模试点应用,在运维体系的建设方面尚处在比较早期的阶段。
2、现有技术中,分布式数据库的特点之一就是服务器众多,架构相较传统数据库而言更为复杂,在业务发生异常时,通过人工进行分布式数据库健康检查,需登陆管理控制台,通过点选各个关键指标进行查看和判断,难以快速定位故障位置,导致业务连续性受到影响。
3、因此,如何在业务发生异常时快速定位分布式数据库故障位置,是目前急需解决的问题。
技术实现思路
1、有鉴于此,本发明实施例提供一种分布式数据库的健康检查方法及相关设备,以实现快速定位故障位置,避免业务连续性受到影响的目的。
2、为实现上述目的,本发明实施例提供如下技术方案:
3、本发明实施例第一方面公开了一种分布式数据库的健康检查方法,所述方法包括:
4、当业务发生异常时,获取所述业务所属应用的应用id;
5、基于所述应用id,从配置中心获取资源信息;所述配置中心存储有各个应用对应的资源信息,每一所述资源信息存在对应的分布式数据库组件;
6、基于所述资源信息和数据交互接口,获取对应的分布式数据库组件的关键指标的指标值;每一所述分布式数据库组件存在预先设定的关键指标;
7、针对每一所述关键指标,判断所述关键指标的指标值是否大于对应的健康阈值;
8、若是,则标记所述关键指标的检查结果为异常;
9、若否,则标记所述关键指标的检查结果为正常;
10、展示各个所述关键指标的检查结果。
11、优选的,所述基于所述资源信息和数据交互接口,获取对应的分布式数据库组件的关键指标的指标值,包括:
12、基于所述资源信息和数据交互接口,获取对应的分布式数据库组件在预设历史时间区间内的运行数据;
13、基于所述运行数据进行统计,得到所述关键指标的指标值。
14、优选的,所述基于所述运行数据进行统计,得到所述关键指标的指标值,包括:
15、若所述运行数据对应的关键指标不属于预设的性能指标,则基于所述运行数据进行计数或者状态识别,得到所述关键指标的指标值;
16、若所述运行数据对应的关键指标属于所述性能指标,则基于所述运行数据计算得到统计值,并将所述统计值作为所述关键指标的指标值;所述统计值包括所述运行数据的最大值、最小值、平均值和当前值中的任一种。
17、优选的,所述展示各个所述关键指标的检查结果,包括:
18、基于预设汇总格式、各个所述关键指标的指标值和各个所述关键指标的检查结果,汇总得到健康检查结果列表;
19、通过预设的前端界面展示所述健康检查结果列表。
20、本发明实施例第二方面公开了一种分布式数据库的健康检查装置,所述装置包括:
21、第一获取单元,用于当业务发生异常时,获取所述业务所属应用的应用id;基于所述应用id,从配置中心获取资源信息;所述配置中心存储有各个应用对应的资源信息,每一所述资源信息存在对应的分布式数据库组件;
22、第二获取单元,用于基于所述资源信息和数据交互接口,获取对应的分布式数据库组件的关键指标的指标值;每一所述分布式数据库组件存在预先设定的关键指标;
23、判断单元,用于针对每一所述关键指标,判断所述关键指标的指标值是否大于对应的健康阈值;若是,则标记所述关键指标的检查结果为异常;若否,则标记所述关键指标的检查结果为正常;
24、展示单元,用于展示各个所述关键指标的检查结果。
25、优选的,所述第二获取单元,包括:
26、获取子单元,用于基于所述资源信息和数据交互接口,获取对应的分布式数据库组件在预设历史时间区间内的运行数据;
27、统计子单元,用于基于所述运行数据进行统计,得到所述关键指标的指标值。
28、优选的,所述统计子单元,具体用于:
29、若所述运行数据对应的关键指标不属于预设的性能指标,则基于所述运行数据进行计数或者状态识别,得到所述关键指标的指标值;
30、若所述运行数据对应的关键指标属于所述性能指标,则基于所述运行数据计算得到统计值,并将所述统计值作为所述关键指标的指标值;所述统计值包括所述运行数据的最大值、最小值、平均值和当前值中的任一种。
31、优选的,所述展示单元,具体用于:
32、基于预设汇总格式、各个所述关键指标的指标值和各个所述关键指标的检查结果,汇总得到健康检查结果列表;
33、通过预设的前端界面展示所述健康检查结果列表。
34、本发明实施例第三方面公开了一种存储介质,用于存储计算机程序,所述计算机程序被执行时,具体用于实现如本发明实施例第一方面公开的任一所述的分布式数据库的健康检查方法。
35、本发明实施例第四方面公开了一种电子设备,存储器和处理器;
36、所述存储器用于存储计算机程序;
37、所述处理器用于执行所述计算机程序,具体用于实现如本发明实施例第一方面公开的任一所述的分布式数据库的健康检查方法。
38、基于上述本发明实施例提供的一种分布式数据库的健康检查方法及相关设备,当业务发生异常时,获取所述业务所属应用的应用id;基于所述应用id,从配置中心获取资源信息;所述配置中心存储有各个应用对应的资源信息,每一所述资源信息存在对应的分布式数据库组件;基于所述资源信息和数据交互接口,获取对应的分布式数据库组件的关键指标的指标值;每一所述分布式数据库组件存在预先设定的关键指标;针对每一所述关键指标,判断所述关键指标的指标值是否大于对应的健康阈值;若是,则标记所述关键指标的检查结果为异常;若否,则标记所述关键指标的检查结果为正常;展示各个所述关键指标的检查结果。在本方案中,通过预设各个分布式数据库组件的关键指标,在业务发生异常时,获取相关的分布式数据库组件的关键指标的指标值,基于健康阈值,定位发生故障的分布式数据库组件,从而实现了快速定位故障位置,避免业务连续性受到影响的目的。
1.一种分布式数据库的健康检查方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述资源信息和数据交互接口,获取对应的分布式数据库组件的关键指标的指标值,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述运行数据进行统计,得到所述关键指标的指标值,包括:
4.根据权利要求1所述的方法,其特征在于,所述展示各个所述关键指标的检查结果,包括:
5.一种分布式数据库的健康检查装置,其特征在于,所述装置包括:
6.根据权利要求5所述的装置,其特征在于,所述第二获取单元,包括:
7.根据权利要求6所述的装置,其特征在于,所述统计子单元,具体用于:
8.根据权利要求5所述的装置,其特征在于,所述展示单元,具体用于:
9.一种存储介质,其特征在于,用于存储计算机程序,所述计算机程序被执行时,具体用于实现如权利要求1至4任意一项所述的分布式数据库的健康检查方法。
10.一种电子设备,其特征在于,包括:存储器和处理器;