分布式图数据库黑盒健康情况的诊断方法、系统和介质与流程

文档序号:31191939发布日期:2022-08-19 23:42阅读:来源:国知局

技术特征:
1.一种分布式图数据库黑盒健康情况的诊断方法,其特征在于,所述方法包括:启动父进程以心跳请求的方式,采集分布式图数据库中的各项指标数据并上报给黑盒,通过所述黑盒将所述指标数据存储到时序数据库;根据从所述时序数据库中获取的所述指标数据,通过预设数据分析算法输出黑盒诊断报告。2.根据权利要求1所述的方法,其特征在于,启动父进程以第一心跳请求的方式,采集分布式图数据库中的各项指标数据包括:通过第一节点数据获取器启动父进程以第一心跳请求的方式,采集分布式图数据库中各个节点机器的指标数据;通过第二节点数据获取器启动父进程以第二心跳请求的方式,采集分布式图数据库中各个节点进程的指标数据;通过第三节点数据获取器启动父进程以第三心跳请求的方式,采集分布式图数据库中各个节点服务的指标数据。3.根据权利要求1所述的方法,其特征在于,所述黑盒中还包括有守护进程;在所述父进程的运行出现故障的情况下,启动所述守护进程以第四心跳请求的方式将所述指标数据存储到时序数据库;监测所述第四心跳请求,若所述时序数据库接收不到所述第四心跳请求,则发送信号重启所述守护进程。4.根据权利要求1所述的方法,其特征在于,通过所述黑盒将所述指标数据存储到时序数据库包括:通过所述黑盒将获取时间在第一预设时间内的指标数据存储在redis缓存中,将获取时间超过所述第一预设时间的指标数据存储在prometheus时序数据库中。5.根据权利要求1所述的方法,其特征在于,所述时序数据库中存储着所述分布式图数据库集群获取时间最新的第二预设时间的指标数据。6.根据权利要求2所述的方法,其特征在于,采集分布式图数据库中各个节点机器的指标数据包括:采集分布式图数据库中各个节点机器的处理器负载、内存使用率、处理器使用率和网络流量吞吐率。7.根据权利要求2所述的方法,其特征在于,采集分布式图数据库中各个节点进程的指标数据包括:获取所述分布式图数据库的ssh权限,根据对应进程的进程id获取所述对应进程的处理器使用率和内存使用率;根据所述分布式图数据库提供的审计日志,获取会话信息。8.根据权利要求2所述的方法,其特征在于,采集分布式图数据库中各个节点服务的指标数据包括:采集分布式图数据库中各个节点服务每秒查询率和心跳情况。9.一种分布式图数据库黑盒健康情况的诊断系统,其特征在于,所述系统包括采集模块和诊断模块;所述采集模块,用于启动父进程以心跳请求的方式,采集分布式图数据库中的各项指
标数据并上报给黑盒,通过所述黑盒将所述指标数据存储到时序数据库;所述诊断模块,用于根据从所述时序数据库中获取的所述指标数据,通过预设数据分析算法输出黑盒诊断报告。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至8中任一项所述的分布式图数据库黑盒健康情况的诊断方法。

技术总结
本申请涉及一种分布式图数据库黑盒健康情况的诊断方法、系统和介质,其中,该方法包括:通过启动父进程以心跳请求的方式,采集分布式图数据库中的各项指标数据并上报给黑盒,通过黑盒将指标数据存储到时序数据库;根据从时序数据库中获取的所述指标数据,通过预设数据分析算法输出黑盒诊断报告,通过本申请,解决了数据库集群崩溃原因的排查存在困难的问题,实现了使用黑盒记录集群的运行情况,帮助运维人员在排查集群问题时提供重要现场还原。运维人员在排查集群问题时提供重要现场还原。运维人员在排查集群问题时提供重要现场还原。


技术研发人员:汪洋 李丹骥 刘鑫超 叶小萌
受保护的技术使用者:杭州悦数科技有限公司
技术研发日:2022.04.28
技术公布日:2022/8/18
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1