一种多集群监控方法及系统与流程

文档序号:38585201发布日期:2024-07-10 15:26阅读:来源:国知局

技术特征:

1.一种多集群监控方法,其特征在于,采用prometheus作为监控工具,形成以监控中心为监控服务管理控制台的多集群监控;该方法的实现包括:

2.根据权利要求1所述的一种多集群监控方法,其特征在于,所述采用prometheus作为监控工具,使用prometheus的联邦集群模式部署,使用consul和k8s用于prometheus的动态服务发现,利用telegraf、exporter收集监控数据,使用grafana展示监控数据,使用alertmanager进行告警通知,通过监控中心与这些工具进行交互,最终形成以监控中心为监控服务管理控制台的多集群监控方案。

3.根据权利要求1或2所述的一种多集群监控方法,其特征在于,所述容器集群监控,每个节点使用cadvisor进行容器监控,获取到当前主机上容器的运行统计信息;通过与prometheus集成,将cadvisor添加到监控数据采集任务中。

4.根据权利要求1或2所述的一种多集群监控方法,其特征在于,所述虚机集群、大数据集群监控,每个节点使用telegraf进行监控数据采集,通过consul将telegraf添加到监控数据采集任务中。

5.根据权利要求1或2所述的一种多集群监控方法,其特征在于,在监控中心系统中通过分组映射,支持用户从业务及管理角度,对主机、服务应用等资源进行分类展示,分类告警;

6.根据权利要求1或2所述的一种多集群监控方法,其特征在于,所述容器集群数据采集,通过直接配置多个kubernetes apiserver的endpoints来监控整个k8s集群,容器集群的微服务通过暴露监控接口,基于k8s与prometheus间可以配置动态的服务发现;

7.根据权利要求1或2所述的一种多集群监控方法,其特征在于,所述统一告警,prometheus允许基于promql定义报警的触发条件,prometheus周期性的对promql进行计算,当满足条件时就会向alertmanager发送报警信息;

8.一种多集群监控系统,其特征在于,包括:

9.一种多集群监控装置,其特征在于,包括:至少一个存储器和至少一个处理器;

10.计算机可读介质,其特征在于,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行权利要求1至7任一所述的方法。


技术总结
本发明公开了一种多集群监控方法及系统,属于监控告警技术领域,采用prometheus作为监控工具,包括:多集群监控,包括容器集群监控,虚机集群、大数据集群监控;监控数据的采集,包括容器集群数据采集和虚机集群、大数据集群数据采集;监控中心通过告警规则的动态编辑,满足用户对告警的实时管控,并将告警内容列表实时呈现给用户;监控中心通过任务配置的方式,实现对任务接口的健康检查和监控;并配置服务拨测告警规则,将每个拨测任务的拨测结果,通过告警方式展示出来。本发明能够帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,对资源、业务应用进行集中、统一监控,及时预警,提升了管理能力。

技术研发人员:孙亮亮,张栋,周庆勇,刘传涛,魏金雷
受保护的技术使用者:浪潮云信息技术股份公司
技术研发日:
技术公布日:2024/7/9
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1