基于nomad的告警自动修复系统及方法与流程

文档序号:32055778发布日期:2022-11-04 21:19阅读:来源:国知局

技术特征:
1.一种基于nomad的告警自动修复系统,其特征在于包括:operator组件,所述operator组件提供有云原生方式的交互界面,用于支持用户编写告警处理逻辑;中心server组件,所述中心server组件用于轮询告警信息,并将告警信息与告警处理逻辑匹配组装为nomad可执行的任务;nomad,集群中每个节点均配置有nomad,集群中配置有nomad的master节点作为nomadserver节点,集群中配置有nomad的master节点和worker节点作为nomadagent节点,所述nomadserver节点用于通过nomad为中心server组件提供接口调用、并对中心server组件下发的任务进行调度,所述nomadserver节点用于通过nomad接收并执行任务,并通过nomad记录任务执行详情、形成任务执行结果并向中心server组件返回任务执行结果;数据库,所述数据库与所述中心server组件交互,用于存储告警信息、任务执行详情以及任务执行结果。2.根据权利要求1所述的基于nomad的告警自动修复系统,其特征在于所述告警处理逻辑为能够固化的重复执行类告警修复逻辑;所述告警处理逻辑包括如下调度规则:随机规则,对于可由任意节点执行的任务,随机选择一个节点执行;广播规则,对于需要所有节点同时执行且等待全部结束的任务,将对用的可执行任务广播至所有节点;指定规则,对于需要指定节点执行的任务,通过类似label selector筛选匹配的节点。3.根据权利要求1所述的基于nomad的告警自动修复系统,其特征在于对于每个告警处理逻辑,所述中心server组件用于基于nomad中job单元规定的语法格式将告警处理逻辑和与其对应的脚本和参数值渲染为json格式的报文;对于轮询到的告警信息,所述中心server组件用于为告警信息匹配对应的告警处理逻辑,并基于对应的告警处理逻辑匹配对应的报文,将所述告警信息对应的报文以及参数值作为可执行的任务,调用由nomadserver节点提供的接口、并触发nomadserver节点通过nomad调度任务。4.根据权利要求3所述的基于nomad的告警自动修复系统,其特征在于对于所述json格式的报文,其中包含的脚本支持jav格式、shell格式、python以及exec格式。5.根据权利要求1-3任一项所述的基于nomad的告警自动修复系统,其特征在于还包括:前端展示模块,所述前端展示模块与数据库交互,并通过前端页面与用户交互,用于通过任务执行列表的形式展示执行的任务,并用于支持查询和展示每个任务对应的告警信息、任务执行详情以及任务执行结果。6.一种基于nomad的告警自动修复方法,其特征在于通过如权利要求1-5任一项所述的基于nomad的告警自动修复系统进行告警自动修复,所述方法包括如下步骤:集群中每个节点上均配置nomad,将集群中配置有nomad的master节点作为nomadserver节点,将集群中配置有nomad的master节点和worker节点作为nomadagent节点;通过operator组件编写告警处理逻辑;
从集群中轮询告警信息,将告警信息与告警处理逻辑匹配组装为nomad可执行的任务;对于所述任务,调用nomadserver节点提供的接口触发nomadserver节点调度任务,将任务下发至对应的nomadagent节点,对应的nomadagent节点通过nomad接收并执行任务,并通过nomad记录任务执行详情、形成任务执行结果,将任务执行详情以及任务执行结果存储至数据库并向中心server组件返回任务执行结果。7.根据权利要求6所述的基于nomad的告警自动修复方法,其特征在于所述告警处理逻辑为能够固化的重复执行类告警修复逻辑;所述告警处理逻辑包括如下调度规则:随机规则,对于可由任意节点执行的任务,随机选择一个节点执行;广播规则,对于需要所有节点同时执行且等待全部结束的任务,将对用的可执行任务广播至所有节点;指定规则,对于需要指定节点执行的任务,通过类似labelselector筛选匹配的节点。8.根据权利要求6所述的基于nomad的告警自动修复方法,其特征在于对于每个告警处理逻辑,基于nomad中job单元规定的语法格式、通过中心server组件将告警处理逻辑和与其对应的脚本和参数值渲染为json格式的报文;对于轮询到的告警信息,通过中心server组件为告警信息匹配对应的告警处理逻辑,并基于对应的告警处理逻辑匹配对应的报文,将所述告警信息对应的报文以及参数值作为可执行的任务,并调用由nomadserver节点提供的接口、触发nomadserver节点通过nomad调度任务。9.根据权利要求8所述的基于nomad的告警自动修复方法,其特征在于对于所述json格式的报文,其中包含的脚本支持jav格式、shell格式、python以及exec格式。10.根据权利要求6-9任一项所述的基于nomad的告警自动修复方法,其特征在于还包括如下步骤:在前端页面通过任务执行列表的形式展示执行的任务,并通过前端页面对每个任务对应的告警信息、任务执行详情以及任务执行结果进行查询和展示。

技术总结
本发明公开了基于nomad的告警自动修复系统及方法,属于云计算技术领域,要解决的技术问题为如何自动化的实现告警自动修复。包括:Operator组件,提供有云原生方式的交互界面,用于支持用户编写告警处理逻辑;中心server组件,用于轮询告警信息,并将告警信息与告警处理逻辑匹配组装为nomad可执行的任务;Nomad,nomadserver节点用于通过nomad为中心server组件提供接口调用、并对中心server组件下发的任务进行调度,所述nomadserver节点用于通过nomad接收并执行任务;数据库,用于存储告警信息、任务执行详情以及任务执行结果。任务执行详情以及任务执行结果。任务执行详情以及任务执行结果。


技术研发人员:张勇 石光银 蔡卫卫 高传集 孙思清
受保护的技术使用者:浪潮云信息技术股份公司
技术研发日:2022.07.22
技术公布日:2022/11/3
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1