主机存活探测方法、装置、设备和存储介质与流程

文档序号:35695314发布日期:2023-10-11 18:21阅读:48来源:国知局
主机存活探测方法、装置、设备和存储介质与流程

本申请涉及分布式架构领域,尤其涉及一种主机存活探测方法、装置、设备和存储介质。


背景技术:

1、在做分布式云架构部署时,由于各个系统可能会出现主机实例异常下线或者不活的非正常工作状态,因此需要通过向目标主机实例发送探测数据包或者探测信息,探测目标实例是否为正常工作状态。

2、现有技术一般是在登录分布式云平台如tsf(tencent service framework,tsf)客户端后,对每个部署组的实例在进行依次排查后,才能发现处于非正常工作状态的主机实例,但由于部署组的主机实例数量很多,因此在对众多部署组的主机实例的排查时,并不能快速、准确的查找到处于非正常工作状态的主机实例,导致排查异常问题效率较低。

3、因此现有技术在不能快速、准确的查找到处于非正常工作状态的主机实例,导致排查异常问题效率较低的方面仍有所欠缺。


技术实现思路

1、本申请提供一种主机存活探测方法、装置、设备和存储介质,用以解决现有技术在不能快速、准确的查找到处于非正常工作状态的主机实例,导致排查异常问题效率较低的问题。

2、第一方面,本申请提供一种主机存活探测方法,包括:通过所述分布式云平台获取系统主机属性信息,所述系统主机属性信息包括系统主机地址,根据所述系统主机地址选取目标主机地址,所述目标主机地址包括多个主机地址,并向所述目标主机地址中的多个主机地址发送对应的探测信息,获取所述目标主机中的多个主机反馈的反馈信息数量,若在第一预设时间内,所述反馈信息数量小于所述目标主机地址的数量,则确认当前的目标主机中存在非正常主机,将所述目标主机中未反馈信息的主机确认为非正常主机,并获取所述非正常主机的主机地址。

3、在一种可能的设计中,所述根据所述系统主机地址选取目标主机地址,包括:在所述系统主机地址中随机选取预设数量的主机地址,作为第n-1批目标主机地址,在向所述第n-1批目标主机地址发送探测信息后,在第n-1批目标主机地址以外的系统主机地址中随机选中预设数量的主机地址,作为第n批目标主机地址,若当第n批目标主机地址以外剩余的主机地址数量小于预设数量时,将第n批目标主机地址以外剩余的主机地址作为第n+1批目标主机地址,直至未能获取到新的目标主机地址,确认本轮查询完成。

4、在一种可能的设计中,在检测到所述未能获取到新的目标主机地址后,还包括:根据在不同批次所述目标主机中确认的所述非正常主机,生成记录清单,所述记录清单包括不同批次目标主机中非正常主机的主机地址。

5、在一种可能的设计中,所述系统主机属性信息还包括责任人终端信息,其中所述责任人终端信息与系统主机地址中各个主机地址对应关联,还包括:根据所述记录清单中各个非正常主机的主机地址,获取对应的所述责任人终端信息,根据所述责任人终端信息向所述责任人终端发送提醒信息,以提醒责任人对所述非正常主机排查消除异常。

6、在一种可能的设计中,在所述确认本轮查询完成后,还包括:经过第二预设时间后,清空所述目标主机地址,并根据所述系统主机地址选取新的目标主机地址,开始新一轮查询,其中所述第二预设时间大于所述第一预设时间。

7、在一种可能的设计中,在向所述目标主机地址中的多个主机发送探测信息后,还包括:若在第一预设时间内,接收到所述反馈信息数量等于所述目标主机地址的数量,则对多个所述反馈信息依次进行检测,若在多个所述反馈信息中检测到无效信息,则根据所述无效信息对应的所述反馈信息,确认发出所述反馈信息的主机为非正常主机,若在多个所述反馈信息中未检测到无效信息,则确认当前的目标主机为正常主机。

8、在一种可能的设计中,所述向所述目标主机地址中的多个主机地址发送对应的探测信息之前,还包括:将发向所述目标地址中多个与主机地址对应的所述探测信息进行备份,获取与所述目标地址中多个与主机地址对应的备份信息,所述备份信息还包括地址索引信息,其中所述地址索引信息用于指示所述探测信息所要到达的主机地址,所述备份信息用于指示获取未反馈信息主机的主机地址,所述获取所述非正常主机的主机地址包括当未获取到对应主机反馈的所述反馈信息时,根据所述备份信息中的所述地址索引信息,获取未反馈信息主机的主机地址。

9、第二方面,本申请提供一种主机存活探测装置,包括:

10、获取模块,用于通过所述分布式云平台获取系统主机属性信息,所述系统主机属性信息包括系统主机地址;

11、第一处理模块,用于根据所述系统主机地址选取目标主机地址,所述目标主机地址包括多个主机地址,并向所述目标主机地址中的多个主机地址发送对应的探测信息,获取所述目标主机中的多个主机反馈的反馈信息数量;

12、第二处理模块,用于若在第一预设时间内,所述反馈信息数量小于所述目标主机地址的数量,则确认当前的目标主机中存在非正常主机;

13、执行模块,用于将所述目标主机中未反馈信息的主机确认为非正常主机,并获取所述非正常主机的主机地址。

14、第三方面,本申请提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器,所述存储器存储计算机执行指令,所述处理器执行所述存储器存储的计算机执行指令,以实现主机存活探测方法。

15、第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现主机存活探测方法。

16、本申请提供的主机存活探测方法、装置、设备和存储介质,通过调用分布式云平台对部署组主机状态查询接口,获取部署组主机实例的状态信息,即获取系统主机属性信息,其中系统主机属性信息包括系统主机地址,根据系统主机地址选取多个主机地址,并向选取的多个主机地址发送对应的探测信息,根据多个主机反馈的反馈信息数量,确认当前的多个主机中是否存在非正常主机,若确认存在非正常主机,则记录非正常主机的主机地址,从而能够快速、准确的查找到处于非正常工作状态的主机实例,并在将所有的部署组主机状态查询完毕后,即将系统主机查询完毕后,根据记录的多个非正常主机的主机地址,向非正常主机各自对应的责任人员发送提醒信息,以及时对非正常主机进行消除故障。



技术特征:

1.一种主机存活探测方法,应用于分布式云平台,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述系统主机地址选取目标主机地址,包括:

3.根据权利要求2所述的方法,其特征在于,在检测到所述未能获取到新的目标主机地址后,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述系统主机属性信息还包括责任人终端信息,其中所述责任人终端信息与系统主机地址中各个主机地址对应关联,所述方法还包括:

5.根据权利要求2所述的方法,其特征在于,在所述确认本轮查询完成后,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,在向所述目标主机地址中的多个主机发送探测信息后,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述向所述目标主机地址中的多个主机地址发送对应的探测信息之前,所述方法还包括:

8.一种主机存活探测装置,包括:

9.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至7任一项所述的方法。


技术总结
本申请提供一种主机存活探测方法、装置、设备和存储介质,可用于分布式架构领域。该方法通过获取系统主机属性信息,其中系统主机属性信息包括系统主机地址,根据系统主机地址选取多个主机地址,并向选取的多个主机地址发送对应的探测信息,根据多个主机反馈的反馈信息数量,确认当前的多个主机中是否存在非正常主机,若确认存在非正常主机,则记录非正常主机的主机地址,从而能够快速、准确的查找到处于非正常工作状态的主机实例,并在将所有的部署组主机状态查询完毕后,即将系统主机查询完毕后,根据记录的多个非正常主机的主机地址,向非正常主机各自对应的责任人员发送提醒信息,从而及时对非正常主机进行消除故障。

技术研发人员:谭建伟,孙鹏
受保护的技术使用者:中国银行股份有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1