一种集群软件启动控制方法、系统、终端及存储介质与流程

文档序号:23724714发布日期:2021-01-26 15:01阅读:78来源:国知局
一种集群软件启动控制方法、系统、终端及存储介质与流程

[0001]
本发明涉及集群服务技术领域,具体涉及一种集群软件启动控制方法、系统、终端及存储介质。


背景技术:

[0002]
集群软件是部署在多台独立设备上,通过软件将一组服务器作为一个整体向客户提供服务。这些单个的服务器就是集群的节点。当对外提供资源的节点故障后,集群中其余的节点能够将资源接管起来,继续对客户提供服务。当节点由故障恢复后,要重新加入集群,继续多外提供服务。现有技术中会把集群软件作为一项关键服务,集群创建好之后,注册到系统中,作为开机自启动的服务。但是集群管理的资源并不是开机就可以对外提供服务的,因此造成集群状态的切换,导致服务不稳定。


技术实现要素:

[0003]
针对现有技术的上述不足,本发明提供一种集群软件启动控制方法、系统、终端及存储介质,以解决上述技术问题。
[0004]
第一方面,本发明提供一种集群软件启动控制方法,包括:
[0005]
控制集群软件在节点启动后进入锁定状态,所述集群软件在锁定状态下暂停服务;
[0006]
获取节点的所有通信链路状态信息;
[0007]
获取节点的基础资源状态;
[0008]
若所述通信链路状态信息为连通状态且所述基础资源状态为可用状态,则解除所述集群软件的锁定状态。
[0009]
进一步的,所述获取节点之间的通信链路状态信息,包括:
[0010]
判断获取的所有通信链路的状态信息是否存在处于未连通状态的异常通信链路:
[0011]
若是,则保持等待,并在等待时间达到预设时间阈值时再次获取所述异常通信链路的状态信息。
[0012]
进一步的,在所述获取节点的基础资源状态之前,所述方法还包括:
[0013]
判断所述节点是否所有通信链路状态信息均为连通状态:
[0014]
若是,则执行所述获取节点的基础资源状态;
[0015]
若否,则输出通信异常提示。
[0016]
第二方面,本发明提供一种集群软件启动控制系统,包括:
[0017]
服务锁定单元,配置用于控制集群软件在节点启动后进入锁定状态,所述集群软件在锁定状态下暂停服务;
[0018]
通信监控单元,配置用于获取节点的所有通信链路状态信息;
[0019]
资源监控单元,配置用于获取节点的基础资源状态;
[0020]
锁定解除单元,配置用于若所述通信链路状态信息为连通状态且所述基础资源状
态为可用状态,则解除所述集群软件的锁定状态。
[0021]
进一步的,所述通信监控单元包括:
[0022]
通信判断模块,配置用于判断获取的所有通信链路的状态信息是否存在处于未连通状态的异常通信链路;
[0023]
重复获取模块,配置用于若存在处于未连通状态的异常通信链路,则保持等待,并在等待时间达到预设时间阈值时再次获取所述异常通信链路的状态信息。
[0024]
进一步的,所述系统还包括:
[0025]
连通判断单元,配置用于判断所述节点是否所有通信链路状态信息均为连通状态;
[0026]
资源获取单元,配置用于若所有通信链路状态信息均为连通状态,则执行所述获取节点的基础资源状态;
[0027]
异常输出单元,配置用于若不是所有通信链路状态信息均为连通状态,则输出通信异常提示。
[0028]
第三方面,提供一种终端,包括:
[0029]
处理器、存储器,其中,
[0030]
该存储器用于存储计算机程序,
[0031]
该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
[0032]
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
[0033]
本发明的有益效果在于,
[0034]
本发明提供的集群软件启动控制方法、系统、终端及存储介质,通过增设集群服务锁,在节点启动后将节点上的集群软件锁定,使其暂停服务。对节点的通信链路状态和基础资源状态进行可用性校验,若两者皆通过校验则解除集群软件的锁定状态,使其提供服务。本发明提高了集群软件的可用性和稳定性,有效避免了集群状态切换导致的服务不稳定问题。
[0035]
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
[0036]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0037]
图1是本发明一个实施例的方法的示意性流程图。
[0038]
图2是本发明一个实施例的方法的另一示意性流程图。
[0039]
图3是本发明一个实施例的系统的示意性框图。
[0040]
图4为本发明实施例提供的一种终端的结构示意图。
具体实施方式
[0041]
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实
施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0042]
图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种集群软件启动控制系统。
[0043]
如图1所示,该方法包括:
[0044]
步骤110,控制集群软件在节点启动后进入锁定状态,所述集群软件在锁定状态下暂停服务;
[0045]
步骤120,获取节点的所有通信链路状态信息;
[0046]
步骤130,获取节点的基础资源状态;
[0047]
步骤140,若所述通信链路状态信息为连通状态且所述基础资源状态为可用状态,则解除所述集群软件的锁定状态。
[0048]
为了便于对本发明的理解,下面以本发明集群软件启动控制方法的原理,结合实施例中对集群软件启动进行控制的过程,对本发明提供的集群软件启动控制方法做进一步的描述。
[0049]
具体的,请参考图2,所述集群软件启动控制方法包括:
[0050]
s1、控制集群软件在节点启动后进入锁定状态,所述集群软件在锁定状态下暂停服务。
[0051]
集群中的节点启动之后,节点上的集群软件自动进入standby状态(锁定状态)。在锁定状态下,节点暂时不对外提供服务
[0052]
s2、获取节点的所有通信链路状态信息。
[0053]
检查本节点与其他集群节点之间的通信链路连接状况,如果链接未恢复(不可用),则等待一定周期(如5s)后,继续检查。
[0054]
s3、获取节点的基础资源状态。
[0055]
本节点与其他集群节点之间的链接恢复(变为可用状态)后,检查集群管理的基础资源(如计算资源和存储资源)状态,如果基础资源未恢复(处于不可用状态),则等待一定周期后,继续检查。
[0056]
s4、若所述通信链路状态信息为连通状态且所述基础资源状态为可用状态,则解除所述集群软件的锁定状态。
[0057]
若步骤s2中检测到节点的所有通信链路都已恢复,且基础资源都已恢复,则解除节点上的集群软件的standby状态,该节点的集群服务变更为可用状态。
[0058]
如图3所示,该系统300包括:
[0059]
服务锁定单元310,配置用于控制集群软件在节点启动后进入锁定状态,所述集群软件在锁定状态下暂停服务;
[0060]
通信监控单元320,配置用于获取节点的所有通信链路状态信息;
[0061]
资源监控单元330,配置用于获取节点的基础资源状态;
[0062]
锁定解除单元340,配置用于若所述通信链路状态信息为连通状态且所述基础资源状态为可用状态,则解除所述集群软件的锁定状态。
[0063]
可选地,作为本发明一个实施例,所述通信监控单元包括:
[0064]
通信判断模块,配置用于判断获取的所有通信链路的状态信息是否存在处于未连通状态的异常通信链路;
[0065]
重复获取模块,配置用于若存在处于未连通状态的异常通信链路,则保持等待,并在等待时间达到预设时间阈值时再次获取所述异常通信链路的状态信息。
[0066]
可选地,作为本发明一个实施例,所述系统还包括:
[0067]
连通判断单元,配置用于判断所述节点是否所有通信链路状态信息均为连通状态;
[0068]
资源获取单元,配置用于若所有通信链路状态信息均为连通状态,则执行所述获取节点的基础资源状态;
[0069]
异常输出单元,配置用于若不是所有通信链路状态信息均为连通状态,则输出通信异常提示。
[0070]
图4为本发明实施例提供的一种终端400的结构示意图,该终端400可以用于执行本发明实施例提供的集群软件启动控制方法。
[0071]
其中,该终端400可以包括:处理器410、存储器420及通信单元430。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0072]
其中,该存储器420可以用于存储处理器410的执行指令,存储器420可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。当存储器420中的执行指令由处理器410执行时,使得终端400能够执行以下上述方法实施例中的部分或全部步骤。
[0073]
处理器410为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器420内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(integrated circuit,简称ic)组成,例如可以由单颗封装的ic所组成,也可以由连接多颗相同功能或不同功能的封装ic而组成。举例来说,处理器410可以仅包括中央处理器(central processing unit,简称cpu)。在本发明实施方式中,cpu可以是单运算核心,也可以包括多运算核心。
[0074]
通信单元430,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
[0075]
本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:rom)或随机存储记忆体(英文:random access memory,简称:ram)等。
[0076]
因此,本发明通过增设集群服务锁,在节点启动后将节点上的集群软件锁定,使其暂停服务。对节点的通信链路状态和基础资源状态进行可用性校验,若两者皆通过校验则解除集群软件的锁定状态,使其提供服务。本发明提高了集群软件的可用性和稳定性,有效
避免了集群状态切换导致的服务不稳定问题,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
[0077]
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
[0078]
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
[0079]
在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0080]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0081]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0082]
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1