基于云计算平台保持主机资源稳定的方法

文档序号:7857979阅读:178来源:国知局
专利名称:基于云计算平台保持主机资源稳定的方法
技术领域
本发明涉及计算机网络技术领域,尤其涉及一种基于云计算平台保持主机资源稳定的方法。
背景技术
云计算(Cloud Comput ing)是网格计算(Grid Computing)、分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(UtilityComputing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机技术和网络技术发展融合的产物。它g在通过网络把多个成本相对较低的计算实体整合成ー个具有強大计算能力的完美系统。云计算的ー个核心理念就是通过不断提高“云”的处理能力,进而減少用户终端的处理负担,最終使用户终端简化成一个单纯的输入输出设备,井能按需享受“云”的强大计算处理能力。云计算的重要特点之一就是对用户端的设备要求最低,使用起来也最方便。主机是云平台的ー个节点,是组成云平台的最小的实体单位,主机上主要用来开启虚拟机。同类型主机可组成ー个集群。集群是指将一组计算机关联起来,使它们在外界从很多方面看起来如同一台计算机。集群内的计算机之间通常通过局域网连接,通常用来改善性能和可用性。虚拟化指对计算资源进行抽象的一个广义概念。虚拟化对上层应用或用户隐藏了计算资源的底层属性。它既包括使单个的资源(比如一个服务器,ー个操作系统,一个应用程序,一个存储设备)划分成多个虚拟资源,也包括将多个资源(比如存储设备或服务器)整合成ー个虚拟资源。虚拟化技术是指实现虚拟化的具体的技术性手段和方法的集合性概念。主机是云计算平台中的基础部分,主要向云计算平台提供资源。当集群出现错误吋,主机与云控制器的连接被中段,对云计算平台来说,有部分资源无法被利用,现有的解决方法是在云平台中清除错误集群下的主机记录,将主机重新注册到另外ー个集群。但是,现有的解决方法存在以下的不足在现有云计算平台的基础上,主机不能重复注册,如果已经注册的主机因为集群丢失而无法使用时,需要将主机重新注册到另外一个集群上,必须先修改云计算平台的数据,即需要清空掉云计算平台关于主机的记录,主机才能重新注册到另外一个集群上。这样,由于需要人为修改云计算平台的数据,可能会导致数据修改错误;另外,由于修改过程繁琐,导致主机资源在一段时间无法使用。

发明内容
本发明实施例提出一种基于云计算平台保持主机资源稳定的方法,能够减少因集群出错而造成的资源丢失和数据丢失,減少处理的步骤和时间,降低因此给用户带来的影响。本发明实施例提供一种基于云计算平台保持主机资源稳定的方法,其特征在于包括步骤:A、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下的主机状态丢失,且云计算平台无法利用所述状态丢失的主机的资源、所述云计算平台通知一特定集群与所述状态丢失的主机进行通信,连接成功后,所述云计算平台通过所述特定集群重新获取状态丢失的主机的资源,并将所述主机的状态更改为找回;C、所述云计算平台通知管理员对所述异常集群进行修复;D、当所述异常集群修复成功,所述云计算平台与修复后的异常集群重新连接,并通过所述修复后的异常集群获取主机资源,将所述主机的状态更改为正在进行,同时中断所述特定集群与所述主机的连接。优选的,还包括步骤E、当所述异常集群修复失败,所述云计算平台通知一新集群替换所述异常集群,替换成功后,所述云计算平台通过所述新集群获取状态丢失的主机的资源,并将所述主机的状态更改为正在进行。实施本发明实施例,具有如下有 益效果本发明基于云计算平台保持主机资源稳定的方法,通过使用特定集群自动接管损坏集群下的主机资源,不会让资源丢失,同时防止因集群损坏带来的一段时间集群及集群下主机资源无法使用;另外,相比于现有方法中清除错误集群下的主机记录以将主机重新注册到另外一个集群的繁琐过程简单很多;且使用特定集群能自动接管损坏集群下的主机资源同时通知管理员修复损坏集群,若损坏的集群能修复,直接开机自动接入平台,收回那些主机资源,重新管理;若不能修复,则提供新集群替换损坏集群的方法来管理丢失的主机,尽量保证资源的稳定性,灵活管理主机资源。


图I是本发明所提供的基于云计算平台保持主机资源稳定的方法的流程图。图2是图I所示基于云计算平台保持主机资源稳定的方法的具体流程图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。请參照图1,本发明提供了一种基于云计算平台保持主机资源稳定的方法,所述方法包括步骤S101、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下的主机状态丢失,且云计算平台无法利用所述状态丢失的主机的资源;步骤S102、所述云计算平台通知一特定集群与所述状态丢失的主机进行通信,连接成功后,所述云计算平台通过所述特定集群重新获取状态丢失的主机的资源,并将所述主机的状态更改为找回;步骤S103、所述云计算平台通知管理员对所述异常集群进行修复;步骤S104、当所述异常集群修复成功,所述云计算平台与修复后的异常集群重新连接,并通过所述修复后的异常集群获取主机资源,将所述主机的状态更改为正在进行,同时中断所述特定集群与所述主机的连接;
步骤S105、当所述异常集群修复失败,所述云计算平台通知一新集群替换所述异常集群,替换成功后,所述云计算平台通过所述新集群获取状态丢失的主机的资源,并将所述主机的状态更改为正在进行。下面,结合图2,对本发明的基于云计算平台保持主机资源稳定的方法进行详细描述,包括步骤Sll :主机向集群b提出注册请求;步骤S12 :注册成功后,集群b向主机返回注册成功消息;并执行步骤S13 :将主机注册记录发送给云计 算平台;以上步骤为现有技术中主机注册到集群上的通用技术,在此不详细描述。步骤S14 :当集群b发生异常情况时,云计算平台监控到与集群b的通讯中断;步骤S15 :等待一段时间后云计算平台再次向集群b发送命令,若等待一段时间后仍无回答,则判断集群b以及集群b下的主机状态丢失,且云计算平台无法利用所述状态丢失的主机的资源;步骤S16 :接着,云计算平台通知一特定集群a与所述状态丢失的主机进行连接通ィ目;在该步骤中,所述特定集群a可以理解为云平台中因集群所在主机不能正常通信导致云控制器无法管理该集群下的正常主机,而特定集群用于找回这些主机;当损坏主机修复后,特定集群会自动归还集群的这部分主机。因此,特定集群在正常情况下其实和其他集群一祥的,执行集群的程序,但这些程序都是平台来控制的。当云计算平台知道丢失主机的IP,特定集群会通过IP联系上丢失主机。步骤S17 :特定集群a与状态丢失的主机连接成功后,所述云计算平台通过所述特定集群重新获取状态丢失的主机的资源,并将所述主机的状态更改为找回;在该步骤中,所述特定集群从所述云计算平台获取所述主机的IP地址和端口号以与所述主机实现连接;当连接成功后,所述特定集群将集群编号发送给所送主机进行验证,验证符合规则后便可获取所送主机的资源。步骤S18 :同时,所述云计算平台通知管理员对所述异常集群b进行修复(图中没显示),若集群b修复成功,所述云计算平台与修复后的集群b重新连接;步骤S19 :修复后的集群b回收所述主机资源,所述云计算平台通过所述修复后的异常集群获取主机资源,并将所述主机的状态更改为正在进行;步骤S20 :所述云计算平台通知特定集群不再管理所述主机,使特定集群与主机断开连接;步骤S21 :但是,若所述集群b修复失败,将修复失败结果通知云计算平台;步骤S22 :所述云计算平台通知新集群c替换所述异常集群b ;在该步骤中,我们了解,每ー个集群具有ー个唯一与硬件绑定的集群编号,由IP地址、MAC地址以及特定标示加密生成,该集群编号记录在集群数据库中。一台主机值属于ー个集群,所以主机更换需要平台、集群的数据更换。在替换集群时,在新集群c上部署好环境并开启服务,该新集群c通过向云计算平台的接ロ输入新集群的IP地址和MAC地址后生成新的集群编号,以替换所述异常集群的集群编号。步骤S23 :替换成功后,所送云计算平台通过所述新的集群编号将所述异常集群下的主机信息发送到所述新集群;所送新集群通过所送主机信息与对应的主机实现连接,并将集群编号发送给所送主机进行验证,验证符合规则后便可获取所述对应的主机的资源,从而,所述云计算平台通过所述新集群获取状态丢失的主机的资源,并将所述主机的状态更改为正在进行。综上所述,本发明基于云计算平台保持主机资源稳定的方法,通过使用特定集群自动接管损坏集群下的主机资源,不会让资源丢失,同时防止因集群损坏带来的一段时间集群及集群下主机资源无法使用;另外,相比于现有方法中清除错误集群下的主机记录以将主机重新注册到另外一个集群的繁琐过程简单很多;且使用特定集群能自动接管损坏集群下的主机资源同时通知管理员修复损坏集群,若损坏 的集群能修复,直接开机自动接入平台,收回那些主机资源,重新管理;若不能修复,则提供新集群替换损坏集群的方法来管理丢失的主机,尽量保证资源的稳定性,灵活管理主机资源。以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
权利要求
1.一种基于云计算平台保持主机资源稳定的方法,其特征在于包括步骤 A、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下的主机状态丢失,且云计算平台无法利用所述状态丢失的主机的资源; B、所述云计算平台通知一特定集群与所述状态丢失的主机进行通信,连接成功后,所述云计算平台通过所述特定集群重新获取状态丢失的主机的资源,并将所述主机的状态更改为找回; C、所述云计算平台通知管理员对所述异常集群进行修复; D、当所述异常集群修复成功,所述云计算平台与修复后的异常集群重新连接,并通过所述修复后的异常集群获取主机资源,将所述主机的状态更改为正在进行,同时中断所述特定集群与所述主机的连接。
2.如权利要求I所述的基于云计算平台保持主机资源稳定的方法,其特征在于,还包括步骤 E、当所述异常集群修复失败,所述云计算平台通知一新集群替换所述异常集群,替换成功后,所述云计算平台通过所述新集群获取状态丢失的主机的资源,并将所述主机的状态更改为正在进行。
3.如权利要求I所述的基于云计算平台保持主机资源稳定的方法,其特征在于,在所述步骤A中,当云计算平台发现与异常集群通讯中断时,等待一段时间后再次向所述异常集群发送命令,如无应答才判断所述异常集群及注册到所述异常集群下的主机状态丢失。
4.如权利要求I所述的基于云计算平台保持主机资源稳定的方法,其特征在于,在所述步骤B中,所述特定集群从所述云计算平台获取所述主机的IP地址和端口号以与所述主机实现连接;当连接成功后,所述特定集群将集群编号发送给所送主机进行验证,验证符合规则后便可获取所送主机的资源。
5.如权利要求2所述的基于云计算平台保持主机资源稳定的方法,其特征在于,所述云计算平台通知一新集群替换所述异常集群具体包括步骤 E1、所述云计算平台选择一新集群,所送新集群通过向云计算平台的接口输入新集群的IP地址和MAC地址后生成新的集群编号,以替换所述异常集群的集群编号; E2、所送云计算平台通过所述新的集群编号将所述异常集群下的主机信息发送到所述新集群; E3、所送新集群通过所送主机信息与对应的主机实现连接,并将集群编号发送给所送主机进行验证,验证符合规则后便可获取所述对应的主机的资源。
全文摘要
本发明公开了一种基于云计算平台保持主机资源稳定的方法,其特征在于包括步骤A、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下的主机状态丢失,且云计算平台无法利用所述状态丢失的主机的资源;B、所述云计算平台通知一特定集群与所述状态丢失的主机进行通信,连接成功后,所述云计算平台通过所述特定集群重新获取状态丢失的主机的资源,并将所述主机的状态更改为找回;C、所述云计算平台通知管理员对所述异常集群进行修复;D、当所述异常集群修复成功,所述云计算平台与修复后的异常集群重新连接,并通过所述修复后的异常集群获取主机资源,将所述主机的状态更改为正在进行,同时中断所述特定集群与所述主机的连接。
文档编号H04L12/24GK102769675SQ201210287500
公开日2012年11月7日 申请日期2012年8月13日 优先权日2012年8月13日
发明者吴文青, 吴海玲, 邓书芬, 陈浩 申请人:广州杰赛科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1