一种云平台的管理系统的制作方法

文档序号:12692254阅读:202来源:国知局
本发明涉及计算机领域,具体来说,涉及一种云平台的管理系统。
背景技术
::集群技术可以让用户在付出较低成本的情况下,获得性能、可靠性、灵活性等方面的较高收益,并且其任务调度则是集群系统中的核心技术,同时,Linux集群已成为很多用户关键业务的运行环境,因此,为保证用户的业务程序对外提供不间断的服务,即减少服务中断时间,避免用户数据丢失,从而需要提供一种高可用机制,把因软件、硬件、人为等因素造成的故障对业务的影响降低到最小程度,进而对集群提出了高可用的要求,同时,随着高可用集群技术的发展,高可用集群软件的功能变得越来越多,其带给客户更多实惠的同时,也带来了配置及可操作性方面的复杂性,因此,简便的配置及可操作性成为一种必然的需求。下面以Gridview(集群管理平台)为例进行说明,其中,Gridview高性能计算云平台是曙光开发的面向云计算的集群综合运维和作业管理系统,该平台主要由平台自身、Mysql数据库(一种关系型数据库管理系统)、和PBS(PortableBatchSystem,作业调度系统)作业调度系统三部分构成,其是一个典型的集群服务管理软件,涵盖了集群高可用所需的基本部分,在现有的技术中,Mysql数据库有多种高可用机制,如Mysql数据库自身提供的主从机制,通过PerconaServer等对Mysql数据库进行修改,以提供对高可用的支持,但是,对于PBS作业调度系统,自身对高可用的支持有限,其仅简单的支持多个服务端,因此,整体而言,通过原有的Heartbeat和Drbd技术结合使用,从而实现了平台和作业调度系统的高可用,其中,Heartbeat是一种心跳机制,其提供可靠消息通信机制,Corosync也为一种心跳机制。但是,PerconaServer等对Mysql数据库进行修改,其需要将用户原有的数据进行迁移,但该迁移过程中可能存在兼容性问题,同时,PBS作业调度系统可以通过简单的设置,保证调度系统的响应,但对主从角色的划分、节点的切换、数据一致性等方面支持有限,不能实现对用户的完全透明,因此,就整体方案而言,Heartbeat技术已不再更新,Drbd技术配置繁琐,不易维护和扩展。综上,Linux集群的各个组成部分,自身或多或少的提供了一部分冗余机制,但不能实现对用户的完全透明,此外,对整个集群而言,各部分高可用相互独立,缺乏统一的管理。针对相关技术中的问题,目前尚未提出有效的解决方案。技术实现要素:针对相关技术中的问题,本发明提出一种云平台的管理系统,基于配置模块完成高可用配置,并且通过配置模块控制主从角色的切换、云平台服务和作业调度任务的启停以及浮动IP的迁移,从而使得集群各部分的高可用相互独立,可根据需要分别替换为不同的高可用实现方式,此外,在高可用切换时,集群各部分统一切换,集群管理员无需关注内部各模块的具体切换过程,各模块按照预定的流程完成切换,同时,集群中高可用的切换对用户完全透明。本发明的技术方案是这样实现的:根据本发明的一个方面,提供了一种云平台的管理系统。该管理系统包括:配置模块、多个管理节点、多个作业调度管理节点、共享存储设备,其中,所述配置模块用于将第一浮动IP地址和当前提供云平台服务的一管理节点绑定,并且所述多个管理节点的第一共享目录存储在所述共享存储设备中;所述配置模块用于将第二浮动IP地址和当前提供作业调度服务的任一作业调度管理节点绑定,并且所述多个作业调度管理节点的第二共享目录存储在所述共享存储设备中。根据本发明的一个实施例,进一步包括:主数据库节点、从数据库节点,其中,所述配置模块用于将所述主数据库的数据信息同步至所述从数据库节点。根据本发明的一个实施例,所述配置模块包括:第一配置模块、第二配置模块。根据本发明的一个实施例,进一步包括:所述第一配置模块用于监控所述多个管理节点、所述多个作业调度管理节点和主从数据库节点是否正常运行。根据本发明的一个实施例,进一步包括:所述第二配置模块用于监控所述多个管理节点、所述多个作业调度管理节点和主从数据库节点的服务是否正常。根据本发明的一个实施例,进一步包括:所述第二配置模块用于将所述第一浮动IP地址和云平台服务信息绑定,以使所述第一浮动IP地址和所述云平台服务运行在同一管理节点上。根据本发明的一个实施例,进一步包括:所述第二配置模块用于将第二浮动IP地址和作业调度任务信息绑定,以使所述第二浮动IP地址和所述作业调度任务运行在同一作业调度管理节点上。本发明通过配置模块用于将第一浮动IP地址和当前提供云平台服务的一管理节点绑定,并且多个管理节点的第一共享目录存储在共享存储设备中,随后配置模块用于将第二浮动IP地址和当前提供作业调度服务的任一作业调度管理节点绑定,并且多个作业调度管理节点的第二共享目录存储在共享设置中,从而通过配置模块完成高可用配置,并且通过配置模块控制主从角色的切换、云平台服务和作业调度任务的启停以及浮动IP的迁移,从而使得集群各部分的高可用相互独立,可根据需要分别替换为不同的高可用实现方式,此外,在高可用切换时,集群各部分统一切换,集群管理员无需关注内部各模块的具体切换过程,各模块按照预定的流程完成切换,同时,集群中高可用的切换对用户完全透明。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本发明实施例的云平台的管理系统的部署关系图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。根据本发明的实施例,提供了一种云平台的管理系统。根据本发明实施例的管理系统包括:配置模块、多个管理节点、多个作业调度管理节点、共享存储设备,其中,所述配置模块用于将第一浮动IP地址和当前提供云平台服务的一管理节点绑定,并且所述多个管理节点的第一共享目录存储在所述共享存储设备中;所述配置模块用于将第二浮动IP地址和当前提供作业调度服务的任一作业调度管理节点绑定,并且所述多个作业调度管理节点的第二共享目录存储在所述共享存储设备中。在该实施例中,配置模块为Corosync配置模块和Pacemaker配置模块,其中,Corosync是集群管理套件的一部分,它在传递信息的时候可以通过一个简单的配置文件来定义信息传递的方式和协议等;Pacemaker是一个集群资源管理器,其利用集群基础构件(OpenAIS、heartbeat或corosync)提供的消息和成员管理能力来探测并从节点或资源级别的故障中恢复,以实现群集服务(亦称资源)的最大可用性。如图1所示,上述配置模块将平台管理节点的浮动IP地址(MGMT_IP或第一浮动IP地址)和当前提供云平台服务的平台管理节点1(mgmt1)或平台管理节点2(mgmt2)绑定,并且平台管理节点1、平台管理节点2的第一共享目录存储在共享存储设备中,此外,进一步将作业调度管理节点的浮动IP(PBS_IP或第二浮动IP地址)和当前提供作业调度服务的作业调度管理节点1(pbs1)或作业调度管理节点2(pbs2)绑定,并且作业调度管理节点1和作业调度管理节点2的第二共享目录存储在共享设置中。根据本发明的一个实施例,进一步包括:主数据库节点、从数据库节点,其中,配置模块用于将主数据库的数据信息同步至从数据库节点。根据本发明的一个实施例,配置模块包括:第一配置模块、第二配置模块。根据本发明的一个实施例,进一步包括:所述第一配置模块用于监控所述多个管理节点、所述多个作业调度管理节点和主从数据库节点是否正常运行,从而通过第一配置模块判断节点的开启状态以及运行状态是否正常,如判断节点是否开机以及判断节点能否正常工作。根据本发明的一个实施例,进一步包括:所述第二配置模块用于监控所述多个管理节点、所述多个作业调度管理节点和主从数据库节点的服务是否正常,从而通过第二配置模块判断上述节点能够正常提供服务,如作业调度任务是否正常等。根据本发明的一个实施例,进一步包括:第二配置模块用于将第一浮动IP地址和云平台服务信息绑定,以使第一浮动IP地址和云平台服务运行在同一管理节点上。根据本发明的一个实施例,进一步包括:第二配置模块用于将第二浮动IP地址和作业调度任务信息绑定,以使第二浮动IP地址和作业调度任务运行在同一作业调度管理节点上。此外,第二配置模块除了用于上述绑定外,由于平台服务和作业调度服务是不允许在多个节点上同时运行的,该第二配置模块还用于监控平台服务和作业调度是否在多个节点上同时运行,但除上述平台服务和作业调度任务之外的其他服务是可以同时运行在多个节点上的。为了更好的描述本发明,下面通过具体的实施例进行详细的描述。下面以Gridview(集群管理平台)为例进行说明,本发明的整体方案是基于Corosync服务和Pacemaker服务完成高可用配置的,其中,上述的Corosync服务和Pacemaker服务可控制主从角色的切换、管理服务的启停以及浮动IP的迁移,其具体包括三个部分:1、实现mysql数据库高可用如图1所示,使用自身的HA机制,Gridview两个数据库节点mysql1、mysql2互为主从,即采用数据库节点主-从的备份方式,并且Mysql数据库服务同时运行在上述两个数据库节点上。2、Gridview平台高可用利用Corosync服务和Pacemaker服务进行平台管理服务,具体地:使用浮动IP安装平台(或客户端)进行访问云平台服务,该云平台管理节点的浮动IP地址为MGMT_IP,根据Pacemaker服务的管理,该浮动IP地址可在平台管理节点间移动,从而可根据该浮动IP访问平台管理节点mgmt1或mgmt2,此外,将该云平台相关服务和MGMT_IP绑定,如将存储服务和MGMT_IP绑定,同时,上述访问和提供云平台服务为一平台管理节点,即MGMT_IP和云平台服务运行在相同的节点上,不可分开运行,此外,云平台的主目录放置在共享存储设备上,以使平台管理节点mgmt1和平台管理节点mgmt2共用该主目录,此外,该云平台的平台服务可在任一平台管理节点上正常运行,但是其平台管理节点mgmt1和平台管理节点mgmt2不可同时运行。3、作业调度系统高可用基于Corosync服务和Pacemaker服务管理作业调度服务,具体地:作业调度管理节点的浮动IP为PBS_IP,根据Pacemaker服务的管理,该浮动IP地址PBS_IP在作业调度管理节点pbs1和作业调度管理节点pbs2之间移动,同时,作业调度系统将上述两个作业调度管理节点的作业调度任务的后缀上设置浮动IP对应的节点名,从而将作业调度系统相关服务和PBS_IP地址绑定,如调度任务和PBS_IP绑定,同时,该PBS_IP和作业调度任务运行在相同的节点上,其不可分开运行,此外,作业调度管理节点的主目录也放置在共享存储设备中,以使作业调度管理节点pbs1和pbs2共用该主目录。综上,通过上述方案,集群平台、数据库、作业调度系统各组成部分别实现了自身对高可用的支持,同时,Corosync服务实现对节点可用性的监控,Pacemaker服务监控集群各部分的状态,确定节点的主从角色并按需启停服务,同时实现集群各部分高可用的整体切换,从而避免了文件的同步过程中主从节点文件不一致的情况,同时,使得平台和作业调度的管理节点也易于扩展,只需将新加入的节点加入Corosync服务和Pacemaker服务的管理即可,无需进行部署和与原有管理节点同步的操作,此外,也实现了集群各部分的高可用相互独立,可根据需要分别替换为不同的高可用实现方式,同时,在高可用的切换时,集群各部分统一切换,集群管理员无需关注内部各模块的具体切换过程,各模块按照预定的流程完成切换,此外,集群高可用的切换对用户完全透明,并且切换节点后,用户无需改变任何使用方式。综上所述,借助于本发明的上述技术方案,通过配置模块用于将第一浮动IP地址和当前提供云平台服务的一管理节点绑定,并且多个管理节点的第一共享目录存储在共享存储设备中,随后配置模块用于将第二浮动IP地址和当前提供作业调度服务的任一作业调度管理节点绑定,并且多个作业调度管理节点的第二共享目录存储在共享设置中,从而通过配置模块完成高可用配置,并且通过配置模块控制主从角色的切换、云平台服务和作业调度任务的启停以及浮动IP的迁移,从而使得集群各部分的高可用相互独立,可根据需要分别替换为不同的高可用实现方式,此外,在高可用切换时,集群各部分统一切换,集群管理员无需关注内部各模块的具体切换过程,各模块按照预定的流程完成切换,同时,集群中高可用的切换对用户完全透明。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1