一种小型服务器集群管理系统及方法与流程

文档序号:22313305发布日期:2020-09-23 01:34阅读:142来源:国知局
一种小型服务器集群管理系统及方法与流程

本发明属于服务器技术领域,具体涉及一种小型服务器集群管理系统及方法。



背景技术:

现有单个服务监控基本通过bmc、cmc、rmc来实现,其中bmc为单服务器的监控,cmc与rmc需要通过cmc板卡与rmc板卡来实现服务器多节点的监控。

大型的数据中心一般通过服务器管理软件来实现服务器管理,但对于小型的数据中心,大型的管理软件相对来说较为浪费,且软件金额较大。

目前,小型的数据中心并没有有效的监管方法,为了节省成本,很多小型数据中心无法采用数据中心的管理软件,因此大多依赖人工维护,对人力资源需求较大,且维护效果具有滞后性,降低了小型数据中心的使用性能。



技术实现要素:

针对现有技术的上述不足,本发明提供一种小型服务器集群管理系统及方法,以解决上述技术问题。

第一方面,本发明提供一种小型服务器集群管理系统,包括:

web端和远程终端,所述web端设有集群对接接口和终端对接接口;所述集群对接接口对接服务器集群;所述终端对接接口对接远程终端;

所述web端包括数据处理层和数据存储层,所述数据处理层按照保存在所述数据存储层的规则对从集群对接接口上传的数据进行处理,并利用终端对接接口将处理结果发送至远程终端。

进一步的,所述数据存储层包括:

集群节点信息库、规则库、固件版本库和固件更新工具库。

进一步的,所述规则包括:

通过关键词筛选从各节点日志中筛选错误日志,若存在错误日志则生成报错信息;

从各节点bmc监控参数筛选超过预设阈值的异常参数,若存在异常参数则生成报错信息。

进一步的,所述终端对接接口包括:

命令接收模块,配置用于接收远程终端上传的命令;

文件接收模块,配置用于接收远程终端上传的固件升级文件;

报错推送模块,配置用于将报错信息推送至远程终端;

数据返回模块,配置用于将远程终端通过命令请求的数据返回至远程终端。

进一步的,所述集群对接接口包括:

节点信息调取模块,配置用于根据集群局域网地址列表从局域网通信服务器采集集群节点信息;

集群监控管理模块,配置用于通过ipmi指令采集集群各节点监控信息并通过ipmi指令控制集群节点运行状态。

进一步的,所述数据处理层还用于:

根据远程终端的固件升级指令从数据存储层调取相应固件版本升级文件;通过集群对接接口将固件版本升级文件发送至目标节点;调用固件升级工具通过集群对接接口向目标节点发送带外固件刷新指令。

第二方面,本发明提供一种小型服务器集群管理方法,包括:

通过集群对接接口从局域网通信服务器采集集群节点信息,所述集群节点信息用于远程登录集群各节点;

通过集群对接接口向集群目标节点发送ipmi信息采集命令采集目标节点的监控信息;

数据处理层根据保存在所述数据存储层的规则对采集的监控信息进行处理;

所述数据处理层将根据监控信息生成的报错信息通过终端对接接口推送至远程终端。

进一步的,所述方法还包括:

通过终端对接接口接收远终端发送的状态控制指令和目标节点信息,所述状态控制指令为开机指令、关机指令和重置指令的任意一种;

数据处理层生成与所述状态控制指令对应的ipmi电源控制命令;

将所述ipmi电源控制命令通过集群对接接口发送至所述目标节点。

进一步的,所述方法还包括:

通过终端对接接口接收远程终端发送的信息查看指令和目标节点信息;

数据处理层生成与所述信息查看指令对应的ipmi数据采集命令;

将所述ipmi数据采集命令通过集群对接接口发送至所述目标节点,调取目标节点的监控信息;

将所述监控信息通过终端对接接口发送至远程终端。

进一步的,所述方法还包括:

通过终端对接接口接收远程终端发送的固件更新文件和固件更新命令;

所述数据处理层将所述固件更新文件保存至数据存储层;

所述数据处理层根据固件更新命令将所述固件更新文件通过集群对接接口下发至目标节点;

所述数据处理层调用固件更新工具通过集群对接接口向目标节点下发带外固件刷新指令。

第三方面,提供一种终端,包括:

处理器、存储器,其中,

该存储器用于存储计算机程序,

该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。

第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。

本发明的有益效果在于,

本发明提供的小型服务器集群管理系统及方法,通过建立web平台,并在web平台开设接口,使web平台能够对接集群和远程终端,并通过web平台对集群监控和处理,从而实现对小型集群的管理。本发明能够实时监控集群内的节点状态,并将监控结果发送至远程管理端,便于运维人员及时查看和处理,此外还能对集群内的节点进行开关机及重启管理和固件升级,实现了对小型集群的基本管理。

此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一个实施例的系统的示意性框图。

图2是本发明一个实施例的方法的示意性流程图。

具体实施方式

为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

实施例1

本实施例提供一种小型服务器集群管理系统,系统包括:

web端和远程终端,web端设有集群对接接口和终端对接接口;集群对接接口对接服务器集群;终端对接接口对接远程终端;

web端包括数据处理层和数据存储层,数据处理层按照保存在数据存储层的规则对从集群对接接口上传的数据进行处理,并利用终端对接接口将处理结果发送至远程终端。

由此可以实现对集群监控信息的采集、处理和转发,维护人员可从远程终端实时获取集群信息。远程终端可以是手机app。

实施例2

请参考图1,本实施例提供一种小型服务器集群管理系统,包括:

web端和远程终端,web端设有集群对接接口和终端对接接口;集群对接接口对接服务器集群;终端对接接口对接远程终端;

web端包括数据处理层和数据存储层,数据处理层按照保存在数据存储层的规则对从集群对接接口上传的数据进行处理,并利用终端对接接口将处理结果发送至远程终端。数据处理层还用于:根据远程终端的固件升级指令从数据存储层调取相应固件版本升级文件;通过集群对接接口将固件版本升级文件发送至目标节点;调用固件升级工具通过集群对接接口向目标节点发送带外固件刷新指令。

其中,数据存储层包括集群节点信息库、规则库、固件版本库和固件更新工具库。集群节点信息库中存储集群各节点的数据ip、bmcip。规则库中保存规则包括通过关键词筛选从各节点日志中筛选错误日志,若存在错误日志则生成报错信息;从各节点bmc监控参数筛选超过预设阈值的异常参数,若存在异常参数则生成报错信息。固件版本库中保存远程终端上传的固件更新文件。固件更新工具库中保存常用的固件更新工具,如yafuflash工具。

终端对接接口包括:命令接收模块,配置用于接收远程终端上传的命令;文件接收模块,配置用于接收远程终端上传的固件升级文件;报错推送模块,配置用于将报错信息推送至远程终端;数据返回模块,配置用于将远程终端通过命令请求的数据返回至远程终端。

集群对接接口包括:节点信息调取模块,配置用于根据集群局域网地址列表从局域网通信服务器采集集群节点信息;集群监控管理模块,配置用于通过ipmi指令采集集群各节点监控信息并通过ipmi指令控制集群节点运行状态。

实施例3

图2是本发明一个实施例的方法的示意性流程图。如图2所示,该方法100包括:

步骤210,通过集群对接接口从局域网通信服务器采集集群节点信息,所述集群节点信息用于远程登录集群各节点;

步骤220,通过集群对接接口向集群目标节点发送ipmi信息采集命令采集目标节点的监控信息;

步骤230,数据处理层根据保存在所述数据存储层的规则对采集的监控信息进行处理;

步骤240,所述数据处理层将根据监控信息生成的报错信息通过终端对接接口推送至远程终端。

具体的,所述小型服务器集群管理方法包括:

s1、通过集群对接接口从局域网通信服务器采集集群节点信息,所述集群节点信息用于远程登录集群各节点

小型集群数据中心部署完成后,web平台通过集群服务器mac列表(局域网地址列表)从dhcp((动态主机配置协议)是一个局域网的网络协议。)服务器识别集群所有节点的信息,如节点网络ip、bmcip。自动将识别的节点添加至web平台,实现集群节点的快速上线管理。

将集群节点bmc设置为免密码登录,或者对节点登录密码进行统一设置。在获取到集群内所有节点的网络ip和bmcip后,登录各计算节点和bmc。

s3、通过集群对接接口向集群目标节点发送ipmi信息采集命令采集目标节点的监控信息;数据处理层根据保存在所述数据存储层的规则对采集的监控信息进行处理;所述数据处理层将根据监控信息生成的报错信息通过终端对接接口推送至远程终端。

web端通过集群对接接口从已登录的bmc中实时采集监控参数,如风扇转速、cpu温度等。此外还采集bmc的告警信息。预先设置需要上报的告警项目(即设定规则),如风扇停转等严重影响节点运行的告警(也可以根据需要设置各监控参数项的告警阈值),将设定好的规则保存至规则库。然后数据处理层判断采集的bmc告警信息中是否有需要上报的告警项目,若有则需要生成平台告警。

从已登录的计算节点中实时采集系统日志,采集方法例如:集群对接接口通过ipmi协议获取日志,获取事件日志及所有日志,依据告警级别筛选警告、严重日志信息

获取系统事件日志:ipmitool–ilanplus–hip

-u–psellist

获取bmc故障日志:ipmitool–ilanplus–hip-u–praw0x3c0x430x02

数据处理层从系统日志中筛选错误日志。预先设置需要上报的告警项目,如cpu占用率过高,通过关键词筛选判断错误日志中是否存在需要上报的告警项目,若存在则生成平台告警,若不存在则继续监控。

web端通过终端对接接口将平台告警推送至远程终端,远程终端为维护人员管理的终端,可以是手机app,也可以是电脑程序。

s4、利用ipmi命令控制集群各节点的运行状态。

若web端终端对接接口接收到远程终端的状态控制指令,则数据处理层生成相应的ipmi电源控制命令,将ipmi电源控制命令通过集群对接接口下发至目标节点即可实现对目标节点运行状态的控制切换。

例如通过ipmi协议进行开关机控制,ipmitool–ilanplus–hip-u–pchassispoweroff/on

s5、利用yafuflash工具更新集群各节点的固件版本。

首先将更新需要的固件更新文件通过终端对接接口上传至web端的固件版本库,并发送固件更新命令,固件更新命令包括目标节点ip。web端根据固件更新命令从固件库中调取相应固件更新文件,将固件更新文件下发至目标节点,并调用yafuflash工具(一种用于安装固件更新的工具),在目标节点安装固件更新文件,然后重启目标节点即可,固件刷新命令为:;./yafuflash-nw-u<username>-p<password>-ip<bmcip><image名称>。

s6、web端通过终端对接接口接收远程终端发送的信息查看指令和目标节点信息,数据处理层生成与所述信息查看指令对应的ipmi数据采集命令,ipmi数据采集命令与步骤s3相同。将ipmi数据采集命令通过集群对接接口发送至目标节点,调取目标节点的监控信息。将所述监控信息通过终端对接接口发送至远程终端。

尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1