分布式机房it设备统一管理平台的制作方法

文档序号:7806245阅读:319来源:国知局
分布式机房it设备统一管理平台的制作方法
【专利摘要】本发明提供了一种分布式机房IT设备统一管理平台,包括统一管理模块及集中监控模块,其中,所述统一管理模块,用于对处于不同地域的多类型IT设备进行统一管理,包括远程管理各类设备、远程批量脚本执行、远程批量投产检查、远程获取设备配置信息、远程登陆设备监控台;所述集中监控模块,用于对所述的处于不同地域的多类型IT设备进行集中监控,包括数据采集、数据处理、数据加工、数据展现以及管理。本发明的管理平台能够对分布于各个地域的机房设备进行统一管理,并能够针对不同类型不同品牌的设备进行统一管理,达到不同地域不同设备同一平台集中管理。
【专利说明】分布式机房IT设备统一管理平台
【技术领域】
[0001]本发明涉及设备管理领域,尤其涉及一种分布式机房IT设备统一管理平台。
【背景技术】
[0002]目前,很多IT公司都在不同地域拥有多个数据中心,每个数据中心都配备了大规模的IT设备。通常这些设备种类繁多,品牌各异,并在每个数据中心内独立进行设备管理。因此,造成了各种工具平台分散,主动维护管理困难,整体作业管理效率低,故障发现滞后,故障定位和处理时间过长等问题。业界尚无一款统一管理平台产品能够全面解决这些问题。

【发明内容】

[0003]有鉴于此,本发明提供了一种分布式机房IT设备统一管理平台,能够对分布于各个地域的机房设备进行统一管理,并能够针对不同类型(服务器、存储阵列、光纤交换机)不同品牌(IBM、Dell、HP、EMC、NetApp、Brocade等)的设备进行统一管理,达到不同地域不同设备同一平台集中管理。
[0004]本发明提供的分布式机房IT设备统一管理平台,包括统一管理模块及集中监控模块,其中,
[0005]所述统一管理模块,用于对处于不同地域的多类型IT设备进行统一管理,包括远程管理各类设备、远程批量脚本执行、远程批量投产检查、远程获取设备配置信息、远程登陆设备监控台;
[0006]所述集中监控模块,用于对所述的处于不同地域的多类型IT设备进行集中监控,包括数据采集、数据处理、数据加工、数据展现以及管理。
[0007]所述统一管理模块在实现远程批量脚本执行和远程批量投产检查时,首先启动shell执行程序,再以SSH(Secure Shell,专为远程登录会话和其他网络服务提供安全性的协议)方式向目标服务器批量发送待执行的shell脚本内容,然后以SSH方式批量获取并分析shell脚本执行结果,并对结果进行优化和过滤,抽取结果中的关键结果,然后对关键结果进行数据格式化后按照规范统一入库;对库内的关键结果进行关联关系标示;最终展示shell脚本执行结果或者关键结果。
[0008]所述统一管理模块在实现远程管理各类设备及远程登陆设备监控台时,
[0009]针对DELL服务器,采用DRAC卡通过IPMI协议对于每一台服务器进行控制和监控台登陆,进行加电、下电、配置管理、获取设备状态的操作;
[0010]针对HP刀片服务器,利用iLO对服务器进行管理和监控台登陆,利用OA对HP刀片服务器笼子进行控制操作、状态查询以及故障诊断;
[0011]针对IBM刀片服务器,利用AMM管理接口和HMC接口进行集中控制管理和监控台登陆,并对输出信息进行分析,得到相关配置信息;
[0012]针对SUN服务器,采用Sun Remote System Control (RSC),通过调用RSC接口进行SUN服务器控制和监控台登陆,加电、下电、状态查询的操作,以及配置信息的获取;
[0013]针对EMC存储器,采用Solution Enabler查询存储状态,通过调用SE接口信息进行装态查询和配置信息获取;
[0014]针对Brocade交换机,采用SNMP获取交换机状态信息,通过SSH进行配置信息获取,通过IE获取图形界面监控台管理。
[0015]所述集中监控模块包括监控资源层、数据采集层、数据处理层以及应用展现层。
[0016]所述监控资源层对IT基础架构进行监控,其中,所述IT基础构架包括主机系统、数据库、中间件、应用系统以及监控工具;所述监控工具包括VMWARE虚拟化、IBMHMC控制台。
[0017]所述数据采集层按照采集策略,采集和监控被监控对象的的资源信息、运行状态信息及业务指标数据,以及及时将发现的事件发送给数据处理层。
[0018]所述数据处理层对采集或接收到的各种原始事件进行标准化处理,根据原始事件信息进行事件合并、压制、过滤和相关性分析处理,产生告警信息;并对性能数据进行聚合、统计处理,根据各种性能关键绩效指标KPI特征和告警门限,通过与事件管理之间的接口生成告警信息,以及提供资源管理、事件管理、告警管理、维护管理、动作管理服务。
[0019]所述应用展现层将告警信息以及所采集的数据以拓扑视图、图表、声光告警、邮件方式展现给用户,并为用户提供各种管理功能界面。
[0020]所述数据采集层的采集方式包括SNMP方式、IPMI方式、JAVA方式、集中管理平台方式以及统一巡检方式,其中,
[0021]所述SNMP方式为:SNMP程序接收数据包并进行分析,根据不同类型的数据包进行分类,过滤整理,并按一定规则分级,插入到监控数据库中;
[0022]所述IPMI方式为:IPMI调度程序每隔一定时间通过SSH自动登录到服务器,执行IPMI指令,抓取监控信息,根据关键字进行过滤整理,并按一定规则分级,插入到监控数据库中;
[0023]所述JAVA方式为:JAVA监控程序采用调度器每隔一段时间通过SSH登录服务器,执行指令,抓取需要的信息,进行监控;
[0024]所述集中管理平台方式为:通过统一平台进行监控管理,之后将汇总的信息通过SNMP发送到平台上;
[0025]所述统一巡检方式为:采用统一巡检的方式,每天统一进行登录检查。
[0026]综上所述,本发明的管理平台能够对开放系统进行批量式主动作业执行和管理,提高运维效率,例如批量脚本运行、批量投产检查和远程设备控制台管理等功能,便捷地进行设备环境配置,服务器健康状态自我安全检查,以及远程服务器控制台操作,节约了大量的重复性工作,避免了服务器安装后参数配置异常的问题,是系统上线前最后一道安全保障。本发明的管理平台还能够进行分布式机房集中监控功能,而市面上虽有针对于某一款设备的监控产品,但并无针对跨类别跨厂商的产品进行集中监控的产品,而且本发明和现有产品比较具有诸多优势。比如无代理特性(Agentless),把设备额外的资源开销降至最低,且可避免代理软件因部署与升级而带来的大规模配置工作。本发明所使用的SNMP协议和IPMI接口均遵循国际标准,是业界广泛使用的事实标准,从而保证对设备类型的广泛适用。通过本发明的集中监控功能,可以主动获取IT设备硬件以及操作系统的各类报警信息以及健康状态信息,及时准确地展示设备的运行状态,迅速发现设备故障和隐患,提高业务可用性,提升了分布式机房IT设备的整体运维管理水平。
【专利附图】

【附图说明】
[0027]为了更清楚地说明本发明实施例或现有技术中的方案,下面将对实施例中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0028]图1为本发明一实施例提供的分布式机房IT设备统一管理平台的结构示意图。【具体实施方式】
[0029]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0030]图1为本发明一实施例提供的分布式机房IT设备统一管理平台的结构示意图,如图1所示,本实施例的分布式机房IT设备统一管理平台,包括统一管理模块及集中监控模块,其中,
[0031]所述统一管理模块,用于对处于不同地域的多类型IT设备进行统一管理,包括远程管理各类设备、远程批量脚本执行、远程批量投产检查、远程获取设备配置信息、远程登陆设备监控台;
[0032]可选地,所述统一管理模块在实现远程批量脚本执行和远程批量投产检查时,可以首先启动shell执行程序,再以SSH方式向目标服务器批量发送待执行的shell脚本内容,然后以SSH方式批量获取并分析shell脚本执行结果,并对结果进行优化和过滤,抽取结果中的关键结果,然后对关键结果进行数据格式化后按照规范统一入库;对库内的关键结果进行关联关系标示;最终展示shell脚本执行结果或者关键结果。
[0033]进一步地,所述统一管理模块在实现远程管理各类设备及远程登陆设备监控台时,
[0034]针对DELL服务器,可以采用DRAC卡通过IPMI协议对于每一台服务器进行控制和监控台登陆,进行加电、下电、配置管理、获取设备状态的操作;
[0035]针对HP刀片服务器,可以利用iLO对服务器进行管理和监控台登陆,利用OA对HP刀片服务器笼子进行控制操作、状态查询以及故障诊断;
[0036]针对IBM刀片服务器,可以利用AMM管理接口和HMC接口进行集中控制管理和监控台登陆,并对输出信息进行分析,得到相关配置信息;
[0037]针对SUN服务器,可以采用Sun Remote System Control (RSC),通过调用RSC接口进行SUN服务器控制和监控台登陆,加电、下电、状态查询的操作,以及配置信息的获取;
[0038]针对EMC存储器,可以采用SolutionEnabler查询存储状态,通过调用SE接口信息进行装态查询和配置信息获取;
[0039]针对Brocade交换机,可以采用SNMP获取交换机状态信息,通过SSH进行配置信息获取,通过IE获取图形界面监控台管理。
[0040]所述集中监控模块,用于对所述的处于不同地域的多类型IT设备进行集中监控,包括数据采集、数据处理、数据加工、数据展现以及管理。
[0041]可选地,所述集中监控模块可以包括监控资源层、数据采集层、数据处理层以及应用展现层。
[0042]进一步地,所述监控资源层对IT基础架构进行监控,其中,所述IT基础构架包括主机系统、数据库、中间件、应用系统以及监控工具;所述监控工具包括VMWARE虚拟化、IBMHMC控制台。其监控的信息由数据采集层采集,并传递到数据处理层以及数据处理层进行加
工处理。
[0043]进一步地,所述数据采集层按照采集策略,采集和监控被监控对象的的资源信息、运行状态信息及业务指标数据,以及及时将发现的事件发送给数据处理层。
[0044]进一步地,所述数据处理层对采集或接收到的各种原始事件进行标准化处理,根据原始事件信息进行事件合并、压制、过滤和相关性分析处理,产生告警信息;并对性能数据进行聚合、统计处理,根据各种性能关键绩效指标KPI特征和告警门限,通过与事件管理之间的接口生成告警信息,以及提供资源管理、事件管理、告警管理、维护管理、动作管理服务。
[0045]可选地,所述数据采集层根据不同设备情况不同,分为五种方式对事件进行采集,包括SNMP方式、IPMI方式、JAVA方式、集中管理平台方式以及统一巡检方式,其中,
[0046]所述SNMP (Simple Network Management Protocol,简单网络管理协议)方式为:SNMP程序接收数据包并进行分析,根据不同类型的数据包进行分类,过滤整理,并按一定规则分级,插入到监控数据库中;通过SNMP监控的设备包括(不仅限于如下列出的设备):EMC存储,NetApp存储,IBM存储,Quantum VTL, BROCADE光纤交换机,VMWARE虚拟化等。
[0047]所述IPMI (Intelligent Platform Management Interface,智能平台管理接口)方式为:IPMI调度程序每隔一定时间通过SSH自动登录到服务器,执行IPMI指令,抓取监控信息,根据关键字进行过滤整理,并按一定规则分级,插入到监控数据库中;支持IPMI的服务器设备厂商包括:DELL服务器,SUN服务器等,IBM服务器等。
[0048]所述JAVA方式为JAVA监控程序采用调度器每隔一段时间通过SSH登录服务器,执行指令,抓取需要的信息,进行监控;通过JAVA程序监控的操作系统包括:AIX, SOLARIS, LILNUX, WINDOWS等操作系统,监控指标包括:CPU使用率,内存使用率,磁盘使用率,系统是否网络不通等。
[0049]所述集中管理平台方式为:通过统一平台进行监控管理,之后将汇总的信息通过SNMP发送到平台上;通过厂商集中管理的监控设备包括=VMWARE虚拟化,IBM HMC控制台
坐寸ο
[0050]所述统一巡检方式为:采用统一巡检的方式,每天统一进行登录检查。
[0051]本发明平台综合使用以上几种方法,根据不同设备的特点采用不同的监控手段,最后汇总到统一的展现PORTAL中,实现集中监控功能。
[0052]进一步地,所述应用展现层将告警信息以及所采集的数据以拓扑视图、图表、声光告警、邮件方式展现给用户,并为用户提供各种管理功能界面。
[0053]综上所述,本发明通过单一终端系统能够检查处理各个机房IT设备状态及故障;通过集中指令发布,能够统一控制所有系统调度作业及批量任务执行。本发明的管理平台能够大大提高多机房之间的统一管理、协助运行效率,同时还节约了大量一线及后台维护人力并提高故障响应速度,并为异地专家共同会诊故障提供便利条件。本发明的管理平台实现了多厂商、多系统和多标准的不同设备的远程管理,其优势在于:
[0054]范围广:能够整合多厂商、多系统和多标准不同设备远程管理。
[0055]分布式:采用分布式控制结构,能够集中管理多个数据中心设备,包括存储,交换机,服务器,虚拟带库,虚拟化等设备。
[0056]效率高:开放系统批量主动作业执行和管理效率,提供运维效率,例如批量脚本运行和批量投产检查等。
[0057]主动性:主动采集数据信息,深入挖掘数据间的关联关系,在出现故障时能购帮助快速定位故障点,大大提高了 IT运维水平。
[0058]目前市场的同类产品较少,并且很难实现众多设备的全面管理。本发明的平台在节省大量成本和人力的同时,能有效缩短故障处理时间,其开发基于各个厂商的各种设备,因此不仅适用于中国航信,还能推广到其他公司的数据中心,应用前景非常广阔。
[0059]最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【权利要求】
1.一种分布式机房IT设备统一管理平台,包括统一管理模块及集中监控模块,其特征在于, 所述统一管理模块,用于对处于不同地域的多类型IT设备进行统一管理,包括远程管理各类设备、远程批量脚本执行、远程批量投产检查、远程获取设备配置信息、远程登陆设备监控台; 所述集中监控模块,用于对所述的处于不同地域的多类型IT设备进行集中监控,包括数据采集、数据处理、数据加工、数据展现以及管理。
2.根据权利要求1所述的一种分布式机房IT设备统一管理平台,其特征在于,所述统一管理模块在实现远程批量脚本执行和远程批量投产检查时,首先启动Shell执行程序,再以SSH方式向目标服务器批量发送待执行的shell脚本内容,然后以SSH方式批量获取并分析shell脚本执行结果,并对结果进行优化和过滤,抽取结果中的关键结果,然后对关键结果进行数据格式化后按照规范统一入库;对库内的关键结果进行关联关系标示;最终展示shell脚本执行结果或者关键结果。
3.根据权利要求1所述的一种分布式机房IT设备统一管理平台,其特征在于,所述统一管理模块在实现远程管理各类设备及远程登陆设备监控台时, 针对DELL服务器,采用DRAC卡通过IPMI协议对于每一台服务器进行控制和监控台登陆,进行加电、下电、配置管理、获取设备状态的操作; 针对HP刀片服务器,利用iLO对服务器进行管理和监控台登陆,利用OA对HP刀片服务器笼子进行控制操作、状态查询以及故障诊断; 针对IBM刀片服务器,利用AMM管理接口和HMC接口进行集中控制管理和监控台登陆,并对输出信息进行分析,得到相关配置信息; 针对SUN服务器,采用Sun Remote System Control (RSC),通过调用RSC接口进行SUN服务器控制和监控台登陆,加电、下电、状态查询的操作,以及配置信息的获取; 针对EMC存储器,采用Solution Enabler查询存储状态,通过调用SE接口信息进行装态查询和配置信息获取; 针对Brocade交换机,采用SNMP获取交换机状态信息,通过SSH进行配置信息获取,通过IE获取图形界面监控台管理。
4.根据权利要求1所述的一种分布式机房IT设备统一管理平台,其特征在于,所述集中监控模块包括监控资源层、数据采集层、数据处理层以及应用展现层。
5.根据权利要求4所述的一种分布式机房IT设备统一管理平台,其特征在于,所述监控资源层对IT基础架构进行监控,其中,所述IT基础构架包括主机系统、数据库、中间件、应用系统以及监控工具;所述监控工具包括VMWARE虚拟化、IBMHMC控制台。
6.根据权利要求4所述的一种分布式机房IT设备统一管理平台,其特征在于,所述数据采集层按照采集策略,采集和监控被监控对象的的资源信息、运行状态信息及业务指标数据,以及及时将发现的事件发送给数据处理层。
7.根据权利要求4所述的一种分布式机房IT设备统一管理平台,其特征在于,所述数据处理层对采集或接收到的各种原始事件进行标准化处理,根据原始事件信息进行事件合并、压制、过滤和相关性分析处理,产生告警信息;并对性能数据进行聚合、统计处理,根据各种性能关键绩效指标KPI特征和告警门限,通过与事件管理之间的接口生成告警信息,以及提供资源管理、事件管理、告警管理、维护管理、动作管理服务。
8.根据权利要求4所述的一种分布式机房IT设备统一管理平台,其特征在于,所述应用展现层将告警信息以及所采集的数据以拓扑视图、图表、声光告警、邮件方式展现给用户,并为用户提供各种管理功能界面。
9.根据权利要求6所述的一种分布式机房IT设备统一管理平台,其特征在于,所述数据采集层的采集方式包括SNMP方式、IPMI方式、JAVA方式、集中管理平台方式以及统一巡检方式,其中, 所述SNMP方式为:SNMP程序接收数据包并进行分析,根据不同类型的数据包进行分类,过滤整理,并按一定规则分级,插入到监控数据库中; 所述IPMI方式为:IPMI调度程序每隔一定时间通过SSH自动登录到服务器,执行IPMI指令,抓取监控信息,根据关键字进行过滤整理,并按一定规则分级,插入到监控数据库中; 所述JAVA方式为:JAVA监控程序采用调度器每隔一段时间通过SSH登录服务器,执行指令,抓取需要的信息,进行监控; 所述集中管理平台方式为:通过统一平台进行监控管理,之后将汇总的信息通过SNMP发送到平台上; 所述统一巡检方式为 :采用统一巡检的方式,每天统一进行登录检查。
【文档编号】H04L12/24GK104022904SQ201410266103
【公开日】2014年9月3日 申请日期:2014年6月13日 优先权日:2014年6月13日
【发明者】王延生, 刘翔, 冯毅, 王欣, 林恩爱 申请人:中国民航信息网络股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1