专利名称::机群系统监控的方法和装置的制作方法
技术领域:
:本发明涉及计算机机群监控,具体涉及机群系统监控和报警的方法和装置;更具体涉及利用PDA进行计算机机群监控和利用手机的短信功能实现机群的告警。在机群监控系统中,往往需要监控机群每个结点的运行状态。传统的机群监控管理系统都是采用控制台方式,当结点出现异常情况,比如温度超过或者低于设定的告警阀值,机群将产生告警事件。一般来讲,这些告警事件产生后会通过机群监控系统的监控界面显示出来或者通过不同的声音提示,机群用户只要查看监控系统的告警界面或者听到声音,就可以了解机群内部某个结点的告警状况,对于存在严重告警的结点机,可以根据告警事件进行相应的结点维护。对机群用户来讲,如果对一个机群进行维护,需要不断的查看监控系统的告警界面,以便及时发现严重的告警事件,进而及时对机群进行维护,这对监控用户来讲,无疑是一种巨大的约束,为了对机群有效的监控和维护,用户不能远离管理机房,需要按照一定的时间间隔去查看告警事件,这带来管理的不便。因而需要一种方便的监控方式,当机群用户离开机群监控环境时也能够及时获知机群的监控信息,特别是告警状况中的严重告警信息,以便采取相应的措施解决。本发明利用移动通信技术实现了对机群的远程监控,通过将机群的监控告警信息以短信发送到机群用户的手机上,用户可以随时随地了解机群的运行情况,通过将监控信息发送到PDA实现机群远程无线监控,通过PDA访问web地址来实现对机群系统的监控管理,使用户可以随时随地实现对机群系统的监控管理。本发明提供一种机群系统监控的装置,包括服务器,用于保存机群监控系统的数据,和进行机群监控系统的管理;无线网络桥连接装置,与所述服务器耦合,实现无线的方式接入机群监控系统;用户无线收发装置,通过无线链路与所述无线网络桥连接装置耦合;用户装置,通过所述用户无线收发装置与服务器耦合;其中,所述服务器包括处理装置,用于将所述机群监控系统的数据根据用户装置的要求,根据所述局域网装置所用的通信协议变换为满足所述无线网络桥连接装置和用户无线收发装置的数据格式的信息。可选地,所述的装置还包括局域网装置,分别与所述服务器和无线网络桥连接装置耦合,使所述服务器和无线网络桥连接装置通过局域网连接。优选地,所述服务器还包括基本服务提供者(BSP)装置模块,用于采集机群中每个结点机的数据,将上层界面的控制机群结点的信息发送给各个结点机执行;数据库,用于存储BSP模块采集的结点机的数据,供给上层界面软件调用使用;其中,所述处理装置包括配置装置,用于配置机群用户定制的信息,并缓存所述定制的信息;接口装置,根据定制的信息,将结点机数据写入所述数据库,并从所述数据库获取所述信息,将满足所述数据格式要求的定制信息提供给所述无线网络桥连接装置。可选地,所述配置装置包括短信提醒装置,用于实现所述BSP与无线网络桥连接装置的接口,过滤配置机群用户定制的短信信息;所述无线网络桥连接装置包括可控制装置,用于通过Socket(套接字)发送所述短信信息的数据包以由所述可控制装置中的pubconfd(公共配置)程序处理为无线发送的短信。优选地,所述局域网装置包括局域网耦合到所述服务器,基于TCP/IP协议实现数据传输;HUB(网络集线器)用于管理局域网的连接;网络控制器用于管理通过所述局域网和HUB对服务器进行远程登陆管理。可选地,所述用户无线收发装置包括PDA无线网卡,用于将用户的PDA与所述无线网络桥连接装置通信;所述用户装置为PDA,所述PDA无线网卡集成于所述PDA中。优选地,所述服务器包括数据划分装置,用于根据机柜或以机群分类数据;显示处理装置,用于将所述分类数据处理为便于以柱状图显示的数据格式。本发明还提供一种机群系统监控的方法,包括步骤设定用户需要的监控数据模式和用户获取监控数据的预定条件;获取所述机群系统的监控数据;存储所述获取的监控数据;根据所述设定的用户需要的监控数据模式,转换所述存储的监控数据;根据所述设定的用户获取监控数据的预定条件,传送所述转换的监控数据给用户。可选地,所述方法还包括步骤,根据预定条件筛选所述获取或存储的机群系统的监控数据,以将所述筛选的信息发送给所述用户。优选地,所述监控数据模式包括短信或PDA格式,所述预定条件包括机群灾难性报警条件和/或一般性报警条件和/或轻微故障报警条件或用户通过网络请求发送信息条件;其中,所述转换所述存储的监控数据的步骤包括转换所述监控数据为难性报警和/或一般性报警和/或轻微故障报警信息和/或柱状图显示信息;所述信息包括通用网络格式信息和用户定义信息格式。可选地,所述转换所述存储的监控数据的步骤包括JSP根据所述设定的数据格式和预定条件生成查询内容,并传递给SERVLET/JSP,以调用JAVABEAN提供的接口查询数据库;由SERVLET/JSP,SERVLET/JSP处理、重组使其能产生动态网页或报警短信;JSP组织HTML语言显示界面或短信消息,以由PDA或通过用户机短信显示。优选地,所述获取所述机群系统的监控数据的步骤包括BSP通过局域网和串口采集监控数据;所述存储所述获取的监控数据的步骤包括通过API0(应用程序接口0)将所述获取的监控数据写入数据库,维护所述监控数据;所述根据所述设定的用户获取监控数据的预定条件,传送所述转换的监控数据给用户的步骤和所述转换所述存储的监控数据的步骤包括比较所述监控数据与预定阈值,如果超出所述预定阈值,产生告警事件;通过API2发送所述告警事件。利用本发明,用户可以随时随地了解机群的运行情况,可以随时随地实现对机群系统的监控管理。图1示出了本发明的实施例的机群监控系统中利用PDA(个人数字助理)的监控装置中的处理装置的原理框图。在本发明的实施例中,PDA的监控界面使用WEB浏览界面的方式实现,利用JavaServlet和JSP技术,获取数据,进行分析处理并通过图形界面显示到客户端浏览器。在服务器端,PDA通过无线链路登陆服务器,这与采用计算机登陆的方式是基本一致的,PDA通过无线Internet或者服务器直接登陆的方式登陆到机群监控系统的服务器上。有关JavaServlet和JSP的内容可参照www.socent.com/programming/category.asp?cate=14。用户通过发出等登陆录请求,通过JSP与SERVLET/JSP交互,并通过JAVABEAN访问数据库,JSP也直接与JAVABEAN接口。其中,Servlet处理并分派请求,对数据信息进行处理、重组,使其能产生动态网页。而JAVABeans,从数据库获取所有机群数据信息,提供查询数据库的接口。SERVLET/JSP和JSP,将数据转换成统计图形(直方图等),表格等组织HTML语言显示界面,并将信息保存在客户端。数据库中存储有机群的各种有关信息与数据,这些数据通过上述装置处理后由PDA监控。其处理流程为,机群监控系统将采集的监控数据保存在数据库中;根据用户查询请求JSP将根据不同的页面请求生成查询内容,这些信息传递给SERVLET/JSP,由它来调用JAVABEAN提供的接口查询数据库;然后对信息进行过滤,并交还给SERVLET/JSP,SERVLET/JSP对其进行处理、重组使其能产生动态网页;最后JSP组织HTML语言显示界面,并将监控信息保存在PDA端进行显示。针对PDA显示屏幕较小,显示的内容有限的特点,PDA界面中显示的监控信息是监控系统中的主要信息,侧重于机群用户所关注的机群维护相关信息。在本发明的实施例中,PDA界面中采用以下方法进行显示和处理。数据划分分参数,以机柜(结点数据)或以机群(机柜数据)为单位在PDA上以多页数据显示;柱状图直观显示在本发明的实施例中,由于PDA的显示特征,将监控数据处理为柱状图以方便显示;通常,PDA单页面中柱状图可清晰显示40个结点的数据,无需横向拖动。在PDA显示上得到了如下很好的效果1)标准的MVC模式(MODEL/VALUE/CONTROL)灵活,高效;2)形象、直观的数据显示(直方图),便于实时监控,快速故障定位图2示出了本发明的实施例的应用PDA的监控装置中的原理框图。本发明的实施例的监控装置包括如下装置服务器Server用于保存机群监控系统的所有数据,该服务器可以是机群的一个专用结点,也可以是一台服务器。该服务器可以按照一定的时间间隔对机群的各个结点进行数据的采集,对采集的数据进行处理,并可以通过连接的显示器显示。用户可以直接登陆到该服务器进行机群监控系统的管理,也可以通过与之相连的PC进行登陆管理,也可以通过PDA进行登陆管理。上文结合图1描述了登陆流程。局域网登陆服务器的网络采用局域网,运行TCP/IP协议进行数据的传输。HUB实现局域网的连接;PC机可以通过基于网对机群监控管理服务器进行远程登陆管理。无线网络桥连接器实现无线的方式接入局域网,本实施例中采用联想生产的天梭LX-AP1500。PDA无线网卡实现PDA和局域网的连接,本实施例中采用Symbol公司的802.11BCF无线网卡,最大流量是11Mbps。PDA用于进行监控系统的浏览和监控。用户在PDA上打开IE浏览器,输入监控系统服务器的IP地址,PDA和服务器之间通过无线网卡、无线网络桥连接器、HUB连接起来,通过局域网进行数据的传输和交换,从而用户可以实现远程对机群的管理和监控。图3描绘了本发明的另一实施例的利用蜂窝电话短信监控机群系统的原理框图。主要包括四个模块监控主机、无线转换板卡、无线发送模块、用户手机。它们的功能如下监控主机机群监控系统产生的告警事件保存在监控主机内,并且在监控主机内根据短信的特征实现短信的定制功能;无线转换板卡安装在监控主机的PCI槽上,用于将监控主机内的告警信息转换成无线发送模块需要的格式,是监控主机和无线发送模块之间的桥梁;无线发送模块将告警信息通过无线的方式发送出去,该硬件模块采用联想移动之翼GPRS;用户手机无线GPRS手机,具有汉字系统短信接收功能。图4描绘了本发明的实施例的利用蜂窝电话短信监控机群系统的短信发送装置原理图,并通过这些装置描绘实现方法的流程。该装置包括如下功能模块。1)BSP模块基本服务提供者BasicServiceProvider,该模块实现对机群中每个结点机的数据采集,采集的是前面提到的29类数据。BSP模块定时向机群的每个结点采集数据,通常30秒可以采集一轮所有机群结点的数据。同时,该模块的还可以将上层界面的控制机群结点的信息发送给各个结点机执行,比如操作系统停止、结点机的开机和关机等操作,都需要BSP模块进行传递完成。2)数据库BSP模块采集的结点机的数据保存在数据库中,数据库对数据进行处理,供给上层界面软件调用使用。3)短信配置信息缓存用于缓存短信定制的信息;4)短信提醒模块BSP与短信发送模块的接口,对发送的告警短信息按照短信定制的内容进行过滤;5)pubconfd程序短信发送模块与无线模块,实现短信的无线发送功能,短信提醒模块通过Socket发送短信数据包给pubconfd程序;6)API0应用程序接口,告警信息产生后,BSP对数据库的操作,将告警信息写入数据库;7)API1应用程序接口,短信提醒模块从数据库中获取短信定制信息;8)API2应用程序接口,短信提醒模块提供给BSP发送短信用的接口,是短信发送数据的调用接口;在该实施例中,短信发送的工作流程如下1)在BSP启动时,通过局域网和串口进行监控数据的采集,将采集的信息通过API0(应用程序接口0)将这些数据写入数据库,并实时维护这些监控信息;2)同时,将采集到的数据与其阈值相比较,如果超出范围,则产生告警事件;3)将告警事件通过API0写入数据库中,同时也将告警事件通过API2发送给短信提醒模块;4)短信提醒模块通过API1从数据库中获取短信定制信息存放到短信定制信息缓存中;5)短信定制模块通过短信定制信息筛选短信发送,将信息发送给短信发送模块与无线模块;6)短信发送模块与无线模块通过系统硬件将断系发送出去。下面详细描绘描绘这些流程,包括发送短信的流程。短信报警流程分为两步1)短信预定;2)相应事件产生后发送短信。1)短信预定流程短信预定指用户可以通过界面设置接收不接收短信、接收什么级别的短信。某个用户登录监控系统界面后,在“系统配置->手机短信配置”菜单下设置接收不接收短信、接收什么级别和类型的短信,以及配置登录用户的手机号。在本发明的实施例中,短信预定分为三个级别A级灾难性报警。导致系统将要或者已经停止运行的情况,如cpu风扇停止转动、硬盘剩余空间为0等等;B级一般性报警。系统出现比较严重的故障但还不至于影响继续运行下去的情况;C级轻微故障报警然后,建立一个用户和短信级别的关联数据库表,保存定制信息用户的ID号以及预定的短信的级别其具体程序如下createtableadmin_smsLevel{AdminIDint(10)defaultnull,#用户ID号,主键(默认空)Sms_levelvarchar(1)defaultnull#预定的短信级别(默认空)};2)相应事件产生后发送短信的流程需要发送短信的相应事件产生后各系统会向pubconfd程序发送一个发送短信的请求数据包,pubconfd收到后从数据包分析把要发送的短信信息内容、类型和产生事件的结点,并根据产生事件的结点分析出要向哪些相应的用户发送短信、得到该用户的手机号码,然后查看该用户是否预定该短信、是否设置接受短信,最后把这些信息都写到数据库中,并标明那些是需要最后实际发送的。下一步就是由实际发送短信的程序定时查询数据库,如果发现数据库中有要发送的短信就取出来进行发送。发送的短信信息都写入数据库中,写入待发数据库中的短信是都要被实际发送的短信,形成短信日志,以后可以通过界面上的短信日志查询/删除来查询和清除日志中的记录。其中,描绘短信日志的数据库表结构的程序如下<prelisting-type="program-listing">createtablesms_log{log_idint(10)default0,#日志记录ID,主键 admin_namevarchar(100)defaultnull,#用户id senderchar(50)defaultnull,#消息来源 sms_levelvarchar(1)defaultnull#短信级别<!--SIPO<DPn="12">--><dpn="d12"/> messagevarchar(1)defaultnull#消息 got_timevarchar(20)defaultnull#接受时间 send_typeint(1)defaultnull 其中#1-表示已实际发送(已写入待发库中) #2-(未实际发送)由于该用户短信没有开通; #3-(未实际发送)由于该用户没有预定该类型的短信 };</pre>虽然通过实施例描绘了本发明,本领域普通技术人员知道,本发明有许多变形和变化而不脱离本发明的精神,希望所附的权利要求包括这些变形和变化而不脱离本发明的精神。权利要求1.一种机群系统监控的装置,包括服务器,用于保存机群监控系统的数据,和进行机群监控系统的管理;无线网络桥连接装置,与所述服务器耦合,实现无线的方式接入机群监控系统;用户无线收发装置,通过无线链路与所述无线网络桥连接装置耦合;用户装置,通过所述用户无线收发装置与服务器耦合;其中,所述服务器包括处理装置,用于将所述机群监控系统的数据根据用户装置的要求,根据所述局域网装置所用的通信协议变换为满足所述无线网络桥连接装置和用户无线收发装置的数据格式的信息。2.如权利要求1所述的装置,还包括局域网装置,分别与所述服务器和无线网络桥连接装置耦合,使所述服务器和无线网络桥连接装置通过局域网连接。3.如权利要求1或2所述的装置,所述服务器还包括基本服务提供者(BSP)装置模块,用于采集机群中每个结点机的数据,将上层界面的控制机群结点的信息发送给各个结点机执行;数据库,用于存储BSP模块采集的结点机的数据,供给上层界面软件调用使用;其中,所述处理装置包括配置装置,用于配置机群用户定制的信息,并缓存所述定制的信息;接口装置,根据定制的信息,将结点机数据写入所述数据库,并从所述数据库获取所述信息,将满足所述数据格式要求的定制信息提供给所述无线网络桥连接装置。4.如权利要求3所述的装置,其中,所述配置装置包括短信提醒装置,用于实现所述BSP与无线网络桥连接装置的接口,过滤配置机群用户定制的短信信息;所述无线网络桥连接装置包括可控制装置,用于通过Socket(套接字)发送所述短信信息的数据包以由所述可控制装置中的pubconfd(公共配置)程序处理为无线发送的短信。5.如权利要求2所述的装置,其中,所述局域网装置包括局域网耦合到所述服务器,基于TCP/IP协议实现数据传输;HUB(网络集线器)用于管理局域网的连接;网络控制器用于管理通过所述局域网和HUB对服务器进行远程登陆管理。6.如权利要求2所述的装置,其中,所述用户无线收发装置包括PDA无线网卡,用于将用户的PDA与所述无线网络桥连接装置通信;所述用户装置为PDA,所述PDA无线网卡集成于所述PDA中。7.如权利要求6所述的装置,其中,所述服务器包括数据划分装置,用于根据机柜或以机群分类数据;显示处理装置,用于将所述分类数据处理为便于以柱状图显示的数据格式。8.一种机群系统监控的方法,包括步骤设定用户需要的监控数据模式和用户获取监控数据的预定条件;获取所述机群系统的监控数据;存储所述获取的监控数据;根据所述设定的用户需要的监控数据模式,转换所述存储的监控数据;根据所述设定的用户获取监控数据的预定条件,传送所述转换的监控数据给用户。9.如权利要求8所述的方法,还包括步骤,根据预定条件筛选所述获取或存储的机群系统的监控数据,以将所述筛选的信息发送给所述用户。10.如权利要求8或9所述的方法,所述监控数据模式包括短信或PDA格式,所述预定条件包括机群灾难性报警条件和/或一般性报警条件和/或轻微故障报警条件或用户通过网络请求发送信息条件;其中,所述转换所述存储的监控数据的步骤包括转换所述监控数据为难性报警和/或一般性报警和/或轻微故障报警信息和/或柱状图显示信息;所述信息包括通用网络格式信息和用户定义信息格式。11.如权利要求10所述的方法,其中,所述转换所述存储的监控数据的步骤包括JSP根据所述设定的数据格式和预定条件生成查询内容,并传递给SERVLET/JSP,以调用JAVABEAN提供的接口查询数据库;由SERVLET/JSP,SERVLET/JSP处理、重组使其能产生动态网页或报警短信;JSP组织HTML语言显示界面或短信消息,以由PDA或通过用户机短信显示。12.如权利要求10所述的方法,其中,所述获取所述机群系统的监控数据的步骤包括BSP通过局域网和串口采集监控数据;所述存储所述获取的监控数据的步骤包括通过API0(应用程序接口0)将所述获取的监控数据写入数据库,维护所述监控数据;所述根据所述设定的用户获取监控数据的预定条件,传送所述转换的监控数据给用户的步骤和所述转换所述存储的监控数据的步骤包括比较所述监控数据与预定阈值,如果超出所述预定阈值,产生告警事件;通过API2发送所述告警事件。全文摘要本发明提供了一种机群系统监控的装置,包括服务器,用于保存机群监控系统的数据,和进行机群监控系统的管理;无线网络桥连接装置,与所述服务器耦合,实现无线的方式接入机群监控系统;用户无线收发装置,通过无线链路与所述无线网络桥连接装置耦合;用户装置,通过所述用户无线收发装置与服务器耦合;其中,所述服务器包括处理装置,用于将所述机群监控系统的数据根据用户装置的要求,根据所述局域网装置所用的通信协议变换为满足所述无线网络桥连接装置和用户无线收发装置的数据格式的信息。利用本发明,用户可以随时随地了解机群的运行情况,可以随时随地实现对机群系统的监控管理。文档编号H04M11/04GK1476224SQ0314628公开日2004年2月18日申请日期2003年7月8日优先权日2003年7月8日发明者程菊生,崔吉顺,彭涛,田宏萍,金正操,蒋晓华申请人:联想(北京)有限公司