一种基于申威芯片的国产计算机系统的运行监控方法与流程

文档序号:32795739发布日期:2023-01-03 22:19阅读:112来源:国知局
一种基于申威芯片的国产计算机系统的运行监控方法与流程

1.本发明涉及物联网计算机技术,尤其是指一种基于申威芯片的国产计算机系统的运行监控方法。


背景技术:

2.随着国产自主可控芯片技术的发展,基于sw64指令集架构的申威cpu芯片快速迭代发展,目前已大批量应用在服务器和桌面pc设备。随着国产化信创浪潮的推进,越来越多的机构和行业选择国产自主可控的申威服务器和pc设备作为生产平台。基于申威芯片的国产计算设备的运用使得业务系统的安全运行得到了保障的同时,给业务it系统的运维部门带来了巨大挑战。
3.目前市面上针对计算机系统的运行监控系统均是适用于x86或arm架构,没有适配国产sw64架构的产品。运维人员对基于申威芯片的国产计算机系统只能采取最原始的人工巡检和排查,无法适应设备数量快速增长带来的问题。为了保障基于申威芯片的国产计算机设备的稳定运行,实时监控设备运行状态,遇到紧急问题时,能够快速定位问题,及时通知预警,保障业务系统的正常运行。需要适配一款适用在sw64架构上的计算机系统运行监控系统,并设计一套基于申威芯片的国产计算机系统的运行监控方法,实现一体化管理,规范运维人员操作流程并提供故障处理能力。
4.基于申威芯片的国产计算机设备组成的系统通常包含大量的硬件(服务器、存储设备、网络设备、pc等),以及各类软件(作业调度软件、web服务、数据库、虚拟化等)协同工作。为了确保系统的稳定性和可靠性,同时降低运维成本和门槛,需要发明一种基于申威芯片的国产计算机系统的运行监控方法。
5.综上所述,目前针对基于申威芯片的国产计算机系统运行监控的系统和方法还处于空白,只能采用传统的系统状态监控方法:一是人工监控,主要对组成计算机系统的服务器、存储、网络设备的巡检来实现硬件状态监控;二是通过对计算机系统中所有节点上部署的软件状态的可用性检查来实现软件状态监控。无法实现及时有效的问题排查和处理。另外,由于基于申威芯片的国产计算机设备组成的系统通常应用于数据中心,包含大量的硬件设备,数量几百台甚至上千台,上述的方法效率极低,需要耗费大量的人力。亟需发明一种基于申威芯片的国产计算机系统的运行监控方法,保障搭载申威芯片的计算机设备的安全稳定运行。


技术实现要素:

6.为此,本发明所要解决的技术问题在于克服现有技术中只能采用人工巡检,无法实现及时有效处理的问题,从而提供一种基于申威芯片的国产计算机设备的监控管理方法。
7.为解决上述技术问题,本发明的一种基于申威芯片的国产计算机系统的运行监控方法,包括:
8.步骤s1:将开源监控软件的server端组件部署在申威服务器上;
9.步骤s2:通过自定义脚本工具将开源监控软件的agent端组件批量部署在支持agent组件安装的被监控计算机设备上,对于不支持agent组件安装的计算机设备,通过自定义脚本配置snmp检测;
10.步骤s3:在server端服务器上通过开源监控软件web端界面设置添加被监控设备,根据设备类型设置自定义监控模板并下发监控指令;
11.步骤s4:server端接收监控数据,根据自定义监控模板中已配置的告警触发机制和逻辑进行判断,若发生异常则进行告警,并将数据存储在数据库中;
12.步骤s5:根据自定义脚本告警设置,将告警信息进行规则匹配,并通过多种途径发送给不同用户;
13.步骤s6:监控系统web端将所述监控数据和告警信息进行实时显示。
14.在本发明的一个实施例中,所述步骤1中申威服务器是监控服务器,其为搭载申威服务器芯片的双路服务器,且预装国产服务器操作系统,同时通过自定义安装脚本将开源监控软件server部署在服务器上,配置database和web管理界面。
15.其中根据申威服务器使用的os类型和版本选择自定义的编译安装脚本;配置server端数据库,支持数据库类型有:mariadb、mysql、postgresql。
16.在本发明的一个实施例中,所述步骤2中监控计算机为监控客户端,其为搭载申威pc芯片的桌面pc机,预装国产桌面操作系统,其中agent组件可调用监控项,对监控客户端运行状态进行监控。
17.其中,可对计算机系统中所有需要监控主机按照能否安装agent端组件进行分类;通过修改agent配置文件,使之能够自定义监控项,自定义监控项能够识别搭载申威芯片的设备的cpu型号、核心数、线程数、温度、频率、占用率等运行参数;也对不能够安装agent端组件的被监控设备,以snmp方式对设备运行状态进行监控;配置agent服务自启动。
18.在本发明的一个实施例中,所述步骤3中开源监控软件web端界面可编制自定义监控模板,用于基于申威芯片的计算机设备,保存为软件常用模板,方便一键配置。
19.其中,可在server端服务器上通过web界面添加被监控设备,根据设备类型或区域进行分类。
20.在本发明的一个实施例中,所述步骤4中自定义监控模板可设置自定义告警触发机制,针对申威芯片特性,设置告警触发器。
21.其中监控数据包括:被监控计算系统的硬件状态、软件状态和服务状态;基于申威芯片的计算机设备硬件状态包括:设备基础运行信息、cpu、内存、磁盘、网络、电压等。
22.本发明的上述技术方案相比现有技术具有以下优点:本发明所述的国产计算机系统的运行监控方法,既填补了对搭载申威芯片的计算机设备的运行监控方法的空白,也可以实现对基于申威芯片的国产计算机系统所有服务器、存储、网络设备、各种运行软件、服务状态进行监控的功能,极大减轻了运维人员的工作量,节省系统运维成本,具有广阔的市场推广价值。
23.本发明提供一种基于申威芯片的国产计算机系统的运行监控方法,通过对开源监控软件的移植适配,能够运行在sw64架构平台,该方法可以实现对搭载申威芯片的计算机设备(如:服务器、pc、存储等)运行状态进行监控,包括硬件状态、软件状态和服务状态。通
过对开源软件的二次开发,编制自定义安装脚本、监控模板和告警机制的设置,填补了对搭载申威芯片计算机设备运行监控管理的空白,为运维人员的日常工作提供有力的支撑。缩短了故障发现、问题定位处理的时间,保障基于申威芯片的国产计算机系统的安全稳定运行。同时,由于该开源监控软件原本兼容x86或arm架构平台,支持telnet、snmp、ipmi、ssh等多种协议,可以实现对不支持agent端组件部署的设备的统一运行监控,实现跨平台、跨系统的统一运行监控管理。
附图说明
24.为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明。
25.图1为本发明开源监控软件在sw64架构平台安装示意图。
26.图2为本发明自定义监控运行流程图。
27.图3为本发明一种基于申威芯片的计算机系统运行监控方法的流程图。
28.图4为本发明实施例的一种基于申威芯片的计算机系统运行监控的系统组成示意图。
29.图5为本发明一种基于申威芯片的计算机系统运行监控方法的监控系统配置流程图。
30.图6为本发明一种基于申威芯片的计算机系统运行监控方法的监控系统告警发送流程图。
具体实施方式
31.一种基于申威芯片的国产计算机系统的运行监控方法是基于开源的系统监控软件,通过软件源码的编译移植,将软件移植到sw64架构平台,使之能够在搭载申威芯片的国产计算机设备上运行,通过对该开源软件的二次开发,可以最适应申威平台设备运行的监控管理。
32.如图1所示,首先确认组成计算机系统中的设备cpu芯片架构,搭载申威芯片的属于sw64架构,通过自定义脚本源码编译安装,包括server端和agent端组件。其他架构设备选择对应版本安装即可。通过对agent端组件配置文件和自定义监控项的设定,来获取计算机系统中被监控设备的硬件状态、软件状态和服务状态。获取到的监控数据发送给server端,通过数据的聚合处理,在server端存储和显示。整体的监控系统运行流程图如图2所示。
33.如图3所示一种基于申威芯片的计算机系统运行监测方法,包括:
34.步骤s1:将开源监控软件的server端组件部署在申威服务器上,具体部署流程参考图1;
35.步骤s2:通过自定义脚本工具将开源监控软件的agent端组件批量部署在支持agent组件安装的被监控计算机设备上,对于不支持agent组件安装的计算机设备,通过自定义脚本配置snmp检测;
36.步骤s3:在server端服务器上通过开源监控软件web端界面设置添加被监控设备,根据设备类型设置自定义监控模板并下发监控指令;
37.步骤s4:server端接收监控数据,根据自定义监控模板中已配置的告警触发机制
和逻辑进行判断,若发生异常则进行告警,并将数据存储在数据库中;
38.步骤s5:根据自定义脚本告警设置,将告警信息进行规则匹配,并通过多种途径发送给不同用户;
39.步骤s6:监控系统web端将所述监控数据和告警信息进行实时显示。
40.通过上述方法流程结合一个实施例具体说明,如图4所示,一种基于申威芯片的计算机系统运行监测系统组成示意图,包括:
41.监控服务器为搭载申威服务器芯片(cpu芯片型号:3231)的双路服务器,预装国产服务器操作系统(统信v20)。通过自定义安装脚本将开源监控软件server部署在监控服务器上,配置database和web管理界面。
42.监控客户端为搭载申威pc芯片(cpu芯片型号:831)的桌面pc机,预装国产桌面操作系统(统信)。通过自定义安装脚本将开源软件agent端部署在被监控的监控客户端上。调用监控项,对监控客户端运行状态进行监控,如图所示,主要包括os、db、进程、日志、端口、存活等运行状态信息。配置自定义监控项,自定义监控项能够识别监控客户端的cpu型号、核心数、线程数、温度、频率、占用率等运行参数。
43.部署在监控服务器的server端,用于接收监控数据并将其存储在数据库,通过web管理界面可以调用自定义的监控模板,发送监控配置指令给agent端,agent端通过自定义模板以及聚合函数将server端需要的运行状态信息进行统计汇总发送。所述监控服务器server端接收到监控数据,根据自定义模板中已配置的告警触发器进行判断,根据告警逻辑进行相应的处理动作。具体的系统配置和指令流转可以详见图5。
44.监控服务器server端根据自定义的监控模板和告警触发机制判断后,如果指标的数据值满足告警触发器中告警表达式规则,则会触发一个告警,该告警会在server端的管理界面端显示,根据告警发送规则,对告警进行进一步的处理,包括发送告警的方式以及处理告警的执行命令等,具体的告警发送流程可详见图6。
45.其中本发明将开源的系统监控软件适配移植到sw64架构,能够流畅运行在搭载申威芯片的计算机设备上;针对开源软件进行二次开发,使之能够识别搭载申威芯片的计算机设备,并且能够读取设备硬件运行参数信息;针对基于申威芯片的计算机系统的硬件状态、软件状态设置一套专用监控方法,并设置成软件内置监控模板,方便运维人员部署调用。
46.通过跨平台部署agent端组件或者采用snmp、ssh、telent等协议,可以获取实际系统组网设备中非sw64架构设备的运行参数信息,通过对接口和数据二次加工与处理,使得最终的监控数据可以进行统一化的呈现。
47.针对基于申威芯片的计算机系统特性,自定义告警触发机制和发送规则,便于运维人员及时发现系统告警并做出处理。
48.以上就是一种基于申威芯片的计算机系统运行监控方法的具体实施说明。在实际应用中,所述的监控服务器可以是搭载申威芯片的物理服务器,也可以是虚拟机产品或者pc整机产品,只要是符合sw64架构平台都可以部署安装。监控客户端可以是搭载申威芯片的pc桌面机,也可以是服务器、虚拟机等所有符合sw64架构平台的计算机设备。开源监控软件同时支持跨平台的版本,可以进行跨平台的部署,通过agent端数据采集,server端对接口和数据二次加工与处理,使得最终的监控数据可以进行统一化的呈现。同时,对于实际应
用中,组成的计算机系统中,有些设备无法部署agent端组件,如交换机、路由器、存储等设备,可以通过公用监控协议实现,目前支持telnet、snmp、ipmi、ssh等多种协议,可以实现对不支持agent端组件部署的设备的统一运行监控,实现跨平台、跨系统的统一运行监控管理。
49.显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1