一种利用信息化手段实现网络设备点检运维的方法与流程

文档序号:23550769发布日期:2021-01-05 21:08阅读:160来源:国知局
一种利用信息化手段实现网络设备点检运维的方法与流程

本发明涉及一种利用信息化手段实现网络设备点检运维的方法,属于冶金行业设备点检运维与信息技术领域。



背景技术:

钢铁制造业中,随着智能制造概念的深入,信息化与制造业的结合日趋紧密。目前,国内大多数钢铁企业,已经建立起以erp系统,mes系统和二级自动控制系统等不同层次的系统,并且相互间的协作和信息交互日趋紧密,可以说,如今脱离这些系统的支持,就无法正常的生产。但无论系统如果健壮,功能如何丰富,一旦脱离了基础网络的支持,这些系统将无计可施,起不到任何作用。往往由于网络系统的及其复杂性和维护人员的网络知识和经验的不同,企业尽管实施了各种各样的网络维护系统并且聘请了大量的网络高级人员进行网络的监管和维护,但由于网络的问题导致的生产中断事故依旧是频繁的发生。越是生产节奏紧密,生产工艺复杂的高端钢材,对网络的依赖程度越大。由于网络故障导致的生产损失越是严重。



技术实现要素:

本发明目的是提供一种利用信息化手段实现网络设备点检运维的方法,借助于数据库系统和操作系统以及自研系统的架构体系,通过运用相关性技术、需求计划、程序开发、接口技术等,实现自动下发带有逻辑拓扑结构的点检任务,网络设备数据自动收集,设备数据智能分析,设备数据可视化呈现,设备参数自动下发,最终使得设备全天候无故障在线运行,有效地解决了背景技术中存在的上述问题。

本发明的技术方案是:一种利用信息化手段实现网络设备点检运维的方法,包含以下步骤:

步骤s1,在系统中以设备、人员和点检模式为基础,梳理出设备和人员之间点检运维的关联关系,并通过自动下发带有逻辑拓扑结构的点检任务形式体现出来;

步骤s2,在系统中将设备主动发送和被动查询返回的数据转换成信息流存入系统,实现对网络设备数据自动收集和存储;

步骤s3,在系统中进行例行点检时,会结合实时数据和历史数据进行自动智能化的分析;

步骤s4,对系统中显示的设备实时数据和历史数据,摒弃晦涩的词汇及大量无关数据,提供设备数据可视化呈现;

步骤s5,对点检维护中发现的问题,可以通过系统向设备自动下发配置。

所述步骤s1中,包含以下步骤

步骤s101,以物理区域为单位,把设备和人员分配到不同的物理区域,并且把不同物理位置的设备和点检人员按照点检运维计划分配到不同的维护周期内;

步骤s102,结合步骤s101和物理设备的逻辑拓扑连接关系生成带有逻辑拓扑结构的计划任务;

步骤s103,结合步骤s101和s102实现程序上的自动下发带有逻辑拓扑结构的点检任务。

所述步骤s2中,数据的采集形式分为设备主动发送的数据和系统发出请求,设备响应请求后反馈给系统的数据,整体的数据采集方式分为三种;包含以下步骤

步骤s201,在要采集数据的设备上,针对远程登录服务进行相关的配置;

步骤s202,在点检维护系统中实现远程登录服务客户端通用功能,并且根据s201的配置特性,定制出远程登录服务客户端的数据交互格式,实现系统的自动连接,自动交互登录,自动下发并执行命令等功能;

步骤s203,根据不同设备厂家的不同指令集,在系统中对利用其他通用方式不能采集的数据,针对不同指令集进行命令的提前内置,并且对执行指令集输入数据和返回数据的交互方式进行定制,以实现数据的正常交互和数据的存储;

步骤s204,在要采集数据的设备上,针对简单网络管理协议进行相关的配置;

步骤s205,在系统中实现简单网络管理协议通用功能,并且根据s204的配置特性和系统所关心的数据进行收集并做简单的分析,把数据和简单的分析结果一并存入系统中;

步骤s206,在要采集数据的设备上,针对syslog协议进行相关的配置;

步骤s207,搭建标准的日志服务器来收集各个设备发送的日志信息;

步骤s208,把日志服务器上的海量日志格式化抽取到系统中进行存储,方便以后的综合分析和判定。

所述步骤s3中,包含以下步骤

步骤s301,在设备端口数据的分析中,在设备上自动延迟一秒,并对前后分别进行数据取样,实时计算秒级的传输速率,同时还对端口错误包数据进行抓取,形成对端口信息的智能化数据分析;

步骤s302,对收集上来的海量设备日志,利用正则表达式生成多种固化规则并结合设备日志等级等多维条件进行大量数据的智能化分析匹配任务;

步骤s303,对收集上来的设备cpu实时信息进行取样分析,对收集上来的历史数据进行综合分析,两者结合,确定设备cpu负载是否正常。

所述步骤s4中,包括如下步骤

步骤s401,设备端口秒级平均速率和端口错误包数据以精简表格的方式进行可视化呈现;

步骤s402,cpu信息采用实时和历史数据曲线的方式进行可视化呈现;

步骤s403,设备日志采用基于正则表达式等多维度条件进行查询并以表格展现方式来实现数据的可视化呈现;

步骤s404,点检完成情况的自查和检查采用饼状图和表格相结合的方式进行呈现;

步骤s405,带有点检任务三种形态的逻辑拓扑结构可视化呈现;

步骤s406,点检数据异常情况以柱状图分析的方式进行可视化呈现;

步骤s407,内存,电源,温度,时钟等采集于设备上数据的可视化呈现。

所述步骤s5中,包含以下步骤

步骤s501,基于设备时间的一致性对数据采集,智能化分析等系统应用的标线作用,及网络设备重启后时间日期要从新计数特性,在系统中能够通过按钮的方式自动对设备下发时钟同步服务器参数及时区配置参数。

本发明的有益效果是:借助于数据库系统和操作系统以及自研系统的架构体系,通过运用相关性技术、需求计划、程序开发、接口技术等,实现自动下发带有逻辑拓扑结构的点检任务,网络设备数据自动收集,设备数据智能分析,设备数据可视化呈现,设备参数自动下发,最终使得设备全天候无故障在线运行。

附图说明

图1是本发明的点检运维流程总图;

图2是生成带有拓扑结构的点检计划计算模型图;

图3是部分智能分析计算模型图。

具体实施方式

为了使发明实施案例的目的、技术方案和优点更加清楚,下面将结合实施案例中的附图,对本发明实施案例中的技术方案进行清晰的、完整的描述,显然,所表述的实施案例是本发明一小部分实施案例,而不是全部的实施案例,基于本发明中的实施案例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施案例,都属于本发明保护范围。

一种利用信息化手段实现网络设备点检运维的方法,包含以下步骤:

步骤s1,在系统中以设备、人员和点检模式为基础,梳理出设备和人员之间点检运维的关联关系,并通过自动下发带有逻辑拓扑结构的点检任务形式体现出来;

步骤s2,在系统中将设备主动发送和被动查询返回的数据转换成信息流存入系统,实现对网络设备数据自动收集和存储;

步骤s3,在系统中进行例行点检时,会结合实时数据和历史数据进行自动智能化的分析;

步骤s4,对系统中显示的设备实时数据和历史数据,摒弃晦涩的词汇及大量无关数据,提供设备数据可视化呈现;

步骤s5,对点检维护中发现的问题,可以通过系统向设备自动下发配置。

所述步骤s1中,包含以下步骤

步骤s101,以物理区域为单位,把设备和人员分配到不同的物理区域,并且把不同物理位置的设备和点检人员按照点检运维计划分配到不同的维护周期内;

步骤s102,结合步骤s101和物理设备的逻辑拓扑连接关系生成带有逻辑拓扑结构的计划任务;

步骤s103,结合步骤s101和s102实现程序上的自动下发带有逻辑拓扑结构的点检任务。

所述步骤s2中,数据的采集形式分为设备主动发送的数据和系统发出请求,设备响应请求后反馈给系统的数据,整体的数据采集方式分为三种;包含以下步骤

步骤s201,在要采集数据的设备上,针对远程登录服务进行相关的配置;

步骤s202,在点检维护系统中实现远程登录服务客户端通用功能,并且根据s201的配置特性,定制出远程登录服务客户端的数据交互格式,实现系统的自动连接,自动交互登录,自动下发并执行命令等功能;

步骤s203,根据不同设备厂家的不同指令集,在系统中对利用其他通用方式不能采集的数据,针对不同指令集进行命令的提前内置,并且对执行指令集输入数据和返回数据的交互方式进行定制,以实现数据的正常交互和数据的存储;

步骤s204,在要采集数据的设备上,针对简单网络管理协议进行相关的配置;

步骤s205,在系统中实现简单网络管理协议通用功能,并且根据s204的配置特性和系统所关心的数据进行收集并做简单的分析,把数据和简单的分析结果一并存入系统中;

步骤s206,在要采集数据的设备上,针对syslog协议进行相关的配置;

步骤s207,搭建标准的日志服务器来收集各个设备发送的日志信息;

步骤s208,把日志服务器上的海量日志格式化抽取到系统中进行存储,方便以后的综合分析和判定。

所述步骤s3中,包含以下步骤

步骤s301,在设备端口数据的分析中,在设备上自动延迟一秒,并对前后分别进行数据取样,实时计算秒级的传输速率,同时还对端口错误包数据进行抓取,形成对端口信息的智能化数据分析;

步骤s302,对收集上来的海量设备日志,利用正则表达式生成多种固化规则并结合设备日志等级等多维条件进行大量数据的智能化分析匹配任务;

步骤s303,对收集上来的设备cpu实时信息进行取样分析,对收集上来的历史数据进行综合分析,两者结合,确定设备cpu负载是否正常。

所述步骤s4中,包括如下步骤

步骤s401,设备端口秒级平均速率和端口错误包数据以精简表格的方式进行可视化呈现;

步骤s402,cpu信息采用实时和历史数据曲线的方式进行可视化呈现;

步骤s403,设备日志采用基于正则表达式等多维度条件进行查询并以表格展现方式来实现数据的可视化呈现;

步骤s404,点检完成情况的自查和检查采用饼状图和表格相结合的方式进行呈现;

步骤s405,带有点检任务三种形态的逻辑拓扑结构可视化呈现;

步骤s406,点检数据异常情况以柱状图分析的方式进行可视化呈现;

步骤s407,内存,电源,温度,时钟等采集于设备上数据的可视化呈现。

所述步骤s5中,包含以下步骤

步骤s501,基于设备时间的一致性对数据采集,智能化分析等系统应用的标线作用,及网络设备重启后时间日期要从新计数特性,在系统中能够通过按钮的方式自动对设备下发时钟同步服务器参数及时区配置参数。

本发明公开了一种利用信息化手段实现网络设备自动化,智能化,可视化点检运维的方法。技术内容包括将设备基础数据和点检基础数据录入到系统中,根据相关点检模式,按照要求自动下发带有逻辑拓扑结构的可视化点检任务。系统根据规则分时自动采集设备数据,系统也同时接受来自设备相关数据的上报,并形成历史记录,供以后大数据分析使用。在点检过程中,根据相关实时数据和形成的历史记录数据自动进行智能分析。屏蔽对点检人员的过渡技术要求,并把数据以可视化多维度展现方式呈现给点检人员。可根据要求自动进行相关命令可视化下发,详细步骤参照图1。具体的实施内容包括以下五个部分:

第一部分,在系统中以设备,人员和点检模式为基础,梳理出设备和人员之间点检运维的关联关系,并通过自动下发带有逻辑拓扑结构的点检任务形式体现出来,具体实施步骤如下:

步骤s101,以物理区域为单位,把设备和人员分配到不同的物理区域,并且把不同物理位置的设备和点检人员按照点检运维计划分配到不同的维护周期内;

步骤s102,结合步骤s101和物理设备的逻辑拓扑连接关系生成带有逻辑拓扑结构的计划任务;

步骤s103,结合步骤s101和s102实现程序上的自动下发带有逻辑拓扑结构的点检任务。

第二部分,在系统中将设备主动发送和被动查询返回的数据转换成信息流存入系统,实现对网络设备数据自动收集和存储,,具体实施步骤如下:

说明:在第二部分的各分步中,数据的采集形式分为设备主动发送的数据和系统发出请求,设备响应请求后反馈给系统的数据。整体的数据采集方式即协议分为三种;

步骤s201:在要采集数据的设备上,针对远程登录服务进行相关的配置。设备上主要是配置用户登录和登录后的相关权限;

步骤s202:在点检维护系统中实现远程登录服务客户端通用功能。这里并不是简单的系统功能调用,而是通过对协议的分析,完全自主开发的通用客户端功能,灵活性和可操作性更好,使得采用公用标准协议实现不了的功能得以实现。根据s201的配置特性,定制出远程登录服务客户端的数据交互格式,实现系统的自动连接,自动交互登录,自动下发并执行命令等功能;

步骤s203:根据不同设备厂家的不同指令集,系统会根据采集的设备信息和在与设备进行交互过程中不同的返回信息,智能化,自动化的进行交互。在系统中对利用其他通用方式不能采集的数据,针对不同指令集进行命令的提前内置,以实现数据的正常交互和数据的存储;

步骤s204:在要采集数据的设备上,针对简单网络管理协议进行相关的配置。这里主要是配置community和访问权限。出于对采集数据时的性能和稳定性考虑,系统决定利用简单网络管理协议的v2c版本进行数据采集,同时v2c版本也是现在使用最广泛的版本;

步骤s205:在系统中实现简单网络管理协议通用功能,并且根据s204的配置特性和系统所关心的数据,同时考虑到对不同硬件厂家设备的兼容性,系统采用rfc1213标准mib库中的oid值进行数据定位和收集。对采集的数据做简单的分析,把数据和简单的分析结果一并存入系统中;

步骤s206:在要采集数据的设备上,针对syslog协议进行相关的配置。主要是配置发送日志的范围和内容以及指定接收日志的服务器地址;

步骤s207:搭建标准的日志服务器来收集各个设备发送的日志信息;

步骤s208:把日志服务器上的海量日志格式化抽取到系统中进行存储,方便以后的综合分析和判定。系统采集到的设备日志信息其实是一个总长度小于1024字节的报文,直接翻译过来就是一串文本。系统利用相关技术,提取报文发送前已经打好的时间戳作为产生报文的时间,同时以ip地址的形式提取报文发送方的实际信息,同时提取优先级等信息,使得原本一串文本有了生命。在把提取到的信息录入到系统的同时,把系统录入时间等辅助信息一同写入到系统,提高系统对不完全标准协议的兼容性。

第三部分,在系统中进行例行点检时,会结合实时数据和历史数据进行自动智能化的分析,具体实施步骤如下:

步骤s301:在设备端口数据的分析中,在设备上自动延迟一秒,并对前后分别进行数据取样,实时计算秒级的传输速率,公式如下。同时还对端口错误包数据进行抓取,形成对端口信息的智能化数据分析;

(前一秒流量-现在流量)/1秒=秒级传输速率

步骤s302:对收集上来的海量设备日志,根据关注的点检项目,利用正则表达式形成固化规则,提供给点检用户选择。同时综合设备日志等级等多维方式进行大量数据的智能化分析匹配,如图3所示;

步骤s303:对收集上来的设备cpu信息进行实时取样分析,对收集上来的历史数据进行综合分析,两者结合,确定设备cpu负载是否正常。判断规则主要有两个:一个是峰值利用率和平均利用率均不超过40%,一个是历史平均cpu曲线和实时平均cpu曲线波峰和波谷波动不大。

第四部分,对系统中显示的设备实时数据和历史数据,摒弃羞涩的词汇及大量无关数据,提供设备数据可视化呈现,具体实施步骤如下:

步骤s401:设备端口采用秒级平均速率和端口错误包以精简表格方式提供可视化呈现;

步骤s402:cpu信息采用实时和历史数据曲线的方式进行可视化呈现;

步骤s403:设备日志采用基于正则表达式等多维度条件进行查询并以表格展现方式来实现数据的可视化呈现;

步骤s404:点检完成情况的自查和检查采用饼状图和表格相结合的方式进行呈现;

步骤s405:如图2所示,逻辑拓扑图随着点检任务的下发并且综合点检任务的完成情况不同,逻辑拓扑图中标识的设备以三种不同形态进行可视化呈现。三种状态为:已点检状态,未点检状态,今日点检状态;

步骤s406:点检过程中的异常数据情况利用柱状图进行分析并提供可视化呈现;

步骤s407:内存,电源,温度,时钟等采集于设备的数据的可视化呈现。

第五部分,对点检维护中发现的问题,可以通过系统向设备自动下发配置,具体实施步骤如下:

步骤s501:基于设备时间的一致性对数据采集,智能化分析等系统应用的标线作用,及网络设备重启后时间日期要从新计数特性,在系统中能够通过按钮的方式自动对设备下发时钟同步服务器参数及时区配置参数。

本发明建立在数据库系统和操作系统基础平台之上,利用自研系统将多年的网络维护经验与对新技术,新管理思路进行综合的整理,形成一套切实可行,独一无二的适合自己,同时对其他企业也有借鉴作用的一种利用信息化手段实现网络设备自动化,智能化,可视化点检运维的方法,并把它体现在这套系统当中。实现对网络设备数据自动收集,自动下发带有逻辑拓扑结构的点检任务,设备数据智能分析,设备参数自动下发,设备数据可视化呈现,最终使得设备全天候无故障在线运行。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1