一种基于ping和电流特征的通用网络设备故障分析方法与流程

文档序号:24345682发布日期:2021-03-19 12:29阅读:56来源:国知局
一种基于ping和电流特征的通用网络设备故障分析方法与流程

【技术领域】

本发明涉及网络设备监测的技术领域,特别是一种基于ping和电流特征的通用网络设备故障分析方法。



背景技术:

近年来,为了适应越来越复杂的治安形势要求,各地政府均大力推进了视频监控系统建设。在治安复杂场所、案件多发地段、主要街道、重点要害部位、重要路口、卡口等地点设立视频监控点,逐渐形成了覆盖整个城市和乡镇的视频监控网络,有效发挥了监控系统的社会效能。视频专网监控系统的使用,一是极大提高了及时发现与处置各类违法犯罪的能力,为查破违法犯罪提供了第一手现场资料;二是有力强化了交通管理能力;三是有效震慑了各种违法犯罪活动,提高了人民群众的安全感。公安机关通过浏览、录像回放、资料下载、处理应用监控视频,直观了解和掌握区域治安动态,全面提升了应对突发案件、群体性事件和重大保卫活动的响应能力和监控力度。

在雪亮工程和天网工程中,除了视频监控设备外,还有很多地方部署了网络补光灯设备和wifi探针等其它网络设备。由于不同的网络设备其报文格式,通信协议,业务特征各不相同,如果每一种网络设备都进行报文特征分析,业务特征分析是不现实的,也是没有必要的。但对于专注于视频监控前端终端设备运维管理的前端管理主机而言,需要根据业务的侧重点分级故障检测。对于核心业务的设备进行专门业务分析,对于通用设备进行普适性特征分析,当然,核心业务设备也是适用于通用设备分析方法。因此,为提高视频监控前端管理设备的运维效率,通用性网络设备的故障检测分析也是很重要的,现提出一种基于ping和电流特征的通用网络设备故障分析方法。



技术实现要素:

本发明的目的就是解决现有技术中的问题,提出一种基于ping和电流特征的通用网络设备故障分析方法,能够实现对通用网络设备故障的监控,提高网络设备的运维效率,节省运维成本。

为实现上述目的,本发明提出了一种基于ping和电流特征的通用网络设备故障分析方法,依次包括以下步骤:

s1.配置接入设备参数信息:通过中心平台对接入到前端管理主机上的io电源端口的接入设备,进行参数配置;

s2.开启电流自动采集和经验值自动学习:通过中心平台开启接入设备电流自动采集模式和经验值自动学习功能,前端管理主机周期性采集网络设备的电流有效值,通过中心平台进行数据分析得到电流经验值范围;

s3.通过中心平台将故障检测参数、故障上报参数、以及电流经验值下发给前端管理主机;

s4.供电故障检测:前端管理主机根据用户下发的接入设备参数,电流经验值范围,故障检测参数,以及周期性采集到网络设备的电流有效值进行比较、分析,如果供电正常,进入步骤s5启动网络故障检测,否则根据用户配置确定是否需要重启设备;

s5.网络故障检测:通过中心平台进行统一检测,首先将网络设备的配置信息保存到一张网络设备故障检测数据表中,然后启动一组网络故障检测线程,周期性给网络设备发送icmp报文,如果统计到网络设备的网络丢包率和网络延时超过用户配置的阈值,则报疑似网络异常告警,并根据用户配置确定是否需要重启设备。

作为优选,步骤s1中进行参数配置,包括:设备类型,设备名称,品牌型号,额定功率,误差范围,电源开关,开关时间,ip地址,登录用户名和密码(可选)等。

作为优选,步骤s2中,前端管理主机通过485每200ms采集一次网络设备的电流有效值(io电源检测内部每20ms采集一次),并生成最大值、最小值和平均值;然后每10分钟上报一次数据给中心平台进行数据分析,得到该品牌型号规格的电流经验值范围(最大值和最小值)。

作为优选,步骤s3中,所述故障检测参数包括:检测使能开关,网络检测周期,网络丢包率,网络延时等。

作为优选,步骤s3中,所述故障上报参数包括告警上报信息和故障是否重启处理等,所述告警上报信息包括告警类型,告警名称,严重等级,是否上报,备注说明等。

作为优选,步骤s3中,电流经验值包括电流最大值和最小值。

作为优选,步骤s4中,如果采集到的电流有效值没有落在经验值范围内,则说明网络设备供电异常,计数器加一;如果连续3次都不正常,则报疑似网络设备供电异常,并根据用户配置是否需要重启设备。

作为优选,步骤s5中,网络设备故障检测数据表的主要字段包括主机编号,槽位号,端口号,设备类型,设备名称,ip地址,网络丢包率,网络延时,用户名和密码(可根据实际需求进行选择)。

作为优选,步骤s5中,网络故障检测线程采用线程池,可自动增加和减少线程数。

本发明通过前端管理主机对io电源端口进行周期性电流采集、校准、分析,并根据设备电流经验值、网络丢包率和网络延时对网络终端设备进行故障检测和分析,再根据用户配置进行设备故障告警上报和自动重启处理。对于通用的网络设备,从网络和电源两个方面分别进行故障检测,并根据业务优先级进行抑制处理。因此,在配置的时候,需分别配置网络故障检测参数和电源故障检测参数。并且网络设备供电异常告警优先级大于网络异常告警,因此在告警上报时存在抑制关系。

本发明的有益效果:

一、通过电流经验值的自动学习和配置可以校准由于环境因素和电流采集元器件导致的误差,从而防止误报。

二、通过捕获网络设备的实时电流值和工作经验值进行比较,来判断网络设备在供电方面是否正常。

三、通过周期性给网络设备发送icmp报文,统计网络丢包率和网络延时来判断网络设备在网络通信方面是否正常。

四、通过远程采集,报警,控制,重启恢复等功能可大大提高网络设备的运维效率,避免人工巡检,节省运维成本。

本发明的特征及优点将通过实施例结合附图进行详细说明。

【附图说明】

图1是本发明的系统布局框架图;

图2是本发明的参数配置流程图;

图3是本发明的电流采集和经验值自动学习流程图;

图4是本发明的设备供电异常检测流程图;

图5是本发明的设备网络异常检测流程图。

【具体实施方式】

一、环境搭建和配置

首先,将前端管理主机1的rj45口(wan口)接入到光猫上(如图1所示)。其次将io扩展电源板卡(比如io_p8_ac220vb)通过485连接到前端管理主机1的485总线上。然后将网络设备1和网络设备2的电源分别插到io_p8_ac220vb板卡中的电源口1和电源口2上。再将网络设备1和网络设备2的网口分别接到前端管理主机1的lan1口和lan2口上。最后配置好主机和中心平台信息,包括主机ip、掩码、网关、中心平台ip、io_p8_ac220vb中的逻辑板卡、网络设备1和网络设备在io板卡中的基本配置。

二、测试网络设备是否正常

将网络设备切到正常工作模式下,比如补光灯开启且灯亮了,摄像头开始录像;然后通过万用表检测网络设备1和网络设备2的电流电压值,如果得到的值和说明书上一致,则说明供电正常。

再分别从中心平台服务器和前端管理主机1上ping网络设备1和网络设备2,如果均ok,业务也正常,则说明网络基本正常。

三、网络设备电流经验值的采集和自动学习

由于实际工作环境的影响和电流检测元器件的误差会导致实际待机电流和工作电流与设备说明书上有一定的偏差。因此需要通过电流经验值进行校准。由于在步骤二中已经验证网络设备是正常的了,接下来是电流值采样和经验值自动学习和配置。

将网络设备切换到工作模式下运行24小时到48小时,得到该品牌型号设备在工作模式下的一组电流采样值,并根据步骤二中测定得到的电流参考值和偏差范围进行比较和处理,得到工作模式下的电流经验值。注意:(1)输入电压需要有稳压器,且市电供电基本正常。(2)在前端管理主机标称的磁场,气压,温度,湿度等环境下运行。

四、经验值配置和故障检测参数配置

将网络设备1和网络设备2在步骤三中学习到的电流经验值下发到前端管理主机1中。然后将故障参数如故障检测使能开关,检测周期、去抖次数、告警名称、告警类型、告警等级、告警是否上报、故障是否自动处理等参数配置到前端管理主机1中。把网络检测参数,如主机编号,槽位号,端口号,设备类型,ip地址,网络丢包率,网络延时等信息保存到数据表中。

五、故障检测

io_p8_ac220vb板卡带有8个ac220vb的电源口,每个电源口都支持输出电压、电流检测。当系统启动网络设备故障检测时,在io电源板卡侧将每20ms采集到一个电流波形图中的64个值,根据这64个值计算得到一个有效电流值。此时前端管理主机通过485每200ms读取一次io_p8_ac220vb中的一组电流值,即一个网络设备采集到10个有效电流值,并根据电流经验值进行比较,如果没有处于经验值范围内,则故障计数器加一,如果故障计算器计数达到故障检测去抖次数,则报疑似网络设备供电异常告警,并根据用户配置进行自我修复处理。

如果供电正常,中心平台会根据网络设备故障检测数据表自动启动一组线程,并可根据数据表的动态变化调整线程池的线程个数。每个线程一次读取n个ip地址(可设置,默认为50),一个ip地址每秒钟发送一次,一次发送3个icmp请求,连续发送3次,每次超时1秒钟。轮询一个周期需要150秒,如果连续3个周期统计到网络设备的网络丢包率和网络延时超过用户配置的阈值,则报疑似网络异常告警,并根据用户配置是否需要重启网络设备。

上述实施例是对本发明的说明,不是对本发明的限定,任何对本发明简单变换后的方案均属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1