一种以太网故障定位与检测方法

文档序号:8546073阅读:463来源:国知局
一种以太网故障定位与检测方法
【技术领域】
[0001] 本发明涉及的是一种网络系统故障维护的技术领域,尤其涉及的是一种以太网故 障定位与检测方法。
【背景技术】
[0002] 随着越来越多的互联网应用融入人们的日常生活,人们对网络的用户体验要求越 来越高。使网络保持实时畅通是保证用户体验的前提,因此必须及时地检测定位并排除网 络故障,所以网络故障的检测与排除是网络管理工作中很重要的一部分。因此如何高效准 确地定位与检测网络故障成为近年来网络故障研宄中的一个热点和难点。
[0003] 目前以太网故障检测的主要方法有:建立网络通信实体间的依赖图或者模块依赖 图,然后通过依赖图检测和定位网络故障;使用概率故障地图和贝叶斯推理技术来定位网 络故障;使用加权二分图的模型来定位网络故障;将规则引擎Drools用于故障系统开发; 结合专家系统和推理机进行故障诊断等。
[0004] 还有一些企业同时也开发了商用网络故障管理系统。如ManageEngine的 OpManager系统,这是一款端到端的综合网络管理软件,可对企业网络内的网络设备、服务 器、主机、WAN链路、应用及服务等IT基础设施实现全方位、可视化、统一集中监控和管理。 IBM的NetcoolNetworkManagement系统是一款具有拓扑发现、检测网络故障、配置网络等 功能的系统。惠普的OpenView系统是一款具有拓扑发现和故障管理等功能的系统。
[0005] 虽然依赖图对故障的定位和检测具有较高的准确率,但是建立一个系统或网络的 依赖图要求对该系统或网络很熟悉才能建立比较准确的依赖图。使用概率模型和贝叶斯推 理算法较复杂,其准确率和效率难以保证,其工程实现难度较大。基于数据挖掘的故障检测 方法,其准确率难以保证,且需要海量的网络设备日志,但不同的厂商生产的网络设备的日 志内容、格式不一样。其他的网络故障检测技术,需要满足一些特定的条件,所以其普遍适 用性较难保证。上述的商用故障管理系统均基于私有的技术方案,其准确性、可靠性特别是 可验证性难以保障。
[0006] 综上可知,目前的网络故障检测方法往往需要修改节点代码、控制节点行为来实 现故障检测,而交换机等以太网设备通常并不具有可修改性。

【发明内容】

[0007] 本发明的目的在于克服现有技术的不足,提供了一种以太网故障定位与检测方 法,以解决现有的网络故障检测方法准确度低,需要修改节点代码、控制节点行为来实现故 障检测,无法适应通常的不具有可修改性的交换机等以太网设备的故障检测。
[0008] 本发明是通过以下技术方案实现的:
[0009] 一种以太网故障定位与检测方法,用于定位与检测目标网络中网络设备故障,包 括以下步骤:
[0010] 步骤S101 :网络设备状态一致性检测:包括目标网络中所有交换机的端口状态检 测、STP协议版本一致性检测、工作方式一致性检测和源路由协议版本一致性检测,若检测 结果均一致,则继续,不一致,则报警;
[0011] 步骤S102 :网络设备拥塞异常检测:周期性检测目标网络中所有交换机的每个端 口,计算由于拥塞导致的报文丢弃率,若报文丢弃率不超过阈值,则继续,若超过阈值,则报 警;
[0012] 步骤S103 :链路丢包异常检测与定位:周期性检测目标网络拓扑中的每一条链路 (Ui,'),计算链路(Ui,')在两个方向的丢包率,若丢包率不超过阈值,则继续,若超过阈 值,则报警;
[0013] 步骤S104 :目标网络DoS攻击检测:周期性检测目标网络中所有交换机的转发条 目丢弃数,若不超过阈值,则继续,若超过阈值,则报警;
[0014] 步骤S105 :地址转发表正确性检测:随机选取一个MAC地址,检测交换机是否已经 学习了MAC地址的转发条目,若是,则继续,若不是,则报警。
[0015] 所述步骤S101中,网络设备状态一致性检测的具体步骤包括:
[0016] 步骤S201 :交换机端口状态检测:对目标网络中的所有交换机,对该交换机出现 在拓扑中的所有端口,查询其当前工作状态值为1,表明端口正在工作;否则,报警;
[0017] 步骤S202 :交换机STP协议版本一致性检测:对目标网络中的所有交换机,查询其 使用的STP版本取值应一致;否则,报警;
[0018]步骤S203:交换机工作方式一致性检测:对目标网络中的所有交换机,获取其工 作于透明网桥模式下每个端口的信息全为空,则跳到步骤S204;否则,获取其工作于源路 由模式下每个端口的信息全为空,则继续;否则,报警;
[0019] 步骤S204 :交换机的源路由协议版本一致性检测:如果网络中所有交换机工作于 源路由模式,则查询所有交换机的操作位数取值应相同;否则,报警。
[0020] 所述步骤S102中,网络设备拥塞异常检测的具体步骤包括:
[0021] 步骤S301 :初始化参数:delta,interval,K,L,且K>L,countl= 0,count2 = 0 ; 其中,delta表示丢包率的警戒值;interval表示两次查询间隔的时间,单位是秒;K表示连 续查询变量的次数;L表示这K次查询中丢包率有L次超过delta,就需要报警;countl用 于统计查询次数;count2用于统计丢包率超过delta的次数;
[0022] 步骤S302:在时刻t,查询交换机每个端口发出的数据帧数TpPOF和丢弃的数据帧 数BTOED ;
[0023] 步骤S303 :等待interval秒,再次查询交换机每个端口发出的数据帧数TpPOF和 丢弃的数据帧数BPDED,计算(t,t+l)时间段内,交换机传输和丢弃的报文帧数,其中t+1表 示t间隔interval秒后的时刻,计算公式如下:
【主权项】
1. 一种以太网故障定位与检测方法,用于定位与检测目标网络中网络设备故障,其特 征在于,包括以下步骤: 步骤SlOl :网络设备状态一致性检测:包括目标网络中所有交换机的端口状态检测、 STP协议版本一致性检测、工作方式一致性检测和源路由协议版本一致性检测,若检测结果 均一致,则继续,不一致,则报警; 步骤S102 :网络设备拥塞异常检测:周期性检测目标网络中所有交换机的每个端口, 计算由于拥塞导致的报文丢弃率,若报文丢弃率不超过阈值,则继续,若超过阈值,则报 警; 步骤S103 :链路丢包异常检测与定位:周期性检测目标网络拓扑中的每一条链路(Ui, Vj),计算链路(Ui,在两个方向的丢包率,若丢包率不超过阈值,则继续,若超过阈值,则 报警; 步骤S104 :目标网络DoS攻击检测:周期性检测目标网络中所有交换机的转发条目丢 弃数,若不超过阈值,则继续,若超过阈值,则报警; 步骤S105 :地址转发表正确性检测:随机选取一个MAC地址,检测交换机是否已经学习 了 MAC地址的转发条目,若是,则继续,若不是,则报警。
2. 根据权利要求1所述的一
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1