故障检测方法、服务器以及采集设备与流程

文档序号:22685392发布日期:2020-10-28 12:51阅读:80来源:国知局
故障检测方法、服务器以及采集设备与流程
本申请涉及通信领域,并且更具体地,涉及一种故障检测方法、服务器以及采集设备。
背景技术
:路由转发是根据目的互联网协议(internetprotocol,ip)地址查找路由表,得到下一跳和出接口。如果下一跳或者出接口错误,会导致流量转发受损。为了避免业务受损,路由器本身有的可靠性手段主要有两种:一种是表项的定时校验;一种是定时检查控制面和转发面的表项的差异,例如,控制面和转发面一致性检查(controlplanewithforwardingplaneconsistencecheck,cfc)。网络采样(netstream)技术是一种基于网络流量信息的统计技术。一个完整的网络采样系统包含采集设备、数据收集设备(netstreamcollector,nsc)、数据分析设备(netstreamdataanalyzer,nda)。采集设备将采集的数据发给nsc和nda。数据内容包含:源ip、源掩码、目的ip、目的掩码、源自治域号、目的自治域号、源协议端口号、目的协议端口号、ip协议类型、入接口索引、出接口索引、服务类型、被聚合的报文数、被聚合报文的总字节数、第一个报文的时间戳、最后一个报文的时间戳、ip下一跳、路由协议(bordergatewayprotocol,bgp)下一跳、多标签交换协议(multi-protocollabelswitching,mpls)标签。采集设备定时会给nda发送采集的流表数据,就是一个统计信息。发送的间隔由老化时间决定。活跃流(即持续有报文过来的数据流)的默认老化时间是30分钟,非活跃流(即偶尔有报文过来的数据流)的默认老化时间是30s。但是,由于可靠性的原因,设备的中央处理单元(centralprocessingunit,cpu)无法长时间用于故障检测,因此覆盖面不够大,也不够及时。技术实现要素:本申请提供一种故障检测方法、服务器以及采集设备,能够快速且全面的进行故障检测。第一方面,提供了一种故障检测方法,包括:服务器在第一时刻接收采集设备发送的第一报文,所述第一报文包括至少一个第一转发面信息,所述至少一个第一转发面信息与至少一个流单元一一对应,每个第一转发面信息用于指示所述采集设备在所述第一时刻之前采集到的与所述第一转发面信息对应的流单元的下一跳地址和所述流单元的出接口;所述服务器根据所述第一报文,进行故障检测。服务器通过采集设备发送的第一报文,并进行故障检测,从而能够实现快速的对采集设备采集的转发面的流单元的下一跳地址和流单元的出接口进行故障检测。结合第一方面,在一种可能的实现方式中,所述方法还包括:所述服务器获取至少一个控制面信息,所述至少一个控制面信息与所述至少一个流单元一一对应,每个控制面信息用于指示控制面设置的与所述控制面信息对应的流单元的下一跳的地址和所述流单元的出接口;以及所述服务器根据所述第一报文,进行故障检测,包括:所述服务器对所述第一转发面信息和控制面信息进行对比;并根据对比结果,确定所述流单元是否发生故障。服务器通过将获取的控制面信息和第一报文中的第一转发面信息进行对比,并根据对比结果,服务器会确定流单元是否发生故障,从而可以实现快速的进行流单元故障的检测。结合第一方面,在一种可能的实现方式中,在所述控制面信息中没有与所述第一转发面信息对应的流单元的情况下,所述方法还包括:所述服务器保存所述第一转发面信息;所述服务器在第二时刻接收采集设备发送的第二报文,所述第二报文包括至少一个第二转发面信息,所述至少一个第二转发面信息与至少一个流单元一一对应,每个第二转发面信息用于指示所述采集设备在所述第二时刻之前采集到的与所述第二转发面信息对应的流单元的下一跳地址和/或所述流单元的出接口,其中,所述第二时刻位于所述第一时刻之后;以及所述服务器根据所述第一报文,进行故障检测,包括:所述服务器对所述第一转发面信息和第二转发面信息进行对比;并根据对比结果,确定所述流单元是否发生故障。在控制面信息中没有与第一转发面信息对应的流单元的情况下,服务器保存第一转发面信息,待服务器接收到第二报文时,可以使用该第一转发面信息和第二报文中第二转发面进行对比,避免服务器中没有第一转发面对应的流单元,对故障检测结果有误,从而提高了服务器进行故障检测的速度。结合第一方面,在一种可能的实现方式中,在所述控制面信息与所述第一转发面信息不一致的情况下,所述方法还包括:所述服务器向所述采集设备发送待检测信息,所述待检测信息用于指示所述采集设备待检测的所述流单元的下一跳地址和/或出接口。服务器将待检测信息发送给采集设备,采集设备需要再次对待检测的所述流单元的下一跳地址和/或出接口,从而提高故障检测的准确率。结合第一方面,在一种可能的实现方式中,所述服务器通过简单网络管理协议snmp向所述采集设备发送待检测信息。结合第一方面,在一种可能的实现方式中,在所述控制面信息与所述第一转发面信息不一致的情况下,所述方法还包括:所述服务器根据所述第一转发面信息对所述待检测信息对应的流单元进行更新。在控制面信息与第一转发面信息不一致的情况下,服务器需要以第一转发面信息为准,对待检测信息对应的流单元进行更新,从而可以缩短下一次服务器故障检测的时间。第二方面,提供了一种故障检测方法,包括:采集设备生成第一报文,所述第一报文包括至少一个第一转发面信息,所述至少一个第一转发面信息与至少一个流单元一一对应,每个第一转发面信息用于指示所述采集设备在第一时刻之前采集到的与所述第一转发面信息对应的流单元的下一跳地址和所述流单元的出接口;所述采集设备在所述第一时刻向服务器发送第一报文。采集设备通过将在第一时刻之前采集到的与第一转发面信息对应的流单元的下一跳地址和流单元的出接口发送给服务器,以便服务器进行故障检测。结合第二方面,在一种可能的实现方式中,所述方法还包括:所述采集设备生成第二报文,所述第二报文包括至少一个第二转发面信息,所述至少一个第二转发面信息与至少一个流单元一一对应,每个第二转发面信息用于指示所述采集设备在所述第二时刻之前采集到的与所述第二转发面信息对应的流单元的下一跳地址和/或所述流单元的出接口;所述采集设备在所述第二时刻向服务器发送第一报文;其中,所述第二时刻位于所述第一时刻之后。采集设备通过将在第二时刻之前采集到的与第二转发面信息对应的流单元的下一跳地址和流单元的出接口发送给服务器,以便服务器再次进行故障检测。结合第二方面,在一种可能的实现方式中,所述方法还包括:所述采集设备接收所述服务器发送的待检测信息,所述待检测信息用于指示所述采集设备待检测的所述流单元的下一跳地址和/或出接口;所述采集设备根据所述待检测信息,进行故障检测。采集设备通过服务器发送的待检测信息,再次对待检测的流单元的下一跳地址和/或出接口进行故障检测,从而提高故障检测的准确率。结合第二方面,在一种可能的实现方式中,所述采集设备通过简单网络管理协议snmp接收所述服务器发送的待检测信息。结合第二方面,在一种可能的实现方式中,所述采集设备根据所述待检测信息,进行故障检测包括:所述采集设备根据待检测信息,判断所述待检测信息中待检测的所述流单元的下一跳地址和/或出接口是否发生故障,在所述待检测的所述流单元的下一跳地址和/或出接口发生故障的情况下,所述采集设备告警或者所述采集设备对待检测的所述流单元的下一跳地址和/或出接口进行更新。结合第二方面,在一种可能的实现方式中,所述采集设备对待检测的所述流单元的下一跳地址和/或出接口进行更新包括:所述采集设备触发控制面重新发送所述待检测的所述流单元的下一跳地址和/或出接口;或者,所述采集设备触发重启采集设备。第三方面,提供了一种服务器,包括:收发模块,用于在第一时刻接收采集设备发送的第一报文,所述第一报文包括至少一个第一转发面信息,所述至少一个第一转发面信息与至少一个流单元一一对应,每个第一转发面信息用于指示所述采集设备在所述第一时刻之前采集到的与所述第一转发面信息对应的流单元的下一跳地址和所述流单元的出接口;处理模块,用于根据所述第一报文,进行故障检测。结合第三方面,在一种可能的实现方式中,所述收发模块还用于获取至少一个控制面信息,所述至少一个控制面信息与所述至少一个流单元一一对应,每个控制面信息用于指示控制面设置的与所述控制面信息对应的流单元的下一跳的地址和所述流单元的出接口;以及所述处理模块还具体用于对所述第一转发面信息和控制面信息进行对比;并根据对比结果,确定所述流单元是否发生故障。结合第三方面,在一种可能的实现方式中,在所述控制面信息中没有与所述第一转发面信息对应的流单元的情况下,所述处理模块还用于保存所述第一转发面信息;所述收发模块还用于在第二时刻接收采集设备发送的第二报文,所述第二报文包括至少一个第二转发面信息,所述至少一个第二转发面信息与至少一个流单元一一对应,每个第二转发面信息用于指示所述采集设备在所述第二时刻之前采集到的与所述第二转发面信息对应的流单元的下一跳地址和/或所述流单元的出接口,其中,所述第二时刻位于所述第一时刻之后;以及所述处理模块还具体用于对所述第一转发面信息和第二转发面信息进行对比;并根据对比结果,确定所述流单元是否发生故障。结合第三方面,在一种可能的实现方式中,在所述控制面信息与所述第一转发面信息不一致的情况下,所述收发模块还用于向所述采集设备发送待检测信息,所述待检测信息用于指示所述采集设备待检测的所述流单元的下一跳地址和/或出接口。结合第三方面,在一种可能的实现方式中,所述收发模块还具体用于通过简单网络管理协议snmp向所述采集设备发送待检测信息。结合第三方面,在一种可能的实现方式中,在所述控制面信息与所述第一转发面信息不一致的情况下,所述处理模块还具体用于根据所述第一转发面信息对所述待检测信息对应的流单元进行更新。第四方面,提供了一种采集设备,包括:处理模块,用于生成第一报文,所述第一报文包括至少一个第一转发面信息,所述至少一个第一转发面信息与至少一个流单元一一对应,每个第一转发面信息用于指示所述采集设备在第一时刻之前采集到的与所述第一转发面信息对应的流单元的下一跳地址和所述流单元的出接口;收发模块,用于在所述第一时刻向服务器发送第一报文。结合第四方面,在一种可能的实现方式中,所述处理模块还用于生成第二报文,所述第二报文包括至少一个第二转发面信息,所述至少一个第二转发面信息与至少一个流单元一一对应,每个第二转发面信息用于指示所述采集设备在所述第二时刻之前采集到的与所述第二转发面信息对应的流单元的下一跳地址和/或所述流单元的出接口;所述收发模块还用于在所述第二时刻向服务器发送第一报文;其中,所述第二时刻位于所述第一时刻之后。结合第四方面,在一种可能的实现方式中,所述收发模块还用于接收所述服务器发送的待检测信息,所述待检测信息用于指示所述采集设备待检测的所述流单元的下一跳地址和/或出接口;所述处理模块还用于根据所述待检测信息,进行故障检测。结合第四方面,在一种可能的实现方式中,所述收发模块还用于通过简单网络管理协议snmp接收所述服务器发送的待检测信息。结合第四方面,在一种可能的实现方式中,所述处理模块还具体用于根据待检测信息,判断所述待检测信息中待检测的所述流单元的下一跳地址和/或出接口是否发生故障,在所述待检测的所述流单元的下一跳地址和/或出接口发生故障的情况下,所述处理模块还具体用于告警或者所述处理模块还具体用于对待检测的所述流单元的下一跳地址和/或出接口进行更新。结合第四方面,在一种可能的实现方式中,所述处理模块还具体用于触发控制面重新发送所述待检测的所述流单元的下一跳地址和/或出接口;或者,所述处理模块还具体用于触发重启采集设备。第五方面,提供了一种服务器,包括处理器、接收器和发送器,所述接收器和所述发送器在所述处理器的控制下,用于执行第一方面或第一方面任一种可能实现方式中的方法。第六方面,提供了一种采集设备,包括处理器、接收器和发送器,所述接收器和所述发送器在所述处理器的控制下,用于执行第二方面或第二方面任一种可能实现方式中的方法。第七方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序代码,所述计算机程序代码被网络设备运行时,使得所述服务器执行上述第一方面以及第一方面任一种可能实现方式中的方法。第八方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序代码,所述计算机程序代码被网络设备运行时,使得所述采集设备执行上述第二方面以及第二方面任一种可能实现方式中的方法。第九方面,提供了一种计算机可读介质,包括计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机用于执行上述第一方面、第二方面以及第一方面、第二方面任一种可能实现方式中的方法。附图说明图1是本申请实施例提供的方法的通信系统100的示意图。图2是本申请实施例提供的一种采集系统200的示意图。图3是本申请实施例提供的网络中报文转发的方法300的示意性流程图。图4是本申请实施例提供的一种采集设备的示意性框图。图5是本申请实施例提供的一种服务器的示意性框图。图6是本申请实施例提供的一种采集设备另一示意性框图。图7是本申请实施例提供的一种采集设备又一示意性框图。图8是本申请实施例提供的一种服务器的另一示意性框图。具体实施方式下面将结合附图,对本申请中的技术方案进行描述。为了便于更好地理解本申请技术方案,下面将对本申请技术方案涉及相关技术进行介绍。1、路由转发是根据目的ip地址查找路由表,得到下一跳地址和出接口。例如,如图1所示,传输报文的目的地址为1.1.1.1,根据路由表中目的地址为1.1.1.1对应的下一跳地址和出接口,便可以知道传输该报文的下一跳地址和出接口。2、表项的定时校验是采集设备通过定时将控制层面的数据和转发层面的数据进行对比,当控制层面的数据和转发层面的数据不一致时,会发生告警或者自动恢复,其中自动回复是以控制层面的数据为准,对转发层面的数据进行恢复。例如,上述数据可以是路由表数据,采集设备通过定时读取控制层面的路由表数据,并与转发层面的路由表数据进行对比,其中,转发层面的表项也是控制层面发送的,但是在发送过程中或转发表项使用过程中,表项可能被改写。又例如,上述数据也可以是地址解析协议(addressresolutionprotocol,arp)数据,采集设备会定时读取控制层面的arp数据,并与转发层面的arp表数据进行对比。3、定时检查控制面和转发面的表项的差异(例如,cfc)。采集设备定时读取控制层面某一条路由的转发路径的所有表项数据,包括路由表、下一跳地址表、arp表等,并跟转发层面对应的表项数据进行对比。如果控制层面某一条路由的转发路径的所有表项数据和转发层面对应的表项数据不一致时,及时会发生告警或者恢复。目前,采集设备定时将控制层面的数据和转发层面的数据进行对比时,各个组件负责自己的表项,无法关联起来,采集设备发现控制层面的数据和转发层面的数据不一致后,一般还需要进一步确认是不是误告警。采集设备进行cfc时,只会选择某个时间段内固定不变的路由中的一部分来进行比较,这样会导致覆盖范围不够。同时,为了避免影响cpu,各个组件或cfc通常按照一个非常低的速率,一秒100条或者10条来进行对比。对于现网动辄上十万的海量路由数据,无法及时发现问题。因此,亟需提供一种能够快速并全面覆盖的进行故障检测的方法。为便于理解本申请实施例,首先对网络采样做简单说明。网络采样(netstream)技术是一种基于网络流量信息的统计技术。如图2所示,是一种采集系统200。一个完整的网络采样系统包含采集设备、数据收集设备(netstreamcollector,nsc)、数据分析设备(netstreamdataanalyzer,nda)。采集设备将采集的数据发给nsc和nda。数据内容包含:源ip、源掩码、目的ip、目的掩码、源自治域号、目的自治域号、源协议端口号、目的协议端口号、ip协议类型、入接口索引、出接口索引、服务类型、被聚合的报文数、被聚合报文的总字节数、第一个报文的时间戳、最后一个报文的时间戳、ip下一跳、路由协议(bordergatewayprotocol,bgp)下一跳、多标签交换协议(multi-protocollabelswitching,mpls)标签。采集设备定时会给nda发送采集的流表数据,就是一个统计信息。发送的间隔由老化时间决定。活跃流(即持续有报文过来的数据流)的默认老化时间是30分钟,非活跃流(即偶尔有报文过来的数据流)的默认老化时间是30s。下面将结合附图详细说明本申请实施例提供的方法。在下文示出的实施例中,可选地,采集设备为路由器或交换机。图3是从设备交互的角度示出的本申请实施例提供的网络中报文转发的方法300的示意性流程图。如图所示,该方法300可以包括步骤310至步骤330。下面详细介绍方法300中的各个步骤。步骤310,采集设备生成第一报文,该第一报文包括至少一个第一转发面信息,该至少一个第一转发面信息与至少一个流单元一一对应,每个第一转发面信息用于指示采集设备在第一时刻之前采集到的与该第一转发面信息对应的流单元的下一跳地址和流单元的出接口。其中,第一转发面信息是来自于转发面的信息,流单元可以是一条路由的转发路径的所有表项数据。采集设备会对转发面的至少一个流单元的下一跳地址和/或流单元的出接口进行定时采样。其中,定时采样是采集设备基于当前的流量按照采样比定时采集,并进行报文统计。例如,当前的采样比可以为1000:1,即采集设备会每1000个报文抽取一个报文,将该报文的信息进行统计。其中,该报文的信息包括至少一个流单元的下一跳地址和/或流单元的出接口。采集设备采集的报文信息中具体包括的内容可以根据预先配置采取的内容进行采取。可选地,上述第一转发面信息还可以用于指示以下至少一项:采集设备在第一时刻之前采集到的与该第一转发面信息对应的流单元的目的ip、第一转发面信息对应的流单元的源ip、第一转发面信息对应的流单元的源掩码、第一转发面信息对应的流单元的目的端口、第一转发面信息对应的流单元的源端口、第一转发面信息对应的流单元的报文数、第一转发面信息对应的流单元的字节数。采集设备统计一段时间后,将报文的统计信息组成至少一个转发面信息。每个转发面信息与一个流单元一一对应。例如,如表1所示的第一报文,流单元1对应一个转发面信息,流单元2对应一个转发面信息,流单元3对应一个转发面信息,流单元4对应一个转发面信息,该转发面信息可以包括与该转发面信息对应的流单元的目的地址、源地址、目的端口、源端口、下一跳地址。出接口、报文数、字节数等。例如,表1所示,第一转发面信息可以包括流单元1的目的地址1.1.1.1,第一转发面信息也可以包括流单元1的源地址1.0.0.1,第一转发面信息也可以包括流单元1的目的端口10,第一转发面信息也可以包括流单元1的源端口10001,第一转发面信息也可以包括流单元1的下一跳地址1.1.1.2,第一转发面信息也可以包括流单元1的出接口5/0/0,第一转发面信息也可以包括流单元1的报文数100,第一转发面信息也可以包括流单元1的字节数100kbit。表1步骤320,采集设备向服务器发送该第一报文。其中,采集设备在第一时刻,将采集设备在第一时刻之前采集的转发面信息封装成报文,并发送发送给服务器。步骤330,服务器根据第一报文,进行故障检测。服务器在进行故障检测之前,获取至少一个控制面信息,该至少一个控制面信息与所述至少一个流单元一一对应,每个控制面信息用于指示控制面设置的与控制面信息对应的流单元的下一跳的地址和所述流单元的出接口。其中,该控制信息指示的与该控制信息对应的流单元中可以包括与第一转发面信息指示的与第一转发面对应的流单元。服务器接收到第一报文后,将第一报文中第一转发面信息和控制面信息进行对比,即服务器将第一转发面信息对应的流单元与控制面信息对应的流单元进行对比。例如,服务器可以对第一转发面信息中的流单元1的下一跳地址和控制面信息中相应的流单元1的下一跳地址进行对比。又例如,服务器可以对第一转发面信息中的流单元1的出接口和控制面信息中相应的流单元1的出接口进行对比。可选地,控制面信息来自于控制面的信息,该控制面信息可以是服务器本地内存或者服务器本地硬盘里保存的流单元。服务器将第一转发面信息和控制面信息进行对比会出现以下两种情况,相应的服务器针对每种情况会进行相应的操作。情况1:控制面信息中没有与第一转发面信息对应的流单元的情况下。服务器保存第一转发面信息,即服务器将第一转发面信息中流单元保存在服务器本地内存或者服务器本地硬盘里,以便后续服务器接收到其他报文时,服务器本地内存或者服务器本地硬盘里存储有相应的流单元。例如,服务器在第二时刻接收采集设备发送的第二报文,第二报文包括至少一个第二转发面信息,至少一个第二转发面信息与至少一个流单元一一对应,每个第二转发面信息用于指示采集设备在第二时刻之前采集到的与第二转发面信息对应的流单元的下一跳地址和/或流单元的出接口,其中,第二时刻位于第一时刻之后。服务器对第一转发面信息和第二转发面信息进行对比,并根据对比结果,确定流单元是否发生故障。例如,控制面信息中没有第一转发面信息对应的流单元1,则服务器需要保存第一转发面信息对应的流单元1。又例如,控制面信息中没有第一转发面信息对应的流单元2,则服务器需要保存第一转发面信息对应的流单元2。可选地,服务器可以保存第一转发面信息对应的流单元的部分内容。例如,控制面信息中没有第一转发面信息对应的流单元1,则服务器需要保存第一转发面信息对应的流单元1,此时,服务器可以保存第一转发信息对应的流单元1的目的ip,服务器也可以保存第一转发信息对应的流单元1的源ip,服务器也可以保存第一转发信息对应的流单元1的下一跳地址,或者服务器可以保存第一转发信息对应的流单元1的出接口。例如,如表2所示是服务器保存控制面信息中没有的第一转发面信息对应的流单元的下一跳地址、流单元的出接口、流单元的下一跳地址、和流单元的出接口。表2流单元目的地址(ip)源地址(ip)下一跳地址出接口流单元11.1.1.11.0.0.11.1.1.25/0/0流单元22.2.2.21.0.0.22.2.2.35/0/0流单元33.3.3.31.0.0.33.3.3.45/0/0流单元44.4.4.41.0.0.44.4.4.55/0/0情况2:控制面信息与第一转发面信息不一致的情况下。服务器向采集设备发送待检测信息,该待检测信息用于指示所述采集设备待检测的流单元的下一跳地址和/或出接口。控制面信息与第一转发面信息不一致的情况可以理解为控制面信息对应的流单元包括的内容与第一转发面信息对应的流单元包括的内容至少有一项不一致。例如,控制面信息对应的流单元1中的出接口是2/0/0,第一转发面信息对应的流单元1的出接口是5/0/0,即控制信息对应的流单元1的出接口与第一转发面信息相应的流单元1的出接口不一致,也即控制面信息与第一转发面信息不一致。又例如,例如,控制面信息对应的流单元1中的下一跳地址是1.1.1.2,第一转发面信息对应的流单元1的下一跳地址是2.2.2.3,即控制信息对应的流单元1的下一跳地址与第一转发面信息相应的流单元1的下一跳地址不一致,也即控制面信息与第一转发面信息不一致。该待检测信息用于指示所述采集设备待检测的流单元的下一跳地址和/或出接口,其中待检测的流单元可以理解为控制面信息对应的流单元与第一转发面信息对应的流单元不一致的流单元。例如,该待检测信息可以包括控制面信息对应的流单元与第一转发面信息对应的流单元不一致的流单元的目的地址、控制面信息对应的流单元的出接口(即源出接口),第一转发面信息对应的出接口(即当前出接口)。例如,如表3所示,是待检测信息包括的内容。例如,控制信息对应的流单元的目的地址是1.1.1.1,该流单元对应的源出接口是2/0/0,第一转发面信息相应的流单元的目的地址是1.1.1.1对应的当前出接口是5/0/0,即源出接口2/0/0是采集设备待检测的出接口。又例如,控制信息对应的流单元的目的地址是2.2.2.2,该流单元对应的源出接口是2/0/0,第一转发面信息相应的流单元的目的地址是2.2.2.2对应的当前出接口是5/0/0,即源出接口2/0/0是采集设备待检测的出接口。表3目的地址源出接口当前出接口1.1.1.12/0/05/0/02.2.2.22/0/05/0/0………可选地,在控制面信息与第一转发面信息不一致的情况下,服务器还可以根据第一转发面信息对待检测信息对应的流单元进行更新。服务器根据第一转发面信息对待检测信息对应的流单元进行更新可以理解为服务器将控制面信息对应的流单元与第一转发面信息对应的流单元的不一致的内容,以第一转发面信息指示的相应的流单元的内容为准,对控制面信息对应的流单元中的内容进行更新。可选地,上述待检测信息可以是服务器通过简单网络管理协议snmp向采集设备发送的待检测信息。可选地,服务器对第一转发面信息和控制面信息进行对比,如出现情况1,则服务器不会执行步骤340,同时采集设备也不会执行步骤350。如出现情况2,服务器会执行步骤340,同时采集设备也会执行步骤350。可选地,步骤340,服务器向采集设备发送待检测信息。可选地,步骤350,采集设备根据待检测信息,进行故障检测。采集设备根据待检测信息,进行故障检测可以理解为在服务器初步进行故障检测之后,采集设备对服务器故障检测的出故障的出接口或下一跳地址再次进行故障检测。采集设备收到服务器发送的待检测信息后,根据待检测信息,判断待检测信息中待检测的流单元的下一跳地址和/或出接口是否发生故障。即可以是采集设备对存在问题的路由进行cfc检测,查看该路由的转发路径的所有表项数据是否发生故障,其中,采集设备可以主要针对出接口或下一跳地址进行cfc检测。在待检测的流单元的下一跳地址和/或出接口发生故障的情况下,采集设备对待检测的所述流单元的下一跳地址和/或出接口进行更新。采集设备对待检测的所述流单元的下一跳地址和/或出接口进行更新可以通过以下三种方式实现。方式1:采集设备用当前出接口或当前下一跳地址代替发生故障的源出接口或源下一跳地址,进行出接口或下一跳地址的更新;方式2:采集设备触发控制层面重新发送待检测的流单元的下一跳地址和/或出接口下;方式3:采集设备触发重启采集设备。在待检测的流单元的下一跳地址和/或出接口发生故障的情况下,采集设备还可以告警。采集设备基于当前的流量按照采样比,对报文进行统计,输出的是统计信息,网络采样可以输出采集设备上所有的流表信息(即第一转发面信息)。服务器可以在一分钟内完成所有流表信息中的一个或多个流单元的对比,服务器能够快速并全面的进行故障检测,同时,采集设备还可以针对服务器故障检测的结果再次进行故障检测,可以提高故障检测的可靠性,避免业务长期不必要的受损。以上,图3详细说明了本申请实施例提供的故障检测300。本申请实施例可以根据上述方法示例对采集设备进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。在采用对应各个功能划分各个功能模块的情况下,图4示出了上述和实施例中涉及的采集设备的一种可能的组成示例图,该采集设备能执行本申请各方法实施例中任一方法实施例中采集设备所执行的步骤。如图4所示,所述采集设备为路由器、交换机、或数通设备实现实施例中提供的方法的采集设备,例如该采集设备可以是芯片系统。该采集设备可以包括:收发单元401和处理单元402。收发单元401,用于支持采集设备执行本申请实施例中描述的方法。例如,收发单元401,用于执行或用于支持采集设备执行图3所示的通信方法中的320和340。需要说明的是,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。本申请实施例提供的采集设备,用于执行上述任意实施例的方法,因此可以达到与上述实施例的方法相同的效果。收发单元对应的实体设备可以为收发器,处理单元对应的实体设备可以为处理器。在采用对应各个功能划分各个功能模块的情况下,图5示出了上述和实施例中涉及的服务器的一种可能的组成示例图,该服务器能执行本申请各方法实施例中任一方法实施例中服务器所执行的步骤。例如该服务器可以是芯片系统。该服务器可以包括:收发单元501和处理单元502。收发单元501,用于支持服务器执行本申请实施例中描述的方法。例如,收发单元501,用于执行或用于支持服务器执行图3所示的通信方法中的320和340。需要说明的是,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。本申请实施例提供的服务器,用于执行上述任意实施例的方法,因此可以达到与上述实施例的方法相同的效果。收发单元对应的实体设备可以为收发器,处理单元对应的实体设备可以为处理器。图6示出了上述实施例中所涉及的采集设备的一种可能的结构示意图。采集设备包括:主控板610和接口板620。所述主控板610包括处理器611和存储器612,所述接口板620包括处理器621、存储器622和接口卡623。所述接口板620的处理器621用于调用接口板620的存储器622中的程序指令执行报文的接收和发送。所述主控板610的处理器611用于调用主控板610存储器612中的程序指令执行相应的处理功能。图7示出了上述实施例中所涉及的采集设备的另一种可能的结构示意图。采集设备包括:收发器710、处理器720和存储器730。收发器710用于接收报文或数据信息等,处理器720用于执行上述实施例采集设备中处理相关步骤。图8示出了上述实施例中所涉及的服务器的另一种可能的结构示意图。服务器包括:收发器810、处理器820和存储器830。收发器810用于接收报文或数据信息等,处理器820用于执行上述实施例服务器中处理相关步骤。在本申请实施例中,处理器可以是通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。在本申请实施例中,存储器可以是非易失性存储器,比如硬盘(harddiskdrive,hdd)或固态硬盘(solid-statedrive,ssd)等,还可以是易失性存储器(volatilememory),例如随机存取存储器(random-accessmemory,ram)。存储器是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1