集群路由器、mpu及其故障的确定方法、感知控制器的制造方法

文档序号:7819645阅读:689来源:国知局
集群路由器、mpu及其故障的确定方法、感知控制器的制造方法
【专利摘要】本发明公开了一种集群路由器、MPU及其故障的确定方法、感知控制器,用以解决现有技术中存在主备MPU中一端一旦出现故障,无法立即确定对端MPU发生故障,而顺利的进行部署的问题。该MPU包括处理器,以及与处理器分别连接的至少一个感知控制器。各个感知控制器在本端MPU工作状态异常时,中断向与感知控制器连接的其他MPU发送该第一测试报文,从而其他MPU在第一规定时长内未接收到第一测试报文时确认本端MPU工作状态异常;或者接收到其他MPU发送的用于通知本端MPU其他MPU工作状态正常的第二测试报文时,将第二测试报文环回给其他MPU,以使其他MPU在接收到环回的第二测试报文时确认本端MPU工作状态异常。
【专利说明】集群路由器、^及其故障的确定方法、感知控制器

【技术领域】
[0001]本发明涉及通信【技术领域】,尤其涉及一种集群路由器、集群路由器中的及其故障的确定方法、感知控制器。

【背景技术】
[0002]目前已有的集群路由器多为多机框互联的集群路由器结构。集群路由器的每个机框由主控板(13111 ?1~006881118 1)1111:,简称I?!!〉管理。为了保证系统的可靠性,米用主备1?^备份的形式来管理系统。
[0003]现有的集群路由器中,主、备腿^分布在不同的机框内,并且主、备腿^通过机框间级联的以太网线或光纤连接,如图1所示,其中洲1化卜表示局域交换机。各个机框中的1?11的主备角色一般由处理器?1~006881118 11=11:,简称⑶11)通过一定的算法仲裁来确定。主备之间通过心跳报文感知对端机框中的状态,该心跳报文在主备的处理器之间传递,当某一端的腿^中的处理器在一段时间内接收不到对端腿^中的处理器发送的心跳报文时,就认为对端腿^的状态异常,从而触发系统主、备腿^的重新部署。
[0004]例如,当主和备腿^之间的心跳报文收发正常时,认为对端正常,保持自己的角色不变。在一段时间内,备腿^ 一直收不到主发送的心跳报文时,就认为主出现了故障,需要采取相应的动作(例如自己升为主用腿;类似地,在一段时间内,当主1?^持续接收不到备祖^发送的心跳报文时,主也需要采取相应的部署操作(例如该机框中还存在其它备份时,重新选出一个备份作为备腿。
[0005]现有技术主备之间依赖机框间级联的以太网线或光纤传递心跳报文,心跳报文需要依赖腿^中的处理器产生和处理,由于在这条机框间级联的网线或光纤形成的通道上同时传递的还有其他控制报文,所以如果在该通道上突然传递其它大量控制报文时,可能会导致该通道拥塞,也可能因此导致短暂丢失心跳报文,而使得主备两端的1?^接收不到心跳报文。现有技术为了保证可靠性,需要设定丢心跳门限,当某一端的腿^接收不到对端1?^发送的心跳报文的持续时间达到设定的丢心跳门限时,才能按照丢心跳的策略处理。这就导致主备腿^中一端一旦出现故障,现有的技术主备腿^无法立即确定对端的腿^发生故障,而顺利的进行部署。


【发明内容】

[0006]本发明提供一种集群路由器、集群路由器中的及其故障的确定方法、感知控制器,用以解决现有技术中存在主备腿^中的一端一旦出现故障,无法立即确定对端的腿^发生故障,而顺利的进行部署的问题。
[0007]第一方面,本发明实施例提供了一种集群路由器中的腿该腿^包括处理器,以及与所述处理器分别连接的至少一个感知控制器,其中:
[0008]所述处理器,用于在所述处理器所属的本端腿^工作状态正常时,向所述至少一个感知控制器分别发送控制信号;并在所述本端工作状态异常时,向所述至少一个感知控制器分别发送中断信号;
[0009]每个感知控制器,用于在接收到处理器发来的控制信号时,向与感知控制器相连的其他1?^发送用于通知其他1?^本端1?^工作状态正常的第一测试报文,以使其他在接收到所述第一测试报文时确认所述本端1叩工作状态正常;并
[0010]在接收到处理器发来的中断信号时,中断向与感知控制器相连的其他腿^发送所述第一测试报文,以使其他在第一规定时长内未接收到所述第一测试报文时确认所述本端工作状态异常;或者
[0011]在接收到处理器发来的中断信号后,若接收到其他腿^发送的用于通知本端腿^其他1?^工作状态正常的第二测试报文时,将所述第二测试报文环回给相连的其他1?口,以使其他1?^在接收到环回的第二测试报文时确认所述本端1?^工作状态异常。
[0012]结合第一方面,在第一方面的第一种可能的实现方式中,各个感知控制器,还用于在本端1?^工作状态正常时,若接收到其他1?^发送的第二测试报文时,则确定其他1?口的工作状态正常;以及
[0013]在第一规定时长内未接收到其他1?[发送的第二测试报文时,确定所述其他工作状态异常;或者接收到其他1叩环回的所述本端1叩发送的第一测试报文时,确定其他的工作状态异常。
[0014]结合第一方面的第一种的可能的实现方式,在第一方面的第二种可能的实现方式中,所述感知控制器,还用于将确定的与感知控制器相连的其他的工作状态保存;
[0015]所述处理器,还用于向所述其它发送心跳报文,及接收其它发来的心跳报文;并在第二规定时长内未接收到任何一个其他1?^发送的心跳报文时,查询与该任何一个其他相连的感知控制器保存的该任何一个其他的工作状态,根据查询到的工作状态确定该任何一个其他的工作状态。
[0016]结合第一方面和第一方面的第一种至第二种的可能的实现方式中的任意一种,在第一方面的第三种可能的实现方式中,所述感知控制器包括:
[0017]可擦除可编程逻辑器件即⑶,继电器,以及接口 ;
[0018]2?10,用于在接收到所述处理器发来的控制信号时,控制所述继电器处于第一工作状态,并通过接口向与感知控制器相连的其他1叩发送用于通知其他本端工作状态正常的第一测试报文,以使其他在接收到所述第一测试报文时确认所述本端工作状态正常;并
[0019]在接收到处理器发来的中断信号时,控制所述继电器处于第二工作状态,并中断向与感知控制器相连的其他发送所述第一测试报文,以使其他在第一规定时长内未接收到所述第一测试报文时确认所述本端工作状态异常;
[0020]所述继电器,还用于在本端腿^掉电后,转换为第二工作状态,若通过接口接收到其他1?^发送的用于通知本端1?^其他1?^工作状态正常的第二测试报文时,将所述第二测试报文通过接口环回给相连的其他以使其他1?^在接收到环回的第二测试报文时确认所述本端工作状态异常。
[0021]第二方面,本发明实施例提供了一种集群路由器,该集群路由器包括:至少两个如第一方面和第一方面的第一种可能的实现方式和第一方面的第二种可能的实现方式中的任一项所述的1?口 ;
[0022]其中至少两个中的至少一个即口为主即口,除主即口之外的即口为备;
[0023]针对任——个主腿该主腿^中包括的每一个感知控制器分别和不同的备腿^中的一个感知控制器相连。
[0024]结合第二方面,在第二方面的第一种可能的实现方式中,所述集群路由器还包括至少两个机框,所述主腿^与备用分别位于不同的机框内。
[0025]第三方面,本发明实施例提供了一种集群路由器中的腿^故障的确定方法,所述方法包括:
[0026]感知控制器在所述感知控制器所属的本端工作状态正常时,若接收到其所属的中的处理器发送的控制信号,则向所述感知控制器相连的其他腿^发送用于通知其他1?^本端1?^工作正常的第一测试报文;
[0027]所述感知控制器在所述本端工作状态异常时,若接收到所述处理器发送的中断信号,则中断向与所述感知控制器相连的其他1叩发送所述第一测试报文,以使其他在第一规定时长内未接收到所述第一测试报文时确认所述本端工作状态异常;或者在接收到所述处理器发来的中断信号后,若接收到相连的其他腿^发送的用于通知本端腿^其他1?^工作正常的第二测试报文时,将所述第二测试报文环回给相连的其他以使其他1?^在接收到环回的第二测试报文时确认所述本端1?^工作状态异常。
[0028]结合第三方面,在第三方面的第一种可能的实现方式中,所述方法还包括:
[0029]所述感知控制器在所属的1?^工作状态正常时,若接收到其他1?^发送的第二测试报文,则确定其他1?^的工作状态正常;以及
[0030]在第一规定时长内未接收到其他1?[发送的第二测试报文时,确定所述其他工作状态异常;或者接收到其他1叩环回的所述本端1叩发送的第一测试报文时,确定其他的工作状态异常。
[0031]结合第三方面的第一种可能的实现方式,在第三方面的第二种可能的实现方式,所述方法还包括:
[0032]所述感知控制器在确定其他1?^的工作状态后,将其他1?^的工作状态保存,以使所述处理器在第二规定时长内未接收到任何一个其他腿^发送的心跳报文时,查询与该任何一个其他相连的感知控制器保存的该任何一个其他1叩的工作状态,根据查询到的工作状态确定该任何一个其他的工作状态。
[0033]第四方面,本发明实施例提供了一种感知控制器,该感知控制器包括:
[0034]接收模块,用于在所述感知控制器所属的本端工作状态正常时,接收其所属的中的处理器发送的控制信号;
[0035]发送模块,用于在所述接收模块接收到所述控制信号时向所述感知控制器相连的其他发送用于通知其他本端工作正常的第一测试报文;
[0036]所述接收模块,还用于在所述本端工作状态异常时,接收所述处理器发送的中断信号;
[0037]所述发送模块,还用于在所述接收模块接收到所述中断信号后中断向与所述感知控制器相连的其他发送所述第一测试报文,以使其他在第一规定时长内未接收到所述第一测试报文时确认所述本端工作状态异常;或者还用于在所述接收模块接收到所述处理器发来的中断信号后,若所述接收模块接收到相连的其他1?^发送的用于通知本端1?^其他1?^工作正常的第二测试报文时,将所述第二测试报文环回给相连的其他1?口,以使其他1?^在接收到环回的第二测试报文时确认所述本端1?^工作状态异常。
[0038]结合第四方面,在第四方面的第一种可能的实现方式中,该感知控制器还包括:
[0039]确定模块,用于在所属的1?^工作状态正常时,若所述接收模块接收到其他1?口发送的第二测试报文,则确定其他的工作状态正常;以及
[0040]在第一规定时长内未接收到其他1?[发送的第二测试报文时,确定所述其他工作状态异常;或者在所述接收模块接收到其他环回的所述本端发送的第一测试报文时,确定其他的工作状态异常。
[0041]结合第四方面的第一种可能的实现方式,在第四方面的第二种可能的实现方式中,还包括:
[0042]保存模块,用于在所述确定模块确定其他的工作状态后,将其他1?^的工作状态保存,以使所述处理器在第二规定时长内未接收到任何一个其他发送的心跳报文时,查询与该任何一个其他1?[相连的感知控制器保存的该任何一个其他1?^的工作状态,根据查询到的工作状态确定该任何一个其他的工作状态。
[0043]本发明实施例通过在中增加至少一个感知控制器,并且在中增加的感知控制器,可以与其它1?口一一相连。各个感知控制器在所属的本端1?口工作状态正常时,向与各个感知控制器分别相连的其他1叩发送用于通知其他1?^本端1?^工作状态正常的第一测试报文;从而其他1?[在接收到该第一测试报文时确认本端1?[工作状态正常。各个感知控制器在本端1?口工作状态异常时,中断向与感知控制器连接的其他1?口发送该第一测试报文,从而其他在第一规定时长内未接收到所述第一测试报文时确认所述本端1?口工作状态异常;或者各个感知控制器在本端工作状态异常时,若接收到其他1?口发送的用于通知本端其他工作状态正常的第二测试报文时,将所述第二测试报文环回给其他1?[,以使其他1?[在接收到环回的第二测试报文时确认所述本端1?[工作状态异常。利用本方案在各个腿^中一端一旦出现故障(故障包括工作故障或者掉电),其它与其相连的其他能够立即确定对端的发生故障,而顺利的进行部署。避免了利用现有技术的处理器在突发大量控制报文时造成的通道拥塞,导致一端无法立即确认对端1?^的故障状态,而影响业务的顺利进行。

【专利附图】

【附图说明】
[0044]图1为现有技术提供的集群路由器的结构示意图;
[0045]图2为本发明实施例提供的集群路由器的结构示意图;
[0046]图3为本发明实施例提供的一种感知控制器结构示意图;
[0047]图4为本发明实施例提供的另一种感知控制器结构示意图。

【具体实施方式】
[0048]为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0049]本发明实施例通过在中增加至少一个感知控制器,并且在中增加的感知控制器,可以与其它1?口一一相连。各个感知控制器在所属的本端1?口工作状态正常时,向与各个感知控制器分别相连的其他1叩发送用于通知其他1?^本端1?^工作状态正常的第一测试报文;从而其他1?[在接收到该第一测试报文时确认本端1?[工作状态正常。各个感知控制器在本端1?口工作状态异常时,中断向与感知控制器连接的其他1?口发送该第一测试报文,从而其他在第一规定时长内未接收到所述第一测试报文时确认所述本端1?口工作状态异常;或者各个感知控制器在本端工作状态异常时,若接收到其他1?口发送的用于通知本端其他1?^工作状态正常的第二测试报文时,将所述第二测试报文环回给其他1?[,以使其他1?[在接收到环回的第二测试报文时确认所述本端1?[工作状态异常。利用本方案在各个腿^中一端一旦出现故障(故障包括工作故障或者掉电),其它与其相连的能够立即确定对端的发生故障,而顺利的进行部署。避免了利用现有技术的处理器在突发大量控制报文时造成的通道拥塞,导致一端无法立即确认对端的工作状态,而影响业务的顺利进行。
[0050]本发明实施例中提供了一种集群路由器、一种集群路由器中的以及一种集群路由器中的故障的确定方法、一种感知控制器,四者是基于同一发明构思的,由于四者解决问题的原理相似,因此各种设备与方法的实施可以相互参见,重复之处不再赘述。
[0051]本发明实施例提供的方案中,集群路由器至少包括两个腿每个包括:处理器,以及与该处理器分别连接的至少一个感知控制器。
[0052]具体的,其中至少两个]中的至少一个即口为主]口,除主即口之外的]口为备1?^ ;针对任——个主腿该主中包括的每一个感知控制器分别和不同的备腿^中的一个感知控制器相连。也就是感知控制器的数量与其它1?^的数量相对应。可以将连接后形成的通道称为快速感知通道。
[0053]可选地,该集群路由器还可以包括至少两个机框,那么每个机框中可以包括至少一个腿具体的,上述主腿^和备腿^分别位于不同的机框内。当然集群路由器也可以不包括机框。
[0054]可选地,位于同一机框内的两个腿^中的感知控制器可以不相互连接。
[0055]以下以一个为例,即以下所述的处理器及至少一个感知控制器位于一个中,则其他1?^的功能类似,可以参照实施。
[0056]所述处理器在所属的工作状态正常时,向所述至少一个感知控制器分别发送控制信号;各个感知控制器在接收到处理发来的控制信号时,向与感知控制器相连的其他1?口发送用于通知其他本端工作状态正常的第一测试报文,从而其他在接收到所述第一测试报文时确认所述本端工作状态正常。
[0057]在1?口工作状态异常时,可以通过以下方式中的至少一种实现,具体如下:1?口工作状态异常包括1叩工作故障或者1?[掉电。
[0058]第一种实现方式:
[0059]处理器在所属的本端腿^工作故障时,由于处理器异常,因此会向至少一个感知控制器分别发送中断信号。各个感知控制器在接收到中断信号或者在本端掉电时,中断向与至少一个感知控制器分别相连的其他1?^发送第一测试报文,从而其他1?^在第一规定时长内未接收到所述第一测试报文时确认所述本端工作状态异常。
[0060]其中,感知控制器可以周期性的向与其相连的其他1? 口发送第一测试报文,因此第一规定时长内就是一个周期,即1?口双方可以约定一周期的时间,则其他1?口在哪个周期没有接收到第一测试报文,确定本端工作状态异常。
[0061]利用上述方案,使得与各个感知控制器相连的各个在各个感知控制器所属的1?^工作状态正常时,在每个周期都能够接收到各个感知控制器发送的测试报文,确定各个感知控制器所属的工作状态正常;在各个感知控制器所属的工作状态一旦出现异常时,与各个感知控制器相连的其他接收不到各个感知控制器发送的测试报文,因此确定各个感知控制器所属的工作状态异常。
[0062]第二种实现方式:
[0063]处理器在所属的工作故障时,由于处理器异常,因此会向至少一个感知控制器分别发送中断信号。各个感知控制器在接收到中断信号或者在所属的本端1?^掉电时,若接收到其他发送的用于通知本端其他工作状态正常的第二测试报文时,将所述第二测试报文环回给相连的其他1?[,从而其他1?[在接收到环回的第二测试报文时确认所述本端工作状态异常。
[0064]具体的,在测试报文中可以携带的标识信息,从而在本端接收到测试报文时,可以根据测试报文中携带的标识信息确定是本端中感知控制器发送的第一测试报文还是其他发送的第二测试报文。
[0065]第三种实现方式:
[0066]处理器在所属的即口工作状态异常时,由于处理器异常,因此会向至少一个感知控制器分别发送中断信号。各个感知控制器在接收到中断信号或者在所属的本端掉电时,中断向与至少一个感知控制器分别相连的其他1叩发送第一测试报文,若接收到其他1? 口发送的用于通知本端1?[其他1?[工作状态正常的第二测试报文时,将所述第二测试报文环回给相连的其他腿从而其他腿^在接收不到所述第一测试报文且接收到环回的第二测试报文时确认所述本端工作状态异常。
[0067]具体的,在测试报文中可以携带的标识信息,从而在本端接收到测试报文时,可以根据测试报文中携带的标识信息确定是本端中感知控制器发送的第一测试报文还是其他发送的第二测试报文。
[0068]在其中一种实施例中,各个感知控器在本端1?口工作状态正常时,接收到其他发送的第二测试报文时,确定其他1?[工作状态正常;在第一规定时长内未接收到其他发送的第二测试报文时,确定所述其他1?[工作状态异常,或者接收到其他1?[环回的所述本端1?^发送的第一测试报文时,确定其他1?^的工作状态异常。
[0069]在其中一个可选的实施例中,各个感知控制器,还用于将确定的与其相连的腿^的工作状态保存。
[0070]具体的,处理器不仅用于在所属的工作正常时向感知控制器发送控制信号,还可以用于向所述处理器所属的以外的其它发送心跳报文,及接收其它发送的心跳报文;也就是处理器保存现有的发送心跳报文确定对端的工作状态的流程,在该基础上再增加感知控制器仅用于发送测试报文。处理器在第二规定时长内接收不到任何一个其他1?^发送的心跳报文时,查询与该任何一个其他1?^相连的感知控制器保存的该任何一个其他1?^的工作状态,根据查询的工作状态确定该任何一个其他1?^的工作状态。具体的,若查询到与该任何一个其他1叩相连的感知控制器保存的该任何一个其他1叩的工作状态异常,则确定该其他腿^的工作状态异常,若查询到与该任何一个其他腿^相连的感知控制器保存的该任何一个其他的工作状态正常,则确定该其他1?^的工作状态正堂巾0
[0071]在其中一个实施例中,所述感知控制器包括:
[0072]可擦除可编程逻辑器件即⑶,继电器,以及接口 ;
[0073]2?10,用于在接收到所述处理器发来的控制信号时,控制所述继电器处于第一工作状态,并通过接口向与感知控制器相连的其他1叩发送用于通知其他1?^本端1?^工作状态正常的第一测试报文,以使其他在接收到所述第一测试报文时确认所述本端工作状态正常;并
[0074]在接收到处理器发来的中断信号时,控制所述继电器处于第二工作状态,并中断向与感知控制器相连的其他发送所述第一测试报文,以使其他在第一规定时长内未接收到所述第一测试报文时确认所述本端工作状态异常;
[0075]所述继电器,还用于在本端腿^掉电后,转换为第二工作状态,若通过接口接收到其他1?^发送的用于通知本端1?^其他1?^工作状态正常的第二测试报文时,将所述第二测试报文通过接口环回给相连的其他1?[,以使其他1?[在接收到环回的第二测试报文时确认所述本端工作状态异常。
[0076]该实施例中所述的2?10还可以通过其他逻辑器件实现,继电器还可以通过双向开关或者能够实现两种状态开关功能的器件等等实现,本发明不作具体限定。
[0077]感知控制器具体功能还可以由??以实现。
[0078]下面结合具体应用场景对本发明实施例进行具体说明。
[0079]以图2所示的集群路由器为例,该集群路由器包括两个机框,机框1和机框2,每个机框中包括两个腿框1包括主即口201,以及为主即口201备份的即口202,框2中包括备腿^203,以及为备备份的腿^204。两个机框之间通过框间连线相互连接,其中框间连线为级联以太网线或光纤。主腿^中包括0^201^1、局域交换机(匕仙#化10 201^以及两个感知控制器201(3^201(:20备肥口203中包括?:?口2033、局域交换机以及两个感知控制器203。1、203。2。为主腿^201备份的腿^202包括0^202^1,局域交换机2026,以及两个感知控制器202(3^202(:20为备肥[203被备份的肥[204包括,局域交换机以及两个感知控制器204(3^204(:20位于不同机框的中的感知控制器两两连接,连接线形成快速感知通道。本发明实施例中位于不同机框的中的感知控制器两两连接采用交叉连接的方式,这样能够保证传输距离。
[0080]这里以主腿^201为例,其它腿^工作原理类似,不再赘述。主腿^201中的处理器2018向对应的各个感知控制器2014及201^2发送控制信号,该控制信号用于指示各个感知控制器2014及20化2,在主腿^201工作状态正常时,周期性向与感知控制器2014相连的备腿^203,以及感知控制器201。2相连的为备腿^203备份的腿^204发送测试报文;在主腿^201工作故障时,也就是主腿^201中的处理器20匕出现故障,从而触发向对应的各个感知控制器2014及20化2发送中断信号,所述中断信号用于指示各个感知控制器,中断向与感知控制器2014相连的备1?口203,以及感知控制器201口相连的为备1?口203备份的1?^204发送测试报文。主腿^201掉电时,各个感知控制器201。1及201。2,中断向与感知控制器201。1相连的备腿^203,以及感知控制器201。2相连的为备腿^203备份的腿^204发送测试报文。
[0081]感知控制器201。1及201。2在所属的主腿^201工作状态正常时,接收处理器2013发送的控制信号。感知控制器2014根据接收到的控制信号向与其相连的备1?似03发送用于通知备腿^203主腿^201工作状态正常的第一测试报文;感知控制器201。2根据接收到的控制信号向为备腿^203备份的腿^204发送用于通知备腿^203主腿^201工作状态正常的第一测试报文,从而备腿^203在接收到所述第一测试报文时确认所述主腿^201工作状态正常。在所属的主腿^201工作故障时,感知控制器201^1及201^2接收对应的处理器20匕发送的中断信号。在接收到中断信号或者在所属的主腿^201掉电后,停止发送第一测试报文,从而备腿^203及为备腿^203备份的腿^204在该中断的周期内未接收到所述第一测试报文时确认所述主腿^201工作状态异常。
[0082]感知控制器201(^1及20化2在接收对应的处理器20匕发送的中断信号或者在所属的主腿^201掉电时,还可以通过以下方式通知备腿^203主祖^201工作状态异常:
[0083]若感知控制器201。1接收到备腿^203发送的用于通知主腿^201备即似03工作状态正常的第二测试报文时,将所述第二测试报文环回给相连的备1?似03,以使备1?口203在接收到环回的第二测试报文时确认所述主1叩工作状态异常。
[0084]主腿^201中的感知控制器2014可以通过以下方式确定备腿^203的工作状态:
[0085]感知控制器201。1在主腿^201工作状态正常时,接收到备腿^203的感知控制器20301发送的第二测试报文,确定备1?似03的工作状态正常;
[0086]接收到备腿^环回的主腿^201发送的第一测试报文时,确定备腿^的工作状态异堂巾0
[0087]主腿^201中的感知控制器2014还可以通过以下方式确定备腿^203的工作状态:
[0088]主腿^201中的感知控制器201。1各个周期等待接收备腿^203发送的第二测试报文。例如:主腿^201中的感知控制器201。1周期性的接收到备腿^203中的感知控制器20301发送的第二测试报文时,确定备腿^203工作状态正常。主腿^201中的感知控制器20101 一旦(各个腿^约定的一周期的时长内)接收不到备腿^203中的感知控制器2034发送的第二测试报文,则确定备1?似03工作状态异常。
[0089]另外,主腿^201的感知控制器201。1在确定备腿^203的工作状态后,可以将该备1?^203的工作状态保存。例如确定备腿^203工作状态正常时,保存为32,确定备腿^203工作状态异常时,保存为33。因此,主腿^201的处理器20匕可以通过查询感知控制器20化1中保存的备腿^203工作状态,确定是否工作正常。
[0090]1?^的处理器还保存现有的发送心跳报文的流程,在该基础上再增加感知控制器用于发送测试报文。例如:主腿^201的处理器20匕在接收不到主备腿^203发送的心跳报文时,查询主腿^201的感知控制器201。1中保存的备腿^203的工作状态,从而确定备1?^203是否出现故障。
[0091]具体的,本发明实施例图2中所示的感知控制器可以通过以下方式实现。需要说明的是,图3中仅示出了主腿^及备腿且每个腿^中仅示出一个感知控制器。
[0092]如图3所示,腿^中的感知控制器包括可擦除可编程逻辑器件?1~0取'咖胍616 10^10 06^1(36,简称即⑶),继电器,以及接口。还可以包括驱动器,该驱动器用于将信号的电平转化为83485的电平,本发明实施例中采用耵45接口,当然还可以采用其他接口,本发明不作具体限定。图3中所示的取为的信号接收端,IX为的信号发送端;仍^611为用于控制接收的使能端口,1x^611为用于控制发送的使能端0。
[0093]该实施例中所述的可以通过逻辑器件实现,继电器可以通过双向开关或者能够实现两种状态开关功能的器件等等,本发明不作具体限定。
[0094]为了保证传输距离,不同的机框中的感知控制器可以采用交叉网线的方式进行,如图3所示。可以是主腿^中的感知控制器的接口耵45中0111与备腿^中的感知控制器的接口耵45中0113相连,主中的感知控制器的接口耵45中0112与备腿^中的感知控制器的接口耵45中0116相连(图3中并未示出),其中0111和0112用于信号输出,?1113和0116用于信号输入。自定义一种协议,周期性的发送测试报文,该测试报文可以是一个序列。主腿^与备腿^相互信号交互。所述继电器初始默认状态为第二工作状态,即八和〇接通。当主腿^工作正常时,主腿^中的处理器(处理器未在图3中示出)发送控制信号给主的即⑶,在该即⑶的控制下使得主中的继电器的八和8接通,并且将第一测试报文发送到对端所连接的备腿则在备工作正常时,备中的处理器(处理器未在图3中示出)发送控制信号给备的即⑶,在该即⑶的控制下使得备則中的继电器的八和8接通,即使得继电器处于第一工作状态,因此备会通过接口、继电器八和8之间连线接收到主发送的第一测试报文,从而确定主工作状态正常。
[0095]当主腿^中的处理器出现故障,触发向主腿^的即⑶发送中断信号,主腳的在接收到中断信号后则主中的即⑶中断发送第一测试报文给备腿并且控制继电器的八和接通,使得继电器处于环回状态。或者当主腿^掉电时,即⑶中断发送第一测试报文给备并且继电器依靠本身物理特性恢复默认状态(八和接通),即继电器自主转换为第二工作状态,将八和接通。
[0096]则在备工作正常时,备中的处理器(处理器未在图3中示出)发送控制信号给备的即⑶,备的感知控制器向主腿^发送第二测试报文,则第二测试报文在通过主的接口后直接通过继电器的八和连线再通过接口环回给备腿因此备的即⑶会接收到主环回的第二测试报文,因此确定主工作状态异常。
[0097]本发明中的感知控制器还可以由??以来实现。
[0098]基于与上述设备实施例同样的发明构思,本发明实施例还一种集群路由器中的1?口故障的确定方法,所述方法包括:
[0099]感知控制器在所述感知控制器所属的本端1?^工作状态正常时,接收其所属的中的处理器发送的控制信号,在接收到所述控制信号时则向所述感知控制器相连的其他发送用于通知其他本端工作正常的第一测试报文;
[0100]所述感知控制器在所述本端工作故障时,接收所述处理器发送的中断信号,在接收到所述中断信号或者在本端掉电时,中断向与所述感知控制器相连的其他发送所述第一测试报文,以使其他在第一规定时长内未接收到所述第一测试报文时确认所述本端1?^工作状态异常;或者在接收到所述处理器发来的中断信号后或者在本端1? 口掉电时,若接收到相连的其他1?^发送的用于通知本端1?^其他1?^工作正常的第二测试报文时,将所述第二测试报文环回给相连的其他以使其他1?^在接收到环回的第二测试报文时确认所述本端1?^工作状态异常,其中,1?^的工作状态异常包括1?^工作故障或者腿^掉电。
[0101]利用本发明实施例提供的方案,在各个1?11中一端一旦出现故障或者掉电,其它与其相连的能够立即确定对端的工作状态异常,而顺利的进行部署。避免了由于突发大量控制报文时造成的通道拥塞,导致一端腿^无法立即确认对端腿^的工作状态,而影响业务的顺利进行。
[0102]其中感知控制器向与其相连的其他腿^发送第一测试报文的同时,还等待接收测试报文,则所述方法还包括:
[0103]所述感知控制器在所属的1?口工作状态正常时,若接收到其他1?口发送的第二测试报文,则确定其他1?^的工作状态正常;以及
[0104]在第一规定时长内未接收到其他1?[发送的第二测试报文时,确定所述其他工作状态异常;或者接收到其他1叩环回的所述本端1叩发送的第一测试报文时,确定其他的工作状态异常。
[0105]在其中一个实施例中,所述感知控制器在确定其他的工作状态后,将其他的工作状态保存,以使所述处理器在第二规定时长内未接收到任何一个其他发送的心跳报文时,查询与该任何一个其他1?^相连的感知控制器保存的该任何一个其他1?^的工作状态,根据查询到的工作状态确定该任何一个其他的工作状态。
[0106]本发明实施例还提供了一种感知控制器,如图4所示,该感知控制器包括:
[0107]接收模块401,用于在所述感知控制器所属的本端1?^工作状态正常时,接收其所属的中的处理器发送的控制信号;
[0108]发送模块402,用于在所述接收模块401接收到所述控制信号时向所述感知控制器相连的其他1叩发送用于通知其他1?^本端1?^工作正常的第一测试报文;
[0109]所述接收模块401,还用于在所述本端工作故障时,接收所述处理器发送的中断信号;
[0110]所述发送模块402,还用于在所述接收模块401接收到所述中断信号后或者本端1?口掉电时,中断向与所述感知控制器相连的其他1?口发送所述第一测试报文,以使其他1?口在第一规定时长内未接收到所述第一测试报文时确认所述本端1?[工作状态异常;或者还用于在所述接收模块401接收到所述处理器发来的中断信号后或者本端掉电时,若所述接收模块401接收到相连的其他1?^发送的用于通知本端1?^其他1?^工作正常的第二测试报文时,将所述第二测试报文环回给相连的其他以使其他1?^在接收到环回的第二测试报文时确认所述本端1叩工作状态异常,其中,1叩的工作状态异常包括1?口工作故障或者掉电。
[0111]在其中一个实施例中,该感知控制器还包括:
[0112]确定模块,用于在所属的1?[工作状态正常时,若所述接收模块401接收到其他1?口发送的第二测试报文,则确定其他1?^的工作状态正常;以及
[0113]在第一规定时长内未接收到其他1?[发送的第二测试报文时,确定所述其他工作状态异常;或者在所述接收模块401接收到其他1?[环回的所述本端1?[发送的第一测试报文时,确定其他的工作状态异常。
[0114]在其中一个实施例中,该感知控制器还包括:
[0115]保存模块,用于在所述确定模块确定其他的工作状态后,将其他1?^的工作状态保存,以使所述处理器在第二规定时长内未接收到任何一个其他发送的心跳报文时,查询与该任何一个其他1?^相连的感知控制器保存的该任何一个其他的工作状态,根据查询到的工作状态确定该任何一个其他的工作状态。
[0116]本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、⑶-801、光学存储器等)上实施的计算机程序产品的形式。
[0117]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0118]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0119]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0120]尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0121]显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
【权利要求】
1.一种集群路由器中的主控制板MPU,其特征在于,包括处理器,以及与所述处理器分别连接的至少一个感知控制器,其中: 所述处理器,用于在所述处理器所属的本端MPU工作状态正常时,向所述至少一个感知控制器分别发送控制信号;并在所述本端MPU工作故障时,向所述至少一个感知控制器分别发送中断信号; 每个感知控制器,用于在接收到处理器发来的控制信号时,向与感知控制器相连的其他MPU发送用于通知其他MPU本端MPU工作状态正常的第一测试报文,以使其他MPU在接收到所述第一测试报文时确认所述本端MPU工作状态正常;并 在接收到处理器发来的中断信号或者本端MPU掉电时,中断向与感知控制器相连的其他MPU发送所述第一测试报文,以使其他MPU在第一规定时长内未接收到所述第一测试报文时确认所述本端MPU工作状态异常;或者 在接收到处理器发来的中断信号或者本端MPU掉电后,若接收到其他MPU发送的用于通知本端MPU其他MPU工作状态正常的第二测试报文时,将所述第二测试报文环回给相连的其他MPU,以使其他MPU在接收到环回的第二测试报文时确认所述本端MPU工作状态异常;其中,MPU工作状态异常包括MPU掉电或者MPU工作故障。
2.如权利要求1所述的MPU,其特征在于,各个感知控制器,还用于在本端MPU工作状态正常时,若接收到其他MPU发送的第二测试报文时,则确定其他MPU的工作状态正常;以及 在第一规定时长内未接收到其他MPU发送的第二测试报文时,确定所述其他MPU工作状态异常;或者接收到其他MPU环回的所述本端MPU发送的第一测试报文时,确定其他MPU的工作状态异常。
3.如权利要求2所述的MPU,其特征在于,所述感知控制器,还用于将确定的与感知控制器相连的其他MPU的工作状态保存; 所述处理器,还用于向所述其它MPU发送心跳报文,及接收其它MPU发来的心跳报文;并在第二规定时长内未接收到任何一个其他MPU发送的心跳报文时,查询与该任何一个其他MPU相连的感知控制器保存的该任何一个其他MPU的工作状态,根据查询到的工作状态确定该任何一个其他MPU的工作状态。
4.如权利要求1?3任一项所述的MPU,其特征在于,所述感知控制器包括: 可擦除可编程逻辑器件EPLD,继电器,以及接口 ; EPLD,用于在接收到所述处理器发来的控制信号时,控制所述继电器处于第一工作状态,并通过接口向与感知控制器相连的其他MPU发送用于通知其他MPU本端MPU工作状态正常的第一测试报文,以使其他MPU在接收到所述第一测试报文时确认所述本端MPU工作状态正常;并 在接收到处理器发来的中断信号时,控制所述继电器处于第二工作状态,并中断向与感知控制器相连的其他MPU发送所述第一测试报文,以使其他MPU在第一规定时长内未接收到所述第一测试报文时确认所述本端MPU工作状态异常; 所述继电器,还用于在本端MPU掉电后,转换为第二工作状态,若通过接口接收到其他MPU发送的用于通知本端MPU其他MPU工作状态正常的第二测试报文时,将所述第二测试报文通过接口环回给相连的其他MPU,以使其他MPU在接收到环回的第二测试报文时确认所述本端MPU工作状态异常。
5.一种集群路由器,其特征在于,包括:至少两个如权利要求1?4任一所述的MPU ; 其中至少两个MPU中的至少一个MPU为主MPU,除主MPU之外的MPU为备MPU ; 针对任一一个主MPU,该主MPU中包括的每一个感知控制器分别和不同的备MPU中的一个感知控制器相连。
6.如权利要求5所述的集群路由器,其特征在于,所述集群路由器还包括至少两个机框,所述主MPU与备用MPU分别位于不同的机框内。
7.一种集群路由器中的MPU故障的确定方法,其特征在于,所述方法包括: 感知控制器在所述感知控制器所属的本端MPU工作状态正常时,若接收到其所属的MPU中的处理器发送的控制信号,则向所述感知控制器相连的其他MPU发送用于通知其他MPU本端MPU工作正常的第一测试报文; 所述感知控制器在所述本端MPU工作故障时,接收所述处理器发送的中断信号,在接收到所述中断信号或者在本端MPU掉电时,中断向与所述感知控制器相连的其他MPU发送所述第一测试报文,以使其他MPU在第一规定时长内未接收到所述第一测试报文时确认所述本端MPU工作状态异常;或者在接收到所述处理器发来的中断信号后或者在本端MPU掉电时,若接收到相连的其他MPU发送的用于通知本端MPU其他MPU工作正常的第二测试报文时,将所述第二测试报文环回给相连的其他MPU,以使其他MPU在接收到环回的第二测试报文时确认所述本端MPU工作状态异常,其中,MPU的工作状态异常包括MPU工作故障或者MPU掉电。
8.如权利要求7所述的方法,其特征在于,所述方法还包括: 所述感知控制器在所属的MPU工作状态正常时,若接收到其他MPU发送的第二测试报文,则确定其他MPU的工作状态正常;以及 在第一规定时长内未接收到其他MPU发送的第二测试报文时,确定所述其他MPU工作状态异常;或者接收到其他MPU环回的所述本端MPU发送的第一测试报文时,确定其他MPU的工作状态异常。
9.如权利要求8所述的方法,其特征在于,所述方法还包括: 所述感知控制器在确定其他MPU的工作状态后,将其他MPU的工作状态保存,以使所述处理器在第二规定时长内未接收到任何一个其他MPU发送的心跳报文时,查询与该任何一个其他MPU相连的感知控制器保存的该任何一个其他MPU的工作状态,根据查询到的工作状态确定该任何一个其他MPU的工作状态。
10.一种感知控制器,其特征在于,包括: 接收模块,用于在所述感知控制器所属的本端MPU工作状态正常时,接收其所属的MPU中的处理器发送的控制信号; 发送模块,用于在所述接收模块接收到所述控制信号时向所述感知控制器相连的其他MPU发送用于通知其他MPU本端MPU工作正常的第一测试报文;所述接收模块,还用于在所述本端MPU工作故障时,接收所述处理器发送的中断信号;所述发送模块,还用于在所述接收模块接收到所述中断信号后或者本端MPU掉电时,中断向与所述感知控制器相连的其他MPU发送所述第一测试报文,以使其他MPU在第一规定时长内未接收到所述第一测试报文时确认所述本端MPU工作状态异常;或者还用于在所述接收模块接收到所述处理器发来的中断信号后或者本端MPU掉电时,若所述接收模块接收到相连的其他MPU发送的用于通知本端MPU其他MPU工作正常的第二测试报文时,将所述第二测试报文环回给相连的其他MPU,以使其他MPU在接收到环回的第二测试报文时确认所述本端MPU工作状态异常,其中,MPU的工作状态异常包括MPU工作故障或者MPU掉电。
11.如权利要求10所述的感知控制器,其特征在于,还包括: 确定模块,用于在所属的MPU工作状态正常时,若所述接收模块接收到其他MPU发送的第二测试报文,则确定其他MPU的工作状态正常;以及 在第一规定时长内未接收到其他MPU发送的第二测试报文时,确定所述其他MPU工作状态异常;或者在所述接收模块接收到其他MPU环回的所述本端MPU发送的第一测试报文时,确定其他MPU的工作状态异常。
12.如权利要求11所述的感知控制器,其特征在于,还包括: 保存模块,用于在所述确定模块确定其他MPU的工作状态后,将其他MPU的工作状态保存,以使所述处理器在第二规定时长内未接收到任何一个其他MPU发送的心跳报文时,查询与该任何一个其他MPU相连的感知控制器保存的该任何一个其他MPU的工作状态,根据查询到的工作状态确定该任何一个其他MPU的工作状态。
【文档编号】H04L12/24GK104394012SQ201410645934
【公开日】2015年3月4日 申请日期:2014年11月12日 优先权日:2014年11月12日
【发明者】张果, 刘毅, 洪文祥 申请人:北京华为数字技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1