一种链路故障处理方法、装置及系统的制作方法
【专利摘要】本发明实施例涉及计算机领域,尤其涉及一种链路故障处理方法、装置及系统,用于实现刀片服务器系统中的链路切换。本发明实施例中,由于第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,如此,刀片服务器中与第一交换系统连接的端口状态也会随之变为失效,进而使刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口,从而使刀片服务器所传输的数据均通过与第二交换系统连接的端口进行传输,从而实现了在第一交换系统上联链路中出现故障时,刀片服务器及时切换与交换系统之间的链路,进一步提升了数据传输的可靠性。
【专利说明】
一种链路故障处理方法、装置及系统
技术领域
[0001]本发明实施例涉及计算机领域,尤其涉及一种链路故障处理方法、装置及系统。
【背景技术】
[0002]随着电信系统的业务飞速发展,用户数量不断的增加,对电信业务系统的稳定性、计算能力、网络延迟等性能要求越来越高,从而要求网络中具备冗余系统,当一条链路出现故障时,可及时实现备用链路的切换,以便于提升系统稳定性,降低网络延迟。
[0003]在电信业发展的初期,由于硬件和系统的集成度不高,一般的业务系统平台均采用塔式服务器或是机架式服务器,随着不断的业务增长,大量的机架式服务器系统和塔式服务器系统占据了机架空间和资源,为了节省资源,电信业务系统现普遍使用刀片服务器系统。刀片服务器系统中可包括多个可用于计算的、热插拔的刀片服务器,每个刀片服务器均通过刀片服务器内部的交换系统与外部系统连接。
[0004]为了实现链路冗余,每个刀片服务器中均通过双网卡绑定方式分别与刀片服务器系统的两个交互系统相连接,当其中一个交换系统与刀片服务器之间的链路出现故障时,刀片服务器会通过与另一个交换系统之间的链路进行数据的传输,以此实现链路冗余,提高数据传输的可靠性。但现有技术中,刀片服务器仅能在刀片服务器与交换系统之间的链路发生故障时,自动切换链路,若其中一个交换器与外部交换设备的链路出现故障,则由于刀片服务器不能检测到该故障,因此依然会将数据从该出现故障的链路传输出去,此时则会造成数据丢失。
[0005]综上,亟需一种链路故障处理方法、装置及系统,用于实现刀片服务器系统中的链路切换,并进一步提升数据传输的可靠性。
【发明内容】
[0006]本发明实施例提供一种链路故障处理方法、装置及系统,用于实现刀片服务器系统中的链路切换,并进一步提升数据传输的可靠性。
[0007]本发明实施例提供一种链路故障处理方法,适用于包括第一交换系统和第二交换系统的刀片服务器系统,该方法包括:
[0008]第一交换系统检测上联链路状态;
[0009]当第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口。
[0010]较佳的,将第一交换系统与所有刀片服务器联接的下联端口状态设置为失效之后,还包括:
[0011]当第一交换系统检测到上联链路状态恢复时,将第一交换系统与刀片服务器联接的下联端口的状态设置为激活。
[0012]较佳的,第一交换系统检测上联链路状态,具体包括:
[0013]第一交换系统检测第一交换系统的上联端口状态,当检测到上联端口状态为失效时,确定上联链路断开。
[0014]较佳的,第一交换系统的上联端口为M个,第一交换系统中设置有N个控制组,N ^ M,每个上联端口对应一个或多个控制组;每个控制组中配置有第一交换系统的部分下联端口,一个下联端口仅配置于一个控制组;
[0015]当第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,具体包括:
[0016]当第一交换系统检测到上联链路断开时,根据断开的上联链路所对应的上联端口确定对应的控制组,将确定出的控制组中的下联端口的状态设置为失效。
[0017]较佳的,还包括:
[0018]第一交换系统连接的刀片服务器的IP地址属于M个网段,同一网段的刀片服务器所连接的第一交换系统的下联端口被设置在同一控制组内。
[0019]由于可检测出第一交换系统中上联链路状态,进一步由于第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,如此,刀片服务器中与第一交换系统连接的端口状态也会随之变为失效,进而使刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口,从而使刀片服务器所传输的数据均通过与第二交换系统连接的端口进行传输,从而实现了在第一交换系统上联链路中出现故障时,刀片服务器及时切换与交换系统之间的链路,进一步提升了数据传输的可靠性。
[0020]本发明实施例提供一种链路故障处理装置,适用于包括第一交换系统和第二交换系统的刀片服务器系统,第一交换系统与第二交换系统分别对应一个链路故障处理装置,第一交换系统对应的链路故障处理装置包括:
[0021]检测模块,用于检测第一交换系统上联链路状态;
[0022]处理模块,用于当检测到第一交换系统的上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口。
[0023]较佳的,处理模块,还用于:
[0024]将第一交换系统与所有刀片服务器联接的下联端口状态设置为失效之后,当检测到第一交换系统上联链路状态恢复时,将第一交换系统与刀片服务器联接的下联端口的状态设置为激活。
[0025]较佳的,检测模块,具体用于:
[0026]检测上联端口状态,当检测到上联端口状态为失效时,确定上联链路断开。
[0027]较佳的,第一交换系统的上联端口为M个,第一交换系统中设置有N个控制组,N ^ M,每个上联端口对应一个或多个控制组;每个控制组中配置有第一交换系统的部分下联端口,一个下联端口仅配置于一个控制组;
[0028]处理模块,具体用于:
[0029]当第一交换系统检测到上联链路断开时,根据断开的上联链路所对应的上联端口确定对应的控制组,将确定出的控制组中的下联端口的状态设置为失效。
[0030]较佳的,第一交换系统连接的刀片服务器的IP地址属于M个网段,同一网段的刀片服务器所连接的第一交换系统的下联端口被设置在同一控制组内。
[0031 ] 由于可检测出第一交换系统中上联链路状态,进一步由于第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,如此,刀片服务器中与第一交换系统连接的端口状态也会随之变为失效,进而使刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口,从而使刀片服务器所传输的数据均通过与第二交换系统连接的端口进行传输,从而实现了在第一交换系统上联链路中出现故障时,刀片服务器及时切换与交换系统之间的链路,进一步提升了数据传输的可靠性。
[0032]本发明实施例提供一种刀片服务器系统,包括第一交换系统和第二交换系统,以及与第一交换系统和第二交换系统连接的刀片服务器;
[0033]第一交换系统,用于检测上联链路状态,当第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效;
[0034]第二交换系统,用于检测上联链路状态,当第二交换系统检测到上联链路断开时,将第二交换系统与刀片服务器联接的下联端口的状态设置为失效;
[0035]刀片服务器,用于在检测到与第一交换系统连接的上联端口失效时,将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口 ;以及,在检测到与第二交换系统连接的上联端口失效时,将与第二交换系统联接的上联端口设置为备端口、将刀片服务器与第一交换系统联接的上联端口设置为主端口。
[0036]本发明实施例中,刀片服务器系统包括第一交换系统和第二交换系统,第一交换系统检测上联链路状态;当第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口。
[0037]由于可检测出第一交换系统中上联链路状态,进一步由于第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,如此,刀片服务器中与第一交换系统连接的端口状态也会随之变为失效,进而使刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口,从而使刀片服务器所传输的数据均通过与第二交换系统连接的端口进行传输,从而实现了在第一交换系统上联链路中出现故障时,刀片服务器及时切换与交换系统之间的链路,进一步提升了数据传输的可靠性。
【附图说明】
[0038]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0039]图1为本发明实施例适用的刀片服务器的系统架构示意图;
[0040]图2为本发明实施例提供的一种链路故障处理方法的流程示意图;
[0041]图3为本发明实施例提供的一种链路故障处理装置的结构示意图;
[0042]图4为本发明实施例提供的另一种链路故障处理装置的结构示意图;
[0043]图5为本发明实施例提供的一种刀片服务器的系统结构示意图。
【具体实施方式】
[0044]本发明实施例提供一种链路故障处理方法、装置及系统,用于实现刀片服务器系统中的链路切换,并进一步提升数据传输的可靠性。
[0045]图1示例性示出了本发明实施例所适用的系统架构。
[0046]如图1所示,刀片服务器系统100包括多个刀片服务器101,两个交换系统,第一交换系统106、第二交换系统107,每个刀片服务器101均通过双网卡绑定方式分别与第一交换系统106、第二交换系统107进行连接,链路119为刀片服务器101与第一交换系统106之间的链路,链路120为刀片服务器101与第二交换系统107之间的链路,每个刀片服务器101分别与第一交换系统106、第二交换系统107进行连接的两个端口分别为端口 102、端口103,端口 102与端口 103分别为主端口和备端口,假设此时端口 102为主端口,端口 103为备端口,则刀片服务器101所传输的数据均通过端口 102进行传输。双网卡绑定的刀片服务器101通过刀片服务器上的端口 102与第一交换系统106上的下联端口 104连接,通过刀片服务器上的端口 103与第二交换系统107上的下联端口 108连接。刀片服务器系统100中的第一交换系统106通过上联端口 105与第一外部交换设备111的下联端口 110连接,刀片服务器系统100中的第二交换系统107通过上联端口 109与第二外部交换设备113的下联端口 112连接。链路117为第一交换系统106与第一外部交换设备111之间的链路,链路118为第二交换系统107与第二外部交换设备113之间的链路,第一外部交换设备111通过上联端口 115与业务系统平台114连接,第二外部交换设备113通过上联端口 116与业务系统平台114连接,第一外部交换设备111与第二外部交换设备113之间通过其它端口进行连接。
[0047]业务系统平台114泛指在电信行业内的相关业务平台,如彩铃业务平台、电信业务支撑平台、电信业务计费系统平台等。
[0048]第一外部交换设备111、第二外部交换设备113,一般分别为三层交换路由设备,第一外部交换设备111、第二外部交换设备113用来实现刀片服务系统100中的刀片服务器101与业务系统平台114之间的信息交互。第一外部交换设备111和第二外部交换设备之间有联接,可用于实现第一外部交换设备111与第二外部交换设备113之间的数据传输。第一外部交换设备111、第二外部交换设备113通常为刀片服务器系统100提供数据交换和路由服务。
[0049]刀片服务器系统100,较佳的,刀片服务器101通过内部模块与刀片服务器系统100的背板总线连接,用于实现网络、电源、外部设备、多媒体等系统的支持,在刀片服务器系统的标准高的机架式机箱内可插装多个卡式的刀片服务器,以此实现刀片服务器系统的高可用性和高密度。
[0050]第一交换系统106、第二交换系统107分别与刀片服务系统中的背板总线相连接,第一交换系统106、第二交换系统107分别与所有刀片服务器101的端口 102、端口 103相连接。
[0051]刀片服务器101是一套整合处理器、内存的服务器,用以运行操作系统和应用程序。硬件实现上,刀片服务器安装在刀片服务器系统的背板总线上,在一个刀片服务器系统100中,一般承载多个刀片服务器101。
[0052]每块刀片服务器101均为一个系统主板。具体实施中,可通过板载硬盘启动刀盘内的操作系统。管理人员可以通过使用系统软件将这些刀片服务器101组成服务器集群。在服务器集群的模式下,所有的刀片服务器可以连接起来,用以提供高速的网络环境,并同时实现资源共享,为相同的用户群服务。每块刀片服务器101均为热拔插模式,可以在线更换刀片服务器,减少维修和故障时间。
[0053]刀片服务器101通过背板总线与第一交换系统106、第二交换系统107相连接,具体应用中,在刀片服务器101中通过绑定软件,刀片服务器101的端口 102、端口 103的主、备状态可以切换,刀片服务器其101通过端口 102、端口 103为业务和系统提供冗余的网络结构。例如,主端口在Linux系统一般为ethO,备端口在Linux系统中一般为ethl。
[0054]本发明实施例中的刀片服务器101通过双网卡绑定的方式绑定到第一交换系统106、第二交换系统107中,第一交换系统106与刀片服务器中的端口 102连接,第二交换系统107与刀片服务器中的端口 103连接,假设现在端口 102为主端口,端口 103现在为备端口,刀片服务器可检测出主端口 102、与备端口 103的工作状态,当检测到主端口 102状态由“激活”转为“失效”时,刀片服务器可将主端口 102状态设置为备端口,将备端口 103状态设置为主端口。从而刀片服务器101中的数据从更新状态后的主端口 103中传输。
[0055]本发明实施例中端口状态“激活”,表示该端口能够正常工作,端口状态“失效”表示该端口不能正常工作。较佳的,可用标志位表示端口的不同状态。刀片服务器101中的数据永远都从端口标志位表示为主端口的端口传输,因此更改刀片服务器101中的端口的主、备状态,即更改刀片服务器101中的数据传输链路。
[0056]为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0057]基于图1所示的系统架构,图2示出了本发明实施例提供的一种链路故障处理方法,适用于包括第一交换系统和第二交换系统的刀片服务器系统,该方法包括:
[0058]步骤201,第一交换系统检测上联链路状态;
[0059]步骤202,当第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口。
[0060]本发明实施例中,刀片服务器系统包括两个交换系统,第一交换系统与第二交换系统的名称仅用于区别两个交换系统,而并非特指某一个交换系统。本发明实施例中,刀片服务器正在进行数据传输的端口为主端口,与刀片服务器的主端口连接的交换系统可为刀片服务器系统中的任一交换系统,本发明实施例中假设目前与刀片服务器的主端口连接的交换系统为第一交换系统。也可假设目前与刀片服务器的主端口连接的交换系统为第二交换系统,下述实施例中以目前与刀片服务器的主端口连接的交换系统为第一交换系统为例进行介绍。
[0061]基于上述假设,本发明实施例中当第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,此时第一交换系统与刀片服务器连接的下联链路断开,刀片服务器可检测到此时与第一交换系统连接的主端口不能正常工作,即处于失效状态,则刀片服务器将该与第一交换系统连接的端口的标志位进行更改,将当前与第一交换系统连接的主端口更改为备端口,将与第二交换系统连接的备端口的更改为主端口,此时,刀片服务器中的数据从主端口,并通过与主端口连接的第二交换系统进行传输。
[0062]较佳的,在上述步骤中,第一交换系统检测上联链路状态的同时,第二交换系统也在检测上联链路状态,且它们是相互独立的,即第一交换系统检测上联链路状态的工作与第二交换系统也在检测上联链路的工作是分开进行的,不会相互造成干扰。且当第二交换系统检测到上联链路断开时,将第二交换系统与刀片服务器联接的下联端口的状态设置为失效,此动作与第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效也是分别独立进行的,不会相互之间造成干扰。
[0063]较佳的,第一交换系统可周期性检测上联链路状态,第二交换系统周期性检测上联链路状态。
[0064]在上述步骤202中,将第一交换系统与所有刀片服务器联接的下联端口状态设置为失效之后,刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口,刀片服务器中的数据通过刀片服务器的主端口以及与主端口连接的第二交换系统进行传输。若在此时,第一交换系统检测到上联链路状态恢复时,则将第一交换系统与刀片服务器联接的下联端口的状态设置为激活,即表示第一交换系统与刀片服务器连接的下联端口也可正常工作,但是由于此时刀片服务器与第二交换系统连接的传输链路仍旧在正常工作,因此,此时刀片服务器仍旧正常传输数据,并不会将此时正在正常工作的与第二交换系统连接的主端口状态进行变更,直到刀片服务器检测到与第二交换系统连接的主端口不能正常工作时,才会将与第二交换系统连接的端口从主?而口切换至备?而口,将与弟一父换系统连接的纟而口从备?而口切换至主?而口,以使刀片服务器传输的数据通过主端口以及与主端口连接的第一交换系统进行传输。
[0065]另一方面,假设当前刀片服务器通过主端口,以及与主端口连接的第二交换系统进行数据传输,若第二交换系统检测到第二交换系统的上联链路断开,则将第二交换系统与刀片服务器联接的下联端口的状态设置为失效,且刀片服务器检测到刀片服务器与第二交换系统连接的主端口状态变更为失效,则刀片服务器将与第二交换系统连接的端口的状态从主端口更改为备端口,将与第一交换系统连接的端口的状态更改为主端口。以便实现网络冗余,在网络链路出现故障时,及时切换至另一条链路,以提高数据传输的安全性。
[0066]较佳的,刀片服务器系统中第一交换系统和第二交换系统中的每个交换系统的上联端口均可为多个,较佳的,本发明实施例中以第一交换系统为例进行介绍,本领域技术人员可知,第二交换系统与第一交换中的设置相同。
[0067]基于上述前提,以第一交换系统进行说明,较佳的,第一交换系统的上联端口为M个,第一交换系统中设置有N个控制组,N多Μ,每个上联端口对应一个或多个控制组;每个控制组中配置有第一交换系统的部分下联端口,一个下联端口仅配置于一个控制组。较佳的,第一交换系统连接的刀片服务器的IP地址属于M个网段,同一网段的刀片服务器所连接的第一交换系统的下联端口被设置在同一控制组内。具体来说,在一些应用场景下,处于同一网段的刀片服务器执行同一业务,将第一交换系统上连接的执行同一业务的刀片服务器的端口对应设置在同一控制组中,当第一交换系统检测到上联链路断开时,根据断开的上联链路所对应的上联端口确定对应的控制组,将确定出的控制组中的下联端口的状态设置为失效。
[0068]以第一交换系统为例,介绍第一交换系统内的配置流程。第一交换系统加电,处于正常工作状态,第一交换系统内部开启协议端口,以便于允许对第一交换系统进行配置。将第一交换系统中的上联链路的上联端口配置为需要监控的监控端口,并对应为第一交换系统与刀片服务器连接的下联端口配置控制组,并配置所监控的上联端口与控制组的对应关系O
[0069]同样的,第二交换系统的上联端口为M个,第二交换系统中设置有N个控制组,N ^ M,每个上联端口对应一个或多个控制组;每个控制组中配置有第二交换系统的部分下联端口,一个下联端口仅配置于一个控制组。较佳的,第二交换系统连接的刀片服务器的IP地址属于M个网段,同一网段的刀片服务器所连接的第二交换系统的下联端口被设置在同一控制组内。当第二交换系统检测到上联链路断开时,根据断开的上联链路所对应的上联端口确定对应的控制组,将确定出的控制组中的下联端口的状态设置为失效。
[0070]以第一交换系统为例,举个例子,第一交换系统的上联端口假设为两个,并假设第一交换系统与刀片服务器系统连接的下联端口有14个,且依据刀片服务器的IP地址的网段,将不同刀片服务器所连接的第一交换系统的下联端口被设置在同一控制组内,例如,假设14个刀片服务器的IP地址分别属于M个网段,则相应设置M个控制组,将同一网段的刀片服务器所连接的第一交换系统的下联端口被设置在同一控制组内。每个上联端口对应一个或多个控制组,具体来说,刀片服务器通过第一交换系统向上传输的数据可能通过两个端口来实现,例如,假设刀片服务器I至7,是通过第一交换系统的上联端口 I来进行数据传输,而刀片服务器8至14是通过第一交换系统的上联端口 2来进行数据传输,假设刀片服务器I至7分别属于控制组I和控制组2,而刀片服务器8至14则属于控制组3,则上联端口 I对应控制组I和控制组2 ;上联端口 2对应控制组3。
[0071]基于上述假例子,当第一交换系统检测到上联链路断开时,根据断开的上联链路所对应的上联端口确定对应的控制组,将确定出的控制组中的下联端口的状态设置为失效。当上联端口 I出现故障时,上联端口对应的控制组I和控制组2内配置的第一交换系统的下联端口的状态均需设置为失效状态,此时控制组I和控制组2分别对应刀片服务I至7,因此,此时刀片服务器I至7均将与第一交换系统连接的端口设置为备端口,将与第二交换系统连接的端口设置为主端口。
[0072]具体来说,本发明实施例中可检测第一交换系统的上联链路状态,第一交换系统检测第一交换系统的上联端口状态,当检测到上联端口状态为失效时,确定上联链路断开。
[0073]刀片服务器系统中的第一交换系统和第二交换系统中的上联端口和下联端口均存在两种工作状态,即失效和激活,端口失效,表示该端口不能正常工作,以第一交换系统为例进行介绍,第一交换系统中的上联端口不能正常工作的情况有以下一种或几种的组合:
[0074]如图1中所示,第一交换系统106与第一外部交换设备111进行联接的第一交换系统上的上联端口 105不能正常工作、第一交换系统106不能正常工作、第一交换系统106与第一外部交换设备111进行联接的上联链路117不能正常工作、第一交换系统106与第一外部交换设备111进行联接的第一外部交换设备111上的端口 110出现故障、第一外部交换设备111出现故障。
[0075]当发生上述状态时,第一交换系统中的上联端口均不能正常工作,此时第一交换系统即检测到第一交换系统中的上联端口工作状态为失效,即确定第一交换系统检测到上联链路断开,此时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口。
[0076]具体来说,结合图1,当第一交换系统106与刀片服务器101联接的下联端口 104的状态为失效、第一交换系统106与刀片服务器101联接的链路119发生故障、刀片服务器101与第一交换系统106联接的刀片服务器101上的端口 102发生失效时,刀片服务器101均能确定刀片服务器101与第一交换系统106联接的刀片服务器101上的端口 102发生失效,从而刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口以使刀片服务器中传输的数据能够成功通过主端口进行传输。
[0077]另一方面,具体来说,本发明实施例中可检测第二交换系统的上联链路状态,第二交换系统检测第二交换系统的上联端口状态,当检测到上联端口状态为失效时,确定上联链路断开。
[0078]刀片服务器系统中的第一交换系统和第二交换系统中的上联端口和下联端口均存在两种工作状态,即失效和激活,端口失效,表示该端口不能正常工作,以第二交换系统为例进行介绍,第二交换系统中的上联端口不能正常工作的情况有以下一种或几种的组合:
[0079]如图1中所示,第二交换系统107与第二外部交换设备113进行联接的第二交换系统上的上联端口 109不能正常工作、第二交换系统107不能正常工作、第二交换系统107与第二外部交换设备113进行联接的上联链路118不能正常工作、第二交换系统107与第二外部交换设备113进行联接的第二外部交换设备113上的端口 112出现故障、第二外部交换设备113出现故障。
[0080]当发生上述状态时,第二交换系统中的上联端口均不能正常工作,此时第二交换系统即检测到第二交换系统中的上联端口工作状态为失效,即确定第二交换系统检测到上联链路断开,此时,将第二交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发刀片服务器将与第二交换系统联接的上联端口设置为备端口、将刀片服务器与第一交换系统联接的上联端口设置为主端口。
[0081]具体来说,结合图1,当第二交换系统107与刀片服务器101联接的下联端口 108的状态为失效、第二交换系统107与刀片服务器101联接的链路120发生故障、刀片服务器101与第二交换系统107联接的刀片服务器101上的端口 103发生失效时,刀片服务器101均能确定刀片服务器101与第二交换系统107联接的刀片服务器101上的端口 103发生失效,从而刀片服务器将与第二交换系统联接的上联端口设置为备端口、将刀片服务器与第一交换系统联接的上联端口设置为主端口以使刀片服务器中传输的数据能够成功通过主端口进行传输。
[0082]具体来说,第一交换系统和第二交换系统均可通过进行配置,以分别监控第一交换系统和第二交换系统中的上联端口。较佳的,可通过串行接口外接一终端模块,并通过该终端模块对监控日志进行查看。第一交换系统及第二交换系统中的设置、端口的状态变更等均是基于最基本的网络管理协议进行的。
[0083]从上述内容可以看出:本发明实施例中,刀片服务器系统包括第一交换系统和第二交换系统,第一交换系统检测上联链路状态;当第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口。
[0084]由于可检测出第一交换系统中上联链路状态,进一步由于第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,如此,刀片服务器中与第一交换系统连接的端口状态也会随之变为失效,进而使刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口,从而使刀片服务器所传输的数据均通过与第二交换系统连接的端口进行传输,从而实现了在第一交换系统上联链路中出现故障时,刀片服务器及时切换与交换系统之间的链路,进一步提升了数据传输的可靠性。
[0085]基于相同构思,本发明实施例提供一种链路故障处理装置,适用于包括第一交换系统和第二交换系统的刀片服务器系统,第一交换系统与第二交换系统分别对应一个链路故障处理装置,如图3所示,第一交换系统对应的链路故障处理装置包括:
[0086]检测模块301,用于检测第一交换系统上联链路状态;
[0087]处理模块302,用于当检测到第一交换系统的上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口。
[0088]较佳的,处理模块302,还用于:
[0089]将第一交换系统与所有刀片服务器联接的下联端口状态设置为失效之后,当检测到第一交换系统上联链路状态恢复时,将第一交换系统与刀片服务器联接的下联端口的状态设置为激活。
[0090]较佳的,检测模块301,具体用于:
[0091]检测上联端口状态,当检测到上联端口状态为失效时,确定上联链路断开。
[0092]较佳的,第一交换系统的上联端口为M个,第一交换系统中设置有N个控制组,N ^ M,每个上联端口对应一个或多个控制组;每个控制组中配置有第一交换系统的部分下联端口,一个下联端口仅配置于一个控制组;
[0093]处理模块302,具体用于:
[0094]当第一交换系统检测到上联链路断开时,根据断开的上联链路所对应的上联端口确定对应的控制组,将确定出的控制组中的下联端口的状态设置为失效。
[0095]较佳的,第一交换系统连接的刀片服务器的IP地址属于M个网段,同一网段的刀片服务器所连接的第一交换系统的下联端口被设置在同一控制组内。
[0096]从上述内容可以看出:本发明实施例中,刀片服务器系统包括第一交换系统和第二交换系统,第一交换系统检测上联链路状态;当第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口。
[0097]由于可检测出第一交换系统中上联链路状态,进一步由于第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,如此,刀片服务器中与第一交换系统连接的端口状态也会随之变为失效,进而使刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口,从而使刀片服务器所传输的数据均通过与第二交换系统连接的端口进行传输,从而实现了在第一交换系统上联链路中出现故障时,刀片服务器及时切换与交换系统之间的链路,进一步提升了数据传输的可靠性。
[0098]基于相同构思,本发明实施例提供一种链路故障处理装置,适用于包括第一交换系统和第二交换系统的刀片服务器系统,第一交换系统与第二交换系统分别对应一个链路故障处理装置,如图4所示,第二交换系统对应的链路故障处理装置包括:
[0099]检测模块401,用于检测第二交换系统上联链路状态;
[0100]处理模块402,用于当检测到第二交换系统的上联链路断开时,将第二交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发刀片服务器将与第二交换系统联接的上联端口设置为备端口、将刀片服务器与第一交换系统联接的上联端口设置为主端口。
[0101]较佳的,处理模块402,还用于:
[0102]将第二交换系统与所有刀片服务器联接的下联端口状态设置为失效之后,当检测到第二交换系统上联链路状态恢复时,将第二交换系统与刀片服务器联接的下联端口的状态设置为激活。
[0103]较佳的,检测模块401,具体用于:
[0104]检测上联端口状态,当检测到上联端口状态为失效时,确定上联链路断开。
[0105]较佳的,第二交换系统的上联端口为M个,第二交换系统中设置有N个控制组,N ^ M,每个上联端口对应一个或多个控制组;每个控制组中配置有第二交换系统的部分下联端口,一个下联端口仅配置于一个控制组;
[0106]处理模块402,具体用于:
[0107]当第二交换系统检测到上联链路断开时,根据断开的上联链路所对应的上联端口确定对应的控制组,将确定出的控制组中的下联端口的状态设置为失效。
[0108]较佳的,第二交换系统连接的刀片服务器的IP地址属于M个网段,同一网段的刀片服务器所连接的第二交换系统的下联端口被设置在同一控制组内。
[0109]从上述内容可以看出:本发明实施例中,刀片服务器系统包括第一交换系统和第二交换系统,第二交换系统检测上联链路状态;当第二交换系统检测到上联链路断开时,将第二交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发刀片服务器将与第二交换系统联接的上联端口设置为备端口、将刀片服务器与第一交换系统联接的上联端口设置为主端口。
[0110]由于可检测出第二交换系统中上联链路状态,进一步由于第二交换系统检测到上联链路断开时,将第二交换系统与刀片服务器联接的下联端口的状态设置为失效,如此,刀片服务器中与第二交换系统连接的端口状态也会随之变为失效,进而使刀片服务器将与第二交换系统联接的上联端口设置为备端口、将刀片服务器与第一交换系统联接的上联端口设置为主端口,从而使刀片服务器所传输的数据均通过与第一交换系统连接的端口进行传输,从而实现了在第二交换系统上联链路中出现故障时,刀片服务器及时切换与交换系统之间的链路,进一步提升了数据传输的可靠性。
[0111]基于相同构思,本发明实施例提供一种刀片服务器系统,如图5所示,包括第一交换系统501和第二交换系统502,以及与第一交换系统和第二交换系统连接的刀片服务器503 ;
[0112]第一交换系统501,用于检测上联链路状态,当第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效;
[0113]第二交换系统502,用于检测上联链路状态,当第二交换系统检测到上联链路断开时,将第二交换系统与刀片服务器联接的下联端口的状态设置为失效;
[0114]刀片服务器503,用于在检测到与第一交换系统连接的上联端口失效时,将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口 ;以及,在检测到与第二交换系统连接的上联端口失效时,将与第二交换系统联接的上联端口设置为备端口、将刀片服务器与第一交换系统联接的上联端口设置为主端
□ O
[0115]从上述内容可以看出:本发明实施例中,刀片服务器系统包括第一交换系统和第二交换系统,第一交换系统检测上联链路状态;当第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口。当第二交换系统检测到上联链路断开时,将第二交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发刀片服务器将与第二交换系统联接的上联端口设置为备端口、将刀片服务器与第一交换系统联接的上联端口设置为主端口。
[0116]由于可检测出第一交换系统中上联链路状态,进一步由于第一交换系统检测到上联链路断开时,将第一交换系统与刀片服务器联接的下联端口的状态设置为失效,如此,刀片服务器中与第一交换系统连接的端口状态也会随之变为失效,进而使刀片服务器将与第一交换系统联接的上联端口设置为备端口、将刀片服务器与第二交换系统联接的上联端口设置为主端口,从而使刀片服务器所传输的数据均通过与第二交换系统连接的端口进行传输,从而实现了在第一交换系统上联链路中出现故障时,刀片服务器及时切换与交换系统之间的链路,进一步提升了数据传输的可靠性。
[0117]且由于可检测出第二交换系统中上联链路状态,进一步由于第二交换系统检测到上联链路断开时,将第二交换系统与刀片服务器联接的下联端口的状态设置为失效,如此,刀片服务器中与第二交换系统连接的端口状态也会随之变为失效,进而使刀片服务器将与第二交换系统联接的上联端口设置为备端口、将刀片服务器与第一交换系统联接的上联端口设置为主端口,从而使刀片服务器所传输的数据均通过与第一交换系统连接的端口进行传输,从而实现了在第二交换系统上联链路中出现故障时,刀片服务器及时切换与交换系统之间的链路,进一步提升了数据传输的可靠性。
[0118]本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0119]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0120]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0121]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0122]尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0123]显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
【主权项】
1.一种链路故障处理方法,适用于包括第一交换系统和第二交换系统的刀片服务器系统,其特征在于,该方法包括: 第一交换系统检测上联链路状态; 当所述第一交换系统检测到上联链路断开时,将所述第一交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发所述刀片服务器将与所述第一交换系统联接的上联端口设置为备端口、将所述刀片服务器与第二交换系统联接的上联端口设置为主端口。2.如权利要求1所述的方法,其特征在于,所述将所述第一交换系统与所有刀片服务器联接的下联端口状态设置为失效之后,还包括: 当所述第一交换系统检测到上联链路状态恢复时,将所述第一交换系统与刀片服务器联接的下联端口的状态设置为激活。3.如权利要求1所述的方法,其特征在于,所述第一交换系统检测上联链路状态,具体包括: 第一交换系统检测所述第一交换系统的上联端口状态,当检测到所述上联端口状态为失效时,确定所述上联链路断开。4.如权利要求1所述的方法,其特征在于,所述第一交换系统的上联端口为M个,所述第一交换系统中设置有N个控制组,N >M,每个上联端口对应一个或多个控制组;每个控制组中配置有所述第一交换系统的部分下联端口,一个下联端口仅配置于一个控制组; 所述当所述第一交换系统检测到上联链路断开时,将所述第一交换系统与刀片服务器联接的下联端口的状态设置为失效,具体包括: 当所述第一交换系统检测到上联链路断开时,根据断开的上联链路所对应的上联端口确定对应的控制组,将确定出的控制组中的下联端口的状态设置为失效。5.如权利要求4所述的方法,其特征在于,还包括: 所述第一交换系统连接的刀片服务器的IP地址属于M个网段,同一网段的刀片服务器所连接的所述第一交换系统的下联端口被设置在同一控制组内。6.一种链路故障处理装置,适用于包括第一交换系统和第二交换系统的刀片服务器系统,其特征在于,所述第一交换系统与所述第二交换系统分别对应一个链路故障处理装置,所述第一交换系统对应的链路故障处理装置包括: 检测模块,用于检测第一交换系统上联链路状态; 处理模块,用于当检测到第一交换系统的上联链路断开时,将所述第一交换系统与刀片服务器联接的下联端口的状态设置为失效,以触发所述刀片服务器将与所述第一交换系统联接的上联端口设置为备端口、将所述刀片服务器与第二交换系统联接的上联端口设置为主端口。7.如权利要求6所述的装置,其特征在于,所述处理模块,还用于: 将所述第一交换系统与所有刀片服务器联接的下联端口状态设置为失效之后,当检测到第一交换系统上联链路状态恢复时,将所述第一交换系统与刀片服务器联接的下联端口的状态设置为激活。8.如权利要求6所述的装置,其特征在于,所述检测模块,具体用于: 检测上联端口状态,当检测到所述上联端口状态为失效时,确定所述上联链路断开。9.如权利要求6所述的装置,其特征在于,所述第一交换系统的上联端口为M个,所述第一交换系统中设置有N个控制组,N >M,每个上联端口对应一个或多个控制组;每个控制组中配置有所述第一交换系统的部分下联端口,一个下联端口仅配置于一个控制组; 所述处理模块,具体用于: 当所述第一交换系统检测到上联链路断开时,根据断开的上联链路所对应的上联端口确定对应的控制组,将确定出的控制组中的下联端口的状态设置为失效。10.如权利要求9所述的装置,其特征在于, 所述第一交换系统连接的刀片服务器的IP地址属于M个网段,同一网段的刀片服务器所连接的所述第一交换系统的下联端口被设置在同一控制组内。11.一种刀片服务器系统,其特征在于,包括第一交换系统和第二交换系统,以及与所述第一交换系统和所述第二交换系统连接的刀片服务器; 第一交换系统,用于检测上联链路状态,当所述第一交换系统检测到上联链路断开时,将所述第一交换系统与刀片服务器联接的下联端口的状态设置为失效; 所述第二交换系统,用于检测上联链路状态,当所述第二交换系统检测到上联链路断开时,将所述第二交换系统与刀片服务器联接的下联端口的状态设置为失效; 所述刀片服务器,用于在检测到与所述第一交换系统连接的上联端口失效时,将与所述第一交换系统联接的上联端口设置为备端口、将所述刀片服务器与第二交换系统联接的上联端口设置为主端口 ;以及,在检测到与所述第二交换系统连接的上联端口失效时,将与所述第二交换系统联接的上联端口设置为备端口、将所述刀片服务器与第一交换系统联接的上联端口设置为主端口。
【文档编号】H04L12/24GK105827426SQ201510009774
【公开日】2016年8月3日
【申请日】2015年1月8日
【发明人】刘丽萍, 刘志萍, 李莹, 黄梅英, 任昱光, 孙启昌, 杨振有, 李颖
【申请人】中国移动通信集团河南有限公司