专利名称:双网卡热备冗余方法
技术领域:
本发明涉及一种服务器的双网卡热备冗余方法,用于网络通信设备状态的 监视以及通讯管理,属于通信管理技术领域。
技术背景现今的服务器一般都有两块或多块网卡, 一些操作系统如IBM、 SUN可使用 自带的软件将网卡聚合,达到热备冗余的目的。这些聚合软件属于操作系统的 一部分,需依赖操作系统的支持, 一些软件还需依赖交换机的支持。 发明内容为解决现有技术的不足,本发明的目的在于提供一种工作在应用层的高可 靠性和高可用性的双网卡热备冗余方法,不依赖于具体的操作系统和交换机, 适用于各种UNIX和Linux操作系统。本发明负责网络通信设备状态的监视以及 通讯管理,在还有任意一块网卡设备正常工作的情况下保证系统正常运行且数 据不丢失,从而达到保证网络通信可靠性的目的。为达到上述发明目的,本发明是采用以下的技术方案来实现的 本发明实现的功能包括两部分(1)网卡故障检测功能和(2)双网卡的热 备冗余功能。本发明的技术方案 一种双网卡热备冗余方法,其特征在于包括以下步骤(1) 、在网络拓扑中将每台机器的两块网卡分别接在两台交换机上;(2) 、在网络拓扑中将两台交换机相互级联;(3) 、由网卡监视程序利用工作网卡的IP地址向交换机发送报文并接受应 答,当多个连续的报文在一定的时间间隔后没有得到应答,则判断为工作网卡 或网络设备故障,系统发出告警信号并记录告警状态,并将IP地址切换到备份 网卡;(4) 、当工作网卡恢复正常时,将原IP地址切换回工作网卡。 前述的双卡热备冗余方法,其特征在于在上述的步骤3中,在每个网卡上配置固定IP和服务IP,所述的固定IP是用于网卡监视程序发送报文监视网卡状态的地址,所述的服务IP为系统正常工作时提供给系统使用的地址,两块网 卡上的服务IP可以同时提供给系统使用;进行如下检测切换过程(1) 由网卡监视程序判断服务IP是否在工作网卡上;(2) 若服务IP工作在工作网卡上,则不进行切换,进行循环监视;当此 工作网卡或网络设备工作不正常,多个连续的报文在一定的时间间隔后没有得 到应答时,査看备份网卡的工作状态;若备份网卡工作正常,则将服务IP切换 到备份网卡上运行。前述的双网卡热备冗余方法,其特征在于在上述的步骤4中,服务IP工作 在备份网卡上,网卡监视程序不断判断工作网卡的状态,若工作网卡已正常, 再判断备份网卡;若备份网卡也正常,则等待工作网卡维持正常状态一段时间 后将服务IP切换到工作网卡;若备份网卡不正常,则立即将服务IP切换到工 作网卡。前述的双卡热备冗余方法,其特征在于所述的服务IP和固定IP不在同一 网段上。本发明的优点1、网络故障监测和故障网卡切换都由自动化程序完成,不 需要人工干预;2、适用于各种UNIX操作系统和LINUX操作系统,通用性好;3、 所有功能完全是在应用层实现,不需要借助任何操作系统自带的软件;4、网络 故障后切换速度快,可达到秒级以内;5、故障检测周期、连接切换时间间隔等 参数编程可调;6、固定IP与服务IP不在同一网络地址段,固定IP不会参与 系统的一般业务,不会跟其他机器的服务IP冲突;7、在两块网卡上都有服务 IP,可同时提供给系统使用;8、能够保证无论是主机的网卡故障、网线故障, 或者是一台交换机故障,整个系统仍然能够正常通信,很好地解决了传统双网 技术的交叉故障问题。
图1为网卡故障检测处理流程图;图2为双网热备冗余方法网络拓扑图;图3为传统双网技术"交叉故障"和"单点故障"示意图; 图4为服务IP切换处理流程图。
具体实施方式
以下结合附图对本发明作进一步详细的介绍。本发明涉及的双网卡热备冗余方法是使用工作在应用层的自主开发的软件实现,不依赖于具体的操作系统和交换机,适用于各种UNIX和Linux操作系统。 本发明的双卡热备冗余方法保证了可移植性,能够安全、稳定地运行在IBMAIX、 SunSolaris、 Alpha Tru64、 HPUX、 Linux等操作系统平台上;系统编程语言采 用ANSI C/C++,并符合IEEE P0SIX,2标准。在本发明中,在网络拓扑中将每台机器的两块网卡分别接在两台交换机上, 在网络拓扑中将两台交换机相互级联。本发明首先实现的是网卡故障检测功能, 检测主机和所连网络设备(如交换机)之间的连通性。具备的功能有(1)网 卡及其附属设备(如网线等)是否正常工作的监视;(2)若网卡及其附属设备(如网线等)状态正常则不会有任何动作,当网卡及其附属设备(如网线等) 发生故障时记录该故障状态,并发出告警信号,通知负责人员修复网卡故障。网卡故障检测是使用网卡监视程序采用发送ICMP报文并接收应答实现的。 在系统中设立配置文件,配置了与每块网卡所连网络设备的地址。系统编程语 言实现的自动化程序以守护进程的形式运行,读取配置文件的信息,通过不间 断的向每块网卡所连的网络设备地址发送ICMP报文监控网卡的连通状态。当多 个连续的ICMP报文在一定时间间隔后没有得到应答,将判断为网络设备故障。 处理流程如图l所示。本发明实现的第二部分功能是双网卡的热备冗余机制。双网热备冗余机制 网络拓扑如图2所示。相比与传统的双网机制,图2中两台交换机被级联起来。 通过交换机的级联,可解决传统双网技术带来的"交叉故障"(图3 (a))和"单 点故障"(图3 (b))问题。在图3 (a)中,当主机l网卡l/网线和主机2网卡 2/网线发生故障时,主机1和主机2就不能通信;同样,在图3 (b)中,当主 机1网卡1/网线发生故障时,主机1和主机2也不能通信。而本发明可很好地 解决这个问题。双网卡的热备冗余机制是通过在网卡上配置固定IP和浮动IP,同时在配置 文件中也写入以上两种地址,并同时运行网卡监视程序和网卡切换程序实现的。 浮动IP又称服务IP,是系统正常工作时通信使用的IP。固定IP和服务IP首 先配置在一个指定的网卡上(称为该服务IP的工作网卡),网卡监视程序使用固定IP发送ICMP报文监视网卡的状态,服务IP则提供给系统正常使用。且服 务IP与固定IP不在同一网段上,这样固定IP不会占用服务IP的个数,且能 保证固定IP不会被系统一般业务所使用。当服务IP的工作网卡及其附属设备(如网线等)发生故障时,网卡切换程 序负责把服务IP切换到另一工作在正常状态的网卡(称为该服务IP的备份网 卡)上,但固定IP不动。在服务IP的工作网卡恢复正常一段时间(如3秒) 后,网卡切换程序负责把服务IP切换回到其工作网卡上。处理流程如图4所示。对照附图4,首先由网卡监视程序判断服务IP是否在工作网卡上。若服务IP工作在工作网卡上,当此网卡工作不正常时,査看备份网卡的工 作状态。若备份网卡工作正常则网卡切换程序将服务IP切换到备份网卡运行。若服务IP已经工作在备份网卡上,即发生过从工作网卡到备份网卡的切换。 则网卡监视程序判断此服务IP的工作网卡状态。若工作网卡已正常再判断备份 网卡状态。若备份网卡也正常,则等待工作网卡维持正常状态一段时间后网卡 切换程序再切换服务IP到工作网卡。若备份网卡也不正常则立即切换服务IP 到工作网卡。 工作实例对照附图2,主机1的网卡1设置浮动IP: 192. 168.0. 1,设置固定IP: 192.168.6.1。主机1的网卡2设置浮动IP: 192.168.1.1,设置固定IP: 192. 168. 7. 1。主机2的网卡1设置浮动IP: 192.168.0.2,设置固定IP: 192.168.6.2。 主机2的网卡2设置浮动IP: 192.168.1.2,设置固定IP: 192.168.7.2。 交换机1的地址设置为192. 168. 6. 254。 交换机2的地址设置为192.168. 7. 254。网卡监视程序使用网卡1的固定IP: 192.168.6.1向交换机1的地址 192. 168. 6. 254发送ICMP报文。若在一定时间内能得到响应则认为网络状态正 常。若超过一定时间间隔未收到应答则认为网络状态不正常,网卡切换程序将 网卡l的浮动IP: 192. 168.0. l切换到网卡2上。这时网卡2有三个ip地址192.168. 0. 2192. 168.1. 2192. 168. 0. 1此时的网络故障分两种情况。情况一是主机1的网卡1故障或网线故障。 这种情况下只有主机1的网卡1服务IP被切换到网卡2上。其他机器仍然能够 通过交换机1与在网卡2上的网卡1服务IP通信。整个系统网络通信正常。情 况二是交换机1发生故障。这种情况下所有主机的网卡1服务地址都被切换到 网卡2上。整个系统使用交换机2进行通信,整个系统网络通信正常。当主机1的网卡1的浮动IP: 192. 168. 0. 1被切换到网卡2后,网卡监视 程序仍然继续使用网卡1的固定IP: 192.168.6.1向交换机1的地址 192. 168. 6.254发送ICMP报文。若再次得到应答,且连续一段时间得到应答, 则认为网卡1恢复正常。此时网卡1的切换程序将网卡1的浮动地址从网卡2 切换回网卡l。整个系统网络通信仍然正常。上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式 所获得的技术方案,均落在本发明的保护范围内。
权利要求
1、一种双网卡热备冗余方法,其特征在于包括以下步骤(1)、在网络拓扑中将每台机器的两块网卡分别接在两台交换机上;(2)、在网络拓扑中将两台交换机相互级联;(3)、由网卡监视程序利用工作网卡的IP地址向交换机发送报文并接受应答,当多个连续的报文在一定的时间间隔后没有得到应答,则判断为工作网卡或网络设备故障,系统发出告警信号并记录告警状态,并将IP地址切换到备份网卡;(4)、当工作网卡恢复正常时,将原IP地址切换回工作网卡。
2、 根据权利要求1所述的双卡热备冗余方法,其特征在于在上述的步骤3 中,在每个网卡上配置固定IP和服务IP,所述的固定IP是用于网卡监视程序 发送报文监视网卡状态的地址,所述的服务IP为系统正常工作时提供给系统使 用的地址,两块网卡上的服务IP可以同时提供给系统使用;进行如下检测切换 过程(1) 由网卡监视程序判断服务IP是否在工作网卡上;(2) 若服务IP工作在工作网卡上,则不进行切换,进行循环监视;当此 工作网卡或网络设备工作不正常,多个连续的报文在一定的时间间隔后没有得 到应答时,查看备份网卡的工作状态;若备份网卡工作正常,则将服务IP切换 到备份网卡上运行。
3、 根据权利要求2所述的双网卡热备冗余方法,其特征在于在上述的步骤 4中,服务IP工作在备份网卡上,网卡监视程序不断判断工作网卡的状态,若 工作网卡已正常,再判断备份网卡;若备份网卡也正常,则等待工作网卡维持 正常状态一段时间后将服务IP切换到工作网卡;若备份网卡不正常,则立即将 服务IP切换到工作网卡。
4、 根据权利要求2或3所述的双卡热备冗余方法,其特征在于所述的服务 IP和固定IP不在同一网段上。
全文摘要
本发明涉及一种双网卡热备冗余方法,包括在网络拓扑中将每台机器的两块网卡分别接在两台交换机上;将两台交换机相互级联;由网卡监视程序利用工作网卡的IP地址向交换机发送报文并接受应答,当多个连续的报文在一定的时间间隔后没有得到应答,则判断为工作网卡或网络设备故障,系统发出告警信号并记录告警状态,并将IP地址切换到备份网卡;当工作网卡恢复正常时,将原IP地址切换回工作网卡。本发明在某个工作网卡或网络设备或交换机故障时,可实现自动切换;并且当工作网卡恢复正常时,还可以切换回来,切换程序自动进行,并能进行故障报警和记录,很好地解决了交叉故障的问题。
文档编号H04L1/22GK101404568SQ20081023519
公开日2009年4月8日 申请日期2008年11月17日 优先权日2008年11月17日
发明者徐漫江, 杨志宏, 翟明玉, 葛以踊, 原 高 申请人:国电南瑞科技股份有限公司