N+1冗余备份方法、处理板和多处理板系统的制作方法

文档序号:7613108阅读:229来源:国知局
专利名称:N+1冗余备份方法、处理板和多处理板系统的制作方法
技术领域
本发明涉及通信领域,并且尤其涉及多处理板系统中的N+1冗余备份方法、切换方法及相关的处理板、多处理板系统和无线网络控制器。
背景技术
现有通信系统设备中通常备有多个处理板,并且为了增强通信系统的可靠性和可用性,一般会实现N+1冗余备份。即,有N个处理板正常工作,一个处理板用作备份板。在现有的多处理板系统中,如果某一个处理板发生故障,则有可能会出现以下三种情况情况一稳定的呼叫不能在备份板上恢复。
情况二稳定的呼叫能在备份板上恢复,备份板上有较大的内存以存储所有激活板上的呼叫上下文数据。当切换发生后,如果要求任一个原先激活的处理板重起成功后也担当备份板的角色,那么就要求每一个处理板都有较大的内存,以便获得较完整的备份功能,因此成本较高。当切换发生后,如果不要求任一个原先激活的处理板重起成功后担当备份板的角色,那么第一次切换后就不再有备份板。此时如果要求有备份板,则必须在故障板重起成功后与备份板进行第二次切换,让备份板重新担当备份板的角色。这样在只需要一个板有较大内存的情形下,需要两次切换,因此处理比较复杂。
情况三稳定的呼叫能在备份板上恢复,需要一个公共内存板存储所有处理板的呼叫上下文。在这种情况下需要增加专用的公共内存板,由此成本会较大,并且公共内存可能成为性能瓶颈。
综上所述,在现有的多处理板系统中都无法在保持稳定呼叫的同时经济地实现N+1冗余备份。

发明内容
本发明的一个目的在于提供一种新的N+1冗余备份方法和多处理板系统,以便能够在保持稳定呼叫的同时经济地并且高可靠性地实现N+1冗余备份。
为了实现上述目的,本发明提供了一种多处理板的N+1冗余备份方法,所述多处理板包括N块激活板和一块备份板,其中N为自然数,所述方法包括以下步骤通过地址映射,将所述N块激活板组成一个逻辑环,使得所述逻辑环中的每一块激活板将所述激活板上的运行时数据中的一部分数据备份到所述激活板在所述逻辑环中的下一块激活板。
本发明还提供一种处理板,包括一个主内存,由所述处理板上的处理器访问,用于存储所述处理板上的运行时数据;以及一个备份内存,由另一块处理板上的处理器访问,用于备份所述另一块处理板上的至少一部分运行时数据。
本发明还提供一种多处理板系统,包括多块处理板,其中有N块激活板和一块备份板,N为自然数,每块处理板包括一个主内存,由该处理板上的处理器访问,用于存储该处理板上的运行时数据;以及一个备份内存,由另一块处理板上的处理器访问,用于备份该另一块处理板上的至少一部分运行时数据;其中,所述N块激活板,通过地址映射,组成一个逻辑环,使得所述逻辑环中的每一块激活板所访问的备份地址空间映射到所述激活板在所述逻辑环中的下一块激活板上的备份内存。
本发明还提供一种无线网络控制器,包括根据本发明的多处理板系统。
在利用根据本发明的方法和装置实现N+1冗余备份时,不要求处理板具有很大的内存,也不需要公共内存板,因此成本较小,同时也避免了性能瓶颈,从而可以高可靠性地和低成本地实现N+1冗余备份。
结合附图阅读本发明实施方式的详细描述后,本发明的其他特点和优点将变得更加清楚。


图1是根据本发明一个实施例的多处理板系统在切换前的系统配置图示意图;图2是根据本发明一个实施例的N+1冗余备份方法例子的流程图;以及图3是图1的多处理板系统在切换后的系统配置图。
具体实施例方式
下面结合附图详细描述本发明的具体实施方式

图1是根据本发明一个实施例的多处理板系统在切换前的系统配置图示意图。如图1所示,该系统包括N+1个处理板(其中N为自然数),其物理板号依次为1、2、……、N、N+1,其中板号为N+1的处理板(以下简称为板N+1)为备份板(在图中用阴影表示),其余的处理板为激活板。这些处理板通过快速以太网交换板相连接。为了提高可靠性,每个处理板有两个网口,分别连接到两个互为备份的以太网交换板。
需要说明的是,备份板只是一个逻辑角色,它可以由某一个特定槽位上的板承担,或者可以由初始化时最后一个完成启动的板承担。
如图1所示,每一个板上的物理内存分为两部分主内存和备份内存。其中,主内存只能由本板处理器访问,用来存储软件程序和运行时数据,运行时数据包括临时数据和全局数据,稳定的呼叫上下文属于全局数据,主内存要求的空间较大。而备份内存只能由另一个激活板访问,但不能被本板访问,只用来存储另一个激活板上运行时数据中的稳定的呼叫上下文,要求的空间较小。在3G无线资源控制器实施例中,主内存与备份内存的空间比例优选地约为10∶1。但是应当理解,也可以采用其它的比例。
每个处理板上的处理器有两种地址空间,一种是通常的主地址,通过操作系统或特定的内存管理机制映射到本板的主内存,另一种是备份地址,通过基于快速以太网交换技术的地址映射软件,映射到其他板的备份内存。备份板(即板N+1)上的备份地址可被配置成映射到任一个处理板上的备份内存。
每个激活板上的软件程序在其主内存上的主地址空间运行,主内存中包括软件程序和所有的运行时数据,运行时数据中的临时变量不需要备份,但其中的全局变量保存了稳定的呼叫上下文(包括状态机),当这些全局变量在主内存里被软件程序更新时,同时也被软件程序保存在该激活板的备份地址里。
如图1所示,这N+1个处理板采用循环备份和地址映射方案。具体来说,通过基于快速以太网交换的地址映射软件,板1上的稳定呼叫上下文备份在板2上的备份内存里,板1上的备份地址映射到板2上的备份内存里,板2上的稳定呼叫上下文备份在板3上的备份内存里,板2上的备份地址映射到板3上的备份内存里,……,板N-1上的稳定呼叫上下文备份在板N上的备份内存里,板N-1上的备份地址映射到N上的备份内存里,板N上的稳定呼叫上下文备份在板1上的备份内存里,板N上的备份地址映射到板1上的备份内存里。
其中地址映射软件是一种很底层的备份内存管理软件。在每个处理板上都存储有地址映射软件,其上层是执行备份的应用程序,下层是快速以太网交换协议。地址映射软件利用快速以太网交换作为传输技术,提供标准的API(应用编程接口)给上层软件程序调用,使得激活板上的软件程序访问用于备份该激活板的下一个激活板上的备份内存就象访问该激活板上的本地内存一样方便。但是,由于目前的快速以太交换的技术局限,某一激活板2访问其下一个激活板上的备份内存的速度还无法达到直接访问该激活板上本地内存的速度,所以备份内存只存储稳定的呼叫上下文,而不存储包括临时数据在内的全部运行时数据,这样也能基本满足绝大多数情况下恢复控制稳定呼叫的要求。
应当注意的是,本文中所说的备份地址并不是严格意义上的CPU指令和数据地址,而是应用层面上的虚拟地址,但也映射到一个真正的物理内存。
在正常情况下,一个处理板上的软件程序在其主内存里运行,并将运行时数据中的稳定的呼叫上下文通过备份地址存储到另一个激活板上的备份内存里,当这个处理板发生故障,而成为故障板时,备份板接替时,备份板的备份地址将通过基于快速以太网交换技术的底层软件,映射到另一个激活板上的备份内存。
在根据本发明的系统中,还包括一个主控板(在图1中未显示),它负责板的故障检测并修改地址映射的配置参数。由于在根据本发明的系统中采用了底层平台提供的成熟的板故障检测方法,所以主控板可以是图1中的任一个处理板(这时主控板是一种逻辑角色),或者主控板也可以是单独的以太交换板。
支持先进的通信计算机架构(ATCA,Advanced Telecom ComputerArchitecture)标准的开发平台中都提供有标准的硬件故障检测功能。在一个优选实施例中,主控板是一个激活的以太交换板。主控板上的底层检测软件通过心跳检测等方式能及时检测到每个被监视板的硬件和软件故障。故障检测在底层平台软件中实现,以标准API的方式通知以太交换板上的上层管理程序,管理程序将修改地址映射参数并激活备份板。当主控板检测到某一激活板发生故障时,上层管理程序将立即通知备份板,配置其备份地址映射参数,使其备份地址切换映射到用于备份该故障板的下一激活板的备份内存,并且激活备份板。
需要注意的是,在根据本发明的系统中,这N+1个板中每个板上的主内存中的软件程序和地址分段是完全相同的,只是运行时数据不同。
图2是根据本发明一个实施例的N+1冗余备份方法例子的流程图。如图2所示,该方法在步骤S200开始。
在步骤S201,对多处理板系统进行初始配置,对N+1个处理板进行循环备份和地址映射。
循环备份和地址映射是由每个板上的地址映射软件和应用程序实现的。缺省的配置参数使板1的备份地址映射到板2的备份内存,板2的备份地址映射到板3的备份内存,……,板N的备份地址映射到板1的备份内存,并且每个板的应用程序备份数据到本板的备份地址,从而实现循环备份。主控板已知所有的配置信息。初始配置后的系统如图1所示,在此就不再详述了。
然后,在步骤S202,判断主控板是否检测到激活板的故障。如前所述,主控板检测激活板的故障可以采用底层平台提供的成熟的板故障检测方法,也可以采用现有技术中其它的板故障检测方法。
一旦在步骤S202中确定主控板检测到某一激活板发生故障,处理流程就转入步骤S203。
在步骤S203,主控板将会立即配置备份板上底层软件里的地址映射参数,使其备份地址映射到用于备份该故障板的下一个激活板(以下简称下一个板)的备份内存。
接下来,在步骤S204,该故障板的逻辑板号不再映射到其物理板号,而是切换映射到备份板的物理板号,所有原来发往故障板的消息都将发向备份板。
在一个优选实施例中,上述步骤是由主控板通过修改故障板的逻辑板号到物理板号的映射表(在每个处理板上均存储有逻辑板号到物理板号的映射表)来实现的。
然后,在步骤S205,激活备份板,以使备份板开始接替发生故障的那个激活板,并且其主内存里的软件程序开始激活准备运行。
随后,在步骤S206,备份板开始恢复并继续故障板上的呼叫处理,并且同时存储新的稳定的呼叫上下文到备份地址里。在这一步中,备份板的备份地址与主地址开始同步,备份地址里存储的稳定的呼叫上下文在很短的时间内被同步输出到备份板的主内存里,同步完毕后主内存里的全局数据将保存稳定的呼叫上下文(包含完整的状态机信息),该备份板上的软件程序将在主地址空间里基于主内存里的全局数据处理输入消息,这样备份板就能恢复并继续故障板上的呼叫处理,并且同时存储新的稳定的呼叫上下文到备份地址里。
接着,在步骤S207,该备份板的备份内存中将存储故障板的上一个板(以下简称上一个板)上的稳定的呼叫上下文。
在此需要说明的是,该上一个板的地址映射参数不必修改。因为备份板的逻辑板号与原来发生故障的那个激活板的逻辑板号相同,所以上一个板只需要向原来的逻辑板号发送数据,而不必关心物理板号的变化。在这个切换过程中,上一个板原来存储在故障板上的稳定的呼叫上下文丢失了,但是只要在一个较短的时间里上一个板不发生故障,新的稳定的呼叫上下文就将会在备份板上保存完整。并且,由于在某一激活板发生故障后的一个较短时间里其上一个板也发生故障的概率非常低,所以上述问题可以基本不予考虑。
然后,在步骤S208,发生故障的那个激活板重起成功后,用作新的备份板,处于备用状态。
最后,在步骤S209,该方法的处理流程结束。
图3是图1的多处理板系统在切换后的系统配置图。在图3所示的例子中,假设板2发生故障,所以用备份板N+1替代板2,板2在恢复后,作为新的备份板。下面描述这一切换过程的细节。
首先假设该实施例中主控板是激活的以太交换板。主控板上的底层检测软件通过心跳检测等方式能及时检测到每个被监视板的硬件和软件故障,并且以标准API的方式通知以太交换板上的上层管理程序。当然,也可以采用其它的通知方式。
在主控板检测到板2发生故障后,其上的上层管理程序会立即通知备份板(即板N+1),并配置备份板的地址映射参数,使其备份地址映射到板3的备份内存。并且,板2的逻辑板号不再映射到其物理板号,而切换映射到备份板N+1的物理板号,所有原来发往板2的消息将发向备份板N+1,板N+1开始接替发生故障的板2,板N+1主内存里的软件程序开始激活准备运行。然后,板N+1的备份地址与主地址开始同步,板3的备份内存里存储的稳定的呼叫上下文在很短的时间内被同步输出到备份板N+1的主内存里的全局变量区,同步完毕后主内存里的全局数据将保存了稳定的呼叫上下文(包含完整的状态机信息),该备份板N+1上的软件程序将在主地址空间里,基于主内存里的全局数据开始处理输入消息,这样备份板N+1能恢复并继续故障板2上的呼叫处理,并且以后继续存储新的稳定的呼叫上下文到板3的备份地址里。同时,板N+1的备份内存开始存储板1上的稳定的呼叫上下文。最后板2重起成功后,变为新的备份板。
如图3所示,在根据图2所示的方法进行切换之后,板1上的稳定呼叫上下文备份在板N+1上的备份内存里,板1上的备份地址映射到板N+1上的备份内存里,板N+1上的稳定呼叫上下文备份在板3上的备份内存里,板N+1上的备份地址映射到板3上的备份内存里。所有从其他板发给原来板2的消息都被路由到板N+1,板2重起成功后用作备份板。其它板的循环备份和地址映射与图1中的相同,因此就不再详述。
在多处理板系统中,通过采用根据本发明的N+1冗余备份方法和系统,可以实现稳定呼叫的恢复,并且也不要求处理板具备很大的内存,从而可以在保持低成本的同时实现N+1冗余备份,并保持稳定的呼叫。
对于本领域技术人员来说,根据本发明的多处理板系统显然可以应用于所有要求高可靠性的电信网络设备中,用于恢复控制面信令(对于速度更快的用户面业务,不必要恢复)。例如,本发明可以应用在第3代通信系统的无线网络控制器中。
虽然以上结合附图描述了本发明的优选实施方式,但是显然本领域技术人员可以在所附权利要求的范围内做出各种变形或修改。
权利要求
1.一种多处理板的N+1冗余备份方法,所述多处理板包括N块激活板和一块备份板,其中N为自然数,所述方法包括以下步骤通过地址映射,将所述N块激活板组成一个逻辑环,使得所述逻辑环中的每一块激活板将所述激活板上的运行时数据中的一部分数据备份到所述激活板在所述逻辑环中的下一块激活板。
2.根据权利要求1的方法,在一块激活板因发生故障而成为一块故障板后,所述方法还包括以下步骤通过地址映射,用所述备份板在所述逻辑环中替换所述故障板;以及激活所述备份板,使得所述备份板,基于原先由所述故障板在所述逻辑环中的下一块激活板上备份的数据,继续所述故障板的操作。
3.根据权利要求2的方法,还包括以下步骤将原先由所述故障板在所述逻辑环中的下一块激活板上备份的数据同步到所述备份板上。
4.根据权利要求3的方法,还包括以下步骤将所述故障板重起,作为新的备份板。
5.根据权利要求1的方法,还包括以下步骤所述逻辑环中的每一块激活板将所述激活板上的运行时数据存储在本地。
6.根据权利要求5的方法,其中在每块激活板上备份的数据是所述激活板在所述逻辑环中的上一块激活板上的稳定呼叫上下文数据。
7.一种处理板,包括一个主内存,由所述处理板上的处理器访问,用于存储所述处理板上的运行时数据;以及一个备份内存,由另一块处理板上的处理器访问,用于备份所述另一块处理板上的至少一部分运行时数据。
8.根据权利要求7的处理板,其中所述主内存被映射到所述处理板主地址空间,并且所述备份内存被映射到所述另一块处理板的备份地址空间。
9.根据权利要求7的处理板,其中所述备份内存用于备份所述另一块处理板上的稳定呼叫上下文数据。
10.一种多处理板系统,包括多块处理板,其中有N块激活板和一块备份板,N为自然数,每块处理板包括一个主内存,由该处理板上的处理器访问,用于存储该处理板上的运行时数据;以及一个备份内存,由另一块处理板上的处理器访问,用于备份所述另一块处理板上的至少一部分运行时数据;其中,所述N块激活板,通过地址映射,组成一个逻辑环,使得所述逻辑环中的每一块激活板所访问的备份地址空间映射到所述激活板在所述逻辑环中的下一块激活板上的备份内存。
11.根据权利要求10的多处理板系统,还包括一个控制板,用于在一块激活板因发生故障而成为一块故障板后,通过地址映射,使所述备份板在所述逻辑环中替换所述故障板,然后,激活所述备份板,使得所述备份板,基于原先由所述故障板在所述逻辑环中的下一块激活板上备份的数据,继续所述故障板的操作。
12.根据权利要求11的多处理板系统,其中所述备份板还将原先由所述故障板在所述逻辑环中的下一块激活板上备份的数据同步到所述备份板上的主内存中。
13.根据权利要求12的多处理板系统,其中所述控制板还将所述故障板重起,作为新的备份板。
14.根据权利要求10的多处理板系统,其中所述逻辑环中的每一块激活板在其主内存中存储所述激活板上的呼叫上下文数据。
15.根据权利要求14的多处理板系统,其中所述逻辑环中的每块激活板在其备份内存中备份所述激活板在所述逻辑环中的上一块激活板上的稳定呼叫上下文数据。
16.根据权利要求11的多处理板系统,其中所述N块激活板中的一块板起所述控制板的作用。
17.一种无线网络控制器,包括如权利要求10到16中任一项所述的多处理板系统。
全文摘要
本发明提供一种多处理板的N+1冗余备份方法,所述多处理板包括N块激活板和一块备份板,其中N为自然数,所述方法包括以下步骤通过地址映射,将所述N块激活板组成一个逻辑环,使得所述逻辑环中的每一块激活板将所述激活板上的运行时数据中的一部分数据备份到所述激活板在所述逻辑环中的下一块激活板。本发明还提供一种处理板,包括一个主内存,由所述处理板上的处理器访问,用于存储所述处理板上的运行时数据;以及一个备份内存,由另一块处理板上的处理器访问,用于备份所述另一块处理板上的至少一部分运行时数据。本发明还提供相关的多处理板系统和无线网络控制器。根据本发明,处理板不需具有大内存,无需公共内存板,减小了成本。
文档编号H04L1/22GK1845468SQ20051002496
公开日2006年10月11日 申请日期2005年4月7日 优先权日2005年4月7日
发明者孔令山, 王春波, 夏斌, 顾凯, 张云 申请人:上海贝尔阿尔卡特股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1