专利名称::一种接管故障元数据服务器的方法、装置及系统的制作方法
技术领域:
:本发明涉及分布式文件存储领域,尤其涉及一种接管故障元数据服务器(MetadataServer,MDS)的方法、装置及系统。技术背景近几年来分布式文件系统得到大力发展,开始广泛地应用于存储解决方案中。由于分布式文件系统管理的文件数量非常大,经常出现上亿个文件或几十亿个文件,需要用专门的元数据服务器进行管理。随着存储规模的扩大和云存储(云存储是指通过集群(Cluster)应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统)的发展,单个元数据服务器已经不能满足用户需求,需要用多个元数据服务器组成的集群来管理这些元数据。在实现本发明过程中,发明人发现现有技术中至少存在如下问题传统的分布式文件系统分为三个部分客户端、元数据服务器、对象存储服务器(ObjectStorageServer,OSS)。元数据服务器管理整个系统所有元数据。如果元数据出现故障,分布式文件系统将不能工作。随着分布式文件系统的增大,元数据服务器的数量会越来越多,元数据服务器出现故障的概率也越来越大,系统的可靠性难以得到保证。因而,如何提高元数据服务器的可靠性就成为了分布式文件存储的发展瓶颈。
发明内容本发明实施例提供一种接管故障元数据服务器的方法、装置及系统,以提高元数据服务器的可靠性,进而提高整个分布式文件存储系统的可靠性。一方面,本发明实施例提供了一种接管故障元数据服务器的方法,应用于元数据服务器集群(MDSCluster),所述元数据服务器包括本地元数据树、邻居元数据树;所述本地元数据树用于对本地文件系统进行管理;所述邻居元数据树对应于邻居元数据服务器的本地元数据树;所述方法包括当本地元数据服务器对应的邻居元数据服务器工作正常时,所述本地元数据服务器通过所述邻居元数据树对所述邻居元数据服务器中的本地元数据树进行实时镜像,以对所述邻居元数据服务器中的本地文件系统进行备份;当所述邻居元数据服务器出现故障时,所述本地元数据服务器通过对实时镜像的邻居元数据树进行管理,以接管出现故障的所述邻居元数据服务器。另一方面,本发明实施例提供了一种接管故障元数据服务器的装置,应用于元数据服务器集群,所述元数据服务器包括本地元数据树、邻居元数据树;所述本地元数据树用于对本地文件系统进行管理,所述邻居元数据树对应于邻居元数据服务器的本地元数据树;所述装置包括实时镜像单元,用于当本地元数据服务器对应的邻居元数据服务器工作正常时,通过所述邻居元数据树对所述邻居元数据服务器中的本地元数据树进行实时镜像,以对所述邻居元数据服务器中的本地文件系统进行备份;故障接管单元,用于当所述邻居元数据服务器出现故障时,所述本地元数据服务器通过对实时镜像的邻居元数据树进行管理,以接管出现故障的所述邻居元数据服务器。再一方面,本发明实施例提供了一种接管故障元数据服务器的系统,上述系统包括客户端集群,用于对元数据服务器集群中的元数据服务器的元数据和对象存储服务器集群(OSSCluster)中对象存储服务器存储的对象进行访问;元数据服务器集群,所述元数据服务器集群中的每个元数据服务器包括本地元数据树、邻居元数据树;所述本地元数据树用于对本地文件系统进行管理,所述邻居元数据树对应于邻居元数据服务器的本地元数据树;用于当本地元数据服务器对应的邻居元数据服务器工作正常时,通过所述邻居元数据树对所述邻居元数据服务器中的本地元数据树进行实时镜像,以对所述邻居元数据服务器中的本地文件系统进行备份;还用于当所述邻居元数据服务器出现故障时,所述本地元数据服务器通过对实时镜像的邻居元数据树进行管理,以接管出现故障的所述邻居元数据服务器;对象存储服务器集群,用于对应于所述元数据服务器集群中的一个元数据服务器,存储所述元数据服务器中的元数据对应的对象。上述技术方案具有如下有益效果在采用本地元数据服务器对应的邻居元数据服务器工作正常时,通过上述本地元数据服务器中的邻居元数据树对上述邻居元数据服务器中的元数据进行实时镜像;当上述邻居元数据服务器出现故障时,上述本地元数据服务器通过对实时镜像的邻居元数据树进行管理,以接管出现故障的上述邻居元数据服务器的技术手段,所以达到了提高元数据服务器的可靠性,进而提高了整个分布式文件存储系统的可靠性。为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例一种接管故障元数据服务器的方法流程图;图2为本发明实施例一种森林文件系统示意图;图3为本发明实施例正常情况下的工作示意图;图4为本发明实施例森林文件系统的森林框架与元数据树的关系示意图;图5为本发明实施例某个元数据服务器发生故障和接管情况下的工作示意图6为本发明实施例一种接管故障元数据服务器的装置结构示意图;图7为本发明实施例一种接管故障元数据服务器的系统组成示意图;图8为本发明实施例集群情况下正常情况的示意图9为本发明实施例集群情况下某个元数据服务器发生故障和接管情况下的示意图10为本发明实施例集群情况下故障排除和数据恢复情况下的示意图。具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。实施例一如图l所示,为本发明实施例一种接管故障元数据服务器的方法流程图,应用于元数据服务器集群,所述元数据服务器包括本地元数据树、邻居元数据树;所述本地元数据树用于对本地文件系统进行管理;所述邻居元数据树对应于邻居元数据服务器的本地元数据树;上述方法包括如下步骤S101,当本地元数据服务器对应的邻居元数据服务器工作正常时,所述本地元数据服务器通过所述邻居元数据树对所述邻居元数据服务器中的本地元数据树进行实时镜像,以对所述邻居元数据服务器中的本地文件系统进行备份。S102,当所述邻居元数据服务器出现故障时,所述本地元数据服务器通过对实时镜像的邻居元数据树进行管理,以接管出现故障的所述邻居元数据服务器。上述方法还通过生成森林框架保存所述元数据服务器集群中所述本地元数据树和所述邻居元数据树的分布情况,以及所述本地元数据树和所述邻居元数据树的相互关系。当所述本地元数据服务器对应的邻居元数据服务器工作正常时,所述邻居元数据树属性为"镜像",所述本地元数据树属性为"读写";当所述邻居元数据服务器出现故障时,所述邻居元数据树的属性从"镜像"变为"读写"。可选的,当所述邻居元数据服务器出现故障后长期没恢复时,所述邻居元数据树变为本地元数据树,对出现故障的所述邻居元数据服务器的本地文件系统进行管理;所述方法还包括,创建第二邻居元数据树,所述第二邻居元数据树对应于第二邻居元数据服务器的本地元数据树,用于对所述第二邻居元数据服务器通过镜像进行备份;所述第二邻居元数据服务器的本地元数据树原先与所述邻居元数据服务器的邻居元数据树对应。当所述邻居元数据服务器的故障恢复后,恢复所述本地元数据服务器和所述邻居元数据树中的所述元数据树对应关系为所述邻居元数据服务器正常时的关系。本发明上述方法实施例的技术方案具有如下有益效果因为采用本地元数据服务器对应的邻居元数据服务器工作正常时,通过上述本地元数据服务器中的邻居元数据树对上述邻居元数据服务器中的元数据进行实时镜像;当上述邻居元数据服务器出现故障时,上述本地元数据服务器通过对实时镜像的邻居元数据树进行管理,以接管出现故障的上述邻居元数据服务器的技术手段,所以提高了元数据服务器的可靠性。实施例二为了接管故障元数据服务器,提高元数据服务器的可靠性,本发明实施例采用"森林文件系统"来对元数据进行组织和管理。森林文件系统是一个全局的文件系统,参见图2,包括森林框架(Framework)和元数据树(MetadataTree)。森林框架描述了整个系统中所有元数据树的分布情况,以及元数据树的相互关系(如父子关系、兄弟关系、邻居关系等)。同时,还为每一个元数据树分配一个本地文件系统。一个森林框架可以管理多个元数据树。元数据树是森林文件系统的一棵数据树,由元数据服务器的本地文件系统组成。一棵元数据树由一个元数据服务器管理。元数据的读写查询等操作都通过元数据树来完成。元数据树的操作权限可以为以下几种(1)"读写"(Read-Write):可以进行读写查找等操作;(2)"只读"(Read-Only):只有读权限,不能进行写和其他操作;(3)"镜像"(Mirror-Only):只有镜像权限,用于数据的镜像,不能进行读写等操作。此处所谓镜像,是指实时读取并拷贝邻居树的数据。元数据树根据存放位置的不同,还可以分为本地元数据树(LocalMetadataTree,简称本地树)和邻居元数据树(NeighborMetadataTree,简称邻居树)。其中,本地树是指该树对应的元数据服务器在本地存放的元数据树;邻居树是指元数据服务器的数据树除了保存在本地外,同时还镜像到邻居元数据服务器上,即为一个保存在某一MDS上的元数据树,为另一元数据树的镜像。当本地树出现故障后,由邻居树来接管。正常情况下,邻居树只具有"镜像"权限,没有"读写"权限。接管时,邻居树被激活,并转换成本地树,具有本地树的全部权限。参见图2,为本发明实施例森林文件系统示意图,在图2中,包括3个元数据树,分别为元数据树l、元数据树2和元数据树3。每个元数据树都由一个元数据服务器来管理,分别为元数据服务器MDS-1、MDS-2和MDS-3。为了对元数据进行冗余备份和故障恢复,可以将这些树组成一个环形,称为"树环(TreeRing)",即在每个元数据服务器上都设置两个树,一个本地树,一个邻居树;每个本地树对应于一个元数据树,每个邻居树对应于相邻的元数据树,并且都是一一对应,不会出现一个本地树或邻居树对应多个元数据树的情况,因此,可以将这些树之间的对应关系看成是一个树环。参见图2,图中所示的元数据服务器与本地树、邻居树的关系如下表1所示表1元数据服务器与本地树、邻居树的关系表<table>tableseeoriginaldocumentpage11</column></row><table>由表1可知,元数据数据服务器MDS-1中本地树对应的是元数据树1,邻居树对应的是元数据树3;同时,元数据树3也是MDS-3中的本地树,即MDS-1中的邻居树对应的是MDS-3中的本地树,如果MDS-3出现故障,则MDS-1通过对邻居树(对应于元数据树3)进行管理来实现对出现故障的MDS-3的接管。这里需要说明的是,上述方案为本发明实施例优选的方案,在实际应用中也可以设置多个邻居树(如2个、或者3个)来对多个元数据树进行管理,其管理方法可以参考本发明实施例中的相关步骤。参见图3,本发明实施例接管故障元数据服务器的流程图,步骤如下S301、构建森林框架;森林框架描述了整个系统中所有元数据树的分布情况,以及所有元数据树的相互关系(如父子关系、兄弟关系、邻居关系等),其实质是建立在本地文件系统之上的一个超级文件系统,具有根节点、目录结构和分区结构;但不负责文件的管理和操作。同时,可以设置每一个分区分别对应于一棵元数据树,如下表2所示,为分区与元数据树对应关系表表2分区与元数据树对应关系表元数据服务器路径MDS0/MDS1/hom6MDS2/usrMDS3/etcMDS4/var在表2中,元数据服务器MDSO对应的分区为"/",即根路径;MDS1对应的路径为"/home";其余元数据服务器具体对应的路径可以参见表2。需要说明的是,一个目录可以对应几个元数据服务器。S302、构建元数据树;参见图4,为本发明实施例森林文件系统森林框架与元数据树的关系示意图,其中,(1)构建本地元数据树如图4所示,为本发明实施例森林文件系统的森林框架与元数据树的关系示意图。元数据树是森林文件系统的一棵子树,本质上是元数据服务器上的本地文件系统。一棵元数据树由一个元数据服务器管理。元数据的读、写、查询等操作都是通过元数据树来完成。元数据树是本地文件系统,由本地的根节点(Rootnode)、索引节点(inode)、数据块(Datablock)三层树型结构组成。只不过,这个本地文件系统仅仅是整个森林文件系统的一个分区。(2)构建元数据的邻居树元数据的邻居树是其他元数据服务器的本地树的镜像。在元数据服务器正常的情况下,邻居树只具有"镜像"权限,只用来实时镜像邻居数据,而没有"读写"权限。邻居元数据树对应于邻居元数据服务器的本地元数据树,对应关系可以参考表l中的对应关系。此外,如果本地树太大时,可以通过森林框架在新的元数据服务器上再创建一棵空树,然后将本地树的部分目录结构迁移到空树上,形成新的元数据服务器的本地树,同时,也可以创建邻居树,以及将这些树与其他元数据服务器上的树对应起来。5303、本地元数据邻居树对应的邻居元数据服务器工作正常时,通过所述邻居元数据树对邻居元数据服务器中的本地元数据树进行实时镜像;例如,在图2所示的系统中,MDS-1中的邻居树对MDS-3中的本地树进行实时镜像,MDS-2中的邻居树对MDS-1中的本地树进行实时镜像,MDS-3中的邻居树对MDS-2中的本地树进行实时镜像。通过实时镜像,可以对邻居元数据服务器的本地文件系统进行备份。5304、当邻居元数据服务器出现故障时,激活邻居元数据树,用来管理邻居元数据服务器;这里的邻居元数据服务器可以是邻居元数据树对应的元数据服务器,例如参见图2,在MDS-1中,邻居元数据服务器是指邻居元数据树对应的元数据服务器,即元数据服务器3(与元数据树3对应)。当邻居元数据服务器出现故障,例如元数据服务器3(MDS-3)出现故障时,将邻居元数据树的属性从"镜像"变为"读写",此时,MDS-1可对邻居元数据树3进行读写操作,来对元数据树3对应的元数据服务器3进行管理。可选地,还可以包括步骤5305、当邻居元数据服务器长期没有恢复,邻居元数据树转变为本地元数据树,并生成新的邻居树对第二邻居元数据服务器进行管理;例如,参见图2和图5,当MDS-1出现故障且长期没有恢复时,实时镜像MDS-1的本地树的MDS-2的邻居树变为本地树-2,接管MDS-1并对其进行元数据管理。同时,还创建新的邻居树来对第二邻居元数据服务器进行管理,这里的第二邻居元数据服务器的本地树原先与出现故障的邻居元数据服务器的邻居树对应。例如,MDS-2生成新的邻居树对MDS-3的本地树进行实时镜像(MDS-3原先对应MDS-1的邻居树),MDS-3生成新的邻居树-2对MDS-2的本地树-2进行实时镜像。可选地,还可以包括步骤S306、当邻居元数据服务器恢复时,恢复所述本地元数据服务器和所述邻居元数据树中的所述元数据树对应关系为所述邻居元数据服务器正常时的关系。如果邻居元数据服务器恢复正常,则恢复改变后的各服务器树的对应关系为邻居元数据服务器正常时的关系。例如,将图5所示的对应关系恢复为图2所示的对应关系。本发明实施例通过提出了一种通过邻居树来接管故障元数据服务器的方法,当本地元数据服务器对应的邻居元数据服务器工作正常时,利用本地元数据服务器的邻居树实时镜像邻居元数据服务器的本地树;当邻居元数据服务器出现故障,由本地元数据服务器的邻居树来接管。本发明实施例提出了一种关于元数据的"森林文件系统--本地树--邻居树"的设计方法。森林文件系统定义了各个分区、分区和元数据服务器的对应关系、本地树间的关系、邻居树的关系等等。本发明实施例技术方案带来的有益效果大大提高分布式文件系统的元数据的可靠性。本发明实施例将大大提高分布式文件系统的元数据的可靠性,如果元数据服务器集群中某个元数据服务器出现故障(只要同一时间不出现两个元数据服务器故障),系统就可以通过邻居树来接管出现故障的邻居元数据服务器,以来保证系统的可用性。只要同一时间不出现两个元数据服务器故障(在实际应用中,同一时间两个元数据服务器发生故障的出现概率也极其微小),在极限情况下(除最后一个元数据服务器正常外,其余所有元数据服务器都发生故障),分布式文件系统依然可用。这种设计方法大大提高了元数据的可靠性。实施例三如图6所示,为本发明实施例一种接管故障元数据服务器的装置结构示意图,应用于元数据服务器集群,所述元数据服务器包括本地元数据树、邻居元数据树;所述本地元数据树用于对本地文件系统进行管理,所述邻居元数据树对应于邻居元数据服务器的本地元数据树;所述装置70包括实时镜像单元701,用于当本地元数据服务器对应的邻居元数据服务器工作正常时,通过所述邻居元数据树对所述邻居元数据服务器中的本地元数据树进行实时镜像,以对所述邻居元数据服务器中的本地文件系统进行备份;故障接管单元702,用于当所述邻居元数据服务器出现故障时,所述本地元数据服务器通过对实时镜像的邻居元数据树进行管理,以接管出现故障的所述邻居元数据服务器。可选的,所述装置70还包括森林框架生成单元,生成森林,所述森林框架用于保存所述元数据服务器集群中所述本地元数据树和所述邻居元数据树的分布情况,以及所述本地元数据树和所述邻居元数据树的相互关系。所述实时镜像单元还用于所述本地元数据服务器对应的邻居元数据服务器工作正常时,设置所述邻居元数据树属性为"镜像",所述本地元数据树属性为"读写";当所述邻居元数据服务器出现故障时,将所述邻居元数据树的属性从"镜像"改变为"读写"。可选的,所述故障接管单元702还用于当所述邻居元数据服务器出现故障后长期没恢复时,所述邻居元数据树变为本地元数据树,对出现故障的所述邻居元数据服务器的本地文件系统进行管理;所述故障接管单元702还用于创建第二邻居元数据树,所述第二邻居元数据树对应于第二邻居元数据服务器的本地元数据树,用于对所述第二邻居元数据服务器通过镜像进行备份;所述第二邻居元数据服务器的本地元数据树原先与所述邻居元数据服务器的邻居元数据树对应。所述装置70还包括故障恢复单元,用于恢复所述本地元数据服务器和所述邻居元数据树中的所述元数据树对应关系为所述邻居元数据服务器正常时的关系。本发明上述装置实施例的技术方案达到了提高元数据服务器的可靠性,进而提高了整个分布式文件存储系统的可靠性。实施例四如图7所示,为本发明实施例一种接管故障元数据服务器的系统组成示意图,上述系统包括客户端集群81,用于对元数据服务器集群82中的元数据服务器的元数据和对象存储服务器集群83中对象存储服务器存储的对象进行访问;元数据服务器集群82,所述元数据服务器集群中的每个元数据服务器包括本地元数据树、邻居元数据树;所述本地元数据树用于对本地文件系统进行管理,所述邻居元数据树对应于邻居元数据服务器的本地元数据树;用于当本地元数据服务器对应的邻居元数据服务器工作正常时,通过所述邻居元数据树对所述邻居元数据服务器中的本地元数据树进行实时镜像,以对所述邻居元数据服务器中的本地文件系统进行备份;还用于当所述邻居元数据服务器出现故障时,所述本地元数据服务器通过对实时镜像的邻居元数据树进行管理,以接管出现故障的所述邻居元数据服务器;对象存储服务器集群83,用于对应于所述元数据服务器集群中的一个元数据服务器,存储所述元数据服务器中的元数据对应的对象。下面在上述系统的基础上结合附图进行具体形象的说明1)正常情况如图8所示,为本发明实施例集群情况下正常情况的示意图。本发明实施例的分布式存储系统分为三大部分客户端集群、元数据服务器集群、对象存储服务器集群。元数据服务器集群由多个元数据服务器组成。每个元数据服务器负责一个对象存储服务器集群。2)发生故障和接管如图9所示,为本发明实施例集群情况下某个元数据服务器发生故障和接管情况下的示意图。当元数据服务器集群中某个元数据服务器发生故障,系统将通过本发明实施例提出的方法,由邻居元数据服务器来接替故障节点。由于邻居元数据服务器上邻居树已经保存了故障节点的全部最新的元数据和目录结构,因而只需要在邻居元数据服务器上将邻居树激活,由"只读"变为"读写",就可以接管故障元数据服务器,保证系统继续可用。3)故障排除和数据恢复如图IO所示,为本发明实施例集群情况下故障排除和数据恢复情况下的示意图。当元数据服务器故障己经排除,并且重新加入集群中,系统将通过本发明实施例提出的方法,将本地元数据服务器上最新的邻居树发送给新节点。新节点根据邻居树来建立本地树,同时将邻居元数据服务器上的本地树备份到本地,作为邻居树。本发明实施例上述系统的技术方案达到了提高元数据服务器的可靠性,进而提高整个了分布式文件存储系统的可靠性。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,包括上述全部或部分步骤,所述的存储介质,如ROM/RAM、磁盘、光盘等。以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而己,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。权利要求1、一种接管故障元数据服务器的方法,其特征在于,应用于元数据服务器集群,所述元数据服务器包括本地元数据树、邻居元数据树;所述本地元数据树用于对本地文件系统进行管理;所述邻居元数据树对应于邻居元数据服务器的本地元数据树;所述方法包括当本地元数据服务器对应的邻居元数据服务器工作正常时,所述本地元数据服务器通过所述邻居元数据树对所述邻居元数据服务器中的本地元数据树进行实时镜像,以对所述邻居元数据服务器中的本地文件系统进行备份;当所述邻居元数据服务器出现故障时,所述本地元数据服务器通过对实时镜像的邻居元数据树进行管理,以接管出现故障的所述邻居元数据服务器。2、如权利要求1所述方法,其特征在于,还包括通过生成森林框架保存所述元数据服务器集群中所述本地元数据树和所述邻居元数据树的分布情况,以及所述本地元数据树和所述邻居元数据树的相互关系。3、如权利要求2所述方法,其特征在于所述本地元数据服务器对应的邻居元数据服务器工作正常时,所述邻居元数据树属性为"镜像",所述本地元数据树属性为"读写";当所述邻居元数据服务器出现故障时,所述邻居元数据树的属性从"镜像"变为"读写"。4、如权利要求3所述方法,其特征在于,所述方法还包括当所述邻居元数据服务器出现故障后长期没恢复时,所述邻居元数据树变为本地元数据树,对出现故障的所述邻居元数据服务器的本地文件系统进行管理;所述方法还包括,创建第二邻居元数据树,所述第二邻居元数据树对应于第二邻居元数据服务器的本地元数据树,用于对所述第二邻居元数据服务器通过镜像进行备份;所述第二邻居元数据服务器的本地元数据树原先与所述邻居元数据服务器的邻居元数据树对应。5、如权利要求1所述方法,其特征在于当所述邻居元数据服务器的故障恢复后,恢复所述本地元数据服务器和所述邻居元数据树中的所述元数据树对应关系为所述邻居元数据服务器正常时的关系。6、一种接管故障元数据服务器的装置,其特征在于,应用于元数据服务器集群,所述元数据服务器包括本地元数据树、邻居元数据树;所述本地元数据树用于对本地文件系统进行管理,所述邻居元数据树对应于邻居元数据服务器的本地元数据树;所述装置包括实时镜像单元,用于当本地元数据服务器对应的邻居元数据服务器工作正常时,通过所述邻居元数据树对所述邻居元数据服务器中的本地元数据树进行实时镜像,以对所述邻居元数据服务器中的本地文件系统进行备份;故障接管单元,用于当所述邻居元数据服务器出现故障时,所述本地元数据服务器通过对实时镜像的邻居元数据树进行管理,以接管出现故障的所述邻居元数据服务器。7、如权利要求6所述装置,其特征在于,所述装置还包括森林框架生成单元,用于生成森林框架,所述森林框架用于保存所述元数据服务器集群中所述本地元数据树和所述邻居元数据树的分布情况,以及所述本地元数据树和所述邻居元数据树的相互关系。8、如权利要求7所述装置,其特征在于,所述实时镜像单元还用于所述本地元数据服务器对应的邻居元数据服务器工作正常时,设置所述邻居元数据树属性为"镜像",所述本地元数据树属性为"读写";当所述邻居元数据服务器出现故障时,将所述邻居元数据树的属性从"镜像"改变为"读写"。9、如权利要求8所述装置,其特征在于所述故障接管单元还用于当所述邻居元数据服务器出现故障后长期没恢复时,所述邻居元数据树变为本地元数据树,对出现故障的所述邻居元数据服务器的本地文件系统进行管理;所述故障接管单元还用于创建第二邻居元数据树,所述第二邻居元数据树对应于第二邻居元数据服务器的本地元数据树,用于对所述第二邻居元数据服务器通过镜像进行备份;所述第二邻居元数据服务器的本地元数据树原先与所述邻居元数据服务器的邻居元数据树对应。10、如权利要求6所述装置,其特征在于,所述装置还包括故障恢复单元,用于恢复所述本地元数据服务器和所述邻居元数据树中的所述元数据树对应关系为所述邻居元数据服务器正常时的关系。11、一种接管故障元数据服务器的系统,其特征在于,所述系统包括-客户端集群,用于对元数据服务器集群中的元数据服务器的元数据和对象存储服务器集群中对象存储服务器存储的对象进行访问;元数据服务器集群,所述元数据服务器集群中的每个元数据服务器包括本地元数据树、邻居元数据树;所述本地元数据树用于对本地文件系统进行管理,所述邻居元数据树对应于邻居元数据服务器的本地元数据树;用于当本地元数据服务器对应的邻居元数据服务器工作正常时,通过所述邻居元数据树对所述邻居元数据服务器中的本地元数据树进行实时镜像,以对所述邻居元数据服务器中的本地文件系统进行备份;还用于当所述邻居元数据服务器出现故障时,所述本地元数据服务器通过对实时镜像的邻居元数据树进行管理,以接管出现故障的所述邻居元数据服务器;对象存储服务器集群,用于对应于所述元数据服务器集群中的一个元数据服务器,存储所述元数据服务器中的元数据对应的对象。全文摘要本发明实施例提供一种接管故障元数据服务器的方法、装置及系统,其中,上述方法应用于元数据服务器集群,元数据服务器包括本地元数据树、邻居元数据树;本地元数据树对本地文件系统进行管理;邻居元数据树对应于邻居元数据服务器的本地元数据树;所述方法包括当本地元数据服务器对应的邻居元数据服务器工作正常时,本地元数据服务器通过邻居元数据树对邻居元数据服务器中的本地元数据树进行实时镜像;当邻居元数据服务器出现故障时,本地元数据服务器通过对实时镜像的邻居元数据树进行管理,以接管出现故障的邻居元数据服务器。本发明实施例上述技术方案达到了提高元数据服务器的可靠性,进而提高了整个分布式文件存储系统的可靠性。文档编号H04L12/24GK101577735SQ20091015073公开日2009年11月11日申请日期2009年6月24日优先权日2009年6月24日发明者涛徐,程菊生,钟吉林,浩陈申请人:成都市华为赛门铁克科技有限公司