分布式环境中的文件管理方法和系统的制作方法

文档序号:6500606阅读:202来源:国知局
专利名称:分布式环境中的文件管理方法和系统的制作方法
技术领域
本发明涉及分布式环境中用于文件管理的方法和系统,该分布式环境为多个终端通过网络连接在一起并且信息被记录在一些分布式终端的各自的存储器中,特别地,涉及那些用户能够使用在多个依靠网络连接的终端(信息处理器)中被存储和控制的文件而不用关注这样的分布式环境的方法和系统。
发明的背景常规地,分布式环境中的文件管理系统是这样的系统,即地理上分散、逻辑上通过网络连接在一起,并且用户能够象他或她访问他或她自己的终端一样使用控制中的文件。既取得数据访问的效率改善和故障损坏的分布,又能够使多个企业间的一般文件或者在同一个企业中的地理上分开的文件的管理成为一个整体。
可是,存在存储文件的倍增问题、为了不在特定的终端上集中访问的负载平衡问题、和文件更新同步的问题。
通常地,在位于分布式环境中的文件管理系统中生成一个索引,并且当用户访问特定的文件时,他或者她通过查阅索引获悉文件的存储位置。根据索引如何在系统中被部署和被管理,管理系统能够被分类成几种方法。有4种方法在其中特定的终端集中存储索引的中央管理系统;在其中全部终端存储索引的完全倍增系统;在其中每个终端仅具有它们自己的索引而根本没有另外终端的索引的非倍增系统;在其中一些终端存储索引的部分倍增系统。
在中央管理系统中,在以下几点上存在问题,即在具有索引的特定终端上出现集中,由于这个终端的故障它变成全部的故障,并且全部访问的开始点变成这个特定的终端引起处理时间增加。
在完全倍增系统中,不存在中央管理系统的问题。可是,在以下几点上存在问题,即在当索引中存在变化时,必需更新全部终端的索引,使得整个系统的负载集中在这一时间;并且因为全部终端维护全部终端的索引,整个系统的索引的数量变大。
在非倍增系统中,不存在由于特定终端的故障而整个系统停止的问题,并且当存在索引变化时,它只需要改变它自己终端的索引。可是,当用户访问由除了它自己的终端以外的终端管理的文件时,存在出现查询全部其它终端的负载的问题。
在部分倍增系统中,通过平衡它们,试图解决具有上述三系统所具有的折衷关系的问题。可是,系统设计相当困难。
本发明的目的在于提供一种能够克服象在上述特定终端上的负载集中,在文件更新时的同步,和在过去系统中对另一个终端的访问这样的问题的文件管理方法和文件管理系统。
发明的公开为了实现上述目的的本发明是一种分布式环境中的文件管理方法,该环境中多个终端通过网络连接在一起并且信息被记录在一些分布式终端各自的存储器中,所述方法包括步骤,1)在单独的终端中设置文件控制器,用于管理它自己终端的文件和控制与网络的信息交换,2)生成元索引(meta-index)以标识关于网络内所述信息的信息,并登记原始文件和它的复制文件的存储位置信息,每个文件在位于记录信息的各个终端中的文件控制器的元索引存储部分存储所述信息,3)在对某个信息的访问要求从某个终端被用户通过网络提出的情况下,在所述某个终端的文件控制器的元索引存储部分中查阅(refering to)元索引,并且(i)当存储所述信息的文件存在于所述某个终端中时,打开这个终端中的所述文件,(ii)当存储所述信息的文件不存在于所述某个终端中时,a>在所述某个终端上复制另一个终端的文件,在所述某个终端和其它相关终端中的文件控制器的元索引里面写入存储位置信息,并打开复制的文件,b>打开另一个终端中的文件并通过网络传送已打开文件的信息给所述某个终端的用户,或者c>转移另一个终端的文件到所述某个终端,重写元索引的存储位置信息,并打开被转移的文件,并4)在记录于某个终端中的文件有改变的情况下,查阅记录在所述某个终端中的存储位置信息部分的所述文件的元索引,并同步更新在与其所记录的存储位置相关的全部其它终端中的文件。
权利要求2所述的本发明涉及根据权利要求1的一种文件管理方法,其特征在于,存储位置信息包括指定存储文件的终端的终端密钥,和指定由所述终端中的文件控制器控制的存储器中的位置的地址。
权利要求3所述的本发明涉及一种根据权利要求1的文件管理方法,其特征在于,其中所述某个终端的用户想要同时使用离散地存储在它自己终端的存储器中的多个文件,1)通过连续地复制所述文件,在它自己终端的所述存储器中的新区域产生一个中间文件,同时在每个文件的元索引中登记所述中间文件的存储位置信息,2)当其后对文件中的一个文件的访问要求被所述某个终端的所述用户提出时,查阅元索引并打开中间文件。
结果,在它自己的终端中的存储器访问的频率被抑制以减少负载。
权利要求4所述的本发明涉及一种根据权利要求1的文件管理方法,其特征在于,它进一步包括步骤,为各个终端的元索引存储部分提供对登记在其中的存储位置的访问频率计数的表格,并且如果需要,根据终端间的负载平衡复制、转移或者删除文件。
结果,终端间的负载被平衡并且集中在一个特定终端上的访问被避开。
权利要求5所述的本发明涉及一种根据权利要求1的文件管理方法,其特征在于,其进一步包括步骤,为文件控制器提供描述对每个终端的查阅权限的列表,并且在根据负载平衡的需要,在一个没有查阅权限的终端上复制文件的情况下,为所述终端设置一个其中复制的文件不能在所述终端被打开的条件。
权利要求6所述的本发明涉及一种根据权利要求1的文件管理方法,其特征在于,所述文件至少包括从由数据文件和程序文件组成的组中选择的一个文件。
权利要求7所述的本发明涉及一种根据权利要求1的文件管理方法,其特征在于,当在通过网络连接的终端的任何一个中出现故障时,它进一步包括步骤,查阅元索引,并且,从其它没有故障的终端复制存储在所述故障终端中的信息文件从而实施备份处理。
结果,即使在没有用于负载平衡的查阅权限的终端中有副本,系统的安全也被保持。
本发明的第二个方面涉及一种分布式环境中的文件管理系统,该分布式环境为多个终端依靠网络连接在一起,并且信息被记录在一些分布式终端各自的存储器中,每个终端包括设置在单独终端中的、管理它们自己的终端的文件、和控制与网络的信息交换的文件控制器,所述文件控制器包括,1)元索引存储部分,用于登记元索引以标识与网络内的所述信息相关的信息,并登记原始文件和它的复制文件的存储位置信息,其中每一个文件存储所述信息,2)信息传送装置,用于在对一个信息的访问要求被用户通过网络从某个终端提出的情况下,查阅位于所述某个终端的文件控制器的元索引存储部分的元索引,并且(iii)当存储所述信息的文件存在于所述某个终端中时,打开这个终端中的所述文件,(iv)当存储所述信息的文件不存在于所述某个终端中时,a>在所述某个终端上复制另一个终端的文件,在所述某个终端和其它相关终端中的文件控制器的元索引中写入存储位置信息,并打开复制的文件,b>打开另一个终端中的文件并通过网络传送已打开文件的信息给所述某个终端的用户,或c>转移另一个终端的文件到所述某个终端,重写元索引的存储位置信息,并打开被转移的文件,和4)同步装置,用于在记录于某个终端中的文件有改变的情况下,查阅记录在所述某个终端的存储位置信息部分中的所述文件的元索引,并同步更新在与其所记录的存储位置相关的全部其它终端中的文件。
权利要求9所述的本发明涉及一种根据权利要求8的文件管理系统,其特征在于,其进一步包括,组设置装置,用于设置组,使属于所述组的终端共同拥有元索引。
权利要求10所述的本发明涉及一种根据权利要求8的文件管理系统,其特征在于,存储位置信息包括指定存储文件的终端的终端密钥,和指定由在所述终端中的文件控制器控制的存储器中的位置的地址。
权利要求11所述的本发明涉及一种根据权利要求8的文件管理系统,其特征在于,它进一步包括,加速装置,用于所述某个终端的用户想要同时使用离散地存储在它自己终端的存储器中的多个文件,1)通过连续地复制所述文件,在它自己终端的所述存储器中的新区域产生一个中间文件,同时在每个文件的元索引中登记所述中间文件的存储位置信息,并2)当其后对文件中的一个文件的访问要求被所述某个终端的所述用户提出时,查阅元索引并打开中间文件。
权利要求12所述的本发明涉及一种根据权利要求8的文件管理系统,其特征在于,所述每个终端的文件控制器进一步包括,统计对登记在其中的存储位置的访问频率的表格,和平衡装置,用于,如果需要,根据终端间的负载平衡复制、转移或者删除文件。
权利要求13所述的本发明涉及一种根据权利要求12的文件管理系统其特征在于,文件控制器进一步包括,描述对于每个终端的查阅权限的列表,和所述的平衡装置,在根据负载平衡的需要,在一个没有查阅权限的终端上复制文件的情况下,为所述终端设置一个其中复制的文件不能在所述终端被打开的条件。
权利要求14所述的本发明涉及一种根据权利要求8的文件管理系统,其特征在于,所述文件至少包括从由数据文件和程序文件组成的组中选择的一个文件。
权利要求15所述的本发明涉及一种根据权利要求8的文件管理系统,其特征在于,当在通过网络连接的终端的任何一个中出现故障时,它进一步包括,备份进行装置,用于查阅元索引,并且从其它没有故障的终端复制存储在所述故障终端中的信息文件从而实施备份处理。


图1是依照本发明的实施例的概念图。
图2是表示文件控制器的组成的方框图。
图3是表示其中存储“材料1”的外观的解释图。
图4是表示文件更新后的存储的解释图。
图5是表示元索引更新的外观的解释图。
图6是表示存储器中的状态的解释图。
图7是表示频率表的解释图。
图8是表示加速原理的轮廓图。
实施本发明的最佳方式以下是参考附图对依照本发明的文件管理方法和系统的实施例的详细解释。
图1是依照本发明的实施例的概念图。通过网络101连接的终端102、103、104在各自操作系统(以下,称其为“OS”)的控制下。装备有文件控制器105(以下,称其为“OFC”)的单个终端使得这三个OS封装在一起,作为一个整体。任何存储在终端中的文件不能被用户通过任何终端打开,除非这样的访问通过文件控制器实现。
图2是表示文件控制器的组成的方框图。参考数字201是元索引数据库DB,并且由元数据索引或者元索引存储部分202和频率表203组成。查阅元索引DB,信息传送装置210,同步装置204,自己终端加速装置205,平衡装置206,加速装置207,和组生成装置208通过每个终端的OS控制文件。
下面解释信息传送装置210的工作。在对一个信息的访问要求被用户通过网络从某个终端提出的情况下,所述某个终端中的信息传送装置210查阅在它自己的文件控制器的元索引存储部分202中的元索引。然后文件将通过下面两个方法中的一个被打开并且所述被打开文件的信息通过网络101被传送给所述的用户。打开文件的方法是,(i)当存储所述信息的文件存在于所述某个终端中时,优先于其它的操作在它自己的终端中准备打开所述的文件。(ii)当存储所述信息的文件不存在于所述某个终端中时,打开文件的方法是a>在所述某个终端上复制另一个终端的文件,在所述某个终端和其它相关终端中的文件控制器的元索引中写入存储位置信息,并打开复制的文件,b>打开另一个终端中的文件,并通过网络传送已打开文件的信息给所述某个终端的用户,或者c>转移另一个终端的文件到所述某个终端,重写元索引的存储位置信息,并打开被转移的文件。
在a>的情况下,相关的信息被记录在由其复制的另一个终端和所述某个终端两者的存储器中。在这种情况下,因为存储所述信息的终端增加,这样的存储位置信息被写入它自己和其它相关终端中的文件控制器的元索引存储部分。
在b>的情况下,另一个终端的文件被打开而没有复制到它自己终端的存储器上,并且所述信息被传送给上述用户。比如,在对所述信息的访问要求被提出五次的时候,上述的a>或者后述的c>能够被规定为采用。
在c>的情况下,另一个终端中的所述文件不再存在,因为它被转移到所述某个终端。在这种情况下,因为记录所述信息的终端被改变,这样的存储位置信息被写入它自己终端中的文件控制器的元索引存储部分。另一方面,这样的存储位置信息被从其它终端中的文件控制器的元索引存储部分删除。
下面说明同步装置204的工作。图3表示相同信息的“材料1”被存储在301的终端1和302的终端2中时的外观。“材料1”被存储在终端1中地址B1和终端2中的地址B2。这些地址是由每个终端的OS(操作系统)给出的在存储器中的地址。这里,终端1的元索引R能够被表示为如参考数字303所示。T1和T2是对应终端1和终端2的终端密钥。
此时,当对“材料1”的访问要求被终端1中的用户提出并且T1-B1的文件被更新时,文件控制器通过查阅R1更新登记在R1(终端1中的“材料1”的元索引)中的T2-B2的文件。此时被更新的文件的地址被登记,并且缺席位(bit of the absence)(OFF)被设置且不再处理旧文件。图4表示更新的文件和旧文件是OFF。这样,存在于分布式环境中的两个或更多个文件的同步能够被进行。
下一步,说明自己终端加速装置205。图5的参考数字501是存储在终端1中的信息的元索引数据。信息R1,R10,和R100被登记在终端密钥和地址(在存储器中的地址数字和大小)中。这里,如果为地址T1-900生成大小为80的中间文件R5000,在元索引被更新为510的同时存储器变成如图6所示。自己终端中的加速能够通过这样做被实现。此外,即使R1、R2、和R3任何一个被更新,它们能够通过查阅元索引数据没有矛盾地被同步。
下面说明平衡装置206。关于各自的信息(RK)的访问请求从一个特定的终端被提出多少次的频率被存储在频率表203中。至于图7所示的频率表,当存在对信息R1的访问要求时,每个终端(T1,T2,T3)的访问频率被计数。信息R1存在于全部的终端中,并且如果R1的负载是个问题,使用频率最小的终端1的文件被删除。此外,如果信息的实体仅存在于终端1中,它被移动到频率最高的终端3中。通过查阅象这样的频率表,能够进行负载平衡。
下面说明加速装置207。在来自用户的对信息R7的访问要求在终端T7被提出的情况下,查阅元索引。无论什么时候当存储所述信息的文件存在于自己的终端时,自己终端中的文件总被打开。在没有文件(图8的801)的情况下,另外一个终端的文件被复制到自己的终端上并且存储位置信息被写入元索引。图8的参考数字802表示文件被复制后的状态。这样,通过访问复制到自己终端上的文件可以取得加速。
下面说明组生成装置208。通过它用于本发明的文件控制的目标终端(Tn)被新近增加的处理在这里被完成。Tn的元索引与已经被生成进组中的终端的元索引数据合并,并且生成的数据作为新组的元索引数据被复制到组的各个终端上。通过这样做,即使从组中的任何一个终端进行访问,用户都能象它存在于自己的终端一样去处理该文件。
此外,如果对每个终端的查阅权限被登记在元索引DB中,即使为了负载平衡将信息文件复制到所述终端上,让没有查阅权限的终端不查阅存储于它自己的文件是可能的,并且网络的安全得到维护。
此外,在通过网络连接的终端的任何一个中出现故障的情况下,通过查阅元索引,存储在故障终端中的文件上的存储位置信息被恢复。然后,用从没有故障的其它终端的复制进行备份处理。通过如此操作,用户不需要考虑特殊备份处理或安全处理,就可以维护一个安全的环境。
如上面的解释所述,依照本发明,用户能够操作保存在网络上的分布式环境中的文件,就象该文件存在于自己的终端一样。此外,负载集中在一个特定终端上的问题,文件更新同步的问题,和对另外终端进行访问而成本增加的问题可以被规避。
权利要求
1.一种分布式环境中的文件管理方法,所述分布式环境为多个终端依靠网络连接在一起,并且信息被记录在一些分布式终端各自的存储器中,所述方法包括步骤1)在单个终端中设置文件控制器,用于管理它自己终端的文件和控制与网络的信息交换,2)生成元索引以标识与网络内的所述信息相关的信息,并在位于记录信息的每个终端中的文件控制器的元索引存储部分登记原始文件和它的复制文件的存储位置信息,每一个文件存储所述信息,3)在对某个信息的访问要求从某个终端被用户通过网络提出的情况下,查阅在所述某个终端的文件控制器的元索引存储部分中的元索引,并且(i)当存储所述信息的文件存在于所述某个终端中时,打开这个终端中的所述文件,(ii)当存储所述信息的文件不存在于所述某个终端中时,a>在所述某个终端上复制另一个终端的文件,在所述某个终端和其它相关终端中的文件控制器的元索引中写入存储位置信息,并打开复制的文件,b>打开另一个终端中的文件并通过网络传送已打开文件的信息给所述某个终端的用户,或者d>转移另一个终端的文件到所述某个终端,重写元索引的存储位置信息,并打开被转移的文件,并4)在记录于某个终端中的文件有改变的情况下,查阅记录于所述某个终端的存储位置信息部分中的所述文件的元索引,并同步更新在与其所记录的存储位置相关的全部其它终端中的文件。
2.如权利要求1所述的文件管理方法,其特征在于,存储位置信息包括指定存储文件的终端的终端密钥,和指定由所述终端中的文件控制器控制的在存储器中的位置的地址。
3.如权利要求1所述的文件管理方法,其特征在于,其进一步包括步骤所述某个终端的用户想要同时使用离散地存储在它自己终端的存储器中的多个文件,1)通过连续地复制所述文件,在它自己终端的所述存储器中的新区域产生一个中间文件,同时在每个文件的元索引中登记所述中间文件的存储位置信息,2)当其后对文件中的一个文件的访问要求被所述某个终端的所述用户提出时,查阅元索引并打开中间文件。
4.如权利要求1所述的文件管理方法,其特征在于,其进一步包括步骤为每个终端的元索引存储部分提供对登记在其中的存储位置的访问频率计数的表格,并且如果需要,根据终端间的负载平衡复制、转移或者删除文件。
5.如权利要求1所述的文件管理方法,其特征在于,其进一步包括步骤为文件控制器提供描述对每个终端的查阅权限的列表,并且在根据负载平衡的需要,在一个没有查阅权限的终端上复制文件的情况下,为所述终端设置一个其中复制的文件不能在所述终端被打开的条件。
6.如权利要求1所述的文件管理方法,其特征在于,所述文件至少包括从由数据文件和程序文件组成的组中选择的一个文件。
7.如权利要求1所述的文件管理方法,其特征在于,当在通过网络连接的终端的任何一个中出现故障时,它进一步包括步骤查阅元索引,并且,从没有故障的其它终端复制存储在所述故障终端中的信息文件从而实施备份处理。
8.一种分布式环境中的文件管理系统,该分布式环境为多个终端依靠网络连接在一起,并且信息被记录在一些分布式终端各自的存储器中,每个终端包括设置于单个终端中的、管理它们自己终端的文件、和控制与网络的信息交换的文件控制器,所述文件控制器包括,1)元索引存储部分,用于登记元索引以标识与网络内的所述信息相关的信息,并且登记原始文件和它的复制文件的存储位置信息,每一个文件存储所述信息,2)信息传送装置,用于在对一个信息的访问要求被用户通过网络从某个终端提出的情况下,查阅位于所述某个终端的文件控制器的元索引存储部分的元索引,并且(i)当存储所述信息的文件存在于所述某个终端中时,打开这个终端中的所述文件,(ii)当存储所述信息的文件不存在于所述某个终端中时,a>在所述某个终端上复制另一个终端的文件,在所述某个终端和其它相关终端中的文件控制器的元索引中写入存储位置信息,并打开复制的文件,b>打开另一个终端中的文件并通过网络传送已打开文件的信息给所述某个终端的用户,或者c>转移另一个终端的文件到所述某个终端,重写元索引的存储位置信息,并打开被转移的文件,并3)同步装置,用于在记录于某个终端中的文件有改变的情况下,查阅记录在所述某个终端中的存储位置信息部分中的所述文件的元索引,并同步更新与其所记录的存储位置相关的全部其它终端中的文件。
9.如权利要求8所述的文件管理系统,其特征在于,它进一步包括,组设置装置,用于设置组,使属于所述组的终端共同拥有元索引。
10.如权利要求8所述的文件管理系统,其特征在于,存储位置信息包括指定存储文件的终端的终端密钥,和指定由所述终端中的文件控制器控制的在存储器中的位置的地址。
11.如权利要求8所述的文件管理系统,其特征在于,它进一步包括,加速装置,用于所述某个终端的用户想要同时使用离散地存储在它自己终端的存储器中的多个文件,1)通过连续地复制所述文件,在它自己终端的所述存储器中的新区域产生一个中间文件,同时在每个文件的元索引中登记所述中间文件的存储位置信息,并且2)当其后对文件中的一个文件的访问要求被所述某个终端的所述用户提出时,查阅元索引并打开中间文件。
12.如权利要求8所述的文件管理系统,其特征在于,所述每个终端的文件控制器进一步包括,对登记在其中的存储位置的访问频率计数的表格,并且平衡装置,用于如果需要,根据终端间的负载平衡复制、转移或者删除文件。
13.如权利要求12所述的文件管理系统,其特征在于,文件控制器进一步包括,用于描述对于每个终端的查阅权限的列表,并且所述平衡装置,在根据负载平衡的需要,在一个没有查阅权限的终端上复制文件的情况下,为所述终端设置一个其中复制的文件不能在所述终端被打开的条件。
14.如权利要求8所述的文件管理系统,其特征在于,所述文件至少包括从由数据文件和程序文件组成的组中选择的一个文件。
15.如权利要求8所述的文件管理系统,其特征在于,当在通过网络连接的终端的任何一个中出现故障时,它进一步包括,备份进行装置,用于查阅元索引,并且从没有故障的其它终端复制存储在所述故障终端中的信息文件从而实施备份处理。
全文摘要
一种用于分布式环境中的文件管理系统,包括每一个具有用于登记包括关于原始和复制的文件的存储的信息的元索引的元索引存储单元(202)的终端;当收到来自用户的访问请求时,查阅元索引的信息传送装置(210),(i)如果文件存在于终端的终端中,打开元索引或者(ii)如果文件不存在,复制存储在另一个终端中的文件到这个终端并在相关的终端中写下存储位置信息,打开复制的文件,并传送文件信息给用户;和同步装置(204),如果文件被改变,该装置查阅元索引,更新其中登记有文件副本的全部其它终端中的文件,并进行同步。
文档编号G06F12/00GK1353836SQ00808249
公开日2002年6月12日 申请日期2000年4月24日 优先权日1999年4月22日
发明者龙忠光 申请人:Cai株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1