基于分布式文件系统的数据处理方法和服务器的制造方法
【专利摘要】本发明提供一种基于分布式文件系统的数据处理方法和服务器,通过接收用于指示所需处理的数据的文件处理命令,查询文件处理命令指示的数据的属性缓存,判断数据对应数据副本的属性缓存与查询到的属性缓存是否相同,若相同,对所述数据副本执行所述文件处理命令指示的所述操作,生成第一操作结果,并向所述第一客户机发送所述第一操作结果,由于预先存储数据的属性缓存,以及预先存储数据对应的数据副本,减少了第一客户机利用网络对服务器进行访问,再通过服务器与第二客户机之间的网络对第二客户机中的包括文件或目录在内的数据进行处理的次数,从而解决在分布式文件系统中,数据处理的性能受到网络状况的影响较大的技术问题。
【专利说明】基于分布式文件系统的数据处理方法和服务器
【技术领域】
[0001]本发明涉及通信技术,尤其涉及一种基于分布式文件系统的数据处理方法和服务器。
【背景技术】
[0002]分布式文件系统(Distributed File System),包括服务器和至少两个客户机。月艮务器设置于云端,通过网络与各个客户机连接,各个客户机之间也可以通过该网络相互进行访问。在分布式文件系统中,第二客户机发表允许第一客户机访问的文件目录,该文件目录所指示的文件的存储位置位于第二客户机所在物理节点上,从而第一客户机通过服务器可对该文件目录下的文件进行包括读操作和写操作在内的处理,以及对该文件目录进行打开和关闭的处理。
[0003]现有技术中,由于第一客户机利用网络对服务器进行访问,再通过服务器与第二客户机之间的网络对第二客户机中的包括文件或目录在内的数据进行处理,并且往往文件的数据量较大,因此,现有的分布式文件系统中,数据处理的性能受到网络状况的影响较大。
【发明内容】
[0004]本发明提供一种基于分布式文件系统的数据处理方法和服务器,用于解决在分布式文件系统中,数据处理的性能受到网络状况的影响较大的技术问题。
[0005]本发明的一个方面是提供一种基于分布式文件系统的数据处理方法,包括:
[0006]服务器接收第一客户机发送的文件处理命令;所述文件处理命令用于指示所需处理的数据、对所述数据所需执行的操作和所述数据所属的第二客户机;所述数据包括文件和文件目录中的至少一个;所述文件目录用于指示所述文件在所述第二客户机中的存储位置;
[0007]所述服务器查询所述文件处理命令指示的所述数据的属性缓存;所述属性缓存用于指示所述数据的元数据;
[0008]所述服务器判断所述数据对应数据副本的属性缓存与查询到的属性缓存是否相同;所述数据副本是预先对所述第二客户机中所述数据进行复制获得的;
[0009]若所述数据对应数据副本的属性缓存与所述查询到的属性缓存相同,所述服务器对所述数据副本执行所述文件处理命令指示的所述操作,生成第一操作结果,向所述第一客户机发送所述第一操作结果。
[0010]本发明的另一个方面是提供一种服务器,设置在分布式文件系统中,包括:
[0011]接收模块,用于接收第一客户机发送的文件处理命令;所述文件处理命令用于指示所需处理的数据、对所述数据所需执行的操作和所述数据所属的第二客户机;所述数据包括文件和文件目录中的至少一个;所述文件目录用于指示所述文件在所述第二客户机中的存储位置;[0012]查询模块,用于查询所述文件处理命令指示的所述数据的属性缓存;所述属性缓存用于指示所述数据的元数据;
[0013]判断模块,用于判断所述数据对应数据副本的属性缓存与查询到的属性缓存是否相同;所述数据副本是预先对所述第二客户机中所述数据进行复制获得的;
[0014]第一发送模块,用于若所述判断模块判断的结果为相同,对所述数据副本执行所述文件处理命令指示的所述操作,生成第一操作结果,向所述第一客户机发送所述第一操作结果。
[0015]本发明提供的基于分布式文件系统的数据处理方法和服务器,通过服务器接收用于指示所需处理的数据的文件处理命令,查询文件处理命令指示的数据的属性缓存,判断数据对应数据副本的属性缓存与查询到的属性缓存是否相同,若相同,对所述数据副本执行所述文件处理命令指示的所述操作,生成第一操作结果,并向所述第一客户机发送所述第一操作结果,由于预先存储了数据的属性缓存以及数据对应的数据副本,可以直接在服务器上对数据进行处理,减少了第一客户机利用网络对服务器进行访问,再通过服务器与第二客户机之间的网络对第二客户机中的包括文件或目录在内的数据进行处理的次数,从而解决在分布式文件系统中,数据处理的性能受到网络状况的影响较大的技术问题。
【专利附图】
【附图说明】
[0016]图1为本发明一实施例提供的基于分布式文件系统的数据处理方法的流程示意图;
[0017]图2为本发明另一实施例提供的基于分布式文件系统的数据处理方法的流程示意图;
[0018]图3为本发明一实施例提供的服务器的结构示意图;
[0019]图4为本发明另一实施例提供的服务器的结构示意图。
【具体实施方式】
[0020]图1为本发明一实施例提供的基于分布式文件系统的数据处理方法的流程示意图,如图1所示,包括:
[0021]101、服务器接收第一客户机发送的文件处理命令。
[0022]其中,文件处理命令用于指示所需处理的数据、对数据所需执行的操作和数据所属的第二客户机;数据包括文件和文件目录中的至少一个;文件目录用于指示文件在第二客户机中的存储位置。
[0023]102、服务器查询文件处理命令指示的数据的属性缓存。
[0024]其中,属性缓存用于指示数据的元数据;元数据,包括:数据量、最后修改时间、最后访问时间和创建时间中的至少一个。
[0025]判断是否预先存储有所述数据的属性缓存,预先存储的所述属性缓存是从所述第二客户机预先获取的;若预先存储有所述属性缓存,确定预先存储的属性缓存的建立时间是否超出第一阈值,若确定预先存储的属性缓存的建立时间未超出所述第一阈值,将所述预先存储的属性缓存作为所述查询到的属性缓存;所述属性缓存的建立时间是从预先获取到所述属性缓存的时刻到当前时刻之间的时间;若预先未存储有所述数据的属性缓存,或者确定所述预先存储的属性缓存的建立时间超出所述第一阈值,则从所述第二客户机获取所述数据的属性缓存,将获取到的所述数据的属性缓存作为所述查询到的属性缓存。
[0026]103、服务器判断数据对应数据副本的属性缓存与查询到的属性缓存是否相同。
[0027]其中,数据副本是预先对第二客户机中数据进行复制获得的。
[0028]104、若相同,服务器对数据副本执行文件处理命令指示的操作,生成第一操作结果,并向第一客户机发送第一操作结果。
[0029]进一步,本实施例提供的基于分布式文件系统的数据处理方法还包括,若不同,向文件处理命令指示的第二客户机发送文件处理指令,以使第二客户机对文件处理指令指示的数据执行文件处理指令指示的操作,生成第二操作结果;从第二客户机获取第二操作结果,将获取到的所述第二操作结果加入到消息队列中;所述服务器按照先进先出原则处理所述消息队列中的所述第二操作结果;当执行到所述消息队列中的第二操作结果时,所述服务器判断所述消息队列中的第二操作结果加入到所述消息队列中的时间;若所述第二操作结果加入到所述消息队列中的时间超出第二阈值,所述服务器丢弃所述消息队列中的所述第二操作结果;若所述第二操作结果加入到所述消息队列中的时间未超出所述第二阈值,所述服务器向所述第一客户机发送所述第二操作结果。
[0030]更进一步,在101之前还包括根据第一客户机发送的连接请求,对所述第一客户机进行身份和权限验证,连接请求包括用户名和密码,若验证通过,建立与第一客户机对应的服务进程,所述服务进程用于接收所述第一客户机发送的所述文件处理命令。
[0031]本实施例中,通过服务器接收用于指示所需处理的数据的文件处理命令,查询文件处理命令指示的数据的属性缓存,判断数据对应数据副本的属性缓存与查询到的属性缓存是否相同,若相同,对数据副本执行文件处理命令指示的操作,生成第一操作结果,并向第一客户机发送第一操作结果,由于预先存储数据的属性缓存,以及预先存储数据对应的数据副本,减少了第一客户机利用网络对服务器进行访问,再通过服务器与第二客户机之间的网络对第二客户机中的包括文件或目录在内的数据进行处理的次数,从而解决在分布式文件系统中,数据处理的性能受到网络状况的影响较大的技术问题。
[0032]图2为本发明另一实施例提供的基于分布式文件系统的数据处理方法的流程示意图,本实施例所提供的基于分布式文件系统的数据处理方法,可应用于分布式文件系统中的服务器,其中,分布式文件系统,包括至少两个客户机和位于云端的服务器,如图2所示,包括:
[0033]201、服务器根据第一客户机发送的连接请求,对第一客户机进行身份和权限验证。
[0034]其中,连接请求包括用户名和密码。
[0035]服务器、第一客户机和第二客户机可用于提供软件即服务(Software as aService), SaaS是一种软件交付模式,软件提供商统一管理部署在服务器中的应用软件,用户通过上述客户机接入网络,从而远程访问服务器中的应用软件,也即是说,应用软件的执行在位于云端的服务器上,利用云端的应用软件对用户的文件进行处理。用户的文件可存储于上述客户机中,也可以存储在服务器中。当用户所需处理的文件存储在第二客户机中,而其正在利用第一客户机远程访问服务器时,用户需要通过第一客户机发送连接请求,以通过服务器打开第二客户机中的文件目录,获知该文件目录下的文件,进而从中获取所需处理的文件。
[0036]服务器中的用户态文件系统(Filesystem in Userapace, FUSE)允许针对每个用户建立一个用户级文件系统,FUSE将应用程序的运行态从核心态迁移到用户态,降低了复杂度,减少了开发的工作量,提高了运行稳定性。
[0037]202、若验证通过,服务器建立与第一客户机对应的服务进程。
[0038]其中,服务进程用于接收第一客户机发送的文件处理命令。
[0039]203、服务器接收第一客户机发送的文件处理命令。
[0040]其中,文件处理命令用于指示所需处理的数据、对数据所需执行的操作和存储数据的第二客户机;数据包括文件和文件目录;文件目录用于指示文件在第二客户机中的存储位置;操作包括:打开、关闭、读操作和写操作中的至少一个。
[0041]服务器利用服务进程接收文件处理命令,对接收到的文件处理命令进行分析,获知发送该文件处理命令的第一客户机,将该文件处理命令加入到该第一客户机对应的服务进程中,对该文件处理命令进行缓存,以等待执行该文件处理命令。
[0042]204、服务器判断是否预先存储有文件处理命令指示的数据的属性缓存,并且预先存储的属性缓存的建立时间未超出第一阈值,若是,执行205,否则执行206。
[0043]其中,预先存储的属性缓存是从第二客户机预先获取的。属性缓存的建立时间是从预先获取到属性缓存的时刻到当前时刻的时间。
[0044]服务器在缓存中查询文件处理命令指示的数据的属性缓存,若查询到,将当前时刻减去预先获取到属性缓存的时刻,计算预先存储的属性缓存的建立时间,将预先存储的属性缓存的建立时间与第一阈值相判断。其中预先获取到属性缓存的时刻可以为该属性缓存添加时间戳的形式进行记录。其中,第一阈值可设置为较短的时间,以保证其有效,例如3秒。
[0045]205、若预先存储有属性缓存,并且预先存储的属性缓存的建立时间未超出第一阈值,则服务器确定将预先存储的属性缓存作为查询到的属性缓存。
[0046]206、若预先未存储有数据的属性缓存,或者预先存储的属性缓存的建立时间超出第一阈值,则服务器从第二客户机获取数据的属性缓存,确定将获取到的数据的属性缓存作为查询到的属性缓存。
[0047]若预先存储的属性缓存的建立时间超出第一阈值,则说明该预先存储的属性缓存已失效,丢弃缓存中的该预先存储的属性缓存,从第二客户机重新获取数据的属性缓存,确定将获取到的数据的属性缓存作为查询到的属性缓存。若预先未存储有数据的属性缓存,同样从第二客户机获取数据的属性缓存,确定将获取到的数据的属性缓存作为查询到的属性缓存。由于属性缓存用于指示元数据,而元数据的数据量很小,因此,受到网络状态的影响很小,避免了由于网络状态不佳所带来的服务器性能下降。
[0048]207、服务器判断数据对应数据副本的属性缓存与查询到的属性缓存是否相同,若相同,执行208,若不同,执行209-211。
[0049]其中,数据副本是预先对第二客户机中数据进行复制获得的。
[0050]将查询到的属性缓存与数据对应数据副本的属性缓存进行判断,根据属性缓存指示的元数据获知预先复制获得的数据副本是否与第二客户机中当前存储的数据相同,即预先复制获得的数据副本是否有效。[0051]需要说明的是,本实施例中的服务器需要利用磁盘或缓存对数据副本进行预先存储,若磁盘或缓存存在空闲存储空间时,可直接进行存储,若磁盘或缓存不存在空闲存储空间时,需要使用,近期最少使用(Least Recently Used, LRU)算法对磁盘或缓存中已存储的数据副本进行替换后进行存储。
[0052]208、若相同,对数据副本执行文件处理命令指示的操作,生成第一操作结果,并向第一客户机发送第一操作结果,以及向第二客户机发送第一操作结果,以使第二客户机根据第一操作结果对第二客户机中存储的数据进行更新。
[0053]209、若不同,服务器向文件处理命令指示的第二客户机发送文件处理指令,以使第二客户机对文件处理指令指示的数据执行文件处理指令指示的操作,生成第二操作结
果O
[0054]210、服务器从第二客户机获取第二操作结果,将获取到的第二操作结果加入到消息队列中。
[0055]服务器从第二客户机获取第二操作结果,将获取到的第二操作结果加入到消息队列中,服务器按照先进先出(First Input First Output, FIFO)原则处理所述消息队列中
的第二操作结果。
[0056]211、服务器当执行到消息队列中的第二操作结果时,向第一客户机发送消息队列中的第二操作结果。
[0057]当执行到所述消息队列中的第二操作结果时,所述服务器判断所述消息队列中的第二操作结果加入到所述消息队列中的时间;若所述第二操作结果加入到所述消息队列中的时间超出第二阈值,所述服务器丢弃所述消息队列中的所述第二操作结果,从而减小了数据的传输时延;若所述第二操作结果加入到所述消息队列中的时间未超出所述第二阈值,所述服务器向所述第一客户机发送所述第二操作结果。
[0058]本实施例中,通过服务器接收用于指示所需处理的数据的文件处理命令,查询文件处理命令指示的数据的属性缓存,判断数据对应数据副本的属性缓存与查询到的属性缓存是否相同,若相同,对数据副本执行文件处理命令指示的操作,生成第一操作结果,并向第一客户机发送第一操作结果,由于预先存储数据的属性缓存,以及预先存储数据对应的数据副本,减少了第一客户机利用网络对服务器进行访问,再通过服务器与第二客户机之间的网络对第二客户机中的包括文件或目录在内的数据进行处理的次数,从而解决在分布式文件系统中,数据处理的性能受到网络状况的影响较大的技术问题。
[0059]图3为本发明一实施例提供的服务器的结构示意图,如图3所示,包括:接收模块31、查询模块32、判断模块33和第一发送模块34。
[0060]接收模块31,用于接收第一客户机发送的文件处理命令。
[0061]其中,文件处理命令用于指示所需处理的数据、对数据所需执行的操作和数据所属的第二客户机;数据包括文件和文件目录;文件目录用于指示文件在第二客户机中的存储位置。
[0062]查询模块32,与接收模块31连接,用于查询文件处理命令指示的数据的属性缓存。
[0063]其中,属性缓存用于指示数据的元数据。元数据,包括:数据量、最后修改时间、最后访问时间和创建时间中的至少一个。[0064]判断模块33,用于判断数据对应数据副本的属性缓存与查询到的属性缓存是否相同。
[0065]其中,数据副本是预先对第二客户机中数据进行复制获得的;
[0066]第一发送模块34,用于若判断模块判断的结果为相同,对数据副本执行文件处理命令指示的操作,生成第一操作结果,并向第一客户机发送第一操作结果。
[0067]其中,操作,包括:打开、关闭、读操作和写操作中的至少一个。
[0068]本实施例中,通过服务器接收用于指示所需处理的数据的文件处理命令,查询文件处理命令指示的数据的属性缓存,判断数据对应数据副本的属性缓存与查询到的属性缓存是否相同,若相同,对数据副本执行文件处理命令指示的操作,生成第一操作结果,并向第一客户机发送第一操作结果,由于预先存储数据的属性缓存,以及预先存储数据对应的数据副本,减少了第一客户机利用网络对服务器进行访问,再通过服务器与第二客户机之间的网络对第二客户机中的包括文件或目录在内的数据进行处理的次数,从而解决在分布式文件系统中,数据处理的性能受到网络状况的影响较大的技术问题。
[0069]图4为本发明另一实施例提供的服务器的结构示意图,如图4所示,在上一实施例的基础上,本实施例中的查询模块32进一步包括:
[0070]判断单元321,用于判断是否预先存储有数据的属性缓存。
[0071]其中,预先存储的属性缓存是从第二客户机预先获取的。
[0072]第一确定单元322,与判断单元321连接,用于若预先存储有属性缓存,确定预先存储的属性缓存的建立时间是否超出第一阈值,若确定预先存储的属性缓存的建立时间未超出第一阈值,将预先存储的属性缓存作为查询到的属性缓存。
[0073]其中,属性缓存的建立时间是从预先获取到属性缓存的时刻到当前时刻之间的时间。
[0074]第二确定单元323,分别与判断单元321和第一确定单元322连接,用于若预先未存储有数据的属性缓存,或者确定预先存储的属性缓存的建立时间超出第一阈值,则从第二客户机获取数据的属性缓存,将获取到的数据的属性缓存作为查询到的属性缓存。
[0075]进一步,本实施例提供的服务器,还包括:第二发送模块35、身份和权限验证模块36和建立模块37。
[0076]第二发送模块35,与判断模块33连接,用于若判断模块33判断的结果为不同,向文件处理命令指示的第二客户机发送文件处理指令,以使第二客户机对文件处理指令指示的数据执行文件处理指令指示的操作,生成第二操作结果;从第二客户机获取第二操作结果,将获取到的第二操作结果加入到消息队列中;实时监测第二操作结果加入到消息队列中的时间,当第二操作结果加入到消息队列中的时间超出第二阈值时,丢弃消息队列中的第二操作结果;当执行到消息队列中的第二操作结果时,向第一客户机发送消息队列中的第二操作结果。
[0077]身份和权限验证模块36,用于根据第一客户机发送的连接请求,对第一客户机进行身份和权限验证;连接请求包括用户名和密码;
[0078]建立模块37,分别与身份和权限验证模块36和接收模块31连接,用于若验证通过,建立与第一客户机对应的服务进程,服务进程用于接收第一客户机发送的文件处理命令。[0079]基于此,接收模块具体用于利用所述服务进程接收所述第一客户机发送的所述文件处理命令。
[0080]本实施例中的服务器可为分布式文件系统中的服务器,该分布式文件系统,包括至少两个客户机和位于云端的服务器。服务器、第一客户机和第二客户机可用于提供软件即服务(Software as a Service), SaaS是一种软件交付模式,软件提供商统一管理部署在服务器中的应用软件,用户通过上述客户机接入网络,从而远程访问服务器中的应用软件,也即是说,应用软件的执行在位于云端的服务器上,利用云端的应用软件对用户的文件进行处理。用户的文件可存储于上述客户机中,也可以存储在服务器中。当用户所需处理的文件存储在第二客户机中,而其正在利用第一客户机远程访问服务器时,用户需要通过第一客户机发送连接请求,以通过服务器打开第二客户机中的文件目录,获知该文件目录下的文件,进而从中获取所需处理的文件。
[0081 ] 本实施例中,通过接收用于指示所需处理的数据的文件处理命令,查询文件处理命令指示的数据的属性缓存,判断数据对应数据副本的属性缓存与查询到的属性缓存是否相同,若相同,对数据副本执行文件处理命令指示的操作,生成第一操作结果,并向第一客户机发送第一操作结果,由于预先存储数据的属性缓存,以及预先存储数据对应的数据副本,减少了第一客户机利用网络对服务器进行访问,再通过服务器与第二客户机之间的网络对第二客户机中的包括文件或目录在内的数据进行处理的次数,从而解决在分布式文件系统中,数据处理的性能受到网络状况的影响较大的技术问题。
[0082]本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:R0M、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
[0083]最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
【权利要求】
1.一种基于分布式文件系统的数据处理方法,其特征在于,包括:服务器接收第一客户机发送的文件处理命令;所述文件处理命令用于指示所需处理的数据、对所述数据所需执行的操作和所述数据所属的第二客户机;所述数据包括文件和文件目录中的至少一个;所述文件目录用于指示所述文件在所述第二客户机中的存储位置;所述服务器查询所述文件处理命令指示的所述数据的属性缓存;所述属性缓存用于指示所述数据的元数据; 所述服务器判断所述数据对应数据副本的属性缓存与查询到的属性缓存是否相同;所述数据副本是预先对所述第二客户机中所述数据进行复制获得的; 若所述数据对应数据副本的属性缓存与所述查询到的属性缓存相同,所述服务器对所述数据副本执行所述文件处理命令指示的所述操作,生成第一操作结果,向所述第一客户机发送所述第一操作结果。
2.根据权利要求1所述的基于分布式文件系统的数据处理方法,其特征在于,所述服务器查询所述文件处理命令指示的所述数据的属性缓存,包括: 所述服务器判断是否预先存储有所述数据的属性缓存;预先存储的所述属性缓存是从所述第二客户机预先获取的; 若所述服务器预先存储有所述属性缓存,确定预先存储的属性缓存的建立时间是否超出第一阈值,若确定预先存储的属性缓存的建立时间未超出所述第一阈值,所述服务器将所述预先存储的属性缓存作为所述查询到的属性缓存;所述属性缓存的建立时间是从预先获取到所述属性缓存的时刻到当前时刻之间的时间; 若所述服务器预先未存储有所述数据的属性缓存,或者确定所述预先存储的属性缓存的建立时间超出所述第一阈值,则所述服务器从所述第二客户机获取所述数据的属性缓存,将获取到的所述数据的属性缓存作为所述查询到的属性缓存。
3.根据权利要求1所 述的基于分布式文件系统的数据处理方法,其特征在于,所述基于分布式文件系统的数据处理方法还包括: 若所述数据对应数据副本的属性缓存与所述查询到的属性缓存不同,所述服务器向所述文件处理命令指示的所述第二客户机发送所述文件处理指令,以使所述第二客户机对所述文件处理指令指示的所述数据执行所述文件处理指令指示的所述操作,生成第二操作结果;所述服务器从所述第二客户机获取所述第二操作结果;所述服务器向所述第一客户机发送所述第二操作结果。
4.根据权利要求3所述的基于分布式文件系统的数据处理方法,其特征在于,所述服务器向所述第一客户机发送所述第二操作结果,包括: 所述服务器将获取到的所述第二操作结果加入到消息队列中; 所述服务器按照先进先出原则处理所述消息队列中的所述第二操作结果; 当执行到所述消息队列中的第二操作结果时,所述服务器判断所述消息队列中的第二操作结果加入到所述消息队列中的时间; 若所述第二操作结果加入到所述消息队列中的时间超出第二阈值,所述服务器丢弃所述消息队列中的所述第二操作结果; 若所述第二操作结果加入到所述消息队列中的时间未超出所述第二阈值,所述服务器向所述第一客户机发送所述第二操作结果。
5.根据权利要求1所述的基于分布式文件系统的数据处理方法,其特征在于,所述接收第一客户机发送的文件处理命令之前,包括: 根据所述第一客户机发送的连接请求,对所述第一客户机进行身份和权限验证;所述连接请求包括用户名和密码; 若验证通过,建立与所述第一客户机对应的服务进程; 基于此,所述服务器接收第一客户机发送的文件处理命令,包括: 利用所述服务进程接收所述第一客户机发送的所述文件处理命令。
6.根据权利要求1-5任一项所述的基于分布式文件系统的数据处理方法,其特征在于,所述元数据,包括:数据量、最后修改时间、最后访问时间和创建时间中的至少一个; 所述操作,包括:打开、关闭、读操作和写操作中的至少一个。
7.一种服务器,设置在分布式文件系统中,其特征在于,包括: 接收模块,用于接收第一客户机发送的文件处理命令;所述文件处理命令用于指示所需处理的数据、对所述数据所需执行的操作和所述数据所属的第二客户机;所述数据包括文件和文件目录中的至少一个;所述文件目录用于指示所述文件在所述第二客户机中的存储位置; 查询模块,用于查询所述文件处理命令指示的所述数据的属性缓存;所述属性缓存用于指示所述数据的元数据; 判断模块,用于判断所述数据对应数据副本的属性缓存与查询到的属性缓存是否相同;所述数据 副本是预先对所述第二客户机中所述数据进行复制获得的; 第一发送模块,用于若所述判断模块判断的结果为相同,对所述数据副本执行所述文件处理命令指示的所述操作,生成第一操作结果,向所述第一客户机发送所述第一操作结果O
8.根据权利要求7所述的服务器,其特征在于,所述查询模块,包括: 判断单元,用于判断是否预先存储有所述数据的属性缓存;预先存储的所述属性缓存是从所述第二客户机预先获取的; 第一确定单元,用于若预先存储有所述属性缓存,确定预先存储的属性缓存的建立时间是否超出第一阈值,若确定预先存储的属性缓存的建立时间未超出所述第一阈值,将所述预先存储的属性缓存作为所述查询到的属性缓存;所述属性缓存的建立时间是从预先获取到所述属性缓存的时刻到当前时刻之间的时间; 第二确定单元,用于若预先未存储有所述数据的属性缓存,或者确定所述预先存储的属性缓存的建立时间超出所述第一阈值,则从所述第二客户机获取所述数据的属性缓存,将获取到的所述数据的属性缓存作为所述查询到的属性缓存。
9.根据权利要求7所述的服务器,其特征在于,所述服务器还包括: 第二发送模块,用于若所述判断模块判断的结果为不同,向所述文件处理命令指示的所述第二客户机发送所述文件处理指令,以使所述第二客户机对所述文件处理指令指示的所述数据执行所述文件处理指令指示的所述操作,生成第二操作结果;从所述第二客户机获取所述第二操作结果,向所述第一客户机发送所述第二操作结果。
10.根据权利要求7所述的服务器,其特征在于,所述服务器还包括: 身份和权限验证模块,用于根据所述第一客户机发送的连接请求,对所述第一客户机进行身份和权限验证;所述连接请求包括用户名和密码; 建立模块,用于若验证通过,建立与所述第一客户机对应的服务进程; 基于此,所述接收模块具体用于利用所述服务进程接收所述第一客户机发送的所述文件处理命令。
【文档编号】G06F12/08GK103595761SQ201310482041
【公开日】2014年2月19日 申请日期:2013年10月15日 优先权日:2013年10月15日
【发明者】沃天宇, 康俊彬, 王聿达, 张本龙, 马晓航 申请人:北京航空航天大学