电子文件管理方法、装置、计算机设备和存储介质与流程

文档序号:23003269发布日期:2020-11-20 11:51阅读:177来源:国知局
电子文件管理方法、装置、计算机设备和存储介质与流程

本申请涉及计算机技术领域,特别是涉及一种电子文件管理方法、装置、计算机设备和存储介质。



背景技术:

电子文件是指在数字设备及环境中形成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传送的文件,如文档、图片、视频、录音文件等。

以企业或公司为例,随着企业或公司的成长,会沉淀越来越多的电子文件,通常会有专门的人员管理文件(如资料管理员),资料管理员通常的处理方式是将这些文件粗略分类后存放。针对某些行业,尤其是互联网金融行业,需要根据监管要求管理某些历史电子文件。现有的将所有电子文件进行初略分类和统一存储的管理方式,由于时间长远,不仅会导致存储空间的过多占用,而且容易出现丢失文件无法恢复的情况,造成对电子文件的管理难度大。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够简化对电子文件的管理,避免文件丢失无法恢复情况的电子文件管理方法、装置、计算机设备和存储介质。

一种电子文件管理方法,方法包括:

获取待存储的电子文件的文件配置数据,文件配置数据包括电子文件在文件存储载体中的有效存储时间,文件存储载体包括处于不同存储环境的第一载体和第二载体,电子文件在第一载体中的第一有效存储时间不大于在第二载体中的第二有效存储时间;

根据文件配置数据,将电子文件存储至第一载体;

当获取到与文件配置数据对应的文件同步任务时,通过执行文件同步任务,将电子文件从第一载体同步至第二载体。

在其中一个实施例中,获取并执行与文件配置数据对应的文件同步任务,将电子文件从第一载体同步至第二载体之后,还包括:

获取将电子文件存储至第一载体时记录的文件存储信息;

根据文件存储信息,得到第一载体中存储的各电子文件的实际存储时间和第一有效存储时间;

清除第一载体中实际存储时间超过对应第一有效存储时间的电子文件。

在其中一个实施例中,清除第一载体中实际存储时间超过对应第一有效存储时间的电子文件包括:

确定第一载体中实际存储时间超过对应第一有效存储时间的待处理电子文件;

当待处理电子文件存在同步标识时,清除待处理电子文件,其中,同步标识在执行文件同步任务时被标记至对应的电子文件。

在其中一个实施例中,第二有效存储时间为永久有效;文件存储载体还包括中间载体,电子文件在中间载体的中间有效存储时间大于第一有效存储时间且小于第二有效存储时间;

当获取到与文件配置数据对应的文件同步任务时,通过执行文件同步任务,将电子文件从第一载体同步至第二载体包括:

根据文件配置数据,生成与第一载体对应的第一文件定时同步任务;

执行第一文件定时同步任务,将电子文件从第一载体定时同步至中间载体;

根据文件配置数据,生成与中间载体对应的第二文件定时同步任务;

执行第二定时同步任务,将电子文件从中间文件存储载体定时同步至第二载体。

在其中一个实施例中,根据文件配置数据,将电子文件存储至第一载体包括:

提取文件配置数据中的文件属性和文件业务类型;

根据文件属性和文件业务类型,确定电子文件的存储路径;

将电子文件存储至第一载体中与存储路径对应的存储位置。

在其中一个实施例中,获取待存储的电子文件的文件配置数据包括:

响应电子文件存储配置页面的文件配置操作;

提取通过文件配置操作输入的待存储的电子文件的文件属性、文件业务类型以及在各文件存储载体中对应的有效存储时间,得到待存储的电子文件的文件配置数据。

在其中一个实施例中,获取待存储的电子文件的文件配置数据之后,还包括:

将文件配置数据存储至第一载体对应的第一数据库;

当获取到与文件配置数据对应的文件同步任务时,通过执行文件同步任务,将电子文件从第一载体同步至第二载体包括:

根据第一数据库中各文件配置数据中的同步时间,生成文件同步任务;

执行文件同步任务,将电子文件的文件配置数据从第一数据库同步至第二载体对应的第二数据库,并将电子文件从第一载体同步至第二载体。

在其中一个实施例中,文件存储载体还包括中间载体,中间载体的数量为正整数,方法还包括:

获取电子文件访问请求,确定电子文件访问请求对应的待访问电子文件;

根据待访问电子文件的文件配置数据,确定待访问电子文件在各文件存储载体间的同步梯级,同步梯级的起点为第一载体,终点为第二载体;

当从第一载体中查找待访问电子文件失败时,根据同步梯级,从下一级载体中查找待访问电子文件,直至查找到待访问电子文件或不存在下一级载体。

一种电子文件管理装置,装置包括:

数据获取模块,用于获取待存储的电子文件的文件配置数据,文件配置数据包括电子文件在文件存储载体中的有效存储时间,文件存储载体包括处于不同存储环境的第一载体和第二载体,电子文件在第一载体中的第一有效存储时间不大于在第二载体中的第二有效存储时间;

第一存储模块,用于根据文件配置数据,将电子文件存储至第一载体;

第二存储模块,用于获取并执行与文件配置数据对应的文件同步任务,将电子文件从第一载体同步至第二载体。

一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:

获取待存储的电子文件的文件配置数据,文件配置数据包括电子文件在文件存储载体中的有效存储时间,文件存储载体包括处于不同存储环境的第一载体和第二载体,电子文件在第一载体中的第一有效存储时间不大于在第二载体中的第二有效存储时间;

根据文件配置数据,将电子文件存储至第一载体;

当获取到与文件配置数据对应的文件同步任务时,通过执行文件同步任务,将电子文件从第一载体同步至第二载体。

一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

获取待存储的电子文件的文件配置数据,文件配置数据包括电子文件在文件存储载体中的有效存储时间,文件存储载体包括处于不同存储环境的第一载体和第二载体,电子文件在第一载体中的第一有效存储时间不大于在第二载体中的第二有效存储时间;

根据文件配置数据,将电子文件存储至第一载体;

当获取到与文件配置数据对应的文件同步任务时,通过执行文件同步任务,将电子文件从第一载体同步至第二载体。

上述电子文件管理方法、装置、计算机设备和存储介质,基于待存储的电子文件的文件配置数据,通过设定电子文件在载体中的有效存储时间,能够避免历史文件在同一载体中的长久存放导致对该固定载体存储空间的占时过多,通过配置多个不同存储环境中的文件存储载体以及第一有效存储时间不大于第二有效存储时间的条件,将电子文件先存储至第一载体,然后同步至第二载体,实现了分级的电子文件存储机制,将电子文件存放在多级载体上,能够在后续处理过程中,在第一载体中电子文件丢失时,能够基于第二载体实现对丢失电子文件的恢复,从而简化对电子文件的管理。

附图说明

图1为一个实施例中电子文件管理方法的应用环境图;

图2为一个实施例中电子文件管理方法的流程示意图;

图3为另一个实施例中电子文件管理方法的流程示意图;

图4为一个实施例中电子文件管理方法的配置界面示意图;

图5为另一个实施例中电子文件管理方法的配置界面示意图;

图6为再一个实施例中电子文件管理方法的流程示意图;

图7为又一个实施例中电子文件管理方法的流程示意图;

图8为还一个实施例中电子文件管理方法的流程示意图;

图9为另一个实施例中电子文件管理方法的流程示意图;

图10为一个实施例中电子文件管理方法的数据处理过程示意图;

图11为一个实施例中电子文件管理方法的文件存储数量对比示意图;

图12为一个实施例中电子文件管理装置的结构框图;

图13为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的电子文件管理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。服务器104获取通过终端102的电子文件存储配置页面输入的待存储的电子文件的文件配置数据,文件配置数据包括电子文件在文件存储载体中的有效存储时间,文件存储载体包括处于不同存储环境的第一载体和第二载体,电子文件在第一载体中的第一有效存储时间不大于在第二载体中的第二有效存储时间;服务器104根据文件配置数据,将电子文件存储至第一载体;当获取到与文件配置数据对应的文件同步任务时,通过执行文件同步任务,将电子文件从第一载体同步至第二载体。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种电子文件管理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤202至步骤206。

步骤202,获取待存储的电子文件的文件配置数据。

文件配置数据包括电子文件在文件存储载体中的有效存储时间,文件存储载体包括处于不同存储环境的第一载体和第二载体,电子文件在第一载体中的第一有效存储时间不大于在第二载体中的第二有效存储时间。

电子文件是指在数字设备及环境中形成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传送的文件,如word文档、图片、视频、录音文件等。

文件存储载体是指用于对电子文件进行存储的载体。具体来说,文件存储载体可以包括云盘、磁盘、磁带、光盘等。在实施例中,第一载体可以是支持联机访问的载体,比如高性能云盘,第二载体可以是磁带等永久性存储载体。在其他实施例中,还可以配置有效存储时间介于第一载体和第二载体之间的中间载体,例如磁盘等。通过将电子文件按预设的存储载体的配置,在不同时间存储在不同的载体上。例如电子文件创建后1年,存放在第一载体,创建1到3年存放在中间载体,创建超过3年存放在第二载体,将电子文件由高性能联机存储载体迁移到低性能载体存储,可以节省存储成本。

电子文件的文件配置数据包括文件属性、文件业务类型、以及在每一级的文件存储载体中的有效存储时间,其中上一级载体的有效存储时间不大于下一级载体的有效存储时间。具体来说,电子文件在各级载体的有效存储时间分为永久保存和定义具体有效存储时间两类,只有电子文件在第一载体中的有效存储时间为永久有效时,该电子文件在第一载体的有效存储时间才会与在第二载体的有效存储时间相同。当电子文件在第一载体中的有效存储时间不是永久有效时,该电子文件在第一载体的有效存储时间小于第二载体的有效存储时间。

在其他实施例中,电子文件的文件配置数据还可以文件归属系统,包括进一步细分的文件业务子类型,文件用途说明等文件信息。

有效存储时间包括第一有效存储时间和第二有效存储时间,可以是具体的维持有效状态的最后时间点,也可以是维持有效状态的时长,具体可以根据实际需要进行配置。

在其中一个实施例中,如图3所示,获取待存储的电子文件的文件配置数据包括步骤302至步骤304。

步骤302,响应电子文件存储配置页面的文件配置操作。

步骤302,提取通过文件配置操作输入的待存储的电子文件的文件属性、文件业务类型以及在各文件存储载体中对应的有效存储时间,得到待存储的电子文件的文件配置数据。

通过配置电子文件存储配置页面,并显示至终端的显示界面,用户可以通过选定要存储的电子文件,并输入该电子文件的文件属性、文件业务类型以及在各文件存储载体中对应的有效存储时间等配置信息,然后将终端将用户输入的配置信息和待存储的电子文件上传至服务器。

具体来说,如图4所示,在服务器配置的存储文件类型管理页面提供了一个“添加”按钮图标,通过在终端显示存储文件类型管理页面,用户通过点击该界面中的按钮图标触发新增存储文件类型事件,唤起电子文件存储配置页面,如图5所示,唤起的电子文件存储配置页面中,文件属性表示文件固有属性,比如文档、图片、视频、音频等。文件业务类型表示电子文件的业务属性,依据电子文件的使用场景定义,同一个文件属性下的文件业务类型是唯一的,不允许重复。

电子文件在各级载体的保存周期分为永久保存和定义具体有效存储时间两类,若选择在第一载体永久保存,电子文件在该第一载体不会被清理,永久保存,但仍会同步至第二载体;若设置在第一载体中的具体有效存储时间,电子文件会被同步至第二载体,超过第一有效存储时间时,第一载体中的电子文件就会被清理。电子文件在第二载体的有效存储时间必须比在第一载体的有效存储时间更长(在第一载体永久保存除外)。

在一个实施例中,第二载体为默认对电子文件永久保存的载体,如磁带、光盘等。在第一载体与第二载体之间还存在一个或多个中间载体,则对中间载体的电子文件也会执行与第一载体一样的文件处理逻辑,文件存储到最后一级载体即第二载体中后将会被永久保存。如图5中所示的一级载体为第一载体,二级载体为中间载体,磁带为第二载体。

当系统管理人员或资料管理人员选定待存储的电子文件,并按要求正确填入各项配置内容后,点击“确定”按钮,将会产生新增的待存储电子文件的文件配置数据通过文件存储请求的形式上传到服务器。

步骤204,根据文件配置数据,将电子文件存储至第一载体。

服务器在获取到文件配置数据之后,在第一载体的数据库中记录该电子文件的文件配置数据,同时,根据文件配置数据,确定该电子文件在第一载体中的存储路径,按照存储路径,将电子文件存储至第一载体。

在其中一个实施例中,如图6所示,根据文件配置数据,将电子文件存储至第一载体包括步骤602至步骤606。

步骤602,提取文件配置数据中的文件属性和文件业务类型。

步骤604,根据文件属性和文件业务类型,确定电子文件的存储路径。

步骤606,将电子文件存储至第一载体中与存储路径对应的存储位置。

服务器从终端上传的文件配置数据中提取待存储电子文件的文件属性和文件业务类型,以文件属性和文件业务类型为存储路径中的目录层级,得到该电子文件的存储路径,在确定了存储路径之后,可以基于已有的目录层级或创建新的指定目录层级的方式,确定电子文件在第一载体中的存储位置,然后将电子文件存储至该确定的存储位置。

在实施例中,电子文件在载体上的存储路径依据文件配置数据中选择的文件属性以及定义的文件业务类型决定,比如可以使用“自定义根目录/文件属性/文件业务类型/日期/电子文件”这样的目录层级来存储电子文件。实现了将电子文件按照属性和使用场景分类,使得每个存储的文件类型具有唯一的存放路径,方便对电子文件进行管理。

对比传统的将电子文件粗略分类存放在一个载体上,采用上述方式来管理电子文件,文件不会丢失,电子文件按分类存放于不同目录,便于管理,而且自动实现文件治理过程,节省人员投入,控制系统复杂度。

步骤206,当获取到与文件配置数据对应的文件同步任务时,通过执行文件同步任务,将电子文件从第一载体同步至第二载体。

与文件配置数据对应的文件同步任务是指基于文件配置数据中的指定同步时间生成的任务。

具体来说,通过执行文件同步任务,需要定时将第一载体中的电子文件同步至第二载体。文件同步任务中包括定时触发条件,在当前时间满足定时触发条件时,服务器会执行该文件同步任务,通过定时执行文件同步任务,可以设定文件同步周期,将一定时间内的电子文件一起同步至第二载体,实现数据的集中同步处理,减小对数据处理资源的占用。

在实施例中,文件同步任务即包括电子文件的同步,还包括与电子文件相关的文件信息的同步,电子文件相关的文件信息存储于各载体对应的数据库中。

在其中一个实施例中,获取待存储的电子文件的文件配置数据之后,还包括将文件配置数据存储至第一载体对应的第一数据库。

当获取到与文件配置数据对应的文件同步任务时,通过执行文件同步任务,将电子文件从第一载体同步至第二载体包括:根据第一数据库中各文件配置数据中的同步时间,生成文件同步任务。执行文件同步任务,将电子文件的文件配置数据从第一数据库同步至第二载体对应的第二数据库,并将电子文件从第一载体同步至第二载体。

每个文件存储载体中都配置有对应的数据库,实现电子文件与电子文件相关的文件信息的分离存储,通过使用数据库来存储文件信息,相较于将电子文件以及文件信息同时存储在载体的数据存储方式,由于数据库中的数据量相对较小,能够提高对文件信息的处理速度,便于在后续的数据查找和数据清理等过程中提高数据处理速度。

在一个实施例中,第一载体对应的第一数据库的文件信息包括电子文件的文件配置数据以及将电子文件存储至第一载体时记录的文件存储信息。

在将电子文件存储至第一载体,将该电子文件的文件信息存储至第一数据库之后,基于第一数据库中的文件信息,生成定时同步任务,通过定时触发执行定时同步任务,将第一载体中的电子文件同步至第二载体,将第一数据库中的文件信息同步至第二载体的第二数据库。电子文件在第一载体和第二载体中的存储路径相同,根据第二数据库中同步得到的电子文件的存储路径,将同步等得到的电子文件存储至第二载体中的对应存储位置。

在其中一个实施例中,如图7所示,获取并执行与文件配置数据对应的文件同步任务,将电子文件从第一载体同步至第二载体之后,还包括步骤702至步骤706。

步骤702,获取将电子文件存储至第一载体时记录的文件存储信息。

步骤704,根据文件存储信息,得到第一载体中存储的各电子文件的实际存储时间和第一有效存储时间。

步骤706,清除第一载体中实际存储时间超过对应第一有效存储时间的电子文件。

文件存储信息存储于第一载体的数据库中,当第一有效存储时间为存储有效时长时,从数据库获取将电子文件存储至第一载体时记录的文件存储信息,可以得到该电子文件的存储时间点,如存储日期,根据当前时间和存储时间,如根据当前日期和存储日期,得到第一载体中存储的各电子文件的实际存储时长,从数据库中存储的文件配置数据中,还可以得到第一载体中存储的各电子文件的第一有效存储时间,即存储有效时长,通过比较存储有效时长和实际存储时长,清除实际存储时长超过存储有效时长的电子文件。通过将第一有效存储时间配置为有效时长,能够直观地表示文件存储需要的时长,便于进行第一有效存储时间的配置。

在其他实施例中,还可以将第一有效存储时间配置为具体的存储失效时间点,如失效日期,对应的,实际存储时间为当前日期。通过遍历数据库,得到第一载体中存储的各电子文件的失效日期,将当前日期与失效日期进行比较,清除当前日期大于失效日期的电子文件。通过将第一有效存储时间配置为失效日期,可以直观地表征文件可以在对应的载体中存储到具体哪一条,适用于具有时间节点要求的电子文件。

在其中一个实施例中,如图8所示,清除第一载体中实际存储时间超过对应第一有效存储时间的电子文件包括步骤802至步骤804。

步骤802,确定第一载体中实际存储时间超过对应第一有效存储时间的待处理电子文件。

步骤804,当待处理电子文件存在同步标识时,清除待处理电子文件,其中,同步标识在执行文件同步任务时被标记至对应的电子文件。

服务器会定时从数据库获取所有存储的电子文件的文件配置信息,根据每一个文件配置信息中的记录的电子文件在各载体的有效存储时间,定时清理已超过有效存储时间的文件,直到所有该载体中超过有效存储时间的文件清理完为止。

在实施例中,当执行电子文件对应的文件同步任务,接收到同步成功的反馈消息时,会将同步标识标记至该电子文件。例如,第一载体中的电子文件的电子标识,表征该电子文件已经同步至第一载体对应的下一级载体中。

清理文件时需要判断电子文件以及该电子文件对应的文件信息是否同步到下一级载体,具体来说,可以根据该电子文件是否携带有同步标识来确定该电子文件是否已同步。若没有同步,则不会清理。例如,清理存储第一载体中超过有效存储时间的文件时,需要判断该电子文件及其对应的文件信息是否已同步到下一级载体(例如中间载体或是第二载体)中,若没有同步,则不清理该电子文件,否则清理。因要求电子文件在第一载体中的有效存储时间要超过在第二载体中的有效存储时间(此处永久保存在第一载体中的电子文件除外),因此清理第一载体的电子文件时,若有同步到第二载体,则第二载体上的该电子文件一定存在,避免了由于文件清理造成的电子文件丢失的情况的发生。

在其中一个实施例中,第二有效存储时间为永久有效。文件存储载体还包括中间载体,电子文件在中间载体的中间有效存储时间大于第一有效存储时间且小于第二有效存储时间。当获取到与文件配置数据对应的文件同步任务时,通过执行文件同步任务,将电子文件从第一载体同步至第二载体包括:根据文件配置数据,生成与第一载体对应的第一文件定时同步任务。执行第一文件定时同步任务,将电子文件从第一载体定时同步至中间载体。根据文件配置数据,生成与中间载体对应的第二文件定时同步任务。执行第二定时同步任务,将电子文件从中间文件存储载体定时同步至第二载体。

可以理解,中间文件的数量可以为1个,也可以是至少两个(≥2),通过配置中间载体,可以为电子文件设置多个存储时间梯度,在不同时间段存储在不同的载体中。

在实施例中,电子文件上传到第一载体后,电子文件和对应的文件信息将会定时同步到中间载体和数据库中,例如今天凌晨开始将昨天上传到第一载体的电子文件同步到中间载体上。同将电子文件由第一载体同步到中间载体一样,中间载体的电子文件也会被定时同步到第二载体(磁带)上。为了保证第一载体上所有新增文件都能同步到第二载体上,第二载体的文件同步时间要延后两天,即今天同步前天从终端上传至服务器的文件。因为在三级文件存储机制中,第二载体为最后一级存储,因此电子文件将在第二载体上永久保存。

在其中一个实施例中,文件存储载体还包括中间载体,中间载体的数量为正整数。如图9所示,电子文件管理方法还包括步骤902至步骤908。

步骤902,获取电子文件访问请求,确定电子文件访问请求对应的待访问电子文件。

步骤904,根据待访问电子文件的文件配置数据,确定待访问电子文件在各文件存储载体间的同步梯级,同步梯级的起点为第一载体,终点为第二载体。

步骤906,当从第一载体中查找待访问电子文件失败时,根据同步梯级,从下一级载体中查找待访问电子文件,直至查找到待访问电子文件或不存在下一级载体。

服务器访问文件时,首先查询对应第一载体的文件,若未能找到文件,则向第一载体的下一级载体寻找文件,若还未找到文件,则一级一级向下查找,直到找到文件或者找完下属所有载体:如在第一载体没有找到文件,则会向中间载体查找,若还是没有找到,则向第二载体查找,直到找到文件或者将下属所有载体全部找完为止。

以第二载体为磁带为例,服务器下载文件时,首先查询在对应环境载体上的文件,若未能找到文件,则文件可能已经丢失或者已经清理,服务器会立即向下一级存储环境的载体查找文件,仍没有找到则会一直向下级查找,若到倒数第二级存储载体都没有找到文件,则表明文件已经存放到磁带中。由于磁带一般是离线保存,属于不支持联机快速访问的载体,通过将文件下载信息放入文件调档队列中并发送至磁带管理人员对应的终端,等待管理人员将电子文件从磁带中恢复到倒数第二级存储载体上,再由服务器下载文件,实现电子文件的访问。可以理解,从磁带中恢复到倒数第二级存储载体中的电子文件由于其之前已经完成了同步至磁带的文件同步任务,因此,恢复的该电子文件携带有同步标识,不会重复进行文件同步。此外,在电子文件恢复的同时,会恢复该电子文件的文件信息至倒数第二级存储载体对应的数据库,基于文件配置信息,会重新计算该电子文件的实际存储时间,并在时间存储时间超过对应的有效存储时间时,对该电子文件进行清理。

在实施例中,分级文件存储机制可以有多级存储层级,但实现思路和电子文件存储流程与三级文件存储机制一致,下面将使用三级文件存储机制阐述分级文件存储机制的技术细节。三级文件存储机制(依次为载体一、载体二和载体三)的文件存储和下载流程如下图10所示。

首先,分级文件存储机制在服务器对应终端界面提供了电子文件存储配置页面,点击新增按钮新增电子文件配置,终端将电子文件和配置信息上传到存储环境一,服务器根据文件配置数据生成电子文件在载体一上的存储路径,并将文件存储到载体一上对应的路径中;同时,与文件相关的信息,如文件配置信息中的文件名、文件类型、文件大小,基于文件配置信息生成的文件存储路径、还有文件创建事件以及文件索引等文件信息将会存储到载体一对应的数据库一中。

电子文件上传到存储环境一的载体一上后,电子文件和文件信息的数据将会定时同步到存储环境二的载体二和数据库二中,例如今天凌晨开始将昨天上传到载体一的电子文件和文件信息同步到载体二上,与将电子文件由载体一同步到载体二一样,载体二的电子文件和文件信息也会被定时同步到载体三(磁带)上。为了保证载体一是所有新增文件都能同步到载体三上,载体三的文件同步时间要延后两天,即今天同步前天上传的文件。因为在三级文件存储机制中,载体三(磁带)为最后一级存储,因此电子文件将在载体三上永久保存,可以理解,由于载体三为永久保存的磁带,因此,将电子文件以及对应的文件信息同步至磁盘的过程也可以称为电子文件的归档过程。

服务器会定时从数据库获取所有文件配置信息,根据每一个文件配置信息中各载体的有效存储时间,定时清理各载体中已超过有效存储时间的文件,直到载体中对应的超过保存周期的文件清理完为止。

清理文件时需要判断电子文件和对应的文件信息是否同步到下一级存储环境,若没有同步,则不会清理。如,清理存储环境一中超过保存周期的文件时,需要判断电子文件及其数据库中的文件信息是否已同步到存储环境二中,若没有同步,则不清理文件,否则清理。因要求电子文件保存在存储环境二的周期要超过该电子文件保存在存储环境一的周期(此处永久保存在存储环境一的文件除外),因此清理载体一的电子文件时,该电子文件已同步到载体二,也就是说,载体二上的该电子文件一定存在。

服务器下载文件时,首先查询在对应环境载体上的电子文件,若未能找到该电子文件,则电子文件可能已经丢失或者已经清理,服务器会立即向下一级存储环境的载体查找该电子文件,仍没有找到则会一直向下一级存储环境查找,若到最后一级存储环境之前都没有找到文件,则表明文件已经存放到磁带中,将文件下载信息放入文件调档队列中,等待文件从磁带中恢复到倒数第二级存储载体上,再由服务器下载文件。

分级文件存储降机制最终使电子文件在各级的存储载体上的文件数量如下图11所示。

如图11所示,从载体一到载体三,载体一的文件数量少于载体二种的文件数量,载体二种的文件数量少于载体三种的文件数量,载体三中存储了全部需要永久保存的文件。载体一中的文件通常是访问频率高,更重要的文件,其存储载体联机访问性能要求更高,单个文件的存储成本比载体三(磁带)成本要高许多。对比于将所有文件都存储在载体一的方式,采用分级文件存储机制可以降低文件的存储成本。

通过上述电子文件管理方法,采用了分级文件存储机制将文件存放在多级存储载体上,某一载体文件丢失,可以基于其下属级别载体,通过离线下载快速恢复,理论上来说不存在文件丢失的可能性;此外,通过分级文件存储机制,将电子文件按照属性和使用场景分类,每个存储的文件类型具有唯一的存放路径,方便管理;分级文件存储机制采用文件类型配置与定时任务结合,实现对每个类型的文件将进行自动同步和清理,实现文件的自动治理。

应该理解的是,虽然图2-3、图6-9的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3、图6-9中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图12所示,提供了一种电子文件管理装置,包括:数据获取模块1202、第一存储模块1204和第二存储模块1206,其中:

数据获取模块1202,用于获取待存储的电子文件的文件配置数据,文件配置数据包括电子文件在文件存储载体中的有效存储时间,文件存储载体包括处于不同存储环境的第一载体和第二载体,电子文件在第一载体中的第一有效存储时间不大于在第二载体中的第二有效存储时间;

第一存储模块1204,用于根据文件配置数据,将电子文件存储至第一载体;

第二存储模块1206,用于获取并执行与文件配置数据对应的文件同步任务,将电子文件从第一载体同步至第二载体。

在其中一个实施例中,电子文件管理装置还包括文件清除模块,用于获取将电子文件存储至第一载体时记录的文件存储信息;根据文件存储信息,得到第一载体中存储的各电子文件的实际存储时间和第一有效存储时间清除第一载体中实际存储时间超过对应第一有效存储时间的电子文件。

在其中一个实施例中,文件清除模块还用于确定第一载体中实际存储时间超过对应第一有效存储时间的待处理电子文件;当待处理电子文件存在同步标识时,清除待处理电子文件,其中,同步标识在执行文件同步任务时被标记至对应的电子文件。

在其中一个实施例中,第二有效存储时间为永久有效;文件存储载体还包括中间载体,电子文件在中间载体的中间有效存储时间大于第一有效存储时间且小于第二有效存储时间;

第二存储模块还用于根据文件配置数据,生成与第一载体对应的第一文件定时同步任务;执行第一文件定时同步任务,将电子文件从第一载体定时同步至中间载体;根据文件配置数据,生成与中间载体对应的第二文件定时同步任务;执行第二定时同步任务,将电子文件从中间文件存储载体定时同步至第二载体。

在其中一个实施例中,第一存储模块还用于提取文件配置数据中的文件属性和文件业务类型;根据文件属性和文件业务类型,确定电子文件的存储路径;将电子文件存储至第一载体中与存储路径对应的存储位置。

在其中一个实施例中,数据获取模块还用于响应电子文件存储配置页面的文件配置操作;提取通过文件配置操作输入的待存储的电子文件的文件属性、文件业务类型以及在各文件存储载体中对应的有效存储时间,得到待存储的电子文件的文件配置数据。

在其中一个实施例中,电子文件管理装置还包括数据存储模块,用于将文件配置数据存储至第一载体对应的第一数据库;第二存储模块还用于根据第一数据库中各文件配置数据中的同步时间,生成文件同步任务;执行文件同步任务,将电子文件的文件配置数据从第一数据库同步至第二载体对应的第二数据库,并将电子文件从第一载体同步至第二载体。

在其中一个实施例中,电子文件管理装置还包括文件访问模块,用于获取电子文件访问请求,确定电子文件访问请求对应的待访问电子文件;根据待访问电子文件的文件配置数据,确定待访问电子文件在各文件存储载体间的同步梯级,同步梯级的起点为第一载体,终点为第二载体;当从第一载体中查找待访问电子文件失败时,根据同步梯级,从下一级载体中查找待访问电子文件,直至查找到待访问电子文件或不存在下一级载体。

关于电子文件管理装置的具体限定可以参见上文中对于电子文件管理方法的限定,在此不再赘述。上述电子文件管理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图13所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储电子文件的文件信息数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种电子文件管理方法。

本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-onlymemory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(randomaccessmemory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(staticrandomaccessmemory,sram)或动态随机存取存储器(dynamicrandomaccessmemory,dram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1