一种企业电子文档管理服务端及系统的制作方法
【专利摘要】本发明的一种企业电子文档管理服务端及系统,服务端包括:按预设容量值分配的多个存储区的数据库、将电子文档按预设容量值分割存储在不同存储区及提取合并的存取模块、将所述电子文档进行分类的文档分类模块、根据所述文档分类将电子文档转换并另存为可预览格式的预览转换模块、可内容栏位检索的索引模块等,服务端通过网络连接客户端,所述系统采用大容量存取快速的非关系型数据库,具备文件预览功能便于查看,高效搜索引擎加速查询,服务端客户端间上传下载速度均对文档作压缩处理提升传输速度,解决企业电子文档管理系统存取的核心问题,实现高效率信息资源管理。
【专利说明】一种企业电子文档管理服务端及系统
【技术领域】
[0001]本发明涉及电子文档管理,特别是涉及企业电子文档管理系统。
【背景技术】
[0002]随着经济及科技的不断发展,企业日常运营活动中的各种资料已经采用电子文档形式保存,这些都是属于公司的宝贵资源,随着电子文档日益增多,企业电子文档管理系统应运而生。
[0003]传统的方式,当企业需要集中管理所有这些文档时,会采用WEB应用程序解决方案,将个人电脑上的相关文件上传到服务器的指定文件夹中,需要时,由服务器端的应用程序来检索相关的服务器硬盘上的文件夹目录,所以,传统的管理文件方式,实质上是依托于对服务器上操作系统下的文件目录系统,来进行添加、检索、删除等操作。
[0004]这种传统的使用文件夹(目录)集中管理的方式,随着所需管理的文件的数量越来越大,分类越来越复杂,使用者越来越多,会出现一系列的问题,从而导致WEB应用文档管理系统的性能越来越差,大概有以下缺陷:
[0005]( I)文件太多,效率低下;
[0006]应用程序检索一个文件夹,是首先获取其目录内的所有文件及子目录,得到一个数组列表,再根据条件得到其中所需要的文件,这个数组列表,一般是占用内存的方式来得到的,当某些文件夹下面的文件及子目录非常多时,比如上万甚至十多万时,首先会因获取所有文件数组时占用太多的存内,其次,以数组循环的方式逐个检索文件,所费的时间很长,效率很低。
[0007]( 2 )访问量增多,服务器负荷过重。
[0008]当访问要求检索文件的人员越来越多时,由于检索的效率低下,占用服务器内存过多,服务器会因耗费太多资源,而使响应的时间越来越长,客户端因长久得不到服务器的返回信息,而使用户体验感越来越差。
[0009](3)分类变化,管理不便。
[0010]当需要对文档的分类细化或更改时,因为使用文件夹管理,其分类完全依靠文件的名称,所以不得不对文件夹中的文件重新进行分目录,或移到新的文件夹中,或建立子文件夹,或需要将原先的文件夹重命名,需要大量更换文件的存储位置及新增或重命名文件夹,这个过程很容易出错,也会非常耗时耗力,很不方便。
[0011](4)访问权限设置复杂。
[0012]不同的用户,需要有访问不同内容文件的权限,使用文件夹管理,权限只能依托于设置文件夹的访问权限,当文件夹的层次与数量越来越多时,所需要的权限设定也越来越复杂。
[0013](5)无法预览。
[0014]有时使用者仅仅需要稍做查看,但因为文档在服务器的文件夹内,不得不要将其下载到本地,才能用本地的程序打开文档查看,不仅不方便,而且不必要地占用了网络资源。
【发明内容】
[0015]鉴于以上所述现有技术的缺点,本发明的目的在于提供一种企业电子文档管理服务端及系统,用于解决上述现有企业电子文档管理系统存取速度慢、效率低下的各种问题。
[0016]为实现上述目的及其他相关目的,本发明提供一种企业电子文档管理服务端,包括:数据库,包括按预设容量值分配的多个存储区块;文档存取模块,用于将电子文档按所述预设容量值分割为多个部分并分别存储至不同的所述存储区块并分配对应所述电子文档的辨识号,以及用于根据所述辨识号从所述不同存储区块将被分割的电子文档各部分还原成所述电子文档并读取;文档分类模块,用于根据文档格式对所述电子文档进行分类,所述分类包括:办公类文档、图片类文档、影音类文档;预览转换模块,用于根据所述文档分类,将符合预设文档分类的文档转换并另存为可预览格式的备份件;索引模块,用于解析所输入检索条件以提取检索关键词信息、以及对应电子文档内容栏位的文档内容栏位信息,并据以在所述电子文档内容对应栏位按所述关键词信息进行检索;其中,所述企业电子文档管理服务端通过网络连接有至少一客户端,接收从所述客户端上传的电子文档、提供所述客户端电子文档供下载、以及提供所述预览格式的备份件以供预览。
[0017]优选的,所述数据库为非关系型数据库。
[0018]优选的,所述预设栏位包括:摘要、正文、关键信息。
[0019]优选的,所述办公类文档包括office软件中的word、ppt、excel软件文档;所述图片类文档包括:文档后缀名为bmp、png、jpg、img的文档;所述影音类文档包括:文档后缀名为wav、rmvb、avi的文档。
[0020]优选的,所述预设文档分类包括:WOrd、ppt、excel格式文档,所述可预览格式为Flash格式。
[0021]优选的,所述索引模块包括软件搜索引擎,所述软件搜索引擎包括:luCene、S0lr、sphinx,所述索弓I模块还包括中文分词插件。
[0022]优选的,所述企业电子文档管理系统还包括服务端文档压缩处理模块,用于对所上传的压缩格式电子文档进行解压缩、以及将待下载的电子文档转换为压缩格式。
[0023]本发明还提供一种企业电子文档管理系统,包括:上述企业电子文档管理服务端、与所述企业电子文档管理服务端网络连接的至少一客户端。
[0024]优选的,所述客户端包括客户端文档压缩处理模块,用于对所下载的电子文档解压缩、以及将待上传的电子文档转换为压缩格式。
[0025]本发明还提供所述企业电子文档管理系统的另一实施方式,所述企业电子文档管理包括:上述企业电子文档管理服务端、与所述企业电子文档管理服务端网络连接的至少一客户端、以及文档压缩处理单元;所述文档压缩处理单元,用于将所述客户端的待上传电子文档转换为压缩格式、并在所述已压缩电子文档上传至所述服务端后进行解压缩;所述文档压缩处理单元,还用于将所述服务端的待下载电子文档转换为压缩格式、并在所述已压缩电子文档下载至所述客户端后进行解压缩。
[0026]如上所述,本发明的一种企业电子文档管理服务端及系统,服务端包括:按预设容量值分配的多个存储区的数据库、将电子文档按预设容量值分割存储在不同存储区及提取合并的存取模块、将所述电子文档进行分类的文档分类模块、根据所述文档分类将电子文档转换并另存为可预览格式的预览转换模块、可内容栏位检索的索引模块等,服务端通过网络连接客户端,所述系统采用大容量存取快速的非关系型数据库,具备文件预览功能便于查看,高效搜索引擎加速查询,服务端客户端间上传下载速度均对文档作压缩处理提升传输速度,解决企业电子文档管理系统存取的核心问题,实现高效率信息资源管理。
【专利附图】
【附图说明】
[0027]图1显示为本发明的一种企业电子文档管理服务端的实施例的结构示意图。
[0028]图2显示为本发明的一种企业电子文档管理系统的实施例的结构示意图。
[0029]图3显示为本发明的一种企业电子文档管理系统的另一实施例的结构示意图。
【具体实施方式】
[0030]以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的【具体实施方式】加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
[0031]请参阅图1,本发明提供的企业电子文档管理服务端1,包括:数据库11、文档存取模块12、文档分类模块13、预览转换模块14、索引模块15。
[0032]所述数据库11,包括按预设容量值分配的多个存储区块,而所述文档存取模块12,用于将电子文档按所述预设容量值分割为多个部分并分别存储至不同的所述存储区块并分配对应所述电子文档的辨识号(ID),以及用于根据所述辨识号从所述不同存储区块将被分割的电子文档各部分还原成所述电子文档并读取。在本实施例中,所述数据库为非关系型数据库(NoSQL),即采用NoSQL类型的数据库来保存文件,所谓NoSQL数据库,是指非传统的使用SQL语句查询的数据库,这种类型的数据库具有强大的快速存取的性能,有些更是具备了专门存储海量大文件的功能,可以将文件以二进制格式,存储在非关系型数据库的字段中,在实际的物理存储中,如果一个文件的大小超过设定的区块最大值,就会被所分割成多个区块,存入数据库设备的区块集中,最后,再把这些区块集存入数据库的文件管理系统中;在读取文件时,根据文件辨识号(ID)号可查到此文件字段对应的所有区块,根据数据库设定的存储规则排序,依次读取出保存的字节内容,还原成原先的文件。由于这些快速存取,以及专门的文件管理体系,使这类支持文档存储的数据库,有优于文件夹保存的快速,灵活,查询检索方便的特性,使用数据库相关的命令,可快速查出符合条件的文件的存储位置,而不需要在一个大类中循环查找,查询的结果信息可以分页的方式返回,节省的服务器的资源和查找时间;并且拥有可以存储上百万的文件而无需担心的扩容性能;同时,由于纳入数据库11的管理体系,在备份,安全,分布式管理等方面,都有足够的保证。除此之外,由于非关系型数据库的松散存储形式,无论何时需要更改分类或其它相关信息,只需随意添加字段,或修改字段内容,非常容易地可达到调整分类及相关检索规则的要求。
[0033]所述文档分类模块13,用于根据文档格式对所述电子文档进行分类,所述分类包括:办公类文档、图片类文档、影音类文档,而所述预览转换模块14,用于根据所述文档分类,将符合预设文档分类的文档转换并另存为可预览格式的备份件。[0034]在本实施例中,所述办公类文档包括office软件中的word、ppt、excel软件文档;所述图片类文档包括:文档后缀名为bmp、png、jpg、img的文档;所述影音类文档包括:文档后缀名为wav、rmvb、avi的文档,而所述预设文档分类包括:word、ppt、excel格式文档,所述可预览格式为如swf格式的Flash文件,并且flash文件仅为备份件,原电子文档还是存在所述数据库11以保护其完整性,另本实施例此处仅列举部分现有文件格式,其实只要是现有的各种相关格式的电子文档均可对应分类,并非以本实施例为限制。
[0035]具体来说,所述服务端I通过网页形式提供对电子文档的各种操作如检索、下载,即“云端”,为了在网页上实现预览文件,需要将所存存储的文件在存储的同时,预先做一个可供在网页上打开的流媒体格式的文档,这个流媒体格式文件的生成方式,主要可采用开源的openoffice等项目所提供的转换工具,将上传过来的原生的word、ppt、excel等文档,转换成如swf格式的flash文件,这个文件也同样可保存在NoSQL数据库11中,当用户需要预览上传的文档时,实际在网页上打开的是转换生成的flash文件。因为flash插件支持在浏览器上以流的方式展现,所以,用户能即时地在网页上浏览这个预生成的flash文件,而不需要将原先上传的word、ppt、excel等文件下载后再打开查看。这样无疑能较大的减少不必要的网络传输。
[0036]所述索引模块15,用于解析所输入检索条件以提取检索关键词信息、以及对应电子文档内容栏位的文档内容栏位信息,并据以在所述电子文档内容对应栏位按所述关键词信息进行检索。在本实施例中,所述预设栏位包括:摘要、正文、关键信息,所述关键信息可以是跟预设关键词库例如某个具体【技术领域】的关键词库相匹配的关键词信息等,所述栏位可以是电子文档编辑时预先设定形成的,也可以根据具体内容解析形成,当然优选的,自然是全文检索方式,对于上传文件中的关键内容或摘要,可以建立搜索索引,采用搜索引擎来实现全文搜索。全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。全文搜索的具体实现主要是依靠搜索引擎来实现的,目前使用广泛的站内开源搜索引擎,有lucene、solr、sphinx等,在使用这些搜索引擎的同时,需要确立分词的插件,分词是搜索的基本要素,英语的词组是非常容易区分的,只需以空格来区分即可,但中文的完全不同,需要根据单个汉字组成的词语来区分,目前已有相关的几种汉语分词插件,需要将这些中文分词插件配置到搜索引擎中,来实现中文词组的分析。使用搜索引擎来提供文件中摘要内容的检索,将极大地提高查找相关内容文档的效率,可供查找的线索,也不再局限于文档分类,而是扩展到了能够查找文件中出现的相关内容信息。
[0037]所述企业电子文档管理服务端I通过网络连接有至少一客户端2,接收从所述客户端2上传的电子文档、提供所述客户端2电子文档供下载、以及提供所述预览格式的备份件以供预览。在本实施例中,所述企业电子文档管理系统还包括服务端文档压缩处理模块16,用于对所上传的压缩格式电子文档进行解压缩、以及将待下载的电子文档转换为压缩格式,所述压缩格式如zip、rar等,在文档被下载前先进行压缩有利于加快下载速度,对所收到的客户端2上传来的电子文档解压缩便于直接存储。
[0038]如图2所示,本发明还提供一种企业电子文档管理系统,包括:所述企业电子文档管理服务端1、与所述企业电子文档管理服务端I网络连接的至少一客户端2,所述客户端2例如为台式机、笔记本电脑、手机、平板电脑等,而且一般企业会有大量员工,因此所述客户端2的数量可不止为一个,可以是几个、几十个、成百上千乃至更多。
[0039]在本实施例中,所述网络连接可以是互联网、企业内部局域网、教育网等等,既可以是有线网络,也可以是无线网络如wifi ;所述客户端2包括客户端文档压缩处理模块21,用于对所下载的电子文档解压缩、以及将待上传的电子文档转换为压缩格式,结合所述服务端I对电子文档的压缩、解压缩处理,从而配合实现电子文档被上传和下载前的压缩处理,以及被上传和下载后的解压缩处理。
[0040]具体来说,文件经过压缩后再上传下载会提高速度,因为它会更小,在网络上传输的时间也会更少。但一般用户,在上传时很少会有压缩后再上传的意识,另外一个原因,用户使用zip,rar等工具压缩后,将是生成另外一个压缩文件,这样无法直接在网页上预览了。所以,在软件处理上传下载时,就需要增加压缩和解压缩环节,那就是用户确定上传文档时,软件系统自动来将指定的文档压缩,压缩完成后,再上传,上传到服务器上后,再解压缩还原成用户指定的原生文件。同样,在下载时,也需要先下载压缩后的文件,下载完成时,再还原成原生文件。这样,能大大缩短上传下载的速度,节省网络资源。
[0041]如图3所示,在另一实施例中,所述企业电子文档管理系统包括:上述企业电子文档管理服务端1、与所述企业电子文档管理服务端I网络连接的客户端2、以及文档压缩处理单元3 ;所述文档压缩处理单元3,用于将所述客户端2的待上传电子文档转换为压缩格式、并在所述已压缩电子文档上传至所述服务端I后进行解压缩;所述文档压缩处理单元3,还用于将所述服务端I的待下载电子文档转换为压缩格式、并在所述已压缩电子文档下载至所述客户端2后进行解压缩。
[0042]相比前一实施例,主要差异在于可以将所述服务端文档压缩处理模块16、客户端文档压缩处理模块21整合为一独立单元,安装在服务端I和客户端2之间例如中继、路由等,如此可以减小服务端1、客户端2的处理压力,当然应当还有其他实施方式,均可在本发明所提供技术方案上结合实际需求加以变更,非以本实施例为限。
[0043]上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属【技术领域】中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
【权利要求】
1.一种企业电子文档管理服务端,其特征在于,包括: 数据库,包括按预设容量值分配的多个存储区块; 文档存取模块,用于将电子文档按所述预设容量值分割为多个部分并分别存储至不同的所述存储区块并分配对应所述电子文档的辨识号;以及用于根据所述辨识号从所述不同存储区块将被分割的电子文档各部分还原成所述电子文档并读取; 文档分类模块,用于对所述电子文档进行分类,所述分类包括:办公类文档、图片类文档、影音类文档; 预览转换模块,用于根据所述文档分类,将符合预设文档分类的文档转换并另存为可预览格式的备份件; 索引模块,用于解析所输入检索条件以提取检索关键词信息、以及对应电子文档内容栏位的文档内容栏位信息,并据以在所述电子文档内容对应栏位按所述关键词信息进行检索; 其中,所述企业电子文档管理服务端通过网络连接有至少一客户端,接收从所述客户端上传的电子文档、提供所述客户端电子文档供下载、以及提供所述预览格式的备份件以供预览。
2.根据权利要求1所述的企业电子文档管理服务端,其特征在于:所述数据库为非关系型数据库。
3.根据权利要求1所述的企业电子文档管理服务端,其特征在于:所述预设栏位包括:摘要、正文、关键信息。`
4.根据权利要求1所述的企业电子文档管理服务端,其特征在于:所述办公类文档包括office软件中的word、ppt、excel软件文档;所述图片类文档包括:文档后缀名为bmp、png、jpg、img的文档;所述影音类文档包括:文档后缀名为wav、rmvb、avi的文档。
5.根据权利要求4所述的企业电子文档管理服务端,其特征在于:所述预设文档分类包括:word、ppt、excel格式文档,所述可预览格式为Flash格式。
6.根据权利要求1所述的企业电子文档管理服务端,其特征在于:所述索引模块包括软件搜索引擎,所述软件搜索引擎包括:luCene、S0lr、sphinx,所述索引模块还包括中文分词插件。
7.根据权利要求1所述的企业电子文档管理服务端,其特征在于,还包括服务端文档压缩处理模块,用于对所上传的压缩格式电子文档进行解压缩、以及将待下载的电子文档转换为压缩格式。
8.一种企业电子文档管理系统,其特征在于,包括:如权利要求1至7中任一项的企业电子文档管理服务端、与所述企业电子文档管理服务端网络连接的至少一客户端。
9.根据权利要求8所述的企业电子文档管理系统,其特征在于,所述客户端包括客户端文档压缩处理模块,用于对所下载的电子文档解压缩、以及将待上传的电子文档转换为压缩格式。
10.一种企业电子文档管理系统,其特征在于,包括:如权利要求1至7中任一项的企业电子文档管理服务端、与所述企业电子文档管理服务端网络连接的至少一客户端、以及文档压缩处理单元; 所述文档压缩处理单元,用于将所述客户端的待上传电子文档转换为压缩格式、并在所述已压缩电子文档上传至所述服务端后进行解压缩; 所述文档压缩处理单元, 还用于将所述服务端的待下载电子文档转换为压缩格式、并在所述已压缩电子文档下载至所述客户端后进行解压缩。
【文档编号】G06F17/30GK103778202SQ201410012297
【公开日】2014年5月7日 申请日期:2014年1月10日 优先权日:2014年1月10日
【发明者】崔小波 申请人:江苏哲勤科技有限公司