专利名称:一种电子文件归档的安全存储方法及系统的制作方法
技术领域:
本发 明涉及电子文件归档领域,特别涉及一种电子文件归档的安全存储方法及 系统。
背景技术:
电子文件在档案局归档时,电子文件的三性保证问题是决定电子文件是否具有 “档案”属性的关键问题。对此国家标准GB/T18894-2002《电子文件归档与管理规
范》中对电子文件的真实性、完整性和有效性进行了明确定义,确定了三性问题在电子 文件管理领域的重要地位。国内档案界由此展开了针对电子文件三性问题的研究热潮, 近年来也取得一定的研究成果,但这些成果基本上都是局限在理论层面,在具体的实现 手段和技术措施上如何完成电子文件的三性保证,迄今为止依然没有取得突破性进展, 这也是目前电子文件归档依然只能作为纸质文件归档的补充手段的根本原因。
发明内容
本发明的目的是提供一种电子文件归档的安全存储方法及系统,其能有效保证 电子文件归档时的真实性、完整性及有效性。一方面,本发明提供一种电子文件归档的安全存储方法,包括以下步骤在提交端,对归档前的电子文件包进行摘要运算并生成第一摘要码,将所述电 子文件及其第一摘要码输出;在接收端,接收上步骤输出的所述电子文件包及其摘要码,对所述电子文件进 行二次摘要运算并生成第二摘要码;对所述第一摘要码和第二摘要码进行比对,若相同则将所述电子文件包归档存 储,若不同则拒绝归档。所述摘要运算为数字摘要运算法,其生成128位摘要码。在将所述电子文件包归档存储时还包括以下步骤设置CA认证服务器以及PDF转换服务器;通过PDF转换服务器将所述电子文件包转换为PDF格式;通过硬件密钥读取所述CA认证服务器中的数字证书,并调用PDF工具包中的数 字签名接口对所述PDF格式的电子文件包进行数字签名;将经数字签名的PDF格式电子文件包归档存储。在将所述电子文件包归档存储时还包括以下步骤将所述电子文件包的元数据封装为XML格式;调用PDF工具包中的元数据嵌入接口,将XML格式元数据作为PDF —个文件 层嵌入所述电子文件中。另一方面,本发明还提供一种电子文件归档的安全存储系统,包括应用服务器,连接所述系统各单元并输出控制指令;
位于提交端的第一摘要运算单元,对归档前的电子文件包进行摘要运算并生成 第一摘要码,将所述电子文件及其第一摘要码输出;位于应用服务器的第二摘要运算单元,接收所述第一摘要运算单元输出的所述 电子文件包及其摘要码,对所述电子文件进行二次摘要运算并生成第二摘要码;位于应用 服务器的比较单元,对所述第一摘要码和第二摘要码进行比对,若相 同则将所述电子文件包输出并归档存储;数据库,连接所述比较单元,存储所述比较单元输出的电子文件。所述第一摘要运算单元和第二摘要运算单元基于数字摘要运算法进行摘要运 算,并生成128位摘要码。所述系统还包括CA认证服务器以及PDF转换服务器,所述PDF转换服务器将 所述电子文件包转换为PDF格式,所述CA认证服务器根据硬件密钥输出数字证书,所述 应用服务器通过PDF工具包中的数字签名接口对所述PDF格式的电子文件包进行数字签 名,并将经数字签名的PDF格式电子文件包归档存储于所述数据库。所述系统还包括以下模块将所述电子文件包的元数据封装为XML格式的模块;调用PDF工具包中的元数据嵌入接口,将XML格式元数据作为PDF —个文件 层嵌入所述电子文件中的模块。采用本发明所述的一种电子文件归档的安全存储方法及系统,其对电子文件的 真实性进行两阶段保证,第一阶段是通过数字摘要算法实现电子文件归档的真实性保 证,第二阶段是通过数字签名来实现归档后的电子文件的真实性保证。另外,本发明还 通过设置PDF转换服务器,以及在文件归档时将元数据作为PDF的一个文件层嵌入等方 法实现电子文件的有效性和完整性的保证。
图1是本发明所述方法的流程图;图2是本发明所述数字摘要算法流程图;图3是本发明所述系统的原理框图;图4为本发明所述PDF文件的三个文件层示意图。
具体实施例方式下面结合附图和实施例进一步说明本发明的技术方案。参见图1,本发明提供一种电子文件归档的安全存储方法100,包括以下步骤101、在提交端,对归档前的电子文件包进行摘要运算并生成第一摘要码,将所 述电子文件及其第一摘要码输出;102、在接收端,接收上步骤输出的所述电子文件包及其摘要码,对所述电子文 件进行二次摘要运算并生成第二摘要码;103、对所述第一摘要码和第二摘要码进行比对,若相同则转下步骤,若不同则 拒绝归档。104、将所述电子文件包归档存储。
作为一实施例,所述摘要运算为数字摘要运算法,其生成128位摘要码,如SHA-I数字摘要运算法,参见图2,在电子文件提交归档之前和归档接收之前分别采用 SHA-I数字摘要算法对归档电子文件包进行摘要运算,生成128位“数字指纹”(摘要 码),通过比对两次生成的“数字指纹”是否一致来判断归档电子文件的真实性。由于 SHA-I是一个不可逆的字符串变换算法,换句话说就是,即使看到源程序和算法描述, 也无法将一个SHA-I的值变换回原始的字符串,因此从数学原理上来说,SHA-I反演算 法有无穷多个解,是不可破解的。对于一个确定的文档,用摘要算法生成的128位“数字指纹”是唯一的,但对 于一个和原始文档有着一个微小变化的文档(比如病毒感染、传输过程不够完整、中途 被人篡改等),用摘要算法生成的128位“数字指纹”和原始“数字指纹”有着巨大的 差别,这样只需要前后两次生成的“数字指纹”是一致的,就能判定档案管理员接受到 的文档就是业务人员提交归档的归档,这样就保证了归档过程的真实性。另夕卜,如果认为SHA-I摘要算法强度不够,还可以采用强度更高的SHA-128/ SHA-256摘要算法。当然算法的强度越高,破解难度也越大,但同时运算时间也越长。参见图3,本发明还提供一种电子文件归档的安全存储系统200,包括应用服务器210,连接所述系统各单元并输出控制指令。位于提交端的第一摘要运算单元220,对归档前的电子文件包进行摘要运算并生 成第一摘要码,将所述电子文件及其第一摘要码输出。位于应用服务器210的第二摘要运算单元211,接收所述第一摘要运算单元220 输出的所述电子文件包及其摘要码,对所述电子文件进行二次摘要运算并生成第二摘要 码。作为一实施例,所述第一摘要运算单元220和第二摘要运算单元211基于SHA-I数 字摘要运算法进行摘要运算,并生成128位摘要码。位于应用服务器210的比较单元212,对所述第一摘要码和第二摘要码进行比 对,若相同则将所述电子文件包输出并归档存储。数据库230,连接所述比较单元212,存储所述比较单元212输出的电子文件。所述系统200还包括CA认证服务器240以及PDF转换服务器250,所述PDF转 换服务器250将所述电子文件包转换为PDF格式,所述CA认证服务器根据硬件密钥输出 数字证书,所述应用服务器210通过PDF工具包中的数字签名接口对所述PDF格式的电 子文件包进行数字签名,并将经数字签名的PDF格式电子文件包归档存储于所述数据库 230。另外,所述系统还包括以下模块将所述电子文件包的元数据封装为XML格式的模块。调用PDF工具包中的元 数据嵌入接口,将XML格式元数据作为PDF —个文件层嵌入所述电子文件中的模块。下面通过真实性、完整性和有效性这三方面来进一步介绍本发明一,真实性保证1,保证方法结合机关立档单位电子文件归档的实际情况,采用“两阶段真实性保证”来解 决即将电子文件的真实性保证分成归档前(业务部门)和归档后(档案部门)两个阶段,分别采取一定的技术措施进行真实性,分别称为“电子文件归档的真实性保 证”以及“归档电子文件的真实性保证”1.电子文件归档的真实性保证在业务部门提交归档时,以“件”为单位, 将电子文件的元数据、正文、附件和过程信息一起打包归档;并加业务人员的数字签名 (有CA认证条件的单位)进行真实性保证,或者采用SHA-I等数字摘要算法(没有CA 认证条件的单位)进行防篡改处理;2.归档电子文件的真实性保证档案部门接收归档电子文件之后,在完成完整 性、有效性检查并整理完毕之后,加档案管理员的数字签名(数字摘要)保证其归档之后 的真实性。2,电子文件归档的真实性保证参见图2,图2显示了电子文件归档阶段的真实性保证的流程,上面已经描述过 了。3,归档电子文件的真实性保证对于具备CA认证条件的单位,可以通过调用USB-Key (硬件密钥)证书访问接 口,从客户端USB-Key中读取CA认证服务器240中的数字证书,并通过调用PDF转换 服务器250中的CES PDF SDK (PDF工具包)中的数字签名接口,用USB-Key中的证书 对PDF文件实现签名操作。比如档案管理员接收到归档电子文件并完成归档整理操作之后,用他自己的 USB-Key对PDF文档加上数字签名,起到真实性保护的目的。另外,考虑到档案管理员一次接收的文件比较多,如果需要对每个文件逐个进 行签名操作,操作非常繁琐,工作量很大。因此,可由系统实现后台批量签名操作,用 户只需要点击一次“签名”按钮,当前记录对应的所有电子文件一次性批量完成签名, 这样就大大方便了档案管理员的操作。二,完整性保证首先,参照上海市档案局《上海市电子文件归档管理实施指南(征求意见稿)》 和国家档案局《电子文件元数据标准(征求意见稿)》中有关元数据的标准定义设计通用 软件的数据接口和完整性校验条件,当电子文件提交归档时,按照标准的要求对其元数 据的完整性进行校验,并提醒档案管理员元数据是否完整。其次,在电子文件接收时系统可以自动获取部分电子文件环境信息,比如文件 大小、文件类型等,减少用户元数据补充著录的工作量。最后,归档时将元数据封装成XML格式,并通过调用CES PDF SDK中的元数 据嵌入接口将XML元数据作为PDF的一个文件层嵌入电子文件中,使元数据依附于电子 文件,任何时间和环境下都能读取比对,不受系统环境限制,进一步保证了归档电子文 件的完整性。这样一来,参见图4,PDF文件便有了三个文件层文件形式层、文件内 容层以及元数据层。 三,有效性保证1、对于PDF格式的归档电子文件进行可读性和规范性检测,保证其可读并符合 PDF1.1以上标准;对于非PDF格式的归档电子文件提供PDF格式转换功能,确保其环境 无关性。
比如,对于非标准格式的PDF转换功能,可以将PDF转换服务放在服务器端自动运行,无需用户干预,由服务器在后台实现批量自动转换,这样就方便了用户操作。2、对存放电子文件的载体进行检测,包括随机抽样检测、指定抽样检测、全盘 完整检测等,提供完备的载体备份记录,并可恢复被检测载体中的损坏文件。需要说明的是,本发明所述的系统200和所述的方法100在原理以及实现过程中 基本相同或类似,故不再分开描述。本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发 明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上实施例的 变化、变型都将落在本发明的权利要求书范围内。
权利要求
1.一种电子文件归档的安全存储方法,其特征在于,包括以下步骤在提交端,对归档前的电子文件包进行摘要运算并生成第一摘要码,将所述电子文 件及其第一摘要码输出;在接收端,接收上步骤输出的所述电子文件包及其摘要码,对所述电子文件进行二 次摘要运算并生成第二摘要码;对所述第一摘要码和第二摘要码进行比对,若相同则将所述电子文件包归档存储, 若不同则拒绝归档。
2.如权利要求1所述的方法,其特征在于,所述摘要运算为数字摘要运算法,其生成 128位摘要码。
3.如权利要求2所述的方法,其特征在于,在将所述电子文件包归档存储时还包括以 下步骤设置CA认证服务器以及PDF转换服务器;通过PDF转换服务器将所述电子文件包转换为PDF格式;通过硬件密钥读取所述CA认证服务器中的数字证书,并调用PDF工具包中的数字签 名接口对所述PDF格式的电子文件包进行数字签名; 将经数字签名的PDF格式电子文件包归档存储。
4.如权利要求2所述的方法,其特征在于,在将所述电子文件包归档存储时还包括以 下步骤将所述电子文件包的元数据封装为XML格式;调用PDF工具包中的元数据嵌入接口,将XML格式元数据作为PDF —个文件层嵌 入所述电子文件中。
5.—种电子文件归档的安全存储系统,其特征在于,包括 应用服务器,连接所述系统各单元并输出控制指令;位于提交端的第一摘要运算单元,对归档前的电子文件包进行摘要运算并生成第一 摘要码,将所述电子文件及其第一摘要码输出;位于应用服务器的第二摘要运算单元,接收所述第一摘要运算单元输出的所述电子 文件包及其摘要码,对所述电子文件进行二次摘要运算并生成第二摘要码;位于应用服务器的比较单元,对所述第一摘要码和第二摘要码进行比对,若相同则 将所述电子文件包输出并归档存储;数据库,连接所述比较单元,存储所述比较单元输出的电子文件。
6.如权利要求5所述的系统,其特征在于,所述第一摘要运算单元和第二摘要运算单 元基于数字摘要运算法进行摘要运算,并生成128位摘要码。
7.如权利要求6所述的系统,其特征在于,所述系统还包括CA认证服务器以及PDF 转换服务器,所述PDF转换服务器将所述电子文件包转换为PDF格式,所述CA认证服 务器根据硬件密钥输出数字证书,所述应用服务器通过PDF工具包中的数字签名接口对 所述PDF格式的电子文件包进行数字签名,并将经数字签名的PDF格式电子文件包归档 存储于所述数据库。
8.如权利要求6所述的系统,其特征在于,所述系统还包括以下模块 将所述电子文件包的元数据封装为XML格式的模块;调用PDF工具包中的元数据嵌入接口,将XML格式元数据作为PDF —个文件层嵌 入所述电子文件中的模块。
全文摘要
本发明揭示了一种电子文件归档的安全存储方法及系统,其对电子文件的真实性进行两阶段保证,第一阶段是通过数字摘要算法实现电子文件归档的真实性保证,第二阶段是通过数字签名来实现归档后的电子文件的真实性保证。另外,本发明还通过设置PDF转换服务器,以及在文件归档时将元数据作为PDF的一个文件层嵌入等方法实现电子文件的有效性和完整性的保证。
文档编号G06F17/30GK102024002SQ20091019548
公开日2011年4月20日 申请日期2009年9月10日 优先权日2009年9月10日
发明者张二伟, 张曙华, 李志卿, 杨安荣, 路斌 申请人:上海中信信息发展股份有限公司