专利名称:一种数字化集成加工的档案系统的制作方法
技术领域:
本实用新型涉及档案管理技术领域,尤其设计一种数字化集成加工的档 案系统。
背景技术:
档案管理对于政府机关或企事业单位来说,是一项非常重要的工作。档 案包括各类公文,例如己经归档的收文、发文、签报、会议纪要、通告、申 请、大事记等文件。管理的档案种类包括,文书档案、科技档案、照片档案、 实物档案、声像档案、会计档案等。
传统的档案信息一般用纸质文档存储在档案室里面,査找检索起来非常
费时,存储档案空间很大,维护起来不方便;备份档案需要使用大量的资源, 而且人工处理可能产生差错。于是,近年来提出了档案信息数字化。档案信 息数字化就是把纸质文档通过扫描,录入信息到计算机数据库中,使用计算 机存储档案信息,数字化的好处是,检索快捷方便、容易实时同步备份、存 储空间小,维护方便、安全。
现有的档案管理方案,首先人工将文件内容录入到档案数据库中,然后 人工使用扫描仪对纸质文件进行扫描转换为电子文件,保存到文件数据库以 备校对。现有的档案管理方案存在需要花费大量人力物力的问题,档案管理 成本高。
实用新型内容
本实用新型提供一种可以降低档案管理成本的数字化集成加工的档案系统。
一种数字化集成加工的档案系统,包括用于扫描纸质文件并获得电子 文件的扫描设备,用于将电子文件进行图像处理并获得图像文件的图像处理 设备,用于将图像文件识别为元数据的数据识别设备,用于保存档案数据库
的档案存储服务器,用于将元数据填入档案数据库相应栏目的数据处理设备;
扫描设备与图像处理设备连接,图像处理设备与数据识别设备连接,数据处 理设备与数据识别设备、档案存储服务器连接。
其中,进一步包括用于保存电子文件的文件存储服务器,和用于将电子 文件与档案数据库挂接的电子文件挂接设备,文件存储服务器和扫描设备连 接,电子文件挂接设备与文件存储服务器、档案存储服务器连接。
其中,数据识别设备为使用反向传播神经网络算法的数据识别设备。
其中,扫描设备为平板式扫描仪。
其中,扫描设备为文件扫描仪。
从以上的技术方案可以看出,本实用新型的数字化集成加工的档案系统 包括,用于扫描纸质文件并获得电子文件的扫描设备,用于将电子文件进行 图像处理并获得图像文件的图像处理设备,用于将图像文件识别为元数据的 数据识别设备,用于保存档案数据库的档案存储服务器,用于将元数据填入
档案数据库相应栏目的数据处理设备;扫描设备与图像处理设备连接,图像 处理设备与数据识别设备连接,数据处理设备与数据识别设备、档案存储服 务器连接;本技术方案对纸质文件进行扫描,并自动识别元数据,把元数据 保存到对应的档案数据库中,从而节省人力物力,降低档案管理成本。
图1为本实用新型实施例的档案系统示意图。
具体实施方式
请参考图l,为本实用新型实施例的档案系统示意图。
本实施例的数字化集成加工的档案系统,包括用于扫描纸质文件并获 得电子文件的扫描设备101,用于将电子文件进行图像处理并获得图像文件
的图像处理设备102,用于将图像文件识别为元数据的数据识别设备103,用 于保存档案数据库的档案存储服务器105,用于将元数据填入档案数据库相 应栏目的数据处理设备104;扫描设备101与图像处理设备102连接,图像 处理设备102与数据识别设备103连接,数据处理设备104与数据识别设备 103、档案存储服务器105连接。本技术方案对纸质文件进行扫描,并自动识 别元数据,把元数据保存到对应的档案数据库中,从而节省人力物力,降低 档案管理成本。
在本实施例中,扫描设备101为平板式扫描仪或文件扫描仪,当然也可 以是其它类型的扫描仪,扫描设备101对纸质文件进行扫描,获得该纸质文 件的电子文件;扫描设备101将电子文件传输给图像处理设备102。
因为纸质差异和扫描条件等因素的影响,扫描出来的电子文件可能不符 合识别的要求,需要使用图像处理设备102对电子文件进行图像处理,获得 符合识别要求的图像文件。对图像的处理包括自动倾斜校正,去黑边,去 白页,加粗,将A3切割为A4等。
图像处理设备102将图像文件发送给数据识别设备103。本实施例的数据识别设备103使用的是光学字符识别(OCR, Optical Character Recognition) 方式,通过扫描获取纸张上的文字图像信息,可以利用不同识别算法来分析 文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中。 OCR是一种快捷、省力的文字识别方式,OCR不仅能识别黑白印刷体汉字, 还能识别灰度和彩色印刷体汉字,识别速度很快,识别正确率达到99%以上; 可识别宋体、黑体、楷体等多种字体的简、繁体;可对多种字体、不同字号 的混排进行识别。OCR还能识别图像、表格。
上述数据识别设备103可以为使用反向传播(BP, back propagation)神 经网络算法的数据识别设备103;即使用BP神经网络算法来分析文字形态特 征,判断出汉字的标准编码。BP神经网络算法,是一个单向传播的多层前馈 网络,输入信号从输入层节点,依次传过各隐含层节点,然后传到输出层节 点,每一层节点的输出只影响下一层节点的输入,使用该算法的识别效果好。
上述元数据为以栏目为单元的字段。因为档案数据库有自身存储的规则, 每个栏目对应特定的字段,在识别出元数据后,数据处理设备104将元数据 填入档案存储服务器105的档案数据库相应栏目。比如政府文件通常包括标 题和文号,把标题和文号作为元数据,填入档案数据库相应栏目。
为了保存原始的电子文件和将电子文件与档案数据库挂接,本实施例的 档案系统进一步包括用于保存电子文件的文件存储服务器107,和用于将电 子文件与档案数据库挂接的电子文件挂接设备106,文件存储服务器107和 扫描设备101连接,从扫描设备101中获取电子文件,电子文件挂接设备106 与文件存储服务器107、档案存储服务器105连接。当对档案数据库里面的 数据有疑义时,可以调出相应的电子文件进行复核。以上内容仅为本实用新型的较佳实施例,对于本领域的普通技术人员, 依据本实用新型的思想,在具体实施方式
及应用范围上均会有改变之处,本 说明书内容不应理解为对本实用新型的限制。
权利要求1.一种数字化集成加工的档案系统,其特征在于,包括用于扫描纸质文件并获得电子文件的扫描设备,用于将所述电子文件进行图像处理并获得图像文件的图像处理设备,用于将所述图像文件识别为元数据的数据识别设备,用于保存档案数据库的档案存储服务器,用于将所述元数据填入档案数据库相应栏目的数据处理设备;扫描设备与图像处理设备连接,图像处理设备与数据识别设备连接,数据处理设备与数据识别设备、档案存储服务器连接。
2. 根据权利要求1所述的数字化集成加工的档案系统,其特征在于,进 一步包括用于保存所述电子文件的文件存储服务器,和用于将所述电子文件 与档案数据库挂接的电子文件挂接设备,文件存储服务器和扫描设备连接, 电子文件挂接设备与文件存储服务器、档案存储服务器连接。
3. 根据权利要求1所述的数字化集成加工的档案系统,其特征在于,所 述数据识别设备为使用反向传播神经网络算法的数据识别设备。
4. 根据权利要求1至3任意一项所述的数字化集成加工的档案系统,其 特征在于,所述扫描设备为平板式扫描仪。
5. 根据权利要求1至3任意一项所述的数字化集成加工的档案系统,其 特征在于,所述扫描设备为文件扫描仪。
专利摘要本实用新型涉及档案管理技术领域,尤其设计一种数字化集成加工的档案系统。本实用新型包括,用于扫描纸质文件并获得电子文件的扫描设备,用于将所述电子文件进行图像处理并获得图像文件的图像处理设备,用于将所述图像文件识别为元数据的数据识别设备,用于保存档案数据库的档案存储服务器,用于将所述元数据填入档案数据库相应栏目的数据处理设备;扫描设备与图像处理设备连接,图像处理设备与数据识别设备连接,数据处理设备与数据识别设备、档案存储服务器连接。本技术方案对纸质文件进行扫描,并自动识别元数据,把元数据保存到对应的档案数据库中,从而节省人力物力,降低档案管理成本。
文档编号G06Q10/06GK201222256SQ20082005082
公开日2009年4月15日 申请日期2008年7月18日 优先权日2008年7月18日
发明者江善东 申请人:东莞市万维网络科技信息有限公司