纸质档案电子化归档方法、装置及终端设备与流程

文档序号:19064980发布日期:2019-11-06 02:14阅读:662来源:国知局
纸质档案电子化归档方法、装置及终端设备与流程

本发明属于档案管理技术领域,更具体地说,是涉及一种纸质档案电子化归档方法、装置及终端设备。



背景技术:

目前,许多单位或企业的纸质档案越来越多,这些档案查询起来非常的耗时和不便,而且随着年代久远和火灾水灾,许多纸质档案损毁严重。随着科学技术的发展,越来越多的单位或企业开始进行纸质档案的电子化存储和管理。

现有技术中纸质档案的电子化归档方法主要为:首先把纸质档案扫描成图像,然后对图像进行处理和识别得到的关键字信息,再根据识别得到的关键字信息在已有的电子档案信息进行查找和比对,比对成功后进行归档。但这种方法存在一个明显的缺陷:由于待归档纸质档案和已有的电子档案数量较大,档案信息的查找和比对过程会耗费大量时间,因而严重影响了纸质档案归档的效率。



技术实现要素:

本发明的目的在于提供一种纸质档案电子化归档方法及装置,以提高纸质档案归档的效率。

本发明实施例的第一方面,提供了一种纸质档案电子化归档方法,包括:

确定所述待归档纸质档案的第一分类,并获取待归档纸质档案的图像信息;

基于待归档纸质档案的图像信息提取待归档纸质档案的关键字信息;

检测所述待归档纸质档案的标题信息是否与第一分类下的子分类名称匹配,若所述待归档纸质档案的标题信息与第一分类下的子分类名称匹配,则根据第一分类下的子分类名称确定待归档纸质档案的子分类标识,并检测所述待归档纸质档案的关键字信息是否与电子档案基础信息库中同子分类标识的电子档案的关键字匹配;

若所述待归档纸质档案的关键字信息与电子档案基础信息库中同子分类标识的某一电子档案的关键字匹配,则根据电子档案基础信息库中同子分类标识的电子档案的档案信息对待归档纸质档案进行归档。

本发明实施例的第二方面,提供了一种纸质档案电子化归档装置,包括:

档案获取模块,用于确定所述待归档纸质档案的第一分类,并获取待归档纸质档案的图像信息;

信息提取模块,用于基于待归档纸质档案的图像信息提取待归档纸质档案的关键字信息;

第一分类检测模块,用于检测所述待归档纸质档案的标题信息是否与第一分类下的子分类名称匹配,若所述待归档纸质档案的标题信息与第一分类下的子分类名称匹配,则根据第一分类下的子分类名称确定待归档纸质档案的子分类标识,并检测所述待归档纸质档案的关键字信息是否与电子档案基础信息库中同子分类标识的电子档案的关键字匹配;

第一匹配模块,用于若所述待归档纸质档案的关键字信息与电子档案基础信息库中同子分类标识的某一电子档案的关键字匹配,则根据电子档案基础信息库中同子分类标识的电子档案的档案信息对待归档纸质档案进行归档。

本发明实施例的第三方面,提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的纸质档案电子化归档方法的步骤。

本发明实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的纸质档案电子化归档方法的步骤。

本发明提供的纸质档案电子化归档方法、装置及终端设备的有益效果在于:本发明实施例先确定了待归档纸质档案的第一分类,在第一分类的基础上确定了待归档纸质档案的子分类标识,再以待归档纸质档案的子分类标识为基础在电子档案基础信息库中进行对应档案信息的查找和比对,大大减少了档案信息查找和比对的数据量,从而有效提高了纸质档案归档的效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的纸质档案电子化归档方法的流程示意图;

图2为本发明一实施例提供的纸质档案电子化归档装置的结构框图;

图3为本发明一实施例提供的终端设备的示意框图。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

请参考图1,图1为本发明一实施例提供的纸质档案电子化归档方法的流程示意图。该方法包括:

s101:确定待归档纸质档案的第一分类,并获取待归档纸质档案的图像信息。

在本实施例中,为了快速进行归档,可对电子档案基础信息库中的档案信息进行分类。具体分类规则可以为:根据现行档案组实体卷的标准建立第一分类,再根据档案中具体的名称划分子类(即确定第一分类下的子分类)。例如,可以人员档案作为第一分类,以出生档案、死亡档案、迁移档案等作为人员档案的子分类(也即第一分类的子分类)。

在确定电子档案基础信息库的分类之后,基于电子档案基础信息库的分类确定待归档纸质档案的第一分类。例如,若待归档纸质档案的档案信息主要是人员信息,则待归档纸质档案的第一分类即为人员档案。

其中,电子档案基础信息库需要事先构建,电子档案基础信息库的构建方法可以为:

首先提取现有电子档案管理系统中的档案数据,再根据预先设定的关键字和现有电子档案管理系统中的档案数据建立电子档案基础信息库。其中,预先设定的关键字包括但不限于标题信息、姓名、出生年月、归档单位编码和名称等。进行分类后的电子档案基础信息库的关键字还会加入分类名称、分类级别、分类编码等。

s102:基于待归档纸质档案的图像信息提取待归档纸质档案的关键字信息。

在本实施例中,可基于ocr(opticalcharacterrecognition,光学字符识别)技术对待归档纸质档案进行扫描,并自动识别出待归档纸质档案的关键字信息。其中,待归档纸质档案的关键字信息包括但不限于身份证号、姓名、出生年月和档案文书标题信息等。

s103:检测待归档纸质档案的标题信息是否与第一分类下的子分类名称匹配,若待归档纸质档案的标题信息与第一分类下的子分类名称匹配,则根据第一分类下的子分类名称确定待归档纸质档案的子分类标识,并检测待归档纸质档案的关键字信息是否与电子档案基础信息库中同子分类标识的电子档案的关键字匹配。

在本实施例中,子分类标识即为子分类编码。

s104:若待归档纸质档案的关键字信息与电子档案基础信息库中同子分类标识的某一电子档案的关键字匹配,则根据电子档案基础信息库中同子分类标识的电子档案的档案信息对待归档纸质档案进行归档。

在本实施例中,若待归档纸质档案的关键字信息与电子档案基础信息库中同子分类标识的某一电子档案的关键字匹配,则基于该与待归档纸质档案的关键字信息匹配的电子档案的档案信息对待归档纸质档案进行归档。

若待归档纸质档案的关键字信息与电子档案基础信息库中同子分类标识的任一电子档案的关键字都不匹配,则需手动添加此待归档纸质档案至归档信息库进行归档。

从上述描述可知,本发明实施例提供的纸质档案电子化归档方法先确定了待归档纸质档案的第一分类,在第一分类的基础上确定了待归档纸质档案的子分类标识,再以待归档纸质档案的子分类标识为基础在电子档案基础信息库中进行对应档案信息的查找和比对,大大减少了档案信息查找和比对的数据量,从而有效提高了纸质档案归档的效率。

可选地,作为本发明实施例提供的纸质档案电子化归档方法的一种具体实施方式,在检测待归档纸质档案的标题信息是否与第一分类下的子分类名称匹配之前,还可以包括:

检测待归档纸质档案的关键字信息提取的完整性,若待归档纸质档案的关键字信息提取不完整,则使用第一标记值对待归档纸质档案进行标记。

在本实施例中,提取不完整包括:字迹无法识别导致的提取失败或提取结果乱码、提取结果中未包含匹配所需的关键字。

可选地,作为本发明实施例提供的纸质档案电子化归档方法的一种具体实施方式,还包括:

若待归档纸质档案的标题信息与第一分类下的子分类名称不匹配,则使用第二标记值对待归档纸质档案进行标记。

可选地,作为本发明实施例提供的纸质档案电子化归档方法的一种具体实施方式,若待归档纸质档案的标记值为第一标记值,则基于预先生成的快速查找特征码确定待归档纸质档案对应的电子档案基础信息库的电子档案。

若待归档纸质档案的关键字信息与待归档纸质档案对应的电子档案基础信息库的电子档案的匹配程度达到预设阈值,则根据待归档纸质档案对应的电子档案基础信息库的电子档案的档案信息对待归档纸质档案进行归档。

在本实施例中,可首先根据电子档案基础信息库中每份档案的档案信息生成与该档案对应的快速查找特征码(即预先生成的快速查找特征码),若待归档纸质档案的标记值为第一标记值,则可根据预设生成规则确定待归档纸质档案的快速查找特征码,再基于待归档纸质档案的快速查找特征码和预先生成的快速查找特征码确定待归档纸质档案对应的电子档案基础信息库的电子档案。

检测待归档纸质档案的关键字信息与待归档纸质档案对应的电子档案基础信息库的电子档案的匹配程度,若该匹配程度达到预设阈值,说明匹配成功,则根据待归档纸质档案对应的电子档案基础信息库的电子档案的档案信息对待归档纸质档案进行归档。

在本实施例中,若待归档纸质档案的关键字信息与待归档纸质档案对应的电子档案基础信息库的电子档案的匹配程度小于预设阈值,则需手动添加此待归档纸质档案至归档信息库进行归档。

从上述描述可知,本发明实施例提供的基于快速查找特征码的查找方式能够有效提高查找效率,进而提供纸质档案的归档效率。

可选地,作为本发明实施例提供的纸质档案电子化归档方法的一种具体实施方式,快速查找特征码的生成方法包括:

提取档案信息中的多个关键字字段,其中,档案信息包括待归档纸质档案的档案信息或电子档案基础信息库的档案信息。

根据预设组合规则对多个关键字字段进行组合,得到快速查找特征码。

在本实施例中,可提取关键字字段:出生年后两位、出生月两位、出生日两位、姓名拼音首字母两位(例如,“张三”的首字母两位为“zs”),将八位字段直接联接形成快速查找特征码。

可选地,作为本发明实施例提供的纸质档案电子化归档方法的一种具体实施方式,若待归档纸质档案的标记值为第二标记值,则获取用户手动添加的待归档纸质档案的子分类标识,并返回执行检测待归档纸质档案的关键字信息是否与电子档案基础信息库中同子分类标识的电子档案的关键字匹配的步骤。

在本实施例中,若待归档纸质档案的标记值为第二标记值,则获取用户手动添加的待归档纸质档案的子分类标识,并返回执行步骤s104(即检测待归档纸质档案的关键字信息是否与电子档案基础信息库中同子分类标识的电子档案的关键字匹配的步骤)。

可选地,作为本发明实施例提供的纸质档案电子化归档方法的一种具体实施方式,若对人员档案进行归档,则人员档案的归档方法可以为:

首先确定待归档的人员档案的第一分类(本实施例中待归档的人员档案的第一分类即为人员档案分类),再根据待归档的人员档案的标题信息确定待归档人员档案的子分类。若对应电子档案基础信息库中的第一分类(本实施例中即为人员档案下的子分类)包括所确定的待归档人员档案的子分类,则待归档人员档案的分类过程完成。

然后检测待归档人员档案的关键字信息(例如,人员名称、身份证号,人员住址等)是否与电子档案基础信息库中同子分类标识的电子档案(也即与待归档人员档案对应的电子档案基础信息库中的电子档案)的关键字匹配,如果两者的信息匹配,则将待归档人员档案按照人员进行归档(也即按照其第一分类进行归档)后,确定归档完成。

对应于上文实施例的纸质档案电子化归档方法,图2为本发明一实施例提供的纸质档案电子化归档装置的结构框图。为了便于说明,仅示出了与本发明实施例相关的部分。参考图2,该装置包括:档案获取模块200,信息提取模块210,第一分类检测模块220,第一匹配模块230。

其中,档案获取模块200,用于确定待归档纸质档案的第一分类,并获取待归档纸质档案的图像信息。

信息提取模块210,用于基于待归档纸质档案的图像信息提取待归档纸质档案的关键字信息。

第一分类检测模块220,用于检测待归档纸质档案的标题信息是否与第一分类下的子分类名称匹配,若待归档纸质档案的标题信息与第一分类下的子分类名称匹配,则根据第一分类下的子分类名称确定待归档纸质档案的子分类标识,并检测待归档纸质档案的关键字信息是否与电子档案基础信息库中同子分类标识的电子档案的关键字匹配。

第一匹配模块230,用于若待归档纸质档案的关键字信息与电子档案基础信息库中同子分类标识的某一电子档案的关键字匹配,则根据电子档案基础信息库中同子分类标识的电子档案的档案信息对待归档纸质档案进行归档。

参考图2,在本发明的另一个实施例中,纸质档案电子化归档装置还可以包括:

第二分类检测模块240,用于检测待归档纸质档案的关键字信息提取的完整性,若待归档纸质档案的关键字信息提取不完整,则使用第一标记值对待归档纸质档案进行标记。

第二匹配模块250,用于若待归档纸质档案的标题信息与第一分类下的子分类名称不匹配,则使用第二标记值对待归档纸质档案进行标记。

可选地,作为本发明实施例提供的纸质档案电子化归档装置的一种具体实施方式,若待归档纸质档案的标记值为第一标记值,则基于预先生成的快速查找特征码确定待归档纸质档案对应的电子档案基础信息库的电子档案。

若待归档纸质档案的关键字信息与待归档纸质档案对应的电子档案基础信息库的电子档案的匹配程度达到预设阈值,则根据待归档纸质档案对应的电子档案基础信息库的电子档案的档案信息对待归档纸质档案进行归档。

可选地,作为本发明实施例提供的纸质档案电子化归档装置的一种具体实施方式,快速查找特征码的生成方法包括:

提取档案信息中的多个关键字字段,其中,档案信息包括待归档纸质档案的档案信息或电子档案基础信息库的档案信息。

根据预设组合规则对多个关键字字段进行组合,得到快速查找特征码。

可选地,作为本发明实施例提供的纸质档案电子化归档装置的一种具体实施方式,若待归档纸质档案的标记值为第二标记值,则获取用户手动添加的待归档纸质档案的子分类标识,并返回执行检测待归档纸质档案的关键字信息是否与电子档案基础信息库中同子分类标识的电子档案的关键字匹配的步骤。

参见图3,图3为本发明一实施例提供的终端设备的示意框图。如图3所示的本实施例中的终端300可以包括:一个或多个处理器301、一个或多个输入设备302、一个或多个输出设备303及一个或多个存储器304。上述处理器301、输入设备302、则输出设备303及存储器304通过通信总线305完成相互间的通信。存储器304用于存储计算机程序,计算机程序包括程序指令。处理器301用于执行存储器304存储的程序指令。其中,处理器301被配置用于调用程序指令执行以下操作上述各装置实施例中各模块/单元的功能,例如图2所示模块200至250的功能。

应当理解,在本发明实施例中,所称处理器301可以是中央处理单元(centralprocessingunit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

输入设备302可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等,输出设备303可以包括显示器(lcd等)、扬声器等。

该存储器304可以包括只读存储器和随机存取存储器,并向处理器301提供指令和数据。存储器304的一部分还可以包括非易失性随机存取存储器。例如,存储器304还可以存储设备类型的信息。

具体实现中,本发明实施例中所描述的处理器301、输入设备302、输出设备303可执行本发明实施例提供的纸质档案电子化归档方法的第一实施例和第二实施例中所描述的实现方式,也可执行本发明实施例所描述的终端的实现方式,在此不再赘述。

在本发明的另一实施例中提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序包括程序指令,程序指令被处理器执行时实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。

计算机可读存储介质可以是前述任一实施例的终端的内部存储单元,例如终端的硬盘或内存。计算机可读存储介质也可以是终端的外部存储设备,例如终端上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,计算机可读存储介质还可以既包括终端的内部存储单元也包括外部存储设备。计算机可读存储介质用于存储计算机程序及终端所需的其他程序和数据。计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1