一种文件扫描方法、设备、介质及产品与流程

文档序号:26357618发布日期:2021-08-20 20:32阅读:101来源:国知局
一种文件扫描方法、设备、介质及产品与流程

本发明涉及文件扫描处理领域,尤其涉及一种文件扫描方法、设备、介质及产品。



背景技术:

随着信息数字化时代的发展,传统的以纸质或实物材料记录的信息被快速的以数字化技术进行转换存储。如日常中使用的发票、存单及支票等有价文件扫描,也有如证明材料、证书及身份证等文件扫描存档,都是在进行信息数字化转换存储。为便于后续数字化信息管理及提高生产效率,文件实物扫描的相关影像信息按有序规则存储是重要前提之一。

目前,在扫描文件实物存储影像数字信息时,文件的保存通常需要扫描得到的影像的面向正确,即保证文件按照正立及正面在前,反面在后等有序存储时。目前为了保证文件扫描后的影像面向正确,通常采用以下方式进行文件扫描:1、配合机器特性,将待扫描文件实物按照特定正确的方向和顺序放入机器中扫描;2、将文件实物以自由方向放入机器中扫描,后期再统一在电子设备端,人为对影像信息进行纠正调整。以上两种操作方式,都需要人工介入处理,极大影响生产效率。



技术实现要素:

为了克服现有技术的不足,本发明的目的之一在于提供一种文件扫描方法,其能解决目前对于带有抬头的文件进行扫描时存在的需要人工介入处理,极大影响生产效率问题。

本发明的目的之二在于提供一种电子设备,其能解决目前对于带有抬头的文件进行扫描时存在的需要人工介入处理,极大影响生产效率问题。

本发明的目的之三在于提供一种计算机可读存储介质,其能解决目前对于带有抬头的文件进行扫描时存在的需要人工介入处理,极大影响生产效率问题。

本发明的目的之四在于提供一种计算机程序产品,其能解决目前对于带有抬头的文件进行扫描时存在的需要人工介入处理,极大影响生产效率问题。

本发明的目的之一采用以下技术方案实现:

一种文件扫描方法,所述方法应用于对含有抬头的目标文件进行扫描过程中,包括以下步骤:

接收目标图像,接收扫描目标文件得到的目标图像;

提取轮廓特征,对所述目标图像中的字符进行轮廓特征提取处理,得到含有若干个轮廓特征结构化信息的轮廓特征结构化信息集合,每个轮廓特征结构化信息中均包括面积值以及坐标信息,所述坐标信息包括横坐标值和纵坐标值;

第一滤波处理,根据预先存储的第一特征滤波阈值对轮廓特征结构化信息集合中所有轮廓特征结构化信息进行滤波处理,将面积值大于第一特征滤波阈值的轮廓特征结构化信息作为第一轮廓特征结构化信息并保存;

交叠处理,判断第一轮廓特征结构化信息在纵坐标方向的投影区域是否有交叠,将在纵坐标方向的投影区域有交叠的第一轮廓特征结构化信息作为第二轮廓特征结构化信息并保存;

第二滤波处理,根据预先存储的第二特征滤波阈值对所有第一轮廓特征结构化信息进行滤波处理,将面积值大于第二特征滤波阈值的第一轮廓特征结构化信息作为第二轮廓特征结构化信息并保存;

计算距离特征值,根据预先存储的目标图像中线纵坐标值以及每个所述第二轮廓特征结构化信息中的纵坐标值计算出与第二轮廓特征结构化信息对应的一维距离特征值;

计算一维抬头特征值,根据每个第二轮廓特征结构化信息对应的面积值以及一维距离特征值计算出对应的一维抬头特征值;

面向判断,判断数值最大的一维抬头特征值对应的第二轮廓特征结构化信息中的纵坐标值是否大于目标图像中线纵坐标值,若是,则目标图像为面向倒立,则执行旋转校正步骤,若否,则目标图像为面向正立,将目标图像输出至上位机进行存储;

旋转校正,对目标图像进行旋转180°处理,将经过旋转180°处理的目标图像输出至上位机进行存储。

进一步地,在所述第一滤波处理步骤之前还包括计算第一特征滤波阈值,将轮廓特征结构化信息集合中所有轮廓特征结构化信息按照对应的面积值进行从大到小排序处理,将所述轮廓特征结构化信息的个数作为第一数量值,根据第一预设系数以及所述第一数量值计算出第一目标序号,将位于第一目标序号的轮廓特征结构化信息中的面积值作为第一特征滤波阈值并存储。

进一步地,在所述第二滤波处理步骤之前还包括计算第二特征滤波阈值,将第二轮廓特征结构化信息按照对应的面积值进行从大到小排序处理,将第二轮廓特征结构化信息的数量作为第二数量值,根据第二数量值以及第二预设系数计算出第二目标序号,将位于第二目标序号的轮廓特征结构化信息中的面积值作为第二特征滤波阈值。

进一步地,在所述提取轮廓特征步骤之前还包括图像预处理,对所述目标图像进行二值化处理。

进一步地,所述图像预处理具体为:采用平均灰度阈值法对所述目标图像进行二值化处理。

进一步地,采用连通域分割算法对所述目标图像中的字符进行轮廓特征提取处理。

进一步地,所述计算一维抬头特征值具体为:将每个第二轮廓特征结构化信息对应的面积值以及一维距离特征值相乘得到的乘积作为对应的一维抬头特征值。

本发明的目的之二采用以下技术方案实现:

一种电子设备,包括:处理器;

存储器;以及程序,其中所述程序被存储在所述存储器中,并且被配置成由处理器执行,所述程序包括用于执行本申请中所述的一种文件扫描方法。

本发明的目的之三采用以下技术方案实现:

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行本申请中所述的一种文件扫描方法。

本发明的目的之四采用以下技术方案实现:

一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现本申请中所述的一种文件扫描方法。

相比现有技术,本发明的有益效果在于:本申请中的一种文件扫描方法,在对含有抬头的目标文件进行扫描时,通过对目标图像进行提取轮廓特征、第一滤波处理、交叠处理、第二滤波处理、计算距离特征值实现了对目标文件的抬头的识别,再根据得到的一维抬头特征值以及目标图像中线的纵坐标值实现对目标文件对应面向信息是否正确的判断,根据面向信息确定是否需要对目标图像进行自动的旋转校正处理,最终实现了对目标影像的有序存储,整个过程无需人工介入,而且当使用者进行文件扫描时,无需检查文件在扫描装置的位置,可以以任意方向将待扫描文件放入至扫描装置中,而且后期无需人工介入处理,极大地提升了现有文件实物信息图像数字化处理效率。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。本发明的具体实施方式由以下实施例及其附图详细给出。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为本发明的一种文件扫描方法的流程示意图。

具体实施方式

下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。

本实施例中的文件扫描方法应用于对含有抬头的目标文件进行扫描,如图1所示,具体包括以下步骤:

接收目标图像,接收扫描目标文件得到的目标图像。在本实施例中,由使用者将目标文件放入扫描装置对应的文件放置处进行扫描,扫描装置中的扫描设备对目标文件进行扫描后得到目标图像,此时还会根据目标图像得到目标图像的整体的宽度和高度,根据宽度和高度(即长度)计算出目标图像的图像中线,将其高度的一半作为目标图像中线纵坐标值并存储。

图像预处理,采用平均灰度阈值法对所述目标图像进行二值化处理,经过二值化处理的目标图像的宽度和高度并未改变。

提取轮廓特征,采用连通域分割算法对所述目标图像中的字符进行轮廓特征提取处理,得到含有若干个轮廓特征结构化信息的轮廓特征结构化信息集合,每个轮廓特征结构化信息中均包括面积值、坐标信息、宽度值以及高度值,所述坐标信息包括横坐标值和纵坐标值,所述坐标信息为根据目标图像的四个顶角中任意一个作为坐标系的原点、目标图像的宽度为横坐标,目标图像的高度为纵坐标建立的坐标系中的坐标点信息,上述横坐标值为对应字符到横坐标的距离值,纵坐标值为对应字符到纵坐标的距离值。

计算第一特征滤波阈值,将轮廓特征结构化信息集合中所有轮廓特征结构化信息按照对应的面积值进行从大到小排序处理,即将面积值最大的轮廓特征结构化信息排在第一位,依次类推,将所有轮廓特征结构化信息进行排序,将所述轮廓特征结构化信息的个数作为第一数量值,根据第一预设系数以及所述第一数量值计算出第一目标序号,将位于第一目标序号的轮廓特征结构化信息中的面积值作为第一特征滤波阈值并存储。在本实施例中,令第一目标序号为k,第一数量自为α_n,第一预设系数为α,k=α*α_n,其中α∈(0,1),在本实施例中,α优选为0.15。以下举例说明,假如第一数量值为100,第一预设系数为0.15,则第一目标序号为15,在经过从大到小排序后轮廓特征结构信息中筛选出排序在第15位轮廓特征结构信息,将排序在第15位轮廓特征结构信息中的面积值作为第一特征滤波阈值并存储。

第一滤波处理,根据预先存储的第一特征滤波阈值对轮廓特征结构化信息集合中所有轮廓特征结构化信息进行滤波处理,将面积值大于第一特征滤波阈值的轮廓特征结构化信息作为第一轮廓特征结构化信息并保存。

交叠处理,判断第一轮廓特征结构化信息在纵坐标方向的投影区域是否有交叠,将在纵坐标方向的投影区域有交叠的第一轮廓特征结构化信息作为第二轮廓特征结构化信息并保存。

计算第二特征滤波阈值,将第二轮廓特征结构化信息按照对应的面积值进行从大到小排序处理,将第二轮廓特征结构化信息的数量作为第二数量值,根据第二数量值以及第二预设系数计算出第二目标序号,将位于第二目标序号的轮廓特征结构化信息中的面积值作为第二特征滤波阈值。在本实施例中,令第二预设系数为αt,第而目标序号为kt,第二数量值为α_νt,则kt=αt*α_νt,其中αt∈(0,1],在本实施例中优选αt=0.5。以下举例说明,假如第二数量值为50,第一预设系数为0.5,则第一目标序号为25,在经过从大到小排序后第二轮廓特征结构化信息中筛选出排序在第25位第二轮廓特征结构化信息,将排序在第15位第二轮廓特征结构化信息中的面积值作为第二特征滤波阈值并存储。

第二滤波处理,根据预先存储的第二特征滤波阈值对所有第一轮廓特征结构化信息进行滤波处理,将面积值大于第二特征滤波阈值的第一轮廓特征结构化信息作为第二轮廓特征结构化信息并保存。

计算距离特征值,根据预先存储的目标图像中线纵坐标值以及每个所述第二轮廓特征结构化信息中的纵坐标值计算出与第二轮廓特征结构化信息对应的一维距离特征值。在本实施例中,在前述接收目标图像步骤中可以得到目标图像的高度,将其高度作为目标图像中线纵坐标值,令目标图像的高度为h,则目标图像中线纵坐标值为令一维距离特征值为dj,第二轮廓特征结构化信息中的纵坐标值为|reg2[j].y,其中j为第二轮廓特征结构化信息的位置序号,j=0,1,...,a_n2,则

计算一维抬头特征值,根据每个第二轮廓特征结构化信息对应的面积值以及一维距离特征值计算出对应的一维抬头特征值。将每个第二轮廓特征结构化信息对应的面积值以及一维距离特征值相乘得到的乘积作为对应的一维抬头特征值。

面向判断,判断数值最大的一维抬头特征值对应的第二轮廓特征结构化信息中的纵坐标值是否大于目标图像中线纵坐标值,若是,则目标图像为面向倒立,则执行旋转校正步骤,若否,则目标图像为面向正立,将目标图像输出至上位机进行存储。在本实施例中,令数值最大的一维抬头特征值对应的第二轮廓特征结构化信息中的纵坐标值为y,目标图像中线纵坐标值为判断是否成立,若成立,则目标图像为面向倒立,需要进行校正。若不成立,则目标图像为面向正立,无需校正,可以直接将目标图像输出至上位机进行存储,作为与目标文件对应的图像。

旋转校正,对目标图像进行旋转180°处理,将经过旋转180°处理的目标图像输出至上位机进行存储。

在本实施例中,还提供一种电子设备,包括:处理器;

存储器;以及程序,其中所述程序被存储在所述存储器中,并且被配置成由处理器执行,所述程序包括用于执行本申请中所述的一种文件扫描方法。

在本实施例中,还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行本申请中所述的一种文件扫描方法。

在本实施例中,一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现本申请中所述的一种文件扫描方法。

本申请中的一种文件扫描方法,在对含有抬头的目标文件进行扫描时,通过对目标图像进行提取轮廓特征、第一滤波处理、交叠处理、第二滤波处理、计算距离特征值实现了对目标文件的抬头的识别,再根据得到的一维抬头特征值以及目标图像中线的纵坐标值实现对目标文件对应面向信息是否正确的判断,根据面向信息确定是否需要对目标图像进行自动的旋转校正处理,最终实现了对目标影像的有序存储,整个过程无需人工介入,而且当使用者进行文件扫描时,无需检查文件在扫描装置的位置,可以以任意方向将待扫描文件放入至扫描装置中,而且后期无需人工介入处理,极大地提升了现有文件实物信息图像数字化处理效率。

以上,仅为本发明的较佳实施例而已,并非对本发明作任何形式上的限制;凡本行业的普通技术人员均可按说明书附图所示和以上而顺畅地实施本发明;但是,凡熟悉本专业的技术人员在不脱离本发明技术方案范围内,利用以上所揭示的技术内容而做出的些许更动、修饰与演变的等同变化,均为本发明的等效实施例;同时,凡依据本发明的实质技术对以上实施例所作的任何等同变化的更动、修饰与演变等,均仍属于本发明的技术方案的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1