一种统一信用代码证识别系统和算法的制作方法

文档序号：20033090发布日期：2020-02-28 10:40阅读：366来源：国知局

本发明涉及图像识别领域，尤其是一种统一信用代码证识别系统和算法。

背景技术：

企业、事业单位在招投标、申报项目或者办理其他业务时，需要填写单位基本信息并上单位传统一信用代码证，但是由于填写者和上传者的失误或者其他原因，往往会导致填写信息与上传的图片信息不一致，从而致使返工或者耽误相关活动，给企业或事业单位造成麻烦；因此能精准的识别填写信息和上传的图片信息一致的方法，可以有效增加工作效率。

而在现在的处理方式中，多数是认为进行核对，而一些借助工具的核对也存在很大的误差，会忽略掉很多细节上的错误。

技术实现要素：

本发明的发明目的在于：针对上述存在的问题，提供一种统一信用代码证识别系统和算法；本发明解决了在核对图片信息和填写信息结果不精确的问题；解决了在核对工作中耗时较多的问题。

本发明采用的技术方案如下：

一种统一信用代码证识别算法，包括：上传统一信用证代码图片；输入单位基本信息；提取统一信用证代码图片信息；将输入信息和图片信息进行对比；若对比一致则通过审核，若对比不一致则需重新填写单位基本信息。

进一步的，所述提取统一信用证代码图片信息方法为：使用长短期记忆网络检测和提取文本区域；再利用radon变换方法和hough变换方法对提取的文本进行校正；再将校正后的文本分割为单行的文本的图片；判断分割出的图片是否需要进行字符分割，若需要进行字符分割则将字符分割后进行提取，若无需进行字符分割，则可直接进行提取。

进一步的，所述字符分割方法为：基于投影直方图极值点作为候选分割点并使用分类器搜索最佳分割点，搜索到分割点之后对于单个字符进行特征分类，提取出信息。

进一步的，所述无需进行字符分割的提取方法为：使用训练好的单个字符分类器在序列图像上滑动，输出概率图，接着用神经网络建立的序列模型并校正后输出提取的字符序列。

进一步的，所述提取统一信用证代码图片信息包括单位统一社会信用代码、单位名称、住所、法定代表人、成立日期、营业期限和经营范围。

进一步的，所述将输入信息和图片信息进行对比方法为：提取出的图像信息和输入的信息会存储在两个不同的数组中，通过对比两个数组中的信息内容判断内容是否一致。

一种统一信用代码证识别系统，包括：获取模块、输入模块、提取模块、审核模块和显示模块；所述获取模块用于获取图片信息，输入模块用于获取输入信息，提取模块用于提取图像中的文字信息，审核模块用于对比输入信息和提取出的文字信息，显示模块用于显示审核结果；所述获取模块和输入模块分别和提取模块连接，提取模块还与审核模块连接，审核模块与显示模块连接。

进一步的，所述提取模块还可以对提取出的文字信息进行分割。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

1、本发明通过对图像进行多次处理，可以精准的提取出上传的图像信息，使对比的结果更加的精准，减小了识别误差。

2、本发明通过对比输入信息和图像信息，有效减小了核对工作中的人力资源和成本。

附图说明

本发明将通过例子并参照附图的方式说明，其中：

图1是统一信用代码证识别算法流程图。

图2是提取图片信息的方法流程图。

图3是统一信用代码证识别系统结构图。

其中，1-获取模块；2-输入模块；3-提取模块；4-审核模块；5-显示模块。

具体实施方式

本说明书中公开的所有特征，或公开的所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以以任何方式组合。

本说明书(包括任何附加权利要求、摘要)中公开的任一特征，除非特别叙述，均可被其他等效或具有类似目的的替代特征加以替换。即，除非特别叙述，每个特征只是一系列等效或类似特征中的一个例子而已。

实施例1

一种统一信用代码证识别算法，包括：

s1：上传统一信用证代码图片；

上述步骤中，所述统一信用证代码图片为识别数据，用于在输入单位信息后，与输入的信息进行对比。

s2：输入单位基本信息；

上述步骤中，当输入单位基本信息后，该输入信息会和上传的图片信息进行对比判断输入是否出错。

s3：提取统一信用证代码图片信息；

上述步骤中，提取图片信息的方法为：

s31：使用长短期记忆网络检测和提取文本区域；

上述步骤中，通过长短期记忆网络可以将上传的统一信用证代码图片中的文本信息完整的检测识别出，并且可以将识别出的文本部分进行单独提取；本实施例中，提取的信息包括单位统一社会信用代码、单位名称、住所、法定代表人、成立日期、营业期限和经营范围。

s32：再利用radon变换方法和hough变换方法对提取的文本进行校正；

上述步骤中，可以先将图像进行灰度值处理，将处理后的图像进行一次校正，再将图像进行二值化处理，将处理后的图像进行再次校正。

s33：再将校正后的文本分割为单行的文本的图片；

上述步骤中，将提取的文本图像进行单行分割可以减小图形识别时的范围，可以更精准的对图像中的文字进行识别。

s34：判断分割出的图片是否需要进行字符分割，若需要进行字符分割则执行s35，若无需进行字符分割，则执行s36；

s35：对分割出的图片进行字符分割；

s36：提取图片信息；

上述步骤中，所述所述字符分割方法为：基于投影直方图极值点作为候选分割点并使用分类器搜索最佳分割点，搜索到分割点之后对于单个字符进行特征分类，提取出信息。

所述无需进行字符分割的提取方法为：使用训练好的单个字符分类器在序列图像上滑动，输出概率图，接着用神经网络建立的序列模型并校正后输出提取的字符序列；所述神经网络为长短记忆网络和循环神经网络。

s4：将输入信息和图片信息进行对比；

上述步骤中，若输入信息和图片信息对比一致则通过审核，若对比不一致则需重新填写单位基本信息；所述将输入信息和图片信息进行对比方法为：提取出的图像信息和输入的信息会存储在两个不同的数组中，通过对比两个数组中的信息内容判断内容是否一致；本实施例中，以ajax(asynchronousjavascriptandxml)为例，图像内容识别结果将被放置在key+value的数组内；用户输入的信息将以form表单的形式在ajax请求时同步被放置到后台，存储在request数组中；当图像识别操作完成时使用:

if($cname1＝＝$cname2){returntrue}else{returnfalse}即可完成对比。

实施例2

一种统一信用代码证识别系统，如图3所示，包括：获取模块1、输入模块2、提取模块3、审核模块4和显示模块5；所述获取模块1和输入模块2分别和提取模块3连接，提取模块3还与审核模块4连接，审核模块4与显示模块5连接。

所述获取模块1用于获取图片信息，当需要对统一信用代码证进行识别时，可以通过获取模块1采集统一信用代码证的图片信息，并将获取的图像信息发送至提取模块3中。

输入模块2用于获取输入信息，所述输入信息为用户手写的统一信用代码证上的文字信息，当用户书写完成后，输入模块2会将该手写信息发送至审核模块4中，用于进行比对。

提取模块3用于提取图像中的文字信息，当统一信用代码证的图像信息发送至提取模块3中后，提取模块3会将图像信息中的文字部分进行识别和提取，再将图像进行灰度值处理，将处理后的图像进行一次校正，再将图像进行二值化处理，将处理后的图像进行再次校正，得到一个清晰的文字信息；再将校正后的文字信息图像进行分割，将大的文字模块信息分割为一个个小的文字信息模块，再将分割后的文字模块信息发送至审核模块4中；在其他实施例中，若提取出的文字信息不需要分割，则可以直接发送至审核模块4中。

审核模块4用于对比输入信息和提取出的文字信息，当审核模块4接收到输入的手写文字信息和提取模块3提取出的图像中的文字信息后，会将两个信息进行一一比对，核实两个信息中的文字部分是否一致，若一致则会发送审核一致的命令至显示模块5；若对比不一致会发送存在差异的文字部分至显示模块5。

显示模块5用于显示审核结果；显示模块5在接收到审核模块4发出的信息后，会将该信息显示在屏幕上，若审核结果一致，则会显示审核一致字样；若审核结果不一致，则会显示出存在错误的文字位置，用户可以根据显示出的内容进行修改，并重新输入和审核。

本发明通过对图像进行多次处理，可以精准的提取出上传的图像信息，使对比的结果更加的精准，减小了识别误差；通过自动对比输入信息和图像信息，有效减小了核对工作中的人力资源和成本。

本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合，以及披露的任一新的方法或过程的步骤或任何新的组合。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨贤
技术所有人：兰州领新网络信息科技有限公司
我是此专利的发明人

上一篇：一种肉鸡高效抗艾美尔球虫组合物及其制备方法、应用与流程
上一篇：一种知识产权托管服务系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。