一种计算机数字识别系统的图象聚类快速校对方法

文档序号：6410658阅读：507来源：国知局

专利名称：一种计算机数字识别系统的图象聚类快速校对方法
技术领域：
本发明涉及计算机数字识别系统后处理中的快速校对方法。
目前，各类计算机管理系统中的各种数字报表的录入普遍采用操作员人工键入的方式，费时费力且误码率很高。而计算机数字识别技术使得数字报表的全自动录入成为可能。但由于报表本身的书写质量，污损等因素及识别技术的局限，使得数字识别不可能达到百分之百的正确(通常手写数字正确识别率可达95％左右)，识别后的人工校对工作成为必需。对于拒识数字，可采用计算机提示原始图形，人工敲入正确数字的方法很方便地进行改正。但对于少量的计算机误识的数字要靠人工一个字一个字地对照原稿进行校对，在成百上千个杂乱无章的数字中找出几个误识的数字，其困难程度可想而知。即使如此校对以后，仍无法确信所有识别数字已百分之百正确。因而也就限制了数字识别技术在各领域中的广泛应用。
本发明的目的是提供一种全新的快速校对方法，使得误识字的改正达到轻而易举，进而保证所有识别结果的完全正确。
本发明提供了一种计算机数字识别系统的图象聚类快速校对方法，首先对整页的数据报表进行电子扫描，经数字切分软件将其切割成一幅幅单独的数字图形，进而形成待识字符图形的文件，包括含有图像信息的数据文件和其对应的索引文件，索引文件含有该字符所在的行号、位号、高度、宽度、在数据文件中的起始地址及识别结果的信息，其特征在于在上述过程进行完毕后----根据识别结果将所对应图象聚类；----将聚类后同类图象显示于屏幕上；----从屏幕上同类图象中找出明显识别错误的不属该类的图象并改正。
计算机的数字识别是近几年的发展热点，为使其能得到广泛应用，人们在追求正确识别率方面作了大量的工作，有些识别系统的正确识别率甚至能达到百分之九十九，但是由于对另百分之一的误识字符的束手无策，而始终不能使数字识别系统进入实质性的应用，应该看到这种对正确识别率的追求是偏面的，也是有限的。而本发明则采取了完全相反的思路，在保证系统具有较高正确识别率的前提下，采用图象聚类的技术手段，对少数的个别的误识字符进行校对，以保证识别结果百分之百的正确。本发明的关键在于利用了数字识别中的识别结果与原始图形的对应关系，将同一识别结果所对应的所有图象聚类，并全屏幕放大显示，从而使操作者极容易在众多的相同中找出个别的误识字符，做到轻松较对，校对操作可以采用触摸屏或鼠标及键盘等操作方式。本发明适用于类型较少且无规之字符，特别是阿拉伯数字0-9的校对。
下面结合附图通过实施例详述本发明。
附

图1为系统组成的结构方框图附图2为图象聚类快速校对软件流程图附图3为触摸屏操作时的模块流程图附图4为键盘操作时的模块流程图附图5为鼠标操作时的模块流程图附图6为操作过程中的屏幕显示示意图实施例系统组成的结构见附图1数字识别过程，首先是对一帧整页的数据报表进行电子扫描，然后经专门的数字切分软件将其切割成一幅幅单独的数字图形，进而形成待识数字图形的文件，包括一个数据文件(dig.DAT)和一个索引文件(dig.IDX)其索引文件格式如下
dig.IDX(定长)数据文件格式如下
dig.DAT(不定长)每个数字的索引共占20个字节，其主要内容包括该数字所在的行号、位号，该数字的高度，宽度。该数字在dig.DAT中的起始地址等有关信息，其中第6字节，为该数字图形的识别结果，其值是由数字识别软件识别后填入的一个识别结果(可能正确，也可能错误)识别结束后进入快速交互式校对模块；图3绘出了利用触屏操作单元(1)进行校对的模块流程系统首先将图象显示初始化成640×480的VGA图形方式，并同时将触屏初始化成单点进入方式，将屏幕化分为图形区(1-420行)及数字区(420-480行)，在图形区中准备显示图形文件，在数字区中绘出0-9及一个回车框菜单。
这时程序开始访问dig.IDX索引文件(索引文件的第6字节中存放着该索引所对应的图形文件的识别结果)将其识别结果为″0″的所有索引号记下，并将各自索引所对应的图形文件读出，以图形方式依次显示于屏幕中的图形区，同时记下各图形在屏幕中的X，Y坐标。此时程序等待操作者的触屏输入。
此时屏幕上的图形大部分为“0”，极少数类似于“0”的数字，由于识别系统误将其识别为“0”，也进入了″0″画面之中，操作者在众多的″0″当中很容易查觉非″0″数字，这时操作者只要用手指明该错误字，程序便自动将该坐标所对应的索引序号记下，待操作者再指明屏幕下方的一个正确数字时，程序便将这一正确结果记入其对应索引的第6字节，完成了校正的过程。
当操作者确认此屏已正确无误，便指明回车框，程序便自动进入下一屏画面，如索引文件中还有为“0”的图象，则再生成一幅“0”画面继续修改，否则程序便从索引文件头开始，生成“1”画面，以下修改过程同“0”画面完全相同。这样一直进行到“9”画面，所有数字全部校改完毕。
该过程结束以后，索引文件中的第6字节全部为正确结果，达到了识别报表录入的100％正确率。
因为数字识别是将一幅数字图形经识别软件处理给出一个识别结果的过程，即每一识别结果分别对应一幅数字图形。以校正数字1为例，在整个数字识别结束后分别将其识别结果为“1”的所有原始图形显示在屏幕上(一屏可显示百余个，每个数字图形足够大十分醒目，屏幕不够，可采用换页办法)如果其中有几个原始图象并不是“1”的图形，而是“2”或“3”等，操作者可非常容易地将其找出。见图5，识别系统误将一个图形“7”识别为“1”，这个“7”的图形便显示于众多“1”的图形之中，操作者非常容易辩别，用手指一下这个图形，再指一下数字菜单中的“7”此时计算机发“7”的声音，修改即告完成。
利用鼠标操作单元(2)进行校正的模块流程示于图3，利用键盘操作单元(3)进行较正的模块流程示于图4，由于其工作过程与触屏操作类同，只是操作者在指明错误图象时所用的手段不同。利用鼠标是靠鼠标在X，Y方向的移动给出当前图象所对应的座标，计算机判明其所对应的索引，然后再根据鼠标指明的正确字符加以改正。利用键盘操作是通过键入的↑↓键来改变当前图象的X，Y座标，并用数字键(0-9)键入正确的结果，其它流程完全一样，故不再重述。
本发明也可用于英文字母的识别系统中，由于英文识别的字符集较多(26个大小写字母，数字标点等)屏幕下方的菜单区可取消，采用键入的方式，同样要比顺序校对的效率大大地提高，而且其可靠性非常之高。
权利要求
1.一种计算机数字识别系统的图象聚类快速校对方法，首先对整页的数据报表进行电子扫描，经数字切分软件将其切割成一幅幅单独的数字图形，进而形成待识字符图形的文件，包括含有图像信息的数据文件和其对应的索引文件，索引文件含有该字符所在的行号、位号、高度、宽度、在数据文件中的起始地址及识别结果的信息，其特征在于上述过程进行完毕后----根据识别结果将所对应图象聚类；----将聚类后同类图象显示于屏幕上；----从屏幕上同类图象中找出明显识别错误的不属该类的图象并改正。
2.按权利要求1所述数字识别系统的图象聚类快速校对方法，其特征在于待校对字符为阿拉伯数字0-9。
全文摘要
一种计算机数字识别系统的图象聚类快速校对方法，适用于各种计算机的数字或字符识别系统，其特征在于数字识别进行完毕后，根据识别结果将所对应图象聚类；将聚类后同类图象显示于屏幕上；从屏幕上同类图象中找出明显识别错误的不属该类的图象并改正。本发明使得误识字的改正达到轻而易举，进而保证所有识别结果的完全正确。
文档编号G06F17/20GK1148218SQ9611532
公开日1997年4月23日申请日期1996年5月22日优先权日1995年9月21日
发明者谈大龙, 李伟, 杨力申请人:中国科学院沈阳自动化研究所

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：谈大龙;李伟;杨力
技术所有人：中国科学院沈阳自动化研究所
我是此专利的发明人

上一篇：Dos文件系统安全存取控制方法及设备的制作方法
上一篇：Pc机用51单片机集成教学卡的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。