信息处理装置及信息处理方法
【技术领域】
[0001]本发明涉及用于编辑图像中的表区域的信息处理装置。
【背景技术】
[0002]图3例示了扫描图像的示例。存在要编辑该扫描图像的情况。日本特开2001-094760号公报公开了编辑扫描图像的功能。
[0003]具体而言,利用日本特开2001-094760号公报中公开的功能,标识扫描图像中由多个格线(ruled lines)形成的表区域,对表区域内的字符进行字符识别。形成表区域的各格线还被向量化。然后,在左侧窗口中显示扫描图像,在右侧窗口中显示向量化结果和识别的字符(日本特开2001-094760号公报中的图5)。当用户在右侧窗口中编辑字符时,从左侧窗口中删除标识的表区域。然后,生成添加了编辑的字符的表,接着将生成的表显示在左侧窗口上。
[0004]在日本特开2001-094760号公报中公开的技术中,如果错误地确定了表区域的位置,则删除用户不期望的位置处的图像。
【发明内容】
[0005]根据本发明的一方面,提供一种信息处理装置,该信息处理装置包括:控制单元,其被构造为将包括多个识别单元格的图像显示在显示单元上;以及接收单元,其被构造为接收图像中位置的选择,其中,当所述接收单元接收到位置的选择时,所述控制单元将用于使得用户能够对在包括接收到所述选择的位置的识别单元格中包括的文本进行编辑的编辑区域、与用于改变包括接收到所述选择的位置的所述识别单元格的位置的控键、显示在所述显示单元上。
[0006]根据以下参照附图对示例性实施例的描述,本发明的其他特征将变得清楚。
【附图说明】
[0007]图1是例示复印机的结构的框图。
[0008]图2是例示信息处理装置的结构的框图。
[0009]图3是扫描图像的示例。
[0010]图4例示了扫描图像上的区域分割的结果。
[0011]图5例示了用于显示识别单元格的框的显示画面。
[0012]图6例示了当选择识别单元格时显示的显示画面。
[0013]图7例示了显示编辑后的文本的画面。
[0014]图8是例不主处理的流程图。
[0015]图9是例不编辑处理的流程图。
[0016]图10是例示用于改变识别单元格的位置的处理的流程图。
[0017]图11是例示用于显示编辑后的文本的处理的流程图。
[0018]图12是例示用于改变编辑后的文本的位置的处理的流程图。
[0019]图13例示了扫描图像的其他示例。
[0020]图14是例示用于确定基准线的方法的补充图。
[0021 ]图15是根据第三示例性实施例的流程图。
【具体实施方式】
[0022]首先,下面将定义术语。
[0023]原始字符是指扫描图像中的字符图像。
[0024]识别字符(recognized characters)是指与通过对原始字符进行字符识别(OCR(光学字符识别处理))获取的字符编码(字符识别结果)相对应的字符,或者与在编辑窗口中显示的相关字符编码相对应的字符。这些识别字符被以编辑窗口文本大小(编辑窗口文本大小是指针对编辑窗口设置的文本大小)显示在编辑窗口上(在编辑区域上)。识别单元格是指通过对扫描图像进行图像处理而标识的有界区域。
[0025]“编辑文本”是指从编辑窗口删除识别字符然后在编辑窗口中输入取代字符的用户动作。“编辑后的文本”是指输入的取代字符或者与相关的字符相对应的字符编码。当被显示在编辑窗口上时,编辑后的文本被以编辑窗口文本大小显示。当被显示在扫描图像上时,编辑后的文本被以扫描图像文本大小显示。
[0026]将针对编辑窗口文本大小和扫描图像文本大小两者的默认值预存储在存储单元202 中。
[0027]下面将参照附图描述用于实施本发明的示例性实施例。
[0028]<复印机和信息处理装置的结构>
[0029]图1例示了根据第一示例性实施例的复印机100的结构。复印机100包括扫描器101、发送和接收单元102、以及打印机单元103。
[0030]图2例示了根据本示例性实施例的信息处理装置200的结构。信息处理装置200包括中央处理单元(CPU)、只读存储器(ROM)以及随机存储存储器(RAM)。CPU从ROM加载信息处理装置200的程序,并且通过使用RAM作为临时存储区域来执行信息处理装置200的程序。通过上述操作实现单元201至205中的各个的处理。接收单元205 —般包括键盘和鼠标,但是本发明不限于该结构。此外,接收单元205和显示单元204可以被集成配置。在这种情况下,接收单元205和显示单元204被统称为触摸屏,在下面的示例性实施例中,将利用触摸的描述来替换点击(click)的描述。
[0031]<从扫描到区域分割和字符识别的处理>
[0032]当复印机100的扫描器101扫描原稿时,生成扫描图像(也被称为扫描图像数据或原稿图像)。发送和接收单元102将生成的扫描图像发送给信息处理装置200。在接收到扫描图像时,信息处理装置200的发送和接收单元201将扫描图像存储在存储单元202中。
[0033]用户经由接收单元205选择存储单元202中存储的多个扫描图像中的扫描图像。然后,控制单元203将该扫描图像显示在显示单元204上。
[0034]用户经由接收单元205发出指令,以分析在显示单元204上显示的扫描图像。然后,控制单元203执行三个处理:区域分割、字符识别和单元格识别框显示,并且将执行结果显示在显示单元204上。图3例示了扫描图像的示例。图4例示了在控制单元203执行了三个处理之后在显示单元204上的显示结果。
[0035]<区域分割处理(I)至(5),字符识别处理(6)以及单元格识别框显示处理(7)的描述〉
[0036](I)控制单元203对扫描图像进行二值化以获取二值图像。作为二值化的结果,扫描图像中亮度值低于阈值的像素是黑色像素,亮度值高于阈值的像素是白色像素。尽管在扫描图像的分辨率为100DPI (dot perinch,每英寸点数)的前提下进行下面的描述,但是扫描图像不限于该分辨率。
[0037](2)针对二值图像,控制单元203追踪基于8连结而连结的黑色像素的轮廓,以检测在8个方向中的一个方向上连续存在的黑色像素的块(黑色像素群(black pixelcluster)) ο 8连结是指在8个方向(左上、左、左下、下、右下、右、右上以及上)中的任何一个方向上连续存在相同颜色的像素(在这种情况下为黑色像素)。另一方面,4连结是指在四个方向(左、下、右以及上)中的任何一个方向上连续存在的相同颜色的像素。在处理
(2)中,在8个方向上存在的8个邻近像素的全部是非黑色像素的单独黑色像素(孤立点)被识别为噪声,并且未被检测到。另一方面,在8个方向上存在的8个邻近像素中的至少一个是黑色像素的黑色像素与邻近的黑色像素一起被检测为黑色像素群。
[0038](3)控制单元203在检测到的黑色像素群中检测长度大于第一阈值长度(例如,50像素=1.25cm)并且宽度小于第二阈值长度(例如,10像素=0.25cm)的黑色像素群。检测到的黑色像素群称为格线。
[0039]在确定格线之前,可以进行表区域确定。例如,将在处理(2)中检测到的大小等于或大于预定大小(假定表的最小大小)的黑色群作为目标,控制单元203追踪相关的黑色像素群内部的白色像素的轮廓以检测多个白色像素群(white pixel cluster) 0然后,控制单元203确定该多个白色像素群的外接矩形是否是以格子图案(lattice pattern)布置的,以确定相关的黑色像素群是否为表区域。然后,控制单元203从表区域的内部检测格线。
[0040](4)控制单元203标识由4条格线围绕并且不包括任何其他格线的区域。标识区域被称为识别单元格。此外,处理(4)被称为识别单元格标识。控制单元203将标识的识别单元格的位置存储在存储单元202中。
[0041]用于标识识别单元格的方法不限于上述一种。例如,能够追踪表区域内部的白色像素的轮廓以检测白色像素群