专利名称:图像处理装置及其控制方法、程序的制作方法
技术领域:
本发明涉及在复印机等的图像输入装置中,可以从读取的纸文档检索对应的原始电子数据,将原始电子数据活用于打印、分配、存储、编辑等的图像处理技术。
背景技术:
近年来,正在进行复印机的数字化和网络化。打印功能也在多样化,可以将包含在同一或多个文档中的多个页布局在1张打印纸上进行打印。
例如,因为在会议等中用的很多的散发资料等是作为参照用的,所以在1张打印纸上,使1个文档与2页相当、与4页相当地,将与N页相当的文档布局在1张打印纸上进行打印的情形是很多的(以后,称为N页打印)。又,当需要一次参照多个文档的页时,也存在结合打印的情形(以后,称为结合打印)。进一步,也存在着为了打印后能够2折叠装订成册,按照装订成册时的顺序打印页号码的情形(以后,称为装订打印)。
又,以后,我们将与N页相当的文档布局在N页打印、结合打印、装订打印等的1张打印纸上进行打印的打印总称为Nup打印。
另一方面,开始提出可以用扫描器读取纸文档,检索该读取的纸文档图像的原始电子数据,从原始电子数据本身进行打印,或分配给网络内所要的PC(个人计算机)等的终端,保存在网络内的所要的存储媒体中,或进行编辑的系统。
作为用于实现它的方法,例如,在日本第3017851号专利中,通过以比特为单元比较扫描纸文档得到的扫描电子数据和存储媒体中的电子数据,可以检索扫描电子数据的原始电子数据。
又,例如,在日本特开2001-257862号专利公报中,当将文档制成电子数据时,将识别码赋予该电子数据,生成包含该识别码的打印物。因此,另外,当检索并打印与打印物对应的电子数据时,读入该打印物,识别打印出来的识别码,可以检索和打印所要的电子数据。
但是,在上述文献中,因为对Nup打印的文档没有任何考虑,所以在使用Nup打印的环境中,发生下列那样的问题。
例如,在日本第3017851号专利中,将通过扫描Nup打印的文档得到的电子数据解释成与1页相当。对此,因为原始电子数据是将1页作为单位的电子数据由存储媒体进行管理,所以即便与哪个电子数据比较也不能够得到高的类似度。因此,不能够检索原始电子数据。
又,例如,在日本特开2001-257862号专利公报中,因为识别码对于各个页决定打印位置,所以当进行Nup打印时打印位置发生偏离,不能够读取各识别码,所以还是不能够检索原始电子数据。
发明内容
本发明就是鉴于上述课题提出的,本发明的目的是提供可以从经过Nup打印的纸文档,检索并活用原始电子数据的图像处理装置及其控制方法、程序。
为了达到上述目的根据本发明的图像处理装置备有下列构成。即,将多个电子数据作为比较目的图像存储起来的存储部件;电子地读取打印物,将该打印物的电子数据作为比较源图像输入的输入部件;根据包含在上述比较源图像中的页图像的数量,提取包含在上述比较源图像中的页图像的处理对象区域的特征量的提取部件;和用由上述提取部件提取的特征量,从上述存储部件检索与上述比较源图像对应的比较目的图像的检索部件,又,最好,进一步备有对作为上述检索部件的检索结果的图像进行处理的处理部件。
又,最好,进一步备有指定包含在上述比较源图像中的页图像的页数的指定部件,上述提取部件,对于每个根据上述指定部件指定的页数决定的处理对象区域,提取该处理对象区域的特征量。
又,最好,上述提取部件提取上述处理对象区域的图像特征量和文字特征量中的某一个或两者。
又,最好,上述图像特征量是色特征量、亮度特征量、结构特征量、形状特征量中的某一个或将它们任意多个组合起来的特征量。
又,最好,上述文字特征量是文字码。
又,最好,进一步备有显示上述检测部件的检测结果的显示部件;和当作为上述检测部件的检测结果,在上述显示部件上显示多个比较目的图像时,从该多个比较目的图像选择所要图像的选择部件。
又,最好,进一步备有当从多个页图像构成上述比较源图像时,从该多个页图像指定所要的页图像的指定部件,上述提取部件提取包含由上述指定部件指定的页图像的处理对象区域的特征量。
又,最好,上述处理部件在指定的打印条件下打印由上述检测部件检测到的图像。
又,最好,进一步备有指示对上述检测结果的图像的处理种类的指示部件,上述处理的种类是打印、分配、存储、编辑中的某一种。
又,最好,进一步备有判定在上述比较源图像中是否存在多个页图像的第1判定部件;和当作为上述第1判定部件的判定结果,在上述比较源图像中存在多个页图像时,判定包含在上述比较源图像中的页图像的页数的第2判定部件,上述提取部件,对于每个根据由上述第2判定部件判定的页数决定的处理对象区域,提取该处理对象区域的特征量。
又,最好,上述第1判定部件检测包含在上述比较源图像中的页号码,判定上述页号码是否等间隔地存在于预定区域内,判定在上述比较源图像中是否存在多个页图像。
又,最好,上述第1判定部件通过检测上述比较源图像的最右端空白或最左端空白和除此以外的中间空白,判定检测出的中间空白是否比上述最右端空白或上述最左端空白大,判定在上述比较源图像中是否存在多个页图像。
又,最好,进一步备有显示上述第1判定部件的第1判定结果的显示部件;和修正上述判定结果的修正部件。
又,最好,进一步备有输入上述比较源图像的输入部件;指定包含在由上述输入部件输入的比较源图像中的页图像的页数的指定部件,上述提取部件,对于每个根据由上述指定部件指定的页数决定的处理对象区域,提取该处理对象区域的特征量。
上述存储部件对应地存储上述比较目的图像和由上述提取部件提取的特征量。
又,最好,进一步备有输入上述比较目的图像的输入部件;判定在上述比较目的图像中是否存在多个页图像的第1判定部件;和当作为上述第1判定部件的判定结果,在上述比较源图像中存在多个页图像时,判定包含在上述比较源图像中的页图像的页数的第2判定部件,上述提取部件,对于每个根据由上述第2判定部件判定的页数决定的处理对象区域,提取该处理对象区域的特征量,上述存储部件对应地存储上述比较目的图像和上述提取部件提取的特征量。
为了达到上述目的根据本发明的图像处理装置的控制方法备有下列构成。即,输入通过电子地读取打印物得到的电子数据作为比较源图像的输入步骤;根据包含在上述比较源图像中的页图像的数量,提取包含在上述比较源图像中包含的页图像的处理对象区域的特征量的提取步骤;和用由上述提取步骤提取的特征量,从作为比较目的图像存储在存储媒体中的多个电子数据,检索与上述比较源图像对应的比较目的图像的检索步骤。
为了达到上述目的根据本发明的程序备有下列构成。即,作为用计算机实现图像处理控制的程序,备有输入通过电子地读取打印物得到的电子数据作为比较源图像的输入步骤的程序码;根据包含在上述比较源图像中的页图像的数量,提取包含在上述比较源图像中包含的页图像的处理对象区域的特征量的提取步骤的程序码;和用由上述提取步骤提取的特征量,从作为比较目的图像存储在存储媒体中的多个电子数据,检索与上述比较源图像对应的比较目的图像的检索步骤的程序码。
本发明的其它特点和优点将从结合附图的下列描述变得很明显,其中在全部附图中相同的参照标号表示相同或类似的部件。
与说明书结合并形成说明书一部分的附图与描述一起阐明本发明的实施方式,并用于解释本发明的原理。
图1是表示本发明的实施方式1的图像处理系统的构成的方框图。
图2是表示本发明的实施方式1的MFP的详细构成的方框图。
图3A是表示本发明的实施方式1的登记处理的操作程序图。
图3B是表示本发明的实施方式1的检索处理的操作程序图。
图4是表示本发明的实施方式1的地址信息的一个例子的图。
图5是表示本发明的实施方式1的块信息的一个例子的图。
图6是表示本发明的实施方式1的特征量信息的一个例子的图。
图7是表示本发明的实施方式1的特征量信息的一个例子的图。
图8是表示本发明的实施方式1的Nup打印与2页相当的文档例子的图。
图9A、9B是表示本发明的实施方式1的图像块提取的一个例子的图。
图10是表示本发明的实施方式1的色特征量信息提取处理的详细情形的操作程序图。
图11是表示本发明的实施方式1的分割图像网格块的一个例子的图。
图12是表示本发明的实施方式1的顺序决定表的一个例子的图。
图13是表示本发明的实施方式1的色空间上的色贮藏室的构成的一个例子的图。
图14是表示本发明的实施方式1的用户接口的一个例子的图。
图15是表示本发明的实施方式1的比较处理的详细情形的操作程序图。
图16是表示本发明的实施方式1的页比较处理的详细情形的操作程序图。
图17是表示本发明的实施方式1的色特征量信息比较处理的详细情形的操作程序图。
图18是表示本发明的实施方式1的色贮藏室惩罚矩阵的构成的一个例子的图。
图19是表示本发明的实施方式1的用户接口的一个例子的图。
图20是表示本发明的实施方式2的检索处理的操作程序图。
图21是表示本发明的实施方式2的在1张打印纸上Nup打印与4页相当的文档的例子的图。
图22是表示本发明的实施方式2的Nup打印判定处理的详细情形的操作程序图。
图23是表示本发明的实施方式3的在1张打印纸上Nup打印与4页相当的文档例子的图。
图24是用于说明本发明的实施方式3的Nup打印判定处理的图。
图25是表示本发明的实施方式4的登记处理的操作程序图。
图26是表示本发明的实施方式5的登记处理的操作程序图。
具体实施例方式
下面,我们用附图详细说明本发明的实施方式。
《实施方式1》图1是表示本发明的实施方式1的图像处理系统的构成的方框图。
该图像处理系统是在用因特网等的网络104连接办公处所10和办公处所20的环境中实现的。
作为实现多种功能的复合机的MFP(Multi Function Peripheral(多功能外围设备))100、控制MFP100的管理PC101、客户PC102、文档管理服务器106及其数据库105和代理服务器103与构筑在办公处所10内的LAN107连接。
办公处所10内的LAN107和办公处所20内的LAN108通过双方办公处所的代理服务器103与网络104连接。
MFP100,特别,具有电子地读取纸文档的图像读取单元和对从图像读取单元得到的图像信号实施图像处理的图像处理单元,能够通过LAN109将该图像信号发送到管理PC101。
管理PC101是通常的PC,在内部具有图像存储单元、图像处理单元、显示单元、输入单元等的各种构成要素,而且这些构成要素的一部分具有与MFP100形成一体化的构成。
又,网络104典型地是通过因特网、LAN、WAN和电话线路、专用数字线路、ATM和帧中继线路、通信卫星线路、电缆电视线路、数字广播用无线电线路等中的某一个或它们的组合实现的所谓的通信网络,最好可以进行数据的发送接收。
又,管理PC101、客户PC102、文档管理服务器等的各种终端分别具有搭载在通用计算机中的标准的构成要素(例如,CPU、RAM、ROM、硬盘、外部存储装置、网络接口、显示器、键盘、鼠标等)。
其次,我们用图2说明MFP100的详细构成。
图2是表示本发明的实施方式1的MFP的详细构成的方框图。
在图2中,包含原稿台和自动文档供给器(ADF)的图像读取单元110用光源(图中未画出)照射束状或1张的原稿图像,由透镜将原稿反射像成像在固体摄像元件上,从固体摄像元件得到光栅状的图像读取信号作为预定密度(例如,600DPI)的光栅图像。
又,MFP100具有用打印单元112将与图像读取信号对应的图像打印在记录媒体上的复印功能,当复印1个原稿图像时,用数据处理单元115对该图像读取信号进行图像处理生成记录信号,由打印单元112将它打印在记录媒体上。另一方面,当复印多个原稿图像时,在临时将与一个原稿图像相当的记录信号存储保持在存储单元111中后,将它顺次地输出到打印单元112,打印在记录媒体上。
又,当进行Nup打印时,缩小与用数据处理单元115指定的页相当的图像信号,为了可以在一张打印纸上打印出来而布局各页的图像信号。此后,输出到打印单元112打印在记录媒体上。
另一方面,数据处理单元115通过LAN107和网络IF114接收从客户PC102输出的记录信号,数据处理单元115在将该记录信号变换成可以记录在打印单元112中的光栅数据后,由打印单元112打印在记录媒体上。
操作者对MFP100的指示是通过由与装备在MFP100中的键操作单元和管理PC101连接的键盘和鼠标构成的输入单元113进行的,由数据处理单元115内的控制单元(图中未画出)对这一连串的工作进行控制。又,由显示单元116进行操作输入的状态显示和处理中的图像数据的显示。
存储单元111也由管理PC101进行控制,通过网络IF117和LAN109进行MFP100和管理PC101的数据的发送接收和控制。
又,在MFP100中,由显示单元116和输入单元113实现将用于实施后述的各种处理的各种操作/显示提供给用户的用户接口。
作为由根据本发明的图像处理系统实施的处理,大致分成登记图像数据的登记处理和检索所要的图像数据的检索处理这样2种处理。
又,在实施形态1中,为了提高图像处理系统整体的处理效率,将下面说明的各种处理分散到构成图像处理系统的各种终端加以实施,但是也可以在1个终端(例如MFP100)上加以实施。
首先,我们说明登记处理[登记处理的概要]作为登记对象的图像数据的登记方法,是登记扫描输入纸文档生成的图像数据的情形、和登记将由文档作成应用程序等作成的电子文档展开成光栅图像的图像数据的情形。
因此,我们用图3A说明登记原始文档的登记处理的概要。
图3A是表示本发明的实施方式1的登记处理的操作程序图。
又,该处理是在将作为登记对象的纸文档设置在图像读取单元110的ADF中,操作输入单元113的登记按钮的时刻开始的。又,登记对象的纸文档既可以是1张也可以是多张,但是当是多张时,将从该纸文档得到的图像数据组(页图像组)作为1个文档进行管理。
首先,在步骤S3010,输入作为登记对象的原始文档。又,伴随着该输入,生成用于管理原始文档的各种信息,存储在存储单元111中。
又,关于登记原始文档时的原始文档输入方法,存在着2种方法。
当原始文档是电子数据时,存储在客户PC102内的硬盘内,或办公处所10和20内的文档管理服务器106内的数据库105内,或MFP100的存储单元111中的某一个内,从这些存储源读出作为登记对象的原始文档的电子数据,通过网络IF114输入到数据处理单元115,由数据处理单元115将该电子数据变换成光栅图像。
另一方面,当原始文档是纸文档时,在MFP100的图像读取单元110中,光栅状地扫描该纸文档得到光栅图像。
这样,在实施方式1中,在作为登记对象的原始文档中,也可以处理电子数据或纸文档中的某一个。此后,由数据处理单元115对光栅图像实施前处理,保存在存储单元111中(又,此后,当是纸文档时光栅图像成为原始文档的电子数据)。这时,对每个作为登记对象的原始文档发行固有的文档ID,对应地附加原始文档的电子数据的地址作为地址信息保存在存储单元111中。
这里,所谓的地址指的是表示由URL、服务器名和目录、文档名构成的电子数据的存储目的地的总线信息。又,当表示地址信息的一个例子时,如图4所示。又,地址信息的存储目的地可以举出数据库105和存储单元111等。
又,令当原始文档是纸文档时的电子数据的文档形式,例如,为BMP形式,但是不限定于此,如果是可以保存色信息的文档形式(例如,GIF、JPEG)则也可以是任何形式。
另一方面,当原始文档是电子数据时该电子数据的文档形式成为由作成该电子数据的应用程序(例如,微软(注册商标)公司的MS-Word和Adobe系统(注册商标)的Acrobat等)作成的文档形式(*.doc和*.pdf)。
其次,在步骤S3011,将在步骤S3010输入的文档的数量设定为文档输入数P。其次,在步骤S3012,分别在表示处理文档数的变量a和表示处理对象的1个文档中的处理页数的变量b中设定1作为初始值。其次,在步骤S3013,将第a个的文档中的页数设定为1个文档的页数Q。
其次,作为结束判定,判定P是否大于等于a。当不到a时(步骤S3014中“否”),结束处理。另一方面,当大于等于a时(步骤S3014中“是”),因为存在未处理的文档,所以继续处理。
其次,在步骤S3015,作为文档单位的结束判定,判定Q是否大于等于b。当不到b时(步骤S3015中“否”),行进到步骤S3032,使a增加1,回到步骤S3014,将处理对象移动到下一个文档。另一方面,当大于等于b时(步骤S3015中“是”),因为存在未处理的页,所以继续处理。
其次,关于第P个文档的Q页,进行块选择(BS)处理。该处理是通过管理PC101的控制实施的。
具体地说,管理PC101的CPU,首先,将存储在存储单元111中的处理对象的原始文档的光栅图像,区域分割成文字/线图像部分和半色调图像部分,进一步将文字/线图像部分分割成在段落中作为块汇集的每个块或由线构成的每个表、图形。
另一方面,将半色调图像部分分割成分离成矩形的块的图像部分、背景部分等的块。
而且,发行作为处理对象的页的页号码、和特定该页中的各块的块ID,使各块的属性(图像、文字等)、大小和原始文档内的位置(页内的坐标)与各块关联起来,作为块信息存储在存储单元111中。当表示该块信息的一个例子时,如图5所示。
其次,在步骤S3030,在数据处理单元115中,与各块的种类相应,进行提取各块的特征量信息的特征量信息提取处理。
特别是,关于文字块,实施OCR处理提取文字码,将它作为文字特征量。又,关于图像块,提取关于色的图像特征量。这时,将与各个块对应的特征量汇集成原始文档单位,与文档ID、页号码、块ID关联地作为特征量信息存储在存储单元111中。当表示该特征量信息的一个例子时,如图6和图7所示。
其次,在步骤S3031,使b增加1,回到步骤S3014,移动到处理对象的下一页。
我们用图3B说明检索原始文档的电子数据的检索处理的概要。
图3B是表示本发明的实施方式1的检索处理的操作程序图。
首先,在步骤S3110,输入成为检索条件的纸文档。因为该处理与步骤S3010的处理相同,所以省略对它的说明。但是,只暂时保存由该处理生成的光栅图像,不需要将对于该纸文档的地址信息保存在存储单元111中。
其次,在步骤S3111,判定有无由用户指定的Nup打印。当存在Nup打印的指定时(步骤S3111中“是”),行进到步骤S3112,将用户指定的1张中的页数设定为页数L。另一方面,当不存在Nup打印的指定时(步骤S3111中“否”),行进到步骤S3115,看作1张中的1页,将页数L1设定为1。
其次,在步骤S3113,将表示处理对象的1个文档中的处理页数的变量b设定为1作为初始值。其次,作为比较处理的结束判定,判定L是否大于等于b。当不到b时(步骤S3116中“否”),行进到步骤S3150。另一方面,当大于等于b时(步骤S3116中“是”),因为存在未处理的页,所以为了继续处理,行进到步骤S3120。
其次,在步骤S3120,对于光栅图像中的第b页的图像区域,进行块选择(BS)处理。
我们用图8说明这时的块选择处理的具体例子。
在图8中,表示了Nup打印与2页相当的部分的例子。在图8中,810是1张纸整体的区域,811和812表示各页的页图像。813和814表示各页的页号码。这里,当b=1时,只对包含第1页的页图像811的处理对象区域815,进行块选择处理。而且,在图8的例子中,当b=2时,对包含第2页的页图像812的处理对象区域进行块选择处理。
又,因为该块选择处理自身与步骤S3020的块选择处理相同所以省略对它的说明。但是只暂时保存由该块选择处理生成的各块的属性、大小、位置,不需要将对于该纸文档的块信息保存在存储单元111中。
又,根据L的值和纸文档的方向,将1张纸文档分割成L个区域,进一步根据预定的处理顺序决定处理对象区域。
其次,在步骤S3130,进行提取各块的特征量信息的特征量信息提取处理。因为该处理与步骤S3030的处理相同,所以省略对它的说明。但是,只暂时保存由该处理生成的各块的特征量,不需要将对于该纸文档的特征量信息保存在存储单元111中。
其次,在步骤S3140,比较对于输入的纸文档中的第b页的图像(比较源图像)的特征量信息与存储在客户PC102内的硬盘内、或办公处所10和办公处所20内的文档管理服务器106内的数据库105内、或MFP100的存储单元111中的某一个内的电子数据(比较目的图像)的特征量信息,算出它们的类似度,根据该类似度,决定作为检索结果的原始文档候补。
其次,在步骤S3141,使b增加1,回到步骤S3116,使处理对象移动到下一页。
而且,在步骤S3116,当L不到b时(步骤S3116中“否”),行进到步骤S3150,判定是否是用户确认模式。
又,所谓的用户确认模式指的是从由比较结果得到的原始文档候补中,确认是否检索用户所要的原始文档的模式。具体地说,是由显示单元116/输入单元113实现包含原始文档候补组的用户接口,通过该用户接口,用户能够确认原始文档候补组的内容的模式。又,我们将在后面述说该用户接口的构成的详细情形。
在步骤S3150,当不是用户确认模式时(步骤S3150中“否”),自动选择在比较处理中判断为最类似的文档,行进到步骤S3170。另一方面,当是用户确认模式时(步骤S3150中“是”),行进到步骤S3160,显示/选择原始文档候补。特别是,在显示单元116中显示出原始文档候补的缩略图像,从多个原始文档候补中用户选择所要的原始文档候补的缩略图像来实现该选择。
其次,在步骤S3170,根据通过由显示单元106/输入单元114实现的用户接口的来自用户的操作,对选出的原始文档,实施该原始文档的打印、分配、存储、编辑中的某一种处理。
如以上说明的那样,当Nup打印时,对于1个文档中包含的各页中的每一页,进行块选择处理和特征量信息提取处理,用它们对每一页顺序地实施类似图像检索,能够全部检索并活用与各页对应的电子数据。
下面,我们说明各处理的详细情形。
首先,我们说明步骤S3020和步骤S3120的块选择处理的详细情形。
所谓的块选择处理指的是,例如,将图9A的光栅图像,如图9B那样,作为具有意义的每个块进行识别,判定该块的各个属性(文字(TEXT))/图像(PICTURE))/照片(PHOTO)/线(LINE)/表(TABLE)等),分割成具有不同属性的块的处理。
下面,我们说明块选择处理的实施方式。
首先,使输入图像二值化为黑白,进行轮廓线追踪提取由黑像素轮廓包围的像素块。关于面积大的黑像素块,即便对于处于内部的白像素,也进行轮廓线追踪提取白像素块,进一步从大于等于一定面积的白像素块的内部递归地提取黑像素块。
用大小和形状对这样得到的黑像素块进行分类,分类成持有不同属性的块。例如,将纵横比接近于1,大小在一定范围内的块作为与文字相当的像素块,进一步将接近的文字可以整列地分组化的部分作为文字块,将扁平的像素块作为线块,将整列地内包大于等于一定大小并且矩形的白像素块的黑像素块的占据范围作为表块,将不定形的像素块散布的区域作为照片块,将除此以外的任意形状的像素作为图画块。
其次,我们说明步骤S3030和步骤S3130的特征量信息提取处理的详细情形。
又,因为在图像块和文字块中处理方法是不同的,所以我们分别说明各自的特征量信息提取处理。
这里,在图9B的例子中,将图像块作为照片块和图画块,但是与用途和目的相应,也可以将图像块作为照片块和图画块中的至少一方。
首先,我们说明对于图像块的特征量信息提取处理。
又,当1个文档中存在多个图像块时,与它的总数相当,反复进行下列的处理。
在实施方式1中,作为一个例子,进行提取关于图像颜色的色特征量的色特征量信息提取处理。
我们用图10说明该色特征量信息提取处理的详细情形。
图10是表示本发明的实施方式1的色特征量信息提取处理的详细情形的操作程序图。
又,在该处理中,提取具有将处理对象图像分割成多个网格块的各网格块的色直方图中的最常出现的颜色的颜色和与各网格块的位置信息对应的信息作为色特征信息。
首先,在步骤S1020,将图像分割成多个网格块。在实施方式1中,如图11所示,将图像分割成纵横各9个网格块。特别是,在实施方式1中,为了示例的方便表示分割成9×9=81个网格块的例子,但是实际上最好分割成约15×15=225个网格块。
其次,在步骤S1030,将成为处理对象的注目网格块设定在左上端的块中。又,例如,如图12所示,参照预先决定处理顺序的顺序决定表设定该注目网格块。
在步骤S1040,判定有无未处理的注目网格块。当没有未处理的注目网格块时(步骤S1040中“否”),结束处理。另一方面,当具有未处理的注目网格块时(步骤S1040中“是”),行进到步骤S1050。
在步骤S1050,将注目网格块的全部像素的各浓度值投影到作为分割图13的色空间作成的部分空间的色贮藏室(bin),生成对于色贮藏室的色直方图。
又,在实施方式1中,如图13所示,表示将注目网格块的全部像素的浓度值投影到将RGB色空间分割成3×3×3=27的色贮藏室的情形,但是实际上,最好将注目网格块的全部像素的浓度值投影到将RGB色空间分割成6×6×6=216的色贮藏室。
在步骤S1060,将色直方图的最常出现的色贮藏室的色贮藏室ID决定为该注目网格块的代表色,将该注目网格块及其位置对应地存储在存储单元111中。
在步骤S1070,参照图12的顺序决定表,设定成为下一个处理对象的注目网格块。此后,回到步骤S1040,递归地反复进行步骤S1040~步骤S1070的处理,直到没有未处理的注目网格块为止。
通过以上的处理,能够提取每个处理对象图像(画像块)的网格块的代表色和与各网格块的位置信息对应的信息作为色特征量信息。
其次,我们说明对于文字块的特征量信息提取处理。
又,当1个文档中存在多个文字块时,与它的总数相当,反复进行下列的处理。
将对于文字块的文字特征量信息作为在该文字块中实施OCR(文字识别)处理得到的文字码。
OCR(文字识别)处理,对于从文字块以文字为单位切出的文字画像,用图案匹配的方法进行文字识别,取得对应的文字码。
该文字识别处理比较将从文字画像得到的特征变换成数十维数值列的观测特征矢量和预先对于每个字符类型求得的字典特征矢量,将距离最近的字符类型作为识别结果。
关于特征矢量的提取具有种种众所周知的方法,例如,具有将文字分割成网格状,以将各网格块内的文字线作为不同方向上的线素进行计数的网格数维矢量为特征的方法。
当对由块选择处理(步骤S3020或步骤S3120)提取的文字块进行文字识别时,首先,对该文字块判定横写/纵写,在各各对应的方向上切出文字列,此后,从文字列切出文字取得文字画像。
横写/纵写的判定是在相应的文字块内取对于画素值的水平/垂直的投影,当水平投影的分散大时判定为横写,当垂直投影的分散大时判定为纵写。到文字列和文字的分解,当是横写文字块时,利用它的水平方向的投影切出行,进一步从对于切出行的垂直方向的投影,切出文字。另一方面,对于纵写的文字块,最好使水平和垂直相反。
其次,我们说明图3B的步骤S3111的Nup打印的指定方法的详细情形。
Nup打印指定是通过MFP100的用户接口,判定是否是Nup打印,进一步,当是Nup打印,指定在1张文档中包含的页数。
我们用图14说明该用户接口的一个例子。
图14是表示本发明的实施方式1的用户接口的一个例子的图。
1411是显示/操作面板。1412~1415是各种功能按钮,各个功能按钮1412~1415是用于进行处理对象的画像的打印指示、分配指示、存储指示和编辑指示的按钮。
1416是开始按钮,通过按下它,能够实施由功能按钮选择的功能。1425是数码键,可以进行打印时的张数指定和Nup打印时的1张打印纸中包含的页数指定。
1417是显示区域,由触摸面板构成,用户通过直接触摸画面可以选择指示。1418是纸文档确认用区域,将由画像读取单元110读取的纸文档画像缩小到收入区域内的大小进行显示。用户可以在该区域1418中确认纸文档画像的状态。
1419是确认输入原稿的种类的区域,能够确认读取的纸文档的种类的内容。在该区域1419内,1420是指定Nup打印的指定区域。又,当指定Nup打印时,为了显示该指定的状态,将它的显示形态变更到例如,附有颜色的显示、闪烁显示、高亮度显示等的显示形态。
1424是当指定Nup打印时,显示1张打印纸中包含的页数的区域,特别是,当不指定Nup打印时,设定为1。使用数码键1425指定页数。
通过构成这样的用户接口,当对于读取的纸文档指定Nup打印,是Nup打印时,能够一面显示该状态一面指定在1张打印纸中包含与哪一页相当的文档。
其次,我们用图15说明步骤S3140的比较处理的详细情形。
图15是表示本发明的实施方式1的比较处理的详细情形的操作程序图。
首先,在步骤S1510,参照地址信息,判定有无未比较的原始文档。当没有未比较的原始文档时(步骤S1510中“否”),行进到步骤S1550。另一方面,当具有未比较的原始文档时(步骤S1510中“是”),行进到步骤S1520。
其次,进行布局比较。这里,所谓的布局指的是块信息中的块的属性、大小、位置。当比较源图像(纸文档)和比较目的图像(电子数据)的布局相同时(步骤S1520中“是”),行进到步骤S1530。另一方面,当比较源图像和比较目的图像的布局不同时(步骤S1520中“否”),回到步骤S1510。
其次,在步骤S1530,实施比较源图像(纸文档)和比较目的图像(电子数据)的页的页比较处理。该比较用与块属性一致,与各个文字、图像相应的特征量,复合地进行比较,算出类似度。我们将在后面述说该处理的详细情形。
其次,在步骤S1540,将比较目的的文档ID、与页号码对应的文档的类似度暂时存储在存储单元111中。
在步骤S1510,当与全部文档的比较结束时(步骤S1510中“否”),行进到步骤S1550,以类似度下降的顺序选择并输出文档ID和页号码。
其次,我们用图16说明步骤S1530的页比较处理的详细情形。
图16是表示本发明的实施方式1的页比较处理的详细情形的操作程序图。
首先,在步骤S1610,参照块信息,判定在与成为处理对象的文档ID和页号码对应的电子数据中,有无未比较的块。当没有未比较的块时(步骤S1610中“否”),行进到步骤S1670。另一方面,当具有未比较的块时(步骤S1610中“是”),行进到步骤S1620。
其次,在步骤S1620判定比较对象的块属性。当属性是图像块时,行进到步骤S1640。另一方面,当属性是文字块时,行进到步骤S1660。
当属性是图像块时,在步骤S1640,用关于色的特征量信息进行作为与比较目的块的类似比较的色特征量信息比较处理。我们将在后面述说该处理的详细情形。又,将由此得到的类似度,与比较目的的文档ID、页号码、与块ID对应地暂时存储在存储单元111中。
另一方面,当属性是文字块时,在步骤S1660,进行作为文字特征量信息中比较原块和比较目的块的类似比较的文字特征量信息比较处理。我们将在后面述说该处理的详细情形。又,将由此得到的类似度,与比较目的的文档ID、页号码、与块ID对应地暂时存储在存储单元111中。
其次,在步骤S1610,当与全部块的比较结束时(步骤S1610中“否”),行进到步骤S1670,通过步骤S1640和步骤S1660的处理,存储在存储单元111中。整合在比较目的文档(电子数据)的页中包含的全部块的类似度,进行算出与作为检索条件的纸文档和原始文档中的页的类似度的整合处理。我们将在后面述说该处理的详细情形。
其次,我们用图17说明步骤S1640的色特征量信息比较处理的详细情形。
图17是表示本发明的实施方式1的色特征量信息比较处理的详细情形的操作程序图。
首先,在步骤S1710,从色特征量信息读出比较源图像块和比较目的图像块的色特征量。
其次,在步骤S1720,在前头设定作为处理对象的图像块中的注目网格块。在步骤S173,将表示比较源图像块的色特征量和比较对象的色特征量的类似度的类似距离设置为0。
在步骤S1740,判定有无未比较的注目网格块。当没有未比较的注目网格块时(步骤S1740中“否”),行进到步骤S1780。另一方面,当具有未比较的注目网格块时(步骤S1740中“是”),行进到步骤S1750。
在步骤S1750,从比较源图像和比较目的图像的各个色特征量,取得各个注目网格块的色贮藏室ID。
在步骤S1760,参照图18的色贮藏室惩罚矩阵,取得与取得的色贮藏室ID间对应的注目网格块的局域类似距离,将它累计地加到前一个处理中取得的类似距离上。而且,将该类似距离存储在存储单元111中。
这里,我们用图18说明色贮藏室惩罚矩阵。
图18是表示本发明的实施方式1的色贮藏室惩罚矩阵的构成的图。
色贮藏室惩罚矩阵是管理色贮藏室ID的局域类似距离的矩阵。如果根据图18,则色贮藏室惩罚矩阵具有在同一个色贮藏室ID,它的类似距离成为0,色贮藏室ID之差越大,即,类似度越低,它的类似距离就越大的构成。又,同一个色贮藏室ID的对角位置全部,其类似距离为0,对于类似距离为0色贮藏室ID是对称的。
这样,在实施方式1中,因为只参照色贮藏室惩罚矩阵,就能够取得色贮藏室ID的类似距离,所以能够达到使处理高速化的目的。
而且,在步骤S1770,参照图12的顺序决定表,设定成为下一个处理对象的注目网格块。此后,回到步骤S1740。
而且,在步骤S1740,当没有未比较的注目网格块时(步骤S1740中“否”),行进到步骤S1780,将存储在存储单元111中的类似距离变换成类似度,与块ID成对地输出。
又,到类似度的变换,例如,当类似距离为最小值时使类似度为100%,当类似距离为最大值时使类似度为0%,可以根据对于最小值或最大值的差算出对于该范围内的类似距离的类似度。
其次,我们说明步骤S1660的文字特征量信息比较处理的详细情形。
在该处理中,进行比较源图像和比较目的图像中的各个文字块内的各文字码的比较,从它们的一致度算出类似度。
又,当比较作为检索条件的纸文档和原始文档时,类似度成为100%是理想的,但是因为实际上,存在着在对于作为检索条件的纸文档的文字块的OCR处理中发生误识别的情形,所以即便可以与原始文档比较,类似度也不成为100%,而是成为相当接近100%的值。
其次,我们说明步骤S1670的整合处理的详细情形。
在该整合处理中,为了更大反映在作为比较目的图像的原始文档内占据的比例大的块的类似度,作为原始文档整体的类似度,整合算出的每一个块的类似度。
例如,对于原始文档中的块B1~B6,算出每个块的类似率为n1~n6,这时原始文档整体的总合类似率N由下列公式表现出来。
N=w1*n1+w2*n2+w3*n3+…+w6*n6 (1)这里,w1~w6是评价各块的类似率的权重系数。权重系数w1~w6是从块的原始文档内的占有率算出的。例如,当令块1~6的大小为S1~S6时,能够算出块1的占有率w1为w1=S1/(S1+S2+…+S6)(2)通过用这种占有率进行加权处理,能够将在原始文档内占据大的区域的块的类似度更好地在原始文档整体的类似度中反映出来。
其次,我们说明当步骤S3150和步骤3160中表示的确认模式时的处理的详细情形。
既可以用户预先从用户接口指定确认模式,也可以自动判定是否要决定确认模式。作为自动判定方法,具有下列的方法。例如,当检索到的原始文档候补为1时,或者,当1位的原始文档候补和2位以后的原始文档候补的各个类似度之差大于等于预定值,1位的原始文档候补是所要的原始文档的可能性高时,作为“非确认模式”行进到步骤S3170,当不是这种情形时,作为“确认模式”。
但是,当扫描Nup打印的纸文档时,关于与扫描图像中的各页对应的各个候补,1个都不满足上述条件时,成为“确认模式”,只确认不满足上述条件的页。
当“确认模式”时,在由MFP100的显示单元110和输入单元113实现的用户接口中,以类似度高的顺序显示原始文档候补组,让用户从中选择所要的原始文档。
这样,当自动判定有无实施确认模式时,因为不需要由用户进行选择原始文档的操作,所以能够减少操作步骤。
这里,我们用图19说明确认模式时的用户接口的一个例子。
图19是表示本发明的实施方式1的用户接口的一个例子的图。
1917是显示区域,由触摸面板构成,用户通过直接触摸画面可以选择指示。又,该显示区域1917与图14的显示区域1417相同。
1918是模式显示区域,在图19中,表示为确定模式。通常显示自动判定的模式。又,通过触摸它,用户能够循环地指定“确认模式”和“非确认模式”。1919~1928是作为检索结果输出的原始文档候补的缩略图像组。该缩略图像的显示以从1919开始的号码顺序以类似度高的顺序进行显示。
在本例中,当显示最大为10个的缩略图像,原始文档候补大于等于10时,显示直到10个缩略图像。而且,通过从该缩略图像组1919~1928,选择所要的缩略图像,可以选择所要的原始文档,可以对该选出的原始文档实施各种处理。
1929表示当扫描Nup打印的纸文档时显示的是否显示文档中第哪一页的候补。又,通过选择它,也可以切换其它页的候补进行显示。
其次,我们说明步骤S3170的打印/分配/存储/编辑处理的详细情形。
例如,当扫描Nup打印的纸文档,用它进行类似图像检索时,能够得到对于该文档中的各页的与多个页相当的检索结果(原始文档)。
而且,当用这些与多个页相当的检索结果进行打印时,作为它的打印条件,例如,既可以在1张打印纸上打印1页,原来的Nup打印也可以进行变更了布局的Nup打印,也可以在1张打印纸的两面上打印各页,既可以将各页重叠在1张打印纸上进行打印,也可以改变顺序进行装订打印。又,当然,也可以只将用户指定的页打印在1张打印纸上。
又,除了打印处理以外,既可以对于全部检索结果,进行分配、存储、编辑等的处理,也可以只对用户指定的页进行分配、存储、编辑等的处理。
如以上说明的那样,如果根据实施方式1,则对于在Nup打印的纸文档中包含的全部页,能够检索原始的电子数据,并且能够实现用该检索到的电子数据的种种活用。
《实施方式2》在实施方式1中,具有判定输入的纸文档是否是Nup打印,进一步,当是Nup打印时,用户指定在1张文档中包含的页数的构成,但是在实施方式2中,我们说明具有解析输入的纸文档的内容,根据该解析结果,判定纸文档是否是Nup打印,进一步,当是Nup打印时,自动判定在1张文档中包含的页数的构成。又,在实施方式1的图3B的步骤S3110输入纸文档后实施该自动判定的定时。
下面,我们用图20说明实施方式2的检索处理。
图20是表示本发明的实施方式2的检索处理的操作程序图。
又,在图20中,在与实施方式1的图3B的检索处理相同的处理步骤上附加相同的步骤号码,并省略对它们的详细情形的说明。
在步骤S3110,输入纸文档后,在步骤S2011,进行判定输入的扫描图像是否是Nup打印的Nup打印判定处理。而且,根据该判定结果,实施步骤S3111的处理。
这里,在纸文档上打印与1页相当的文档的通常打印的情形中,在纸文档的上端或下端打印页号码。另一方面,在Nup打印的情形中,在纸文档内等间隔地打印多个页号码。因此,在实施方式2中,利用这点,判定处理对象的扫描图像是否是Nup打印。
作为一个例子,我们说明图21所示的在1张打印纸上Nup打印与4页相当的文档的情形。
图21是表示本发明的实施方式2的在1张打印纸上Nup打印与4页相当的文档的例子的图。
在图21中,2110表示Nup打印时的纸整体的区域。2111~2114表示各页的页图像。2115~2118是赋予各页的号码。2119和2120的粗线框内是后面述说的页号码探索区域。
我们用图21和图22说明步骤S2011的Nup打印判定处理的详细情形。
图22是表示本发明的实施方式2的Nup打印判定处理的详细情形的操作程序图。
首先,在步骤S2210,对打印纸整体的区域2110的上端和下端的区域,实施OCR处理。其次,在步骤S2220,作为OCR处理的处理结果,判定页号码(例如,阿拉伯数字或英文数字)是否大于等于2个,是否等间隔地存在于上端区域或下端区域的同一个区域内。当不存在页号码大于等于2个时(步骤S2220中“否”),行进到步骤S2260,判定是通常打印。另一方面,当存在页号码大于等于2个时(步骤S2220中“是”),行进到步骤S2230。
在图21的例子中,在下端区域在2个地方检测出页号码2117(“3”)和2118(“4”)。
在步骤S2230,根据检测出的页号码,设定用于探索其它页号码的页号码探索区域,对该设定的页号码探索区域实施OCR处理。
在图21的例子中,在页号码图像2117和2118中,在包含各个页号码的打印纸整体的垂直方向上,设定页号码探索区域2119和2120。而且,对各页号码探索区域2119和2120实施OCR处理。
其次,在步骤S2240,在各页号码探索区域中检测页号码,判定各页号码探索区域中的各页号码的间隔是否相同。当不相同时(步骤S2240中“否”),行进到步骤S2260,判定是通常打印。另一方面,当相同时(步骤S2240中“是”),行进到步骤S2250,判定是Nup打印。
又,这里的间隔是否相同的判定是对包含考虑到某种程度的误差范围的页号码之间的间隔实施的。即,当页号码之间的间隔包含在该误差范围内时,判定页号码之间的间隔相同。
在图21的例子中,在页号码探索区域2119中检测出页号码2115(“1”)和2117(“3”),在页号码探索区域2120中检测出页号码2116(“2”)和2118(“4”)。而且,页号码探索区域2119和页号码探索区域2120中的页号码间隔成为相同的间隔。因此,这时,判定Nup打印。
又,这时,使在步骤S2210检测出的页号码数与在步骤S2230的1个页号码探索区域中检测出的页号码数相乘,能够算出1张打印纸中包含的页数,将该页数暂时保存在存储单元111中。
如以上说明的那样,如果根据实施方式2,则除了实施方式1中说明的效果外,自动地判定扫描图像是否是Nup打印,可以不用麻烦用户动手,判定是否是Nup打印,又,当是Nup打印时判定与哪一页相当地包含扫描图像。
又,在实施方式2中,也可以具有临时向用户提示步骤S2011的Nup打印判定处理的处理结果使用户确认的构成。这时,如图14的纸文档确认用区域1418那样最好将判定结果作为缩小图像显示出来。又,作为确认的结果,当误判定时,可以给予用区域1419修正判定内容的机会。
根据这种构成,即便在Nup打印判定处理中是误判定,也能够修正该判定内容,防止输出错误的原始电子数据。
《实施方式3》在实施方式2中,我们说明了在步骤S2011的Nup打印判定处理中,用OCR处理,检测页号码的方法,但是不限定于此。例如,也可以如下那样地检测页号码。
这里,我们说明如图23所示,在1张打印纸上Nup打印与4页相当的文档的情形。
又,因为2310与图21的2110对应,下面同样地,2311与2111对应,2312与2112对应,2313与2113对应,2314与2114对应,2315与2115对应,2316与2116对应,2317与2117对应,2318与2118对应,所以省略对它们的说明。
在图23中,2320是左侧的2个页的左边缘(最左端空白)。2321是右侧的2个页的右边缘(最右端空白)。2319是左侧的2个页和右侧的2个页的中间边缘(中间空白)。这里,因为中间边缘2319与左侧的2个页的右边缘和右侧的2个页的左边缘连续,所以比左边缘2320和右边缘2321长。
而且,当检测出中间边缘2319时,能够判定是Nup页打印。
又,在图23中,我们注目于横方向的边缘进行说明,但是关于纵方向也是同样的。
其次,我们用图24说明更详细的具体例。
2410表示纸整体的区域。首先,对它进行块选择处理,得到块2411~2421作为块选择处理结果。首先,检测检出的块组的最左端,算出作为纸整体区域的左端的差分的左边缘2422。而且,该左边缘2422与图23的左边缘2320相当。
同样,检测块组的最右端,算出作为纸整体区域的右端的差分的右边缘2423。而且,该右边缘2423与图23的右边缘2321相当。
此后,算出各块组的横方向的间隔,算出中间边缘2319的中间边缘候补2424、2425。在中间边缘候补2424、2425中,将比左边缘2422、右边缘2423长的中间边缘候补2424作为中间边缘。
这样检测出的中间边缘的数+1成为横方向的页数。在纵方向也进行同样的处理,将各个结果乘起来,能够算出页的总数。
如以上说明的那样,如果根据实施方式3,则与实施方式2中说明的效果相同,自动地判定扫描图像是否是Nup打印,可以不用麻烦用户动手,判定是否是Nup打印,又,当是Nup打印时判定与哪一页相当地包含扫描图像。
又,在实施方式1中,也可以在图14的纸文档确认用区域1418中,用户触摸显示所要的页的范围,指定页,选择处理对象的页。这时,从步骤S3120到步骤S3140的处理,进行只对指定的页区域的处理。
又,即便在实施方式2、3中,也可以向用户提示Nup打印判定结果,通过进行同样的手续,也可以进行只对指定的页区域的处理。通过这样做,用户能够只对Nup打印的纸文档中的特定的页进行打印等处理。
又,我们说明了在图10的色特征量信息提取处理中,提取处理对象图像的最常出现的颜色作为色特征信息的例子,但是不限定于此,例如,也可以提取平均色作为色特征信息。
又,用色特征量作为图像特征量,但是不限定于此,例如,也可以用最经常出现的亮度、平均亮度等的亮度特征量、共同出现矩阵、对比度、熵、Gabor变换等表现的纹理特征量、边缘、傅里叶描述符等表现的形状特征量等多个种类的图像特征量中的一个或将它们任意多个组合起来得到的图像特征量。
又,进行块选择处理,将处理对象的文档分割成文字块和图像块,复合地使用这些各块的特征量进行检索,但是也可以将文档整体看作1个图像,进行原始文档的检索。又,如果在精度允许的范围内,则也可以只利用文档中的图像块,进行原始文档的检索。
又,将电子数据临时变换成光栅图像,但是当然也可以从电子数据直接选出文字码和图像进行比较。
又,采用文字码作为文字特征量,但是也可以例如,预先进行与单词字典的匹配,提取单词的品词,将是名词的单词作为文字特征量。
《实施方式4》在上述实施方式1中,作为登记对象的原始文档不是Nup打印的纸文档(或者它的电子数据),而作为通常打印的纸文档(或者它的电子数据),但是也能够将Nup打印的纸文档(或者它的电子数据)作为登记对象的原始文档。这时,与实施方式1的检索处理同样,当登记处理时,最好用户指定Nup打印和指定包含在1张文档(或者它的电子数据)中的页数。
这时的登记处理,例如,成为如图25那样。但是,在图25中,为了使说明简单起见,表示登记1张的Nup打印的纸文档时的登记处理。
又,图25的各步骤是通过将与实施方式1的图3A和图3B的一部分步骤大致相同的步骤组合起来实现的。
当简单地进行说明时,在步骤S3010,输入作为登记对象的原始文档。在步骤S3111,判定是否由用户指定原始文档是否是Nup打印文档。
而且,当判定指定Nup打印的纸文档时(步骤S3111中“是”),在步骤S3112,将用户指定的1张打印纸中的页数设定为页数L。另一方面,当判定不指定Nup打印文档时(步骤S3111中“否”),在步骤S3115,将页数L设定为1。
其次,在步骤S3113,作为初始值将表示处理对象的1个文档中的处理页数的变量b设定为1。其次,作为比较处理的结束判定,判定L是否大于等于b。当L不到b时(步骤S3116中“否”),结束登记处理。
另一方面,当L大于等于b时(步骤S3116中“是”),因为存在着未处理的页,所以行进到步骤S3120,对Nup的原始文档中的第b页的区域进行块选择处理。其次,在步骤S3130,提取各块的特征量信息存储在存储单元111中。而且,在步骤S3141,使b增加1,回到步骤S3116。
当然,也可以登记多张Nup打印的纸文档,这时,能够通过将实施方式1的图3A和图3B的步骤内的必要的步骤组合起来实现。
又,当登记Nup打印的纸文档时,既可以对登记对象的文档图像中包含的各个页图像,与在1张打印纸上打印1页时相同地进行图像分辨率变换,将它作为在1张打印纸上打印1页的文档图像进行登记,也可以原封不动地登记与Nup打印的纸文档对应的文档图像《实施方式5》也可以代替实施方式3的指定Nup打印,自动判定是否是Nup打印,进一步当是Nup打印时,自动判定包含在1张文档中的页数,进行登记处理。
这时的登记处理,例如,成为如图26那样。但是,在图26中,为了使说明简单起见,表示登记1张的Nup打印的纸文档时的登记处理。
又,图26的各步骤是通过将与实施方式1的图3A和实施方式2的图20的一部分步骤大致相同的步骤组合起来实现的。
当简单地进行说明时,在步骤S3010,输入作为登记对象的原始文档。在步骤S2011,自动判定原始文档是否是Nup打印文档。而且,当判定是Nup打印文档时,在步骤S3112中,将判定的页数设定为页数L。另一方面,当判定不是Nup打印文档时,在步骤S3115,将页数L设定为1。
其次,在步骤S3113,作为初始值将表示处理对象的1个文档中的处理页数的变量b设定为1。其次,作为比较处理的结束判定,判定L是否大于等于b。当L不到b时(步骤S3116中“否”),结束登记处理。
另一方面,当L大于等于b时(步骤S3116中“是”),因为存在着未处理的页,所以行进到步骤S3120,对Nup的原始文档中的第b页的区域进行块选择处理。其次,在步骤S3130,提取各块的特征量信息存储在存储单元111中。而且,在步骤S3141,使b增加1,回到步骤S3116。
当然,也可以登记多张Nup打印的纸文档,这时,也能够通过将实施方式1的图3A和实施方式2的图20的步骤内的必要的步骤组合起来实现。
以上,我们详细述说了实施方式例,但是本发明可以取例如作为系统、装置、方法、程序或存储媒体等的实施方式,具体地说,既可以适用于由多个设备构成的系统,又,也可以适用于由一个设备构成的装置。
又,本发明也包含通过直接或从远距离将实现上述实施方式的功能的软件的程序(在实施方式中与图示的操作程序图对应的程序)供给系统或装置,该系统或装置的计算机读出并实施该供给的程序码,实现本发明的情形。
从而,因为用计算机实现本发明的功能处理,所以安装在该计算机中的程序码自身也实现本发明。即,本发明也包含用于实现本发明的功能处理的计算机程序自身。
这时,如果具有程序的功能,则也可以是目标码、由翻译机实施的程序、供给OS的屏幕显示数据等的方式。
作为用于供给程序的记录媒体,例如,是软盘(floppy(注册商标)disc)、硬盘、光盘、光磁盘、MO、CD-ROM、CD-R、CD-RW、磁带、非易失性存储卡、ROM、DVD(DVD-ROM、DVD-R)等。
其它,作为供给程序的方法,也能够通过用客户计算机的浏览器与因特网的主页连接,从该主页将本发明的计算机程序本身或者经过压缩包含自动安装功能的文档下载到硬盘等的记录媒体上进行供给。又,也可以通过将构成本发明的程序的程序码分割成多个文档,从不同的主页下载各个文档来实现。即,对多位用户下载为了用计算机实现本发明的功能处理的程序文档的WWW服务器也包含在本发明内。
又,也可以通过对本发明的程序进行密码化,存储在CD-ROM等的存储媒体中分发给用户,对于清除了预定条件的用户,经过因特网从主页下载解除密码化的键信息,使用该键信息,实施经过密码化的程序并安装在计算机中来实现。
又,除了通过计算机实施读出的程序,实现上述实施方式的功能外,根据该程序的指示,在计算机上工作的OS等进行实际处理的一部分或全部,通过这些处理也能够实现上述实施方式的功能。
进一步,将从记录媒体读出的程序写入在插入计算机的功能扩展板和与计算机连接的功能扩展单元中备有的存储器后,根据该程序的指示,该功能扩展板和功能扩展单元中备有CPU等进行实际处理的一部分或全部,通过这些处理也能够实现上述实施方式的功能。
本发明不限于上述实施方式,在本发明的精神和范围内能够进行各种不同的变化和修改。所以,为了向公众报告本发明的范围,我们制订了下列权利要求书。
权利要求
1.一种图像处理装置,其特征在于它备有将多个电子数据作为比较目的图像存储起来的存储部件;电子地读取打印物,将该打印物的电子数据作为比较源图像输入的输入部件;根据包含在上述比较源图像中的页图像的数量,提取包含在上述比较源图像中的页图像的处理对象区域的特征量的提取部件;和用由上述提取部件提取出的特征量,从上述存储部件检索与上述比较源图像相对应的比较目的图像的检索部件。
2.权利要求1所述的图像处理装置,其特征在于它进一步备有对作为上述检索部件的检索结果的图像进行处理的处理部件。
3.权利要求1所述的图像处理装置,其特征在于它进一步备有指定包含在上述比较源图像中的页图像的页数的指定部件;上述提取部件,对于每个根据上述指定部件所指定的页数决定的处理对象区域,提取该处理对象区域的特征量。
4.权利要求1所述的图像处理装置,其特征在于上述提取部件提取上述处理对象区域的图像特征量和文字特征量中的一个或两个。
5.权利要求4所述的图像处理装置,其特征在于上述图像特征量是色特征量、亮度特征量、纹理特征量、形状特征量中的某一个或将它们任意多个组合起来的特征量。
6.权利要求4所述的图像处理装置,其特征在于上述文字特征量是文字码。
7.权利要求1所述的图像处理装置,其特征在于它进一步备有显示上述检测部件的检测结果的显示部件、和当作为上述检测部件的检测结果,在上述显示部件上显示多个比较目的图像时,从该多个比较目的图像选择所要图像的选择部件。
8.权利要求1所述的图像处理装置,其特征在于它进一步备有当由多个页图像构成上述比较源图像时,从该多个页图像指定所要的页图像的指定部件;上述提取部件提取包含由上述指定部件所指定的页图像的处理对象区域的特征量。
9.权利要求2所述的图像处理装置,其特征在于上述处理部件在指定的打印条件下打印由上述检索部件检索到的图像。
10.权利要求1所述的图像处理装置,其特征在于它进一步备有指示对上述检索结果的图像的处理种类的指示部件;上述处理的种类是打印、分配、存储、编辑中的某一种。
11.权利要求1所述的图像处理装置,其特征在于它进一步备有判定在上述比较源图像中是否存在多个页图像的第1判定部件;和当作为上述第1判定部件的判定结果,在上述比较源图像中存在多个页图像时,判定包含在上述比较源图像中的页图像的页数的第2判定部件;上述提取部件,对于每个根据由上述第2判定部件判定的页数决定的处理对象区域,提取该处理对象区域的特征量。
12.权利要求11所述的图像处理装置,其特征在于上述第1判定部件检测包含在上述比较源图像中的页号码,判定上述页号码是否等间隔地存在于预定区域内,来判定在上述比较源图像中是否存在多个页图像。
13.权利要求11所述的图像处理装置,其特征在于上述第1判定部件通过检测上述比较源图像的最右端空白或最左端空白和除此以外的中间空白,判定检测出的中间空白是否比上述最右端空白或上述最左端空白大,来判定在上述比较源图像中是否存在多个页图像。
14.权利要求11所述的图像处理装置,其特征在于它进一步备有显示上述第1判定部件的判定结果的显示部件、和修正上述判定结果的修正部件。
15.权利要求1所述的图像处理装置,其特征在于它进一步备有输入上述比较源图像的输入部件;和指定由上述输入部件输入的包含在比较源图像中的页图像的页数的指定部件,上述提取部件,对于每个根据由上述指定部件指定的页数所决定的处理对象区域,提取该处理对象区域的特征量,上述存储部件对应地存储上述比较目的图像和由上述提取部件提取的特征量。
16.权利要求1所述的图像处理装置,其特征在于它进一步备有输入上述比较目的图像的输入部件;判定在上述比较目的图像中是否存在多个页图像的第1判定部件;和当作为上述第1判定部件的判定结果,在上述比较目的图像中存在多个页图像时,判定包含在上述比较源图像中的页图像的页数的第2判定部件;上述提取部件,对于每个根据由上述第2判定部件判定的页数决定的处理对象区域,提取该处理对象区域的特征量;上述存储部件对应地存储上述比较目的图像和上述提取部件提取的特征量。
17.一种图像处理装置的控制方法,其特征在于它备有输入通过电子地读取打印物得到的电子数据作为比较源图像的输入步骤;根据包含在上述比较源图像中的页图像的数量,提取包含在上述比较源图像中包含的页图像的处理对象区域的特征量的提取步骤;和用由上述提取步骤提取出的特征量,从作为比较目的图像存储在存储媒体中的多个电子数据,检索与上述比较源图像相对应的比较目的图像的检索步骤。
18.一种用计算机实现图像处理控制的程序,其特征在于它备有输入通过电子地读取打印物得到的电子数据作为比较源图像的输入步骤的程序码;根据包含在上述比较源图像中的页图像的数量,提取包含在上述比较源图像中所包含的页图像的处理对象区域的特征量的提取步骤的程序码;和用由上述提取步骤提取的特征量,从作为比较目的图像存储在存储媒体中的多个电子数据,检索与上述比较源图像相对应的比较目的图像的检索步骤的程序码。
全文摘要
本发明提供图像处理装置及其控制方法、程序。其中电子地读取打印物,输入该打印物的电子数据作为比较源图像。提取包含在比较源图像中包含的页图像的处理对象区域的特征量。用提取的特征量,从存储媒体检索与上述比较源图像对应的比较目的图像。而且,对作为检索结果的图象进行处理。
文档编号H04N1/32GK1550971SQ20041004533
公开日2004年12月1日 申请日期2004年5月20日 优先权日2003年5月20日
发明者东条洋 申请人:佳能株式会社