专利名称:多对象影像辨识方法
技术领域:
本发明涉及一种影像识别方法,特别涉及一种可即时处理且不需记录全影像即可 进行多对象影像辨识的方法。
背景技术:
目前的影像处理技术,对于在一影像中辨识任意数量的对象(Objects),往往需要 配合不同的影像辨识算法,而一般算法随着所述影像中欲辨识对象数量的增加,其算法的 计算亦更趋复杂。例如必须使用复杂的区域增长(Region growing)算法,也因此必须事先 将整张影像(全影像)在影像处理系统中的影像缓冲器(Image buffer)储存,待搜集到所 有影像的信息后,才能进行复杂的识别程序以辨识出所述影像中的各对象。如此一来,辨识 时不但占用影像缓冲器的存储器资源,亦十分耗费时间。
发明内容
因此,本发明的一目的在于提供一种不需记录全影像即可进行多对象影像辨识的 方法,其可有效节省存储器资源。本发明另一目的在于提供一种极具有扩充性、不受影像中的对象数量限制且可即 时地辨识出各对象的多对象影像辨识方法。本发明再一目的在于提供一种多对象影像辨识方法,其可在辨识对象的同时辨识 是否有对象被合并或无效以决定是否释放无用数据空间,藉以进一步节省所占用的存储器 资源。为达上述目的,本发明的多对象影像辨识方法用以辨识一影像中的多个对象,其 中各对象由多个影像区段所组成。所述方法包括下列步骤依序撷取所述影像的每个像素; 在撷取一像素时,判断所述像素是否为一未知对象的一影像区段的一影像区段起始点;自 所述影像区段起始点逐点记录所述影像区段的信息;在记录所述影像区段的信息时,判断 所述未知对象的一影像区段终点;根据所述影像区段起始点和所述影像区段终点分辨所述 影像区段的所属对象;判断是否有对象结束;当有对象结束时,判断已结束对象是否无效; 以及当所述已结束对象为无效时,释放无效对象的数据空间。本发明另提供一种多对象影像辨识方法用以辨识一影像中的多个对象,其中各对 象由多个影像区段所组成。所述方法包括下列步骤依序撷取所述影像的每个像素;在撷 取一像素时,判断所述像素是否为一未知对象的一影像区段的一影像区段起始点;自所述 影像区段起始点逐点记录所述影像区段的信息;在记录所述影像区段的信息时,判断所述 未知对象的一影像区段终点;根据所述影像区段起始点和所述影像区段终点分辨所述影像 区段的所属对象;判断是否有对象被合并;以及当有对象被合并,释放被合并对象的数据 空间。本发明另提供一种多对象影像辨识方法用以辨识一影像中的多个对象,其中各对 象由多个影像区段所组成。所述方法包括下列步骤依序撷取所述影像的每个像素;在撷取一像素时,判断该像素是否为一未知对象的一影像区段的一影像区段起始点;自所述影 像区段起始点逐点记录所述影像区段的信息;在记录所述影像区段的信息时,判断所述未 知对象的一影像区段终点;利用所述影像区段与相邻行或相邻列中各对象影像区段的空间 相关性分辨所述影像区段的所属对象;以及判断无效或被合并对象以否释放其数据空间。另一实施形式中,本发明的多对象影像辨识方法另包括下列步骤汇集所记录所 述影像区段的信息至其所属对象,其中所述影像区段的信息(例如端点坐标及像素灰阶 值)记 录于一寄存器中。本发明的多对象影像辨识方法中,当一行或一列像素被撷取完时,在所述行或所 述列中无相关影像区段的对象则被判断为结束;当已结束对象的尺寸或平均亮度未介于一 预设范围内时则判断所述已结束对象无效;当所述影像区段同时属于多个对象时则判断有 对象被合并。
图1显示了本发明实施例的影像处理系统的方块图。图2显示了用以说明本发明的多对象影像辨识方法的一个影像的示意图。图3显示了本发明实施例的多对象影像辨识方法的流程图。图4显示了本发明的多对象影像辨识方法中判断对象合并的示意图。图5显示了本发明的多对象影像辨识方法中判断对象结束的示意图。图6显示了本发明的多对象影像辨识方法中判断对象无效的示意图。主要元件符号说明1、4、5、6影像11圆形对象12三角形对象111 114、121 125影像区段101 109步骤3影像处理系统31影像感测器311像素32模拟数字转换器 33影像处理单元34 寄存器401、402、501、a、b 对象X0 X4 —行像素11 la、112a、121a、122a 影像区段起始点111b、112b、121b、122b 影像区段终点
具体实施例方式为了让本发明的上述和其他目的、特征和优点能更明显,下文将配合所附图示,作 详细说明如下。如图1所示,本发明不需记录全影像即可进行多对象影像辨识的方法的实施例 应用于影像处理系统3中。所述影像处理系统3具有影像感测器(Image sensor) 31, 模拟数字转换器(A/D Converter) 32、影像处理单元(Imag印rocessor) 33以及寄存器 (Register) 34。所述影像感测器31可由C⑶或CMOS元件制成,用以感应对象(图未示)的 反射光、发射光或遮蔽光影以形成模拟影像信号。接着,模拟影像信号被传送至模拟数字转 换器32转换为数字影像信号。所述影像处理单元33则负责大部分影像信号的计算处理。其它实施例中,所述模拟数字转换器32可包括于所述影像感测器31中。必须说明的是,本实施例的影像处理系统3可用于摄像录影等取像装置的辨识功 能,或可以是通过一视频装置撷取影像并以安装在电脑的辨识软件执行所述影像的辨识功 能的方式实现。另外,由于影像感测器31、模拟数字转换器32、影像处理单元33及其他相 关元件的构造原理为已知技术,故不在赘述。本发明的主要概念是以影像处理单元33配合 寄存器34执行影像中多个对象的辨识功能,因此以下将仅就相关于本发明原理的部分作 介绍。此外,其他实施例中,所述寄存器34也可以包括于所述影像处理单元33或其他构件 中,并不限于图1所揭示的内容。配合图1及图2所示,本发明不需记录全影像即可进行多对象影像辨识的方法是 对于影像感测器31所撷取的一影像1 (如图2)所具有的任意数量的对象进行辨识。本实 施例中,影像1中待辨识的对象是以一圆形对象11及一三角形对象12为例来说明进行辨 识的步骤。必须说明的是,由于影像感测器31具有多个行列式感应像素(pixel)311,且所述 多个像素311以逐行或逐列的方式感应各对象11、12,因此,此处将影像感测器31所感应到 的一对象在每一行或每一列的部分影像称为一影像区段(Image Segment)。例如图 2所示 的圆形对象11具有四行影像区段111 114,而三角形对象12具有五行影像区段121 125,以此类推。可以理解的是,影像区段定义为一行像素或一列像素可根据所述影像感测 器31的运作而决定。后述说明中虽将影像区段以行来说明,但其仅为例示性,并非用以限 定本发明。配合图1 图3所示,将本发明不需记录全影像即可进行多对象影像辨识的方法 的各步骤及作用原理详述如下首先,所述影像感测器31撷取一影像1,所述影像处理单元 33自所述模拟数字转换器32依序撷取所述影像1的每个像素值(步骤101)。一种实施例 中,所述影像处理单元33自第一行开始从左到右读取所述行中的每个像素值,以此类推不 断读取每行的各像素值。在读取一像素的同时,判断所述像素是否为一未知对象的一影像区段的一影像区 段起始点;若是,则将其坐标及灰阶值储存至寄存器34(步骤102)。接着,自所述影像区段起始点开始,逐点记录所述影像区段的信息(例如,灰阶 值)并储存至寄存器34 (步骤103)。在记录所述影像区段的信息的同时,判断所述未知对象的一影像区段终点,并将 其坐标及灰阶值储存至寄存器34(步骤104);其中步骤102至104判断是否有对象影像信 息的方式为判断是否有大于一系统预设阈值(threshold)的像素值出现;其中所述预设阈 值的设定方式例如,可由使用者自行决定、可根据一参考影像来设定或根据连续像素灰阶 值的变化量作为所述阈值,例如可根据所述影像感测器31所撷取前一张影像的平均亮度 的一比例或一偏置(offset)作为所述预设阈值,但本发明的预设阈值并不限于此。接着,利用所述未知对象的影像区段的影像区段起始点及影像区段终点与相邻行 或相邻列中各对象影像区段的空间相关性分辨所述影像区段的所属对象(步骤105)。本实施例中,当所述空间相关性符合下述公式1,则可判断所述未知对象影像区段 属于对象i Seg_L ( Preline_0bji_R ;i
Seg_R > Preline_0bji_L。其中,假设读取至影像1中的第y行数据时,则Preline_0bji_R表示第y-Ι行出 现的各所述对象i的影像区段的右方终点X坐标值;Preline_0bji_L表示第y-Ι行出现的 各所述对象i的影像区段左方起始点X坐标值;Seg_L表示读取第y行出现的未知对象的 影像区段左方起始点X坐标值;Seg_R表示读取第y行出现的未知对象的影像区段右方终 点X坐标值。亦即,判断所述影像区段起始点是否位于相邻行或相邻列中一对象影像区段 的终点前(例如左侧)且所述影像区段终点是否位于相邻行或相邻列中一对象影像区段的 起始点后(例如右侧)。汇集所记录所述影像区段的信息至其所属的对象(步骤106)并储存至所述寄存 器34。为了减少所述寄存器34的占用空间,接着判断是否有对象结束或被合并(步骤 107)。当有对象被合并时,则释放被合并对象所占用的数据空间(步骤108a),其中一对象 是否被合并为判断一未知对象的影像区段是否同时属于多个对象。当有对象结束时,判断 所述对象是否为无效(步骤108b),其中一对象是否结束是在一列或一行像素撷取完毕时, 在所述行或所述列中无相关影像区段的对象(即一对象未被汇集任何未知对象的影像区 段)则被判断为结束。当所述对象为无效,则释放所述无效对象所占用的数据空间(步骤 109),其中判断对象是否无效的方式为判断对象的尺寸、整体亮度或平均亮度是否介于一 预设范围内。未被释放的对象信息则持续储存于所述寄存器34中,接着,再以相同步骤进 行此行中下一影像区段(如果存在)的判断;当撷取完所述影像1所有像素值后,亦同时完 成所述影像1的多对象辨识。配 合图1 图3所示,接着举例说明本发明的多对象影像辨识方法。假设在影像 1中自第1行开始逐行读取各像素,由于坐标(1,3)处有大于系统预设阈值的像素值出现, 因此便记录对象11的起始点Illa的坐标值及灰阶值于寄存器34中,接着逐点记录影像区 段111的信息并储存至寄存器34中,直到遇到所述影像区段111的终点111b,再记录所述 终点Illb的坐标值及灰阶值于寄存器34中。然而,由于第一行中接着出现有另一影像区 段121的信息,亦需再储存所述影像区段121的起始点121a及终点121b的坐标值与灰阶 值及逐点记录的信息于寄存器34中。因此,此时所述寄存器34则累计有两个对象的影像 区段111及121。接着,所述影像处理元33依序接收所述影像1的第二行的影像信息,并记录该行 出现的各未知对象影像区段的左方起始点坐标值112a、122a及其灰阶值,以及各未知对象 影像区段的右方终点坐标值112b、122b及其灰阶值,并在读取至每一未知对象影像区段的 右方终点时随即以公式1作为判断标准以区分是否属于各对象11、12,以由左而右、由上而 下的顺序为原则,逐行记录并运算至最后一行。因此,当撷取完所述影像1所有像素311的 值时,即可即时地完全辨识出所述影像中的各所述对象11、12。归纳上述,本发明不需记录全影像即可进行多对象影像辨识的方法具有下述优占.
^ \\\ ·1.本发明的影像辨识方法以寄存的方式即时进行影像辨识,无需记录整张影像, 因此可节省存储器资源。2.本发明的影像辨识方法由于算法单纯,不受影像中的对象数量限制,因此任何数量的对象均可被辨识出来,不但极具有扩充性,亦可即时地辨识出各个对象。另外,为了 进一步减少在对象辨识过程中寄存器34的使用量,当寄存器34所储 存影像区段所属对象遇到被合并或已结束对象的信息符合无效的条件时,即可将寄存器34 中储存所述对象的空间释放,藉此降低所述寄存器34的使用量。请参照图4所示,其显示了本发明的多对象影像辨识方法中判断对象合并的示意 图。当所述影像处理单元33处理完第Xtl行像素时,所述寄存器34中储存有两个对象401 及402 ;然而当所述影像处理单元33处理至第X1行像素时,辨认出所述对象401及402属 于同一对象(由于第X1行的影像区段同时属于对象401及402),因而可将所述对象401及 402合并并释放出所述对象401或402所占用的数据空间(步骤108a)。请参照图5所示,其显示了本发明的多对象影像辨识方法中判断对象结束的示意 图。当所述影像处理单元33处理至第X2行像素时,由于在X2行像素中无任何影像区段属于 对象501,因此辨认出该对象501已经结束,接着判断该对象501是否为无效(步骤108b)。请参照图6所示,其显示了本发明的多对象影像辨识方法中判断对象无效的示意 图。本发明中判断对象无效的方式为例如判断对象的尺寸、对象整体亮度或平均亮度是否 介于一预设范围。当对象尺寸过小、对象整体亮度或平均亮度过低时,其可能为所述影像1 中的噪声,例如图6中当所述影像处理单元33处理至第X3行像素时对象a已经结束且尺 寸过小而被视为无效对象,因而可释放所述对象a所占用的空间。当对象尺寸过大、对象整 体亮度或平均亮度过高时,其可能为所述影像处理系统3所处环境中其他光源或对象的影 像,例如图6中当所述影像处理单元33处理至第X4行像素时对象b已经结束且尺寸过大 而被视为无效对象,因而可释放所述对象b所占用的空间,其中尺寸的最大值可根据所述 影像处理系统3所应辨识的对象尺寸预先设定。本发明中,所述寄存器34可将原先储存的无效数据空间释放,并提供作为后续步 骤使用。因此除可降低寄存器34的使用量之外,由于所述寄存器34的空间为有限而固定, 因此藉由空间的释放可用以辨识出更多有效的对象。上述实施例仅用来例举本发明的实施形式,以及阐释本发明的技术特征,并非用 来限制本发明的保护范畴。任何本领域技术人员可轻易完成的改变或均等性的安排均属于 本发明所主张的范围,本发明的权利保护范围应以权利要求书所界定的范围为准。
权利要求
1.一种多对象影像辨识方法,用以辨识一影像中的多个对象,各对象由多个影像区段 所组成,所述方法包括下列步骤依序撷取所述影像的每个像素;在撷取一像素时,判断该像素是否为一未知对象的一影像区段的一影像区段起始点; 自所述影像区段起始点逐点记录所述影像区段的信息; 在记录所述影像区段的信息时,判断所述未知对象的一影像区段终点; 根据所述影像区段起始点和所述影像区段终点分辨所述影像区段的所属对象; 判断是否有对象结束;当有对象结束时,判断已结束对象是否无效;以及 当所述已结束对象为无效时,释放无效对象的数据空间。
2.根据权利要求1所述的多对象影像辨识方法,所述方法还包括下列步骤判断是否 有对象被合并。
3.根据权利要求2所述的多对象影像辨识方法,所述方法还包括当有对象被合并时, 释放被合并对象的数据空间。
4.根据权利要求1所述的多对象影像辨识方法,其中,判断已结束对象的尺寸、整体亮 度或平均亮度是否介于一预设范围内以判断所述已结束对象是否无效。
5.根据权利要求1所述的多对象影像辨识方法,所述方法还包括汇集所记录的所述 影像区段的信息至该影像区段的所属对象。
6.根据权利要求1所述的多对象影像辨识方法,其中,依序撷取所述影像的每一行或 每一列的每个像素。
7.根据权利要求6所述的多对象影像辨识方法,其中,当一行或一列像素被撷取完时, 在所述行或所述列中无相关影像区段的对象则被判断为结束。
8.一种多对象影像辨识方法,用以辨识一影像中的多个对象,各对象由多个影像区段 所组成,所述方法包括下列步骤依序撷取所述影像的每个像素;在撷取一像素时,判断所述像素是否为一未知对象的一影像区段的一影像区段起始点。自所述影像区段起始点逐点记录所述影像区段的信息;在记录所述影像区段的信息时,判断所述未知对象的一影像区段终点;根据所述影像区段起始点和所述影像区段终点分辨所述影像区段的所属对象;判断是否有对象被合并;以及当有对象被合并时,释放被合并对象的数据空间。
9.根据权利要求8所述的多对象影像辨识方法,其中,判断所述影像区段是否同时属 于多个对象以判断是否有对象被合并。
10.根据权利要求8所述的多对象影像辨识方法,其中,依序撷取所述影像的每一行或 每一列的每个像素。
11.根据权利要求8所述的多对象影像辨识方法,所述方法还包括下列步骤汇集所记 录的所述影像区段的信息至该影像区段的所属对象。
12.—种多对象影像辨识方法,用以辨识一影像中的多个对象,各对象由多个影像区段所组成,所述方法包括下列步骤 依序撷取所述影像的每个像素;在撷取一像素时,判断该像素是否为一未知对象的一影像区段的一影像区段起始点; 自所述影像区段起始点逐点记录所述影像区段的信息; 在记录所述影像区段的信息时,判断所述未知对象的一影像区段终点; 利用所述影像区段与相邻行或相邻列中各对象影像区段的空间相关性,分辨所述影像 区段的所属对象;以及判断无效或被合并对象以释放其数据空间。
13.根据权利要求12所述的多对象影像辨识方法,其中,根据对象的尺寸、整体亮度或 平均亮度判断所述对象是否无效。
14.根据权利要求12所述的多对象影像辨识方法,其中,判断所述影像区段是否同时 属于多个对象以判断是否有对象被合并。
15.根据权利要求12所述的多对象影像辨识方法,其中,所述空间相关性为判断所述 影像区段起始点是否位于相邻行或相邻列中一对象的影像区段终点前且所述影像区段终 点是否位于相邻行或相邻列中所述对象的影像区段起始点后。
全文摘要
一种多对象影像辨识方法,用以辨识一影像中的多个对象,其中各对象由多个影像区段组成。所述方法包括下述步骤依序撷取所述影像的每个像素;判断一未知对象的一影像区段起始点;自所述影像区段起始点逐点记录所述影像区段的信息;判断所述未知对象的一影像区段终点;根据所述影像区段起始点和所述影像区段终点分辨所述影像区段所属的对象;以及判断无效或被合并对象以释放其数据空间。
文档编号H04N5/14GK102131050SQ201010188508
公开日2011年7月20日 申请日期2010年5月31日 优先权日2010年1月19日
发明者简士期 申请人:原相科技股份有限公司