多对象影像辨识方法

文档序号：7750353阅读：278来源：国知局

专利名称：多对象影像辨识方法
技术领域：
本发明涉及一种影像识别方法，特别涉及一种可即时处理且不需记录全影像即可进行多对象影像辨识的方法。
背景技术：
目前的影像处理技术，对于在一影像中辨识任意数量的对象(Objects)，往往需要配合不同的影像辨识算法，而一般算法随着所述影像中欲辨识对象数量的增加，其算法的计算亦更趋复杂。例如必须使用复杂的区域增长(Region growing)算法，也因此必须事先将整张影像(全影像)在影像处理系统中的影像缓冲器(Image buffer)储存，待搜集到所有影像的信息后，才能进行复杂的识别程序以辨识出所述影像中的各对象。如此一来，辨识时不但占用影像缓冲器的存储器资源，亦十分耗费时间。

发明内容
因此，本发明的一目的在于提供一种不需记录全影像即可进行多对象影像辨识的方法，其可有效节省存储器资源。本发明另一目的在于提供一种极具有扩充性、不受影像中的对象数量限制且可即时地辨识出各对象的多对象影像辨识方法。本发明再一目的在于提供一种多对象影像辨识方法，其可在辨识对象的同时辨识是否有对象被合并或无效以决定是否释放无用数据空间，藉以进一步节省所占用的存储器资源。为达上述目的，本发明的多对象影像辨识方法用以辨识一影像中的多个对象，其中各对象由多个影像区段所组成。所述方法包括下列步骤依序撷取所述影像的每个像素；在撷取一像素时，判断所述像素是否为一未知对象的一影像区段的一影像区段起始点；自所述影像区段起始点逐点记录所述影像区段的信息；在记录所述影像区段的信息时，判断所述未知对象的一影像区段终点；根据所述影像区段起始点和所述影像区段终点分辨所述影像区段的所属对象；判断是否有对象结束；当有对象结束时，判断已结束对象是否无效；以及当所述已结束对象为无效时，释放无效对象的数据空间。本发明另提供一种多对象影像辨识方法用以辨识一影像中的多个对象，其中各对象由多个影像区段所组成。所述方法包括下列步骤依序撷取所述影像的每个像素；在撷取一像素时，判断所述像素是否为一未知对象的一影像区段的一影像区段起始点；自所述影像区段起始点逐点记录所述影像区段的信息；在记录所述影像区段的信息时，判断所述未知对象的一影像区段终点；根据所述影像区段起始点和所述影像区段终点分辨所述影像区段的所属对象；判断是否有对象被合并；以及当有对象被合并，释放被合并对象的数据空间。本发明另提供一种多对象影像辨识方法用以辨识一影像中的多个对象，其中各对象由多个影像区段所组成。所述方法包括下列步骤依序撷取所述影像的每个像素；在撷取一像素时，判断该像素是否为一未知对象的一影像区段的一影像区段起始点；自所述影像区段起始点逐点记录所述影像区段的信息；在记录所述影像区段的信息时，判断所述未知对象的一影像区段终点；利用所述影像区段与相邻行或相邻列中各对象影像区段的空间相关性分辨所述影像区段的所属对象；以及判断无效或被合并对象以否释放其数据空间。另一实施形式中，本发明的多对象影像辨识方法另包括下列步骤汇集所记录所述影像区段的信息至其所属对象，其中所述影像区段的信息(例如端点坐标及像素灰阶值)记录于一寄存器中。本发明的多对象影像辨识方法中，当一行或一列像素被撷取完时，在所述行或所述列中无相关影像区段的对象则被判断为结束；当已结束对象的尺寸或平均亮度未介于一预设范围内时则判断所述已结束对象无效；当所述影像区段同时属于多个对象时则判断有对象被合并。

图1显示了本发明实施例的影像处理系统的方块图。图2显示了用以说明本发明的多对象影像辨识方法的一个影像的示意图。图3显示了本发明实施例的多对象影像辨识方法的流程图。图4显示了本发明的多对象影像辨识方法中判断对象合并的示意图。图5显示了本发明的多对象影像辨识方法中判断对象结束的示意图。图6显示了本发明的多对象影像辨识方法中判断对象无效的示意图。主要元件符号说明1、4、5、6影像11圆形对象12三角形对象111 114、121 125影像区段101 109步骤3影像处理系统31影像感测器311像素32模拟数字转换器 33影像处理单元34 寄存器401、402、501、a、b 对象X0 X4 —行像素11 la、112a、121a、122a 影像区段起始点111b、112b、121b、122b 影像区段终点
具体实施例方式为了让本发明的上述和其他目的、特征和优点能更明显，下文将配合所附图示，作详细说明如下。如图1所示，本发明不需记录全影像即可进行多对象影像辨识的方法的实施例应用于影像处理系统3中。所述影像处理系统3具有影像感测器(Image sensor) 31, 模拟数字转换器(A/D Converter) 32、影像处理单元(Imag印rocessor) 33以及寄存器 (Register) 34。所述影像感测器31可由C⑶或CMOS元件制成，用以感应对象(图未示)的反射光、发射光或遮蔽光影以形成模拟影像信号。接着，模拟影像信号被传送至模拟数字转换器32转换为数字影像信号。所述影像处理单元33则负责大部分影像信号的计算处理。其它实施例中，所述模拟数字转换器32可包括于所述影像感测器31中。必须说明的是，本实施例的影像处理系统3可用于摄像录影等取像装置的辨识功能，或可以是通过一视频装置撷取影像并以安装在电脑的辨识软件执行所述影像的辨识功能的方式实现。另外，由于影像感测器31、模拟数字转换器32、影像处理单元33及其他相关元件的构造原理为已知技术，故不在赘述。本发明的主要概念是以影像处理单元33配合寄存器34执行影像中多个对象的辨识功能，因此以下将仅就相关于本发明原理的部分作介绍。此外，其他实施例中，所述寄存器34也可以包括于所述影像处理单元33或其他构件中，并不限于图1所揭示的内容。配合图1及图2所示，本发明不需记录全影像即可进行多对象影像辨识的方法是对于影像感测器31所撷取的一影像1 (如图2)所具有的任意数量的对象进行辨识。本实施例中，影像1中待辨识的对象是以一圆形对象11及一三角形对象12为例来说明进行辨识的步骤。必须说明的是，由于影像感测器31具有多个行列式感应像素(pixel)311，且所述多个像素311以逐行或逐列的方式感应各对象11、12，因此，此处将影像感测器31所感应到的一对象在每一行或每一列的部分影像称为一影像区段(Image Segment)。例如图 2所示的圆形对象11具有四行影像区段111 114，而三角形对象12具有五行影像区段121 125，以此类推。可以理解的是，影像区段定义为一行像素或一列像素可根据所述影像感测器31的运作而决定。后述说明中虽将影像区段以行来说明，但其仅为例示性，并非用以限定本发明。配合图1 图3所示，将本发明不需记录全影像即可进行多对象影像辨识的方法的各步骤及作用原理详述如下首先，所述影像感测器31撷取一影像1，所述影像处理单元 33自所述模拟数字转换器32依序撷取所述影像1的每个像素值(步骤101)。一种实施例中，所述影像处理单元33自第一行开始从左到右读取所述行中的每个像素值，以此类推不断读取每行的各像素值。在读取一像素的同时，判断所述像素是否为一未知对象的一影像区段的一影像区段起始点；若是，则将其坐标及灰阶值储存至寄存器34(步骤102)。接着，自所述影像区段起始点开始，逐点记录所述影像区段的信息(例如，灰阶值)并储存至寄存器34 (步骤103)。在记录所述影像区段的信息的同时，判断所述未知对象的一影像区段终点，并将其坐标及灰阶值储存至寄存器34(步骤104)；其中步骤102至104判断是否有对象影像信息的方式为判断是否有大于一系统预设阈值(threshold)的像素值出现；其中所述预设阈值的设定方式例如，可由使用者自行决定、可根据一参考影像来设定或根据连续像素灰阶值的变化量作为所述阈值，例如可根据所述影像感测器31所撷取前一张影像的平均亮度的一比例或一偏置(offset)作为所述预设阈值，但本发明的预设阈值并不限于此。接着，利用所述未知对象的影像区段的影像区段起始点及影像区段终点与相邻行或相邻列中各对象影像区段的空间相关性分辨所述影像区段的所属对象(步骤105)。本实施例中，当所述空间相关性符合下述公式1，则可判断所述未知对象影像区段属于对象i Seg_L ( Preline_0bji_R ；i
Seg_R > Preline_0bji_L。其中，假设读取至影像1中的第y行数据时，则Preline_0bji_R表示第y-Ι行出现的各所述对象i的影像区段的右方终点X坐标值；Preline_0bji_L表示第y-Ι行出现的各所述对象i的影像区段左方起始点X坐标值；Seg_L表示读取第y行出现的未知对象的影像区段左方起始点X坐标值；Seg_R表示读取第y行出现的未知对象的影像区段右方终点X坐标值。亦即，判断所述影像区段起始点是否位于相邻行或相邻列中一对象影像区段的终点前(例如左侧)且所述影像区段终点是否位于相邻行或相邻列中一对象影像区段的起始点后(例如右侧)。汇集所记录所述影像区段的信息至其所属的对象(步骤106)并储存至所述寄存器34。为了减少所述寄存器34的占用空间，接着判断是否有对象结束或被合并(步骤 107)。当有对象被合并时，则释放被合并对象所占用的数据空间(步骤108a)，其中一对象是否被合并为判断一未知对象的影像区段是否同时属于多个对象。当有对象结束时，判断所述对象是否为无效(步骤108b)，其中一对象是否结束是在一列或一行像素撷取完毕时，在所述行或所述列中无相关影像区段的对象(即一对象未被汇集任何未知对象的影像区段)则被判断为结束。当所述对象为无效，则释放所述无效对象所占用的数据空间(步骤 109)，其中判断对象是否无效的方式为判断对象的尺寸、整体亮度或平均亮度是否介于一预设范围内。未被释放的对象信息则持续储存于所述寄存器34中，接着，再以相同步骤进行此行中下一影像区段(如果存在)的判断；当撷取完所述影像1所有像素值后，亦同时完成所述影像1的多对象辨识。配合图1 图3所示，接着举例说明本发明的多对象影像辨识方法。假设在影像 1中自第1行开始逐行读取各像素，由于坐标(1，3)处有大于系统预设阈值的像素值出现，因此便记录对象11的起始点Illa的坐标值及灰阶值于寄存器34中，接着逐点记录影像区段111的信息并储存至寄存器34中，直到遇到所述影像区段111的终点111b，再记录所述终点Illb的坐标值及灰阶值于寄存器34中。然而，由于第一行中接着出现有另一影像区段121的信息，亦需再储存所述影像区段121的起始点121a及终点121b的坐标值与灰阶值及逐点记录的信息于寄存器34中。因此，此时所述寄存器34则累计有两个对象的影像区段111及121。接着，所述影像处理元33依序接收所述影像1的第二行的影像信息，并记录该行出现的各未知对象影像区段的左方起始点坐标值112a、122a及其灰阶值，以及各未知对象影像区段的右方终点坐标值112b、122b及其灰阶值，并在读取至每一未知对象影像区段的右方终点时随即以公式1作为判断标准以区分是否属于各对象11、12，以由左而右、由上而下的顺序为原则，逐行记录并运算至最后一行。因此，当撷取完所述影像1所有像素311的值时，即可即时地完全辨识出所述影像中的各所述对象11、12。归纳上述，本发明不需记录全影像即可进行多对象影像辨识的方法具有下述优占.
^ \\\ ·1.本发明的影像辨识方法以寄存的方式即时进行影像辨识，无需记录整张影像，因此可节省存储器资源。2.本发明的影像辨识方法由于算法单纯，不受影像中的对象数量限制，因此任何数量的对象均可被辨识出来，不但极具有扩充性，亦可即时地辨识出各个对象。另外，为了进一步减少在对象辨识过程中寄存器34的使用量，当寄存器34所储存影像区段所属对象遇到被合并或已结束对象的信息符合无效的条件时，即可将寄存器34 中储存所述对象的空间释放，藉此降低所述寄存器34的使用量。请参照图4所示，其显示了本发明的多对象影像辨识方法中判断对象合并的示意图。当所述影像处理单元33处理完第Xtl行像素时，所述寄存器34中储存有两个对象401 及402 ；然而当所述影像处理单元33处理至第X1行像素时，辨认出所述对象401及402属于同一对象(由于第X1行的影像区段同时属于对象401及402)，因而可将所述对象401及 402合并并释放出所述对象401或402所占用的数据空间(步骤108a)。请参照图5所示，其显示了本发明的多对象影像辨识方法中判断对象结束的示意图。当所述影像处理单元33处理至第X2行像素时，由于在X2行像素中无任何影像区段属于对象501，因此辨认出该对象501已经结束，接着判断该对象501是否为无效(步骤108b)。请参照图6所示，其显示了本发明的多对象影像辨识方法中判断对象无效的示意图。本发明中判断对象无效的方式为例如判断对象的尺寸、对象整体亮度或平均亮度是否介于一预设范围。当对象尺寸过小、对象整体亮度或平均亮度过低时，其可能为所述影像1 中的噪声，例如图6中当所述影像处理单元33处理至第X3行像素时对象a已经结束且尺寸过小而被视为无效对象，因而可释放所述对象a所占用的空间。当对象尺寸过大、对象整体亮度或平均亮度过高时，其可能为所述影像处理系统3所处环境中其他光源或对象的影像，例如图6中当所述影像处理单元33处理至第X4行像素时对象b已经结束且尺寸过大而被视为无效对象，因而可释放所述对象b所占用的空间，其中尺寸的最大值可根据所述影像处理系统3所应辨识的对象尺寸预先设定。本发明中，所述寄存器34可将原先储存的无效数据空间释放，并提供作为后续步骤使用。因此除可降低寄存器34的使用量之外，由于所述寄存器34的空间为有限而固定，因此藉由空间的释放可用以辨识出更多有效的对象。上述实施例仅用来例举本发明的实施形式，以及阐释本发明的技术特征，并非用来限制本发明的保护范畴。任何本领域技术人员可轻易完成的改变或均等性的安排均属于本发明所主张的范围，本发明的权利保护范围应以权利要求书所界定的范围为准。
权利要求
1.一种多对象影像辨识方法，用以辨识一影像中的多个对象，各对象由多个影像区段所组成，所述方法包括下列步骤依序撷取所述影像的每个像素；在撷取一像素时，判断该像素是否为一未知对象的一影像区段的一影像区段起始点；自所述影像区段起始点逐点记录所述影像区段的信息；在记录所述影像区段的信息时，判断所述未知对象的一影像区段终点；根据所述影像区段起始点和所述影像区段终点分辨所述影像区段的所属对象；判断是否有对象结束；当有对象结束时，判断已结束对象是否无效；以及当所述已结束对象为无效时，释放无效对象的数据空间。
2.根据权利要求1所述的多对象影像辨识方法，所述方法还包括下列步骤判断是否有对象被合并。
3.根据权利要求2所述的多对象影像辨识方法，所述方法还包括当有对象被合并时，释放被合并对象的数据空间。
4.根据权利要求1所述的多对象影像辨识方法，其中，判断已结束对象的尺寸、整体亮度或平均亮度是否介于一预设范围内以判断所述已结束对象是否无效。
5.根据权利要求1所述的多对象影像辨识方法，所述方法还包括汇集所记录的所述影像区段的信息至该影像区段的所属对象。
6.根据权利要求1所述的多对象影像辨识方法，其中，依序撷取所述影像的每一行或每一列的每个像素。
7.根据权利要求6所述的多对象影像辨识方法，其中，当一行或一列像素被撷取完时，在所述行或所述列中无相关影像区段的对象则被判断为结束。
8.一种多对象影像辨识方法，用以辨识一影像中的多个对象，各对象由多个影像区段所组成，所述方法包括下列步骤依序撷取所述影像的每个像素；在撷取一像素时，判断所述像素是否为一未知对象的一影像区段的一影像区段起始点。自所述影像区段起始点逐点记录所述影像区段的信息；在记录所述影像区段的信息时，判断所述未知对象的一影像区段终点；根据所述影像区段起始点和所述影像区段终点分辨所述影像区段的所属对象；判断是否有对象被合并；以及当有对象被合并时，释放被合并对象的数据空间。
9.根据权利要求8所述的多对象影像辨识方法，其中，判断所述影像区段是否同时属于多个对象以判断是否有对象被合并。
10.根据权利要求8所述的多对象影像辨识方法，其中，依序撷取所述影像的每一行或每一列的每个像素。
11.根据权利要求8所述的多对象影像辨识方法，所述方法还包括下列步骤汇集所记录的所述影像区段的信息至该影像区段的所属对象。
12.—种多对象影像辨识方法，用以辨识一影像中的多个对象，各对象由多个影像区段所组成，所述方法包括下列步骤依序撷取所述影像的每个像素；在撷取一像素时，判断该像素是否为一未知对象的一影像区段的一影像区段起始点；自所述影像区段起始点逐点记录所述影像区段的信息；在记录所述影像区段的信息时，判断所述未知对象的一影像区段终点；利用所述影像区段与相邻行或相邻列中各对象影像区段的空间相关性，分辨所述影像区段的所属对象；以及判断无效或被合并对象以释放其数据空间。
13.根据权利要求12所述的多对象影像辨识方法，其中，根据对象的尺寸、整体亮度或平均亮度判断所述对象是否无效。
14.根据权利要求12所述的多对象影像辨识方法，其中，判断所述影像区段是否同时属于多个对象以判断是否有对象被合并。
15.根据权利要求12所述的多对象影像辨识方法，其中，所述空间相关性为判断所述影像区段起始点是否位于相邻行或相邻列中一对象的影像区段终点前且所述影像区段终点是否位于相邻行或相邻列中所述对象的影像区段起始点后。
全文摘要
一种多对象影像辨识方法，用以辨识一影像中的多个对象，其中各对象由多个影像区段组成。所述方法包括下述步骤依序撷取所述影像的每个像素；判断一未知对象的一影像区段起始点；自所述影像区段起始点逐点记录所述影像区段的信息；判断所述未知对象的一影像区段终点；根据所述影像区段起始点和所述影像区段终点分辨所述影像区段所属的对象；以及判断无效或被合并对象以释放其数据空间。
文档编号H04N5/14GK102131050SQ201010188508
公开日2011年7月20日申请日期2010年5月31日优先权日2010年1月19日
发明者简士期申请人:原相科技股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：简士期
技术所有人：原相科技股份有限公司
我是此专利的发明人

上一篇：无线通信收发机的制作方法
上一篇：一种跨网元的媒体发夹连接方法和系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。