目标检索装置、目标检索方法以及计算机可读取记录介质的制作方法
【专利摘要】本发明提供一种目标检索装置,具备:摄像单元,取得光轴相对于被摄体移动后的多个图像数据;距离计算单元,基于上述多个图像数据,计算出从上述摄像单元到上述被摄体为止的距离;剪切单元,从上述图像数据中剪切上述被摄体中的主要目标;实际尺寸计算单元,根据上述剪切出的主要目标在上述图像数据上的大小、从上述摄像单元到被摄体为止的距离、和上述摄像单元的焦点距离,计算出上述主要目标的实际尺寸;和检索单元,通过附加上述实际尺寸的信息并访问主要目标的数据库,从而检索上述主要目标的种类。
【专利说明】目标检索装置、目标检索方法以及计算机可读取记录介质
[0001]关联申请的参照(CROSS-REFERENCETO RELATED APPLICATIONS)
[0002]关于本申请,主张以2012年7月24日申请的日本国专利申请特愿2012-163860号为基础的优先权,将该基础申请的内容全部援弓I到本申请中。
【技术领域】
[0003]本发明涉及从摄像到的图像数据中剪切主要目标的区域并检索该主要目标的种类的目标检索装置、目标检索方法以及计算机可读取的记录介质。
【背景技术】
[0004]有时想知道在山野或路旁看到的花的名称。因此,提出了以下技术:根据通过数码相机等得到的花的数字图像,采用聚类法来提取作为对象物的花的图像,求得将根据该提取出的花的图像得到的信息作为特征量的一个或多个特征量,采用统计方法对该求得的特征量和预先登记于数据库中的各种花的特征量进行分析并判断花的种类(例如参照日本特开2002-203242号公报)。
[0005]此外,公知采用Graph Cuts法(图像剪切法)将包括花等主要目标在内的图像分割为主要目标区域和背景区域并剪切主要目标的区域的现有技术(参照例如Y.Boykov andG.Funka-Lea Interactive Graph Cuts for Optimal Boundary&Region Segmentationof Objects in N-D Images,,,Proceedings of “Internation Conference on ComputerVision”, Vancouver, Canada, vol.1, p.105-112, July2001、以及日本特开 2011-35636 号公报)。在进行剪切的情况下,有可能根据主要目标和背景的关系而存在其界限不明确的部分,需要进行最佳的区域分割。在此,在该现有技术中,将区域分割看作能量的最小化问题,提出其最小化方案。在该现有技术中,生成图像(graph)以适合区域分割,通过求得该图形的最小切割来进行能量函数的最小化。该最小切割通过采用最大流算法(maximum flowalgorithm)来实现有效的区域分割计算。
[0006]但是,在确定大小成为识别点的花等主要目标的情况下,仅以图像的特征进行检索时,当特征数据相同时,即使正确地剪切出主要目标区域,也具有不能自动识别并确定差异的问题。
【发明内容】
[0007]本发明的目的在于提高主要目标的检索精度。
[0008]本发明的目标检索装置,具备:摄像单元,取得光轴相对于被摄体移动后的多个图像数据;距离计算单元,基于上述多个图像数据,计算出从上述摄像单元到上述被摄体为止的距离;剪切单元,从上述图像数据中剪切上述被摄体中的主要目标;实际尺寸计算单元,根据上述剪切出的主要目标在上述图像数据上的大小、从上述摄像单元到被摄体为止的距离、和上述摄像单元的焦点距离,计算出上述主要目标的实际尺寸;和检索单元,通过附加上述实际尺寸的信息并访问主要目标的数据库,从而检索上述主要目标的种类。[0009]根据本发明,基于来自取得光轴相对于被摄体移动后的多个图像数据的摄像单元的信息,计算出主要目标的实际尺寸并附加该信息,由此能够提高主要目标的检索精度。
【专利附图】
【附图说明】
[0010]图1为表示本发明的一实施方式涉及的目标检索装置的硬件结构例的框图。
[0011]图2为表示图1的数码相机101所实现的目标检索装置的功能结构的功能框图。
[0012]图3为表示本实施方式的目标检索处理的整体动作的流程图。
[0013]图4为本实施方式的景深计算处理的说明图。
[0014]图5是本实施方式的实际尺寸计算处理的说明图。
[0015]图6是表示本实施方式的图形切割处理的整体动作的流程图。
[0016]图7是带有权重的有向图(directed graph)的说明图。
[0017]图8是直方图Θ的说明图。
[0018]图9是huv (Xu, Xv)的特性图。
[0019]图10是示意性表示具有t-link和n-link的图形、与区域标号矢量X以及图形切割之间的关系的图。
[0020]图11是表示区域分割处理的流程图。
【具体实施方式】
[0021]以下,参照附图对用于实施本发明的方式进行详细的说明。
[0022]图1为表示实现本发明的一实施方式涉及的目标检索装置的数码相机101的硬件结构例的框图。
[0023]数码相机101具备摄影镜头(image pickup lens) 102、校正透镜103、镜头驱动模块104、光圈兼快门105、CCD106、垂直驱动器107、TG(Timing Generator:定时产生电路)108、单元电路 109、DMA 控制器(以下称作 DMA) 110、CPU (Central Processing Unit:中央运算处理装置)111、按键输入部112、存储器113、DRAM(Dynamic Random AccessMemory) 114、通信部 115、模糊检测部 117、DMA (Direct Memory Access) 118、图像生成部119、DMA120、DMA121、显示部 122、DMA123、压缩解压部 124、DMA125、闪存 126、总线 127。
[0024]在数码相机101的外部或者内部具备花数据库116。
[0025]在数码相机101的外部设置花数据库116的情况下,例如花数据库116被安装在通过互联网连接的服务器计算机上。而且,数码相机101的CPUlll采用通信部115并经由互联网,访问服务器计算机上的花数据库116。
[0026]在数码相机101的内部设置花数据库116的情况下,例如在DRAM114上安装花数据库116。而且,CPUlll访问DRAM114上的花数据库116。
[0027]摄影镜头102包括由多个透镜组构成的聚焦透镜、变焦透镜。
[0028]另外,镜头驱动模块104包括未图示的驱动电路,驱动电路按照来自CPUlll的控制信号使聚焦透镜、变焦透镜分别在光轴方向上移动。
[0029]校正透镜103为用于对手抖动引起的像的模糊进行校正的透镜,校正透镜103与镜头驱动t吴块104连接。
[0030]镜头驱动模块104使校正透镜103在Yaw (偏转)方向以及Pitch (倾斜)方向上移动,从而校正手抖动。该镜头驱动模块104由使校正透镜103在偏转方向以及倾斜方向上移动的电机、以及驱动该电机的电机驱动器构成。
[0031]光圈兼快门105包括未图示的驱动电路,驱动电路使光圈兼快门105按照从CPUlll发送来的控制信号进行动作。该光圈兼快门105起到光圈、快门的作用。
[0032]所谓光圈是指对入射到CCD106的光的量进行控制的构造,所谓快门是指对光击中CCD106的时间进行控制的构造,光击中CCD106的时间(曝光时间)随着快门速度而变化。
[0033]曝光量由该光圈值(光圈的开口程度)和快门速度决定。
[0034]由垂直驱动器7对(XD106进行扫描驱动,按每个固定周期对被摄体像的RGB (红绿蓝)值的各颜色的光的强度进行光电变换并作为摄像信号而输出到单元电路109。经由TG108,由CPUlll控制该垂直驱动器107、单元电路109的动作定时。
[0035]单元电路109与TG108连接,由对从(XD106输出的摄像信号进行相关二重采样后保持的⑶S(Correlated Double Sampling)电路、进行该采用后的摄像信号的自动增益调整的AGC(Automatic Gain Control)电路、将该自动增益调整后的模拟信号变换为数字信号的A/D (模拟/数字)变换器构成,通过CCD106得到的摄像信号经过单元电路109后,通过DMAllO以拜耳(bayer)数据的状态存储到缓冲存储器(DRAM114)中。
[0036]CPUlll 为具有进行 AE (Automatic Exposure)处理、AF (Automatic Focus)处理等的功能,并且是控制数码相机101的各部分的单片机。
[0037]尤其是,在本实施方式中,CPUlll对由102?110的部分构成的摄像单元,取得光轴相对于被摄体移动后的多个图像数据,并基于这些图像数据执行以下的各处理。首先,CPUlll执行计算出到被摄体为止的距离的距离计算处理。接下来,CPUl 11执行剪切被摄体中的主要目标区域的图形切割(剪切)处理。接下来,CPUl 11执行根据从摄影镜头102到被摄体为止的距离和摄影镜头102的焦点距离计算出主要目标的实际尺寸的实际尺寸计算处理。而且,CPUlll通过附加实际尺寸的信息来访问主要目标的数据库116,从而执行对主要目标的种类进行检索的检索处理。
[0038]按键输入部112包括能进行半按操作和全按操作的快门按钮、模式切换按键、十字按键、SET按键等多个操作按键,并将与用户的按键操作相对应的操作信号输出到CPUlll。
[0039]存储器113中记录有CPUlll控制数码相机101的各部分所需的控制程序、以及所需的数据,CPUlll按照这些控制程序进行动作。
[0040]DRAMl 14被用作暂时存储通过(XD106拍摄到的图像数据的缓冲存储器,并且也可用作CPUlll的工作存储器。
[0041]模糊检测部117具备未图示的陀螺传感器等角速度传感器,检测摄影者的手抖动量。
[0042]另外,模糊检测部117具备检测Yaw(偏转)方向的模糊量的陀螺传感器和检测倾斜Pitch (倾斜)方向的模糊量的陀螺传感器。
[0043]通过该模糊检测部117所检测出的模糊量被送到CPUl 11。
[0044]DMA118读出在缓冲存储器中存储的拜耳数据的图像数据并将其输出到图像生成部 119。[0045]图像生成部119对从DMAl 18发送来的图像数据实施像素插值处理、Y校正处理、白平衡处理等处理,并且还进行亮度色差信号(YUV数据)的生成。即为进行图像处理的部分。
[0046]DMA120使缓冲存储器存储由图像生成部119进行过图像处理的亮度色差信号的图像数据(YUV数据)。
[0047]DMA121将在缓冲存储器中存储的YUV数据的图像数据输出到显示部122中。
[0048]显示部122包括彩色IXD及其驱动电路,并显示从DMA121输出的图像数据的图像。
[0049]DMA123将存储于缓冲存储器中的YUV数据的图像数据或被压缩的图像数据输出到压缩解压部124中,并使缓冲存储器存储由压缩解压部124压缩的图像数据、由压缩解压部124解压的图像数据。
[0050]压缩解压部124为进行图像数据的压缩/解压(例如JPEG或MPEG形式的压缩/解压)的部分。
[0051]DMA125读出存储在缓冲存储器中的压缩图像数据并记录于闪存126中,并且使缓冲存储器存储记录在闪存126中的压缩图像数据。
[0052]图2为表示图1的数码相机101所实现的目标检索装置的功能的构成的功能框图。
[0053]摄像单元201取得光轴相对于被摄体206移动的多个图像数据207。该摄像单元201例如具备通过使光轴移动来校正手抖动的校正透镜,使该校正透镜的光轴移动的同时,取得多个的图像数据207。
[0054]距离计算单元202基于多个图像数据207,计算出从摄像单元201到被摄体206的距离208。
[0055]剪切单元203从图像数据207中的例如I个图像数据中剪切被摄体206中的主要目标209的区域。该剪切单元203例如更新对图像数据207的各像素赋予的表示主要目标或者背景的区域标号值的同时,基于该区域标号值与各像素的像素值,通过例如基于GraphCuts法的能量函数的最小化处理,在图像数据207内对主要目标和背景进行区域分割来剪切出主要目标209,该Graph Cuts法对主要目标相似度(main object-ness)或者背景相似度(background-ness)与相邻像素间的像素值的变化进行评价。
[0056]实际尺寸计算单元204根据剪切出的主要目标209在图像数据207上的大小、从摄像单元201到被摄体206为止的距离208和摄像单元201的焦点距离210,计算出主要目标208的实际尺寸211。
[0057]检索单元205通过附加实际尺寸211的信息并访问主要目标的数据库116 (参照图1),来检索主要目标209的种类。
[0058]通过图2所示的数码相机101所实现的目标检索装置的功能结构,基于来自取得光轴相对于被摄体206移动的多个图像数据207的摄像单元201的信息,计算出主要目标209的实际尺寸211并附加该信息,从而能够提高主要目标209的检索精度。
[0059]图3为表示本实施方式的目标检索处理的控制动作的流程图。作为图1的数码相机101内的CPUlll将DRAMl 14用作工作存储器来执行存储器113中存储的控制程序的处理,实现该流程图的处理、和图6及图11的流程图的处理。[0060]首先,图1的校正透镜103在与其光轴垂直的方向上靠近一方来实施被摄体206 (参照图2)的拍摄,作为图像数据207 (参照图2)在图1的DRAMl 14中取得图像A (图3的步骤S301)。同样地,图1的校正透镜103在与其光轴垂直的方向上靠近相反侧来实施被摄体206的拍摄,作为图像数据207在图1的DRAMl 14中取得图像B (图3的步骤S302)。上述的步骤S301和S302的处理实现图2的摄像单元201的功能。
[0061 ] 接下来,根据在DRAMl 14中得到的图像A以及图像B,计算出从图1的摄影镜头102的透镜面到被摄体206为止的景深(距离)d(图3的步骤S303)。图4为本实施方式的景深计算处理的说明图。
[0062]图4中,为了简化说明,考虑包括校正透镜103的摄影镜头102位于镜头位置#1 (由多个构成的摄影镜头102的虚拟的透镜面H与光轴#1相交的点),且点光源L位于该光轴#1上的情况。在该情况下,点光源L在图1的(XD106上的摄像面I的摄像点Pl上成像。由此,通过经由镜头驱动模块104控制校正透镜103,从而使包括校正透镜103的摄影镜头102的镜头位置从与光轴#1相对应的镜头位置#1向与光轴#2相对应的镜头位置#2 (透镜面H与光轴#2相交的点)位移(移动)了距离S。其结果,点光源L在图1的(XD106上的摄像面I的摄像点P2上成像。此时,连结点光源L、镜头位置#1以及镜头位置#2的三角形、与连结镜头位置#2、摄像点P2以及光轴#2与摄像面I相交的点的三角形成为相似形。因此,在校正透镜103的移动量S、与从透镜面H到点光源L所处的物体面O为止的距离d(将其称为“景深”)(与图2的距离208相对应)之间成立以下的关系。
[0063]f: d = S,: S
[0064]因此,根据上述式1,通过下式能够计算出景深d。
[0065]d = fX S/S,
[0066]在此,f为从透镜面H到摄像I为止的焦点距离210 (参照图2),S为从光轴#1到光轴#2为止的位移量,S’为从光轴#2与摄像面I相交的点到摄像点P2为止的距离。另外,S’为图1的(XD106在摄像面I上的距离,因此在根据拍摄到的图像进行计算的情况下,在摄像面I的点数(pixel_count)上乘以摄像元件的像素倾斜尺寸(size_per_pixel)。即,
[0067]S’ = size_per_pixel Xpixel_count。
[0068]为了简化说明,上述的计算式以包括校正透镜103的摄影镜头102的镜头位置#1位于经过最初点光源L的光轴#1上的情况进行了说明,但对于任意2点的镜头位置,都成立同样的比例关系。
[0069]基于以上的原理执行的图3的步骤S303实现图2的距离计算单元202的功能。
[0070]接下来,通过图形切割处理,根据在步骤S301中计算出的图像A(也可以是在步骤S302中计算出的图像B),通过图形切割处理剪切出作为主要目标209(参照图2)的花区域(图3的步骤S304)。关于该处理的详细内容将在后面叙述。该步骤S304的处理实现图2的剪切单元203的功能。
[0071]接下来,根据在步骤S304中剪切出的作为主要目标209的花区域的宽度、在步骤S303中计算出的景深d、和包括图1的校正透镜103以及摄影镜头102在内的全部透镜的焦点距离210 = f,计算出花区域的实际尺寸hw (图3的步骤S305)。图5为本实施方式的实际尺寸计算处理的说明图。
[0072]根据图5,根据三角形的相似形的关系,焦点距离210 = f和景深d、与CXD106(图I)的摄像面I上的作为主要目标209的花区域的宽度W’和主要目标209的实际的花的被摄体的宽度的实际尺寸w具有下式的关系。
[0073]f: d = W,: w
[0074]因此,能够根据下式计算出实际的花的宽度的实际尺寸W。
[0075]w = W,X d/f
[0076]另外,w’为图1的(XD106在摄像元件面I上的距离,因此在根据拍摄到的图像进行计算的情况下,在摄像面I上的作为主要目标209的花的区域的宽度个数(floWer_pixel_count)上乘以摄像元件的像素倾斜尺寸(size_per_pixel)。即
[0077]w’ = size_per_pixelXflower_pixel_count。
[0078]基于以上的原理执行的图3的步骤S305实现图2的实际尺寸计算单元204的功能。在这种情况下,除了作为主要目标209的花的宽度的实际尺寸w外,还根据主要目标209上的宽度与高度的比例关系,也可以计算出花的高度的实际尺寸h。如上所述,计算出作为主要目标209的花的实际尺寸211 (参照图2) = hw(高度和宽度)。
[0079]如上所述计算出作为主要目标209的花的实际尺寸211 = hw后,从图3的步骤S304中剪切出的作为主要目标209的花区域的图像数据中提取图像特征量(图3的步骤S306)。
[0080]接下来,采用在步骤S306中提取出的图像特征量来构成花识别器,并参照图1的主要目标的数据库116中的花的种类的数据库。其结果,从数据库中取得识别花的标识符(ID)的目录,作为花的种类的候补目录(图3的步骤S307)。
[0081]接下来,参照按主要目标的数据库116中的花的各个标识符(ID)存储了实际尺寸HW的数据库。而且,判定每个IDn (η = 1,2,…)的实际尺寸HW(IDn.HW)与在步骤S305中计算出的花的实际尺寸211 = hw在固定误差范围内是否一致(图3的步骤S308)。
[0082]若实际尺寸不一致且步骤S308的判定为“否”,则针对下一个IDn反复进行步骤S308的判定。
[0083]若实际尺寸一致且步骤S308的判定为“是”,则判定该IDn是否为与在步骤S307中计算出的候补目录中的花相同的花(图3的步骤S309)。
[0084]若步骤S309的判定为“否”,则针对下一个IDn反复进行步骤S308的判定。
[0085]若步骤S309的判定为“是”,则作为检索结果而输出该花,并结束花的检索处理。
[0086]以上的步骤S306到S309的一系列的处理实现图2的检索单元205的功能。
[0087]通过以上的图3所示的目标检索处理计算出作为主要目标209的花的实际尺寸211并附加该信息,从而能够提高作为主要目标209的花的检索精度。在这种情况下,通过数码相机101原来具备的例如手抖动校正用的校正透镜103的控制,能够有效地计算出主要目标209的实际尺寸211。
[0088]图6为表示图3的步骤S304的图形切割处理的流程图。
[0089]首先,执行矩形框决定处理(图6的步骤S601)。在该处理中,用户使例如图1的显示部122显示例如由图1的摄像单元102~110进行拍摄而得到的图像数据207(参照图2)中的一个(例如图3的图像A)。而且,在该显示图像上,对想要识别的物体(本实施方式中例如是花)存在的大致区域采用例如触摸面板等输入装置107来指定矩形框。例如是手指在触摸面板上进行的滑动动作。[0090]接下来,对图像范围内的各像素执行对主要目标和上述背景进行区域分割的区域分割处理(图形切割处理)(图6的步骤S602)。该处理的详细内容将在后面叙述。
[0091]在一次区域分割处理结束之后,进行收敛判定(图6的步骤S603)。在满足以下的任一个条件时,该收敛判定成为“是”的判定结果。
[0092].反复次数成为一定以上
[0093].成为上次主要目标的区域面积和成为本次主要目标的区域面积的差在一定以下
[0094]若在步骤S603的判定中未收敛,该判定为“否”的情况下,按照上次区域分割处理的状况,用户指定的矩形框内的后述的成本函数gv(xv)如下那样被修正后被进行数据更新(图6的步骤S604)。按每个彩色像素值C混合(加法运算)通过步骤S602的区域分割处理而判定为主要目标的区域的直方图和事先准备的后述的直方图Θ (c,0)。由此,生成表示新的主要目标相似度的直方图Θ (c,0),并基于该直方图计算新的成本函数gv(Xv)(参照后述的式12等)。同样地,按每个彩色像素值c例如以固定比例混合(加法运算)通过步骤S602的区域分割处理判定为背 景的区域的直方图和事先准备的后述的直方图Θ (c,l)0由此,生成表示新的背景相似度的直方图Θ (C,I),基于此计算新的成本函数gv(Xv)(参照后述的式13等)。
[0095]若步骤S603的判定收敛,该判定为“是”,则图6的流程图所示的区域分割处理结束,作为最终结果即主要目标209 (参照图2),输出目前得到的主要目标区域。
[0096]以下,说明图6的步骤S602的区域分割处理。
[0097]设父=^...^...^)
[0098]为要素Xv表示图像V中的相对像素V的区域标号的区域标号矢量。该区域标号矢量为例如如果像素V位于主要目标区域内则要素Xv = O、如果像素V位于背景区域内则要素Xv = I的二进制矢量。即、
[0099]Xv = 0(像素V e主要目标区域)
[0100]Xv = 1(像素V e背景区域)。
[0101]在本实施方式中执行的区域分割处理为在图像V中求得使由下式定义的能量函数E(X)最小这样的式7的区域标号矢量X的处理。
[0102]細=[紙卜
reVUlv^E
[0103]执行能量最小化处理的结果,作为区域标号矢量X上成为区域标号值Xv = O的像素V的集合、得到主要目标区域。对本实施方式的例子来说,为矩形框内的花的区域。另外,在区域标号矢量X上区域标号值Xv = I的像素V的集合成为背景区域(还包括矩形框外)。
[0104]为了使式9的能量最小化,定义下式以及图7所示的带有权重的有向图(以下简略为“图形(graph)”)。
[0105]G= (E, V)
[0106]在此,V为节点(node)、E为边缘(edge)。在该图形适用于图像的区域分割的情况下,图像的各像素与各节点V相对应。此外,作为像素以外的节点,追加在下式以及图7所示的、被称作
[0107]源(source)s e V[0108]凹陷(sink)tev
[0109]的特殊的末端(terminal)。将该源s对应为主要目标区域、凹陷t对应为背景区域来考虑。此外,边缘E表现节点V间的关系。将表示与周边的像素的关系的边缘E称作n-link、将表示各像素与源s(与主要目标区域对应)或者与凹陷t(与背景区域对应)的关系的边缘E称作t-link。
[0110]暂且将连结源s和与各像素对应的节点的各t-link看作表示各像素与主要目标区域相似到哪种程度的关系。而且,使表示该主要目标区域相似度的成本值与式9第I项建立对应关系,并定义为
[0111]gv(xv) = gb(0) = -log θ (I (V),O)。
[0112]在此,θ (c、0)为表示根据为了学习而准备的多个(数百个程度)主要目标区域图像计算出的每个彩色像素值c的直方图(出现次数)的函数数据,例如,如图8(a)所示那样预先得到。另外,归一化为遍及Θ (c、0)的全彩色像素值c的总和成为I。此外,I(V)为输入图像的各像素V的彩色(RGB)像素值。实际上,还有将彩色(RGB)像素值变换为亮度值而得到的值,但如果没有需要特别提及,则以下为了简化说明,记载为“彩色(RGB)像素值”或者“彩色像素值”。式12中,Θ (I (v),O)的值越大,成本值就越小。这意味着在预先得到的主要目标区域的彩色像素值中出现次数越多,根据式12得到的成本值越小,意味着像素V相似为主要目标区域中的像素,结果,可降低式9的能量函数E(X)的值。
[0113]接下来,将连结凹陷t和与各像素对应的节点的各t-link看作表示各像素与背景区域相似到哪种程度的关系。而且,使表示该背景区域相似度的成本值与式9第I项建立对应关系,并定义为
[0114]gv (Xv) = gv(l) = -log θ (I (V),I)。
[0115]在此,θ (c、l)为表示根据为了学习而准备的多个(数百个左右)背景区域图像计算出的每个彩色像素值c的直方图(出现次数)的函数数据,例如如图8(b)所示那样预先得到。另外,归一化为遍及Θ (cU)的全彩色像素值c的总和成为I。Kv)与式12的情况相同,为输入图像的各像素V的彩色(RGB)像素值。在式12中,θ (I(v)、l)的值越大,成本值就越小。这意味着在预先得到的背景区域的彩色像素值中出现次数越多,根据式13得到的成本值就越小,像素V相似为背景区域中的像素,结果,可降低式9的能量函数E(X)的值。
[0116]接下来,使表示对应于各像素的节点与其周边像素的关系的n-link的成本值、和式9第2项建立对应关系,并定义为
【权利要求】
1.一种目标检索装置,其特征在于,具备: 摄像单元,取得光轴相对于被摄体移动后的多个图像数据; 距离计算单元,基于上述多个图像数据,计算出从上述摄像单元到上述被摄体为止的距离; 剪切单元,从上述图像数据中剪切上述被摄体中的主要目标; 实际尺寸计算单元,根据上述剪切出的主要目标在上述图像数据上的大小、从上述摄像单元到被摄体为止的距离、和上述摄像单元的焦点距离,计算出上述主要目标的实际尺寸;和 检索单元,通过附加上述实际尺寸的信息并访问主要目标的数据库,从而检索上述主要目标的种类。
2.根据权利要求1所述的目标检索装置,其特征在于, 上述摄像单元具备通过使光轴移动来校正手抖动的校正透镜,使该校正透镜的光轴移动的同时取得上述多个图像数据。
3.根据权利要求1所述的目标检索装置,其特征在于, 上述剪切单元对赋予给上述图像数据的各像素的表示上述主要目标或者上述背景的区域标号值进行更新,同时基于该区域标号值和上述各像素的像素值,通过评价上述主要目标相似度与相邻像素间的上述像素值的变化、或者上述背景相似度与相邻像素间的上述像素值的变化的能量函数的最小化处理,在上述图像数据内对上述主要目标和上述背景进行区域分割来剪切上述主要目标。
4.根据权利要求3所述的目标检索装置,其特征在于, 上述剪切单元通过图像剪切法执行上述能量函数的最小化处理。
5.一种目标检索方法,其特征在于,包括: 摄像步骤,取得光轴相对于被摄体移动后的多个图像数据; 距离计算步骤,基于上述多个图像数据,计算出从摄像单元到上述被摄体为止的距离; 剪切步骤,从上述图像数据中剪切上述被摄体中的主要目标; 实际尺寸计算步骤,根据上述剪切出的主要目标在上述图像数据上的大小、从上述摄像单元到被摄体为止的距离、和上述摄像步骤的焦点距离,计算出上述主要目标的实际尺寸;和 检索步骤,通过附加上述实际尺寸的信息并访问主要目标的数据库,从而检索上述主要目标的种类。
6.一种计算机可读取记录介质,其记录了使执行目标检索处理的计算机作为以下单元起作用的程序,即: 摄像单元,取得光轴相对于被摄体移动后的多个图像数据; 距离计算单元,基于上述多个图像数据,计算出从上述摄像单元到上述被摄体为止的距离; 剪切单元,从上述图像数据中剪切上述被摄体中的主要目标; 实际尺寸计算单元,根据上述剪切出的主要目标在上述图像数据上的大小、从上述摄像单元到被摄体为止的距离、和上述摄像单元的焦点距离,计算出上述主要目标的实际尺寸;和 检索单元,通过附加上述实际尺寸的信息并访问主要目标的数据库,从而检索上述主要目标的种类。
【文档编号】G06F17/30GK103577520SQ201310311243
【公开日】2014年2月12日 申请日期:2013年7月23日 优先权日:2012年7月24日
【发明者】二瓶道大, 松永和久, 广浜雅行, 中込浩一 申请人:卡西欧计算机株式会社