专利名称:表示出现在图像中的目标的方法、设备和计算机系统的制作方法
技术领域:
本发明涉及例如出现在诸如在多媒体数据库中所存储的图像之 类的静止或视频图像中的目标的表示,并且特别地涉及这样一种表示 的编码。
背景技术:
在诸如图像或视频文库之类的应用中,希望的是对于出现在静 止或视频图像中的目标或目标各个部分的轮廓或形状具有一种有效 表示和存储。基于形状的索引和重现(retrieval)的一种已知技术 使用曲率缩放空间(CSS) (Curvature Scale Space)表示。CSS表示的 细节可以在文件"Robust and Efficient Shape Indexing through Curvature Scale Space"(通过曲率缩放空间的强大并有效的形状索 引)Proc. British Machine Vision conference, 第 53 - 62页, Edinburgh, UK, 1996和 "Indexing an Image Database by Shape Content using Curvature Scale Space"(通过形状内容使用曲率 缩放空间来索引 一个图4象数据库)Proc. IHE Colloquium on Intelligent Databases, London 1996,中找到。两篇文章都是F. Mokhtarian、 S. Abbasi和J. KiUler的,将其内容引用在此供参 考。
发明内容
CSS表示使用目标轮廓的一个曲率函数,从该轮廓上的一个任意 点开始。因为轮廓形状被使形状平滑的一系列失真所演变故研究曲率 函数。更明确地,计算以高斯滤波器系列旋转的曲率函数的导数的零 交叉。将该零交叉被绘制在一个曲线图上,通称为曲率缩放空间,在 此X轴是该曲线的标准化弧长而Y轴是演变参数,更明确地,是所应 用的滤波器的参数。曲线图上的曲线环绕成轮廓特性。目标轮廓的每 一凸形或凹形部分对应于该CSS图像中的一个环路。CSS图像中的最凸 出的环路的峰值坐标被使用作为该轮廓的一个表示。
为了搜索与输入目标形状匹配的储存在数据库中的图像中的目 标,计算出一个输入形状的CSS表示。通过使用匹配算法来比较在各个css图像中的峰值的位置和高度,从而确定输入形状和储存形状之 间的相似性。
表示一个描述符中的轮廓形状性质所需要的比特数目应该尽可 能小以便进行有效储存和传输。
按照本发明,提供了一种通过处理与图像对应的信号来表示出现
在静止或视频图像中的目标的方法,所述方法包括导出表示所述目 标的形状的多组坐标值并且量化所述坐标值来导出该形状的编码表 示,其中,对于第一组坐标值的给定坐标值小于第二组坐标值中的对 应坐标值,向所述第一组值的给定坐标值的量化表示分配的比特数目 少于向所述第二组值的对应坐标值的量化表示分配的比特数目。
本发明能够提供一个非常简洁的表示(根据用于存储的比特数目) 而在重现性能中没有任何显著的恶化。
下面将参考附图描述的本发明的实施例,附图中
图l是一个视频数据库系统的框图2是一个轮廓的CSS表示;
图3是说明CSS表示的坐标值编码的图表。
具体实施例方式
图l示出了根据本发明实施例的一个计算机化的视频数据库系 统。该系统包括计算机形式的一个控制单元2,监视器形式的一个显 示单元4,鼠标形式的一个定点设备6,包括储存的静止和视频图像 的一个图像数据库8以及一个描述符数据库IO,该描述符数据库10 存储出现在储存在图像数据库8中的图像中的目标或目标各个部分 的描述符。
出现在图像数据库中的图像中每一感兴趣目标的形状描述符被 控制单元2导出并且被储存在描述符数据库10中。控制单元2导出 在执行如下所述方法的一个适当程序控制下操作的描述符。
首先,对于一个给定目标轮廓,轮廓的一个CSS表示被导出。使 用在上面提及的文件之一中描述的已知方法来执行之。
更明确地,该轮廓通过一个表示W- ((x(u), y(u), ue [ 0 , 1〗}来表示,在此,u是一个标准化弧长参数而(x,y)是目标轮廓上 的点的坐标。该轮廓通过用Gaussan核心g (u , cr)或类似的核心旋转平而被 平滑,并且演变的曲线的曲率零交叉被检查作为a变量。使用曲率的 下列表达式来识别零交叉。
W" 一 Xu (", cr)乙(",QP - X仙(",(",刊 , (xu(",o02 + };(w,o02)3'2
在此 和
Xu - (") * gB (", cr)L (", cO=* " (", cr)
在上面,*表示巻积、而下才示表示导数。
曲率零交叉的数目改变为CJ变量,并且当cr十分高时,¥成为没 有零交叉的一个凸形曲线。
零交叉(u, a)被绘制在一曲线图上,通称CSS图像空间。这导 致原始轮廓的多个曲线特性。特性曲线的峰值被识别并且相应的坐标 被提取和储存。在一般的术语中,这给出了一组n个坐标对 [(xl,yl), (x2,y2) (xn,yn)〗,在此,n是峰值数目,而xi是第i个峰 值的弧长位置并且yi是峰值高度。
特性曲线的顺序和位置以及它们出现在CSS图像空间中的相应 峰值取决于如上所述的曲率函数的起始点。峰值坐标被重新排列,如 下所述。
让我们假定从中提取参数的轮廓有n个峰值,峰值参数形成一组 (( ,y1), (x2, y2), ...(xn,yn)},如图2所示。然后根据高度按照 递增或递减的顺序排列峰值Ux!,yJ, (x2,y2), (xn,yn)}(下标表示在 排序之后的峰值序号)。让我们假定按照递减的顺序排列峰值,所以 最高峰值是第一个(x^),并且每一后续峰值低于或等于该组中的它 的前者(图3)。
这些重新排列的峰值坐标形成目标轮廓的描述符的基础。诸如环 状C、偏心率E和紧密度D之类的另外的形状参数(其中某些从所谓 的"原型轮廓形状"中被提取)还可以被计算并储存来使用在如共同 悬而未决的申请no. GB 9916684. 5中所述的匹配处理中,该申请的内容在此被参考结合。
接下来,执行峰值高度的粗略量化。对于每个峰值,执行量化的 范围是不同的,并且取决于较高的峰值(例如,在作为被排列组中的 前者的那些峰值的高度)。
参见图3,第一峰值在范围11= [ 0, Y陋]上被量化,在此,Ynax 是对某一类形状所期待的峰值的最大值。每一剩余峰值被量化到该范 围,这取决于一个或好几个早先峰值的数值。例如,峰值y2在间隔 12= [ 0,yi ]上被量化,(图3)峰值y3在间隔
上被量化。
在这个实施例中,使用7比特把第一峰值量化在间隔
上并且在适当的各个范围上把剩余峰值量化到比特3。假如第一峰值 的高度是893,则说,那么使用3比特在范围
上把y;量 化,等等。因此,对于峰值h到y5,量化间隔被降低,尽管使用较少 的比特,但给出更大的精确度。每个峰值的X坐标被量化到在[O,l] 间隔上均匀分布的6比特。x值可以是原始X值,例如如图2所示, 或者在沿着x轴偏移一个数量之后,如此以使最高峰值的x值在0 处。
让我们检查从本发明中的获益。在传统解决方案中,每一峰值需 要两个浮点数,每一个是4字节。因此,对于具有9个峰值的一个典 型形状,存储规格是9*2*4=72字节(576比特)。在建议的实施例的应 用之后,第一峰值需要7个比特,假定x值被作为零来对待,并且每 个连续峰值6+3比特,因此总共为79比特。
代替一个范围[O,yi], 一个范围(O,R(yi))可以被使用,在此, R(yi)是在反量化之后的值yi的重建。
具有类似效果的另一个实施例通过各个早先峰值的数值划分每 一峰值{y2,y3,...,yn}(除最高一个之外)的高度。在此操作之后, 所有yi的范围是来自组(O,l ]中。这允许对于所有的yi使用许多粗 略量化。
在任一示例中,可以通过对于所有剩余峰值的最高峰值加4或3 比特量化来使用7或6比特量化从而获得优良的结果。也可以使用其 它数目的比特。
上面的操作还可以在坐标值已经蒙受一个副法线和一个非线性 变换之后被执行,正如在共同悬而未决的申请no. GB9915699. 4中所述,该申请的内容在此被参考结合。代替或者像y值一样,可以沿着 如上所述的线路来编码x坐标。
通过适当的修改,该结果值可以被储存,例如用来使用在一个适 当的匹配程序中,比如在我们的共同悬而未决的申请GB9915699. 4, GB9915698.6和GB9916684. 5中所描述的,例如在执行匹配之前对,皮 储存描述符执行反量化。
权利要求
1.一种通过处理与图像对应的信号来表示出现在静止或视频图像中的目标的方法,所述方法包括导出表示所述目标的形状的多组坐标值并且量化所述坐标值来导出该形状的编码表示,其中,对于第一组坐标值的给定坐标值小于第二组坐标值中的对应坐标值,向所述第一组值的给定坐标值的量化表示分配的比特数目少于向所述第二组值的对应坐标值的量化表示分配的比特数目。
2. 如权利要求l所述的方法,其中,第一组坐标值的给定坐标 值的量化范围至少基于第二组坐标值的对应坐标值。
3. 如权利要求2所述的方法,其中,对于递减的坐标值的序列, 每一坐标值的量化范围是基于以它们存在的一个或多个先前的、较高 的坐标值。
4. 如权利要求1到3的任何一项所述的方法,其中,在所述给定 坐标值被量化的范围对于第一组坐标值比对于第二组坐标值小。
5. 如权利要求1到3的任何一项所述的方法,其中,向第一组值 的给定坐标值的量化表示分配的比特数目与向第二组值的对应坐标 值的量化表示分配的比特数目相同。
6. 如前面权利要求的任何一项所述的方法,其中,这些坐标组 是坐标对,并且对于每一对坐标值的至少一个坐标值,所述量化范围 是变化的。
7. 如权利要求6所述的方法,其中,所述坐标对对应于形状的 CSS表示中的峰值的位置。
8. 如权利要求7所述的方法,其中,变化的量化范围用于与峰值高度对应的坐标值。
9. 如前面权利要求的任何一项所述的方法,其中,对于多个坐 标值,该量化范围是相同的。
10. 如前面权利要求的任何一项所述的方法,包括按照递减或递 增的大小对坐标值进行排序的步骤。
11. 一种通过处理与图像对应的信号来搜索静止或视频图像中 的目标的方法,所述方法包括输入查询目标,导出所述查询目标的 表示,把所述表示与使用如前面权利要求任何一项所导出的表示进行 比较,并且选择和显示其表示指示了与所述查询的相似程度的那些目标。
12. —种编程为执行权利要求l至ll中所述的任一种方法的控制 设备。
13. —种设备,包括用于执行权利要求l至ll中所述的任一种方法 的装置。
14. 如权利要求13的设备,包括权利要求12中的控制设备和用于 存储图像和/或图像表示的存储装置。
15. —种用于实现权利要求1至10中任一种方法的计算机程序, 或一种存储这种计算机程序的计算机可读存储介质,或一种编程为根 据权利要求1至10中任一项进行操作的计算机系统。
全文摘要
表示出现在图像中的目标的方法、设备和计算机系统。一种通过处理与图像对应的信号来表示出现在静止或视频图像中的目标的方法,所述方法包括导出表示所述目标的形状的多组坐标值并且量化所述坐标值来导出该形状的编码表示,其中,对于第一组坐标值的给定坐标值小于第二组坐标值中的对应坐标值,向所述第一组值的给定坐标值的量化表示分配的比特数目少于向所述第二组值的对应坐标值的量化表示分配的比特数目。
文档编号G06K9/48GK101539997SQ20091013282
公开日2009年9月23日 申请日期2001年2月27日 优先权日2000年2月29日
发明者M·波贝尔 申请人:三菱电机株式会社