专利名称:基于分水岭算法的视频对象提取方法
技术领域:
本发明涉及一种视频对象提取和视频信号处理方法,具体讲是一种基于分水岭算法的视频对象提取方法。属于计算机视觉研究领域。
背景技术:
视频对象提取技术是计算机视觉和模式识别的重要研究对象之一,不仅具有很高的理论价值,而且在许多实际问题中,如基于内容的视频监控、运动检测等方面都得到了广泛的应用。同时,视频对象提取也是一项比较复杂的技术,牵涉到几何学、数学形态学、计算技术等许多领域,研究至今已经提出了很多算法,这些算法一般从视频对象的某些关键属性出发,建立相应的数学模型,使模型以视频对象的这些属性为唯一解或者局部最优解。然后就利用数值计算或计算机模拟的方法对模型进行求解,从而完成对视频对象的提取。
分水岭(watershed segmentation)算法是一种基于块的静态图象分割算法,也是一种常用的视频对象提取算法。在水线分割算法中,通过得到聚水盆就可以划分出相应的不同的图象区域,这种思想时比较直观的。经文献检索发现,图象的水线分割有两类方法,第一类方法(S H Collins.Terrain parameters directly from a digitalterrain model.Canadian Surveyor,加拿大测量29(5)507-518,1975)是从每个象素出发获得到达拓扑曲面局部最低区域的下降路线,一个聚水盆就是由所有汇到同一个局部最低区域的下降路线组成,这种方法计算量非常大,而且精度不高。第二类方法(L Vincent and P Soille.Watershed in digital spacesAn efficient algorithm basedon immersion simulations.IEEE Transactions on Pattern Analysis and MachineIntelligence,IEEE模式识别与机器视觉杂志13(6)583-598,1991)与第一类方法正好相反,是从聚水盆的盆底出发,采用模拟注水的方法(盆底看作是连通的)当相邻的聚水盆中的水溢出时相遇点连成线就形成了分水岭,该算法效率高,精度好,是比较普遍使用的一种分水岭算法。但是传统的分水岭算法最大的缺点就是过分割现象,即有时会出现大量的分割图象块,这主要是噪声和图象内容本身比较复杂造成的,也是分水岭算法本身无法克服的。
发明内容
本发明目的在于克服现有视频内容监控技术的缺陷,提供一种高效,准确的基于分水岭算法的视频对象提取方法。使其解决视频对象提取计算量大,准确性不高的问题,从而使视频监控的效率和实用性大大提高,为进一步进行的视频对象跟踪,监控视频对象状态提供可靠的依据。
本发明是通过以下技术方案实现的,本发明首先获得视频输入的初始帧,然后根据用户事先生成的监控区域配置文件确定需要提取的视频对象所在的局部矩形区域,接着在已经确定的各矩形区域中分别进行预处理(滤波去噪)、分水岭分割以及颜色分析和区域聚类处理,最后存储提取的视频对象。
以下对本发明作进一步的说明,方法包括如下步骤(1)视频帧读取以RGB的格式读入图象数据,然后分别转换为YUV12和HSI格式的数据保存;(2)预处理采用Roberts算子计算原图象的梯度图象,然后用中值滤波的方法对梯度图象去噪声,减少由于噪声引起的过分割;中值滤波器窗口大小的选择应兼顾滤波效果和运算速度。
(3)图象分割采用分水岭算法对图象进行块分割。具体说以图象的灰度作为第三维建立三维拓扑图,用Vincent和Soille提出的模拟注水的方法提取拓扑图表面的分水岭,自然形成不同的区域,完成图象的块分割;(4)颜色分析和区域聚合对每一对相邻块,首先计算它们的颜色相似度。一般来说,彩色数字图象的颜色空间取RGB空间,但是就子色彩空间的区分度来说,其它颜色空间,如HSV,HSI和CIE更加便于分析和计算。在本发明中选取HSI作为颜色空间,H表示色调,S表示饱和度,I表示亮度。图象中的每一个块的灰度均值可以计算出来,块合并的阈值由人的视觉特征一JND(Just Noticeable Difference)来确定设在某一个子色彩空间中相邻两个块各自的灰度均值分别为I1和I2,如果|I1-I2|<min(JDN(I1),JND(I2))。则将这两个块合并成一个块。
(5)弱边界的处理经过颜色聚类处理后,再消除弱边界,即对每一条相邻块之间的边界,检验边界上的梯度大于某一设定阈值的象素的比例,若该比例超过50%则认为是强边界予以保留,反之则认为是弱边界,相应的邻块进行合并;(6)视频对象保存以象素链表的数据结构实现视频对象的存储。
由于视频监控的实时性要求,本发明采用了局部对象提取技术,即由用户首先采用配置文件的方式向程序提供需要监控的物体所在的矩形区域,程序就在该局部范围内进行对象提取。与从整帧范围进行全局对象提取相比,这种局部对象提取方法不仅准确性高而且计算量显著下降,分割、聚类的速度完全可以达到实时监控的要求。
本发明的针对传统的分水岭算法易产生过分割的缺陷,采用基于颜色信息的象素块聚合的方法,结合弱边界检测和消除技术,很好的解决了过分割的问题,进一步提高了视频对象提取的准确性。提取出来的视频对象以像素链表的数据结构存储,非常便于数据的分析和使用。在象素块聚类的过程中需要用到的阈值将根据人类视觉特性来确定,可以在程序执行过程中由计算机计算得到,不需要用户事先取定,因此使本技术的智能化水平进一步提高。
本发明具有实质性特点和显著进步,本发明采用基于颜色信息的块聚类算法,能够较好的减轻过分割现象,比较准确地提取出视频对象,该方法在基于内容的视频监控领域尚数首创,可以解决视频对象提取计算量大,准确性不高的问题,从而使视频监控的效率和实用性大大提高。本发明被用于对场景中的指定监控物体进行提取,实验表明,算法的实时性强,经过聚类处理后得到的象素块与被监控物体基本一致,为进一步进行视频对象的跟踪奠定了很好的基础。
具体实施例方式
下面结合本发明在“设备实时视频监控”实验中的应用,具体阐述其实施方式。在该实施例中,用户首先采用配置文件的方式向程序提供以上三个监控的物体所在的矩形区域,程序就在该局部范围内进行对象提取,具体步骤如下(1)视频帧读取。输入的视频帧的格式是320*240的RGB图象,根据相应变换矩阵的分别将RGB格式转换为YUV12和HSI格式的数据保存;(2)预处理。对视频帧的亮度灰度图,采用Roberts算子计算梯度图象,然后用中值滤波的方法对得到的梯度图象去噪声,中值滤波器采用5*5正方型滤波窗口,能够有效满足滤波效果和实时性要求。
(3)图象分割。对滤波后的梯度图象用模拟注水的方法进行块分割,分割结果表明的确存在过分割现象,三个监控对象本身都被分成了许多小块,为了使被监控对象尽量以一个块或少数几个相邻块的形式出现,必须进行聚合处理;(4)颜色分析和区域聚合。利用步骤1中得到的HSI格式的图象数据进行颜色分析和块聚类;
(5)弱边界的处理。在步骤(4)的同时结合弱边界消除技术进一步减少图象块的个数,使分割结果更加精确;(6)视频对象保存,以象素链表的数据结构实现三个视频监控对象的存储。
实际监控效果表明,采用以上方法能够精确地提取出指定对象的轮廓,而且效率很高,可以满足实时监控的要求。提取出的对象用于跟踪,当对象状态发生一定变化后程序会及时报警,当对象状态恢复后程序也会发出相应的提示信息,这反映出对象提取的效果是显著的。
权利要求
1.一种基于分水岭算法的视频对象提取方法,其特征在于,首先获得视频输入的初始帧,然后根据用户事先生成的监控区域配置文件确定需要提取的视频对象所在的局部矩形区域,接着在已经确定的各矩形区域中分别进行预处理、分水岭分割以及颜色分析和区域聚类处理,最后存储提取的视频对象。
2.根据权利要求1所述的基于分水岭算法的视频对象提取方法,其特征是,对本发明的方法限定如下(1)视频帧读取,(2)预处理,(3)图象分割,(4)颜色分析和区域聚合,(5)弱边界的处理,(6)视频对象保存。
3.根据权利要求2所述的基于分水岭算法的视频对象提取方法,其特征是,对本发明的方法进一步限定如下(1)视频帧读取以RGB的格式读入图象数据,然后分别转换为YUV12和HSI格式的数据保存;(2)预处理采用Roberts算子计算原图象的梯度图象,然后用中值滤波的方法对梯度图象去噪声,减少由于噪声引起的过分割,中值滤波器窗口大小的选择兼顾滤波效果和运算速度;(3)图象分割采用分水岭算法对图象进行块分割,即以图象的灰度作为第三维建立三维拓扑图,用Vincent和Soille提出的模拟注水的方法提取拓扑图表面的分水岭,自然形成各区域,完成图象的块分割;(4)颜色分析和区域聚合设一幅灰度图象经过分水岭算法处理后被分为k个区域,得到块邻接关系图;(5)弱边界的处理经过颜色聚类处理后,再消除弱边界,即对每一条相邻块之间的边界,检验边界上的梯度大于某一设定阈值的象素的比例,若该比例超过50%则认为是强边界予以保留,反之则认为是弱边界,相应的邻块进行合并;(6)视频对象保存以象素链表的数据结构实现视频对象的存储。
4.根据权利要求3所述的基于分水岭算法的视频对象提取方法,其特征是,步骤(4)具体实现如下首先计算相邻块的颜色相似度,选取HSI作为颜色空间,H表示色调,S表示饱和度,I表示亮度,图象中的每一个块的灰度均值计算出来,块合并的阈值由人的视觉特征一JND来确定设在某一个子色彩空间中相邻两个块各自的灰度均值分别为I1和I2,如果|I1-I2|<min(JDN(I1),JND(I2)),则将这两个块合并成一个块。
全文摘要
一种基于分水岭算法的视频对象提取方法,属于计算机视觉研究领域。本发明首先获得视频输入的初始帧,然后根据用户事先生成的监控区域配置文件确定需要提取的视频对象所在的局部矩形区域,接着在已经确定的各矩形区域中分别进行预处理、分水岭分割以及颜色分析和区域聚类处理,最后存储提取的视频对象。本发明方法在基于内容的视频监控领域尚数首创,可以解决视频对象提取计算量大,准确性不高的问题,从而使视频监控的效率和实用性大大提高。本发明被用于对场景中的指定监控物体进行提取,实验表明,算法的实时性强,经过聚类处理后得到的象素块与被监控物体基本一致,为进一步进行视频对象的跟踪奠定了很好的基础。
文档编号G06K9/34GK1529284SQ0315140
公开日2004年9月15日 申请日期2003年9月29日 优先权日2003年9月29日
发明者杨树堂, 李建华, 须泽中, 郭礼华, 袁晓彤 申请人:上海交通大学