一种基于多尺度分析的图像特征包构建方法
【技术领域】
[0001] 本发明属于计算机视觉领域,更为具体地讲,涉及一种基于多尺度分析的特征包 构建方法。
【背景技术】
[0002] 随着信息化时代进程,数字图像作为信息的重要载体,其数量呈现出爆炸式增长。 海量的数字图像数据在为人们的信息采集、传递、获取带来极大便利的同时,也使信息的归 类、存储和检索面临很多新的困难。如何从浩如烟海的图像数据中更加快速和准确的分析、 识别并获取有用的信息是目前计算机视觉领域最至关重要的研宄课题之一。
[0003]早期的图像分类标识主要由人工手动完成,利用图像附加的文本信息进行分类和 检索,然而随着图像数量的几何级增长,以及人工分类不可避免的主观理解差异,传统分类 模式已无法适应信息化时代的需求。有鉴于此,上世纪九十年代出现了基于内容的图像分 类(Content-basedimageretrieval,CBIR),该方法利用图像颜色、纹理、形状等底层特征 作为分类依据,有效的实现了数字图像的自动化分类。但是,基于内容的图像分类中所采用 的底层特征与人类所能够理解的图像语义特征存在明显差异,这种"语义鸿沟"造成计算机 很难如人类一样对复杂图像进行描述并加以理解。进入21世纪以来,许多计算机视觉领域 的研宄者致力于建立一种更为直观准确的图像描述方式。2003年,Sivic等提出了视觉词 袋模型,该模型主要借鉴文本分析领域的词袋模型(BagofWords,BoW),把每幅图像视为 若干局部特征的无序集合,并通过对局部特征进行聚类获取特征聚类中心作为视觉单词, 因此也称为特征包模型(BagofFeatures(B0F),该模型一经提出即获得极大成功,随着众 多研宄者的不断改进和拓展,目前已成为计算机视觉领域最主要的图像描述和图像分类方 法之一。
[0004] 局部特征提取和视觉词典建立是特征包模型中最为关键的两个步骤,目前最常使 用的局部特征包括基于图像块(Patches)的特征和基于关键点(KeyPoints)两大类,其中 以SIFT为代表的基于关键点的局部特征更为流行,但是近来随着计算机性能的提升,新的 研宄认为基于图像块的特征可以具有与SIFT同样的分类效果,以及更多进一步改进的余 地。基于图像块的特征存在的问题主要是对图像细节和纹理的表述不足。小波变换作为一 种多尺度分析方法被称作数字图像处理中的显微镜,许多在某种分辨率下难以发现的特征 可以通过小波变换分解之后从另一种分辨率下轻易发现,将多尺度分析理念和小波变换引 入特征包模型可以有效的捕获一些容易被忽视的细节信息。
【发明内容】
[0005] 本发明的目的在于设计一种能够从不同尺度下对图像内容加以描述的视觉特征 包模型,该模型聚焦于图像的多尺度特征提取和图像的语义描述层面,并可具体应用于图 像的分类、检索等高层处理。
[0006] 为实现上述目的,本发明一种基于多尺度分析的图像特征包构建方法,主要包括 以下内容:在特征包模型中引入图像的多尺度分析理念,利用小波变换对图像进行分解,分 别提取其高频和低频子带的局部区域特征,并分别构建高频视觉词典与低频视觉词典,然 后利用视觉词典对图像加以描述,此后可根据图像所包含视觉单词的分布情况进行分类和 检索。
[0007] 技术原理如图1所示,具体技术流程如下: 步骤一:首先利用小波变换对训练图像进行多尺度分解,分别生成高频子带与低频子 带; 步骤二:对多尺度分解之后的高频子带与低频子带分别进行局部特征提取,生成高频 子带特征集合与低频子带特征集合; 步骤三:对训练集中所有的高频子带特征和低频子带特征分别进行聚类,将聚类中心 作为视觉单词,构建视觉词典; 步骤四:根据上述步骤生成的视觉词典对图像特征进行编码,将图像转换为视觉特征 包; 步骤五:在获得视觉特征包模型之后,可以通过SVM分类器对图像进行分类。
【附图说明】
[0008] 图1是本发明一种基于多尺度分析的图像特征包构建方法的原理框图; 图2是本发明一种基于多尺度分析的图像特征包构建方法的技术方案图。
【具体实施方式】
[0009] 下面结合附图对本发明的【具体实施方式】进行描述,以便本领域的技术人员更好地 理解本发明。需要特别提醒注意的是,在以下的描述中,可能淡化本发明主要内容的已知功 能和设计的详细描述将被忽略。
[0010] 图2是本发明一种基于多尺度分析的图像特征包构建方法的技术方案图。
[0011] 在本实施方案中,本发明一种基于多尺度分析的特征包构建方法主要包括以下环 节:1.多尺度分解、2.特征提取、3.生成视觉词典、4.生成图像特征包、5.图像分类测试。
[0012] 多尺度分解环节主要通过对原图像进行小波变换加以实现,小波变换分解公式如 下:
【主权项】
1. 本发明一种基于多尺度分析的图像特征包构建方法,主要包括w下内容:在特征包 模型中引入图像的多尺度分析理念,利用小波变换对图像进行分解,分别提取其高频和低 频子带的局部区域特征,并分别构建高频视觉词典与低频视觉词典,然后依据视觉词典对 图像加W描述,此后可根据图像所包含视觉单词的分布情况进行分类和检索。 技术方案如下: 步骤一;首先利用小波变换对训练图像进行多尺度分解,分别生成高频子带与低频子 -W- 市; 步骤二:对多尺度分解之后的高频子带与低频子带分别进行局部特征提取,生成高频 子带特征集合与低频子带特征集合; 步骤对训练集中所有的高频子带特征和低频子带特征分别进行聚类,将聚类中屯、 作为视觉单词,构建视觉词典; 步骤四:根据上述步骤生成的视觉词典对图像特征进行编码,将图像转换为视觉特征 包; 步骤五;在获得视觉特征包模型之后,再通过SVM分类器对图像进行分类。
2. 根据权利要求1所述的一种基于多尺度分析的图像特征包构建方法,其特征在于在 图像特征包模型中引入多尺度分析理念,利用小波变换对图像进行多尺度分解,之后分别 构建出高频和低频的视觉词典,再依据视觉词典对图像进行编码,从而获得一个多尺度视 觉特征下的图像描述。 本发明中主要的特色是在图像特征包模型中引入多尺度分析理念,利用多尺度词典对 图像内容进行描述。主要包括;(1)利用小波变换对原始图像进行多尺度分解,获得高频和 低频四个子带。(2)对训练集中所有的高频、低频子带特征分别进行聚类计算获取不同的视 觉词典。(3)利用多个视觉词典来描述一幅图像,从而获得更准确的特征包模型。 多尺度分解环节主要通过对原图像进行小波变换加W实现,小波变换分解公式如下:
其中g(n) = (-l)nh(l-n),h(n)和g(n)是滤波器。 小波分解之后可W获得LL,化,LH,皿四个子带,其中化为图像的低频子带,代表图 像的背景;化为图像水平方向的高频子带,代表图像水平方向上的细节特征;LH为垂直方 向的高频子带,代表图像垂直方向上的细节特征;皿则是水平和垂直两个方向上的高频子 带,代表图像水平和垂直方向的细节特征; 视觉词典的生成通过对上述环节提取的特征进行K-Means聚类,该算法W欧式距离作 为相似度测度,其具体算法过程如下;(1)从N个特征中任意选取K个特征作为初始聚类中 屯、,(2)测量每个特征与各初始聚类中屯、的距离,并将其划入距离最近的一类,(3)重新计 算每个聚类的均值,获得新的聚类中屯、,(4)迭代2-3步直至每个聚类不再发生变化或变化 程度小于阔值。 生成图像特征包主要是依据上述步骤获得的视觉词典对图像所包含的特征进行编码, 从而获得一个对于样本图像的特征描述,具体做法是利用步骤1-2提取出样本图像的多尺
【专利摘要】本发明通过在特征包模型中引入图像的多尺度分析理念,构建了一种基于多尺度分析的图像特征包构建方法。该方法首先利用小波变换对图像进行分解,接着分别提取其高频和低频子带的局部区域特征,并分别构建高频视觉词典与低频视觉词典,然后利用视觉词典对图像加以描述,生成图像特征包。本发明聚焦于图像的多尺度特征提取和图像的语义描述层面,可以更好的捕获图像中的细节信息从而生成视觉特征词汇,新的特征包模型可具体应用于医学图像、遥感图像、网络图像等数字图像数据的分类、检索等。
【IPC分类】G06K9-62
【公开号】CN104850859
【申请号】CN201510268127
【发明人】秦志光, 王伟, 秦臻, 丁熠, 肖哲, 黄若菡, 张聪, 陈浩, 陈圆, 徐路路
【申请人】电子科技大学
【公开日】2015年8月19日
【申请日】2015年5月25日