一种基于词袋模型的图像分类方法
【专利摘要】本发明公开了一种基于词袋模型的图像分类方法,所述图像分类方法根据预先训练好的SVM模型,对待分类图像进行特征提取,得到所提取的特征点,对特征点进行聚类得到特征类型,并将特征点表述为其所属的特征类型,根据图像特征点所属的特征类型,利用空间金字塔模型形成图像的直方图向量,最后将待分类图像的直方图向量输入到训练好的SVM模型,完成图像的分类。本发明采用了全新的核函数训练SVM模型,本发明方法降低了计算难度,而且保留了局部特征间的空间信息,提高了图像分类的精度,减少了分类时间。
【专利说明】
一种基于词袋模型的图像分类方法
技术领域
[0001] 本发明属于图像分类领域,尤其涉及一种基于词袋模型的图像分类方法。
【背景技术】
[0002] 随着计算机与互联网技术以及数字图像获取技术的快速发展,图像信息的获取、 使用、交换和传输变得越来越方便,每时每刻都有海量的数字图像出现在互联网以及人们 周边。依靠人工对图像进行分类、组织和管理非常的耗时耗力,而且工作单调枯燥。为了及 时完成数字图像的组织和管理,将人力从单调枯燥的人工图像管理工作中解放出来,我们 希望能够通过计算机对图像中的目标内容进行自动地描述,并根据这些描述将图像数据快 速、规范、自动的进行组织、归类和管理。因此使用计算机对大规模的数字图像进行快速有 效的分类和管理,对人类生活和社会发展具有重大的作用和意义。使用计算机自动地对图 像进行分类和管理在图像检索、视频检索、遥感图像应用、医学图像应用、机器人领域、旅游 导航等领域有着广阔的应用前景。
[0003] 图像分类技术的基本思想是根据图像中包含的内容,用计算机把图像划分到其所 属的特定的语义类别中。这种技术能够在一定程度上对图像内容进行自动理解,将数字图 像转化为人们所能理解的形式,是实现图像语义内容自动提取的重要途径。早期的图像分 类主要依赖于文本特征,使用的是基于文本的图像分类模式。图像标注需要人为地辨识并 为其选定关键字,而不同的人对其所要检索的图像内容有不同的理解,即使是同一个人也 可能因为检索目的不同而对相同的内容标注不同的关键字。随着计算机技术和数字化图像 技术的发展,图像库的规模越来越大,人工标注的方式无法满足快速产生的内容标注的要 求,完全依靠人工对图像进行分类己不可能,人们开始逐渐将研究的重点转移到基于图像 内容分析的自动分类研究上。
[0004] 基于内容的图像分类技术不需要进行任何人工标注的语义信息,而是直接对图像 所包含的信息进行处理和分析,利用图像底层视觉特征来进行图像分类。这种分类技术首 先对图像进行特征提取,将不易受随机因素干扰的信息作为该图像的特征提取出来,即使 用图像本身的颜色、形状、纹理等图像基本视觉特征描述图像,建立视觉特征与图像类别之 间的关联来实现图像的自动分类。
[0005] 词袋模型源于自然语言处理和信息检索,这种模型将文本看作是无序的单词集 合,根据文本中单词的统计信息完成对文本的分类。与文本相似,图像可以被视为一些与位 置无关的局部特征的集合,这些局部特征的地位就类似于文本中的单词,这里叫作"视觉单 词",视觉单词的集合叫作"视觉词典"。图像的灰度、梯度等低级特征通过视觉单词形成了 终极语义表示。2004年起,词袋模型被广泛的应用到了图像的目标分类和场景识别中。早期 应用到图像中的词袋模型大多用于文本分类,近年来,对词袋模型的研究方向从底层的特 征提取和描述开始转向于对视觉词典的建立和优化以及对分类方法的研究,进一步提高了 算法的分类性能和计算效率。
【发明内容】
[0006] 本发明的目的是提供一种基于词袋模型的图像分类方法,以提高图像分类的精 度,降低计算复杂度,减少分类时间。
[0007] 为了实现上述目的,本发明技术方案如下:
[0008] -种基于词袋模型的图像分类方法,所述图像分类方法包括:
[0009] 对待分类图像进行特征提取,得到所提取的特征点;
[0010] 对特征点进行聚类得到特征类型,并将特征点表述为其所属的特征类型;
[0011] 根据图像特征点所属的特征类型,利用空间金字塔模型形成图像的直方图向量;
[0012] 将待分类图像的直方图向量输入到训练好的SVM模型,完成图像的分类。
[0013] 其中,所述SVM模型的训练过程,包括:
[0014] 对训练样本图像进行特征提取,得到所提取的特征点;
[0015] 对特征点进行聚类得到特征类型,并将特征点表述为其所属的特征类型;
[0016] 根据特征点所属的特征类型,利用空间金字塔模型形成图像的直方图向量;
[0017] 采用训练样本的直方图向量训练SVM模型。
[0018] 进一步地,所述对图像进行特征提取,得到所提取的特征点,包括:
[0019] 检测图像的尺度空间的极值点;
[0020] 过滤极值点得到特征点;
[0021 ]确定每个特征点的方向参数;
[0022] 生成特征点描述子,完成特征点的提取。
[0023] 进一步地,所述根据特征点所属的特征类型,利用空间金字塔模型形成图像的直 方图向量,包括:
[0024] 利用空间金字塔模型生成图像每个特征类型的直方图;
[0025]为特征类型的直方图添加权重;
[0026] 计算图像特征类型的权重直方图;
[0027] 根据图像每个特征类型的权重直方图,形成图像的直方图向量。
[0028]进一步地,所述采用训练样本的直方图向量训练SVM模型,包括:
[0029] 构建SVM训练核函数Ks?(xi,xj);
[0030] 选择惩罚因子,根据构建的SVM训练核函数求解以下最优化问题得到最优解(Λ
[0031]
[0032] 选择f的一个小于C的正分量CTy结合SVM训练核函数求解b'
[0033]
[0034]根据SVM训练核函数以及b*构建SVM模型的决策函数,完成SVM模型的训练,所述决 策函数为:
[0035]
[0036] 其中^是训练样本的第i个样本的特征向量直方图,716{1,-1}4 = 1,2,...,1是 与^对应的样本标记,同样的^是训练样本的第j个样本的特征向量直方图,,-i} J =1,2,.. .,1是与对应的样本标记,1表示训练样本的总数,sgn( ·)为符号函数,α〖为样 本对应的拉格朗日乘子,P表示分类阈值,ζ为待分类图像的直方图向量。
[0037] 所述SVM训练核函数KSVM(xi,xj)为:
[0038]
[0039] 其中,a是参数,W表示直方图向量的维度,= 是双伽马函数,I = Clp
[1,1,..,1]7表示全1列向量,维度为^1,0=[扮,02,...,&^表示狄利克雷概率分布模型 参数;
型,X表示直方图向量,diag(.)表示对角矩阵是一个三角伽马函数,Q表示全1向量,维度 为WX W,T表示转置。
[0041 ] 进一步地,所述构建SVM训练核函数Ks?(xi,xj),包括:
[0042] 将直方图向暈X输入到狄利克雷概率分布模型中:
[0043
[0044] 其中X表示直方图向量,W表示直方图向量的维度,β= [βι,β2, . . .,β?0τ表示狄利克 雷概率分布模型参数,) = 表示伽马函数;
[0045] 当狄利克雷概率分布模型的In似然函数获得最大值时,相应的模型参数使得模型 最合理,根据以下公式求得模型参数i3=[fo,fe,. . .,ft]T:
[0046]
[0047] 将β代入到狄利克雷概率分布模型中并计算狄利克雷概率分布模型的In似然函数 的梯度,将一个可变长度的直方图向量X变换成一个固定长度的向量H(x):
[0048]
[0049] %表示对β求梯度
:双伽马函数,I表示全1向量;
[0050] 对H(X)进行白化变换得到白化向量ψ (X):
[0051]
[0052] 示H(x)的协方差矩阵,diag(.)表示对角矩阵,是一个三角伽马函数,I表示全1向量,T表 示转置;
[0053] 从而构建SVM训练核函数KsvM(Xi,Xj)为:
[0054]
[0055]
[0056]
[0057]
[0058]进一步地,所述将待分类图像的直方图向量输入到训练好的SVM模型,完成图像的 分类,包括:
[0059]将待分类图像的直方图向量z输入到SVM模型的决策函数,当f (z) >0表示z为正样 本,f (z)<0表示z为负样本,f (z) =0不做判断。
[0060]本发明提出了一种基于词袋模型的图像分类方法,在处理分类的SVM分类器核函 数的选择上,结合了空间金字塔和狄利克雷概率分布的优点提出了新的核函数spro,SPPD 核函数不仅与原始特征保持了同样的维度,降低了计算难度,而且保留了局部特征间的空 间信息,提高了图像分类的精度,减少了分类时间。
【附图说明】
[0061 ]图1为本发明SVM模型的训练过程流程图;
[0062] 图2为本发明实施例利用空间金字塔模型生成图像每个特征类型的直方图示意 图;
[0063] 图3为本发明基于词袋模型的图像分类方法流程图。
【具体实施方式】
[0064]下面结合附图和实施例对本发明技术方案做进一步详细说明,以下实施例不构成 对本发明的限定。
[0065] 本实施例采用支持向量机SVM(Support Vector Machine)模型来进行图像分类, 首先需要采用训练样本训练学习得到SVM模型,然后采用学习得到的SVM模型对待分类的图 像进行分类。
[0066] 本实施例本实施例采用V0C2007数据集作为训练样本,来进行SVM模型训练。完成 SVM模型的训练过程如图1所示,包括步骤:
[0067] SOl:对训练样本图像进行特征提取,得到所提取的特征点。
[0068] 图像的特征提取,可以通过兴趣点检测、密集采样或随机采集,结合图割区域、显 著区域等方式获得图像的局部特征,例如SIFT或Dense-SIFT描述子。本实施例对训练样本 图像进行特征提取的具体步骤如下:
[0069] 1):检测训练样本图像的尺度空间的极值点。
[0070] 为了分析训练样本图像中各个局部特征的尺度,训练样本图像要通过一系列平滑 操作得到图像的尺度空间。这里图像的尺度空间定义为L(x,y,〇),它是由一个可变尺度的 二维高斯函数G(x,y,〇)和图像I(x,y)卷积得到的,公式如下:L(x,y,〇)=G(x,y,5)*I(x,y) [0071 ]这里*是指在X,y上的卷积操作,〇是尺度空间因子,且有:
[0072]
[0073]为了有效地检测尺度空间稳定的特征点的位置,常使用由DoG(Difference of Gauss i an)函数和图像做卷积而得到的尺度空间D (X,y,δ)进行极值检测。D(x,y, δ)可以通 过对两个相邻高斯尺度的图像相减获得。
[0074] D(x,y,〇) = (G(x,y,k〇)-G(x,y,5))*I(x,y)=L(x,y,k〇)-L(x,y,5)
[0075] 这里,k是常数,δ表示两相邻尺度空间的倍数。在进行局部极值点检测时,以像素 点为单位,将每个像素点与和它相同尺度且相邻的8个像素点以及相邻像素点对应位置的9 个点比较,因为相邻尺度有两个,因此是9*2 = 18个点。这样,每一个采样点与9*2+8 = 26个 点进行比较,只有该点的值比其对应的26个点的值都大或者都小的时候,该点才会被选择 为极值点。
[0076] 2):过滤极值点得到特征点。
[0077] 上面通过比较一个像素和它邻域的点确定了极值点,由于在金字塔中存在降采样 的图像,所以接下来要确定这个候选特征点的位置,尺度等信息。首先在某极值点对D(x,y, σ)进行泰勒展开:
[0078]
[0079] 其中X= (X,y,σ )τ是到该极值点的偏移量。对上式求导并令倒数等于〇,得到精确 的位置
[0080]
[0081 ]仕匕泣恆测到的攸但点甲,安云除低对比度的点和不稳定的边缘响应点。为了去 除低对比度的点,首先需要把公式②代入公式①,得到极值点处的极值:
[0082;
[0083]当f.在任一方向上的偏移大于0.5时,认为这个极值离其他的采样点更近,这个点 需要删除。假设图像的灰度范围是O到I.O之间,当极值|D(X)| < ο.03时,这样的点已受到 噪声的干扰,也要删除。
[0084] 现在我们需要去除不稳定的边缘响应点,一个相对平坦的DoG函数在横跨边缘的 时候会有较大的主曲率,在垂直的方向有较小的主曲率,主曲率可以通过Hessian矩阵计算 出:
[0085]
[0086] H的特征值与D的主曲率成正比,可以避免计算其具体的特征值,因为特征值的比 例才是我们所关心的。这里令α为较大的特征值,β为较小的特征值,有 [0087: .
[0088;
[0089;
[0090;
[0091] 我们给定r = 10。对于主曲率比值大于10的极值点被删除。
[0092] 在去除低对比度的点和不稳定的边缘响应点后,剩下的极值点作为提取的特征 点。
[0093] 3)确定每个特征点的方向参数。
[0094]为了实现图像的旋转不变性,需要根据检测到的特征点的图像局部结构确定一个 1古、比估田図伧從齒的古、比本步前図伧巨部娃诒的君古向
[0095]
[0096]
[0097] ΛΑ^πινχ,γ ;/TM〇vx,y ^ ι · ια·>^π ΗΛΙ mww/JtH'J 方向,σ是特征点的尺度值。
[0098] 4)生成特征点描述子,完成特征点的提取。
[0099]为了保证特征矢量具有旋转不变性,以特征点为中心,将特征点邻域内的梯度的 位置和方向旋转一个角度Θ。
[0100] 为了增强计算过程中的鲁棒性,以特征点为中心取16*16的邻域作为采样窗口,每 个小格代表特征点邻域所在尺度空间的一个像素,箭头代表该像素的梯度方向,箭头长度 代表梯度的大小。将采样点和特征点的相对方向通过高斯加权后归入包含8个bin的方向直 方图,最后获得4*4*8的128维特征向量,该特征向量通常称为SIFT描述子。
[0101] S02:对特征点进行聚类得到特征类型,并将特征点表述为其所属的特征类型。
[0102] 本步骤是在整个训练集上提取局部特征后,实用某种聚类算法将局部特征进行聚 类,每个聚类中心可以看作是视觉词典中的一个视觉单词,所有视觉单词形成一个视觉词 典。视觉单词相当于文本检索中的词,视觉单词由聚类中心对应特征形成的码字来表示。
[0103] 本实施例采用K-均值方法来进行聚类,本实施例中特征类型相当于词袋模型中的 视觉单词。具体步骤如下:
[0104] 1)对提取出的η个特征点的数据集,选取M个初始聚类中心μ」,j = l,2,3, . . .,M;
[0105] 2)计算每个特征点与聚类中心的距离D(xi,yj),i = l,2,3, ...,n,j = l,2,3,...M, 如果满足 0(Χ?,μ」)=π?η{0(Χ?,μ」),j = l,2,3, · · ·,n},则 Xiesj;其中S」(j = l,2,3, · · ·,M) 表示中心点为的第j个聚类类别。Xl表示属于类别&的数据点。本步的目的是通过计算每 个待分类的特征与聚类中心的距离,将η个数据集根据距离最小原则分到M个聚类中心的类 别中。
[0106] 3)计算误差平方和准则函数J并将每个簇的质 心作为新的聚类中心。
[0107] 4)重复计算S02和S03,直到J。的值不变或者迭代次数达到设定的次数为止,例如 150次为止。
[0108] 5)通过前四个步骤,将所有特征点聚类成了M个特征类型W,...,yKeR D。
[0109] 然后从所有特征类型中选出距离特征点沿最近的前5个特征类型
[0110] 6)将特征点编码为其所属的特征类型。
[0111] 本发明采用KCB编码方法,将特征点^编码成如下形式:
[0112]
[0113] 3为参数,本实施例o = 〇.〇〇〇l。
[0114] 编码的目的是在特征类型空间中,寻找与特征点^最近的前5个特征类型并进行 加权,然后用这些加权特征类型来重新表述特征点。
[0115] S03:根据特征点所属的特征类型,利用空间金字塔模型形成图像的直方图向量。
[0116] 具体步骤如下:
[0117] 1)利用空间金字塔模型生成图像每个特征类型的直方图。
[0118] 将图像从像素空间上分为L层,随着层数的增加,图像被分割成一些越来越精细的 子区域(在本发明中,取L = 3,分辨率分别为1*1,2*2,4*4)。在每个特征类型上,通过计算特 征点落入每个子区域的数目来形成直方图,然后所有子区域的直方图被连接成一个大的 特征向量hm。
[01 19] hm= [hlN(l) ,h21, . . . ,h2N(2) ,h31, . . . ,hij , . . . ,hLN(L)]
[0120] 对任何一个特征类型而言,N(i)表示第i层子区域的总数。hu表示第i层第j个子区 域。1^的维度为d X Uhm表示图像的第m个特征类型的直方图。
[0121] 如图2所示,假设图像中有三种特征类型,图2中表示为黑色圆点、菱形框和加号。 对于黑色圆点而言,在第一层上有11个黑色圆点落入到子区域中,然后就在这个子区间上 形成直方图,直方图的高度为11,如图2中最左边图像下的黑色直条所示,同样的对于菱形 框和加号对应的特征类型的直方图,分别为白色直条和灰色直条。在第二层和第三层上的 特征类型的直方图分别如图2中间和右边的图形所示,这里不再赘述。
[0122] 2)为特征类型的直方图添加权重。
[0123] 为匕的每个直方图添加如下的权重:
[0124] O111= [ ω η,ω 21,· · ·,"2Ν(2),ω 31,· · ·,ω ij,· · ·,ω ln(l)]T
[0125] ωΜ表示图像的第m个特征类型的权重。〇^的维度为NXl。权重可以通过以下公式 获得:
[0126]
[0127] 兵甲_] = 1,2, ...,Ν(ι)。COij表示第i层第j个子区域的权重。
[0128] 3)计算图像特征类型的权重直方图。
[0129] 第m个特征类型的权重直方图拥有如下的形式:Fm=hmc〇m。因为我们有M个特征类 型,所以我们可以得到M个特征类型的直方图集合以及所对应的权重集合:
[0130] h={hi,h2, · · ·,hm,· · ·,1ιμ}
[0131] ω ={ ωχ, ω2, . . . , 〇m, . . . , ωΜ}
[0132] 进一步,我们得到M个特征类型的权重直方图:
[0133] F={Fi,F2, . . . ,Fm, . . . ,Fm}
[0134] 4)根据图像每个特征类型的权重直方图,形成图像的直方图向量。
[0135] 对于L层M个特征类型的图像而言,最终的直方图向量z的维度为dMXl。图像的直 方图向量Z为:
[0136]
[0137] S04:采用训练样本的直方图向量训练SVM模型。
[0138] 具体包括如下步骤:
[0139] 01)、构建SVM训练核函数。
[0140] 本发明提出一种新的核函数,spro核函数,它与原始特征保持了同样的维度,降低 了 SVM模型的计算复杂度。本实施例通过如下方法得到SVM核函数:
[0141] 将直方图向量X输入到狄利克雷概率分布模型中,得到直方图向量的狄利克雷概 率分布
[0142]
[0143] 其中X表示直方图向量,W表示直方图向量的维度,β= [β?,β2, . . .,β?0Τ表示狄利克 雷概率分布模型参数,「(/) = £> 表示伽马函数。
[0144]根据概率论与数理统计的相关理论,当狄利克雷概率分布模型的In似然函数获得 最大值时,相应的模型参数可以使得模型最合理,根据以下公式求得模型参数β=[仏, &,. . .,0W]T:
[0145]
[0146] 将β代入到狄利克雷概率分布模型中并计算狄利克雷概率分布模型的In似然函数 的梯度,将一个可变长度的直方图向量X变换成一个固定长度的向量H(X)。
[0147]
[0148] 全1列向量,维度为WX1。
[0149] 白化变换是一种去相关的变换,它可以消除维度间的相关性,减小数据的冗余,对 H(x)进行白化变换得到白化向量Ψ (X)。
[0150]
[0151] 表示H (X)的协方差矩阵,d iag (.)表示对角矩阵,《是一个三角伽马函数,Q表示全1向量,维 度为WX W,T表示转置。
[0152]
[0153]
[0154]
[0155] 为 ln(x
[0156]
[0157] 02)、选择惩罚因子,构造并求解以下最优化问题,得到最优解c/ = (?,.,.,%
[0158] 惩罚因子C表示对分类错误的样本的重视程度,C值越大表示出现分类错误的样本
越少,该值一船龙1 核函数以及惩罚因子C,构造并求解以下最优化 问题,得到:!
[0159]
[0160] 其中Xi是训练样本的第i个样本的特征向量直方图,yie{_l,-l丨,1 = 1,2,...,1是 与^对应的样本标记。同样的^是训练样本的第j个样本的特征向量直方图,,-i} J = 1,2, ...,1是与Xj对应的样本标记,1表示训练样本的总数。
[0161] 03)、选择α*的一个小于C的正分量α)结合SPPD核函数求解b*:
[0162]
[0163] 的决策函数,完成SVM模型的训练。
[0164]
[0165] 其中sgn( ·)为符号函数,<为样本对应的拉格朗日乘子,1/表不分类阈值,Xi是训 练样本的第i个样本,71£{1,-1}4 = 1,2,...,1是与^对应的样本标记,2为待分类图像的 直方图向量。
[0166] 在训练完成SVM模型后,采用训练得到的SVM模型对待分类的图像进行分类,如图3 所示,具体包括步骤:
[0167] FOl、对待分类图像进行特征提取,得到所提取的特征点;
[0168] F02、对特征点进行聚类得到特征类型,并将特征点表述为其所属的特征类型;
[0169] F03、根据特征点所属的特征类型,利用空间金字塔模型形成图像的直方图向量; [0170] F04、将待分类图像的直方图向量输入到训练好的SVM模型,完成图像的分类。
[0171] 其中步骤R)1、F02、F03与SVM模型训练中的步骤S01、S02、S03相同,这里不再赘述。 从而通过步骤FOl、F02、F03得到待分类图像的直方图向量z。最后将直方图向量z输入到SVM 模型中,完成图像的分类。
[0172]即将待分类图像的直方图向量z输入到SVM模型的决策函数,当f(z)>0表示z为正 样本,f (z)<0表示z为负样本,f (z) =0不做判断。
[0173] 在V0C2007数据集上进行实验的结果如表1所示,给出六种方法(SPPD,Homker,JS+ ?0,51疆4,此,1^11 6&〇在每一类别的分类精度值,并且对每一类别中分类精度最高的数值 进行加粗表示,最后通过mAP(mean average precisions)值来衡量每种方法的分类精度。
[0174] 从表1中可以清楚的看到,五种方法的m A P值均在基本线性核的m A P值之上,在 V0C2007数据集中,使用SPH)核的方法的mAP值比其他方法的mAP值要好,获得了20个类别中 的19个类别的分类最佳效果。具体地说,在V0C2007数据集的Motorbike类别中,SPPD核的 mAP值比JS+PQ核的mAP值高0.3194,比SIKMA核的mAP值高0.2311,比MKL方法的mAP值高 0 · 2105,比 Homker 核的 mAP 值高 0 · 1885。
[
[0177] 表1
[0178] 根据PASCAL V0C2007的官方申明,准确率/查全率(prec i s ion/reca11)曲线提供 了比ROC曲线更加直观以及更加敏感的评估性能。采用准确率/查全率曲线分析不同方法的 分类表现。在实验中,希望查询到的相关图像越多越好即准确率越高越好。同样的,希望查 询到的图像越多越好即查全率越高越好。但是实际应用中,它们是相互制约的。以查全率为 横坐标,准确率为纵坐标绘制查全率/准确率曲线。如果一种分类方法所绘制出的PR曲线最 靠近右上角(即查全率与准确率最高)时,则该分类方法是所有方法中分类效果最好的。为 了获得真实、令人信服的结果,本实施例每个实验重复运行5次,通过比较6种方法在数据集 V0C2007上的PR曲线,可得本实施例的SPH)核优于其他核。
[0179] 以上实施例仅用以说明本发明的技术方案而非对其进行限制,在不背离本发明精 神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变 形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
【主权项】
1. 一种基于词袋模型的图像分类方法,其特征在于,所述图像分类方法包括: 对待分类图像进行特征提取,得到所提取的特征点; 对特征点进行聚类得到特征类型,并将特征点表述为其所属的特征类型; 根据图像特征点所属的特征类型,利用空间金字塔模型形成图像的直方图向量; 将待分类图像的直方图向量输入到训练好的SVM模型,完成图像的分类。2. 根据权利要求1所述的图像分类方法,其特征在于,所述SVM模型的训练过程,包括: 对训练样本图像进行特征提取,得到所提取的特征点; 对特征点进行聚类得到特征类型,并将特征点表述为其所属的特征类型; 根据特征点所属的特征类型,利用空间金字塔模型形成图像的直方图向量; 采用训练样本的直方图向量训练SVM模型。3. 根据权利要求1或2所述的图像分类方法,其特征在于,所述对图像进行特征提取,得 到所提取的特征点,包括: 检测图像的尺度空间的极值点; 过滤极值点得到特征点; 确定每个特征点的方向参数; 生成特征点描述子,完成特征点的提取。4. 根据权利要求1或2所述的图像分类方法,其特征在于,所述根据特征点所属的特征 类型,利用空间金字塔模型形成图像的直方图向量,包括: 利用空间金字塔模型生成图像每个特征类型的直方图; 为特征类型的直方图添加权重; 计算图像特征类型的权重直方图; 根据图像每个特征类型的权重直方图,形成图像的直方图向量。5. 根据权利要求2所述的图像分类方法,其特征在于,所述采用训练样本的直方图向量 训练SVM模型,包括: 构建SVM训练核函数KsvM(xi,xj); 选择惩罚因子,根据构建的SVM训练核函数求解W下最优化问题得到最优解0<ai<C,i = l,2,...,l 选择勺一个小于C的正分量α;:错合SVM训练核函数求解护:根据SVM训练核函数W及b*构建SVM模型的决策函数,完成SVM模型的训练,所述决策函 数为:其中XI是训练样本的第i个样本的特征向量直方图,71^{1,-1}4 = 1,2,...,1是与又1 对应的样本标记,同样的^是训练样本的第j个样本的特征向量直方图,yjE{l,-l},j = l, 2,. . .,1是与^对应的样本标记,1表示训练样本的总数,S即(·)为符号函数,<为样本对 应的拉格朗日乘子,b^表示分类阔值,z为待分类图像的直方图向量。6. 根据权利要求5所述的图像分类方法,其特征在于,所述SVM训练核函数Lsvm(Xi,Xj) 为:其中,a是参数,W表示直方图向量的维度是双伽马函数,1 = [1, 1,. .,1]τ表示全1列向量,维度为WX 1,β=[βι,β2,...,执〇τ表示狄利克雷概率分布模型参 数; 其中Vg表示 对0求梯度为直方图向量的狄利克雷概率分布模型,X表 示直方图向量,diag(.)表示对角矩阵,口'是一个Ξ角伽马函数,Q表示全1向量,维度为WX W,T表示转置。7. 根据权利要求6所述的图像分类方法,其特征在于,所述构建SVM训练核函数KsvM( XI, Xj),包括: 将直方图向量X输入到狄利克雷概率分布模型中:其中X表示直方图向量,W表示直方图向量的维度,β=[βι,&,...,执〇τ表示狄利克雷概 率分布模型参数:受:表示伽马函数; 当狄利克雷概率分布模型的In似然函数获得最大值时,相应的模型参数使得模型最合 理,根据W下公式求得模型参数0=[01,&,...,阮]T:将β代入到狄利克雷概率分布模型中并计算狄利克雷概率分布模型的In似然函数的梯 度,将一个可变长度的直方图向量X变换成一个固定长度的向量H(x):表示对β求梯度,其牛曼双伽马函数,I = [ 1,1,. .,1 ]Τ表示全1列 向量,维度为wxi; 对H(x)进行白化变换得到白化向量ψ(χ):其中表示Η(χ) 的协方差矩阵,diag(.)表示对角矩阵,口'是一个Ξ角伽马函数,Q表示全1向量,维度为WX W, T表示转置; 从而构建SVM训练核函数KsvM(xi,xj)为:其中Xi与X康不直方图向量; 使用参数a将ln(x)优化为ln(x+a),构建的SVM核函数为:8.根据权利要求5所述的图像分类方法,其特征在于,所述将待分类图像的直方图向量 输入到训练好的SVM模型,完成图像的分类,包括: 将待分类图像的直方图向量Z输入到SVM模型的决策函数,当f(z)>0表示Z为正样本,f (z)<0表示z为负样本,f(z)=0不做判断。
【文档编号】G06K9/62GK105844299SQ201610171326
【公开日】2016年8月10日
【申请日】2016年3月23日
【发明人】桂江生, 张青, 包晓安
【申请人】浙江理工大学