一种图像的特征提取方法、图像的分类方法及相关装置制造方法

文档序号:6514340阅读:242来源:国知局
一种图像的特征提取方法、图像的分类方法及相关装置制造方法
【专利摘要】本发明公开了一种图像的特征提取方法及装置,用以实现提取出的特征向量能够准确反映未进行缩放处理的图像的特征。本发明不需要对图像进行缩放,可以直接对原始图像进行分块,并根据分块得到的各图像块的特征向量,就可以确定原始图像的特征向量。针对单个待提取特征的图像而言,由于可以对针对该图像而获得的聚类中心的个数进行设定,从而可以实现从该图像中提取出特定长度的特征向量;而针对多个分辨率不同的待提取特征的图像而言,由于针对不同待提取特征的图像而获得的聚类中心的个数是相等的,从而可以实现从具备不同分辨率的图像中提取到相同长度的特征向量。本发明还公开了一种图像的分类方法及装置。
【专利说明】一种图像的特征提取方法、图像的分类方法及相关装置

【技术领域】
[0001]本发明涉及信息处理领域,尤其涉及一种图像的特征提取方法、图像的分类方法及相关装置。

【背景技术】
[0002]现有技术中,在对图像进行特征向量提取时,为了从不同图像中提取出相同长度的特征向量,或者从某个图像中提取出特定长度的向量,通常都要先将不同分辨率的图像缩放为特定分辨率的图像;然后再应用某种特征提取方法对这些经过缩放处理的图像进行特征向量的提取。然而,由于在对图像进行缩放处理时,会不可避免的导致图像产生一些形变,从而导致从产生了形变的图像中提取出的特征向量不能很准确地反映相应的未进行缩放处理的原始图像的特征。


【发明内容】

[0003]本发明实施例提供一种图像的特征提取方法及装置,用以解决现有技术中存在的为了从图像中提取出特定长度的特征向量而对图像进行缩放处理,使得从产生了形变的图像中提取出的特征向量不能很准确地反映相应的未进行缩放处理的原始图像的特征的问题。
[0004]本发明实施例还提供一种图像的分类方法及装置。
[0005]本发明实施例采用以下技术方案:
[0006]一种图像的特征提取方法,包括:
[0007]为图像集合中每个图像所包括的图像块分配图像块标识;其中,每个图像中的图像块是按照相同规则划分得到的;在同一个图像中,不同图像块的图像块标识不同;在不同图像中,处于相同位置的图像块的图像块标识相同;所述图像集合包含至少两个图像,且所述至少两个图像中至少存在一个待提取特征向量的图像;以及
[0008]分别针对每个由具备相同图像块标识的所有图像块构成的图像块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像块集合中的各图像块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;
[0009]以及针对该图像块集合中的待提取特征向量的图像的各图像块分别执行:从所述聚类中心集合中,为该图像块的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像块的特征描述向量的个数;
[0010]针对每个所述待提取特征向量的图像执行:根据针对该待提取特征向量的图像的具备不同图像块标识的各图像块所分别确定出的所有所述特定个数的信息,确定该待提取特征向量的图像的特征向量;
[0011]其中,当所述图像集合中包含多个图像,且仅包含一个待提取特征向量的图像时,针对不同的所述图像块集合而获得的所述聚类中心集合所包含的聚类中心的总个数等于规定个数。
[0012]一种图像的分类方法,包括:
[0013]获得待提取特征向量的图像的特征向量;
[0014]根据图像分类器和确定出的所述待提取特征向量的图像的特征向量,确定所述待提取特征向量的图像所属的图像类别;
[0015]其中,所述图像分类器是根据对各图像样本的特征向量进行分类训练得到的;且每个图像样本的特征向量的确定方式如下:
[0016]为每个图像样本所包括的图像样本块分配图像样本块标识;其中,每个图像样本中的图像样本块是按照所述规则划分得到的;在同一个图像样本中,不同图像样本块的图像样本块标识不同;在不同图像样本中,处于相同位置的图像样本块的图像样本块标识相同;
[0017]分别针对每个由具备相同图像样本块标识的所有图像样本块构成的图像样本块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像样本块集合中的各图像样本块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像样本块集合中的各图像样本块分别执行:从所述聚类中心集合中,为该图像样本块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像样本块的特征描述向量的个数;
[0018]针对每个所述图像样本执行:根据针对该图像样本的具备不同图像块标识的各图像样本块所分别确定出的所有所述特定个数的信息,确定该图像样本的特征向量;
[0019]其中,针对所述待提取特征向量的图像的各图像块而分别获得的聚类中心集合所包含的聚类中心的个数之和等于针对任意图像样本的各图像样本块而分别获得的聚类中心集合所包含的聚类中心的个数之和。
[0020]一种图像的特征提取装置,包括:
[0021]标识分配单元,用于为图像集合中每个图像所包括的图像块分配图像块标识;其中,每个图像中的图像块是按照相同规则划分得到的;在同一个图像中,不同图像块的图像块标识不同;在不同图像中,处于相同位置的图像块的图像块标识相同;所述图像集合包含至少两个图像,且所述至少两个图像中至少存在一个待提取特征向量的图像;
[0022]特定个数信息确定单元,用于分别针对每个由具备相同由标识单元分配的图像块标识的所有图像块构成的图像块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像块集合中的各图像块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像块集合中的待提取特征向量的图像的各图像块分别执行:从所述聚类中心集合中,为该图像块的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像块的特征描述向量的个数;
[0023]特征向量确定单元,用于针对每个所述待提取特征向量的图像执行:根据针对该待提取特征向量的图像的具备不同图像块标识的各图像块所分别确定出的所有所述特定个数的信息,确定该待提取特征向量的图像的特征向量;
[0024]其中,当所述图像集合中包含多个图像,且仅包含一个待提取特征向量的图像时,针对不同的所述图像块集合而获得的所述聚类中心集合所包含的聚类中心的总个数等于规定个数。
[0025]一种图像的分类装置,包括:
[0026]特征向量获得单元,用于获得待提取特征向量的图像的特征向量;
[0027]图像类别确定单元,用于根据图像分类器和特征向量获得单元获得的特征向量,确定所述待提取特征向量的图像所属的图像类别;
[0028]其中,所述图像分类器是根据对各图像样本的特征向量进行分类训练得到的;且每个图像样本的特征向量的确定方式如下:
[0029]为每个图像样本所包括的图像样本块分配图像样本块标识;其中,每个图像样本中的图像样本块是按照所述规则划分得到的;在同一个图像样本中,不同图像样本块的图像样本块标识不同;在不同图像样本中,处于相同位置的图像样本块的图像样本块标识相同;
[0030]分别针对每个由具备相同图像样本块标识的所有图像样本块构成的图像样本块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像样本块集合中的各图像样本块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像样本块集合中的各图像样本块分别执行:从所述聚类中心集合中,为该图像样本块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像样本块的特征描述向量的个数;
[0031]针对每个所述图像样本执行:根据针对该图像样本的具备不同图像块标识的各图像块所分别确定出的所有所述特定个数的信息,确定该图像样本的特征向量;
[0032]其中,针对所述待提取特征向量的图像的各图像块而分别获得的聚类中心集合所包含的聚类中心的个数之和等于针对任意图像样本的各图像样本块而分别获得的聚类中心集合所包含的聚类中心的个数之和。
[0033]本发明实施例的有益效果如下:
[0034]本发明实施例提供的该方案不需要对图像进行缩放,可以直接对原始图像进行分块,并根据分块得到的各图像块的特征向量,就可以确定原始图像的特征向量。针对单个待提取特征的图像而言,由于可以对针对该图像而获得的聚类中心的个数进行设定,从而可以实现从该图像中提取出特定长度的特征向量;而针对多个分辨率不同的待提取特征的图像而言,由于针对不同待提取特征的图像而获得的聚类中心的个数是相等的,从而可以实现从具备不同分辨率的图像中提取到相同长度的特征向量。

【专利附图】

【附图说明】
[0035]图1为本发明实施例提供的一种图像的特征提取方法的流程图;
[0036]图2为本发明实施例提供的一种图像的特征提取方法的具体应用流程图;
[0037]图3为本发明实施例提供的一种图像的分类方法的流程图;
[0038]图4为本发明实施例提供的一种图像的特征提取装置的结构示意图;
[0039]图5为本发明实施例提供的一种图像的分类装置的结构示意图。

【具体实施方式】
[0040]为了解决现有技术中存在的为了从图像中提取出特定长度的特征向量而对图像进行缩放处理,使得从产生了形变的图像中提取出的特征向量不能很准确地反映相应的未进行缩放处理的原始图像的特征的问题,本发明实施例提供了一种图像的特征提取方案。该方案不需要对图像进行缩放,可以直接对原始图像进行分块,并根据分块得到的各图像块的特征向量确定原始图像的特征向量。针对单个待提取特征的图像而言,由于该方案可以对针对该图像而获得的聚类中心的个数进行设定,从而可以实现从该图像中提取出特定长度的特征向量;而针对多个分辨率不同的待提取特征的图像而言,由于该方案针对不同待提取特征的图像而获得的聚类中心的个数是相等的,从而可以实现从具备不同分辨率的图像中提取到相同长度的特征向量。
[0041]以下结合说明书附图对本发明的实施例进行说明,应当理解,此处所描述的实施例仅用于说明和解释本发明,并不用于限制本发明。并且在不冲突的情况下,本说明中的实施例及实施例中的特征可以互相结合。
[0042]首先,本发明实施例提供了一种图像的特征提取方法,该方法的实现流程图如图1所示,主要包括下述步骤:
[0043]步骤11,为图像集合中每个图像所包括的图像块分配图像块标识,其中,这里所说的图像集合包含至少两个图像,且所述至少两个图像中至少存在一个待提取特征向量的图像;
[0044]上述每个图像中的图像块是按照相同规则划分得到的,从而每个图像块中的图像块的个数是相同的。
[0045]本发明实施例中,为图像块分配图像块标识的规则需要达到下述目标:
[0046]在同一个图像中,不同图像块的图像块标识不同;在不同图像中,处于相同位置的图像块的图像块标识相同。
[0047]步骤12,分别针对每个由具备相同图像块标识的所有图像块构成的图像块集合执行:分别提取该图像块集合中的各图像块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同类别的特征描述向量的聚类中心构成的聚类中心集合;
[0048]其中,当该图像集合中包含多个图像,且仅包含一个待提取特征向量的图像时,针对不同的图像块集合而获得的聚类中心集合所包含的聚类中心的总个数等于规定个数。
[0049]本发明实施例中,图像块的特征描述向量一般是指图像块的特征点的特征描述向量。比如,可以采用尺度不变特征变换匹配(Scale Invariant Feature Transform, SIFT)或加速鲁棒特征(Speeded Up Robust Features, SURF)等的特征描述向量提取方法,从图像块中确定特征点,并提取特征点的特征描述向量。一般地,“特征点”是指无论其所在的图像如何变换(比如图像进行旋转、分辨率改变等等),其周围区域的特征(比如灰度等特征)都不会发生较大变化的像素点。由于采用SIFT或SURF等方法提取特征描述向量的技术已是现有的比较成熟的技术,因此本发明实施例对此部分技术特征的具体实现方式不再进行赘述。
[0050]需要说明的是,步骤13中对于具备相同图像块标识的不同图像块需要采用相同的特征描述向量提取方法,以保证从不同图像块中提取出的特征描述向量的长度一致,从而使得不同的特征描述向量之间具有可比性,能够进行聚类。
[0051]而对于具备不同标识的图像块而言,提取其特征描述向量时所采用的特征描述向量提取方法则可以相同也可以不同。
[0052]步骤13,针对步骤12中的图像块集合中的各图像块分别执行:从获得的聚类中心集合中,为该图像块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对该聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;
[0053]其中,这里所说的特定个数为与该聚类中心相似度最大的该图像块的特征描述向量的个数。
[0054]步骤14,针对每个待提取特征向量的图像执行:根据针对该待提取特征向量的图像的具备不同图像块标识的各图像块所分别确定出的所有的上述特定个数的信息,确定该待提取特征向量的图像的特征向量。
[0055]通过本发明实施例提供的技术方案,针对单个待提取特征的图像而言,由于可以对针对该图像而获得的聚类中心集合所包含的聚类中心的个数(即前文所述的规定个数)进行设定,从而可以实现在不对图像的分辨率进行调整的前提下,也可以从该图像中提取出特定长度的特征向量;而针对多个分辨率不同的待提取特征的图像而言,由于针对不同待提取特征的图像而获得的聚类中心集合所包含的聚类中心的个数是相等的,从而可以实现在不对图像的分辨率进行调整的前提下,也可以从具备不同分辨率的图像中提取到相同长度的特征向量。
[0056]以下介绍本发明实施例提供的上述方法在实际中的一种具体应用流程。该应用流程包括如图2所示的下述步骤:
[0057]步骤21,针对图像集合中的各图像分别执行:将该图像划分为分别对应图像的不同区域的多个图像块;
[0058]其中,划分得到的多个图像块的个数等于第一规定个数;该图像集合包含多个图像,且至少包含一个待提取特征向量的图像。
[0059]在本发明实施例中,假设图像集合中包含M个图像,可以对该M个图像中的各图像分别执行:将该图像划分为4个图像块,且这4个图像块所在的图像区域可以按照预设的方式分别标识为区域1、区域2、区域3和区域4。本发明实施例中,不同图像块所在的区域可以完全不重叠,也可以有部分重叠。
[0060]步骤22,根据预先设置的图像的区域与图像块标识的对应关系,为对各图像划分得到的各图像块分别分配图像块标识;
[0061]具体地,可以将所在的图像区域为区域I的各图像的图像块均标识为1,将所在的图像区域为区域2的各图像的图像块均标识为2,将所在的图像区域为区域3的各图像的图像块均标识为3,将所在的图像区域为区域4的各图像的图像块均标识为4。这样,每个图像都包含标识分别为1、2、3和4的4个图像块,且具备相同图像标识块的所有图像块可以构成一个图像块集合,从而一共可以构成4个图像块集合。其中,每个图像块集合包含M个图像块。
[0062]步骤23,分别提取各图像块集合中的各图像块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;
[0063]在本发明实施例中,可以按照指定的特征描述向量提取方法对各图像块集合的各图像块提取特征描述向量,比如采用尺度不变特征变换匹配(Scale InvariantFeature Transform, SIFT)的特征描述向量提取方法或加速鲁棒特征(Speeded Up RobustFeatures,SURF)的特征描述向量提取方法,分别从各图像块集合的各图像块中提取特征点的特征描述向量;然后,针对每个图像块集合都执行:对提取到的该图像块集合中的各图像块中的特征点的特征描述向量进行聚类,得到相应的聚类中心集合。为了便于描述,针对包含的图像块的标识为I的图像块集合而言,可以将得到的相应的聚类中心集合所包含的聚类中心的个数记为K1,类似地,针对包含的图像块的标识为i的图像块集合而言,可以将得到的相应的聚类中心集合所包含的聚类中心的个数记为Ki (i为图像块标识)。以每个图像都包含标识分别为1、2、3和4的4个图像块的图像集合为例,相应的4个图像块集合所分别对应的聚类中心个数Kl?K4可以相等也可以不相等。其中,每个聚类中心都是一个向量,且与特征点的特征描述向量长度相等。
[0064]步骤24,针对待提取特征向量的图像的每个图像块分别执行:从上述聚类中心集合中,为该图像块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对该聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,该特定个数为与该聚类中心相似度最大的该图像块的特征描述向量的个数;
[0065]具体地,针对待提取特征向量的图像的某个标识为i的图像块而言,可以分别对该图像块的各特征描述向量和该图像块所在的图像块集合所对应的Ki个聚类中心进行比较,从而确定分别与各特征描述向量相似度最大的各聚类中心。
[0066]例如,针对标识为I的图像块集合中的某个图像块1,假设该图像块I包含NI个特征描述向量,将这NI个特征描述向量分别与该图像块集合所对应的Kl个聚类中心逐一进行比较,计算每个特征描述向量与各聚类中心之间的距离,若假设特征描述向量X与特征描述向量Y都距离聚类中心A最近(相对其他聚类中心而言),则可以把这两个特征描述向量归为与聚类中心A同属同一个类别,即可以将特征描述向量X与特征描述向量Y分类结果均视为A。
[0067]然而,若特征描述向量X与该聚类中心A之间的距离的绝对值较大,而特征描述向量Y与该聚类中心之间的距离的绝对值较小。那么,虽然将这两个特征向量都归为聚类中心A所属类别,但是,可以通过为特征描述向量X的分类结果分配权重值0.1,而为特征描述向量Y的分类结果分配权重值0.9的方式,将这两个特征描述向量的分类结果调整为0.1*A和0.9*A。类似地,对于每个特征描述向量的分类结果,都可以采用上述方式来进行调整,从而通过对调整后的分类结果的统计,就可以得到各聚类中心的加权值,如得到2.5A、3B和
1.2C,其中,2.5、3、1.2分别表征了与聚类中心A、B、C相似度最大的图像块I的特征描述向量的个数的信息。
[0068]在本发明实施例中,为了较直观的体现图像块的特征描述向量与相应的聚类中心的比较结果,可以建立针对图像块的聚类中心统计直方图。具体地,将某个图像块I的所有特征描述向量与Kl个聚类中心进行比较,得到每个聚类中心所分别对应的的加权值。那么,以这Kl个聚类中心为横坐标,以Kl个聚类中心中的每一个聚类中心所对应的加权值作为纵坐标,就可以建立该图像块I的聚类中心统计直方图。类似的,对待提取特征向量的图像的每一个图像块都执行上述操作,可以得到相应的聚类中心统计直方图。
[0069]步骤25,确定每个待提取特征向量的图像的特征向量;
[0070]针对每个待提取特征向量的图像执行:根据针对该待提取特征向量的图像的具备不同图像块标识的各图像块所分别确定出的所有特定个数的信息,确定该待提取特征向量的图像的特征向量。
[0071]例如,针对单个待提取特征向量的图像m,假设该图像m共包含4个图像块,且针对该4个图像块所分别建立的聚类中心统计直方图的维数分别为:K1、Κ2、Κ3和Κ4,那么,就可以将这4个统计直方图组合成一个Κ1+Κ2+Κ3+Κ4维的统计直方图作为该图像m的统计直方图,该统计直方图所表示的向量即为图像m的特征向量。
[0072]虽然每个待提取特征向量的图像的各图像块所分别包含的特征点数目可能会不一致,但是由于针对各待提取特征向量的图像的不同图像块所属的图像块集合而分别获得的聚类中心之和是相同的,因此对于不同的待提取特征向量的图像而言,其分别包含的具备不同标识的各图像块所对应的聚类中心统计直方图的维数之和是相等的,从而保证了最终得到的每个待提取特征向量的图像的特征向量的长度是一致的。
[0073]可选的,在本发明实施例中,若待提取特征向量的图像同属同一类别,且需要提取待提取特征向量的图像的共性特征,则可以进一步执行下述步骤26 ;或者,若待提取特征向量的图像分属不同类别,且需要提取各类别的待提取特征向量的图像的共性特征,则也可以进一步执行下述步骤26。
[0074]步骤26,将得到的每个待提取特征向量的图像的特征向量进行模式识别训练,获得相应类别的共性特征。
[0075]具体的模式识别训练方式有多种,比如聚类和线性判别分析等。由于该些方式均为现有技术中比较成熟的技术,在此不再赘述。
[0076]通过本发明实施例提供的技术方案在实际中的上述应用流程可知,针对多个分辨率不同的待提取特征的图像而言,由于针对不同待提取特征的图像而获得的聚类中心的个数是相等的,从而可以实现从具备不同分辨率的图像中提取到相同长度的特征向量,而无需对图像进行缩放处理,进而也就保证图像特征的完整性,使得提取到的特征向量能够准确地反映未进行缩放处理的图像的特征。
[0077]以下介绍本发明实施例提供的一种图像的分类方法,该方法的实现流程图如图3所示,主要包括下述步骤:
[0078]步骤31,获得按照步骤11?步骤15所述的方法确定的待提取特征向量的图像的特征向量。
[0079]步骤32,根据图像分类器和确定出的待提取特征向量的图像的特征向量,确定待提取特征向量的图像所属的图像类别;
[0080]具体的,以通过线性判别分析而得到的图像分类器为例:该图像分类器会保存一个投影矩阵,然后根据该图像分类器可以识别的各图像类别的聚类中心和该投影矩阵,得到与各图像类别对应的投影中心。以步骤31确定的某个待提取特征向量的图像的特征向量为例,将该特征向量输入图像分类器,图像分类器首先利用该投影矩阵,得到该特征向量所对应的投影向量;然后通过将该投影向量与上述各图像类别对应的投影中心进行逐一比较,分别确定该投影向量与各图像类别对应的投影中心的距离;最后,选择与该投影向量距离最近的那个投影中心所对应的图像类别作为该图像的图像类别。
[0081]其中,所述图像分类器是根据对各图像样本的特征向量进行分类训练得到的;且每个图像样本的特征向量可以按照上述特征提取方法确定,具体如下:
[0082]为每个图像样本所包括的图像样本块分配图像样本块标识;其中,每个图像样本中的图像样本块是按照前文所述的规则划分得到的;在同一个图像样本中,不同图像样本块的图像样本块标识不同;在不同图像样本中,处于相同位置的图像样本块的图像样本块标识相同;上述每个图像样本中的图像样本块是按照相同规则划分得到的,从而每个图像样本块中的图像样本块的个数是相同的,并且,该个数与待提取特征向量的图像的图像块个数相同;
[0083]分别针对每个由具备相同图像样本块标识的所有图像样本块构成的图像样本块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像样本块集合中的各图像样本块的特征向量,并通过对提取的所有特征向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像样本块集合中的各图像样本块分别执行:从获得的聚类中心集合中,为该图像样本块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对该聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,特定个数为与该聚类中心相似度最大的该图像样本块的特征描述向量的个数;
[0084]针对每个所述图像样本执行:根据针对该图像样本的具备不同图像块标识的各图像样本块所分别确定出的所有特定个数的信息,确定该图像样本的特征向量;
[0085]其中,针对所述待提取特征向量的图像的各图像块而分别获得的聚类中心集合所包含的聚类中心的个数之和等于针对任意图像样本的各图像样本块而分别获得的聚类中心集合所包含的聚类中心的个数之和。
[0086]出于与本发明实施例提供的图像的特征提取方法相同的发明构思,本发明实施例还提供一种图像的特征提取装置。该装置的具体结构示意图如图4所示,其具体包括如下功能单元:
[0087]标识分配单元41,用于为图像集合中每个图像所包括的图像块分配图像块标识;其中,每个图像中的图像块是按照相同规则划分得到的;在同一个图像中,不同图像块的图像块标识不同;在不同图像中,处于相同位置的图像块的图像块标识相同;图像集合包含至少两个图像,且至少两个图像中至少存在一个待提取特征向量的图像;
[0088]特定个数信息确定单元42,用于分别针对每个由具备相同由标识单元分配的图像块标识的所有图像块构成的图像块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像块集合中的各图像块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像块集合中的待提取特征向量的图像的各图像块分别执行:从获得的聚类中心集合中,为该图像块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对该聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,该特定个数为与该聚类中心相似度最大的该图像块的特征描述向量的个数;
[0089]特征向量确定单元43,用于针对每个待提取特征向量的图像执行:根据特定个数信息确定单元42针对该待提取特征向量的图像的具备不同图像块标识的各图像块所分别确定出的所有特定个数的信息,确定该待提取特征向量的图像的特征向量。
[0090]可选的,上述特定个数信息确定单元42具体用于针对与该聚类中心相似度最大的该图像块的各特征向量分别执行:计算该聚类中心和该特征向量之间的距离,并根据预先设置的距离与权重值的对应关系,确定计算出的距离对应的权重值;确定针对与该聚类中心相似度最大的图像块的各特征向量而分别确定出的权重值的总和。
[0091]可选的,上述图像的特征提取装置还可以包括:
[0092]共性特征获得单元44,用于通过对根据针对各所述待提取特征向量的图像而分别确定的特征向量进行模式识别训练,获得所述多个所述待提取特征向量的图像的共性特征。
[0093]需要说明的是,当上述图像集合中包含多个图像,且仅包含一个待提取特征向量的图像时,针对不同的图像块集合而获得的聚类中心集合所包含的聚类中心的总个数等于规定个数。
[0094]出于与本发明实施例提供的图像的分类方法相同的发明构思,本发明实施例还提供一种图像的分类装置。该装置的具体结构示意图如图5所示,其具体包括如下功能单元:
[0095]特征向量获得单元51,用于获得待提取特征向量的图像的特征向量;其中,所述待提取特征向量的图像的特征向量是采用本发明实施例所提供的图像的特征提取法确定的;
[0096]图像类别确定单元52,用于根据图像分类器和特征向量获得单元获得的特征向量,确定所述待提取特征向量的图像所属的图像类别;
[0097]其中,所述图像分类器是根据对各图像样本的特征向量进行分类训练得到的;且每个图像样本的特征向量的确定方式如下:
[0098]为每个图像样本所包括的图像样本块分配图像样本块标识;其中,每个图像样本中的图像样本块是按照规则划分得到的;在同一个图像样本中,不同图像样本块的图像样本块标识不同;在不同图像样本中,处于相同位置的图像样本块的图像样本块标识相同;
[0099]分别针对每个由具备相同图像样本块标识的所有图像样本块构成的图像样本块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像样本块集合中的各图像样本块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像样本块集合中的各图像样本块分别执行:从获得的聚类中心集合中,为该图像样本块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对该聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,特定个数为与该聚类中心相似度最大的该图像样本块的特征描述向量的个数;
[0100]针对每个所述图像样本执行:根据针对该图像样本的具备不同图像块标识的各图像块所分别确定出的所有所述特定个数的信息,确定该图像样本的特征向量;
[0101]其中,针对所述待提取特征向量的图像的各图像块而分别获得的聚类中心集合所包含的聚类中心的个数之和等于针对任意图像样本的各图像样本块而分别获得的聚类中心集合所包含的聚类中心的个数之和。
[0102]本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0103]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0104]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0105]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0106]尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0107]显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
【权利要求】
1.一种图像的特征提取方法,其特征在于,包括: 为图像集合中每个图像所包括的图像块分配图像块标识;其中,每个图像中的图像块是按照相同规则划分得到的;在同一个图像中,不同图像块的图像块标识不同;在不同图像中,处于相同位置的图像块的图像块标识相同;所述图像集合包含至少两个图像,且所述至少两个图像中至少存在一个待提取特征向量的图像;以及 分别针对每个由具备相同图像块标识的所有图像块构成的图像块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像块集合中的各图像块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合; 以及针对该图像块集合中的待提取特征向量的图像的各图像块分别执行:从所述聚类中心集合中,为该图像块的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像块的特征描述向量的个数; 针对每个所述待提取特征向量的图像执行:根据针对该待提取特征向量的图像的具备不同图像块标识的各图像块所分别确定出的所有所述特定个数的信息,确定该待提取特征向量的图像的特征向量; 其中,当所述图像集合中包含多个图像,且仅包含一个待提取特征向量的图像时,针对不同的所述图像块集合而获得的所述聚类中心集合所包含的聚类中心的总个数等于规定个数。
2.如权利要求1所述的方法,其特征在于,确定用于表征特定个数的信息,具体包括: 针对与该聚类中心相似度最大的该图像块的各特征向量分别执行:计算该聚类中心和该特征向量之间的距离,并根据预先设置的距离与权重值的对应关系,确定计算出的所述距离对应的权重值; 确定针对与该聚类中心相似度最大的该图像块的各特征向量而分别确定出的所述权重值的总和。
3.如权利要求1所述的方法,其特征在于,所述图像集合中包含多个所述待提取特征向量的图像;则 所述方法还包括: 通过对根据针对各所述待提取特征向量的图像而分别确定的特征向量进行模式识别训练,获得所述多个所述待提取特征向量的图像的共性特征。
4.如权利要求1?3任一所述的方法,其特征在于,所述不同区域不相互重叠。
5.一种图像分类方法,其特征在于,包括: 获得按照如权利要求1或2所述的方法确定的待提取特征向量的图像的特征向量;根据图像分类器和确定出的所述待提取特征向量的图像的特征向量,确定所述待提取特征向量的图像所属的图像类别; 其中,所述图像分类器是根据对各图像样本的特征向量进行分类训练得到的;且每个图像样本的特征向量的确定方式如下: 为每个图像样本所包括的图像样本块分配图像样本块标识;其中,每个图像样本中的图像样本块是按照所述规则划分得到的;在同一个图像样本中,不同图像样本块的图像样本块标识不同;在不同图像样本中,处于相同位置的图像样本块的图像样本块标识相同;分别针对每个由具备相同图像样本块标识的所有图像样本块构成的图像样本块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像样本块集合中的各图像样本块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像样本块集合中的各图像样本块分别执行:从所述聚类中心集合中,为该图像样本块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像样本块的特征描述向量的个数; 针对每个所述图像样本执行:根据针对该图像样本的具备不同图像块标识的各图像样本块所分别确定出的所有所述特定个数的信息,确定该图像样本的特征向量; 其中,针对所述待提取特征向量的图像的各图像块而分别获得的聚类中心集合所包含的聚类中心的个数之和等于针对任意图像样本的各图像样本块而分别获得的聚类中心集合所包含的聚类中心的个数之和。
6.一种图像的特征提取装置,其特征在于,包括: 标识分配单元,用于为图像集合中每个图像所包括的图像块分配图像块标识;其中,每个图像中的图像块是按照相同规则划分得到的;在同一个图像中,不同图像块的图像块标识不同;在不同图像中,处于相同位置的图像块的图像块标识相同;所述图像集合包含至少两个图像,且所述至少两个图像中至少存在一个待提取特征向量的图像; 特定个数信息确定单元,用于分别针对每个由具备相同由标识单元分配的图像块标识的所有图像块构成的图像块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像块集合中的各图像块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像块集合中的待提取特征向量的图像的各图像块分别执行:从所述聚类中心集合中,为该图像块的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像块的特征描述向量的个数; 特征向量确定单元,用于针对每个所述待提取特征向量的图像执行:根据针对该待提取特征向量的图像的具备不同图像块标识的各图像块所分别确定出的所有所述特定个数的信息,确定该待提取特征向量的图像的特征向量; 其中,当所述图像集合中包含多个图像,且仅包含一个待提取特征向量的图像时,针对不同的所述图像块集合而获得的所述聚类中心集合所包含的聚类中心的总个数等于规定个数。
7.如权利要求6所述的装置,其特征在于,所述特定个数信息确定单元具体用于: 针对与该聚类中心相似度最大的该图像块的各特征向量分别执行:计算该聚类中心和该特征向量之间的距离,并根据预先设置的距离与权重值的对应关系,确定计算出的所述距离对应的权重值; 确定针对与该聚类中心相似度最大的图像块的各特征向量而分别确定出的所述权重值的总和。
8.如权利要求6所述的装置,其特征在于,所述图像集合中包含多个所述待提取特征向量的图像;则 所述装置还包括: 共性特征获得单元,用于通过对根据针对各所述待提取特征向量的图像而分别确定的特征向量进行模式识别训练,获得所述多个所述待提取特征向量的图像的共性特征。
9.如权利要求6?8任一所述的装置,其特征在于,所述不同区域不相互重叠。
10.一种图像分类装置,其特征在于,包括: 特征向量获得单元,用于获得待提取特征向量的图像的特征向量;其中,所述待提取特征向量的图像的特征向量是采用如权利要求1或2所述的方法确定的; 图像类别确定单元,用于根据图像分类器和特征向量获得单元获得的特征向量,确定所述待提取特征向量的图像所属的图像类别; 其中,所述图像分类器是根据对各图像样本的特征向量进行分类训练得到的;且每个图像样本的特征向量的确定方式如下: 为每个图像样本所包括的图像样本块分配图像样本块标识;其中,每个图像样本中的图像样本块是按照所述规则划分得到的;在同一个图像样本中,不同图像样本块的图像样本块标识不同;在不同图像样本中,处于相同位置的图像样本块的图像样本块标识相同;分别针对每个由具备相同图像样本块标识的所有图像样本块构成的图像样本块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像样本块集合中的各图像样本块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像样本块集合中的各图像样本块分别执行:从所述聚类中心集合中,为该图像样本块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像样本块的特征描述向量的个数; 针对每个所述图像样本执行:根据针对该图像样本的具备不同图像块标识的各图像块所分别确定出的所有所述特定个数的信息,确定该图像样本的特征向量; 其中,针对所述待提取特征向量的图像的各图像块而分别获得的聚类中心集合所包含的聚类中心的个数之和等于针对任意图像样本的各图像样本块而分别获得的聚类中心集合所包含的聚类中心的个数之和。
【文档编号】G06K9/46GK104517113SQ201310460255
【公开日】2015年4月15日 申请日期:2013年9月29日 优先权日:2013年9月29日
【发明者】谢志明, 潘晖, 潘石柱, 张兴明, 傅利泉, 朱江明, 吴军, 吴坚 申请人:浙江大华技术股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1