一种图像识别方法及装置与流程

文档序号:12365718阅读:221来源:国知局
一种图像识别方法及装置与流程

本发明涉及人工智能领域,具体涉及一种图像识别方法及装置。



背景技术:

随着图像处理技术的发展,越来越多的领域开始使用图像处理技术,例如,在工业领域,开始使用图像识别工业元件代替以前人工识别工业元件的方法等。

服装识别是指利用图像处理技术对服装的颜色、图案进行识别,从而可进一步识别衣服的颜色、样式,并且可以与人脸识别进行组合以提高人脸识别的准确率。目前,利用图像技术对图像进行识别时,经常使用词袋模型(Bag of Features,简称BOF)或金字塔模型(Spatial Pyramid Matching,简称SPM)提取图像的特征,再对图像进行识别,但是基于BOF模型所提取的特征中丢失图像的空间结构信息而SPM模型采用了均匀划分的方式,不适用于姿态和角度较为丰富的服装识别,同时整幅图像对特征所占的比重相同,不能有效减少背景的影响,使得图像识别准确率低。



技术实现要素:

本发明实施例提供了一种图像识别方法及装置,以期可以提高图像识别准确率。

第一方面,本发明实施例提供一种图像识别方法,包括:

根据原始图像获取包括N个图像特征L个尺度的包含空间信息的特征向量,所述L个尺度中,子区域以上下划分为主,以得到各子区域基于这N个图像特征的特征向量,所述N为正整数,所述L为正整数;

获取所述L个尺度的特征向量的第一直方图权重,所述第一直方图权重中对所述尺度为l的特征向量增加其中心区域的权重,所述l为大于或等于3的正整数;

基于所述第一直方图权重获取所述L个尺度的特征向量的串联特征,并基于所述串联特征获取对应尺度对应子区域的图像特征;

利用所述特征向量对所述原始图像进行分类识别。

第二方面,本发明实施例提供一种图像识别装置,包括:

第一获取模块,用于根据原始图像获取包括N个图像特征L个尺度的包含空间信息的特征向量,所述L个尺度中,子区域以上下划分为主,以得到各子区域基于这N个图像特征的特征向量,所述N为正整数,所述L为正整数;

第二获取模块,还用于获取所述L个尺度的分块直方图的第一直方图权重,所述第一直方图权重中对所述尺度为l的分块直方图增加中心区域权重,所述l为大于或等于3的正整数;

第三获取模块,用于基于所述第一直方图权重获取所述L个尺度的分块直方图的串联直方图,并基于所述串联直方图获取所述不同尺度不同子区域的N个图像特征;

识别模块,用于利用所述特征向量对所述原始图像进行分类识别。

可以看出,本发明实施例所提供的技术方案中,根据原始图像获取包括N个图像特征L个尺度的包含空间信息的特征向量,所述L个尺度中,子区域以上下划分为主,以得到各子区域基于这N个图像特征的特征向量,所述N为正整数,所述L为正整数;获取所述L个尺度的特征向量的第一直方图权重,所述第一直方图权重中对所述尺度为l的特征向量增加其中心区域的权重,所述l为大于或等于3的正整数;基于所述第一直方图权重获取所述L个尺度的特征向量的串联特征,并基于所述串联特征获取对应尺度对应子区域的图像特征;利用所述特征向量对所述原始图像进行分类识别。通过原始图像计算得到包括N个图像特征的L个特征向量,再对该特征向量按增加中心区域权重的直方图权重进行累加得到串联特征向量,最后基于该串联串联特征向量获取图像特征对原始图像进行识别,从而使得对原始图像的识别准确率高。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种图像识别方法的第一实施例流程示意图;

图2-a是本发明实施例提供的一种图像识别方法的第二实施例流程示意图;

图2-b是本发明实施例提供的分块直方图划分方法及不同尺度串联权重示意图;

图3是本发明实施例提供的一种图像识别方法的第三实施例流程示意图;

图4是本发明实施例提供的一种图像识别装置的第一实施例的结构示意图;

图5是本发明实施例提供的一种图像识别装置的第二实施例的结构示意图;

图6是本发明实施例提供的一种图像识别装置的第三实施例的结构示意图。

具体实施方式

本发明实施例提供了一种图像识别方法及装置,以期可以提高图像识别准确率。

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例提供的一种图像识别方法,包括:

根据原始图像获取包括N个图像特征的L个尺度的分块直方图,所述L个尺度的分块直方图为以上下划分为主的分块直方图,所述N为正整数,所述L为正整数;

获取所述L个尺度的分块直方图的第一直方图权重,所述第一直方图权重中对所述尺度为L的分块直方图增加中心区域权重,所述L为大于或等于3的正整数;

基于所述第直方图权重获取所述L个尺度的分块直方图的串联直方图,所 述串联直方图包含所述原始图像的N个图像特征以及空间结构信息;

利用所述串联直方图对所述原始图像进行分类识别。

以下,对本申请中的技术背景进行进一步解释说明,以便于本领域技术人员理解本方案。

参见图1,图1是本发明实施例提供的一种图像识别方法的第一实施例流程示意图。如图1所示,本发明实施例提供的图像识别方法包括以下步骤:

S101、根据原始图像获取包括N个图像特征L个尺度的包含空间信息的特征向量,所述L个尺度中,子区域以上下划分为主,以得到各子区域基于这N个图像特征的特征向量,所述N为正整数,所述L为正整数。

优选地,该特征向量为直方图。

S102、获取所述L个尺度的特征向量的第一直方图权重,所述第一直方图权重中对所述尺度为l的特征向量增加其中心区域的权重,所述l为大于或等于3的正整数。

S103、基于所述第一直方图权重获取所述L个尺度的特征向量的串联特征向量,并基于所述串联特征向量获取对应尺度对应子区域的图像特征。

S104、利用所述特征向量对所述原始图像进行分类识别。

可以看出,本实施例的方案中,根据原始图像获取包括N个图像特征L个尺度的包含空间信息的特征向量,所述L个尺度中,子区域以上下划分为主,以得到各子区域基于这N个图像特征的特征向量,所述N为正整数,所述L为正整数;获取所述L个尺度的特征向量的第一直方图权重,所述第一直方图权重中对所述尺度为l的特征向量增加其中心区域的权重,所述l为大于或等于3的正整数;基于所述第一直方图权重获取所述L个尺度的特征向量的串联特征向量,并基于所述串联特征向量获取对应尺度对应子区域的图像特征;利用所述特征向量对所述原始图像进行分类识别。通过原始图像计算得到包括N个图像特征的L个特征向量,再对该L个分块直方图按增加中心区域权重后的直方图权重进行串联得到串联特征向量,最后基于该串联特征向量对原始图像进行识别,从而使得对原始图像的识别准确率高。

参见图2-a,图2-a是本发明实施例提供的一种图像识别方法的第二实施例流程示意图。如图2-a所示,本发明实施例提供的图像识别方法包括以下步骤:

S201、根据原始图像获取包括N个图像特征的L个尺度的分块直方图,所 述L个尺度的分块直方图为以上下划分为主的分块直方图,所述N为正整数,所述L为正整数。

其中,原始图像是指需要识别的目标图像,可以是摄像机所采集到的图像,在本发明实施例中,该原始图像需要为彩色图像,可以为bmp或jpeg等格式,可以支持CLYK或RGB等色彩模式。

可选地,该原始图像可以为所有需要识别的目标彩色图像,例如,服装图像、家具图像、人物图像等。

优选地,在本发明实施例中,该原始图像为服装图像。

其中,图像特征是指用于表征图像特点的一个参数,该图像特征可以基于对原始图像进行一些处理后再进行提取的,从而可以利用图像特征对图像进行分类识别等。

在本发明实施例中,所述图像特征包括以下图像特征中的至少一种:

图像颜色特征、图像纹理特征和图像形状特征。

优选地,该图像特征包括图像颜色特征、图像纹理特征和图像形状特征。

可选地,该图像特征也可以是图像颜色特征、图像纹理特征和图像形状特征任一两个组合。

可以理解,通过利用一个或多个图像特征可以对图像进行分类识别,并且所选取的图像特征数越多,所进行的分类识别准确率将越高,但同时也将导致图像识别的计算量增大,所以可根据实际情况对图像的特征数量以及特征组合进行选取。

其中,分块直方图是指基于原图像的特征聚类后,再进行分块,然后对每个块统计各特征得到的直方图。

可选地,在本发明的一些可能的实施方式中,所述根据原始图像获取包括N个图像特征的L个尺度的分块直方图,包括:

对原始图像进行特征提取得到N个图像特征,并基于所述图像特征进行聚类生成聚类图像;

基于所述聚类图像生成L个尺度的分块图像,并对所述L个尺度的分块图像中的每个分块图像直方图统计得到L个尺度的分块直方图,所述L个尺度的分块图像以及分块直方图为以上下划分为主的分块图像。

可选的,在本发明的一个实施例中,采用BOF方法对图像进行聚类。

可选地,在本发明的一个实施例中,基于图像特征进行聚类生成聚类图像的方法可以是利用硬聚类算法Kmeans进行聚类得到聚类中心。

可选地,在本发明的另一个实施例中,基于图像特征进行聚类生成聚类图像的方法也可以是利用目标跟踪算法Meanshift聚类算法进行聚类得到聚类中心。

可选地,在本发明的另一些可能的实施方式中,也可以是利用其它聚类算法基于图像特征对图像进行聚类得到聚类中心。

优选地,在本发明的一个实施例中,基于该聚类图像将生成4个尺度的分块图像,即Level 0,Level 1,Level 2,Level 3,其中,Level 0为原始聚类图像,Level 1为对原始聚类图像上下划分成1*2分块后所得到的分块图像,Level 2为对原始聚类图像上下划分为2*3=6块后所得到的分块图像,Level 3为对原始聚类图像上下左右划分为2*3*4=24块后所得到的图像,其中,上下划分为6块,左右划分为4块,从而使得在各尺度图像切分中都是以上下划分为主的,最后再对每个尺度基于各小分块进行直方图统计,得到4个尺度的分块直方图,具体可参见图2-b,图2-b是本发明实施例提供的分块直方图划分方法及不同尺度串联权重示意图。

可选地,在本发明的另一个示例中,该L个尺度还可以是其它尺度,例如4尺度或5尺度等。

可以理解,由于对于服装来说,左右对称,上下更具区分度,所以通过生成以上下划分为主的分块直方图,再基于该分块直方图去进一步提取服装特征,从而能够体现服装的空间方位信息,并同时减少了姿态对识别的影响。

S202、获取所述L个尺度的分块直方图的第一直方图权重,所述第一直方图权重中对所述尺度为l的分块直方图增加中心区域权重,所述l为大于或等于3的正整数。

其中,直方图权重是指将该L个尺度的分块直方图串联成串联直方图时所使用的每个尺度的分块直方图权重,由于不同尺度的直方图重要性不同,所以为了使最后串联得到的直方图最能体现原始图像的性质,需要根据直方图的重要性对直方图赋予不同的权重,在本发明实施例中,由于中心区域包含更多的有效信息,所以增加中心区域的权重将使得最终得到的串联直方图最有效。

优选地,在本发明实施例中,由于当直方图尺度大于或等于3时,直方图 为上下左右划分的直方图,所以此时可增加尺度大于或等于3的直方图中中心区域的权重,使得最终得到的串联直方图最有效,最终基于该串联直方图所得到的特征也最准确。具体可参见图2-b所示的权重示意图。

S203、基于所述第一直方图权重获取所述L个尺度的分块直方图的串联直方图,所述串联直方图包含所述原始图像的N个图像特征以及空间结构信息。

其中,串联直方图是指基于该包括N个图像特征的L个尺度的分块直方图,叠加第一直方图权重后所得到的L*N*Psum个直方图,从而该串联直方图将包含原始图像的N个图像特征,并且由于该分块直方图为以上下划分为主,从而包含了原始图像的空间结构信息,使得最终得到的串联直方图能很好地反映图像的特征信息,使该串联直方图用于原始图像的分类识别时准确率更高。

S204、利用所述串联直方图对所述原始图像进行分类识别。

在本发明实施例中,若原始图像为服装图像,可以基于该串联直方图去对图像进行识别,例如识别图像的颜色、纹理,以及识别图像所包括的结构化图案等信息。

举例说明,在本发明的一个示例中,若该串联直方图去包括图像的颜色特征,则可以基于该颜色特征去识别服装图像的颜色。

再举例说明,在本发明的另一个示例中,若该该串联直方图去包括图像的纹理特征,则可以基于该纹理特征去识别服装图像的纹理,更进一步地,基于该纹理去识别服装图像的结构化图案。

更进一步地,利用该串联直方图去对服装图像进行分类,以根据各服装图像所对应的服装类别。

可以看出,本实施例的方案中,根据原始图像获取包括N个图像特征的L个尺度的分块直方图,所述L个尺度的分块直方图为以上下划分为主的分块直方图,所述N为正整数,所述L为正整数;获取所述L个尺度的分块直方图的第一直方图权重,所述第一直方图权重中对所述尺度为l的分块直方图增加中心区域权重,所述l为大于或等于3的正整数;基于所述第一直方图权重获取所述L个尺度的分块直方图的串联直方图,所述串联直方图包含所述原始图像的N个图像特征以及空间结构信息;利用所述串联直方图对所述原始图像进行分类识别。通过原始图像计算得到包括N个图像特征的L个分块直方图,再对该L个分块直方图按增加中心区域权重后的直方图权重进行串联得到串联直方图, 最后基于该串联直方图对原始图像进行识别,从而使得对原始图像的识别准确率高。

可选地,在本发明的一个实施例中,所述基于所述第一直方图权重获取所述L个尺度的分块直方图的串联直方图,包括:

根据所述L个尺度的分块直方图的直方图相交匹配点数确定与所述直方图相交匹配点数正相关的第二直方图权重;

在所述第二直方图权重的基础上叠加尺度为l的所述分块直方图的中心区域权重以得到第一直方图权重。

具体地,以N=2为例,假设存在两个特征集合X、Y,也即对原始图像以2个特征进行聚类时得到4个尺度的分块直方图,其中,Level 0为原始聚类图像,Level 1为对原始聚类图像上下划分成1*2分块后所得到的分块图像,Level 2为对原始聚类图像上下划分为2*3=6块后所得到的分块图像,Level 3为对原始聚类图像上下左右划分为2*3*4=24块后所得到的图像,其中,上下划分为6块,左右划分为4块,从而使得在各尺度图像切分中都是以上下划分为主的,最后再对每个尺度基于各小分块进行直方图统计,得到4个尺度的分块直方图。然后再并将尺度0-尺度2对应子区域的直方图分别相交,获得相交的匹配Match点数Il

<mrow> <msup> <mi>I</mi> <mi>l</mi> </msup> <mo>=</mo> <mi>I</mi> <mrow> <mo>(</mo> <msubsup> <mi>H</mi> <mi>X</mi> <mi>l</mi> </msubsup> <mo>,</mo> <msubsup> <mi>H</mi> <mi>Y</mi> <mi>l</mi> </msubsup> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>D</mi> </munderover> <mi>min</mi> <mrow> <mo>(</mo> <msubsup> <mi>H</mi> <mi>X</mi> <mi>l</mi> </msubsup> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>,</mo> <msubsup> <mi>H</mi> <mi>Y</mi> <mi>l</mi> </msubsup> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>)</mo> </mrow> </mrow>

其中,分别为尺度为l的两幅图像对应子区域的直方图数值,D为尺度l中的子区域数目。

统计各个尺度下Latch的总数Ll(就等于直方图相交)。由于细粒度的bin被大粒度的bin所包含,为了不重复计算,每个尺度的有效Latch定义为Latch的增量Ll-Ll+1

不同的尺度下的Latch应赋予不同权重,显然大尺度的权重小,而小尺度的权重大,因此定义权重为如图2所示,可以看出,尺度1的直方图的权重为1/24,尺度2的直方图的权重为3/24,尺度3的直方图权重为1/3,尺度4的直方图权重为1/2。

同时,由于中心区域包含更多的有效信息,因此增加了尺度为3中图像中心区域的权重:

<mrow> <msup> <mi>I</mi> <mn>3</mn> </msup> <mo>=</mo> <mi>I</mi> <mrow> <mo>(</mo> <msubsup> <mi>H</mi> <mi>X</mi> <mn>3</mn> </msubsup> <mo>,</mo> <msubsup> <mi>H</mi> <mi>Y</mi> <mn>3</mn> </msubsup> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mi>i</mi> <mo>&NotEqual;</mo> <mn>6</mn> <mo>,</mo> <mn>7</mn> <mo>,</mo> <mn>18</mn> <mo>,</mo> <mn>19</mn> </mrow> <mn>24</mn> </munderover> <mn>0.75</mn> <mo>&times;</mo> <mi>min</mi> <mrow> <mo>(</mo> <msubsup> <mi>H</mi> <mi>X</mi> <mn>3</mn> </msubsup> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>,</mo> <msubsup> <mi>H</mi> <mi>Y</mi> <mn>3</mn> </msubsup> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>+</mo> <munder> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>6</mn> <mo>,</mo> <mn>7</mn> <mo>,</mo> <mn>18</mn> <mo>,</mo> <mn>19</mn> </mrow> </munder> <mn>2.25</mn> <mo>&times;</mo> <mi>min</mi> <mrow> <mo>(</mo> <msubsup> <mi>H</mi> <mi>X</mi> <mn>3</mn> </msubsup> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>,</mo> <msubsup> <mi>H</mi> <mi>Y</mi> <mn>3</mn> </msubsup> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>,</mo> </mrow>

最后得到各尺度中各块的权重,如图2所示,可以看出,对于尺度为3的图像来说,图像中心区域的权重系数为2.25,而图像四周的权重系数为0.75。

最后得到各个不同尺度的串联权重κL(X,Y)为:

其中,L为总尺度大小,在本示例中为4。

从而即可得到尺度从低到高,权重依次增强大的串联直方图,具体可参见图2-b。

可选地,在本发明的另一些可能的实施方式中,也可以利用其它方式来计算各特征的直方图权重,使得符合最终得到的直方图权重满足中心区域的权重得到增加,以增加中心区域的特征比例,使得最终基于该直方图权重获得的串联直方图能更准确地反映特定图像的特征,例如,能准确反映服装图像的特征。

可选地,在本发明的另一些可能的实施方式中,也可以根据原始图像的类别去设计其它直方图权重,例如,对于周边区域信息更为重要的分块直方图来说,则可以适当增加周边区域直方图权重。

可以理解,通过对各尺度权重系数进行调整,再基于该权重系数计算串联直方图,将使得该串联直方图能更准确地反映原始图像的特征,从而使得基于该图像特征对不同的图像进行分类识别的准确率更高。

为了便于更好地理解和实施本发明实施例的上述方案,下面将举例几个具体的应用场景进行说明。

参见图3,图3是本发明实施例提供的一种图像识别方法的第三实施例流程示意图。图3所示的方法中,与图1所示方法相同或类似的内容可以参考图1中的详细描述,此处不再赘述。如图3所示,本发明实施例提供的图像识别方法包括以下步骤:

S301、对原始图像进行特征提取得到N个图像特征,并基于所述图像特征进行聚类生成聚类图像。

其中,原始图像是指需要识别的目标图像,可以是摄像机所采集到的图像,在本发明实施例中,该原始图像需要为彩色图像,可以为bLp或jpeg等格式,可以支持CLYK或RGB等色彩模式。

可选地,该原始图像可以为所有需要识别的目标彩色图像,例如,服装图像、家具图像、人物图像等。

优选地,在本发明实施例中,该原始图像为服装图像。

其中,图像特征是指用于表征图像特点的一个参数,该图像特征可以基于对原始图像进行一些处理后再进行提取的,从而可以利用图像特征对图像进行分类识别等。

在本发明实施例中,所述图像特征包括以下图像特征中的至少一种:

图像颜色特征、图像纹理特征和图像形状特征。

优选地,该图像特征包括图像颜色特征、图像纹理特征和图像形状特征。

可选地,该图像特征也可以是图像颜色特征、图像纹理特征和图像形状特征任一两个组合。

可选的,在本发明的一个实施例中,采用BOF方法对图像进行聚类。

可选地,在本发明的一个实施例中,基于图像特征进行聚类生成聚类图像的方法可以是利用硬聚类算法KMeans进行聚类得到聚类中心。

可选地,在本发明的另一个实施例中,基于图像特征进行聚类生成聚类图像的方法也可以是利用目标跟踪算法Meanshift聚类算法进行聚类得到聚类中心。

S302、基于所述聚类图像生成L个尺度的分块图像,并对所述L个尺度的分块图像中的每个分块图像直方图统计得到L个尺度的分块直方图,所述L个尺度的分块图像以及分块直方图为以上下划分为主的分块图像。

S303、根据所述L个尺度的分块直方图的直方图相交匹配点数确定与所述直方图相交匹配点数正相关的第二直方图权重。

S304、在所述第二直方图权重的基础上叠加尺度为L的所述分块直方图的中心区域权重以得到第一直方图权重。

S305、基于所述第一直方图权重获取所述L个尺度的分块直方图的串联直方图,所述串联直方图包含所述原始图像的N个图像特征以及空间结构信息。

S306、利用所述串联直方图对所述原始图像进行分类识别。

在本发明实施例中,若原始图像为服装图像,可以基于该串联直方图去对图像进行识别,例如识别图像的颜色、纹理,以及识别图像所包括的结构化图案等信息。

举例说明,在本发明的一个示例中,若该该串联直方图包括图像的颜色特征,则可以基于该颜色特征去识别服装图像的颜色。

再举例说明,在本发明的另一个示例中,若该该串联直方图包括图像的纹理特征,则可以基于该纹理特征去识别服装图像的纹理,更进一步地,基于该纹理去识别服装图像的结构化图案。

更进一步地,利用该串联直方图对服装图像进行分类,以根据各服装图像所对应的服装类别。

可以看出,本实施例的方案中,根据原始图像获取包括N个图像特征的L个尺度的分块直方图,所述L个尺度的分块直方图为以上下划分为主的分块直方图,所述N为正整数,所述L为正整数;获取所述L个尺度的分块直方图的第一直方图权重,所述第一直方图权重中对所述尺度为L的分块直方图增加中心区域权重,所述L为大于或等于3的正整数;基于所述第一直方图权重获取所述L个尺度的分块直方图的串联直方图,所述串联直方图包含所述原始图像的N个图像特征以及空间结构信息;利用所述串联直方图对所述原始图像进行分类识别。通过原始图像计算得到包括N个图像特征的L个分块直方图,再对该L个分块直方图按增加中心区域权重后的直方图权重进行串联得到串联直方图,最后基于该串联直方图对原始图像进行识别,从而使得对原始图像的识别准确率高。

本发明实施例还提供一种图像识别装置,包括:

第一获取模块,用于根据原始图像获取包括N个图像特征L个尺度的包含空间信息的特征向量,所述L个尺度中,子区域以上下划分为主,以得到各子区域基于这N个图像特征的特征向量,所述N为正整数,所述L为正整数;

第二获取模块,还用于获取所述L个尺度的特征向量的第一直方图权重,所述第一直方图权重中对所述尺度为l的特征向量增加其中心区域的权重,所述l为大于或等于3的正整数;

第三获取模块,用于基于所述第一直方图权重获取所述L个尺度的特征向量的串联特征向量,并基于所述串联特征向量获取对应尺度对应子区域的图像特征;

分类模块,用于利用所述特征向量对所述原始图像进行分类识别。

具体地,请参见图4,图4是本发明实施例提供的一种图像识别装置的第一 实施例的结构示意图,用于实现本发明实施例公开的图像识别方法。其中,如图4所示,本发明实施例提供的一种图像识别装置400可以包括:

第一获取模块410、第二获取模块420、第三获取模块430和识别模块440。

其中,第一获取模块410,用于根据原始图像获取包括N个图像特征L个尺度的包含空间信息的特征向量,所述L个尺度中,子区域以上下划分为主,以得到各子区域基于这N个图像特征的特征向量,所述N为正整数,所述L为正整数。

优选地,该特征向量为直方图。

其中,原始图像是指需要识别的目标图像,可以是摄像机所采集到的图像,在本发明实施例中,该原始图像需要为彩色图像,可以为bLp或jpeg等格式,可以支持CLYK或RGB等色彩模式。

可选地,该原始图像可以为所有需要识别的目标彩色图像,例如,服装图像、家具图像、人物图像等。

优选地,在本发明实施例中,该原始图像为服装图像。

其中,图像特征是指用于表征图像特点的一个参数,该图像特征可以基于对原始图像进行一些处理后再进行提取的,从而可以利用图像特征对图像进行分类识别等。

在本发明实施例中,所述图像特征包括以下图像特征中的至少一种:

图像颜色特征、图像纹理特征和图像形状特征。

优选地,该图像特征包括图像颜色特征、图像纹理特征和图像形状特征。

可选地,该图像特征也可以是图像颜色特征、图像纹理特征和图像形状特征任一两个组合。

可以理解,通过利用一个或多个图像特征可以对图像进行分类识别,并且所选取的图像特征数越多,所进行的分类识别准确率将越高,但同时也将导致图像识别的计算量增大,所以可根据实际情况对图像的特征数量以及特征组合进行选取。

其中,分块直方图是指基于原图像的特征聚类后,再进行分块,然后对每个块统计各特征得到的直方图。

可选地,在本发明的一些可能的实施方式中,所述第一获取模块410还用于:

对原始图像进行特征提取得到N个图像特征,并基于所述图像特征进行聚类生成聚类图像;

基于所述聚类图像生成L个尺度的分块图像,并对所述L个尺度的分块图像中的每个分块图像直方图统计得到L个尺度的分块直方图,所述L个尺度的分块图像以及分块直方图为以上下划分为主的分块图像。

可选地,在本发明的一个实施例中,基于图像特征进行聚类生成聚类图像的方法可以是利用硬聚类算法KLeans进行聚类得到聚类中心。

可选地,在本发明的另一个实施例中,基于图像特征进行聚类生成聚类图像的方法也可以是利用目标跟踪算法Leanshift聚类算法进行聚类得到聚类中心。

可选地,在本发明的另一些可能的实施方式中,也可以是利用其它聚类算法基于图像特征对图像进行聚类得到聚类中心。

优选地,在本发明的一个实施例中,基于该聚类图像将生成4个尺度的分块图像,即Level 0,Level 1,Level 2,Level 3,其中,Level 0为原始聚类图像,Level 1为对原始聚类图像上下划分成1*2分块后所得到的分块图像,Level 2为对原始聚类图像上下划分为2*3=6块后所得到的分块图像,Level 3为对原始聚类图像上下左右划分为2*3*4=24块后所得到的图像,其中,上下划分为6块,左右划分为4块,从而使得在各尺度图像切分中都是以上下划分为主的,最后再对每个尺度基于各小分块进行直方图统计,得到4个尺度的分块直方图,具体可参见图2-b,图2-b是本发明实施例提供的分块直方图划分方法及不同尺度串联权重示意图。

可选地,在本发明的另一个示例中,该L个尺度还可以是其它尺度,例如4尺度或5尺度等。

可以理解,由于对于服装来说,左右对称,上下更具区分度,所以通过生成以上下划分为主的分块直方图,再基于该分块直方图去进一步提取服装特征,从而能够体现服装的空间方位信息,并同时减少了姿态对识别的影响。

第二获取模块420,还用于获取所述L个尺度的特征向量的第一直方图权重,所述第一直方图权重中对所述尺度为l的分块直方图增加中心区域权重,所述l为大于或等于3的正整数。

其中,直方图权重是指将该L个尺度的分块直方图串联成串联直方图时所 使用的每个尺度的分块直方图权重,由于不同尺度的直方图重要性不同,所以为了使最后串联得到的直方图最能体现原始图像的性质,需要根据直方图的重要性对直方图赋予不同的权重,在本发明实施例中,由于中心区域包含更多的有效信息,所以增加中心区域的权重将使得最终得到的串联直方图最有效。

优选地,在本发明实施例中,由于当直方图尺度大于或等于3时,直方图为上下左右区分的直方图,所以此时可增加尺度大于或等于3的直方图中中心区域的权重,使得最终得到的串联直方图最有效,最终基于该串联直方图所得到的特征也最准确。具体可参见图2-b所示的权重示意图。

第三获取模块430,用于基于所述第一直方图权重获取所述L个尺度的分块直方图的串联特征向量,并基于所述串联特征向量获取所述N个图像特征。

其中,串联直接图是指基于该包括N个图像特征的L个尺度的分块直方图,叠加第一直方图权重后所得到的N个直方图,从而基于该串联直方图将得到原始图像的N个图像特征。

在本发明实施例中,若原始图像为服装图像,可以基于所提取出来N个图像特征去对图像进行识别,例如识别图像的颜色、纹理,以及识别图像所包括的结构化图案等信息。

举例说明,在本发明的一个示例中,若该N个图像包括图像的颜色特征,则可以基于该颜色特征去识别服装图像的颜色。

再举例说明,在本发明的另一个示例中,若该N个图像包括图像的纹理特征,则可以基于该纹理特征去识别服装图像的纹理,更进一步地,基于该纹理去识别服装图像的结构化图案。

更进一步地,利用各特征对服装图像进行分类,以根据各服装图像所对应的服装类别。

分类模块440,用于利用所述特征向量对所述原始图像进行分类识别。

可以看出,本实施例的方案中,图像识别装置400根据原始图像获取包括N个图像特征的L个尺度的分块直方图,所述L个尺度的分块直方图为以上下划分为主的分块直方图,所述N为正整数,所述L为正整数;图像识别装置400获取所述L个尺度的分块直方图的第一直方图权重,所述第一直方图权重中对所述尺度为l的分块直方图增加中心区域权重,所述l为大于或等于3的正整数;图像识别装置400基于所述第一直方图权重获取所述L个尺度的分块直方图的 串联直方图,所述串联直方图包含所述原始图像的N个图像特征以及空间结构信息;图像识别装置400利用所述串联直方图对所述原始图像进行分类识别。通过原始图像计算得到包括N个图像特征的L个分块直方图,再对该L个分块直方图按增加中心区域权重后的直方图权重进行串联得到串联直方图,最后基于该串联直方图对原始图像进行识别,从而使得对原始图像的识别准确率高。

在本实施例中,图像识别装置400是以单元的形式来呈现。这里的“单元”可以指特定应用集成电路(application-specific integrated circuit,ASIC),执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。

可以理解的是,本实施例的图像识别装置400的各功能单元的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。

参见图5,图5是本发明实施例提供的一种图像识别装置500的第二实施例的结构示意图,用于实现本发明实施例公开的图像识别方法。其中,如图5所示的终端是由图4所示的终端进行优化得到的。图5所示的终端除了包括图4所示的图像识别装置500的模块之外,还有以下扩展:

可选地,在本发明的一个实施例中,所述第二获取模块520,包括:

直方图权重确定单元521,用于根据所述L个尺度的分块直方图的直方图相交匹配点数确定与所述直方图相交匹配点数正相关的第二直方图权重;

叠加单元522,用于在所述第二直方图权重的基础上叠加尺度为L的所述分块直方图的中心区域权重以得到第一直方图权重。

具体地,以N=2为例,假设存在两个特征集合X、Y,也即对原始图像以2个特征进行聚类时得到4个尺度的分块直方图,其中,Level 0为原始聚类图像,Level 1为对原始聚类图像上下划分成1*2分块后所得到的分块图像,Level 2为对原始聚类图像上下划分为2*3=6块后所得到的分块图像,Level 3为对原始聚类图像上下左右划分为2*3*4=24块后所得到的图像,其中,上下划分为6块,左右划分为4块,从而使得在各尺度图像切分中都是以上下划分为主的,最后再对每个尺度基于各小分块进行直方图统计,得到4个尺度的分块直方图。然后再并将尺度0-尺度2对应子区域的直方图分别相交,获得相交的匹配Latch点数Il

<mrow> <msup> <mi>I</mi> <mi>l</mi> </msup> <mo>=</mo> <mi>I</mi> <mrow> <mo>(</mo> <msubsup> <mi>H</mi> <mi>X</mi> <mi>l</mi> </msubsup> <mo>,</mo> <msubsup> <mi>H</mi> <mi>Y</mi> <mi>l</mi> </msubsup> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>D</mi> </munderover> <mi>min</mi> <mrow> <mo>(</mo> <msubsup> <mi>H</mi> <mi>X</mi> <mi>l</mi> </msubsup> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>,</mo> <msubsup> <mi>H</mi> <mi>Y</mi> <mi>l</mi> </msubsup> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>)</mo> </mrow> </mrow>

其中,分别为尺度为l的两幅图像对应子区域的直方图数值,D为尺度l中的子区域数目。

统计各个尺度下Latch的总数Ll(就等于直方图相交)。由于细粒度的bin被大粒度的bin所包含,为了不重复计算,每个尺度的有效Latch定义为Latch的增量Ll-Ll+1

不同的尺度下的Latch应赋予不同权重,显然大尺度的权重小,而小尺度的权重大,因此定义权重为如图2所示,可以看出,尺度1的直方图的权重为1/24,尺度2的直方图的权重为3/24,尺度3的直方图权重为1/3,尺度4的直方图权重为1/2。

同时,由于中心区域包含更多的有效信息,因此增加了尺度为3中图像中心区域的权重:

<mrow> <msup> <mi>I</mi> <mn>3</mn> </msup> <mo>=</mo> <mi>I</mi> <mrow> <mo>(</mo> <msubsup> <mi>H</mi> <mi>X</mi> <mn>3</mn> </msubsup> <mo>,</mo> <msubsup> <mi>H</mi> <mi>Y</mi> <mn>3</mn> </msubsup> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mi>i</mi> <mo>&NotEqual;</mo> <mn>6</mn> <mo>,</mo> <mn>7</mn> <mo>,</mo> <mn>18</mn> <mo>,</mo> <mn>19</mn> </mrow> <mn>24</mn> </munderover> <mn>0.75</mn> <mo>&times;</mo> <mi>min</mi> <mrow> <mo>(</mo> <msubsup> <mi>H</mi> <mi>X</mi> <mn>3</mn> </msubsup> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>,</mo> <msubsup> <mi>H</mi> <mi>Y</mi> <mn>3</mn> </msubsup> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>+</mo> <munder> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>6</mn> <mo>,</mo> <mn>7</mn> <mo>,</mo> <mn>18</mn> <mo>,</mo> <mn>19</mn> </mrow> </munder> <mn>2.25</mn> <mo>&times;</mo> <mi>min</mi> <mrow> <mo>(</mo> <msubsup> <mi>H</mi> <mi>X</mi> <mn>3</mn> </msubsup> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>,</mo> <msubsup> <mi>H</mi> <mi>Y</mi> <mn>3</mn> </msubsup> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>,</mo> </mrow>

最后得到各尺度中各块的权重,如图2所示,可以看出,对于尺度为3的图像来说,图像中心区域的权重系数为2.25,而图像四周的权重系数为0.75。

最后得到各个不同尺度的串联权重κL(X,Y)为:

其中,L为总尺度大小,在本示例中为4。

从而即可得到尺度从低到高,权重依次增强大的串联直方图,具体可参见图2。

可选地,在本发明的另一些可能的实施方式中,也可以利用其它方式来计算各特征的直方图权重,使得符合最终得到的串联直方图满足中心区域的权重得到增加,以增加中心区域的特征比例,使得最终计算得到的特征能更准确地反映特定图像的特征,例如,能准确反映服装图像的特征。

可选地,在本发明的另一些可能的实施方式中,也可以根据原始图像的类别去设计其它直方图权重,例如,对于周边区域信息更为重要的分块直方图来说,则可以适当增加周边区域直方图权重。

可以理解,通过对各尺度权重系数进行调整,再基于该权重系数计算串联直方图,最后基于该串联直方图计算N个图像特征,将使得该N个图像特征能 更准确地反映原始图像的特征,从而使得基于该图像特征对不同的图像进行分类识别的准确率更高。

可以看出,本实施例的方案中,图像识别装置500根据原始图像获取包括N个图像特征的L个尺度的分块直方图,所述L个尺度的分块直方图为以上下划分为主的分块直方图,所述N为正整数,所述L为正整数;图像识别装置500获取所述L个尺度的分块直方图的第一直方图权重,所述第一直方图权重中对所述尺度为l的分块直方图增加中心区域权重,所述l为大于或等于3的正整数;图像识别装置500基于所述第一直方图权重获取所述L个尺度的分块直方图的串联直方图,并基于所述串联直方图获取所述N个图像特征;图像识别装置500利用所述N个图像特征对所述原始图像进行分类识别。通过原始图像计算得到包括N个图像特征的L个分块直方图,再对该分块直方图按增加中心区域权重的直方图权重进行累加得到串联直方图,最后基于该串联直方图获取图像特征对原始图像进行识别,从而使得对原始图像的识别准确率高。

在本实施例中,图像识别装置500是以单元的形式来呈现。这里的“单元”可以指特定应用集成电路(application-specific integrated circuit,ASIC),执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。

可以理解的是,本实施例的图像识别装置500的各功能单元的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。

参见图6,图6是本发明实施例提供的一种图像识别装置的第三实施例的结构示意图,用于实现本发明实施例公开的图像识别方法。其中,该图像识别装置600可以包括:至少一个总线601、与总线601相连的至少一个处理器602以及与总线601相连的至少一个存储器603。

其中,处理器602通过总线601,调用存储器中存储的代码以用于根据原始图像获取包括N个图像特征的L个尺度的分块直方图,所述L个尺度的分块直方图为以上下划分为主的分块直方图,所述N为正整数,所述L为正整数;

获取所述L个尺度的分块直方图的第一直方图权重,所述第一直方图权重中对所述尺度为l的分块直方图增加中心区域权重,所述l为大于或等于3的正整数;

基于所述第一直方图权重获取所述L个尺度的分块直方图的串联直方图,并基于所述串联直方图获取所述N个图像特征;

利用所述N个图像特征对所述原始图像进行分类识别。

可选地,在本发明的一些可能的实施方式中,所述处理器502根据原始图像获取包括N个图像特征的L个尺度的分块直方图,包括:

对原始图像进行特征提取得到N个图像特征,并基于所述图像特征进行聚类生成聚类图像;

基于所述聚类图像生成L个尺度的分块图像,并对所述L个尺度的分块图像中的每个分块图像直方图统计得到L个尺度的分块直方图,所述L个尺度的分块图像以及分块直方图为以上下划分为主的分块图像。

可选地,在本发明的一些可能的实施方式中,所述处理器502基于所述第一直方图权重获取所述L个尺度的分块直方图的串联直方图,包括:

根据所述L个尺度的分块直方图的直方图相交匹配点数确定与所述直方图相交匹配点数正相关的第二直方图权重;

在所述第二直方图权重的基础上叠加尺度为l的所述分块直方图的中心区域权重以得到第一直方图权重。

可选地,在本发明的一些可能的实施方式中,所述图像特征包括以下图像特征中的至少一种:

图像颜色特征、图像纹理特征和图像形状特征。

可选地,在本发明的一些可能的实施方式中,所述原始图像包括服装图像。

可以看出,本实施例的方案中,图像识别装置600根据原始图像获取包括N个图像特征的L个尺度的分块直方图,所述L个尺度的分块直方图为以上下划分为主的分块直方图,所述N为正整数,所述L为正整数;图像识别装置600获取所述L个尺度的分块直方图的第一直方图权重,所述第一直方图权重中对所述尺度为l的分块直方图增加中心区域权重,所述l为大于或等于3的正整数;图像识别装置600基于所述第一直方图权重获取所述L个尺度的分块直方图的串联直方图,并基于所述串联直方图获取所述N个图像特征;图像识别装置500利用所述N个图像特征对所述原始图像进行分类识别。通过原始图像计算得到包括N个图像特征的L个分块直方图,再对该分块直方图按增加中心区域权重的直方图权重进行累加得到串联直方图,最后基于该串联直方图获取图像特征 对原始图像进行识别,从而使得对原始图像的识别准确率高。

在本实施例中,图像识别装置600是以单元的形式来呈现。这里的“单元”可以指特定应用集成电路(application-specific integrated circuit,ASIC),执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。

可以理解的是,本实施例的图像识别装置600的各功能单元的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。

本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任何图像识别方法的部分或全部步骤。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明的各个实施例中的各功能单元可以集成在一个处理单元中, 也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROL,Read-Only LeLory)、随机存取存储器(RAL,RandoL Access LeLory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1