一种图像识别方法及装置的制作方法

文档序号:6380265阅读:166来源:国知局
专利名称:一种图像识别方法及装置的制作方法
技术领域
本发明涉及图像处理领域,特别涉及一种图像识别方法及装置。
背景技术
在人类图像识别系统中,图像识别是以图像的主要特征为基础的。每个图像都有它的特征,如字母A有个尖,P有个圈、而Y的中心有个锐角等。由此可见,在机器进行图像识别过程中,可以通过排除多余信息,抽出关键的特征对图像进行识别。利用提取图像特征进行图像识别,一般的方法是判断提取的图像特征是否符合一个关键特征,如果符合,则识别成功,例如,目前有一种硬币图像识别的方法,该方法首选 提取硬币图像中的硬币外轮廓圆直径,若提取的硬币外轮廓圆直径在允许的直径范围内,则符合硬币关键特征,若不在允许的直径范围内,则认为是假硬币。但是,目前对图像的关键特征描述过于简单,在图像质量不好时,所提取的图像特征可能不具备关键特征,导致识别失败,例如,针对硬币拍摄图像的识别,在光照条件或者拍摄角度不佳时,提取的硬币外轮廓变形,不具备所约定的允许直径范围,导致识别失败。

发明内容
有鉴于此,本发明的主要目的在于提供一种图像识别方法及装置以实现能够对各种图像质量的图像进行准确识别的目的。本发明提供的一种图像识别方法,包括计算目标图像的图像特征向量;查询与所述目标图像的图像特征向量匹配的代表特征向量;返回查询结果;其中,一个代表特征向量通过提取聚为一类的样本图像的图像特征向量的特征获得;所述聚为一类的样本图像的图像特征向量按照多个样本图像的图像特征向量相似度聚类获得;所述样本图像的图像特征向量通过提取与所述目标图像的图像特征向量相同的特征获得。优选地,所述计算目标图像的图像特征向量具体包括根据预先设置的分块要求分割所述目标图像,获得子图像块;计算所述子图像块的颜色直方图向量和梯度直方图向量;将所述子图像块的颜色直方图向量和梯度直方图向量组合,获得所述目标图像的图像特征向量。优选地,所述聚为一类的样本图像的图像特征向量按照多个样本图像的图像特征向量相似度聚类获得具体包括以下步骤获得多个样本图像特征向量;
从多个样本图像特征向量中,随机选取k个样本图像特征向量,分别作为k个类的第一中心值,其中k > 2 ;建立与第一中心值对应的k个第一聚类,计算所述多个样本图像特征向量与所述k个第一聚类的第一中心值的相似度,将所述多个样本图像特征向量分别归到与所述k个第一聚类的第一中心值相似度最高的类中;通过计算k个第一聚类中每类包含的每个样本图像特征向量与所在类的第一中心值的差值,获得所述多个样本图像特征向量到第一中心值的平均距离;计算k个第一聚类中每类包含的样本图像特征向量的均值,将其作为第二中心值;进入分类步骤;分类步骤包括建立与第二中心值对应的k个第二聚类,计算所述多个样本图像特征向量与所述k个第二聚类的第二中心值的相似度,将所述多个样本图像特征向量分别归到与所述k个第二聚类的第二中心值相似度最高的类中;通过计算k个第二聚类中每类包含的每个样本图像特征向量与所在类的第二中心值的差值,获得所述多个样本图像特征向量到第二中心值的平均距离;判断到第二中心值的平均距离与到第一中心值的平均距离的差是否小于预设的阈值;如果否,将到第二中心值的平均距离作为到第一中心值的平均距离,计算k个第二聚类中每类包含的样本图像特征向量的均值,将其作为第二中心值,重新进入分类步骤;如果是,获得第二聚类,结束该流程。优选地,一个代表特征向量具体通过计算聚为一类的样本图像的图像特征向量平均值获得。优选地,所述查询与目标图像的图像特征向量匹配的代表特征向量具体通过以下步骤查询分别计算所述目标图像的图像特征向量与各个代表特征向量的差值;选择差值最小的代表特征向量作为与所述目标图像的图像特征向量匹配的代表特征向量。优选地,该方法还包括判断所述目标图像的图像特征向量与各个代表特征向量的差值是否均超过差值标准;若超过,查询结果为未找到;若未超过,查询结果为所述差值最小的代表特征向量。优选地,该方法在计算目标图像的图像特征向量之前,还包括将所述目标图像作为待处理图像,执行以下预处理步骤;所述预处理步骤包括在所述待处理图像上定位限定图像范围的标识,获得所述标识在所述待处理图像上的位置;
根据所述标识在所述待处理图像上的位置,更新所述待处理图像为所述标识限定范围内的图像。优选地,该方法还包括将所述样本图像作为待处理图像,执行所述预处理步骤获得更新的样本图像,所述样本图像的图像特征向量具体通过提取所述更新的样本图像的特征获得。在本发明的一个实施例中,所述限定图像范围的标识具体为特定闭合曲线,所述标识限定的范围具体为所述特定闭合曲线所包围的范围。在该实施例中,在所述待处理图像上定位所述标识具体通过以下步骤定位利用特定闭合曲线模板将特定闭合曲线投影在所述待处理图像上,计算出特定闭合曲线的投影线在待处理图像上的位置;通过调整特定闭合曲线模板的角度和位置、调整所述待处理图像的缩放尺寸,计算在调整过程中的任意调整状态下第一图像与第二图像的色差值,所述第一图像具体为所述待处理图像上的投影线一侧预设范围内的图像,所述第二图像具体为所述待处理图像上的投影线另一侧预设范围内的图像;在所述色差值最大时,将特定闭合曲线的投影线在待处理图像上的位置作为所述标识在所述待处理图像上的位置。在本发明的另一个实施例中,所述限定图像范围的标识具体为N个第一特殊图形、且所述N个第一特殊图形相连形成的N边形符合第二特殊图形,所述标识限定的范围具体为所述N个第一特殊图形相连形成的N边形所包围的范围,其中所述N个第一特殊图形的中心点不在同一条直线上,N大于等于3。·在该实施例中,在所述待处理图像上定位所述标识具体通过以下步骤定位计算所述待处理图像上各像素点的像素值和位置;通过所述各像素点的像素值和位置,确定像素值不为O且位置相邻的像素点所形成的各个待选图形,并计算各个待选图形在所述待处理图像上的位置;从各个待选图形中筛选出与第一特殊图形相似程度超过标准值的第一待选图形;若第一待选图形的个数总和大于等于N,从各个第一待选图形中,筛选出N个第一待选图形,其中心点相连形成的N边形与第二特殊图形的相似程度最高,将所述筛选出的N个第一待选图形在所述待处理图像上的位置作为所述标识在所述待处理图像上的位置;否则,定位失败。或者,还可以通过以下步骤定位利用第一特殊图形模板将第一特殊图形边缘投影在所述待处理图像上,计算出第一特殊图形边缘的投影线在待处理图像上的位置;通过调整第一特殊图形模板的角度和位置、调整所述待处理图像的缩放尺寸,计算在调整过程中的任意调整状态下第一图像与第二图像的色差值,所述第一图像具体为所述待处理图像上的投影线一侧预设范围内的图像,所述第二图像具体为所述待处理图像上的投影线另一侧预设范围内的图像;在所述色差值最大时,将第一特殊图形边缘的投影线在待处理图像上的位置作为所述第一特殊图形在所述待处理图像上的位置;
重复以上步骤直到无法找到第一特殊图形在所述待处理图像上更新的位置;若在所述待处理图像上找到的第一特殊图形个数大于等于N,从找到的各个第一特殊图形中,筛选出N个第一特殊图形,其中心点相连形成的N边形与第二特殊图形的相似程度最高,将所述筛选出的N个第一特殊图形在所述待处理图像上的位置作为所述标识在所述待处理图像上的位置;否则,定位失败。优选地,所述预处理步骤还包括在更新所述待处理图像为所述标识限定范围内的图像之后,调整所述待处理图像为标准尺寸和标准角度的图像。优选地,该方法还包括在预先设置的游戏规则中,查询出所述查询结果所对应的执行指令; 执行所述执行指令。优选地,所述目标图像具体通过数字摄像设备采集目标的拍摄图像实时获取。所述样本图像具体为对每个拍摄目标,通过调整各种拍摄条件,采集的多个拍摄图像。优选地,该方法还包括输出查询结果对应的语音文件到音频设备。本发明还提供一种图像识别装置,其特征在于,包括计算单元用于计算所述目标图像的图像特征向量,将所述目标图像的图像特征向量发送至查询单元;查询单元用于查询与所述目标图像的图像特征向量匹配的代表特征向量,返回查询结果,其中,一个代表特征向量通过提取聚为一类的样本图像的图像特征向量的特征获得,所述聚为一类的样本图像的图像特征向量按照多个样本图像的图像特征向量相似度聚类获得,所述样本图像的图像特征向量通过提取与所述目标图像的图像特征向量相同的特征获得。可见本发明具有如下有益效果本发明在计算目标图像的图像特征向量之后,通过查询与目标图像的图像特征向量匹配的代表特征向量得到图像识别的结果,因为代表特征向量是聚为一类的样本图像的图像特征向量的特征,聚为一类的样本图像的图像特征向量按照多个样本图像的图像特征向量相似度聚类获得,也就是说,对于一个样本来说,根据本发明,若干样本图像可以按照相似度分为多个类,每个代表特征向量都是一类图像质量的样本图像的特征,所以,代表特征向量能够体现各种图像质量的样本图像的特点,为图像提供了更加准确的特征描述,从而使对目标图像的识别更加准确,具有更高的识别能力。


图I是本发明一种图像识别的方法一个实施例的流程图;图2是本发明计算目标图像的图像特征向量的流程图;图2-1是本发明64X32 = 2048维图像特征向量的示例图;图3是本发明聚类样本图像的图像特征向量的流程图;图4是本发明预处理步骤的流程图;图5是本发明一个目标图像的示例图6是本发明定位标识的一个实施例的流程图;图7是本发明特定闭合曲线在图像上的投影示例图;图8是本发明第一图像和第二图像的示例图;图9是本发明另一个目标图像的示例图;图10是本发明定位标识的另一个实施例的流程图;图11是本发明定位标识的又一个实施例的流程图;图12是本发明一种图像识别的装置的组成图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式
对本发明实施例作进一步详细的说明。图I为本发明一种图像识别的方法一个实施例的流程图,如图所示,包括S101、计算目标图像的图像特征向量;S102、查询与所述目标图像的图像特征向量匹配的代表特征向量,其中,一个代表特征向量通过提取聚为一类的样本图像的图像特征向量的特征获得;所述聚为一类的样本图像的图像特征向量按照多个样本图像的图像特征向量相似度聚类获得;所述样本图像的图像特征向量通过提取与所述目标图像的图像特征向量相同的特征获得;S103、返回查询结果。可见,如图I所示的本发明的一个方法实施例,将聚为一类的多个样本图像的图像特征向量的特征,即代表特征向量,作为图像识别的特征,因为聚为一类的样本图像的图像特征向量是按照相似度聚类的,使得代表特征向量可以认为是一类图像质量的样本图像的特征,为各种图像质量的样本图像提供了更加准确的特征描述,进而可以使目标图像的识别更加准确,具有更高的识别能力。其中,步骤SlOl所述计算目标图像的图像特征向量,参见图2,如图所示,具体可以包括S201、根据预先设置的分块要求分割所述目标图像,获得子图像块;具体地,所述根据预先设置的分块要求分割所述待处理图像,在具体实施时,例如,如图5所示,可以将待处理图像平均分割为64块,每个图像块都是所述待处理图像的子图像块。S202、计算所述子图像块的颜色直方图向量和梯度直方图向量;计算子图像块的颜色直方图向量,就是计算子图像块中所有像素的每一个颜色RGB分量的分布,具体地,例如,在每一个子图像块中,每一个像素都有红色(R)、绿色(G)、和蓝色(B)的颜色分量,每个颜色分量的范围是O到255,把颜色分量值范围
均分分割为8个区间,然后统计每个颜色每个区间内像素的个数,这样,每个颜色分量的直方图为一个8维向量,把RGB三个颜色分量的直方图向量拼接起来,形成一个24维的颜色直方图向量;计算子图像块的梯度直方图向量,就是计算子图像块中梯度方向的分布,具体地,例如,在每一个子图像块中,每一个像素都有水平方向的变化(dx)和垂直方向的变化
(dy),可以通过水平方向和垂直方向的变化计算出该像素的梯度方向0=tanΘ的范
围为[_π/2, 31/2],把Θ的范围均分为8个区间,然后统计每个区间内像素的个数,形成8维的梯度方向直方图向量。S203、将所述子图像块的颜色直方图向量和梯度直方图向量组合,获得所述待处理图像的图像特征向量。具体地,例如,对每个图像块,把24维的颜色直方图向量和8维的梯度方向直方图向量拼接起来,形成一个32维的特征向量,再将整个待处理图像的64个子图像块的32维特征向量拼接起来,形成整个待处理图像的图像特征向量,如图2-1所示,其图像特征向量 为64X32 = 2048维的向量。需要说明的是,如步骤S102所述,样本图像的图像特征向量具体通过提取与所述目标图像的图像特征向量相同的特征获得,因此,在本发明中,在上述实施例中,所述样本图像的图像特征向量同样可以采取如步骤S201到S203所示的方法计算获得。在该计算目标图像的图像特征向量的具体步骤示例中,通过分割目标图像为多个子图像块,获得由多个子图像块的颜色直方图向量和梯度直方图向量拼接而成的目标图像的图像特征向量,使得该图像特征向量具有较大的维数,从而可以更加全面和详细的描述该图像的特征,而且,在根据预先设置的分块要求分割所述目标图像时,可以根据具体实施需要,有选择的进行分块,例如,在预估计图像信息量较小的区域分割为较大的子图像块,在预估计图像信息量较大的区域分割为较小的子图像块,从而降低计算量,提高图像特征描述的有效性。下面,对步骤S102所述聚为一类的样本图像的图像特征向量按照多个样本图像的图像特征向量相似度聚类获得,进行详细阐述,例如,参见图3,具体可以包括S301、获得多个样本图像特征向量;S302、从多个样本图像特征向量中,随机选取k个样本图像特征向量,分别作为k个类的第一中心值,其中k > 2 ;S303、建立与第一中心值对应的k个第一聚类,计算所述多个样本图像特征向量与所述k个第一聚类的第一中心值的相似度,将所述多个样本图像特征向量分别归到与所述k个第一聚类的第一中心值相似度最高的类中;S304、通过计算k个第一聚类中每类包含的每个样本图像特征向量与所在类的第一中心值的差值,获得所述多个样本图像特征向量到第一中心值的平均距离;S305、计算k个第一聚类中每类包含的样本图像特征向量的均值,将其作为第二中心值;进入分类步骤;分类步骤包括S306、建立与第二中心值对应的k个第二聚类,计算所述多个样本图像特征向量与所述k个第二聚类的第二中心值的相似度,将所述多个样本图像特征向量分别归到与所述k个第二聚类的第二中心值相似度最高的类中;S307、通过计算k个第二聚类中每类包含的每个样本图像特征向量与所在类的第二中心值的差值,获得所述多个样本图像特征向量到第二中心值的平均距离;S308、判断到第二中心值的平均距离与到第一中心值的平均距离的差是否小于预设的阈值;S309、如果否,将到第二中心值的平均距离作为到第一中心值的平均距离,计算k个第二聚类中每类包含的样本图像特征向量的均值,将其作为第二中心值,重新进入分类步骤;S310、如果是,获得第二聚类,结束该流程。下面再对步骤S102中的代表特征向量进行解释,如步骤S102所述,一个代表特征向量具体通过提取聚为一类的样本图像的图像特征向量的特征获得,在这里,提取聚为一类的多个样本图像的图像特征向量的特征的目的,就是为了更加准确的描述样本图像的特征,以适应各种图像质量的图像识别,例如,一个代表特征向量具体可以通过计算聚为一类的样本图像的图像特征向量平均值获得。 当然提取聚为一类的样本图像的图像特征向量的特征,不仅仅限于取平均值的方法,例如,还可以是按照该聚为一类的各个图像特征向量出现的频率,做一个权重的分配,再计算均值的方法,或者其他在本发明的启示下提出的其他方法。下面,再对步骤S102所述查询与所述目标图像的图像特征向量匹配的代表特征向量进行解释,在本发明提供的一个实施例中,例如,所述查询与目标图像的图像特征向量匹配的代表特征向量具体可以通过以下步骤查询分别计算所述目标图像的图像特征向量与各个代表特征向量的差值;选择差值最小的代表特征向量作为与所述目标图像的图像特征向量匹配的代表特征向量。例如目标图像的图像特征向量表示为X = [X1, X2, . . . xj,代表特征向量表示为X = Lr1, r2, . . . rj,计算所述目标图像的图像特征向量与各个代表特征向量的差值,如差值 D = I X1T11 +1 x2-r21 +· · · +1 xL-rL I。考虑到即使差值最小的代表特征向量也有可能不是与所述目标图像的图像特征向量匹配的代表特征向量,为了解决这个问题,在图像识别之前,可以通过反复试验或者经验,预先找到一个能够确定目标图像识别失败的差值标准,再利用该差值标准找出图像识别失败的情况,例如,可以包括如下步骤判断所述目标图像的图像特征向量与各个代表特征向量的差值是否均超过差值标准;若超过,查询结果为未找到;若未超过,查询结果为所述差值最小的代表特征向量。在本发明方法的一个优选实施例中,在计算目标图像的图像特征向量之前,还可以包括将所述目标图像作为待处理图像,执行以下预处理步骤所述预处理步骤,如图4所示,包括S401、在所述待处理图像上定位限定图像范围的标识,获得所述标识在所述待处理图像上的位置;S402、根据所述标识在所述待处理图像上的位置,更新所述待处理图像为所述标识限定范围内的图像。需要说明的是,对于样本图像来说,其具有与目标图像相同的特点,因此,本发明还包括将所述样本图像作为待处理图像,执行所述预处理步骤获得更新的样本图像,所述样本图像的图像特征向量具体通过提取所述更新的样本图像的特征获得。下面,对所述预处理步骤中所述限定图像范围的标识,进行详细阐述在本发明的一个实施例中,所述限定图像范围的标识具体可以为特定闭合曲线,所述标识限定的范围具体为所述特定闭合曲线所包围的范围,具体地,所述特定闭合曲线,在具体实施时,可以是一个矩形框,或者其他便于定位和计算的闭合曲线;另外,如步骤S401所述,在待处理图像上定位限定图像范围的标识,则所述特定闭合曲线一定在所述待处理图像上,例如,如图5所示的卡片图像,大写字母A为图像内容,在卡片上有一个矩形线框501,该矩形线框501为所述特定闭合曲线。
在该实施例中,如图6所示,在所述待处理图像上定位所述标识具体可以通过以下步骤进行定位,包括S601、利用特定闭合曲线模板将特定闭合曲线投影在所述待处理图像上,计算出特定闭合曲线的投影线在待处理图像上的位置;具体地,参见图7所示所述特定闭合曲线模板将特定闭合曲线投影在所述待处理图像上的效果,投影线701为特定闭合曲线模板投影在所述待处理图像上的投影线,通过投影,可以获得特定闭合曲线的投影线701在待处理图像上的位置。S602、通过调整特定闭合曲线模板的角度和位置、调整所述待处理图像的缩放尺寸,计算在调整过程中的任意调整状态下第一图像与第二图像的色差值,所述第一图像具体为所述待处理图像上的投影线一侧预设范围内的图像,所述第二图像具体为所述待处理图像上的投影线另一侧预设范围内的图像;在这里,所述预设范围内的图像范围不宜过大,一般设置为矩形框变长的十分之一为宜,具体地,例如,参见图7所示,所述第一图像为所述待处理图像上的投影线701外侧与虚线框702之间范围内的图像,所述第二图像为待处理图像上的投影线701内侧与点线框703之间范围内范围。S603、在所述色差值最大时,将特定闭合曲线的投影线在待处理图像上的位置作为所述标识在所述待处理图像上的位置。具体地,例如,参见图8,在所述第一图像与第二图像的色差值最大时,可以认为特定闭合曲线的投影线801将所述待处理图像上的特定闭合曲线804套在了投影线801内侧与点线框803之间范围内的第一图像,从而可以将特定闭合曲线的投影线在待处理图像上的位置作为所述标识在所述待处理图像上的位置。在本发明的另一个实施例中,所述限定图像范围的标识具体可以为N个第一特殊图形、且所述N个第一特殊图形相连形成的N边形符合第二特殊图形,所述标识限定的范围具体为所述N个第一特殊图形相连形成的N边形所包围的范围,其中所述N个第一特殊图形的中心点不在同一条直线上,N大于等于3,具体地,例如,如图9所示,在矩形卡片图像上,四个角总共有4个第一特殊图形,菱形901、902、903和904,形成的4边形符合第二特殊图形,即等边矩形905。在该实施例中,如图10所示,在所述待处理图像上定位所述标识具体可以通过以下步骤进行定位,包括S1001、计算所述待处理图像上各像素点的像素值和位置;S1002、通过所述各像素点的像素值和位置,确定像素值不为O且位置相邻的像素点所形成的各个待选图形,并计算各个待选图形在所述待处理图像上的位置;在该实施例中,认为待处理图像为白色为底色的图像,可以通过确定像素值不为O且位置相邻的像素点,定位待处理图像上的各个图形,各个图形的描述方法,具体可以采取将待处理图像上像素值不为O且位置相邻的像素点形成的阵列用向量的形式表示出来的方法。S1003、从各个待选图形中筛选出与第一特殊图形相似程度超过标准值的第一待选图形;
需要说明的是,筛选的方法,具体可以通过将各个待选图形的向量与预先已知的标准的第一特殊图形的向量进行比较,获得与第一特殊图形相似度超过标准值的第一待选图形,这里的标准值,具体可以根据方案实施需要或者反复试验,确定比较准确的相似度标准值,例如,上述四个角有4个菱形的矩形卡片,经过所述步骤S1003,至少会筛选出4个与菱形相似度超过标准值的第一待选图形。S1004、若第一待选图形的个数总和大于等于N,从各个第一待选图形中,筛选出N个第一待选图形,其中心点相连形成的N边形与第二特殊图形的相似程度最高,将所述筛选出的N个第一待选图形在所述待处理图像上的位置作为所述标识在所述待处理图像上的位置;需要说明的是,如果待处理图像由于意外情况,限定待处理图像范围的标识部分缺失,将导致无法定位所述标识,在该实施例中,会发生定位失败的情况,因此,首先要判断第一待选图形的个数总和是否大于等于约定的第一特殊图形的个数,如果是,才能继续进行定位,否则,将定位失败;对于筛选出的第一待选图形,因为在待处理图像本身也可能包含符合第一特殊图形的图形,因此,需要从中找出其中心点相连形成的N边型与第二特殊图形最相似的作为所述标识在所述待处理图像上的位置,以排除待处理图像本身图像的干扰。S1005、否则,定位失败。在该实施例中,如图11所示,在所述待处理图像上定位所述标识具体还可以通过以下步骤进行定位,包括S1101、利用第一特殊图形模板将第一特殊图形边缘投影在所述待处理图像上,计算出第一特殊图形边缘的投影线在待处理图像上的位置;S1102、通过调整第一特殊图形模板的角度和位置、调整所述待处理图像的缩放尺寸,计算在调整过程中的任意调整状态下第一图像与第二图像的色差值,所述第一图像具体为所述待处理图像上的投影线一侧预设范围内的图像,所述第二图像具体为所述待处理图像上的投影线另一侧预设范围内的图像;S1103、在所述色差值最大时,将第一特殊图形边缘的投影线在待处理图像上的位置作为所述第一特殊图形在所述待处理图像上的位置;S1104、重复以上步骤SllOl到S1103直到无法找到第一特殊图形在所述待处理图像上更新的位置;
S1105、是否找到的第一特殊图形个数大于等于N ;S1106、如果是,从找到的各个第一特殊图形中,筛选出N个第一特殊图形,其中心点相连形成的N边形与第二特殊图形的相似程度最高,将所述筛选出的N个第一特殊图形在所述待处理图像上的位置作为所述标识在所述待处理图像上的位置;S1107、否则,定位失败。需要说明的是,在经过所述预处理步骤之后,所得到的更新的待处理图像有可能由于在定位过程中调整了图像的尺寸和角度,导致图像的尺寸和角度不符合识别标准,在后续计算图像特征向量时,提取的特征不符合预先设计,因此,所述预处理步骤还包括在更新所述待处理图像为所述标识限定范围内的图像之后,调整所述待处理图像为标准尺寸和标准角度的图像。在本发明的一个具体实施场景中,例如,卡片识别,用户在数字摄像设备前合适的位置出示卡片,数字摄像设备实时采集卡片的拍摄图像,再传输到图像识别程序,即利用本发明方法实现的图像识别程序中进行图像识别,在该实施场景下,所述目标图像具体可以通过数字摄像设备采集目标的拍摄图像实时获取,所述样本图像具体为对每个拍摄目标,通过调整各种拍摄条件,采集的多个拍摄图像,具体地,例如,为了适应不同的环境和光照条件下的图像识别,对每个拍摄目标,通过调整拍摄条件,采集1200个拍摄图像作为样本图像。下面,对本发明的另一个实施场景进行举例说明,例如,本发明的实际应用为一个卡片识别互动的应用,预先设置有游戏规则,不同的识别结果对应不同的执行指令,因此,本发明还可以包括在预先设置的游戏规则中,查询出所述查询结果所对应的执行指令;执行所述执行指令。另外,在该实施场景中,本发明还可以包括输出查询结果对应的语音文件到音频设备,从而达到卡片识别互动的效果。本发明还提供一种图像识别的装置,参见图12,为本发明装置的一个实施例的组成图,如图所示,包括计算单元1201 :用于计算所述目标图像的图像特征向量,将所述目标图像的图像特征向量发送至查询单元;查询单元1202 :用于查询与所述目标图像的图像特征向量匹配的代表特征向量,返回查询结果,其中,一个代表特征向量通过提取聚为一类的样本图像的图像特征向量的特征获得,所述聚为一类的样本图像的图像特征向量按照多个样本图像的图像特征向量相似度聚类获得,所述样本图像的图像特征向量通过提取与所述目标图像的图像特征向量相同的特征获得。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围 内。
权利要求
1.一种图像识别方法,其特征在于,包括 计算目标图像的图像特征向量; 查询与所述目标图像的图像特征向量匹配的代表特征向量; 返回查询结果; 其中,一个代表特征向量通过提取聚为一类的样本图像的图像特征向量的特征获得;所述聚为一类的样本图像的图像特征向量按照多个样本图像的图像特征向量相似度聚类获得; 所述样本图像的图像特征向量通过提取与所述目标图像的图像特征向量相同的特征获得。
2.根据权利要求I所述的方法,其特征在于,所述计算目标图像的图像特征向量具体包括 根据预先设置的分块要求分割所述目标图像,获得子图像块; 计算所述子图像块的颜色直方图向量和梯度直方图向量; 将所述子图像块的颜色直方图向量和梯度直方图向量组合,获得所述目标图像的图像特征向量。
3.根据权利要求I所述的方法,其特征在于,所述聚为一类的样本图像的图像特征向量按照多个样本图像的图像特征向量相似度聚类获得具体包括以下步骤 获得多个样本图像特征向量; 从多个样本图像特征向量中,随机选取k个样本图像特征向量,分别作为k个类的第一中心值,其中k > 2 ; 建立与第一中心值对应的k个第一聚类,计算所述多个样本图像特征向量与所述k个第一聚类的第一中心值的相似度,将所述多个样本图像特征向量分别归到与所述k个第一聚类的第一中心值相似度最高的类中; 通过计算k个第一聚类中每类包含的每个样本图像特征向量与所在类的第一中心值的差值,获得所述多个样本图像特征向量到第一中心值的平均距离; 计算k个第一聚类中每类包含的样本图像特征向量的均值,将其作为第二中心值; 进入分类步骤; 分类步骤包括 建立与第二中心值对应的k个第二聚类,计算所述多个样本图像特征向量与所述k个第二聚类的第二中心值的相似度,将所述多个样本图像特征向量分别归到与所述k个第二聚类的第二中心值相似度最高的类中; 通过计算k个第二聚类中每类包含的每个样本图像特征向量与所在类的第二中心值的差值,获得所述多个样本图像特征向量到第二中心值的平均距离; 判断到第二中心值的平均距离与到第一中心值的平均距离的差是否小于预设的阈值; 如果否,将到第二中心值的平均距离作为到第一中心值的平均距离,计算k个第二聚类中每类包含的样本图像特征向量的均值,将其作为第二中心值,重新进入分类步骤; 如果是,获得第二聚类,结束该流程。
4.根据权利要求I所述的方法,其特征在于,一个代表特征向量具体通过计算聚为一类的样本图像的图像特征向量平均值获得。
5.根据权利要求I所述的方法,其特征在于,所述查询与目标图像的图像特征向量匹配的代表特征向量具体通过以下步骤查询 分别计算所述目标图像的图像特征向量与各个代表特征向量的差值; 选择差值最小的代表特征向量作为与所述目标图像的图像特征向量匹配的代表特征向量。
6.根据权利要求5所述的方法,其特征在于,还包括 判断所述目标图像的图像特征向量与各个代表特征向量的差值是否均超过差值标准; 若超过,查询结果为未找到; 若未超过,查询结果为所述差值最小的代表特征向量。
7.根据权利要求I所述的方法,其特征在于,在计算目标图像的图像特征向量之前,还包括 将所述目标图像作为待处理图像,执行以下预处理步骤; 所述预处理步骤包括 在所述待处理图像上定位限定图像范围的标识,获得所述标识在所述待处理图像上的位置; 根据所述标识在所述待处理图像上的位置,更新所述待处理图像为所述标识限定范围内的图像。
8.根据权利要求7所述的方法,其特征在于,还包括将所述样本图像作为待处理图像,执行所述预处理步骤获得更新的样本图像,所述样本图像的图像特征向量具体通过提取所述更新的样本图像的特征获得。
9.根据权利要求7或8所述的方法,其特征在于,所述限定图像范围的标识具体为特定闭合曲线,所述标识限定的范围具体为所述特定闭合曲线所包围的范围。
10.根据权利要求9所述的方法,其特征在于,在所述待处理图像上定位所述标识具体通过以下步骤定位 利用特定闭合曲线模板将特定闭合曲线投影在所述待处理图像上,计算出特定闭合曲线的投影线在待处理图像上的位置; 通过调整特定闭合曲线模板的角度和位置、调整所述待处理图像的缩放尺寸,计算在调整过程中的任意调整状态下第一图像与第二图像的色差值,所述第一图像具体为所述待处理图像上的投影线一侧预设范围内的图像,所述第二图像具体为所述待处理图像上的投影线另一侧预设范围内的图像; 在所述色差值最大时,将特定闭合曲线的投影线在待处理图像上的位置作为所述标识在所述待处理图像上的位置。
11.根据权利要求7或8所述的方法,其特征在于,所述限定图像范围的标识具体为N个第一特殊图形、且所述N个第一特殊图形相连形成的N边形符合第二特殊图形,所述标识限定的范围具体为所述N个第一特殊图形相连形成的N边形所包围的范围,其中所述N个第一特殊图形的中心点不在同一条直线上,N大于等于3。
12.根据权利要求11所述的方法,其特征在于,在所述待处理图像上定位所述标识具体通过以下步骤定位 计算所述待处理图像上各像素点的像素值和位置; 通过所述各像素点的像素值和位置,确定像素值不为O且位置相邻的像素点所形成的各个待选图形,并计算各个待选图形在所述待处理图像上的位置; 从各个待选图形中筛选出与第一特殊图形相似程度超过标准值的第一待选图形; 若第一待选图形的个数总和大于等于N,从各个第一待选图形中,筛选出N个第一待选图形,其中心点相连形成的N边形与第二特殊图形的相似程度最高,将所述筛选出的N个第一待选图形在所述待处理图像上的位置作为所述标识在所述待处理图像上的位置; 否则,定位失败。
13.根据权利要求11所述的方法,其特征在于,在所述待处理图像上定位所述标识具体通过以下步骤定位 利用第一特殊图形模板将第一特殊图形边缘投影在所述待处理图像上,计算出第一特殊图形边缘的投影线在待处理图像上的位置; 通过调整第一特殊图形模板的角度和位置、调整所述待处理图像的缩放尺寸,计算在调整过程中的任意调整状态下第一图像与第二图像的色差值,所述第一图像具体为所述待处理图像上的投影线一侧预设范围内的图像,所述第二图像具体为所述待处理图像上的投影线另一侧预设范围内的图像; 在所述色差值最大时,将第一特殊图形边缘的投影线在待处理图像上的位置作为所述第一特殊图形在所述待处理图像上的位置; 重复以上步骤直到无法找到第一特殊图形在所述待处理图像上更新的位置; 若在所述待处理图像上找到的第一特殊图形个数大于等于N,从找到的各个第一特殊图形中,筛选出N个第一特殊图形,其中心点相连形成的N边形与第二特殊图形的相似程度最高,将所述筛选出的N个第一特殊图形在所述待处理图像上的位置作为所述标识在所述待处理图像上的位置; 否则,定位失败。
14.根据权利要求7或8所述的方法,其特征在于,所述预处理步骤还包括在更新所述待处理图像为所述标识限定范围内的图像之后,调整所述待处理图像为标准尺寸和标准角度的图像。
15.根据权利要求I所述的方法,其特征在于,还包括 在预先设置的游戏规则中,查询出所述查询结果所对应的执行指令; 执行所述执行指令。
16.根据权利要求I所述的方法,其特征在于,所述目标图像具体通过数字摄像设备采集目标的拍摄图像实时获取; 所述样本图像具体为对每个拍摄目标,通过调整各种拍摄条件,采集的多个拍摄图像。
17.根据权利要求I所述的方法,其特征在于,还包括 输出查询结果对应的语音文件到音频设备。
18.一种图像识别装置,其特征在于,包括 计算单元用于计算所述目标图像的图像特征向量,将所述目标图像的图像特征向量发送至查询单元;查询单元用于查询与所述目标图像的图像特征向量匹配的代表特征向量,返回查询结果,其中,一个代表特征向量通过提取聚为一类的样本图像的图像特征向量的特征获得 ,所述聚为一类的样本图像的图像特征向量按照多个样本图像的图像特征向量相似度聚类获得,所述样本图像的图像特征向量通过提取与所述目标图像的图像特征向量相同的特征获得。
全文摘要
本发明公开了一种图像识别方法及装置,以实现能够对各种图像质量的图像进行准确识别的目的,包括计算目标图像的图像特征向量;查询与所述目标图像的图像特征向量匹配的代表特征向量;返回查询结果;其中,一个代表特征向量通过提取聚为一类的样本图像的图像特征向量的特征获得;所述聚为一类的样本图像的图像特征向量按照多个样本图像的图像特征向量相似度聚类获得;所述样本图像的图像特征向量通过提取与所述目标图像的图像特征向量相同的特征获得;因为每个代表特征向量都是一类图像质量的样本图像的特征,能够体现各种图像质量的样本图像的特点,为图像提供了更加准确的特征描述,从而使对目标图像的识别更加准确,具有更高的识别能力。
文档编号G06K9/54GK102930296SQ20121043063
公开日2013年2月13日 申请日期2012年11月1日 优先权日2012年11月1日
发明者周晨 申请人:长沙纳特微视网络科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1