图像识别方法、装置、设备和计算机可读介质与流程

文档序号:24335333发布日期:2021-03-19 12:15阅读:107来源:国知局
图像识别方法、装置、设备和计算机可读介质与流程

本发明涉及机器视觉领域,具体涉及一种图像识别方法、装置、设备和计算机可读介质。



背景技术:

图像识别技术是本领域已知的。目前针对一些图像的识别,尤其是对于一些尺寸比较小、分辨率比较低的纹理图像的识别,存在识别成功率低、脱靶率高的问题。现有的一些解决方案无法明显提升识别率,或者计算开销较大。



技术实现要素:

有鉴于此,本发明实施例致力于提供一种能够明显提高识别成功率、计算开销小的图像识别方法。

在一方面,本发明提供了一种图像识别方法,包括:获取具有原始纹理的原始图像;根据原始纹理的特征,扩展原始图像,得到扩展图像;识别扩展图像。

根据本发明的一个具体实施例,扩展图像包括原始图像和在原始图像外侧生成的外侧图像。

根据本发明的一个具体实施例,根据原始纹理的特征,扩展原始图像,得到扩展图像,包括:根据原始纹理的延伸方向,扩展原始图像,得到扩展图像。

根据本发明的一个具体实施例,根据原始纹理的延伸方向,扩展原始图像,得到扩展图像,包括:根据原始纹理的延伸方向,确定外侧图像中的第一待填充像素的第一方向场;根据第一方向场,确定第一待填充像素的像素值;根据外侧图像中的所有第一待填充像素的像素值,生成外侧图像,从而得到扩展图像。

根据本发明的一个具体实施例,根据原始纹理的延伸方向,确定外侧图像中的第一待填充像素的第一方向场,包括:确定原始图像的边缘上的像素中最靠近第一待填充像素的第一参考像素的位置;根据第一参考像素的第二方向场,确定第一方向场。其中,根据第一方向场,确定第一待填充像素的像素值,包括:根据第一待填充像素的位置、第一方向场以及第一待填充像素与第一参考像素的第一距离,确定原始图像的第二参考像素的位置;根据第二参考像素的像素值,确定第一待填充像素的像素值。

根据本发明的一个具体实施例,根据第一待填充像素的位置、第一方向场以及第一待填充像素与第一参考像素的第一距离,确定原始图像的第二参考像素的位置,包括:根据第一距离,确定第二参考像素与第一待填充像素之间、在第一待填充像素和第一参考像素共同所在的第一直线的方向上的第二距离;确定第一方向场的方向与第一直线的夹角;将第二距离除以夹角的正切值,得到第二参考像素与第一待填充像素之间、在与第一直线相垂直的第二直线的方向上的第三距离;根据第一待填充像素的位置以及第二和第三距离,确定第二参考像素的位置。

根据本发明的一个具体实施例,根据原始纹理的特征,扩展原始图像,得到扩展图像,包括:根据原始纹理的重复周期,扩展原始图像,得到扩展图像。

根据本发明的一个具体实施例,根据原始纹理的重复周期,扩展原始图像,得到扩展图像,包括:根据原始图像,确定外侧图像中的第二待填充像素的第一梯度场;根据第一梯度场,判断原始纹理的重复周期;根据重复周期,确定第二待填充像素的像素值;根据外侧图像中的所有第二待填充像素的像素值,生成外侧图像,从而得到扩展图像。

根据本发明的一个具体实施例,根据原始图像,确定外侧图像中的第二待填充像素的第一梯度场,包括:确定原始图像的边缘上的像素中最靠近第二待填充像素的第三参考像素的位置;根据第三参考像素的第二梯度场,确定第一梯度场。其中,根据第一梯度场,判断原始纹理的重复周期,包括:沿第一梯度场的方向,找到原始图像中的像素值为局部极值的第四和第五参考像素;判断第四和第五参考像素的间隔距离;根据间隔距离,确定重复周期。

根据本发明的一个具体实施例,根据重复周期,确定第二待填充像素的像素值,包括:从第二待填充像素的位置出发,沿第一梯度场的方向,找到原始图像中与第二待填充像素相隔间隔距离的第六参考像素;根据第六参考像素的像素值,确定第二待填充像素的像素值。

在另一方面,本发明提供一种图像识别装置,包括:获取模块,用于获取具有原始纹理的原始图像;扩展模块,用于根据原始纹理的特征,扩展原始图像,得到扩展图像;识别模块,用于识别扩展图像。

在另一方面,本发明提供一种图像识别设备,包括:处理器;存储器;应用程序,应用程序存储在存储器中,并配置成由处理器执行,应用程序包括用于执行上述的图像识别方法的指令。

在另一方面,本发明提供一种计算机可读介质,计算机可读介质存储有计算机程序,计算机程序用于执行上述的图像识别方法。

在识别图像之前对图像进行扩展,能够提高识别率,降低图像识别的脱靶率。以根据原始纹理特征的方式扩展图像的边界,能够使扩展后的图像与扩展前的图像在纹理的某些方面(比如走向、宽度、纹样等)保持一致,这相当于扩展了纹理的可识别面积,使得纹理被成功识别的概率更高。

附图说明

图1示出根据本发明一实施例的图像识别方法的流程示意图;

图2示出根据本发明一实施例的图像识别方法的流程示意图;

图3示出根据本发明一实施例的图像识别方法的流程示意图;

图4示出根据本发明一实施例的图像扩展方法的示意图;

图5示出根据本发明一实施例的图像识别方法的流程示意图;

图6示出根据本发明一实施例的图像识别方法的流程示意图;

图7示出根据本发明一实施例的图像扩展方法的示意图;

图8示出根据本发明一实施例的图像识别装置的结构示意图;

图9示出根据本发明一实施例的图像识别设备的结构示意图。

具体实施方式

为了使本领域技术人员更加清楚地理解本发明的概念和思想,以下结合具体实施例详细描述本发明。应理解,本文给出的实施例都只是本发明可能具有的所有实施例的一部分。本领域技术人员在阅读本申请的说明书以后,有能力对下述实施例的部分或整体作出改进、改造、或替换,这些改进、改造、或替换也都包含在本发明要求保护的范围内。

在本文中,术语“第一”、“第二”和其它类似词语并不意在暗示任何顺序、数量和重要性,而是仅仅用于对不同的元件进行区分。在本文中,术语“一”、“一个”和其它类似词语并不意在表示只存在一个所述事物,而是表示有关描述仅仅针对所述事物中的一个,所述事物可能具有一个或多个。在本文中,术语“包含”、“包括”和其它类似词语意在表示逻辑上的相互关系,而不能视作表示空间结构上的关系。例如,“a包括b”意在表示在逻辑上b属于a,而不表示在空间上b位于a的内部。另外,术语“包含”、“包括”和其它类似词语的含义应视为开放性的,而非封闭性的。例如,“a包括b”意在表示b属于a,但是b不一定构成a的全部,a还可能包括c、d、e等其它元素。

在本文中,术语“实施例”、“本实施例”、“一实施例”、“一个实施例”并不表示有关描述仅仅适用于一个特定的实施例,而是表示这些描述还可能适用于另外一个或多个实施例中。本领域技术人员应理解,在本文中,任何针对某一个实施例所做的描述都可以与另外一个或多个实施例中的有关描述进行替代、组合、或者以其它方式结合,所述替代、组合、或者以其它方式结合所产生的新实施例是本领域技术人员能够容易想到的,属于本发明的保护范围。

在本发明各实施例中,图像可以是指物体反射或透射的光线分布在人脑中所形成的印象或认识。按照图像的形态分,图像可以包括静态图像,如照片、图片等,也包括动态图像,如视频、动图(如gif(图像交换格式)图片)等。按图像的产生方式分,图像可以包括用相机或其它成像装置拍摄的图像、人工绘制或合成的图像、以及机器自动绘制或合成的图像。按照图像(尤其是数字图像)的格式分,图像可以包括jpeg(联合图像专家组)图像、png(便携式网络图形)图像、bmp(位图)图像、tiff(标签图像文件格式)图像和dicom(医学成像和通信标准)图像。按照图像的用途分,图像包括生活场景图像(生活照、自拍照、旅游照等)、身份识别图像(面部图像、指纹图像、虹膜图像、步态图像等)、医学图像(ct图像、x射线图像、核磁共振图像、b超(b型超声波)图像等)、地质图像(地质雷达图像、岩石薄片图像等)、工业检测图像(如探伤图像)、监控图像(可见光视频监控图像、红外视频监控图像)、天文观测图像、电子显微镜图像等等。

在本发明各实施例中,图像识别可以是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。图像识别可以包括指纹图像识别、面部图像识别、车牌图像识别、医疗图像识别、地质图像识别等。在本发明各实施例中,图像识别的一般步骤包括图像采集、图像预处理、特征提取、图像识别。

以下结合图1描述本发明一实施例的图像识别方法。

根据本实施例,图像识别方法100包括:

s110,获取具有原始纹理的原始图像;

s120,根据原始纹理的特征,扩展原始图像,得到扩展图像;

s130,识别扩展图像。

根据本实施例,在识别图像之前对图像进行扩展,能够提高识别率,降低图像识别的脱靶率。以根据原始纹理特征的方式扩展图像的边界范围,能够使扩展后的图像与扩展前的图像在纹理的某些方面(比如走向、宽度、纹样等)保持一致,这相当于扩展了纹理的可识别面积,使得纹理被成功识别的概率更高。

在一实施例中,纹理可以是指物体面上的花纹或线条,是物体上呈现的线形、块状纹路。在一实施例中,纹理可以是指具有方向性、重复性的图案。在一实施例中,纹理可以具有纹理走向,例如对于条纹状的纹理,单个条纹的延伸方向就是纹理的走向或延伸方向。在一实施例中,纹理可以具有重复周期,例如对于条纹状的纹理,相同颜色的条纹之间相隔的距离就是纹理的重复周期。在一实施例中,纹理还可以具有单位面积,比如对于规则分布的点状纹理,每个点的大小就是纹理的单位面积。在一实施例中,纹理还可以具有重复单元,比如足球表面的纹理,其表面上的五边形和六边形就可以看做是一个重复单元。在一实施例中,纹理可以是指生物特征纹理,例如指纹、掌纹、静脉纹理、虹膜纹理等。纹理还可以具有其他特征。

在一实施例中,具有纹理的图像可以是指整个图像上都显示纹理的图像,也可以是指图像中仅有一部分显示纹理、其他部分不显示纹理的图像。在一实施例中,获取具有原始纹理的原始图像,可以是指通过图像采集设备(例如摄像头)采集到纹理图像,例如通过指纹采集装置采集指纹图像;也可以是指读取存储在存储器中的纹理图像,例如预先存储在指纹识别设备中的模板图像。

在一实施例中,根据纹理的特征,可以是指保持纹理的延伸方向、重复周期、图像样式、重复单元大小等各种特征不变或基本不变。在一实施例中,扩展图像可以是指使图像的面积扩大的任何操作手段。在一优选实施例中,扩展图像仅指在图像的外部形成新的图像边界,从而扩大图像的显示面积。在一实施例中,根据纹理的特征扩展图像,可以是指,使图像的显示面积增大,并在新的图像部分中再现原始图像中的纹理特征,使得扩展之后的图像相对于未扩展的图像能够显示出更多的纹理。在一实施例中,根据原始纹理的特征,扩展原始图像,得到扩展图像,可以是指,保持原始纹理的某些方面不变,将原始图像的显示面积增大,在增大的部分中能够体现原始纹理的某些特征,这样得到的图像作为扩展图像。在一实施例中,根据原始纹理的特征,扩展原始图像,得到扩展图像,可以是图像识别的通常步骤(图像采集、图像预处理、特征提取、图像识别)中的预处理步骤中所包括的一个过程。

在一实施例中,识别扩展图像,可以是指,通过识别设备识别扩展之后所得到的图像,从而得到所希望的结果,比如对于指纹图像,通过识别得到该指纹是否属于与预先登记的指纹模板相同的指纹,从而确定该指纹所属的人员是否具有特定的身份,比如是否允许该人员进入特定场所。

以下描述根据本发明的另一实施例,本实施例是图1实施例的一个具体实例,可以包括上述所有实施例中的一个或多个实施例中的一个或多个特征。

根据本实施例,扩展图像包括原始图像和在原始图像外侧生成的外侧图像。

根据本实施例,扩展图像包括原始图像和外侧图像,意味着根据本实施例的扩展图像是在保持原始图像不变的基础上生成新的部分而得到的。这样的扩展方式比起直接拉伸原始图像等扩展方式能够更加有效地扩大原始图像的可识别内容的面积。给图像增加新的内容,而不仅仅是简单扩展图像的尺寸(比如拉伸、缩放等),能够增强图像特征的明显程度和可识别性,从而提高识别率。

在一实施例中,外侧图像可以是指位于原始图像的一侧,与原始图像紧挨或相隔一段距离的图像。外侧图像的位置可以根据需要设置,例如设置在原始图像的上侧、下侧、左侧和/或右侧等。在一实施例中,原始图像可以呈除矩形以外的其它形状,例如圆形,此时外侧图像可以设置在原始图像的任何方向上的外侧,也可以设置在原始图像的整个周围,形成环形的外侧图像。在一实施例中,对于细长的原始图像,外侧图像可以设置在原始图像的宽度方向两侧,从而增加原始图像的宽度,以利于进行识别。

以下描述根据本发明的另一实施例,本实施例是图1实施例的一个具体实例,可以包括上述所有实施例中的一个或多个实施例中的一个或多个特征。

根据本实施例,s120包括:

根据原始纹理的延伸方向,扩展原始图像,得到扩展图像。

根据本实施例,以根据纹理延伸方向的方式扩展原始图像,能够使纹理的走向趋势更加明显,从而使通过纹理的延伸和走向来表达的纹理特征能够被更加准确地捕捉和识别到。

在一实施例中,原始纹理的延伸方向,可以是指原始纹理中的细长形状的长度方向。例如,对于条纹状的纹理,纹理的延伸方向就是条纹中的长条的长度方向。如果该长条是直线形状的,那么整个长条向左或向右延展的方向就是纹理的延伸方向。如果该长条是曲线形状的,那么纹理的延伸方向是针对长条上的每一点来说的,长条上某点的切线方向就是纹理在该点上的延伸方向。

在一实施例中,根据原始纹理的延伸方向,可以是指,保持原始纹理的延伸方向不变或基本不变,再进行下一步操作。在一实施例中,根据原始纹理的延伸方向,扩展原始图像,得到扩展图像,可以是指,在原始图像的外侧(紧靠原始图像或与原始图像隔一段距离)生成新的图像部分,该新的图像部分中也具有与原始图像中的纹理类似的纹理,并且该新的图像部分中的纹理的延伸方向与原始图像中的纹理的延伸方向是一致或基本一致的。例如,该新的图像部分中的纹理是紧接着原始图像中的纹理的边界而生成的,从而延续原始纹理的图案。

以下参照图2描述根据本发明的另一实施例,本实施例是图1实施例的一个具体实例,可以包括上述所有实施例中的一个或多个实施例中的一个或多个特征。

根据本实施例,s120进一步包括:

s210,根据原始纹理的延伸方向,确定外侧图像中的第一待填充像素的第一方向场;

s220,根据第一方向场,确定第一待填充像素的像素值;

s230,根据外侧图像中的所有第一待填充像素的像素值,生成外侧图像,从而得到扩展图像。

根据本实施例,通过方向场来表达原始纹理的延伸方向,能够简单有效地确定原始纹理的走向特征。方向场的计算有很多可用的手段。根据方向场来计算原始纹理的走向和趋势,能够以较为简单的算法确定外侧图像的内容,从而高效地生成能够体现和根据原始纹理特征的外侧图像。

在一实施例中,方向场可以是指对于任意一点(x,y),该点的方向场可以定义为其所在脊线(或谷线)位置的切线方向与水平轴之间的夹角。方向场的计算方法包括基于梯度的方法、基于模型的方法、基于滤波器的方法、基于卷积神经网络的方法。在一实施例中,某像素的方向场,可以是指像素所在点的位置上的方向场。

在一实施例中,待填充像素可以是指外侧图像中的像素值未知的像素。如果将外侧图像中的所有像素值未知的像素都赋予了像素值,则外侧图像就生成了。

在一实施例中,根据原始纹理的延伸方向,确定外侧图像中的第一待填充像素的第一方向场,可以是指,通过原始纹理的延伸方向,确定原始纹理的走向,并且假设原始纹理走向在外侧图像中的一定范围内不变,以此确定外侧图像中的待填充像素的方向场。

在一实施例中,根据第一方向场,确定第一待填充像素的像素值,可以是指,根据待填充像素的方向场,确定其可以参考的原始图像中的像素(作为参考像素)。根据该参考像素的像素值,确定该待填充像素的像素值。

在一实施例中,根据外侧图像中的所有第一待填充像素的像素值,生成外侧图像,从而得到扩展图像,可以是指,按照上述方法对外侧图像中的所有未知的像素都填充上像素值之后,整个外侧图像(或外侧图像的一部分)就生成了。外侧图像一旦生成,将原始图像与生成的外侧图像拼接起来,或者在原始图像的边界外直接生成外侧图像,这样就形成了扩展图像。

以下参照图3描述根据本发明的另一实施例,本实施例是图1实施例的一个具体实例,可以包括上述所有实施例中的一个或多个实施例中的一个或多个特征。

根据本实施例,图像识别方法300包括:

s310,获取具有原始纹理的原始图像;

s320,确定原始图像的边缘上的像素中最靠近第一待填充像素的第一参考像素的位置,第一待填充像素在原始图像外侧生成的外侧图像中;

s330,根据第一参考像素的第二方向场,确定第一待填充像素的第一方向场;

s340,根据第一待填充像素的位置、第一方向场以及第一待填充像素与第一参考像素的第一距离,确定原始图像的第二参考像素的位置;

s350,根据第二参考像素的像素值,确定第一待填充像素的像素值;

s360,根据外侧图像中的所有第一待填充像素的像素值,生成外侧图像,从而得到扩展图像,扩展图像包括原始图像和外侧图像;

s370,识别扩展图像。

根据本实施例,由于纹理具有一定的规律性,因此可以假定原始图像的边缘上的参考像素与外侧图像中的待填充像素具有相同的方向场。确定待填充像素的方向场之后,沿方向场的方向去原始图像中寻找目标像素点,再将目标像素点的像素值复制到待填充像素上。这样的方法并不需要很大的计算开销,就能在很大程度上使原始图像的纹理走向在外侧图像中得到保持,使得外侧图像中的纹理是根据原始图像的纹理的延伸方向而形成的,从而提高原始图像的纹理的显著性。

在一实施例中,确定原始图像的边缘上的像素中最靠近第一待填充像素的第一参考像素的位置,可以是指,确定了需要填充的待填充像素的位置以后,在原始图像的边缘上寻找最靠近这个待填充像素的像素。比如,对于在图像的竖直边缘(例如左侧边缘)附近的待填充像素,最靠近待填充像素的边缘像素就是与该待填充像素在同一水平线上的像素;对于在图像的水平边缘(例如顶部边缘)附近的待填充像素,最靠近待填充像素的边缘像素就是与该待填充像素在同一竖直线上的像素;对于在图像的弧形边缘(例如圆形图像的边缘)附近的待填充像素,最靠近待填充像素的边缘像素就是与该待填充像素在同一半径线上的像素。

在一实施例中,根据第一参考像素的第二方向场,确定第一方向场,可以是指,将第一参考像素的方向场直接作为待填充像素的方向场;也可以是指,在第一参考像素的方向场的基础上进行计算或变换,得到的结果作为待填充像素的方向场。

在一实施例中,第一距离即第一待填充像素与第一参考像素之间的直线距离。在一实施例中,根据第一待填充像素的位置、第一方向场以及第一待填充像素与第一参考像素的第一距离,确定原始图像的第二参考像素的位置,可以是指,根据待填充像素的位置、方向场及其与第一参考像素的直线距离,根据几何学的计算方式得到第二参考像素的位置。第二参考像素即是用于确定待填充像素的像素值的像素。

在一实施例中,根据第二参考像素的像素值,确定第一待填充像素的像素值,可以是指,将第二参考像素的像素值直接作为第一待填充像素的像素值,即将第二参考像素的像素值复制到第一待填充像素上;也可以是指,以第二参考像素的像素值为参照或基础,再进行进一步的计算或处理,由此得到的像素值作为第一待填充像素的像素值。

以下描述根据本发明的另一实施例,本实施例是图3实施例的一个具体实例,可以包括上述所有实施例中的一个或多个实施例中的一个或多个特征。

根据本实施例,s340包括:

根据第一距离,确定第二参考像素与第一待填充像素之间、在第一待填充像素和第一参考像素共同所在的第一直线的方向上的第二距离;

确定第一方向场的方向与第一直线的夹角;

将第二距离除以夹角的正切值,得到第二参考像素与第一待填充像素之间、在与第一直线相垂直的第二直线的方向上的第三距离;

根据第一待填充像素的位置以及第二和第三距离,确定第二参考像素的位置。

本实施例通过原始图像中的第二参考像素点的像素值来确定外侧图像中待填充像素点的像素值,并涉及第二参考像素值的位置的确定方式。根据本实施例,能够以简单的函数计算(比如正切函数)得到第二参考像素相对于待填充像素在两个相互垂直的方向(比如水平方向和垂直方向)上的距离,进而确定出第二参考像素相对于待填充像素的位置,实现简单、准确、高效的计算。

在一实施例中,第二参考像素可以是指在原始图像边缘上的、可以将其像素值赋予到未知的待填充像素上的像素。在一实施例中,根据第一距离,确定第二参考像素与第一待填充像素之间、在第一待填充像素和第一参考像素共同所在的第一直线的方向上的第二距离,可以是指:以第一待填充像素与第一参考像素之间的直线距离(即第一距离)为参照,确定第一待填充像素与第二参考像素在第一距离所在的直线(即第一待填充像素与第一参考像素共同所在的直线)上的距离。当待填充像素在原始图像的直线边缘(例如竖直边缘)附近的时候,第一距离与第二距离相等(二者都是待填充像素与竖直边缘的水平距离)。当待填充像素在原始图像的外凸的边缘附近的时候,第一距离小于第二距离。当待填充像素在原始图像的内凹的边缘附近的时候,第一距离大于第二距离。

在一实施例中,确定第一方向场的方向与第一直线的夹角,可以是指,根据待填充像素的方向场所代表的方向(例如通过其与水平线的夹角来表示),确定该方向与待填充像素与第一参考像素共同所在的直线(即第一直线)之间的夹角。例如,当第一待填充像素与第一参考像素在同一条水平线上的时候(此时原始图像的边缘为竖直边缘),第一方向场的方向与第一直线的夹角,就是第一方向场的方向与水平线的夹角。

在一实施例中,将第二距离除以夹角的正切值,得到第二参考像素与第一待填充像素之间、在与第一直线相垂直的第二直线的方向上的第三距离,可以是指:假设第一距离与第二距离相等(此时原始图像的边缘为直线边缘),则第一待填充像素、第一参考像素和第二参考像素形成一个直角三角形,其中第一参考像素所在的点为直角的顶点,第一待填充像素与第一参考像素之间的距离(即第一或第二距离)为直角边,第一待填充像素与第二参考像素之间的距离为斜边,第一参考像素与第二参考像素之间的距离(即第三距离)为另一直角边;第一方向场与第一直线的夹角的正切值,即是第三距离与第二距离的比值;将第二距离除以夹角的正切值,即可得到第三距离。

根据第一待填充像素的位置以及第二和第三距离,确定第二参考像素的位置,可以是指,第二参考像素与第一待填充像素之间的在第一直线上的距离(即第二距离)已知,如果再知道第二参考像素与第一待填充像素之间的在第二直线(即与第一直线相垂直的直线)上的距离(即第三距离),就能精确知道第二参考像素相对于第一待填充像素的位置。

以下参照图4描述根据本发明的另一实施例,本实施例是图3实施例的一个具体实例,可以包括上述所有实施例中的一个或多个实施例中的一个或多个特征。

如图4所示,原始图像401为长方形,其左侧为外侧图像402,原始图像401和外侧图像402共同构成扩展图像。p0为第一待填充像素,p1为第一参考像素,p2为第二参考像素。在原始图像401的边缘上,最接近p0的像素点为p1,因此p1是第一参考像素。假设p1的方向场与p0的方向场是一致的(对于规则纹理图像,方向场在小范围内不会变化),那么p0的方向场可以通过p1的方向场求出。p0与p1共同所在的直线为水平线,p0与p1之间的距离(即第一距离)为dx。p2与p0之间、在p0与p1共同所在的直线(即第一直线,图中为水平线)上的距离(即第二距离)也为dx。因此,第一距离与第二距离相等。由图可知,θ的正切值(即tanθ)即dy与dx的比值,即tanθ=dy/dx。因此,dy=dx/tanθ。根据该公式即可以求出p2与p0在与第一直线(水平线)相垂直的第二直线(竖直线)的方向上的距离(即第三距离),也即dy。根据p0的位置,以及dx和dy的值,即可确定第二参考像素p2的位置。将p2的像素值复制到p0,即完成了未知像素p0的填充。针对外侧图像402中的所有像素执行上述操作,即可填充整个外侧图像(或其一部分,其它部分根据其它方式填充)。

以下描述根据本发明的另一实施例,本实施例是图1实施例的一个具体实例,可以包括上述所有实施例中的一个或多个实施例中的一个或多个特征。

根据本实施例,s120包括:

根据原始纹理的重复周期,扩展原始图像,得到扩展图像。

根据本实施例,通过根据纹理的重复周期来扩展原始图像,能够使纹理的周期性特征得到更加显著的突出,从而使得原始图像中通过纹理的周期重复性来表达的纹理特征能够更加明显地被捕捉和识别到,从而提高原始图像的识别成功率。

在一实施例中,原始纹理的重复周期,可以是指原始纹理中重复出现的单元之间的相隔距离。例如对于条纹状的纹理,纹理的重复周期可以是条纹中相同颜色的长条之间的相隔距离。对于块状的纹理,例如足球表面的纹理,纹理的重复周期可以是相邻两个五边形的相隔距离,或者相邻两个六边形之间的距离。

在一实施例中,根据原始纹理的重复周期,可以是指,保持原始纹理的重复周期不变或基本不变,再进行下一步操作。在一实施例中,根据原始纹理的重复周期,扩展原始图像,得到扩展图像,可以是指,在扩展图像中相对于原始图像的新增部分,其中的纹理也具有重复性,其中的重复单元之间的距离,与原始图像中的重复单元之间的距离是一致或基本一致的。

以下参照图5描述根据本发明的另一实施例,本实施例是图1实施例的一个具体实例,可以包括上述所有实施例中的一个或多个实施例中的一个或多个特征。

根据本实施例,s120进一步包括:

s510,根据原始图像,确定外侧图像中的第二待填充像素的第一梯度场;

s520,根据第一梯度场,判断原始纹理的重复周期;

s530,根据重复周期,确定第二待填充像素的像素值;

s540,根据外侧图像中的所有第二待填充像素的像素值,生成外侧图像,从而得到扩展图像。

根据本实例,通过梯度场来判断重复周期,能够以简单有效的方式来确定纹理的重复特征的扩展方向。梯度场能够表示图像中像素值变化最快的方向,通常该方向就是与纹理的切线垂直的方向,因此,根据梯度场能够判断,在与纹理切线垂直的方向上,纹理的重复周期是多大。梯度场的计算方式有多种成熟的算法。这样的计算方式并不复杂,适合快速有效确定纹理图像的重复周期,进而确定外侧图像中的纹理的重复周期。

在一实施例中,梯度场可以是指图像某像素在x和y两个方向上的变化率(与相邻像素比较),是一个二维向量。经典的图像梯度算法是考虑图像的每个像素的某个邻域内的灰度变化,利用边缘临近的一阶或二阶导数变化规律,对原始图像中像素某个邻域设置梯度算子,通常我们用小区域模板进行卷积来计算,有sobel算子、robinson算子、laplace算子等。

在一实施例中,根据原始图像,确定外侧图像中的第二待填充像素的第一梯度场,可以是指,假设外侧图像中待填充的某像素与原始图像中的某像素的梯度场是一样的,通过求解原始图像中的某像素的梯度场,即可求得带填充像素的梯度场。

在一实施例中,根据第一梯度场,判断原始纹理的重复周期,可以是指,根据待填充像素的梯度场所显示出来的信息,以此为指引,去判断原始图像中与该待填充像素有关联的部分纹理的重复周期。

在一实施例中,根据重复周期,确定第二待填充像素的像素值,可以是指,求得原始图像中与待填充像素有关联的部分纹理的重复周期之后,即可知道待填充像素周围的应该具有的纹理的重复周期。根据待填充像素周围的纹理的重复周期,即可知道第二待填充像素周围的纹理变化规律,以此求得第二待填充像素的像素值。

在一实施例中,根据外侧图像中的所有第二待填充像素的像素值,生成外侧图像,从而得到扩展图像,可以是指,根据上述方法,针对外侧图像中所有适合用上述方法求解的像素点进行求解后,生成一个完整的外侧图像(或外侧图像的一部分),从而得到扩展图像。

以下参照图6描述根据本发明的另一实施例,本实施例是图5实施例的一个具体实例,可以包括上述所有实施例中的一个或多个实施例中的一个或多个特征。

根据本实施例,图像识别方法600包括:

s610,获取具有原始纹理的原始图像;

s620,确定原始图像的边缘上的像素中最靠近第二待填充像素的第三参考像素的位置,第二待填充像素在原始图像外侧生成的外侧图像中;

s630,根据第三参考像素的第二梯度场,确定第二待填充像素的第一梯度场;

s640,沿第一梯度场的方向,找到原始图像中的像素值为局部极值的第四和第五参考像素;

s650,判断第四和第五参考像素的间隔距离;

s660,根据间隔距离,确定重复周期;

s670,从第二待填充像素的位置出发,沿第一梯度场的方向,找到原始图像中与第二待填充像素相隔间隔距离的第六参考像素;

s680,根据第六参考像素的像素值,确定第二待填充像素的像素值;

s690,根据外侧图像中的所有第二待填充像素的像素值,生成外侧图像,从而得到扩展图像,扩展图像包括原始图像和外侧图像;

s691,识别扩展图像。

根据本实施例,通过梯度场确定纹理重复周期的重复方向,通过局部极值确定重复周期的大小(相隔多少像素重复一次),这样通过简单、成熟的算法将纹理的重复特征给表达出来,从而能够根据这种重复特征来在扩展图像中新生成的外侧图像中再现这种重复特征。

在一实施例中,根据第三参考像素的第二梯度场,确定第一梯度场,可以是指,假设梯度场在一定范围内不会变化,那么最靠近第二待填充像素的第三参考像素的梯度场可以直接作为第二待填充像素的梯度场。在一实施例中,根据第三参考像素的第二梯度场,确定第一梯度场,也可以是指,基于第二梯度场进行进一步的计算或变换以后,得到的结果作为待填充像素的第一梯度场。

在一实施例中,沿第一梯度场的方向,找到原始图像中的像素值为局部极值的第四和第五参考像素,可以是指,第一梯度场的方向即是纹理的横截面方向,沿第一梯度场的方向在原始图像中寻找像素值为局部最大值或局部最小值的像素,即可以找到原始图像中的两个波峰(或脊线)或波谷(或谷线)。寻找局部极值的过程可以是,寻找一个像素,该像素的像素值比左右两个像素值都大,作为局部极大值,或者,寻找一个像素,该像素的像素值比左右两个像素值都小,作为局部极小值。其它类似的方法也是可以想到的。

在一实施例中,判断第四和第五参考像素的间隔距离,可以是指,判断原始图像中的重复单元之间的距离。由于第四和第五像素都是局部极值,可以判断这两个像素都位于某个重复单元的相似的位置上,例如都位于指纹的脊线上。计算这两个像素的距离,即可得到原始纹理的重复周期。

在一实施例中,根据间隔距离,确定重复周期,可以是指,直接将求得的间隔距离作为重复周期;也可以是指,在间隔距离的基础上做进一步的计算或处理,得到的结果作为纹理的重复周期。

在一实施例中,从第二待填充像素的位置出发,沿第一梯度场的方向,找到原始图像中与第二待填充像素相隔间隔距离的第六参考像素,可以是指,以第二待填充像素为起点,沿第一梯度场的方向作一条直线,该直线经过原始图像。原始图像的在该直线上的像素点中,与第二待填充像素的相隔距离是通过前述方法求得的间隔距离的点,即可作为第六参考像素。

在一实施例中,根据第六参考像素的像素值,确定第二待填充像素的像素值,可以是指,直接将第六参考像素的像素值作为待填充像素的像素值;也可以是指,基于第六参考像素的像素值,做进一步的计算或处理之后,得到的结果作为第二待填充像素的像素值。

以下参照图7描述根据本发明的另一实施例,本实施例是图6实施例的一个具体实例,可以包括上述所有实施例中的一个或多个实施例中的一个或多个特征。

如图7所示,原始图像701为长方形,左侧细长长方形为外侧图像702。原始图像701与外侧图像702共同构成扩展图像。p3的方向场的方向与水平线的夹角较大(例如大于80°、大于85°、等于90°),因此图4所示的方法不再适用。在本实施例中,p0为未知的待填充像素(即第二待填充像素)。与p0最靠近的在原始图像边缘上的像素点为p3(即与p0在同一水平线上的点)。因为原始图像的纹理的规律性,假设p3的梯度场(如箭头所示,即第二梯度场)与p0的梯度场是一样的,由此求得p0的第一梯度场。从p0出发,沿第一梯度场的方向(即图中长虚线方向),在原始图像中找到两个局部极大值的像素点,即p4(第四参考像素点)和p5(第五参考像素点)。根据p4与p5之间的直线距离t,得到原始图像的原始纹理的重复周期。根据距离t,从p0出发,沿第一梯度场的方向在原始图像中搜索,找到与p0相隔t的像素点p6(即第六参考像素点),以p6的像素值作为p0的像素值,填充p0。对整个外侧图像702进行如上所述的操作,能够得到整个外侧图像(或外侧图像的一部分)的像素值,即生成了外侧图像。外侧图像一旦生成,也就得到了扩展图像。

以下结合图8描述根据本发明一实施例的图像识别装置800。

根据本实施例,图像识别装置800包括:

获取模块810,用于获取具有原始纹理的原始图像;

扩展模块820,用于根据原始纹理的特征,扩展原始图像,得到扩展图像;

识别模块830,用于识别扩展图像。

关于获取模块、扩展模块和识别模块的细节,参见上文关于图1实施例的描述。

在一实施例中,扩展模块被进一步配置成:

根据原始纹理的延伸方向,扩展原始图像,得到扩展图像。

在一实施例中,扩展模块包括:

第一确定单元,用于根据原始纹理的延伸方向,确定外侧图像中的第一待填充像素的第一方向场;

第二确定单元,用于根据第一方向场,确定第一待填充像素的像素值;

第一生成单元,用于根据外侧图像中的所有第一待填充像素的像素值,生成外侧图像,从而得到扩展图像。

在一实施例中,第一生成单元被进一步配置成:

确定原始图像的边缘上的像素中最靠近第一待填充像素的第一参考像素的位置;

根据第一参考像素的第二方向场,确定第一方向场;

其中,第二确定单元被进一步配置成:

根据第一待填充像素的位置、第一方向场以及第一待填充像素与第一参考像素的第一距离,确定原始图像的第二参考像素的位置;

根据第二参考像素的像素值,确定第一待填充像素的像素值。

在一实施例中,第二确定单元被进一步配置成:

根据第一距离,确定第二参考像素与第一待填充像素之间、在第一待填充像素和第一参考像素共同所在的第一直线的方向上的第二距离;

确定第一方向场的方向与第一直线的夹角;

将第二距离除以夹角的正切值,得到第二参考像素与第一待填充像素之间、在与第一直线相垂直的第二直线的方向上的第三距离;

根据第一待填充像素的位置以及第二和第三距离,确定第二参考像素的位置。

在一实施例中,扩展模块被进一步配置成:

根据原始纹理的重复周期,扩展原始图像,得到扩展图像。

在一实施例中,扩展模块还包括:

第三确定单元,用于根据原始图像,确定外侧图像中的第二待填充像素的第一梯度场;

判断单元,用于根据第一梯度场,判断原始纹理的重复周期;

第四确定单元,用于根据重复周期,确定第二待填充像素的像素值;

第二生成单元,用于根据外侧图像中的所有第二待填充像素的像素值,生成外侧图像,从而得到扩展图像。

在一实施例中,第三确定单元被进一步配置成:

确定原始图像的边缘上的像素中最靠近第二待填充像素的第三参考像素的位置;

根据第三参考像素的第二梯度场,确定第一梯度场;

其中,判断单元被进一步配置成:

沿第一梯度场的方向,找到原始图像中的像素值为局部极值的第四和第五参考像素;判断第四和第五参考像素的间隔距离;

根据间隔距离,确定重复周期。

在一实施例中,第四确定单元被进一步配置成:

从第二待填充像素的位置出发,沿第一梯度场的方向,找到原始图像中与第二待填充像素相隔间隔距离的第六参考像素;

根据第六参考像素的像素值,确定第二待填充像素的像素值。

以下结合图9描述根据本发明一实施例的图像识别设备。

如图9所示,图像识别设备900包括一个或多个处理器910和存储器920。

处理器910可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制图像识别设备900中的其他组件以执行期望的功能。

存储器920可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器910可以运行所述程序指令,以实现上文所述的本申请的各个实施例的泊车方法以及/或者其他期望的功能。

在一个示例中,图像识别设备900还可以包括:输入装置930和输出装置940,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

例如,该输入装置930可以是麦克风或麦克风阵列,用于捕捉语音输入信号;可以是通信网络连接器,用于从云端或其它设备接收所采集的输入信号;还可以包括例如键盘、鼠标等等。

该输出装置940可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出设备940可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然,为了简化,图9中仅示出了该图像识别设备900中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,图像识别设备900还可以包括任何其他适当的组件。

除了上述方法和设备以外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上文中描述的根据本申请各种实施例的显示控制方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施方式(包括实施例和实例)详细描述了本发明的概念、原理和思想。本领域技术人员应理解,本发明的实施方式不止上文给出的这几种形式,本领域技术人员在阅读本申请文件以后,可以对上述实施方式中的步骤、方法、装置、部件做出任何可能的改进、替换和等同形式,这些改进、替换和等同形式应视为落入在本发明的范围内。本发明的保护范围仅以权利要求书为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1