一种图像识别方法、图像识别装置、电子设备和存储介质与流程

文档序号:20704749发布日期:2020-05-12 16:15阅读:155来源:国知局
一种图像识别方法、图像识别装置、电子设备和存储介质与流程

本申请涉及图像识别领域,尤其是涉及一种图像识别方法、图像识别装置、电子设备和存储介质。



背景技术:

奇妙的大千世界,有太多我们不知道的事物。目前,用户可以利用电子设备的拍摄功能对不知道的事物进行拍摄,得到包含该事物的图像,进而电子设备对该图像进行识别,得到图像包含的事物的识别结果。然而,这种对拍摄得到的整张图像进行识别的方法存在识别准确率低的问题。



技术实现要素:

本申请实施例期望提供一种图像识别方法、图像识别装置、电子设备和存储介质,解决相关技术中对拍摄得到的整张图像进行识别的方法存在识别准确率低的问题。

本申请的技术方案是这样实现的:

一种图像识别方法,所述方法包括:

获得待识别的第一图像;

将所述第一图像输入卷积神经网络模型,得到所述卷积神经网络模型的多个卷积层中目标层对应的多个特征图;

基于所述多个特征图,提取所述第一图像中目标对象所在的第二图像;

将所述第二图像输入经过训练得到的分类模型,得到与所述第一图像中的目标对象关联的识别结果,并输出所述识别结果。

可选的,所述基于所述多个特征图,提取所述第一图像中目标对象所在的第二图像,包括:

将所述多个特征图中的各像素沿各通道方向逐像素相加,得到加和激活图;

确定所述加和激活图中所述目标对象对应的目标位置;

确定所述第一图像中与所述目标位置对应的所述第二图像,并提取所述第二图像。

可选的,所述确定所述加和激活图中所述目标对象对应的目标位置,包括:

查找所述加和激活图中像素对应的激活值大于目标激活值的多个像素所在的多个位置;

确定第一方向上所述多个位置中的最小激活值对应的第一位置和最大激活值对应的第二位置;

确定第二方向上所述多个位置中的最小激活值对应的第三位置和最大激活值对应的第四位置;所述第二方向与所述第一方向之间的夹角为直角;所述目标位置包括所述第一位置、所述第二位置、所述第三位置和所述第四位置。

可选的,所述查找所述加和激活图中像素对应的激活值大于目标激活值的多个位置,包括:

获得所述加和激活图中所有像素对应的所有激活值中的最大激活值;

用所述最大激活值乘以预设参数,得到目标激活值;

查找所述加和激活图中激活值中大于所述目标激活值的所述多个位置。

可选的,所述确定所述第一图像中与所述目标位置对应的所述第二图像,包括:

获得所述加和激活图中的各像素与所述第一图像中的所述各像素之间的位置映射关系;

基于所述位置映射关系,确定所述第一图像中所述目标位置对应的所述第二图像。

可选的,所述目标层为所述多个卷积层中层数小于目标阈值的层。

可选的,所述目标层为所述多个卷积层中的第二层,所述映射关系表征同一像素在所述加和激活图中的位置和在所述第一图像中的位置相同。

一种图像识别装置,所述图像识别装置包括:

获得单元,用于获得待识别的第一图像;

第一处理单元,用于将所述第一图像输入卷积神经网络模型,得到所述卷积神经网络模型的多个卷积层中目标层对应的多个特征图;

第二处理单元,用于基于所述多个特征图,提取所述第一图像中目标对象所在的第二图像;

第三处理单元,用于将所述第二图像输入经过训练得到的分类模型,得到与所述第一图像中的目标对象关联的识别结果,并输出所述识别结果。

一种电子设备,所述电子设备包括:处理器、存储器和通信总线;

所述通信总线用于实现处理器和存储器之间的通信连接;

所述处理器用于执行存储器中存储的图像识别程序,以实现如上述的图像识别方法的步骤。

一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上述的图像识别方法的步骤。

本申请实施例所提供的一种图像识别方法、图像识别装置、电子设备和存储介质,获得待识别的第一图像;将第一图像输入卷积神经网络模型,得到卷积神经网络模型的多个卷积层中目标层对应的多个特征图;基于多个特征图,提取第一图像中目标对象所在的第二图像;即对第一图像进行预处理,提取语义信息最明显的主体部分所在的第二图像;进而将第二图像输入经过训练得到的分类模型,得到与第一图像中的目标对象关联的识别结果,并输出识别结果;可见,在识别之前,先排除了主体区域的背景和噪声对最终识别结果的影响,仅针对主体区域进行识别,如此,解决了对拍摄得到的整张图像进行识别的方法存在识别准确率低的问题,提高了识别的准确率,提升了电子设备的智能化程度。

附图说明

图1为本申请实施例提供的一种图像识别方法的流程示意图;

图2为本申请实施例提供的另一种图像识别方法的流程示意图;

图3为本申请实施例提供的又一种图像识别方法的流程示意图;

图4为本申请另一实施例提供的一种图像识别方法的流程示意图;

图5为本申请实施例提供的一种第一图像的示意图;

图6为本申请实施例提供的第二层对应的多个特征图的激活情况的示意图;

图7为本申请实施例提供的一种图像识别装置的结构示意图;

图8为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。

应理解,说明书通篇中提到的“本申请实施例”或“前述实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“本申请实施例中”或“在前述实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中应用。在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

本申请实施例提供一种图像识别方法,应用于电子设备,参照图1所示,该方法包括以下步骤:

步骤101、获得待识别的第一图像。

这里,电子设备可以是智能终端,例如可以是移动电话(手机)、平板电脑、笔记本电脑等具有无线通信能力的移动终端设备,还可以是台式计算机等不便移动的智能终端设备。电子设备用于进行图像识别。

第一图像可以是电子设备实时采集的一张图像;第一图像也可以是电子设备从实时拍摄的视频流中提取的一张图像;当然,第一图像还可以是预采集到的一张图像,例如可以是电子设备预先采集的一张图像或者电子设备获得的其他设备预先采集的一张图像。这里,第一图像作为待识别对象,本申请实施例中对第一图像的来源不做具体地限定。

本申请实施例提供的图像识别方法,可以应用于物品识别的场景、人脸识别的场景、车牌识别的场景等,当然,本申请实施例提供的图像识别方法还可以应用于其他场景如病灶检测的场景,对于应用场景本申请实施例不做具体地限定。

步骤102、将第一图像输入卷积神经网络模型,得到卷积神经网络模型的多个卷积层中目标层对应的多个特征图。

卷积神经网络(convolutionalneuralnetworks,cnn)是一类包含卷积计算且具有深度结构的前馈神经网络(feedforwardneuralnetworks),是深度学习(deeplearning)的代表算法之一。卷积神经网络具有表征学习(representationlearning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariantclassification),因此也被称为平移不变人工神经网络(shift-invariantartificialneuralnetworks,siann)。

卷积神经网络包括输入层、隐含层和输出层。输入层,起到输入信号的扇出作用;所以在计算神经网络的层数时不被记入,该层负责接收来自网络外部的信息。隐藏层,除输入层和输出层以外的其他各层叫做隐藏层,也就是说,隐藏层不直接接受外界的信号,也不直接向外界发送信号。输出层,负责输出神经网络的计算结果。

这里,卷积神经网络的隐含层包含卷积层、池化层和全连接层3类常见构筑。卷积层的功能是对输入数据如输入图像进行特征提取,其内部包含多个卷积核,组成卷积核的每个元素都对应一个权重系数和一个偏差量(biasvector),类似于一个前馈神经网络的神经元(neuron)。

这里,卷积层参数包括卷积核大小、步长和填充,三者共同决定了卷积层输出特征图的尺寸,是卷积神经网络的超参数。

其中,卷积核大小可以指定为小于输入图像尺寸的任意值,卷积核越大,可提取的输入特征越复杂。

其中,卷积步长定义了卷积核相邻两次扫过特征图时位置的距离,卷积步长为1时,卷积核会逐个扫过特征图的元素,步长为n时会在下一次扫描跳过n-1个像素。

进一步地,由卷积核的交叉计算可知,随着卷积层的堆叠,特征图的尺寸会逐步减小;为此,填充是在特征图通过卷积核之前人为增大其尺寸以抵消计算中尺寸收缩影响的方法。

本申请实施例中,通过对卷积核大小、步长和填充各参数进行设置实现对卷积神经网络模型的调整。

在实际应用中,电子设备将第一图像输入卷积神经网络模型,得到卷积神经网络模型的多个卷积层中每一卷积层的多个特征图,进而从多个卷积层中每一卷积层的多个特征图中提取目标层对应的多个特征图。

在一些实施例中,卷积神经网络模型可以是超分辨率测试序列(visualgeometrygroup,vgg)模型。vgg模型中根据卷积核大小和卷积层数目的不同,可以分为多个配置,本申请实施例中可以选用vgg16或vgg19这两个配置。

示例性的,以选用vgg16为例,vgg16包含13个卷积层,3个全连接层,5个池化层。其中,卷积层和全连接层具有权重系数,因此也被称为权重层,总数目为13+3=16,这即是vgg16中16的来源。这里,选用vgg16的突出特点是简单,体现在:第一方面,卷积层均采用相同的卷积核参数,卷积层均表示为conv3-xxx,其中conv3说明该卷积层采用的卷积核的尺寸(kernelsize)是3,即宽(width)和高(height)均为3,3×3是很小的卷积核尺寸,结合其它参数(步长stride=1,填充方式padding=same),这样就能够使得每一个卷积层与前一层保持相同的宽和高。xxx代表卷积层的通道数。第二方面,池化层均采用相同的池化核参数。第三方面,模型是由若干卷积层和池化层堆叠(stack)的方式构成,比较容易形成较深的网络结构。

本申请其他实施例中,目标层为多个卷积层中层数小于目标阈值的层。示例性的,目标阈值的取值范围为[1,5],如电子设备将第一图像输入卷积神经网络模型,得到卷积神经网络模型的多个卷积层中第一层对应的多个特征图。又例如,电子设备将第一图像输入卷积神经网络模型,得到卷积神经网络模型的多个卷积层中第二层对应的多个特征图。再例如,电子设备将第一图像输入卷积神经网络模型,得到卷积神经网络模型的多个卷积层中第五层对应的多个特征图。

步骤103、基于多个特征图,提取第一图像中目标对象所在的第二图像。

这里,电子设备获得目标层对应的多个特征图后,基于这些个特征图,从第一图像中确定目标对象对应的主体区域,即目标对象所在的部分图像即第二图像,进而提取第一图像中目标对象所在的第二图像,从而,将第二图像从第一图像中裁剪出来。

步骤104、将第二图像输入经过训练得到的分类模型,得到与第一图像中的目标对象关联的识别结果,并输出识别结果。

这里,电子设备获得第二图像后,将第二图像输入经过训练得到的分类模型,得到与第一图像中的目标对象关联的识别结果,并输出识别结果;也就是说,本申请实施例中对第一图像中的目标对象进行识别的过程中,对待识别的第一图像进行裁剪,提取语义信息最明显的主体区域对应的部分图像即第二图像,有效地对主体区域进行定位,较好地排除非主体区域背景和噪声对最终识别结果的影响,避免将第一图像整图送入分类模型进行识别而引入较多的环境背景和噪声,增加识别的难度的问题,排除了多个对象存在的情况下也会引入其他对象或环境因素的干扰,提升识别效果。

本申请实施例所提供的一种图像识别方法,获得待识别的第一图像;将第一图像输入卷积神经网络模型,得到卷积神经网络模型的多个卷积层中目标层对应的多个特征图;基于多个特征图,提取第一图像中目标对象所在的第二图像;即对第一图像进行预处理,提取语义信息最明显的主体部分所在的第二图像;进而将第二图像输入经过训练得到的分类模型,得到与第一图像中的目标对象关联的识别结果,并输出识别结果;可见,在识别之前,先排除了主体区域的背景和噪声对最终识别结果的影响,仅针对主体区域进行识别,如此,解决了对拍摄得到的整张图像进行识别的方法存在识别准确率低的问题,提高了识别的准确率,提升了电子设备的智能化程度。

本申请实施例提供一种图像识别方法,应用于电子设备,参照图2所示,该方法包括以下步骤:

步骤201、获得待识别的第一图像。

步骤202、将第一图像输入卷积神经网络模型,得到卷积神经网络模型的多个卷积层中目标层对应的多个特征图。

步骤203、将多个特征图中的各像素沿各通道方向逐像素相加,得到加和激活图。

这里,加和激活图可以理解为目标层所有特征图1:1融合后整体的特征图。

步骤204、确定加和激活图中目标对象对应的目标位置。

这里,目标位置包括加和激活图中目标对象所在区域的顶点坐标。

本申请实施例中,步骤204、确定加和激活图中目标对象对应的目标位置,可以包括以下步骤:

步骤204a、查找加和激活图中像素对应的激活值大于目标激活值的多个像素所在的多个位置。

这里,加和激活图中像素对应的激活值大于目标激活值的多个像素所在的多个位置,包括目标对象在加和激活图中的各个分布点。

本申请一些实施例中,步骤204a查找加和激活图中像素对应的激活值大于目标激活值的多个像素所在的多个位置,可以包括以下步骤:

step1、获得加和激活图中所有像素对应的所有激活值中的最大激活值。

step2、用最大激活值乘以预设参数,得到目标激活值。

这里,预设参数与加和激活图中所选的激活区域即目标对象所在区域的面积大小有关;例如,预设参数的取值范围在0.5-1之间,且预设参数取值越小,激活区域面积越大,预设参数取值越大,激活区域面积越小。示例性的,预设参数的取值可以为0.65,如此,确保提取具有目标面积的第二图像。

step3、查找加和激活图中激活值中大于目标激活值的多个位置。

步骤204b、确定第一方向上多个位置中的最小激活值对应的第一位置和最大激活值对应的第二位置。

步骤204c、确定第二方向上多个位置中的最小激活值对应的第三位置和最大激活值对应的第四位置。

其中,第二方向与第一方向之间的夹角为直角。目标位置包括第一位置、第二位置、第三位置和第四位置。

这里,电子设备在确定第一位置、第二位置、第三位置和第四位置的情况下,可以基于第一位置、第二位置、第三位置和第四位置,构建一个矩形区域,这个矩形区域中各像素的位置与第一图像中待提取的第二图像所在的区域中各像素的位置存在映射关系。

步骤205、确定第一图像中与目标位置对应的第二图像,并提取第二图像。

本申请实施例中,步骤205中确定第一图像中与目标位置对应的第二图像,可以包括以下步骤:

步骤205a、获得加和激活图中的各像素与第一图像中的各像素之间的位置映射关系。

这里,加和激活图中的各像素与第一图像中的各像素之间的位置映射关系与stride和padding的取值有关。电子设备可以基于stride和padding的取值,确定加和激活图中的各像素与第一图像中的各像素之间的位置映射关系。

步骤205b、基于位置映射关系,确定第一图像中目标位置对应的第二图像。

本申请一些实施例中,目标层为多个卷积层中的第二层,映射关系表征同一像素在加和激活图中的位置和在第一图像中的位置相同。

这里,在目标层为多个卷积层中的第二层时,stride和padding的取值均为1,此时,映射关系表征同一像素在加和激活图中的位置和在第一图像中的位置相同;进而,电子设备基于位置映射关系,确定第一图像中目标位置对应的第二图像。

步骤206、将第二图像输入经过训练得到的分类模型,得到与第一图像中的目标对象关联的识别结果,并输出识别结果。

这里,识别结果包括但不限于目标对象的属性信息,例如,目标对象所属的类别或目标对象的名称。分类模型包括深度学习模型,电子设备将第二图像输入经过训练得到的分类模型后,便可以得到与第一图像中的目标对象关联的识别结果,并输出识别结果。

需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。

本申请实施例提供一种图像识别方法,参照图3和图4所示,该方法包括以下步骤:

步骤301、电子设备获得待识别的第一图像,并将第一图像送入vgg16预训练模型进行计算。

这里,vgg16预训练模型是使用imagenet进行训练得到的卷积神经网络模型。

示例性的,参见图5所示,用户在户外游玩时,利用电子设备拍摄树枝上的一只小鸟,电子设备获得第一图像;进而,电子设备将第一图像送入vgg16预训练模型进行计算,得到卷积神经网络模型的多个卷积层中每一层对应的多个特征图。

步骤302、电子设备提取vgg16预训练模型的各层特征图中第二层对应的多个特征图。

其中,第二层对应的多个特征图的维度为h×w×c:224×224×64。这里,h表征特征图的高度,w表征特征图的宽度,c表征通道数。

示例性的,参见图6所示,图6中显示出第二层对应的多个特征图的激活情况,每一特征图中黑色网格对应区域的激活值大于其他空白区域的激活值;说明这一区域为目标对象所在的区域。

步骤303、电子设备将第二层对应的多个特征图沿通道逐元素相加,得到一个二维的加和激活图,求该激活图的最大值,记为maxy。

步骤304、电子设备将加和激活图中激活值大于等于0.65×maxy的所有元素找出来,找出这些元素在x,y方向的最小和最大值,得到xmin,xmax,ymin,ymax。

这里,(xmin,ymax),(xmax,ymin)即为主体区域的左上、右下坐标,实现主体定位。

步骤305、电子设备将特征图的(xmin,ymax),(xmax,ymin)位置对应至原图,得到(x’min,y’max),(x’max,y’min),使用该在原图中的坐标将主体区域裁剪出来。

需要说明的是,选择vgg16的第1及第2层卷积的卷积核尺寸为3,stride=1,pad=1,所以加和激活图点位与第一图像点位一一对应,因此x’min=xmin,x’ma=xmax,y’min=ymin,y’max=ymax。

步骤306、电子设备将裁剪得到的主体区域送入在目标数据集上训练得到的分类模型中进行分类识别,得到与第一图像中的目标对象关联的识别结果,并输出识别结果。

本申请实施例提供的图像识别方法,识别过程参考注意力机制(attentionmechanism),为了合理利用有限的视觉信息处理资源,需要选择视觉区域中的特定部分,然后集中关注它。例如,人们在阅读时,通常只有少量要被读取的词会被关注和处理。根据特征分布选择性增强或抑制某些特征区域。综上,注意力机制主要有两个方面:决定需要关注输入的哪部分;分配有限的信息处理资源给重要的部分。本申请实施例中,主体区域即需要关注的区域。

由上述可知,本申请实施例中使用imagenet预训练的卷积神经网络模型对待识别图像进行预处理,提取语义信息最明显的主体部分,该部分在特征图上具有相对更强的激活值,有效地对主体区域进行定位,较好地排除非主体区域背景和噪声对最终识别结果的影响,提升识别效果。

需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。

本申请的实施例提供一种图像识别装置,该图像识别装置可以应用于图1~2对应的实施例提供的一种图像识别方法中,参照图7所示,该图像识别装置4包括:

获得单元41,用于获得待识别的第一图像。

第一处理单元42,用于将第一图像输入卷积神经网络模型,得到卷积神经网络模型的多个卷积层中目标层对应的多个特征图。

第二处理单元43,用于基于多个特征图,提取第一图像中目标对象所在的第二图像。

第三处理单元44,用于将第二图像输入经过训练得到的分类模型,得到与第一图像中的目标对象关联的识别结果,并输出识别结果。

本申请其他实施例中,第二处理单元43,还用于将多个特征图中的各像素沿各通道方向逐像素相加,得到加和激活图;确定加和激活图中目标对象对应的目标位置;确定第一图像中与目标位置对应的第二图像,并提取第二图像。

本申请其他实施例中,第二处理单元43,还用于查找加和激活图中像素对应的激活值大于目标激活值的多个像素所在的多个位置;确定第一方向上多个位置中的最小激活值对应的第一位置和最大激活值对应的第二位置;确定第二方向上多个位置中的最小激活值对应的第三位置和最大激活值对应的第四位置;第二方向与第一方向之间的夹角为直角;目标位置包括第一位置、第二位置、第三位置和第四位置。

本申请其他实施例中,第二处理单元43,还用于获得加和激活图中所有像素对应的所有激活值中的最大激活值;用最大激活值乘以预设参数,得到目标激活值;查找加和激活图中激活值中大于目标激活值的多个位置。

本申请其他实施例中,第二处理单元43,还用于获得加和激活图中的各像素与第一图像中的各像素之间的位置映射关系;基于位置映射关系,确定第一图像中目标位置对应的第二图像。

本申请其他实施例中,目标层为多个卷积层中层数小于目标阈值的层。

本申请其他实施例中,目标层为多个卷积层中的第二层,映射关系表征同一像素在加和激活图中的位置和在第一图像中的位置相同。

需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。

基于前述实施例,本申请的实施例提供一种电子设备,该电子设备可以应用于图1~2对应的实施例提供的一种图像识别方法中,参照图8所示,该电子设备5(图5中的电子设备5与图4中的图像识别装置4相对应)包括:处理器51、存储器52和通信总线53,其中:

通信总线53用于实现处理器51和存储器52之间的通信连接。

处理器51用于执行存储器52中存储的图像识别程序,以实现以下步骤:

获得待识别的第一图像;

将第一图像输入卷积神经网络模型,得到卷积神经网络模型的多个卷积层中目标层对应的多个特征图;

基于多个特征图,提取第一图像中目标对象所在的第二图像;

将第二图像输入经过训练得到的分类模型,得到与第一图像中的目标对象关联的识别结果,并输出识别结果。

本申请的其他实施例中,处理器51用于执行存储器52中存储的图像识别程序,以实现以下步骤:

将多个特征图中的各像素沿各通道方向逐像素相加,得到加和激活图;

确定加和激活图中目标对象对应的目标位置;

确定第一图像中与目标位置对应的第二图像,并提取第二图像。

本申请的其他实施例中,处理器51用于执行存储器52中存储的图像识别程序,以实现以下步骤:

查找加和激活图中像素对应的激活值大于目标激活值的多个像素所在的多个位置;

确定第一方向上多个位置中的最小激活值对应的第一位置和最大激活值对应的第二位置;

确定第二方向上多个位置中的最小激活值对应的第三位置和最大激活值对应的第四位置;第二方向与第一方向之间的夹角为直角;目标位置包括第一位置、第二位置、第三位置和第四位置。

本申请的其他实施例中,处理器51用于执行存储器52中存储的图像识别程序,以实现以下步骤:

获得加和激活图中所有像素对应的所有激活值中的最大激活值;

用最大激活值乘以预设参数,得到目标激活值;

查找加和激活图中激活值中大于目标激活值的多个位置。

本申请的其他实施例中,处理器51用于执行存储器52中存储的图像识别程序,以实现以下步骤:

获得加和激活图中的各像素与第一图像中的各像素之间的位置映射关系;

基于位置映射关系,确定第一图像中目标位置对应的第二图像。

本申请的其他实施例中,目标层为多个卷积层中层数小于目标阈值的层。

本申请的其他实施例中,目标层为多个卷积层中的第二层,映射关系表征同一像素在加和激活图中的位置和在第一图像中的位置相同。

需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。

基于前述实施例,本申请的实施例提供一种计算机存储介质,该计算机存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如下步骤:

获得待识别的第一图像;

将第一图像输入卷积神经网络模型,得到卷积神经网络模型的多个卷积层中目标层对应的多个特征图;

基于多个特征图,提取第一图像中目标对象所在的第二图像;

将第二图像输入经过训练得到的分类模型,得到与第一图像中的目标对象关联的识别结果,并输出识别结果。

在本申请的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:

将多个特征图中的各像素沿各通道方向逐像素相加,得到加和激活图;

确定加和激活图中目标对象对应的目标位置;

确定第一图像中与目标位置对应的第二图像,并提取第二图像。

在本申请的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:

查找加和激活图中像素对应的激活值大于目标激活值的多个像素所在的多个位置;

确定第一方向上多个位置中的最小激活值对应的第一位置和最大激活值对应的第二位置;

确定第二方向上多个位置中的最小激活值对应的第三位置和最大激活值对应的第四位置;第二方向与第一方向之间的夹角为直角;目标位置包括第一位置、第二位置、第三位置和第四位置。

在本申请的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:

获得加和激活图中所有像素对应的所有激活值中的最大激活值;

用最大激活值乘以预设参数,得到目标激活值;

查找加和激活图中激活值中大于目标激活值的多个位置。

在本申请的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:

获得加和激活图中的各像素与第一图像中的各像素之间的位置映射关系;

基于位置映射关系,确定第一图像中目标位置对应的第二图像。

在本申请的其他实施例中,目标层为多个卷积层中层数小于目标阈值的层。

在本申请的其他实施例中,目标层为多个卷积层中的第二层,映射关系表征同一像素在加和激活图中的位置和在第一图像中的位置相同。

需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。

需要说明的是,上述计算机存储介质/存储器可以是只读存储器(readonlymemory,rom)、可编程只读存储器(programmableread-onlymemory,prom)、可擦除可编程只读存储器(erasableprogrammableread-onlymemory,eprom)、电可擦除可编程只读存储器(electricallyerasableprogrammableread-onlymemory,eeprom)、磁性随机存取存储器(ferromagneticrandomaccessmemory,fram)、快闪存储器(flashmemory)、磁表面存储器、光盘、或只读光盘(compactdiscread-onlymemory,cd-rom)等存储器;也可以是包括上述存储器之一或任意组合的各种终端,如移动电话、计算机、平板设备、个人数字助理等。

在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外,在本申请各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。

本申请所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。

本申请所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。

以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1