模型训练方法、图像分类方法和装置与流程

文档序号:32400185发布日期:2022-12-02 18:45阅读:32来源:国知局
模型训练方法、图像分类方法和装置与流程

1.本公开的实施例涉及计算机技术领域和互联网技术领域,具体涉及人工智能技术领域和图像处理技术领域,尤其涉及模型训练方法、图像分类方法和装置。


背景技术:

2.随着深度神经网络的不断发展和广泛应用,深度学习模型在计算机视觉领域迅猛发展,然而这一进展在很大程度上依赖于来自相关类别的海量标记图像样本。在现实场景中如工业制造中的缺陷检测,由于成本较高,对于感兴趣的新类别,并不总是能够获得如此大量的图像样本。随着神经网络的不断发展与进步,提出了从少量标记图像中快速学习的小样本学习方法,目前主要包括:度量学习技术、语义对齐技术和特征聚合技术。
3.然而度量学习技术通常聚合图像中所有区域的特征,没有考虑这些图像区域是否与图像语义相关,从而降低了所获得特征的判别性;或者,语义对齐技术侧重于探索有效的配对图像间局部特征相似度量技术,受背景杂波、类内变化或计算代价高等问题限制,在小样本学习中,标记图像的稀缺性使得精确的语义对齐变得更加困难;再者,特征聚合技术缺乏对图像语义的感知,更多的注意力被放在了与任务无关的图像区域上。


技术实现要素:

4.本公开的实施例提出了一种模型训练方法、图像分类方法、装置、电子设备和计算机可读介质。
5.第一方面,本公开的实施例提供了一种模型训练方法,该方法包括:响应于获取到包括样本图像、样本图像对应的标注信息和查询图像,构建样本图像和查询图像对应的图像对;构建包括局部特征提取器、语义特征提取器和分类判别器的小样本学习网络;将图像对输入局部特征提取器进行局部特征提取,得到样本图像对应的第一局部特征和查询图像对应的第二局部特征;将第一局部特征和第二局部特征分别输入语义特征提取器进行语义特征提取,得到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征;将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别输入分类判别器,基于样本图像对应的标注信息,对小样本学习网络进行训练,得到图像分类模型。
6.在一些实施例中,将第一局部特征和第二局部特征分别输入语义特征提取器进行语义特征提取,得到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征,包括:通过语义特征提取器分别对第一局部特征和第二局部特征进行特征压缩,得到压缩后的第一局部特征和压缩后的第二局部特征;通过语义特征提取器分别对压缩后的第一局部特征和压缩后的第二局部特征进行维度扩充和语义特征提取,得到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征。
7.在一些实施例中,将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别输入分类判别器,基于样本图像对应的标注信息,对小样本学习网络进行训练,得到图像分类模型,包括:将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别
输入分类判别器进行特征聚合,得到第一局部特征对应的第一聚合特征和第二局部特征对应的第二聚合特征;基于第一聚合特征、第二聚合特征和样本图像对应的标注信息,对小样本学习网络进行训练,得到图像分类模型。
8.在一些实施例中,将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别输入分类判别器进行特征聚合,得到第一局部特征对应的第一聚合特征和第二局部特征对应的第二聚合特征,包括:通过分类判别器对第一局部特征和第一语义特征进行权重计算,得到第一局部特征的第一权重;基于第一权重和第一局部特征,确定出第一局部特征对应的第一聚合特征;通过分类判别器对第二局部特征和第二语义特征进行权重计算,得到第二局部特征的第二权重;基于第二权重和第二局部特征,确定出第二局部特征对应的第二聚合特征。
9.在一些实施例中,基于第一聚合特征、第二聚合特征和样本图像对应的标注信息,对小样本学习网络进行训练,得到图像分类模型,包括:基于第一聚合特征和第二聚合特征,确定交叉熵损失函数;基于交叉熵损失函数和样本图像对应的标注信息,对小样本学习网络进行联合训练,得到图像分类模型。
10.第二方面,本公开的实施例提供了一种图像分类方法,该方法包括:获取待分类图像;将待分类图像输入图像分类模型,得到待分类图像的分类结果,其中,图像分类模型基于上述第一方面的方法获取。
11.第三方面,本公开的实施例提供了一种模型训练装置,该装置包括:构建模块,被配置成响应于获取到包括样本图像、样本图像对应的标注信息和查询图像,构建样本图像和查询图像对应的图像对;构建包括局部特征提取器、语义特征提取器和分类判别器的小样本学习网络;局部特征提取模块,被配置成将图像对输入局部特征提取器进行局部特征提取,得到样本图像对应的第一局部特征和查询图像对应的第二局部特征;语义特征提取模块,被配置成将第一局部特征和第二局部特征分别输入语义特征提取器进行语义特征提取,得到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征;训练模块,被配置成将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别输入分类判别器,基于样本图像对应的标注信息,对小样本学习网络进行训练,得到图像分类模型。
12.在一些实施例中,语义特征提取模块,进一步被配置成:通过语义特征提取器分别对第一局部特征和第二局部特征进行特征压缩,得到压缩后的第一局部特征和压缩后的第二局部特征;通过语义特征提取器分别对压缩后的第一局部特征和压缩后的第二局部特征进行维度扩充和语义特征提取,得到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征。
13.在一些实施例中,训练模块,包括:特征聚合单元,被配置成将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别输入分类判别器进行特征聚合,得到第一局部特征对应的第一聚合特征和第二局部特征对应的第二聚合特征;训练单元,被配置成基于第一聚合特征、第二聚合特征和样本图像对应的标注信息,对小样本学习网络进行训练,得到图像分类模型。
14.在一些实施例中,特征聚合单元,进一步被配置成:通过分类判别器对第一局部特征和第一语义特征进行权重计算,得到第一局部特征的第一权重;基于第一权重和第一局
部特征,确定出第一局部特征对应的第一聚合特征;通过分类判别器对第二局部特征和第二语义特征进行权重计算,得到第二局部特征的第二权重;基于第二权重和第二局部特征,确定出第二局部特征对应的第二聚合特征。
15.在一些实施例中,训练单元,进一步被配置成:基于第一聚合特征和第二聚合特征,确定交叉熵损失函数;基于交叉熵损失函数和样本图像对应的标注信息,对小样本学习网络进行联合训练,得到图像分类模型。
16.第四方面,本公开的实施例提供了一种图像分类装置,该装置包括:获取模块,被配置成获取待分类图像;分类模块,被配置成将待分类图像输入图像分类模型,得到待分类图像的分类结果,其中,图像分类模型基于上述第一方面的方法获取。
17.第五方面,本公开的实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面或第二方面中任一实施例描述的方法。
18.第六方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面或第二方面中任一实施例描述的方法。
19.本公开的实施例提供的模型训练方法,上述执行主体首先响应于获取到包括样本图像、样本图像对应的标注信息和查询图像,构建样本图像和查询图像对应的图像对,并构建包括局部特征提取器、语义特征提取器和分类判别器的小样本学习网络,然后将图像对输入局部特征提取器进行局部特征提取,得到样本图像对应的第一局部特征和查询图像对应的第二局部特征,之后将第一局部特征和第二局部特征分别输入语义特征提取器进行语义特征提取,得到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征,最后将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别输入分类判别器,基于样本图像对应的标注信息,对小样本学习网络进行训练,得到图像分类模型,能够基于局部特征进行提取获得对应的语义特征,能够基于语义特征突出与当前分类任务相关的图像区域,抑制与当前分类任务无关的图像区域,能够更注重与当前分类任务相关的图像区域,不需要考虑其他区域,从而能够提升基于语义特征的特征聚合准确性,克服了度量学习技术的缺点,并且避免了语义对齐技术的难题,进一步提高了图像分类模型的准确性。
附图说明
20.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
21.图1是本公开的一个实施例可以应用于其中的示例性系统架构图;
22.图2是根据本公开的模型训练方法的一个实施例的流程图;
23.图3是根据本公开的进行语义特征提取的一个实施例的流程图;
24.图4是根据本公开的对小样本学习网络进行训练的一个实施例的流程图;
25.图5是根据本公开的进行特征聚合的一个实施例的流程图;
26.图6是根据本公开的获取图像分类模型的一个实施例的流程图;
27.图7是根据本公开的图像分类方法的一个实施例的流程图;
28.图8是根据本公开的模型训练装置的一个实施例的结构示意图;
29.图9是根据本公开的图像分类装置的一个实施例的结构示意图;
30.图10是适于用来实现本公开的实施例的电子设备的结构示意图。
具体实施方式
31.下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关公开,而非对该公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关公开相关的部分。
32.需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
33.图1示出了可以应用本公开的实施例的模型训练方法、图像分类方法和装置的示例性系统架构100。
34.如图1所示,系统架构100可以包括终端设备104、105、106,网络107,服务器101、102、103。网络107用以在终端设备104、105、106与服务器101、102、103之间提供通信链路的介质。网络107可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
35.用户可以通过终端设备104、105、106通过网络107与属于同一服务器集群的服务器101、102、103交互,以接收或发送信息等。终端设备104、105、106上可以安装有各种应用,例如物品展示应用、数据分析应用、搜索类应用等。
36.终端设备104、105、106可以是硬件,也可以是软件。当终端设备为硬件时,可以是具有显示屏并且支持与服务器通信的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
37.服务器101、102、103可以是提供各种服务的服务器,例如对与其建立通信连接的终端设备发送的请求进行接收的后台服务器。后台服务器可以对终端设备发送的请求进行接收和分析等处理,并生成处理结果。
38.服务器101、102、103可以获取到包括样本图像、样本图像对应的标注信息和查询图像,构建样本图像和查询图像对应的图像对,然后构建包括局部特征提取器、语义特征提取器和分类判别器的小样本学习网络。服务器101、102、103可以将图像对输入局部特征提取器进行局部特征提取,得到样本图像对应的第一局部特征和查询图像对应的第二局部特征,并将第一局部特征和第二局部特征分别输入语义特征提取器进行语义特征提取,得到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征,最后将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别输入分类判别器,基于样本图像对应的标注信息,对小样本学习网络进行训练,得到图像分类模型。
39.以及,服务器101、102、103可以获取待分类图像,并将该待分类图像输入图像分类模型,得到该待分类图像的分类结果,上述图像分类模型基于上述方法获取。
40.需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以是为终端设备提供各种服务的各种电子设备。当服务器为软件时,可以实现成为为终端设备提供各种服务的多个软件或软件模块,也可以实现成为为终端设备提供各种服务的单个软件或软件模块。在此不做具体限定。
41.需要说明的是,本公开的实施例所提供的模型训练方法和图像分类方法可以由服务器101、102、103执行。相应地,模型训练装置和图像分类装置设置于服务器101、102、103中。
42.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
43.继续参考图2,示出了根据本公开的模型训练方法的一个实施例的流程200。该模型训练方法包括以下步骤:
44.步骤210,响应于获取到包括样本图像、样本图像对应的标注信息和查询图像,构建样本图像和查询图像对应的图像对。
45.在本步骤中,模型训练方法运行于其上的执行主体(例如图1中的服务器101、102、103)可以通过网络读取等方式获取到多种类别的图像,每种类别对应多张不同的图像。上述执行主体可以将获取到的图像进行分组,将图像分为样本图像组和查询图像组,其中,样本图像组可以包括多张不同类别的样本图像,并对样本图像进行信息标注,得到样本图像的标注信息,样本图像组作为小样本学习的支持集,可以包括n个类别的图像,每个类别可以包括m个样本图像;查询图像组可以包括多张未进行标注的查询图像,查询图像组作为小样本学习的查询集。
46.上述执行主体获取到样本图像组和查询图像组后,可以从样本图像组中选择样本图像,从查询图像组中选择查询图像,并将样本图像和查询图像组成图像对。
47.步骤220,构建包括局部特征提取器、语义特征提取器和分类判别器的小样本学习网络。
48.在本步骤中,上述执行主体可以使用faster r-cnn等神经网络作为模型的主框架,在此基础上构建出包括局部特征提取器、语义特征提取器和分类判别器的小样本学习网络。
49.其中,局部特征提取器可以用于对输入的图像进行特征提取,提取输入图像的局部特征;语义特征提取器可以用于对获取到的局部特征进行语义分析,提取出对应的语义特征;分类判别器可以用于对输入的语义特征和局部特征进行分析处理,生成输入图像的分类结果。
50.步骤230,将图像对输入局部特征提取器进行局部特征提取,得到样本图像对应的第一局部特征和查询图像对应的第二局部特征。
51.在本步骤中,上述局部特征提取器可以是去掉全局池化层及其后续层之后的常用的卷积神经网络(convolutional neural network,cnn),上述执行主体可以将构建的图像对输入至局部特征提取器中,通过局部特征提取器分别对图像对中的样本图像和查询图像进行局部特征提取,从而可以通过局部特征提取器对样本图像进行局部特征提取,得到样本图像对应的第一局部特征,可以通过局部特征提取器对查询图像进行局部特征提取,得到查询图像对应的第二局部特征。
52.局部特征提取器可以通过来实现对应样本图像和查询图像的特征提取,其中,θ1表示所使用的卷积神经网络的可学习参数,c、h和w分别表示通道、高度和宽度,通过合并空间维度可以得到样本图像和查询图像的hw个维度为c的局部特征,可以表示

53.步骤240,将第一局部特征和第二局部特征分别输入语义特征提取器进行语义特征提取,得到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征。
54.在本步骤中,上述执行主体通过局部特征提取器获取到样本图像对应的第一局部特征和查询图像对应的第二局部特征后,可以将第一局部特征和第二局部特征分别输入语义特征提取器中,根据当前分类任务通过语义提取器对第一局部特征进行语义分析和语义处理,得到第一局部特征对应的第一语义特征,以及,根据当前分类任务通过语义提取器对第二局部特征进行语义分析和语义处理,得到第二局部特征对应的第二语义特征。
55.步骤250,将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别输入分类判别器,基于样本图像对应的标注信息,对小样本学习网络进行训练,得到图像分类模型。
56.在本步骤中,上述执行主体获取到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征后,可以将第一局部特征和第一语义特征输入至分类判别器,并将第二局部特征和第二语义特征也输入分类判别器,通过分类判别器分别对第一局部特征和第一语义特征、第二局部特征和第二语义特征进行分类处理,并根据输入的样本图像的标注信息,利用机器学习方法对小样本学习网络进行训练,得到图像分类模型。
57.本公开的实施例提供的模型训练方法,上述执行主体首先响应于获取到包括样本图像、样本图像对应的标注信息和查询图像,构建样本图像和查询图像对应的图像对,并构建包括局部特征提取器、语义特征提取器和分类判别器的小样本学习网络,然后将图像对输入局部特征提取器进行局部特征提取,得到样本图像对应的第一局部特征和查询图像对应的第二局部特征,之后将第一局部特征和第二局部特征分别输入语义特征提取器进行语义特征提取,得到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征,最后将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别输入分类判别器,基于样本图像对应的标注信息,对小样本学习网络进行训练,得到图像分类模型,能够基于局部特征进行提取获得对应的语义特征,能够基于语义特征突出与当前分类任务相关的图像区域,抑制与当前分类任务无关的图像区域,能够更注重与当前分类任务相关的图像区域,不需要考虑其他区域,从而能够提升基于语义特征的特征聚合准确性,克服了度量学习技术的缺点,并且避免了语义对齐技术的难题,进一步提高了图像分类模型的准确性。
58.参考图3,图3示出了进行语义特征提取的一个实施例的流程图300,可以包括以下步骤:
59.步骤310,通过语义特征提取器分别对第一局部特征和第二局部特征进行特征压缩,得到压缩后的第一局部特征和压缩后的第二局部特征。
60.其中,语义特征提取器可以包括全局池化层、三个相互交叠的全连接层和relu层。
61.在本步骤中,上述执行主体获取到第一局部特征和第二局部特征后,可以分别将第一局部特征和第二局部特征输入至语义特征提取器中,通过语义特征提取器中的全局池化层对第一局部特征进行全局池化聚合,并利用语义特征提取器中三个相互交叠的全连接层和relu层对池化聚合后的第一局部特征进行特征压缩,可以根据降维比将通过全局池化聚合得到的第一局部特征压缩到一个紧凑的特征空间中,可以将第一局部特征由维度为c
压缩成维度为d的局部特征,且d的数值小于c的数值。作为示例,上述执行主体可以通过图像主成分分析法(principal component analysis,pca)对第一局部特征进行特征压缩,得到压缩后的第一局部特征,该主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标(即主成分),其中每个主成分都能够反映原始变量的大部分信息,且所含信息互不重复。
62.以及,上述执行主体通过语义特征提取器中的全局池化层对第二局部特征进行全局池化聚合,并利用语义特征提取器中三个相互交叠的全连接层和relu层对池化聚合后的第二局部特征进行特征压缩,可以根据降维比将通过全局池化聚合得到的第二局部特征压缩到一个紧凑的特征空间中,可以将第二局部特征由维度为c压缩成维度为d的局部特征,且d的数值小于c的数值。作为示例,上述执行主体可以通过图像主成分分析法(principal component analysis,pca)对第二局部特征进行特征压缩,得到压缩后的第二局部特征,该主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标(即主成分),其中每个主成分都能够反映原始变量的大部分信息,且所含信息互不重复。
63.步骤320,通过语义特征提取器分别对压缩后的第一局部特征和压缩后的第二局部特征进行维度扩充和语义特征提取,得到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征。
64.在本步骤中,上述执行主体获取到压缩后的第一局部特征和压缩后的第二局部特征后,可以进一步通过语义特征提取器中三个相互交叠的全连接层和relu层对压缩后的第一局部特征进行维度扩充,即可以将压缩后的第一局部特征的维度扩充至原始维度,例如,原始维度为c,可将压缩后的第一局部特征由压缩维度d扩充至原始维度c,且d的数值小于c的数值。然后上述执行主体可以通过语义特征提取器中三个相互交叠的全连接层和relu层对扩充后至原始维度的第一局部特征进行语义特征提取,可以利用下述公式来实现语义特征提取,该公式可以是:
[0065][0066]
其中,和θ2是语义特征提取参数,rj表示局部特征的特征向量,h和w分别表示高度和宽度。
[0067]
本公开可以通过相关技术中的语义特征获取方法根据压缩后的第一局部特征和压缩后的第二局部特征,得到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征。
[0068]
在本实现方式中,通过对第一局部特征和第二局部特征件特征压缩来滤除与当前分类任务无关的图像区域,提高了所获得特征的判别性和模型的性能。
[0069]
参考图4,图4示出了对小样本学习网络进行训练的一个实施例的流程图400,可以包括以下步骤:
[0070]
步骤410,将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别输入分类判别器进行特征聚合,得到第一局部特征对应的第一聚合特征和第二局部特征对应的第二聚合特征。
[0071]
在本步骤中,上述执行主体获取到第一局部特征对应的第一语义特征和第二局部
特征对应的第二语义特征后,可以将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别输入分类判别器进行特征聚合,根据第一语义特征通过分类判别器对第一局部特征进行特征聚合,得到第一局部特征对应的第一聚合特征,并且根据第二语义特征通过分类判别器对第二局部特征进行特征聚合,得到第二局部特征对应的第二聚合特征。
[0072]
步骤420,基于第一聚合特征、第二聚合特征和样本图像对应的标注信息,对小样本学习网络进行训练,得到图像分类模型。
[0073]
在本步骤中,上述执行主体获取到第一聚合特征和第二聚合特征后,可以通过分类判别器分别对第一聚合特征和第二聚合特征进行分类处理,并根据输入的样本图像的标注信息,利用机器学习方法对小样本学习网络进行训练,得到图像分类模型。
[0074]
在本实现方式中,通过基于语义特征对局部特征进行聚合,能够强化与当前分类任务相关的图像区域,抑制其它的图像区域,强调了对图像语义的感知,提高了聚合特征的准确性。
[0075]
参考图5,图5示出了进行特征聚合的一个实施例的流程图500,可以包括以下步骤:
[0076]
步骤510,通过分类判别器对第一局部特征和第一语义特征进行权重计算,得到第一局部特征的第一权重。
[0077]
在本步骤中,上述执行主体获取到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征后,可以通过分类判别器对第一局部特征和第一语义特征进行权重计算,计算第一局部特征的范数,并将局部特征的范数定义为局部特征的注意力值,该注意力值可以作为第一局部特征的第一权重。
[0078]
上述执行主体可以通过分类判别器利用下述公式计算第一局部特征的范数,该公式如下:
[0079]
||rj+f||2=(||f||+||rj||)
2-2||f||||rj||(1-cosθj)
[0080]
其中,θj表示f和rj之间的夹角,rj表示局部特征,可以理解,对于两个局部特征rj和ri,如果rj比ri与语义感知特征f更相关,则cosθj应大于cosθi,这意味着上述公式使rj的范数增量大于ri的范数增量。存在两种极端情况如下:1)如果rj与语义感知特征完全相关,则范数增量为||f||;如果rj与语义感知特征完全无关,则范数增量为-||f||。
[0081]
步骤520,基于第一权重和第一局部特征,确定出第一局部特征对应的第一聚合特征。
[0082]
在本步骤中,上述执行主体获取到第一局部特征的第一权重后,上述执行主体可以根据第一权重计算第一局部特征对应的第一聚合特征。
[0083]
上述执行主体可以通过分类判别器利用下述公式计算第一局部特征对应的第一聚合特征,该公式如下:
[0084][0085]
其中,rj+f表示第一局部特征的范数,即第一权重;h和w分别表示高度和宽度。
[0086]
步骤530,通过分类判别器对第二局部特征和第二语义特征进行权重计算,得到第二局部特征的第二权重。
[0087]
在本步骤中,上述执行主体可以通过分类判别器对第二局部特征和第二语义特征
进行权重计算,计算第二局部特征的范数,并将局部特征的范数定义为局部特征的注意力值,该注意力值可以作为第二局部特征的第二权重。
[0088]
上述执行主体可以通过分类判别器利用下述公式计算第二局部特征的范数,该公式如下:
[0089]
||rj+f||2=(||f||+||rj||)
2-2||f||||rj||(1-cosθj)
[0090]
其中,θj表示f和rj之间的夹角,rj表示局部特征,可以理解,对于两个局部特征rj和ri,如果rj比ri与语义感知特征f更相关,则cosθj应大于cosθi,这意味着上述公式使rj的范数增量大于ri的范数增量。存在两种极端情况如下:1)如果rj与语义感知特征完全相关,则范数增量为||f||;如果rj与语义感知特征完全无关,则范数增量为-||f||。
[0091]
步骤540,基于第二权重和第二局部特征,确定出第二局部特征对应的第二聚合特征。
[0092]
在本步骤中,上述执行主体获取到第二局部特征的第二权重后,上述执行主体可以根据第二权重计算第二局部特征对应的第二聚合特征。
[0093]
上述执行主体可以通过分类判别器利用下述公式计算第二局部特征对应的第二聚合特征,该公式如下:
[0094][0095]
其中,rj+f表示第二局部特征的范数,即第二权重;h和w分别表示高度和宽度。
[0096]
在本实现方式中,通过语义特征确定每个局部特征的权重值,避免了与当前分类任务无关的图像区域被赋予了更多的权重,提高了权重值的准确性,从而使用语义特征来确定聚合特征,能够抑制与当前分类任务无关的图像区域,突出与当前分类任务相关的图像区域,提升了特征聚合准确性。
[0097]
参考图6,图6示出了获取图像分类模型的一个实施例的流程图600,可以包括以下步骤:
[0098]
步骤610,基于第一聚合特征和第二聚合特征,确定交叉熵损失函数。
[0099]
在本步骤中,上述执行主体获取到后,可以根据第一聚合特征和第二聚合特征确定对应的交叉熵损失函数。
[0100]
具体地,上述执行主体在获取到第一聚合特征和第二聚合特征后,可以计算样本图像的平均特征:
[0101][0102]
其中,表示样本图像组中属于第m个支持类别的第i个样本图像的聚合特征,n为样本图像组中样本图像的总数。
[0103]
之后上述执行主体可以基于下述公式计算查询图像组中第k个查询图像属于第m个支持类别的概率:
[0104][0105]
其中,d(
·

·
)表示余弦距离,τ表示尺度因子,表示查询图像组中属于第m个支持类别的第k个样本图像的聚合特征。
[0106]
最后上述执行主体可以确定交叉熵损失函数如下:
[0107][0108]
其中,表示第k个查询图像的标签,i(
·
)表示指示函数,如果其自变量为真,则等于1,否则等于0。
[0109]
步骤620,基于交叉熵损失函数和样本图像对应的标注信息,对小样本学习网络进行联合训练,得到图像分类模型。
[0110]
在本步骤中,上述执行主体确定出交叉熵损失函数后,可以根据交叉熵损失函数和输入的样本图像的标注信息,利用机器学习方法对小样本学习网络进行联合训练,调整小样本学习网络中的网络参数,得到图像分类模型。
[0111]
在本实现方式中,通过交叉熵损失函数和样本图像对应的标注信息,对小样本学习网络进行联合训练,得到图像分类模型,提高了图像分类模型的训练效果和准确性。
[0112]
参考图7,图7示出了图像分类方法的一个实施例的流程图700,可以包括以下步骤:
[0113]
步骤710,获取待分类图像。
[0114]
在本步骤中,上述执行主体通过网络读取等方式获取待分类图像。
[0115]
步骤720,将待分类图像输入图像分类模型,得到待分类图像的分类结果。
[0116]
在本步骤中,上述执行主体获取到待分类图像后,可以将该待分类图像输入图像分类模型中,图像分类模型对待分类图像进行处理,输出与该待分类图像对应的分类结果,该分类结果能够表征待分类图像的图像类别信息。其中,上述图像分类模型基于上述图2-图6的模型训练方法获取。
[0117]
本公开的上述实施例提供的图像分类装置,上述执行主体首先获取待分类图像,然后将待分类图像输入图像分类模型,得到待分类图像的分类结果,该图像分类模型基于上述方法获取,通过图像分类模型对待分类图像进行分类处理,能够提高待分类图像的分类效率和准确性。
[0118]
进一步参考图8,作为对上述各图所示方法的实现,本公开提供了一种模型训练装置的一个实施例。该装置实施例与图2所示的方法实施例相对应。
[0119]
如图8所示,本实施例的模型训练装置800可以包括:构建模块810、局部特征提取模块820、语义特征提取模块830和训练模块840。
[0120]
其中,构建模块810,被配置成响应于获取到包括样本图像、样本图像对应的标注信息和查询图像,构建所述样本图像和所述查询图像对应的图像对;构建包括局部特征提取器、语义特征提取器和分类判别器的小样本学习网络;
[0121]
局部特征提取模块820,被配置成将所述图像对输入所述局部特征提取器进行局部特征提取,得到所述样本图像对应的第一局部特征和所述查询图像对应的第二局部特征;
[0122]
语义特征提取模块830,被配置成将所述第一局部特征和所述第二局部特征分别输入所述语义特征提取器进行语义特征提取,得到所述第一局部特征对应的第一语义特征和所述第二局部特征对应的第二语义特征;
[0123]
训练模块840,被配置成将所述第一局部特征和所述第一语义特征、所述第二局部特征和所述第二语义特征分别输入所述分类判别器,基于所述样本图像对应的标注信息,对所述小样本学习网络进行训练,得到图像分类模型。
[0124]
在本实施的一些可选的实现方式中,语义特征提取模块830,进一步被配置成:通过语义特征提取器分别对第一局部特征和第二局部特征进行特征压缩,得到压缩后的第一局部特征和压缩后的第二局部特征;通过语义特征提取器分别对压缩后的第一局部特征和压缩后的第二局部特征进行维度扩充和语义特征提取,得到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征。
[0125]
在本实施的一些可选的实现方式中,训练模块840,包括:特征聚合单元,被配置成将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别输入分类判别器进行特征聚合,得到第一局部特征对应的第一聚合特征和第二局部特征对应的第二聚合特征;训练单元,被配置成基于第一聚合特征、第二聚合特征和样本图像对应的标注信息,对小样本学习网络进行训练,得到图像分类模型。
[0126]
在本实施的一些可选的实现方式中,特征聚合单元,进一步被配置成:通过分类判别器对第一局部特征和第一语义特征进行权重计算,得到第一局部特征的第一权重;基于第一权重和第一局部特征,确定出第一局部特征对应的第一聚合特征;通过分类判别器对第二局部特征和第二语义特征进行权重计算,得到第二局部特征的第二权重;基于第二权重和第二局部特征,确定出第二局部特征对应的第二聚合特征。
[0127]
在本实施的一些可选的实现方式中,训练单元,进一步被配置成:基于第一聚合特征和第二聚合特征,确定交叉熵损失函数;基于交叉熵损失函数和样本图像对应的标注信息,对小样本学习网络进行联合训练,得到图像分类模型。
[0128]
本公开的上述实施例提供的模型训练装置,上述执行主体首先响应于获取到包括样本图像、样本图像对应的标注信息和查询图像,构建样本图像和查询图像对应的图像对,并构建包括局部特征提取器、语义特征提取器和分类判别器的小样本学习网络,然后将图像对输入局部特征提取器进行局部特征提取,得到样本图像对应的第一局部特征和查询图像对应的第二局部特征,之后将第一局部特征和第二局部特征分别输入语义特征提取器进行语义特征提取,得到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征,最后将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别输入分类判别器,基于样本图像对应的标注信息,对小样本学习网络进行训练,得到图像分类模型,能够基于局部特征进行提取获得对应的语义特征,能够基于语义特征突出与当前分类任务
相关的图像区域,抑制与当前分类任务无关的图像区域,能够更注重与当前分类任务相关的图像区域,不需要考虑其他区域,从而能够提升基于语义特征的特征聚合准确性,克服了度量学习技术的缺点,并且避免了语义对齐技术的难题,进一步提高了图像分类模型的准确性。
[0129]
本领域技术人员可以理解,上述装置还包括一些其他公知结构,例如处理器、存储器等,为了不必要地模糊本公开的实施例,这些公知的结构在图8中未示出。
[0130]
进一步参考图9,作为对上述各图所示方法的实现,本公开提供了一种图像分类装置的一个实施例。该装置实施例与图7所示的方法实施例相对应。
[0131]
如图9所示,本实施例的图像分类装置900可以包括:获取模块910和分类模块920。
[0132]
其中,获取模块910,被配置成获取待分类图像;
[0133]
分类模块920,被配置成将所述待分类图像输入图像分类模型,得到所述待分类图像的分类结果,其中,所述图像分类模型基于上述图2-6所示的方法获取。
[0134]
本公开的上述实施例提供的图像分类装置,上述执行主体首先获取待分类图像,然后将待分类图像输入图像分类模型,得到待分类图像的分类结果,该图像分类模型基于上述方法获取,通过图像分类模型对待分类图像进行分类处理,能够提高待分类图像的分类效率和准确性。
[0135]
本领域技术人员可以理解,上述装置还包括一些其他公知结构,例如处理器、存储器等,为了不必要地模糊本公开的实施例,这些公知的结构在图9中未示出。
[0136]
下面参考图10,其示出了适于用来实现本公开的实施例的电子设备1000的结构示意图。本公开的实施例中的终端设备可以包括但不限于诸如智能屏、笔记本电脑、pad(平板电脑)、pmp(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。图10示出的终端设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
[0137]
如图10所示,电子设备1000可以包括处理装置(例如中央处理器、图形处理器等)1001,其可以根据存储在只读存储器(rom)1002中的程序或者从存储装置1008加载到随机访问存储器(ram)1003中的程序而执行各种适当的动作和处理。在ram 1003中,还存储有电子设备1000操作所需的各种程序和数据。处理装置1001、rom 1002以及ram 1003通过总线1004彼此相连。输入/输出(i/o)接口1005也连接至总线1004。
[0138]
通常,以下装置可以连接至i/o接口1005:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置1006;包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置1007;包括例如磁带、硬盘等的存储装置1008;以及通信装置1009。通信装置1009可以允许电子设备1000与其他设备进行无线或有线通信以交换数据。虽然图10示出了具有各种装置的电子设备1000,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图10中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
[0139]
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置1009从网络上被下载和安装,或者从存储装置
1008被安装,或者从rom 1002被安装。在该计算机程序被处理装置1001执行时,执行本公开的实施例的方法中限定的上述功能。需要说明的是,本公开的实施例的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。
[0140]
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言诸如java、smalltalk、c++,还包括常规的过程式程序设计语言诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络包括局域网(lan)或广域网(wan)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0141]
附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0142]
描述于本技术实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括构建模块、局部特征提取模块、语义特征提取模块和训练模块,或者,一种处理器包括获取模块和分类模块,其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
[0143]
作为另一方面,本技术还提供了一种计算机可读介质,上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可
读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:响应于获取到包括样本图像、样本图像对应的标注信息和查询图像,构建样本图像和查询图像对应的图像对;构建包括局部特征提取器、语义特征提取器和分类判别器的小样本学习网络;将图像对输入局部特征提取器进行局部特征提取,得到样本图像对应的第一局部特征和查询图像对应的第二局部特征;将第一局部特征和第二局部特征分别输入语义特征提取器进行语义特征提取,得到第一局部特征对应的第一语义特征和第二局部特征对应的第二语义特征;将第一局部特征和第一语义特征、第二局部特征和第二语义特征分别输入分类判别器,基于样本图像对应的标注信息,对小样本学习网络进行训练,得到图像分类模型。或者,使得该电子设备:获取待分类图像;将待分类图像输入图像分类模型,得到待分类图像的分类结果,其中,图像分类模型基于模型训练方法获取。
[0144]
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1