一种图像分类方法、装置、存储介质及终端与流程

文档序号：30061431发布日期：2022-05-17 23:42阅读：来源：国知局

技术特征：
1.一种图像分类方法，其特征在于，所述方法包括：获取待分类的目标图像；将所述目标图像输入到预先训练的图像分类模型中；其中，所述预先训练的图像分类模型是依次经过自监督学习、监督学习和半监督学习训练生成的；所述自监督学习是基于有标签数据集训练的，所述监督学习是基于无标签数据集训练的，所述半监督学习时基于伪标签数据集和有标签数据集共同训练的；所述伪标签数据集是基于所述无标签数据集生成的；输出所述目标图像对应的图像类别。2.根据权利要求1所述的方法，其特征在于，按照以下步骤生成预先训练的图像分类模型，包括：获取数据集；其中，所述数据集包括无标签数据集和有标签数据集；创建分类模型，并基于所述分类模型的模型参数构建编码器和动量编码器；根据所述无标签数据集、编码器和动量编码器进行自监督学习，得到训练后的编码器；将训练后的编码器的参数加载到所述分类模型上，并初始化所述分类模型的全连接层，得到第一分类模型；将所述有标签数据集输入到所述第一分类模型进行监督学习，得到训练后的第一分类模型；预处理训练后的第一分类模型，得到预处理后的第一分类模型；将所述有标签数据集输入到预处理后的第一分类模型进行半监督学习，得到预先训练的图像分类模型。3.根据权利要求2所述的方法，其特征在于，所述根据所述无标签数据集、编码器和动量编码器进行自监督学习，得到训练后的编码器，包括：初始化预设大小的队列；将所述无标签数据集划分为多个子数据集；在所述多个子数据集中确定出一个目标子数据集；对所述目标子数据集进行图像变换，得到第一变换数据和第二变换数据；将所述第一变换数据和第二变换数据分别输入到所述编码器和动量编码器中，输出第一嵌入式表征结果和第二嵌入式表征结果；对所述第一嵌入式表征结果和第二嵌入式表征结果分别进行维度扩张，得到第一扩张结果和第二扩张结果；根据所述第一扩张结果和第二扩张结果计算正样本特征相似度；将所述队列中的特征进行置换后得到置换矩阵，并根据所述置换矩阵与所述第一嵌入式表征结果计算负样本特征相似度；根据所述正样本特征相似度和所述负样本特征相似度计算自监督学习损失值，并当所述自监督学习损失值到达预设值时，得到训练后的编码器。4.根据权利要求3所述的方法，其特征在于，所述当所述自监督学习损失值到达预设值时，得到训练后的编码器，包括：当所述自监督学习损失值未到达预设值时，根据所述自监督学习损失值对所述编码器进行反向传播，以更新所述编码器参数；
继续执行所述在所述多个子数据集中确定出一个目标子数据集的步骤，直到所述自监督学习损失值到达预设值。5.根据权利要求2所述的方法，其特征在于，所述预处理训练后的第一分类模型，得到预处理后的第一分类模型，包括：确定训练后的第一分类模型的骨干网络和第一全连接层；构建与所述第一全连接层结构相同的第二全连接层；将所述第二全连接层连接在所述骨干网络的最后一层，得到第二分类模型；将所述第二分类模型中的骨干网络和第一全连接层参数进行固定，并开启所述第二分类模型中的所有dropout层，得到预处理后的第一分类模型。6.根据权利要求5所述的方法，其特征在于，所述将所述有标签数据集输入到预处理后的第一分类模型进行半监督学习，得到预先训练的图像分类模型，包括：将所述有标签数据输入到预处理后的第一分类模型中进行多次并行计算，输出多个第一目标预测值；根据每个第一目标预测值计算第一均值和第一标准差，并根据所述第一均值和第一标准差计算半监督学习损失值；当所述半监督学习损失值到达预设值时，得到第三分类模型；开启所述第三分类模型中的第二全连接层中的dropout层；关闭所述第三分类模型中的除第二全连接层之外其它层中的dropout层，得到预处理后的第三分类模型；将所述无标签数据输入预处理后的第三分类模型中进行多次并行计算，输出多个第二目标概率值和偶然不确定性参数；根据每个第二目标概率值计算出第二均值和第二标准差；根据所述偶然不确定性参数、第二均值和第二标准差得到伪标签数据集；当所述伪标签符合预设多个条件时，将所述伪标签数据集加入所述有标签数据集中，得到目标数据集；将所述目标数据集输入到所述第一分类模型进行监督学习，得到预先训练的图像分类模型。7.根据权利要求6所述的方法，其特征在于，所述当所述半监督学习损失值到达预设值时，得到第三分类模型，包括：当所述半监督学习损失值未到达预设值时，继续执行将所述有标签数据输入到预处理后的第一分类模型中进行多次并行计算的步骤。8.一种图像分类装置，其特征在于，所述装置包括：图像获取模块，用于获取待分类的目标图像；图像输入模块，用于将所述目标图像输入到预先训练的图像分类模型中；其中，所述预先训练的图像分类模型是依次经过自监督学习、监督学习和半监督学习训练生成的；所述自监督学习是基于有标签数据集训练的，所述监督学习是基于无标签数据集训练的，所述半监督学习时基于伪标签数据集和有标签数据集共同训练的；所述伪标签数据集是基于所述无标签数据集生成的；类别输出模块，用于输出所述目标图像对应的图像类别。
9.一种计算机存储介质，其特征在于，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行如权利要求1-7任意一项的方法步骤。10.一种终端，其特征在于，包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行如权利要求1-7任意一项的方法步骤。

技术总结
本发明公开了一种图像分类方法、装置、存储介质及终端，方法包括：获取待分类的目标图像；将目标图像输入到预先训练的图像分类模型中；其中，预先训练的图像分类模型是依次经过自监督学习、监督学习和半监督学习训练生成的；自监督学习是基于有标签数据集训练的，监督学习是基于无标签数据集训练的，半监督学习时基于伪标签数据集和有标签数据集共同训练的；伪标签数据集是基于无标签数据集生成的；输出目标图像对应的图像类别。本申请通过无标签数据集生成伪标签数据集，并结合有标签数据集对模型进一步训练，从而提升了无标签数据的利用率，使得模型的分类精度更高。使得模型的分类精度更高。使得模型的分类精度更高。

技术研发人员：刘斌张睿何英杰聂虎
受保护的技术使用者：特斯联科技集团有限公司
技术研发日：2021.12.31
技术公布日：2022/5/16

完整全部详细技术资料下载

当前第2页1 2