本申请涉及数据处理,特别涉及一种分类识别方法、计算机设备和存储介质。
背景技术:
1、深度学习技术近年在通用视觉识别方面取得了显著突破。然而,训练样本的长尾类不平衡常常限制了基于深度网络的识别模型在实际应用中的实用性,深度长尾学习是视觉识别中的挑战性问题之一,期望从遵循长尾类分布的样本中训练出泛化能力强的深度模型。
2、相关技术方案中,将图片输入默认分支和重采样分支进行数据增强后输入深度卷积神经网络得到低维特征表示后再经过全连接层得到属于每个类别概率,然而,其采样方式只是基于平衡采样的简单改进,模型的分类效果并无明显提升。
3、如何突破表征学习的性能瓶颈,提高深度长尾学习的性能,以提升深度网络的识别模型的分类效果的问题仍待解决。
技术实现思路
1、本申请实施方式提供一种深度长尾学习的分类识别方法、计算机设备和存储介质。
2、本申请实施方式提供一种深度长尾学习的分类识别方法。所述分类识别方法包括:获取原始训练数据集,所述原始训练数据集包括头部数据和尾部数据;对所述原始训练数据集进行预处理得到均衡训练数据集;利用深度模型的第一分支卷积神经网络对所述原始训练数据集进行表征学习得到第一特征;利用所述深度模型的第二分支卷积神经网络对所述均衡训练数据集进行表征学习得到第二特征,所述第一分支卷积神经网络和所述第二分支卷积神经网络共享最后一个残差网络以外的参数;根据所述第一特征、所述第二特征、平衡因子和分类器进行融合得到融合特征;根据所述融合特征进行分类得到分类预测结果;根据所述分类预测结果调节所述深度模型直到所述深度模型满足分类识别效果。
3、如此,本申请的深度长尾学习的分类识别方法使用双分支卷积神经网络,能够实现深度网络对长尾数据的稳定表征,提高了深度模型的分类精度,得到更为准确的分类识别效果。
4、在某些实施方式中,所述获取原始训练数据集的步骤之后,所述分类识别方法包括:根据所述原始训练数据集中各个分类的样本数据量将样本数据划分为所述头部数据或所述尾部数据。
5、如此,本申请可以根据原始训练数据集中各个分类的样本数据量将样本数据划分为头部数据和尾部数据。
6、在某些实施方式中,所述对所述原始训练数据集的尾部数据进行预处理得到均衡训练数据集,包括:采用平衡生成对抗网络生成对所述尾部数据进行数据增广得到所述增广训练数据集;对所述增广训练数据集内各个分类的头部数据进行类内样本均衡化处理得到所述均衡训练数据集。
7、如此,本申请通过使用平衡生成对抗网络生成接近真实图片的尾部数据,缩小了长尾数据的分布差距,使得深度模型能够学习到更多的特征表示,减小了均匀采样对深度模型带来的影响。本申请还对增广训练数据集内各个分类的头部数据进行类内样本均衡化处理得到均衡训练数据集,有效减少相似甚至重复样本的采样,能够提高深度模型的泛化能力。
8、在某些实施方式中,所述采用平衡生成对抗网络生成对所述尾部数据进行数据增广得到所述增广训练数据集,包括:根据所述尾部数据的类别标签和隐含因子生成器生成隐含因子;根据所述隐含因子和数据生成器生成新增数据;利用判别器和所述尾部数据对所述新增数据进行处理得到判别结果;根据所述判别结果将所述新增数据添加到所述原始训练数据集中得到所述增广训练数据集。
9、如此,本申请通过引入平衡生成对抗网络扩增尾部数据,可以缩小头尾数据的分布差距。
10、在某些实施方式中,所述对所述增广训练数据集内各个分类的头部数据进行类内样本均衡化处理得到所述均衡训练数据集,包括:确定所述增广训练数据集内各个分类的头部数据的采样数量;随机抽取每个分类内的头部数据的一个抽样数据,计算所述抽样数据与对应分类内的头部数据样本数据的特征相似度;根据所述采样数量和所述特征相似度等间距均衡抽取对应分类内的所述样本数据得到所述均衡训练数据集。
11、本申请通过类内样本均衡化平衡各类样本采样,能够有效减少相似甚至重复样本的采样,能够提高深度模型的泛化能力。另外,本申请使用特征相似度的原理对头部数据进行了类内样本的均衡重采样,极大地改善了自然场景下普通平衡采样方式对相似或相同行人年龄样本重复采样所带来特征损失。
12、在某些实施方式中,所述根据所述第一特征、所述第二特征、平衡因子和分类器进行融合得到融合特征,包括:分别对所述第一特征和所述第二特征进行全局池化处理得到第三特征和第四特征;利用所述平衡因子和对应的分类器分别对所述第三特征和所述第四特征进行加权累加融合得到所述融合特征数据。
13、如此,本申请可以根据第一特征、第二特征、平衡因子和分类器进行融合得到融合特征,以便于后续根据融合特征数据进行分类得到分类预测结果,最后根据分类预测结果得到分类识别结果。
14、在某些实施方式中,所述根据所述第一特征、所述第二特征、平衡因子和分类器进行融合得到融合特征,包括:根据训练迭代次数确定所述平衡因子。
15、如此,本申请通过训练迭代次数确定平衡因子,即平衡因子与训练迭代次数相关,能够通过调整训练迭代次数调节平衡因子,从而得到不同的融合特征,得到不同的分类预测结果和分类识别结果。
16、在某些实施方式中,所述分类识别方法包括:获取待处理数据;利用满足分类识别结果的所述深度模型对所述待处理数据进行分类得到分类识别结果。
17、如此,本申请可以利用满足分类识别结果的深度模型对待处理数据进行分类得到分类识别结果。
18、本申请还提供一种计算机设备。所述计算机设备包括处理器和存储器,所述存储器上存储有计算机程序,当所述计算机程序被所述处理器执行时,实现如上述实施方式中任一项所述的分类识别方法。
19、本申请的计算机设备应用上述的深度长尾学习的分类识别方法使用双分支卷积神经网络,能够实现深度网络对长尾数据的稳定表征,提高了深度模型的分类精度,得到更为准确的分类识别效果。
20、本申请还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被一个或多个处理器执行时,实现上述实施方式中任一项所述的分类识别方法。
21、如此,本申请的存储介质应用上述的深度长尾学习的分类识别方法使用双分支卷积神经网络,能够实现深度网络对长尾数据的稳定表征,提高了深度模型的分类精度,得到更为准确的分类识别效果。
22、本申请实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
1.一种深度长尾学习的分类识别方法,其特征在于,包括:
2.根据权利要求1所述的分类识别方法,其特征在于,所述获取原始训练数据集的步骤之后,所述分类识别方法包括:
3.根据权利要求1所述的分类识别方法,其特征在于,所述对所述原始训练数据集进行预处理得到均衡训练数据集,包括:
4.根据权利要求3所述的分类识别方法,其特征在于,所述采用平衡生成对抗网络生成对所述尾部数据进行数据增广得到所述增广训练数据集,包括:
5.根据权利要求3所述的分类识别方法,其特征在于,所述对所述增广训练数据集内各个分类的头部数据进行类内样本均衡化处理得到所述均衡训练数据集,包括:
6.根据权利要求1所述的分类识别方法,其特征在于,所述根据所述第一特征、所述第二特征、平衡因子和分类器进行融合得到融合特征,包括:
7.根据权利要求1所述的分类识别方法,其特征在于,所述根据所述第一特征、所述第二特征、平衡因子和分类器进行融合得到融合特征,包括:
8.根据权利要求1所述的分类识别方法,其特征在于,所述分类识别方法包括:
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器上存储有计算机程序,当所述计算机程序被所述处理器执行时,实现如权利要求1-8任一项所述的分类识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被一个或多个处理器执行时,实现如权利要求1-8任一项所述的分类识别方法。