1.一种vit蒸馏训练方法,其特征在于,包括:
2.根据权利要求1所述的vit蒸馏训练方法,其特征在于,所述选择长尾数据集,并对长尾数据集进行预处理,包括:
3.根据权利要求2所述的vit蒸馏训练方法,其特征在于,所述对卷积神经网络进行训练,生成教师模型,包括:
4.根据权利要求3所述的vit蒸馏训练方法,其特征在于,所述基于长尾数据集生成数据样本,输入教师模型,生成软标签,包括:
5.根据权利要求4所述的vit蒸馏训练方法,其特征在于,所述基于视觉transformer构建学生模型,为学生模型配置知识蒸馏功能和损失函数,包括:
6.根据权利要求5所述的vit蒸馏训练方法,其特征在于,所述基于分类结果和软标签利用损失函数优化学生模型参数,包括:
7.根据权利要求2所述的vit蒸馏训练方法,其特征在于,所述弱增强处理包括:随机裁剪处理、水平翻转处理和颜色调整处理;所述强增强处理包括:随机旋转处理、预设幅度的裁剪处理和颜色抖动处理。
8.一种vit蒸馏训练系统,其特征在于,所述系统采用权利要求1至7任一项所述的vit蒸馏训练方法;
9.一种vit蒸馏训练装置,其特征在于,包括:
10.一种可读存储介质,其特征在于:所述可读存储介质上存储有vit蒸馏训练程序,所述vit蒸馏训练程序被处理器执行时实现如权利要求1至7任一项权利要求所述的vit蒸馏训练方法的步骤。