一种基于全局-局部知识蒸馏的跨域小样本图像分类方法

文档序号：33822263发布日期：2023-04-19 20:01阅读：63来源：国知局

本发明属图像处理，具体涉及一种基于全局-局部知识蒸馏的跨域小样本图像分类方法。

背景技术：

1、图像处理是机器视觉走向工业应用的关键技术，而图像分类是图像处理技术的基础。在医学、遥感等多种场景下，图像数据往往难以获取，呈现典型的小样本特性。为了缓解小样本问题，一种有效的方式是利用源域数据学习可迁移的知识，并将学习到的知识泛化到目标域的小样本任务中。然而，由于源域与目标域之间存在域差异，导致源域上训练的模型难以有效地泛化到目标域中。为此，研究适用于跨域场景下的小样本图像分类技术具有重要的应用价值。文献“snell j,swersky k,zemel r.prototypical networks for fewlearning[c]//advances in neural information processing systems.2017:4077-.”提出一种基于原型的小样本图像分类方法。它首先使用深度神经网络提取图像的特征，然后在特征空间中利用每个小样本任务中的少量标记样本构建类别的原型表示，最后根据测试样本到这些类别原型之间的距离进行类别隶属关系的分配。然而，由于深度神经网络的简单性偏好，导致该方法构建的原型往往只能捕获最具判别性的模式，例如，颜色、形状等，忽略了具有跨域泛化能力的语义信息。因此，该方法在跨域小样本图像分类任务中性能表现不佳。

技术实现思路

1、为了克服现有技术的不足，本发明提供一种基于全局-局部知识蒸馏的跨域小样本图像分类方法。构建了由全局分支和局部分支构成的分类模型，其中，全局分支以原始图像为输入，用于提取图像的全局特征，局部分支以原始图像的局部块为输入，用于提取该图像的局部特征；在两分支之间，通过构建全局-局部知识蒸馏损失促进全局特征关注到图像的局部区域，使得全局特征捕获丰富的语义信息，进而提升全局特征在跨域小样本任务上的泛化性能。

2、一种基于全局-局部知识蒸馏的跨域小样本图像分类方法，其特征在于步骤如下：

3、步骤1：基于现有的图像数据集构建小样本任务训练数据集，包括支持集和查询集其中，支持集包括n个类别，每个类别带有k个监督样本，查询集也包括这n个类别，每个类别带有m个未标记的样本；

4、步骤2：构建模型的全局分支，其处理过程如下：

5、首先，按照下式获得支持集的原型表示：

6、

7、其中，表示支持集中第n个类别的第k个样本，表示全局分支中的特征提取网络，本发明中采用resnet-10网络，cn表示第n个类别的原型表示，n＝1,2,…,n；

8、然后，基于原型表示对查询集中的每个样本进行类别隶属关系预测：

9、

10、其中，表示查询集中的第i个查询样本，i＝1,2,…,n*m，表示该样本的预测得分，matching(·)为两个向量之间的相似度度量函数，本发明中使用欧氏距离进行相似度度量；

11、接着，根据预测得分中的最大相似度对应的类别作为该查询样本的预测标签并根据查询样本的预测标签和真实标签计算交叉熵损失如下：

12、

13、其中，h(·)表示交叉熵损失函数，表示查询样本对应的真实标签，表示查询样本的预测标签和真实标签之间的交叉熵损失；

14、步骤3：构建模型的局部分支，其处理过程如下：

15、对于查询样本首先使用随机裁剪获取其相应的局部图像块其中r∈[1,r]，表示每个查询图像对应的局部图像块的个数，表示查询样本的第r个局部图像块；

16、然后，使用局部分支中的特征提取网络提取得到各个局部图像块对应的局部特征其中，局部分支中的特征提取网络采用resnet-10网络；

17、接着，使用步骤2计算的原型对局部特征进行类别隶属关系预测，得到各个局部图像块对应的预测得分

18、

19、其中，表示查询样本的第r个局部图像块的相似度得分，表示查询样本的第r个局部图像块的局部特征；

20、步骤4：按照下式计算模型的总损失

21、

22、其中，i表示小样本任务中查询样本的总个数，表示查询样本的全局-局部知识蒸馏损失，表示跨图像的局部-全局蒸馏损失，λ1表示全局-局部知识蒸馏损失项的系数，设置λ1为1，λ2表示跨图像的局部-全局蒸馏损失项的系数，设置λ2为0.15；

23、所述的查询样本的全局-局部知识蒸馏损失按下式计算得到：

24、

25、所述的跨图像的局部-全局蒸馏损失按下式计算得到：

26、

27、其中，表示查询集中的第j个查询样本的第r个局部图像块的预测得分，j≠i表示j为与第i个查询样本属同一类别的不同样本，j＝1,2,…,n*m；

28、步骤5：根据步骤4计算的模型总损失，使用随机梯度下降法，端到端的训练全局分支的网络参数，并按下式进行局部分支的网络参数的更新：

29、θt←mθt+(1-m)θs(8)

30、其中，θt表示局部分支中的网络参数，m表示指数移动平均更新中的动量系数，设置m为0.998，θs表示全局分支中的网络参数，←表示更新操作；

31、步骤6：将待处理图像数据集输入到步骤5训练后得到的全局分支，预测得到其中每幅图像的隶属类别，完成图像分类。

32、本发明的有益效果是：通过训练阶段构建的全局-局部知识蒸馏框架促进全局特征关注到图像的局部信息，从而使模型能够学习到泛化性强的语义表征，提升在跨域小样本任务上的泛化性能；采用端到端的框架设计方式，一旦模型在源域(训练数据集)上训练完成之后，即可在任意目标域(待处理图像数据集)的小样本任务上进行测试，无需微调特征提取模型；本发明能够在跨域小样本图像分类中获得较好的分类效果。

技术特征：

1.一种基于全局-局部知识蒸馏的跨域小样本图像分类方法，其特征在于步骤如下：

技术总结
本发明提供了一种基于全局‑局部知识蒸馏的跨域小样本图像分类方法。构建了由全局分支和局部分支构成的分类模型，其中，全局分支以原始图像为输入，用于提取图像的全局特征，局部分支以原始图像的局部块为输入，用于提取该图像的局部特征；在两分支之间，通过构建全局‑局部知识蒸馏损失促进全局特征关注到图像的局部区域，使得全局特征捕获丰富的语义信息，进而提升全局特征在跨域小样本任务上的泛化性能。

技术研发人员：张磊,魏巍,周飞,张艳宁
受保护的技术使用者：西北工业大学
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张磊魏巍周飞张艳宁
技术所有人：西北工业大学
我是此专利的发明人

上一篇：一种板式自动换网器的制作方法
上一篇：长牡蛎C型凝集素CgCLec-TM2功能域CRD重组蛋白及应用

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。