一种基于原型的低扰动的图像类增量学习算法

文档序号：35209978发布日期：2023-08-24 03:41阅读：35来源：国知局

本发明涉及深度学习领域，具体来说，涉及深度学习领域中的图像分类领域，更具体的说是涉及一种基于原型的低扰动的图像类增量学习算法。

背景技术：

1、人类和动物能够应对环境的不断变化接受和学习新的知识，并对原有的知识进行补充和修正。在很多分类任务中，也需要分类算法具备人类和动物这种持续学习新知识，并避免遗忘旧知识的能力，这类算法称为增量学习算法。本发明研究图像类增量学习问题，即分类模型在保持对旧类别的判别力同时，可持续学习新的类别。目前主流的图像分类算法是基于封闭世界假设的全监督神经网络分类模型，即训练和测试的类别完全相同。但是在实际应用过程中会不断的出现新的类别，大部分神经网络并不能识别未训练过的图片。即神经网络模型仅能识别已知类别的图片，对于未训练的图片种类，神经网络模型会将该物体错误的归到已知的类别，从而导致识别精度下降，所以需要设计图像增量学习算法，使得模型可以在保持对旧类别的判别力同时，可持续学习新类别的知识。

2、增量学习分类模型一方面必须表现出从新数据中学习新知识和提炼已有知识的能力，另一方面又必须避免新知识对已有知识的显著干扰。如何让模型更好的在两者间取得平衡，是增量学习算法所面临的挑战。目前已经提出了一些类别增量学习策略，其中主流的方法是存储少量的旧类别样本与新增的类别样本一起联合训练更新模型参数，但是这类算法往往用全部的新类数据去训练模型，导致模型训练需要花费很长的时间。对于获取不到旧数据的情况下，有些研究尝试确定保持旧类别分类性能的重要参数并惩罚重要参数的变化，但是在长序列增量任务中，由于新旧类别优化方向差异较大，导致这些正则化方法泛化能力较差。有的方法提出通过动态地调整网络结构，在必要时扩展网络以适应新任务的学习，但是随着新增任务的不断增加，其模型结构也将不断变大，因此无法应用到大规模数据任务。

3、本发明提供了一种基于原型的低扰动的图像类增量学习算法，对于新类别的数据，先用全部的数据获得新类别的初始化原型，再优选出与旧类别数据具有冲突部分的边缘数据对分类模型做低扰动训练，控制了新增数据数量，降低了分类模型的训练成本，提高新旧类别的分类准确率。

技术实现思路

1、针对在增量过程中不断学习新数据的知识同时不忘记旧数据知识的迫切需求，本发明提供了一种基于原型的低扰动的图像类增量学习算法。本发明采用如下技术方案：

2、一种基于原型的低扰动的图像类增量学习算法，包括以下步骤：

3、1)将旧分类模型的特征提取网络，作为增量学习新分类模型的特征提取网络。输入新增量数据，至所述增量学习新分类模型，初始化新类别的原型；

4、2)对于每一个新类，将该类样本的特征提取网络的输出与其对应的原型的欧式距离从大到小排序，选择前十分之一的样本作为新类的边缘部分样本，以及随机选取等量的旧类别样本，共同构建增量学习数据集；

5、3)输入所述增量学习数据集到所述增量学习新分类模型，在增量学习损失函数loss约束下进行增量学习训练，loss具体包括类间间隔损失ldce和类内紧致性损失lp，得到训练后的增量学习新分类模型；

6、4)在测试阶段，输入待分类图像至所述训练后的增量学习新分类模型，得到图像特征提取网络的输出，计算该输出与每类原型的欧氏距离，将该图像分类为距离最近的原型所属的类别。

7、步骤1)中新类别的原型的计算公式为：

8、

9、其中，pc表示类别c的原型，l表示类别c的样本总数，i表示类别c中的第i张图像，表示类别c中第i张图像的特征提取网络的输出。

10、步骤3)中类间间隔损失ldce采用如下公式计算：

11、

12、

13、其中，di表示特征提取网络的输出featurei与对应所属类别的原型pi的欧式距离，i表示类别，yi表示类别的标签，k为旧分类模型的类别数量，m为增量学习新分类模型新增加的类别数量。

14、步骤3)中类内紧致性损失lp采用如下公式计算：

15、

16、其中，featurei表示特征提取网络的输出，pi表示类别的原型，i表示类别，k为旧分类模型的类别数量，m为增量学习新分类模型新增加的类别数量。

17、步骤3)中增量学习损失函数loss采用如下公式计算：

18、loss＝ldce+λlp

19、其中，λ表示lp的权重系数，调节类间间隔损失ldce和类内紧致性损失lp的重要程度。

20、本发明具有以下有益效果：1)在训练过程中采用了类间间隔损失，提升每个类别的聚类能力，同时使用了类内紧致性损失，进一步增强每个类别聚类的紧致性，对分类任务更具鲁棒性；2)在增量学习阶段，通过选取与旧类别数据具有冲突部分的边缘数据对分类模型做低扰动训练，降低了模型的计算代价，使得分类模型的网络变化不会过大，保持对旧类别的识别率，同时提升对新类别的识别率。

技术特征：

1.一种基于原型的低扰动的图像类增量学习算法，其特征在于，所述方法包括对图像分类模型进行多阶段增量学习训练以识别新类别和旧类别的图像，每个阶段训练后得到一个该阶段对应的图像分类模型，每个阶段使用不同类别的图像数据集，其中，每阶段包括以下步骤：

2.根据权利要求1所述的一种基于原型的低扰动的图像类增量学习算法，其特征在于，步骤1)中新类别的原型是采用如下公式计算：

3.根据权利要求1所述的一种基于原型的低扰动的图像类增量学习算法，其特征在于，步骤3)中类间间隔损失ldce采用如下公式计算：

4.根据权利要求1所述的一种基于原型的低扰动的图像类增量学习算法，其特征在于，步骤3)中类内紧致性损失lp采用如下公式计算：

5.根据权利要求1所述的一种基于原型的低扰动的图像类增量学习算法，其特征在于，步骤3)中增量学习损失函数loss采用如下公式计算：

技术总结
本发明涉及一种基于原型的低扰动的图像类增量学习算法，该方法包括如下步骤：将旧分类模型的特征提取网络，作为增量学习新分类模型的特征提取网络。输入新增量数据，至增量学习新分类模型，初始化新类别的原型；对于每一个新类，将该类样本的特征提取网络的输出与其对应的原型的欧式距离从大到小排序，选择前十分之一的样本作为新类的边缘部分样本，以及随机选取等量的旧类别样本，共同构建增量学习数据集；输入增量学习数据集至增量学习新分类模型，在增量学习损失函数约束下进行增量学习训练，得到训练后的增量学习新分类模型；在测试阶段，输入待分类图像至训练后的增量学习新分类模型，得到图像特征提取网络的输出，计算该输出与每类原型的欧氏距离，将该图像分类为距离最近的原型所属的类别。本发明优选出边缘数据对分类模型做低扰动训练，控制了新增数据数量，降低了分类模型的训练成本，提高新旧类别的分类准确率。

技术研发人员：曾明,李思颖,赵峰,王湘晖
受保护的技术使用者：天津大学
技术研发日：
技术公布日：2024/1/14

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曾明李思颖赵峰王湘晖
技术所有人：天津大学
我是此专利的发明人

上一篇：信息输出方法和装置与流程
上一篇：文本分类模型的训练方法和装置、电子设备及存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。