一种基于遗传算法的图像数据自动增强方法

文档序号：33367587发布日期：2023-03-08 00:13阅读：79来源：国知局

1.本发明涉及计算机视觉领域，特别是指一种基于遗传算法的图像数据自动增强方法。

背景技术：

2.随着深度学习的发展以及计算机计算性能的提升，基于深度学习的图像识别方法在计算机视觉领域的应用越来越广泛。深度学习模型的性能依赖于大量的数据，获取数据的方法一般是人工标注。人工标注需要耗费大量的人力物力，数据增强可以扩展可训练的数据。数据增强通过对图片进行几何变换和颜色变换，来获得与原始数据集相似的训练数据，进而提高深度学习模型的性能。
3.通常在模型的训练过程中，会手工设置一些数据增强方法，手工设计增强策略需要丰富的专家经验，并且很难使模型达到最优的性能。近年来已有一些自动数据增强的方法来缓解手工设计增强策略的缺点。常见的自动数据增强方法有autoaugment，autoaugment-det等，其思想是把增强策略离散化，建立若干个增强策略组合，每个增强策略组合包含多个增强操作。然后利用离散寻优的方法，搜索出若干个最优的增强策略组合。但是，这些自动增强方法是针对于大型数据集的，如coco数据集，因此存在搜索空间大，搜索过程耗时多的缺点，需要耗费大量的计算资源。

技术实现要素：

4.本发明的主要目的在于克服现有技术中的上述缺陷，提出一种基于遗传算法的图像数据自动增强方法，旨在减少数据集自动增强的搜索成本，在较短的时间内搜索出最优的增强策略组合。
5.本发明采用如下技术方案：
6.一种基于遗传算法的图像数据自动增强方法，包括：
7.获取用于搜索的代理数据集：把原始数据集按照设定的比例划分为训练集t和测试集v，从训练集和测试集中随机抽取一定比例的数据，作为代理训练集t和代理测试集v；
8.获取多种数据增强操作方法：根据增强操作原理把数据增强操作分为几何变换和颜色变换；
9.构建离散搜索空间：把每种增强策略的操作方法、操作概率、操作幅度进行离散编码，分别构建数据自动增强的几何变换搜索空间和颜色变换搜索空间；
10.搜索增强策略：采用遗传算法，随机生成若干个操作方法作为初始种群，通过种群的迭代寻优，在几何变换搜索空间中，搜索出若干个最优的几何增强策略，同样在颜色变换搜索空间中搜索出若干个最优的颜色增强策略，将若干个最优的几何增强策略和若干个最优的颜色增强策略合成增强策略组合；
11.确定最优的增强策略组合个数：在每个增强策略组合分别从搜索到的几何增强策略和颜色增强策略中，按精度顺序各选择n个增强策略组合，n＝1、2、3
…
；在n取不同值时，
采用对应的增强策略组合训练模型并评估精度，根据精度来确定n的最优值。
12.具体地，所述数据增强操作方法，包括几何变换和颜色变换；其中所述几何变换包括但不限于旋转、翻转、平移、缩放、剪切、裁剪；所述颜色变换包括但不限于颜色、亮度、对比度、锐度、曝光、直方图均衡化。
13.具体地，增强策略的离散编码是采用3个正整数，来分别代表具体的操作方法、使用该操作的概率和使用该操作的幅度。
14.具体地，采用遗传算法，从单个搜索空间中，搜索出若干个最优增强策略的过程，具体包括：
15.s201，使用原始训练集t训练出一个初始模型m；
16.s202，随机生成初始种群，种群由k个增强策略组成；
17.s203，循环遍历k个增强策略，在代理训练集t上应用每个增强策略，对初始模型m进行微调训练，得到增强后的模型m*；采用m*评估代理测试集v的精度；
18.s204，根据代理测试集v的精度大小，从k个增强策略中选择k个精度最高的策略，作为遗传的亲本，k≥2；
19.s205，在k个遗传亲本中，随机选择两个亲本进行交叉，生成新的子代，交叉过程中有p的概率发生变异；交叉过程重复(k-k)次，即生成(k-k)个子代；
20.s206，k个遗传亲本和(k-k)个子代结合，组成新的种群，新的种群依然有k个增强策略；
21.s207，重复s203～s206的过程，不断对种群进行迭代；种群i次迭代后，输出k个最优的增强策略。
22.具体地，确定最优的增强策略组合个数，具体包括：
23.增强策略组合包括一个几何增强策略和一个颜色增强策略；使用n个增强策略组合训练模型时，训练集为原始训练集t，评估模型精度时，测试集为原始测试集v。
24.由上述对本发明的描述可知，与现有技术相比，本发明具有如下有益效果：
25.本发明中的图像数据自动增强方法，包括：获取用于搜索的代理数据集：把原始数据集按照设定的比例划分为训练集t和测试集v，从训练集和测试集中随机抽取一定比例的数据，作为代理训练集t和代理测试集v；获取多种数据增强操作方法：根据增强操作原理把数据增强操作分为几何变换和颜色变换；构建离散搜索空间：把每种增强策略的操作方法、操作概率、操作幅度进行离散编码，分别构建数据自动增强的几何变换搜索空间和颜色变换搜索空间；搜索增强策略：采用遗传算法，随机生成若干个操作方法作为初始种群，通过种群的迭代寻优，在几何变换搜索空间中，搜索出若干个最优的几何增强策略，同样在颜色变换搜索空间中搜索出若干个最优的颜色增强策略，将若干个最优的几何增强策略和若干个最优的颜色增强策略合成增强策略组合；确定最优的增强策略组合个数：在每个增强策略组合分别从搜索到的几何增强策略和颜色增强策略中，按精度顺序各选择n个增强策略组合，n＝1、2、3
…
；在n取不同值时，采用对应的增强策略组合训练模型并评估精度，根据精度来确定n的最优值；通过在搜索时使用代理数据集，对几何变换和颜色变换分开进行寻优，减少单个搜索空间的参数量，即减少了搜索过程的时间成本，又能实现增强策略组合个数的优选，最大限度的保留了数据增强的有效性，普遍适用于各类数据集。
附图说明
26.图1为本发明实施例提供的图像数据自动增强流程图。
27.图2为本发明实施例提供的单个搜索空间的搜索流程图。
28.以下结合附图和具体实施例对本发明作进一步详述。
具体实施方式
29.为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
30.本发明中的图像数据自动增强方法，通过在搜索时使用代理数据集，对几何变换和颜色变换分开进行寻优，减少单个搜索空间的参数量，即减少了搜索过程的时间成本，又能实现增强策略组合个数的优选，最大限度的保留了数据增强的有效性，普遍适用于各类数据集。
31.本发明的目的是提供一种基于遗传算法的图像数据自动增强方法，提高图像数据的丰富度和使用效率，与深度学习模型相结合提高模型的识别精度。
32.一种基于遗传算法的图像数据自动增强方法，所述方法包括如下步骤：
33.s01，获取用于搜索的代理数据集，把原始数据集按照8:2的比例划分为训练集t和测试集v。从训练集和测试集中随机抽取三分之一的数据，作为代理训练集t和代理测试集v。
34.s02，获取多种数据增强操作方法，根据增强操作原理把操作分为几何变换和颜色变换。几何变换包含6种操作方法：旋转、翻转、平移、缩放、剪切、裁剪等。颜色变换包含6种操作方法：颜色、亮度、对比度、锐度、曝光、直方图均衡化。
35.s03，构建离散搜索空间。编码是使用3个正整数分别代表增强策略的操作方法、操作概率和操作幅度。操作方法的编码和操作幅度范围如表1所示。操作概率的取值范围是[1,10]，如取2代表使用该操作的概率为0.2。操作幅度的取值范围是[1,10]，即将表1中的幅度范围10等分。如编码(1,5,1)在几何变换空间代表的含义是使用旋转变换操作、操作概率是0.5、旋转的幅度是-30度，而在颜色变换空间的含义是使用颜色变换操作、操作概率是0.5、颜色的变换系数是0.1。
[0036]
表1操作方法的编码和操作幅度范围
[0037]
[0038][0039]
s04，使用遗传算法从单个搜索空间中，搜索出若干个最优增强策略的过程，具体包括：
[0040]
s201，使用原始训练集t训练迭代24000步，得到初始模型m。
[0041]
s202，随机生成初始种群，种群由20个增强策略组成。
[0042]
s203，循环遍历20个增强策略，在代理训练集t上应用每个增强策略，对初始模型m进行微调训练2000步，学习率设置为0.00025，batchsize设置为4。微调训练后得到增强后的模型m*。使用m*评估代理测试集v的精度。
[0043]
s204，根据代理测试集v的精度大小，从20个增强策略中按顺序选择10个精度最高的增强策略，作为遗传的亲本。
[0044]
s205，在10个遗传亲本中，随机选择两个亲本进行交叉，生成新的子代，交叉过程中有p＝0.2的概率发生变异。交叉过程重复10次，即生成10个子代。
[0045]
s206，10个遗传亲本和10个子代结合，组成新的种群，新的种群依然有20个增强策略。
[0046]
s207，重复s203～s206的过程，不断对种群进行迭代。种群迭代10次后，输出10个最优的增强策略。
[0047]
s04中从几何变换搜索空间搜索出的最优的几何增强策略，记为集合a＝{a1，a2，
…
a10}，从颜色变换搜索空间搜索出的最优的颜色增强策略记为集合b＝{b1，b2,
…
b10}。
[0048]
s05，确定最优的增强策略组合个数。增强策略组合包括一个几个增强策略和一个颜色增强策略，如a1，b1为一个增强策略组合，a2，b2为一个增强策略组合
…
a10，b10为一个增强策略组合，共计10个增强策略组合。为了确定最优的增强策略组合个数，需要分别应用n(n＝1、2、
…
10)个增强策略组合训练模型。具体方法是，使用训练集t迭代训练24000步，使用测试集v评估模型精度，根据精度来确定n的最优值。
[0049]
n的最优值确定了，即能得到原始数据集的最优增强策略组合方案。
[0050]
本发明中的图像数据自动增强方法，包括：获取用于搜索的代理数据集：把原始数
据集按照设定的比例划分为训练集t和测试集v，从训练集和测试集中随机抽取一定比例的数据，作为代理训练集t和代理测试集v；获取多种数据增强操作方法：根据增强操作原理把数据增强操作分为几何变换和颜色变换；构建离散搜索空间：把每种增强策略的操作方法、操作概率、操作幅度进行离散编码，分别构建数据自动增强的几何变换搜索空间和颜色变换搜索空间；搜索增强策略：采用遗传算法，随机生成若干个操作方法作为初始种群，通过种群的迭代寻优，在几何变换搜索空间中，搜索出若干个最优的几何增强策略，同样在颜色变换搜索空间中搜索出若干个最优的颜色增强策略，将若干个最优的几何增强策略和若干个最优的颜色增强策略合成增强策略组合；确定最优的增强策略组合个数：在每个增强策略组合分别从搜索到的几何增强策略和颜色增强策略中，按精度顺序各选择n个增强策略组合，n＝1、2、3
…
；在n取不同值时，采用对应的增强策略组合训练模型并评估精度，根据精度来确定n的最优值；通过在搜索时使用代理数据集，对几何变换和颜色变换分开进行寻优，减少单个搜索空间的参数量，即减少了搜索过程的时间成本，又能实现增强策略组合个数的优选，最大限度的保留了数据增强的有效性，普遍适用于各类数据集。
[0051]
最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨天成杨建红房怀英陈伟鑫计天晨汪鑫
技术所有人：华侨大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。