本发明涉及深度学习,特别涉及一种基于对称交叉复合训练的新型深度学习方法及装置。
背景技术:
1、得益于深度学习强大的特征提取能力,深度学习在计算机视觉领域展现出色的性能。目前在深度学习中,一般按照传统深度学习训练策略来获得合适的神经网络模型,包括:1)首先将数据集划分为训练集、验证集和测试集;2)然后在训练集上训练深度神经网络,通过梯度优化来获得参数化模型,以及在验证集上选取最优模型;3)最后在测试集上执行特定的任务,比如分类和预测。然而在数据集有限的情况下,训练集中的一些离群样本将会导致神经网络出现过拟合问题,即离群样本导致神经网络过度学习,导致模型的泛化能力降低。对于此问题,学者们已经提出了多种方法,比如软权值共享,dropout策略,以及当模型作用于验证集上的性能开始变差时立刻停止训练。最后一种方法是利用验证集来避免深度学习模型出现过拟合,从而获得合适的深度学习模型,这种方法虽然能够防止模型性能降低,却没有探讨导致过拟合的离群样本对深度学习网络造成的干扰。
技术实现思路
1、本发明的目的在于提供一种基于对称交叉复合训练的新型深度学习方法及装置,通过改变传统深度学习训练方法模式,利用深度学习特征提取的功能来自动地识别和分离在训练集中的离群样本,进一步提高模型性能。
2、一方面,本发明提供了一种基于对称交叉复合训练的新型深度学习方法,所述方法具体包括:
3、获取第一样本数据,将所述第一样本数据划分为第一训练集、第一验证集和第一测试集,并将所述第一训练集再划分为第一数据集和第二数据集;
4、将所述第一数据集和所述第二数据集轮流作为训练集和验证集进行对称交叉训练,获得离群样本和真性样本,所述离群样本包括第一离群样本和第二离群样本,所述真性样本包括第一真性样本和第二真性样本;
5、对所述离群样本和所述真性样本进行复合训练,同时进行输出矫正归类,获得第一最优模型。
6、进一步的,所述将所述第一数据集和所述第二数据集轮流作为训练集和验证集进行对称交叉训练,获得离群样本和真性样本,具体包括:
7、将所述第一数据集和所述第二数据集分别作为第二训练集和第二验证集进行训练,分离出第一离群样本和第一真性样本;
8、将所述第二数据集和所述第一数据集分别作为第三训练集和第三验证集进行训练,分离出第二离群样本和第二真性样本。
9、更进一步的,所述将所述第一数据集和所述第二数据集分别作为第二训练集和第二验证集进行训练,分离出第一离群样本和第一真性样本,具体包括:
10、将所述第一数据集确定为第二训练集,将所述第二数据集确定为第二验证集;
11、基于第一神经网络模型训练所述第二训练集,并根据所述第二验证集获得第二最优模型;
12、将所述第二最优模型作用于所述第二训练集,确定第一离群样本和第一真性样本。
13、更进一步的,所述将所述第二数据集和所述第一数据集分别作为第三训练集和第三验证集进行训练,分离出第二离群样本和第二真性样本,具体包括:
14、将所述第二数据集确定为第三训练集,将所述第一数据集确定为第三验证集;
15、基于第二神经网络模型训练所述第三训练集,并根据所述第三验证集获得第三最优模型;
16、将所述第三最优模型作用于所述第三训练集,确定第二离群样本和第二真性样本。
17、进一步的,所述对所述离群样本和所述真性样本进行复合训练,同时进行输出矫正归类,获得第一最优模型,具体包括:
18、合并所述离群样本和所述真性样本,然后按照真阳性样本、真阴性样本、假阳性样本和假阴性样本进行标注划分,获得第四训练集;
19、基于第三神经网络模型训练所述第四训练集,并根据所述第一验证集获得第一最优模型;
20、根据所述第一测试集评估所述第一最优模型,通过归类公式进行输出矫正归类。
21、更进一步的,所述第四训练集包括
22、
23、
24、其中,表示总真阳性样本,表示总真阴性样本,表示总假阳性样本,表示总假阴性样本,表示第一真性样本中的真阳性样本,表示第一真性样本中的真阴性样本,表示第一离群样本中的假阳性样本,表示第一离群样本中的假阴性样本,表示第二真性样本中的真阳性样本,表示第二真性样本中的真阴性样本,表示第二离群样本中的假阳性样本,表示第二离群样本中的假阴性样本。
25、更进一步的,所述归类公式满足
26、
27、
28、其中,表示测试阳性结果,表示测试阴性结果,表示测试错误阳性结果,表示测试错误阴性结果。
29、另一方面,本发明还提供了一种基于对称交叉复合训练的新型深度学习装置,所述装置具体包括:
30、获取模块,用于获取第一样本数据,将所述第一样本数据划分为第一训练集、第一验证集和第一测试集,并将所述第一训练集再划分为第一数据集和第二数据集;
31、对称交叉训练模块,用于将所述第一数据集和所述第二数据集轮流作为训练集和验证集进行对称交叉训练,获得离群样本和真性样本,所述离群样本包括第一离群样本和第二离群样本,所述真性样本包括第一真性样本和第二真性样本;
32、复合训练模块,用于对所述离群样本和所述真性样本进行复合训练,同时进行输出矫正归类,获得第一最优模型。
33、与现有技术相比,本发明具有以下技术效果的至少之一:
34、1、该方法改变深度学习方法的训练模式,应用深度学习网络学习特性自动地去区分离群样本,避免深度学习网络出现过拟合。
35、2、将离群样本作为深度学习网络新的分类输入,有助于网络学习离群样本的特征,增强模型的泛化能力,进一步地提高模型性能。
36、3、分离出离群样本,并让深度学习网络具备鉴别离群样本的能力。
1.一种基于对称交叉复合训练的新型深度学习方法,其特征在于,所述方法具体包括:
2.根据权利要求1所述的方法,其特征在于,所述将所述第一数据集和所述第二数据集轮流作为训练集和验证集进行对称交叉训练,获得离群样本和真性样本,具体包括:
3.根据权利要求2所述的方法,其特征在于,所述将所述第一数据集和所述第二数据集分别作为第二训练集和第二验证集进行训练,分离出第一离群样本和第一真性样本,具体包括:
4.根据权利要求2所述的方法,其特征在于,所述将所述第二数据集和所述第一数据集分别作为第三训练集和第三验证集进行训练,分离出第二离群样本和第二真性样本,具体包括:
5.根据权利要求1所述的方法,其特征在于,所述对所述离群样本和所述真性样本进行复合训练,同时进行输出矫正归类,获得第一最优模型,具体包括:
6.根据权利要求5所述的方法,其特征在于,所述第四训练集包括
7.根据权利要求5所述的方法,其特征在于,所述归类公式满足
8.一种基于对称交叉复合训练的新型深度学习装置,其特征在于,所述装置具体包括: