,对第二训练样本集中的各样本人脸图像进行分类标号即上述第一原始分类标号的配置。该分类标号用于区分各不同的样本人脸图像,相当于给每个样本人脸图像分配一个编号。
[0106]值得说明的是,对于同一个人,第二训练样本集中可能包含有其多张样本人脸图像,可以将对应于同一个人的各样本人脸图像设置相同的分类标号。
[0107]通过对各样本人脸图像进行分类标号设置,这样在对原始人脸识别模型进行训练时,通过比较输入分类标号与输出分类标号来确定人脸识别模型的分类结果是否正确,不会泄露对应的样本人脸图像对应的是谁这样的用户隐私信息。
[0108]在步骤103中,采用所述原始人脸识别模型的前Μ层特征系数对所述第二训练样本集中的各样本人脸图像进行编码,获得编码后的第二训练样本集。
[0109]其中,所述编码后的第二训练样本集中包括与各样本人脸图像分别对应的各编码后特征向量以及与各编码后特征向量分别对应的第一原始分类标号,Ν多Μ多1。
[0110]在步骤104中,根据所述编码后的第二训练样本集对所述原始人脸识别模型的后N-Μ层特征系数进行训练,获得训练后的后N-Μ层特征系数。
[0111]本实施例中,为了避免用户隐私数据的泄露,除了上述分类标号之外,还对第二训练样本集中的各样本人脸图像进行编码处理,以基于编码后的第二训练样本集对原始人脸识别模型进行训练,以优化原始人脸识别模型。
[0112]具体来说,采用原始人脸识别模型的前Μ层特征系数对第二训练样本集中的各样本人脸图像进行编码,获得编码后的第二训练样本集。其中,采用原始人脸识别模型的前Μ层特征系数对第二训练样本集中的各样本人脸图像进行编码,相当于提取各样本人脸图像中的前Μ层特征系数。本实施例中,Ν多Μ多1,一般来说,为了更好地保证用户隐私的同时降低处理负载,Μ取2或3。
[0113]第二训练样本集中的各样本人脸图像经上述Μ层特征系数编码后,得到对应的各特征向量,称为编码后特征向量。由于每个样本人脸图像具有上述第一原始分类标号,从而,经编码处理后的各编码后特征向量也对应有个第一原始分类标号。
[0114]经过上述编码处理后,以编码后的第二训练样本集对原始人脸识别模型的后Ν-Μ层特征系数进行训练,即保持前Μ层特征系数不变,以各编码后特征向量以及与各编码后特征向量分别对应的第一原始分类标号为输入,对原始人脸识别模型的后N-Μ层特征系数进行训练,获得训练后的后N-Μ层特征系数。从而,优化后的人脸识别模型包括原始人脸识别模型的前Μ层特征系数以及训练后的后N-Μ层特征系数。
[0115]本实施例中,为了对使用第一训练样本集对卷积神经网络进行训练后得到的包括Ν层特征系数的原始人脸识别模型进行优化,首先获得不同于传统第一训练样本集的第二训练样本集。其中,构成第一训练样本集中的各样本人脸图像是通过随机在网络上搜索得到的各人脸图像,样本噪声较大;而第二训练样本集中的各样本人脸图像是存储于云端人脸相册中的人脸图像,样本比较干净。由于第二训练样本集中各样本人脸图像涉及到用户隐私,为了保护用户隐私的同时采用第二训练样本集对原始人脸识别模型进行优化训练,首先为每个样本人脸图像进行标记即为每个样本人脸图像分配一个分类标号,进而采用原始人脸识别模型的前Μ层特征系数对第二训练样本集中的各样本人脸图像进行编码,即提取各样本人脸图像的前Μ层特征系数,从而经编码和分类标号标记的各样本人脸图像不会泄露对应的用户隐私。最后,以各编码后特征向量即经Μ层特征系数编码的各样本人脸图像以及与各编码后特征向量分别对应的分类标号为输入,对原始人脸识别模型的后N-Μ层特征系数进行训练,获得训练后的后N-Μ层特征系数,从而获得由原Μ层特征系数和训练后的后N-Μ层特征系数构成的优化后的人脸识别模型。由于优化后的人脸识别模型是基于干净的训练样本训练获得的,更加准确、可靠。
[0116]本公开实施例中,在采用编码后的第二训练样本集对原始人脸识别模型的后Ν-Μ层特征系数进行训练的过程中,可以依次将每个编码后特征向量和对应的分类标号输入到原始人脸识别模型中,根据原始人脸识别模型输出的分类标号与输入的分类标号之间的误差来确定是否需要调整当前的后N-Μ层特征系数。但是,这样的训练方式往往可能存在这样的问题:根据前一个样本调整后的后N-Μ层特征系数,很可能根据后一个样本再向相反的趋势调整,这样导致需要频繁地调整后N-Μ层特征系数。
[0117]为此,本公开实施例提供了一种分批迭代进行后N-Μ层特征系数的训练、调整的方式:
[0118]具体来说,对编码后的第二训练样本集中的各编码后特征向量进行随机分批处理,获得各批训练样本子集;
[0119]依次以每批训练样本子集对原始人脸识别模型的后Ν-Μ层特征系数进行训练,获得经全部各批训练样本子集训练后得到的后N-Μ层特征系数。
[0120]下面结合图3所示实施例,对上述分批迭代训练过程进行介绍。
[0121]图3是根据一示例性实施例示出的一种人脸识别模型训练方法实施例二的流程图,如图3所示,上述步骤104可以通过如下具体的分批迭代处理方式实现:
[0122]在步骤201中,对所述编码后的第二训练样本集中的各编码后特征向量进行随机分批处理,获得各批训练样本子集。
[0123]本实施例中,假设编码后的第二训练样本集中包含了 10000个样本人脸图像对应的编码后特征向量,将这些编码后特征向量分为100个批次,每批100个样本。由于这10000个编码后特征向量中可能存在表征同一个人的多个编码后特征向量,为了更好地保证训练效果,每个批次的100个编码后特征向量是从这10000个编码后特征向量中随机选取的,以大大降低表征同一个人的多个编码后特征向量被划分到一个批次中的概率。
[0124]进而,依次以当前一批训练样本子集中的各编码后特征向量为输入,迭代执行如下处理,直到所述全部各批训练样本子集都被执行为止:
[0125]在步骤202中,以当前一批训练样本子集中的各编码后特征向量为输入,对所述原始人脸识别模型的后N-Μ层特征系数进行训练,得到与所述当前一批训练样本子集中的各编码后特征向量分别对应的第一输出分类标号。
[0126]在步骤203中,根据预设距离度量方式,确定所述当前一批训练样本子集中的各编码后特征向量分别对应的第一原始分类标号与对应的第一输出分类标号间的距离。
[0127]在步骤204中,根据各所述距离,确定所述当前一批训练样本子集对应的分类误差率,确定所述分类误差率是否大于预设阈值,若是,则执行步骤205,否则直接执行步骤206。
[0128]在步骤205中,调整经所述当前一批训练样本子集中的各编码后特征向量对所述原始人脸识别模型的后N-Μ层特征系数进行训练后得到的后N-Μ层特征系数。
[0129]在步骤206中,更新所述当前一批训练样本子集为所述当前一批训练样本子集的下一批训练样本子集。
[0130]在步骤206之后,继而重新执行步骤202。
[0131]针对当前一批训练样本子集来说,逐一将其中的各编码后特征向量输入到原始人脸识别模型中,分别得到经分类输出的分类标号,即各第一输出分类标号。
[0132]可以理解的是,各第一输出分类标号与对应的各第一原始分类标号会存在一定的误差。可以根据诸如欧式距离、马氏距离、切比雪夫距离、余弦距离等预设距离度量方式,分别计算各第一原始分类标号与对应的各第一输出分类标号间的距离。
[0133]进而,可以将计算获得的各距离与预设距离阈值进行比较,确定大于预设距离阈值的距离数量占当前一批训练样本子集包含的样本数量的比例,即确定当前一批训练样本子集对应的分类误差率。如果该当前一批训练样本子集对应的分类误差率大于预设阈值,说明当前一批训练样本子集训练获得的后N-Μ层特征系数不理想,需要进行调整,可以采用梯度下降法等方式进行后N-Μ层特征系数的调整。调整之后,以下一批训练样本子集为输入,重复上述训练过程。如果当前一批训练样本子集对应的分类误差率小于预设阈值,则说明当前一批训练样本子集训练获得的后N-Μ层特征系数比较理想,不需要进行调整,可以直接以下一批训练样本子集为输入,重复上述训练过程,直到所有批次的训练样本子集都执行完毕为止。
[0134]从而,通过上述分批迭代训练方式,最后获得了经全部各批训练样本子集训练后的后N-Μ层特征系数。从而,基于训练结果,更新原始人脸识别模型为更新后人脸识别模型,即更新后的人脸识别模型中包括原始人脸识别模型的前Μ层特征系数以及训练获得的后N-Μ层特征系数。
[0135]本实施例中,通过随机分批、迭代训练方式,对原始人脸识别模型的后N-Μ层特征系数进行训练,使得训练样本随机性较强,并且避免反复调整后N-Μ层特征系数,使得训练效率得到提尚。
[0136]经过上述的基于少噪声的编码后第二训练样本集对原始人脸识别模型的后Ν-Μ层特征系数进行训练的训练过程,得到的训练后的后N-Μ层特征系数应该会更佳准确,但是,其准确性究竟如何,还需要进行测试过程才能最终确定。因此,结合如图4所示的实施例,介绍对更新后的人脸识别模型的测试过程。
[0137]图4是根据一示例性实施例示出的一种人脸识别模型训练方法实施例三的流程图,如图4所示,在上述步骤104之后,还包括如下测试的步骤:
[0138]在步骤301中,获取测试样本集,并确定测试样本集中的各测试人脸图像对应的第二原始分类标号。
[0139]其中,该测试样本集中的各测试人脸图像与上述第二训练样本集中的各样本人脸图像不同。
[0140]本实施例中,测试样本集中的各测试人脸图像与上述第二训练样本集中的各样本人脸图像相同,都是存在于云端人脸相册中的人脸图像。但是,为了保证测试的准确可靠,该测试样本集与第二训练样本集中不具有相同的人脸图像。
[0141]同样的,为了保证测试样本集中各测试人脸图像对应的用户的用户隐私,为各测试人脸图像设置分类标号即第二原始分类标号。
[0142]其中,上述更新后的人脸识别模型即是经分批、迭代训练后对原