本发明涉及图像处理技术领域,特别是涉及一种基于dcgan的红外人脸图像转化方法。
背景技术:
人脸识别多年来一直是快速发展的研究领域,是当前模式识别和计算机视觉领域的研究热点。面部识别通过将面部与存储在数据库中的面部图像进行比较来识别或验证身份。近红外(nir)成像对于照明变化更加稳健因为它捕获来自物体的发射能量以产生图像。因此,在不同照明条件下,使用近红外图像相对于用于面部识别的可见图像具有显著的优点。现实生活中,每个人都拥有至少一张可见光人脸图像,比如身份证照片,该照片光照条件可控且无大幅度表情。在安检车站等地应用人脸识别时,为了不受到光照等条件的影响,应用近红外图像进行人脸识别,产生了异质人脸识别的问题。在识别中,为提高准确度,可将可见人脸图像转化为红外图像来进行后续识别,然而现有图像转换处理技术,大大提升了异质人脸识别的难度,从而降低了异质人脸识别的识别准确率。
技术实现要素:
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种基于dcgan的红外人脸图像转化方法,是采用dcgan对抗生成网络将可见光人脸图像转化为红外人脸图像的方法。
为实现本发明的目的所采用的技术方案是:
一种基于dcgan的红外人脸图像转化方法,包括步骤:
构建dcgan对抗生成网络,该dcgan对抗生成网络包括生成器与判别器;
将训练集的可见人脸图像和近红外人脸图像输入dcgan对抗生成网络的生成器中,通过加入噪声信号进行图像生成,由判别器来对生成器进行对抗训练,最终得到可通过可见人脸图像生成近红外人脸图像的生成器。
所述生成器和判决器都由卷积神经网络来搭建,四个卷积层构成,但结构相反。
所述生成器中使用转置卷积进行上采样,判别器中用加入stride的卷积代替池化操作,生成器中使用relu作为激活函数,最后一层使用tanh激活函数,判别器中使用leakyrelu作为激活函数。
与现有技术相比,本发明的有益效果是:
本发明利用dcgan网络进行从可见人脸图像到近红外人脸图像的转化,使人脸图像对光照等影响因素具有一定的鲁棒性,降低了异质人脸识别的难度,提高了异质人脸识别的识别准确率。
附图说明
图1所示为dcgan对抗生成网络的结构图;
图2所示为dcgan对抗生成网络的生成器generator的结构图;
图3所示为dcgan对抗生成网络的判别器discriminator结构图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明首先获得数据集中的可见人脸图像和近红外人脸图像的输入,经由生成器基于可见光图像生成近红外人脸图像,再经过判别器来进行判别,经过判别器的对抗训练后,生成器来通过可见人脸图像生成近红外人脸图像,
如图1所示,本发明基于dcgan的红外人脸图像转化方法的实现步骤如下:
一、dcgan对抗生成网络构建
对抗网络可认为是一个生成模型和一个判别模型组成的。一般情况下,生成模型和判别模型都是使用的神经网络的算法,比如感知器或者卷积神经网络。对于对抗网络,经过所谓的对抗过程的训练之后,生成网络可生成逼真的图像,接近于训练图片,但又不完全一样。所以生成网络是学习了一个训练数据的近似分布。对于判别网络也能进行训练数据的很好的区分。核心公式如下:
整个式子由两项构成,x表示真实图片,z表示输入g网络的噪声,而g(z)表示g网络生成的图片,d(x)表示d网络判断真实图片是否真实的概率(因为x就是真实的,所以对于d来说,这个值越接近1越好)。而d(g(z))是d网络判断g生成的图片的是否真实的概率。g的目的:上面提到过,d(g(z))是d网络判断g生成的图片是否真实的概率,g应该希望自己生成的图片“越接近真实越好”。也就是说,g希望d(g(z))尽可能得大,这时v(d,g)会变小。因此看到式子的最前面的记号是min_g。d的目的:d的能力越强,d(x)应该越大,d(g(x))应该越小。这时v(d,g)会变大。因此式子对于d来说是求最大(max_d)。
dcgan中,将判别器用于特征提取,然后加入个l2-支持向量机,进行分类,取得了不错的效果,而且又通过“反卷积”可视化,学到了很明显物体结构特征。
其中,其的生成器和判别器都由卷积神经网络来搭建。对卷积神经网络作一些改变来提高样本质量和收敛速度。首先取消所有pooling层,所以卷积网络均使用batchnormalization(批归一化)。生成器网络中使用转置卷积进行上采样,判别器网络中用加入stride的卷积代替pooling(池化)。去掉全连接层,使网络变为全卷积网络。生成器网络中使用relu作为激活函数,最后一层使用tanh激活函数,判别器网络中使用leakyrelu作为激活函数。
二、将数据集中可见人脸图像和近红外人脸图像输入进行对抗生成训练
将训练集的可见人脸图像和近红外人脸图像输入dcgan的生成器中,通过加入噪声信号z来进行图像生成,由判别器d来对生成器g进行对抗训练,最终得到可以通过可见人脸图像生成逼真近红外人脸图像的生成器g。
本发明中,所述dcgan对抗生成网络采用google开源的tensorflow来搭建,其生成器和判决器都由四个卷积层构成,但结构相反,如图2-3所示。
dcgan对抗生成网络是神经网络的一种,包括生成器(generator)和判别器(discriminator)。dcgan中的生成器和判别器都有卷积神经网络构成,同时对卷积神经网络的结构做了一些改变,以提高样本的质量和收敛的速度。
在dcgan网络中,将可见人脸图像输入生成器中生成红外人脸图像,经由判别器来判断生成图像的质量,通过生成器和判别器的对抗来进行训练。
测试采用casianir-vis2.0数据库,casianir-vis2.0数据库共包含725个科目,每个受试者有1-22个可见光图像和5-50个近红外脸部图像,适合作为此次人脸图像融合方法的训练集。采用lu-casiair-vis数据集作为测试集。训练过程采用mini-batch方法加快训练速度。
本发明利用dcgan网络进行从可见人脸图像到近红外人脸图像的转化,使人脸图像对光照等影响因素具有一定的鲁棒性,降低了异质人脸识别的难度,提高了异质人脸识别的识别准确率。
本发明通过dcgan网络的应用,一定程度上解决了原始gan网络训练不稳定等问题。
本发明通过将图像转化应用于现实生活中,可使异质人脸识别得到较好的识别效果。
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。