基于卷积神经网络的图片鉴别方法及系统的制作方法
【专利摘要】本发明公开了一种基于卷积神经网络的图片鉴别方法,包括:将图片数据输入至少两个串联连接的卷积层进行特征的提取,获得提取后的特征数据,其中,所述卷积层的核大小均不大于5×5;将提取后的特征数据通过池化层和卷积层进行特征数据的降维和提取,获得降维后的特征数据;其中,池化层采用平均值池化;将图片降维后的特征数据输入全连接层中,得到图片数据的二维特征值;将二维特征值通过分类器进行分类处理,得到图片的鉴别结果。本发明还公开了基于卷积神经网络的图片鉴别系统。所述基于卷积神经网络的图片鉴别方法及系统通过较小核的卷积层进行特征数据的提取,使得能够更好、更快地提取出图片的局部特征,进而提高了图片鉴别的速度和效率。
【专利说明】
基于卷积神经网络的图片鉴别方法及系统
技术领域
[0001]本发明涉及卷积神经网络技术领域,特别是指一种基于卷积神经网络的图片鉴别方法及系统。
【背景技术】
[0002]卷积神经网络(Convolut1nal Neural Network,CNN)是近年发展起来,并引起广泛重视的一种高效识别方法。目前,卷积神经网络已经成为众多科学领域的研究热点之一,特别是在模式分类领域,由于该网络避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了更为广泛的应用。
[0003]—般地,卷积神经网络的基本结构中包括多个卷积层,每个卷积层上设置有多个神经元,每个神经元的输入与前一个卷积层的局部接受域(local receptive filed)相连,通过对前一个卷积层的局部接受域的数据进行卷积运算,以提取该局部接受域的特征,一旦该局部特征被提取后,它与其它特征间的位置关系也随之确定下来;然后,通过求局部平均(也称池化处理)与二次特征提取以进行特征映射,得到特征信息,该特征信息输出到下一个卷积层继续进行处理,直到到达最后一层(输出层),从而得到最终输出结果。特征映射通常采用sigmoid函数作为卷积神经网络的激活函数。在卷积神经网络中,一个卷积层上的神经元与同一层的其他神经元共享权重,因而减少了网络自由参数的个数。在卷积神经网络模型中,可将激活函数(activat1n funct1n)应用于每个作为输出结果的数据值以确定是否达到阈值,因此而产生的数据值作为下一个卷积层的输入。
[0004]通常的,一个用于识别的卷积神经网络计算模型包括卷积层、池化层、全连接层以及后续的分类器。通过对已有的样本数据的训练,能够获得较好的卷积神经网络计算模型,当需要识别新的目标时,只需要将目标的数据输入计算模型,就能够实现对新的目标的识别。
[0005]但是,现有的利用卷积神经网络的计算模型进行目标鉴别时,通常按照现有较为固定的模型架构进行计算,如AlexNet、VGG、GoogLeNet等,这些模型中卷积层、池化层、全连接层及激活函数等参数及架构都已经固定,虽然其具有通用性,但是也使得这些模型在应用于特定的场景时,其识别结果不佳。例如:在针对于视频或图片的鉴黄中,鉴别的效果较差。
【发明内容】
[0006]有鉴于此,本发明的目的在于提出一种基于卷积神经网络的图片鉴别方法及系统,能够大大提高图片鉴别的速度和准确性。
[0007]基于上述目的本发明提供的一种基于卷积神经网络的图片鉴别方法,包括:
[0008]将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取,获得图片提取后的特征数据;
[0009]将所述图片提取后的特征数据通过至少一个池化层和至少一个卷积层进行特征数据的降维和特征数据的提取,获得图片降维后的特征数据;其中,所述池化层采用平均值池化;
[0010]将所述图片降维后的特征数据输入至少一个全连接层中,得到图片数据的二维特征值;
[0011]将所述二维特征值通过分类器进行分类处理,得到图片的鉴别结果。
[0012]可选的,所述至少两个串联连接的卷积层包含四个依次连接的卷积层Cl层、C2层、C3层和C4层,且所述卷积层的核大小分别为:Cl层的核大小为3 X3、C2层的核大小为3X3、C3层的核大小为5 X 5、C4层的核大小为5 X 5。
[0013]进一步,所述四个依次连接的卷积层的步数均为I;四个卷积层的卷积核的个数均为96个;所述Cl层和C2层的pad值均为I,所述C3层和C4层的pad值均为2。
[0014]可选的,所述将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取,获得图片降维后的特征数据的步骤包括:
[0015]将所述图片提取后的特征数据通过依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8;其中,所述池化层P4、池化层P5、池化层P8的核大小均为3,步数均为2,pad值均为O ;所述卷积层C5的核大小为5,步数为I,pad值为2,卷积核的个数为256个;所述卷积层C6、卷积层C7、卷积层CS的核大小均为3,步数均为l,pad值均为I,卷积核的个数分别为384、384、256个。
[0016]可选的,所述至少一个全连接层为依次连接的全连接层f c9、全连接层f c 1、全连接层f c11、全连接层f c12;其中所述全连接层的节点数目分别为2048、2048、2048、2;且所有全连接层均采用dropout方式进行数据处理。
[0017]可选的,所述待鉴别的图片数据依次经过卷积层Cl、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fclO、全连接层fell、全连接层fcl2的处理,然后连接到分类器SVM中经过分类处理,得到图片的鉴别结果。
[0018]可选的,所有所述卷积层和所有所述全连接层均采用激活函数LEAKYRELU进行数据的激活处理。
[0019]本发明还提供了一种基于卷积神经网络的图片鉴别系统,包括:
[0020]数据提取模块,用于将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取,获得图片提取后的特征数据,并将图片提取后的特征数据发送给数据降维模块;其中,所述至少两个卷积层的核大小均不大于5 X 5;
[0021]数据降维模块,用于接收所述数据提取模块发送的图片提取后的特征数据,将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取,获得图片降维后的特征数据,将获得的图片降维后的特征数据发送给全连接模块;其中,所述池化层采用平均值池化;
[0022]全连接模块,用于接收所述特征降维模块发送的图片降维后的特征数据,将所述图片降维后的特征数据输入至少一个全连接层中,得到图片数据的二维特征值;将获得的图片数据的二维特征值发送给分类模块;
[0023]分类模块,用于接收所述全连接模块发送的图片数据的二维特征值,将所述二维特征值通过分类器进行分类处理,得到图片的鉴别结果。
[0024]可选的,所述数据提取模块包括:
[0025]四个依次连接的卷积层Cl层、C2层、C3层和C4层,且所述卷积层的核大小分别为:Cl层核大小为3 X 3、C2层核大小为3 X 3、C3层核大小为5 X 5、C4层核大小为5 X 5。
[0026]进一步,所述四个依次连接的卷积层的步数均为I;四个卷积层的卷积核的个数均为96个;所述Cl层和C2层的pad值均为I,所述C3层和C4层的pad值均为2。
[0027]可选的,所述数据降维模块包括:
[0028]依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层CS和池化层P8;其中,所述池化层P4、池化层P5、池化层P8的核大小均为3,步数均为2,pad值均为O;所述卷积层C5的核大小为5,步数为I,pad值为2,卷积核的个数为256个;所述卷积层C6、卷积层C7、卷积层CS的核大小均为3,步数均为l,pad值均为1,卷积核的个数分别为384、384、256。
[0029]可选的,所述全连接模块包括:
[0030]依次连接的全连接层fc9、全连接层fc 1、全连接层f c 11、全连接层f c 12;其中所述全连接层的节点数目分别为2048、2048、2048、2;且所有全连接层均采用dropout方式进行数据处理。
[0031]可选的,所述系统包括依次连接的卷积层Cl、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fclO、全连接层fell、全连接层fcl2的处理,然后连接到分类器SVM中经过分类处理,得到图片的鉴别结果。
[0032]可选的,所有所述卷积层和所有所述全连接层均采用激活函数LEAKYRELU进行数据的激活处理。
[0033]从上面所述可以看出,本发明实施例提供的基于卷积神经网络的图片鉴别方法及系统首先通过多个小窗口(卷积层的核小)的卷积层相连,使得能够更好、更快地提取出图片的局部特征,并将这些局部特征快速组合成高级特征,能够大大提高图片鉴别的速度和效率。
[0034]此外,本发明实施例所述的基于卷积神经网络的图片鉴别方法及系统通过采用平均值池化以及全连接层的处理,使得图片数据最后输出为2个特征,进而使得分类器进行分类鉴别处理时,不仅速度更快,而且准确性更高。
【附图说明】
[0035]图1为本发明提供的基于卷积神经网络的图片鉴别方法的实施例的流程图;
[0036]图2为本发明提供的卷积神经网络计算模型的结构示意图;
[0037]图3为本发明提供的基于卷积神经网络的图片鉴别系统的实施例的结构示意图。
【具体实施方式】
[0038]为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
[0039]需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一” “第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
[0040]参照图1所示,为本发明提供的基于卷积神经网络的图片鉴别方法的实施例的流程图。所述基于卷积神经网络的图片鉴别方法,包括:
[0041]步骤101,将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取,获得图片提取后的特征数据,其中,优选的,所述至少两个卷积层的核大小均不大于5X 5 ;
[0042]其中,所述待鉴别的图片数据既可以为直接的图片数据信息,还可以为视频中获取的图片信息,也即本发明所述的方法也同样适用于视频的鉴别。所述卷积层用于对输入的图片数据进行局部块特征的提取,获得更高一级的特征数据,且每个卷积层中均会进行多次的卷积操作。通常卷积层的核采用nXn的结构(也可以采用mXn),所述卷积层的核越小,则能够提取出更多的特征,但是相应的特征数据也更多。
[0043]步骤102,将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取,获得图片降维后的特征数据;其中,所述池化层采用平均值池化;
[0044]其中,所述池化层用于将卷积层输出的特征数据进行降维处理,也即在保证数据有效性的基础上大大减少数据量。这里所述的反复是指重复池化或卷积的过程,例如:池化层-卷积层-池化层-卷积层,当然,也可以在中间的某一层中多次出现池化层或者卷积层。所述平均值池化是指按照池化的原则,取池化核大小范围内数据的平均值作为池化后的输出数据。
[0045]步骤103,将所述图片降维后的特征数据输入至少一个全连接层中,得到图片数据的二维特征值;
[0046]不论经过多少个全连接层的处理,最后一个全连接层都输出一个2维的特征数据,这样,在进行分类鉴别时能够更加准确。
[0047]步骤104,将所述二维特征值通过分类器进行分类处理,得到图片的鉴别结果。
[0048]由上述实施例可知,所述基于卷积神经网络的图片鉴别方法通过多个小窗口(SP卷积层的核较小)的卷积层依次相连,使得能够更好、更快地提取出图片的局部特征,并将这些局部特征快速组合成高级特征,能够大大提高图片鉴别的速度和效率。同时,本发明所述的基于卷积神经网络的图片鉴别方法及系统通过采用平均值池化以及全连接层的处理,使得图片数据最后输出为2个特征,进而使得分类器进行分类鉴别处理时,不仅速度更快,而且准确性更高。
[0049]作为本发明一个较佳的实施例,所述至少两个串联连接的卷积层包含四个依次连接的卷积层Cl层、C2层、C3层和C4层,且所述卷积层的核大小分别为:Cl层核大小为3X3、C2层核大小为3 X 3、C3层核大小为5 X 5、C4层核大小为5 X 5。这样,依次连接的卷积层能够更有效地提取图片的特征数据,同时还减少了神经网络计算模型的参数,对于提升鉴别速度,防止过度拟合由较大的作用。
[0050]作为本发明进一步的实施例,所述四个依次连接的卷积层的步数均为I;四个卷积层的卷积核的个数均为96个;所述Cl层和C2层的pad值均为I,所述C3层和C4层的pad值均为
2。其中,所述卷积层的步数指卷积层的核每次移动的步长,所述pad值是指在输入数据的周围是否添加一圈数据参与运算,pad值的大小也即添加数据的圈数。这样,能够进一步提高卷积层的处理效率和速度,进而提高图片鉴别的效率。
[0051]作为本发明一个优选的实施例,所述将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取,获得图片降维后的特征数据的步骤102包括:将所述图片提取后的特征数据通过依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8;其中,所述池化层P4、池化层P5、池化层P8的核大小均为3,步数均为2,pad值均为O;所述卷积层C5的核大小为5,步数为I,pad值为2,卷积核的个数为256;所述卷积层C6、卷积层C7、卷积层CS的核大小均为3,步数均为I,pad值均为I,卷积核的个数分别为384、384、256个。
[0052]作为本发明另一个优选的实施例,所述至少一个全连接层为依次连接的全连接层fc9、全连接层fc 1、全连接层fc 11、全连接层fc 12;其中所述全连接层的节点数目分别为2048、2048、2048、2 ;且所有全连接层均采用dropout方式进行数据处理。这里,所述的节点数据也可以理解为特征数目。所述dropout方式是通过随机开启一定数目的数据,而将剩下的数据丢弃,这样能够有效地防止数据的过拟合,进而提高鉴别的效率。
[0053]参照图2所示,为本发明提供的卷积神经网络计算模型的结构示意图。所述待鉴别的图片数据依次经过卷积层Cl、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc 1、全连接层fell、全连接层fcl2的处理,然后连接到分类器SVM中经过分类处理,得到图片的鉴别结果。其中,所有卷积层以及全连接层fc9、全连接层fclO、全连接层fell均通过激活函数LEAKYRELU进行数据的处理,使得前一层的数据能够向下一层传递。所述激活函数是将上一次的输出数据通过激活函数中的算法计算得到新的输出结果,将所述新的输出结果作为下一层的输入数据。本发明通过选用分类器SVM(支持向量机),使得能够更加适用于二分问题的鉴另O。同时,本发明所采用的激活函数LEAKY RELU相比于传统的激活函数RELU,在函数值小于零时,也具有一定的输出值,也即使得函数值小于零这一部分的数据也可以参与训练过程。这里,当函数值小于O时,输出值为输入值乘以一个系数a,所述系数a优选采用固定值。
[0054]优选的,所有所述卷积层和所有所述全连接层均采用激活函数LEAKYRELU进行数据的激活处理。其中,最后一个全连基层可以不需要激活函数。这样,能够使得数据的传递更为有效。
[0055]在一些可选的实施例中,本发明准备正负训练样本一共100小时视频,从视频中截取110万张图片,其中,正样本训练图片50万张,负样本训练图片50万张。测试样本10万张,正负样本各5万张。网络中卷积层采用标准偏差为0.0I的高斯分布进行初始化。LEAKY RELU函数的系数a参数为0.01。全连接层中参数采用标准偏差为0.002的高斯分布进行初始化。dropout模块的参数为0.5。训练过程采用反向传播算法(BP算法)进行参数的训练及更新。本发明中一共训练30万次迭代。
[0056]参照图3所示,为本发明提供的一种基于卷积神经网络的图片鉴别系统的一个实施例的结构示意图。所述基于卷积神经网络的图片鉴别系统包括:
[0057]数据提取模块201,用于将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取,获得图片提取后的特征数据,并将图片提取后的特征数据发送给数据降维模块202;其中,所述至少两个卷积层的核大小均不大于5 X 5;
[0058]数据降维模块202,用于接收所述数据提取模块201发送的图片提取后的特征数据,将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取,获得图片降维后的特征数据,将获得的图片降维后的特征数据发送给全连接模块203;其中,所述池化层采用平均值池化;
[0059]全连接模块203,用于接收所述特征降维模块202发送的图片降维后的特征数据,将所述图片降维后的特征数据输入至少一个全连接层中,得到图片数据的二维特征值;将获得的图片数据的二维特征值发送给分类模块204;
[0060]分类模块204,用于接收所述全连接模块203发送的图片数据的二维特征值,将所述二维特征值通过分类器进行分类处理,得到图片的鉴别结果。
[0061]由上述实施例可知,所述基于卷积神经网络的图片鉴别系统通过所述数据提取模块201完成数据的卷积,进而数显图片数据特征的提取,然后通过所述数据降维模块202实现特征的降维处理,通过所述全连接模块203获得图片数据的二维特征值,最后通过所述分类模块204实现图片数据的鉴别。所述基于卷积神经网络的图片鉴别系统通过采用较小核的卷积层实现特征数据的有效提取,不仅提高了图片鉴别的效率和速度,而且有效的防止了过拟合。
[0062]作为本发明一个优选的实施例,所述数据提取模块201包括:四个依次连接的卷积层Cl层、C2层、C3层和C4层,且所述卷积层的核大小分别为:Cl层核大小为3 X 3、C2层核大小为3 X 3、C3层核大小为5 X 5、C4层核大小为5 X 5。
[0063]作为本发明进一步的实施例,所述四个依次连接的卷积层的步数均为I;四个卷积层的卷积核的个数均为96个;所述Cl层和C2层的pad值均为I,所述C3层和C4层的pad值均为2。
[0064]作为本发明另一个优选的实施例,所述数据降维模块202包括:依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8;其中,所述池化层P4、池化层P5、池化层P8的核大小均为3,步数均为2,pad值均为O;所述卷积层C5的核大小为5,步数为I,pad值为2,卷积核的个数为256个;所述卷积层C6、卷积层C7、卷积层CS的核大小均为3,步数均为I,pad值均为I,卷积核的个数分别为384、384、256。
[0065]在一些可选的实施例中,所述全连接模块203包括:依次连接的全连接层fc9、全连接层fclO、全连接层fell、全连接层fcl2;其中所述全连接层的节点数目分别为2048、2048、2048、2;且所有全连接层均采用dropout方式进行数据处理。
[0066]在本发明另一些可选的实施例中,所述系统包括依次连接的卷积层Cl、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fclO、全连接层fell、全连接层fcl2的处理,然后连接到分类器SVM中经过分类处理,得到图片的鉴别结果。
[0067]优选的,所有所述卷积层和所有所述全连接层均采用激活函数LEAKYRELU进行数据的激活处理。
[0068]所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
[0069]另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
[0070]尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
[0071]本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1.一种基于卷积神经网络的图片鉴别方法,其特征在于,包括: 将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取,获得图片提取后的特征数据; 将所述图片提取后的特征数据通过至少一个池化层和至少一个卷积层进行特征数据的降维和特征数据的提取,获得图片降维后的特征数据;其中,所述池化层采用平均值池化; 将所述图片降维后的特征数据输入至少一个全连接层中,得到图片数据的二维特征值; 将所述二维特征值通过分类器进行分类处理,得到图片的鉴别结果。2.根据权利要求1所述的方法,其特征在于,所述至少两个串联连接的卷积层包含四个依次连接的卷积层Cl层、C2层、C3层和C4层,且所述卷积层的核大小分别为:Cl层的核大小为3 X 3、C2层的核大小为3 X 3、C3层的核大小为5 X 5、C4层的核大小为5 X 5。3.根据权利要求2所述的方法,其特征在于,所述四个依次连接的卷积层的步数均为I;四个卷积层的卷积核的个数均为96个;所述Cl层和C2层的pad值均为I,所述C3层和C4层的pad值均为2。4.根据权利要求1所述的方法,其特征在于,所述将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取,获得图片降维后的特征数据的步骤包括: 将所述图片提取后的特征数据通过依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8;其中,所述池化层P4、池化层P5、池化层P8的核大小均为3,步数均为2,pad值均为O ;所述卷积层C5的核大小为5,步数为I,pad值为2,卷积核的个数为为256;所述卷积层C6、卷积层C7、卷积层CS的核大小均为3,步数均为l,pad值均为1,卷积核的个数分别为384、384、256个。5.根据权利要求1所述的方法,其特征在于,所述至少一个全连接层为依次连接的全连接层fc9、全连接层fclO、全连接层fell、全连接层fcl2;其中所述全连接层的节点数目分别为2048、2048、2048、2 ;且所有全连接层均采用dropout方式进行数据处理。6.根据权利要求1所述的方法,其特征在于,所述待鉴别的图片数据依次经过卷积层Cl、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc 1、全连接层fc 11、全连接层fc 12的处理,然后连接到分类器SVM中经过分类处理,得到图片的鉴别结果。7.根据权利要求1-6任意一项所述的方法,其特征在于,所有所述卷积层和所有所述全连接层均采用激活函数LEAKY RELU进行数据的激活处理。8.一种基于卷积神经网络的图片鉴别系统,其特征在于,包括: 数据提取模块,用于将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取,获得图片提取后的特征数据,并将图片提取后的特征数据发送给数据降维模块;其中,所述至少两个卷积层的核大小均不大于5 X 5; 数据降维模块,用于接收所述数据提取模块发送的图片提取后的特征数据,将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取,获得图片降维后的特征数据,将获得的图片降维后的特征数据发送给全连接模块;其中,所述池化层采用平均值池化; 全连接模块,用于接收所述特征降维模块发送的图片降维后的特征数据,将所述图片降维后的特征数据输入至少一个全连接层中,得到图片数据的二维特征值;将获得的图片数据的二维特征值发送给分类模块; 分类模块,用于接收所述全连接模块发送的图片数据的二维特征值,将所述二维特征值通过分类器进行分类处理,得到图片的鉴别结果。9.根据权利要求8所述的系统,其特征在于,所述数据提取模块包括: 四个依次连接的卷积层Cl层、C2层、C3层和C4层,且所述卷积层的核大小分别为:Cl层核大小为3 X 3、C2层核大小为3 X 3、C3层核大小为5 X 5、C4层核大小为5 X 5。10.根据权利要求9所述的系统,其特征在于,所述四个依次连接的卷积层的步数均为I;四个卷积层的卷积核的个数均为96个;所述Cl层和C2层的pad值均为I,所述C3层和C4层的pad值均为2。11.根据权利要求8所述的系统,其特征在于,所述数据降维模块包括: 依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层CS和池化层P8;其中,所述池化层P4、池化层P5、池化层P8的核大小均为3,步数均为2,pad值均为O ;所述卷积层C5的核大小为5,步数为I,pad值为2,卷积核的个数为256个;所述卷积层C6、卷积层C7、卷积层C8的核大小均为3,步数均为l,pad值均为1,卷积核的个数分别为384、384、256个。12.根据权利要求8所述的系统,其特征在于,所述全连接模块包括: 依次连接的全连接层f c9、全连接层f ClO、全连接层f Cl 1、全连接层f cl2;其中所述全连接层的节点数目分别为2048、2048、2048、2;且所有全连接层均采用dropout方式进行数据处理。13.根据权利要求8所述的系统,其特征在于,所述系统包括依次连接的卷积层Cl、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc 10、全连接层fc 11、全连接层fc 12的处理,然后连接到分类器SVM中经过分类处理,得到图片的鉴别结果。14.根据权利要求8-13任意一项所述的系统,其特征在于,所有所述卷积层和所有所述全连接层均采用激活函数LEAKY RELU进行数据的激活处理。
【文档编号】G06K9/62GK105868785SQ201610195777
【公开日】2016年8月17日
【申请日】2016年3月30日
【发明人】刘阳, 白茂生, 魏伟, 蔡砚刚, 祁海
【申请人】乐视控股(北京)有限公司, 乐视云计算有限公司