基于深层卷积神经网络的网络色情图像检测方法
【技术领域】
[0001]本发明属于计算机视觉、图像识别领域,涉及一种基于深层卷积神经网络的网络色情图像检测方法。
【背景技术】
[0002]现有的从海量网络图片中准确快速地检测色情图像的具体有以下方法:
[0003]第一种、通过肤色统计的色情图像检测方法
[0004]解决方案:通过肤色检测模型(基于不同颜色空间颜色特征或纹理特征,并运用高斯混合模型判断一个像素点是否为皮肤)检测出图像中的肤色区域,根据肤色区域面积占总图像面积的比例判断图像是否色情。
[0005]缺点:(1)很多图像即使皮肤区域较多也不是色情图像(如含有穿着比基尼的人物的图像,如图1(a)所示);
[0006](2) 一些色情图像的肤色区域所占整幅图像的比重并不高(一些色情图像只是裸露了色情部分);
[0007](3)建立一种通用准确的肤色检测模型是极其困难的(不同人、不同种族的肤色差异较大,或者一些正常图像的颜色非常类似于肤色);如图1(a) (b) (C)所示,对(a) (b)两幅图像建立都适用的肤色模型是困难的,且现有的肤色检测算法会把(C)图大面积认为是皮肤。
[0008]第二种、基于图像检索的色情图像检测方法
[0009]解决方案:首先预先构建一个既包含正常图像又包含色情图像的图像数据库,然后对于待检测图像和已建立图像数据库中的每一幅图像进行比对,找到最相似的η幅图像,最终根据这η幅图像中色情图像所占的比例判断待检测图像是否为色情图像。
[0010]缺点:(I)选择何种类型的图像构建待检索图像数据库对最终效果影响很大(色情图像和正常图像都具有海量的样式,选取有限的图像代表所有类型是不可能的,会经常出现一幅色情图像在图像数据库中检索不到很相似图像的情况);
[0011](2)选取何种特征来比对两幅图像比较相似是非常困难的(弱特征会带来大量误判,强特征会导致检索不到相似图片)。
[0012]第三种、结合肤色信息与低级视觉特征的色情图像检测方法
[0013]解决方案:在训练阶段首先根据肤色信息检测图像的肤色区域,在检测的皮肤区域中提取纹理、形状、局部特征点等特征。然后把这些特征送入SVM、贝叶斯或单层神经网络等分类器中训练这些分类器。在识别阶段用和训练阶段同样的方法提取特征送入已训练好的分类器判断结果。
[0014]缺点:⑴同样采用了肤色检测模型,具有和现有方法I同样的缺陷;
[0015](2)采用何种低级视觉特征、如何选择分类器都是根据经验的,很难保证最佳检测效果。
[0016]第四种、基于视觉词袋的高级语义模型的色情图像检测方法
[0017]解决方案:在训练阶段提取SIFT或者DenSe-SIFT、Hue-SIFT等特征通过聚类的方法构建视觉词袋,每一幅训练图像都利用构建的视觉词袋表示为一个高维特征向量,使用这些特征向量训练一个SVM分类器。对待检测的图像用同样方法提取特征送入已训练好的分类器即可获得结果。
[0018]缺点:(I)采用何种特征构建视觉词袋是困难的;
[0019](2)视觉词袋的大小没有对应的评价标准;
[0020](3)有些图像的主体部分所占图像的比例过小,通过特征点的提取会出现大量无意义的特征点,从而影响分类效果;如图1(d)所示,如果这是一幅色情图像,则提取的特征点会包含大量的干扰的背景信息,从而影响分类器的判断。
[0021]第五种、使用小样本直接训练卷积神经网络
[0022]解决方案:训练色情图片检测网络时直接采用已标记好的小样本进行网络参数的更新,待网络收敛时即可使用其检测新图片。
[0023]缺点:训练样本数量很少,容易产生过拟合,会导致在训练集准确率很高而在测试集准确率很低的情况。
【发明内容】
[0024]本发明要解决的技术问题是:基于上述问题,本发明提供一种基于深层卷积神经网络的网络色情图像检测方法,以便在海量网络图片中准确快速的检测出色情图像。
[0025]本发明解决其技术问题所采用的一个技术方案是:一种基于深层卷积神经网络的网络色情图像检测方法,包括以下步骤:
[0026](I)通过人工标定的方法获取色情图像与正常图像,对这些图像进行预处理与增强,获得有效的方形训练图像;
[0027](2)将步骤(I)获得的有效的方形训练图像送入深层卷积神经网络中来训练网络;
[0028](3)将步骤⑵得到的网络模型在验证集上进行验证,根据结果调整训练集并继续训练深层卷积神经网络;
[0029](4)重复步骤(3)直至在验证集上的检测准确率达到预期目标或者网络损失函数开始收敛;
[0030](5)将训练好的网络在测试集上进行测试。
[0031]进一步地,步骤(I)中增强获得有效的方形训练图像对获得的方形图像进行多种变换以增强训练数据的个数,具体方法为:对图像进行转置和水平镜像翻转;在0.5?1.5之间随机选取4个值作为方差对图像进行高斯模糊,再随机选择4个值作为因子乘以所有像素进行亮度变换;进行图像增强,轻微地依次改变原图像R,G, B三个通道的值;并对图片添加随机噪声。
[0032]进一步地,步骤(2)中深层卷积神经网络共有10层,从左至右分别为5个卷积层、4个全连接层和I个softmax层。
[0033]进一步地,训练网络是将5个卷积层和3个全连接层这前八层网络作为现有的图像大分类公开数据集的分类模型进行分类,具体方法为:当前八层网络对于其它大分类数据集效果满足要求时,直接把这八层网络的参数迀移到色情图像检测的网络上进行参数微调。
[0034]本发明的有益效果是:提出一种基于深层卷积神经网络的色情图像检测方法,使其能够通过单一模型快速准确的检测出几乎所有类型的色情图像,实际测试中本发明的检测准确率达到98.6%以上;通过迀移训练的方式解决色情图像训练样本不足所造成的深层网络效果下降的问题。
【附图说明】
[0035]下面结合附图对本发明进一步说明。
[0036]图1是本发明的【背景技术】中用来解释目前存在的方法缺陷的图组;
[0037]图2是本发明的整体流程图;
[0038]图3是本发明的训练阶段有效数据获取与快速扫描测试图像方法;
[0039]图4是本发明的训练图像增强的方法;
[0040]图5是本发明的深层卷积神经网络的结构。
【具体实施方式】
[0041]现在结合具体实施例对本发明作进一步说明,以下实施例旨在说明本发明而不是对本发明的进一步限定。
[0042]一、有效训练图像数据的获取与增强
[0043](I)通过人工标定的方法获得3300张色情图片与5300张正常图片,将这些图片分为四个图像集:训练集(1500张色情,3500张正常),辅助训练集(800张色情,800张正常),验证集(500张色情,500张正常),测试集(500张色情,500张正常);
[0044](2)对训练集、辅助训练集两个图像集进行有效训练区域获取与数据增强
[0045]I)有效训练区域获取(如图3 (a)所示)
[0046]A.将这些图片的短边缩放为227像素,另一边按原始图像比例变化,每一幅图片都变为227*N或N*227像素的图像;
[0047]B.对于正常图像只需随机选取1