一种基于卷积神经网络模型的危险物品图像分类方法
【技术领域】
[0001] 本发明属于图像分类技术领域,特别是设及一种基于卷积神经网络模型的危险物 品图像分类方法。
【背景技术】
[0002] 人工神经网络是一种用于尝试模拟人脑的功能而产生的人工智能方法,在上个世 纪末期经历了一段时间的蓬勃发展之后再次陷入低潮。深度学习技术是受到生物学和神经 学领域在动物和人脑视觉神经领域的新发现的启发,模拟视觉系统的层次化的工作模式, 在人工神经网络的基础上构建具有层次化结构的深度网络模型,给人工神经网络带来了新 的发展方向。
[0003] 卷积神经网络是将人工神经网络和深度学习技术结合而产生的一种新型人工神 经网络,是目前人工神经网络领域的研究热点,其与传统方法相比,在图像分类领域具有很 好的应用效果。之前卷积神经网络之所W没有得到长远发展是因为硬件计算能力有限,可 供训练的数据也有限,如今随着硬件计算性能的稳步提高,各种图像数据急速增长,运些都 为其发展奠定了基础。
[0004] 训练卷积神经网络需要大的数据集,比如ImageNet。现在的卷积神经网络可W充 分利用海量数据自动学习到大量图像的特征信息。Image化t中含有很多种图像的类别,其 中一些是民航中危险物品的类别,因此,可W利用卷积神经网络来进行民航危险物品图像 的检测。
[0005] 此外,由于卷积方法在图像处理领域本质上是使图像变得平滑,因此,像素的平移 对分类结果的影响较小,而图像的旋转对分类的结果影响较大。因此,对于卷积神经网络不 能识别的图像,将其旋转后再进行分类,有可能得到正确的分类结果,从而可提高图像分类 的准确率,但目前尚未发现有效的方法。
【发明内容】
[0006] 为了解决上述问题,本发明的目的在于提供一种分类准确率高,分类速度快的基 于卷积神经网络模型的危险物品图像分类方法。
[0007] 为了达到上述目的,本发明提供的基于卷积神经网络模型的危险物品图像分类方 法包括按顺序进行的下列步骤:
[000引1)在图形处理器上搭建基于包含多种卷积神经网络模型的化ffe深度学习框架的 平台;
[0009] 2)准备训练数据集和带有标签的测试数据集,并利用上述数据集在图形处理器上 训练上述卷积神经网络模型;
[0010] 3)列出中国民航中危险物品类别;
[0011] 4)将上述危险物品类别中的原始图像和旋转180度后的图像输入上述已训练好的 卷积神经网络模型,得到top-5测试结果,实现含有危险物品图像的分类。
[0012] 在步骤2)中,所述的训练数据集是由从Image化t数据集中选择的0.12亿张训练图 像组成;测试数据集采用带有标签的确认数据集;卷积神经网络模型采用化ffeNet、VGG和 GoogleNet。
[0013] 本发明提供的基于卷积神经网络模型的危险物品图像分类方法具有的优点和积 极效果是:(1)本发明采用了现在人工智能中图像分类最好的深度学习方法,分类准确率 高;(2)综合考虑了原始图像和旋转后图像的分类效果,进一步提高了分类准确率;(3)采用 海量的训练样本来训练深度卷积神经网络模型,使模型具有高智能性;(4)基于图形处理器 计算,训练和测试速度比基于CPU的计算有大幅度的提高。
【附图说明】
[0014] 图1为基于深层卷积神经网络的图像分类方法对比(a)只考虑原始图像;(b)考虑 旋转180度后的图像;
[0015] 图2为经过化ffe化t模型,旋转前不能识别而旋转后可W识别的图像示例;
[0016] 图3为使用四种卷积神经网络,考虑图像旋转的top_5准确率对比曲线。(a) CaffeNet;(b)VGG16;(c)VGG19;(d)Google化t。
[0017]图4为Top-k对于准确率的影响曲线。(a)类别413; (b)类别763。
【具体实施方式】
[0018] 下面结合附图和具体实施例对本发明提供的基于卷积神经网络模型的危险物品 图像分类方法进行详细说明。
[0019] 本发明提供的基于深层卷积神经网络的图像分类方法包括按顺序进行的下列步 骤:
[0020] 1)在图形处理器上搭建基于包含多种卷积神经网络模型的化ffe深度学习框架的 平台;
[0021] 化ffe是目前流行的高效深度学习框架之一,具有纯粹的C++/CUDA架构,支持命令 行、Python和MATLAB接口,可W在CPU和图形处理器上直接无缝切换。
[0022] 化ffe的优势是:1、上手快。其包含的模型与相应优化都是W文本形式而非源码形 式给出,并且给出了模型的定义、最优化设置W及预训练的权重,因此方便立即上手。2、速 度快。能够运行最深层的模型和海量的数据,比如:Caffe与CU面N结合使用,测试化ffeNet 时,在K40上处理每张图像只需要1.171113。3、模块化。方便扩展到新的任务和设置上,可^使 用化ffe提供的各层类型来定义自己的模型。4、开放性。公开代码和参考模型,方便用户复 现和再开发。
[0023] Caffe的安装与配置:Caffe需要预先安装一些依赖项。首先是CUDA驱动。不论是 Centos还是化un化都预装了开源的nouveau显卡驱动,如果不禁用,j?CUDA驱动不能正确安 装。安装了 CUDA之后,依次按照化ffe官网安装指南安装BLAS、化enCV、Boost即可(Caffe官 网安装指南网址是http: //c曰f f e. berkeleyvision. org/inst曰 11曰tion. html)。
[0024] 2)准备训练数据集和带有标签的测试数据集,并利用上述数据集在图形处理器上 训练上述卷积神经网络模型;
[0025] 本发明采用的是Image化t数据集。Image化t数据集中有超过1.5亿张具有标签的 高分辨率图像,运些图像划分为22000类,均来自互联网,由一些志愿者进行标注。从2010年 开始,每年都举办全球范围的基于ImageNet数据集的大规模视觉识别竞赛(ImageNet Large-Scale Visual Recognition Qiallenge,ILSVRC) oILSVRC采用Image化t的一个子数 据集,具有1000个类别,每个类别中大概有1000幅左右的图像。总体上,有大概0.12亿张训 练图像,50000张确认图像(带标注,每个类别50张图像),1