一种基于卷积神经网络模型的危险物品图像分类方法

文档序号：9866206阅读：587来源：国知局

一种基于卷积神经网络模型的危险物品图像分类方法
【技术领域】
[0001] 本发明属于图像分类技术领域，特别是设及一种基于卷积神经网络模型的危险物品图像分类方法。
【背景技术】
[0002] 人工神经网络是一种用于尝试模拟人脑的功能而产生的人工智能方法，在上个世纪末期经历了一段时间的蓬勃发展之后再次陷入低潮。深度学习技术是受到生物学和神经学领域在动物和人脑视觉神经领域的新发现的启发，模拟视觉系统的层次化的工作模式，在人工神经网络的基础上构建具有层次化结构的深度网络模型，给人工神经网络带来了新的发展方向。
[0003] 卷积神经网络是将人工神经网络和深度学习技术结合而产生的一种新型人工神经网络，是目前人工神经网络领域的研究热点，其与传统方法相比，在图像分类领域具有很好的应用效果。之前卷积神经网络之所W没有得到长远发展是因为硬件计算能力有限，可供训练的数据也有限，如今随着硬件计算性能的稳步提高，各种图像数据急速增长，运些都为其发展奠定了基础。
[0004] 训练卷积神经网络需要大的数据集，比如ImageNet。现在的卷积神经网络可W充分利用海量数据自动学习到大量图像的特征信息。Image化t中含有很多种图像的类别，其中一些是民航中危险物品的类别，因此，可W利用卷积神经网络来进行民航危险物品图像的检测。
[0005] 此外，由于卷积方法在图像处理领域本质上是使图像变得平滑，因此，像素的平移对分类结果的影响较小，而图像的旋转对分类的结果影响较大。因此，对于卷积神经网络不能识别的图像，将其旋转后再进行分类，有可能得到正确的分类结果，从而可提高图像分类的准确率，但目前尚未发现有效的方法。

【发明内容】

[0006] 为了解决上述问题，本发明的目的在于提供一种分类准确率高，分类速度快的基于卷积神经网络模型的危险物品图像分类方法。
[0007] 为了达到上述目的，本发明提供的基于卷积神经网络模型的危险物品图像分类方法包括按顺序进行的下列步骤：
[000引1)在图形处理器上搭建基于包含多种卷积神经网络模型的化ffe深度学习框架的平台；
[0009] 2)准备训练数据集和带有标签的测试数据集，并利用上述数据集在图形处理器上训练上述卷积神经网络模型；
[0010] 3)列出中国民航中危险物品类别；
[0011] 4)将上述危险物品类别中的原始图像和旋转180度后的图像输入上述已训练好的卷积神经网络模型，得到top-5测试结果，实现含有危险物品图像的分类。
[0012] 在步骤2)中，所述的训练数据集是由从Image化t数据集中选择的0.12亿张训练图像组成；测试数据集采用带有标签的确认数据集;卷积神经网络模型采用化ffeNet、VGG和 GoogleNet。
[0013] 本发明提供的基于卷积神经网络模型的危险物品图像分类方法具有的优点和积极效果是：（1)本发明采用了现在人工智能中图像分类最好的深度学习方法，分类准确率高；（2)综合考虑了原始图像和旋转后图像的分类效果，进一步提高了分类准确率；（3)采用海量的训练样本来训练深度卷积神经网络模型，使模型具有高智能性；（4)基于图形处理器计算，训练和测试速度比基于CPU的计算有大幅度的提高。
【附图说明】
[0014] 图1为基于深层卷积神经网络的图像分类方法对比（a)只考虑原始图像；（b)考虑旋转180度后的图像；
[0015] 图2为经过化ffe化t模型，旋转前不能识别而旋转后可W识别的图像示例；
[0016] 图3为使用四种卷积神经网络，考虑图像旋转的top_5准确率对比曲线。（a) CaffeNet;(b)VGG16;(c)VGG19;(d)Google化t。
[0017]图4为Top-k对于准确率的影响曲线。（a)类别413; (b)类别763。
【具体实施方式】
[0018] 下面结合附图和具体实施例对本发明提供的基于卷积神经网络模型的危险物品图像分类方法进行详细说明。
[0019] 本发明提供的基于深层卷积神经网络的图像分类方法包括按顺序进行的下列步骤：
[0020] 1)在图形处理器上搭建基于包含多种卷积神经网络模型的化ffe深度学习框架的平台；
[0021] 化ffe是目前流行的高效深度学习框架之一，具有纯粹的C++/CUDA架构，支持命令行、Python和MATLAB接口，可W在CPU和图形处理器上直接无缝切换。
[0022] 化ffe的优势是：1、上手快。其包含的模型与相应优化都是W文本形式而非源码形式给出，并且给出了模型的定义、最优化设置W及预训练的权重，因此方便立即上手。2、速度快。能够运行最深层的模型和海量的数据，比如：Caffe与CU面N结合使用，测试化ffeNet 时，在K40上处理每张图像只需要1.171113。3、模块化。方便扩展到新的任务和设置上，可^使用化ffe提供的各层类型来定义自己的模型。4、开放性。公开代码和参考模型，方便用户复现和再开发。
[0023] Caffe的安装与配置:Caffe需要预先安装一些依赖项。首先是CUDA驱动。不论是 Centos还是化un化都预装了开源的nouveau显卡驱动，如果不禁用，j?CUDA驱动不能正确安装。安装了 CUDA之后，依次按照化ffe官网安装指南安装BLAS、化enCV、Boost即可(Caffe官网安装指南网址是http: //c曰f f e. berkeleyvision. org/inst曰 11曰tion. html)。
[0024] 2)准备训练数据集和带有标签的测试数据集，并利用上述数据集在图形处理器上训练上述卷积神经网络模型；
[0025] 本发明采用的是Image化t数据集。Image化t数据集中有超过1.5亿张具有标签的高分辨率图像，运些图像划分为22000类，均来自互联网，由一些志愿者进行标注。从2010年开始，每年都举办全球范围的基于ImageNet数据集的大规模视觉识别竞赛（ImageNet Large-Scale Visual Recognition Qiallenge，ILSVRC) oILSVRC采用Image化t的一个子数据集，具有1000个类别，每个类别中大概有1000幅左右的图像。总体上，有大概0.12亿张训练图像，50000张确认图像(带标注，每个类别50张图像），1

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：屈景怡;吴仁彪;朱威;李佳怡;
技术所有人：中国民航大学;
我是此专利的发明人

上一篇：一种短期用电负荷预测方法及装置的制造方法
上一篇：基于遗传编程的铁谱磨粒复合特征构造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。