一种基于改进型卷积神经网络的车型识别方法与流程

文档序号:13237161阅读:235来源:国知局
一种基于改进型卷积神经网络的车型识别方法与流程

本发明属于计算机视觉与模式识别领域,特别涉及一种改进型神经网络的车型识别的方法。



背景技术:

车型识别技术的主要目的是对特定地段的车辆进行准确的检测和正确的识别。当前对于车辆检测方面的技术主要分为两大类:车辆自动识别和车辆自动分类。分着利用的是一些硬件设备,如车载设备和地面的基站设备进行互相识别,如我们的车辆收费系统。而后者是通过检测车辆的一些参数,运用适当的算法来完成车型的识别。这类技术主要可以通过射频微波、红光、激光等方式来识别车辆信息,也可以通过视频图像的方式来识别车辆信息。本发明采用的就是通过视频图像来获取车型信息。

近年来,随着视频图像处理技术以及人工智能的迅速发展,基于视频图像处理的车型识别越来越成为主流的研究方向。这种方法能够动态地适应交通情况的变化,为解决道路交通拥堵提供了很好的解决思路。基于视频的车型识别是通过安装在特定区域的摄像头和图像采集卡来获取视频图像,并通过相关算法对图像进行分析检测,得到车型信息。这种方法绿色环保,而且装置简便,维护方便。并且采取非接触式检测,不影响交通。对于某些应用,还可以进行离线分析。综上所述,基于视频图像的车型识别,研究意义非常大。

国外专家较早地对基于视频图像的车型识别开展了研究。collins等创建了一个路上移动目标的检测、跟踪、识别系统,用训练过的神经网络来识别运动目标是人、人群、车辆还是干扰,网络的输入特性量有目标的分散性度量、目标大小目标表面大小与摄影机监视区域大小的相对值。车辆又进一步区分为不同类型和颜色。tan和baker描述了一种车辆定位和识别(小型公共汽车、轿车、卡车等)的方法,在一个小窗口内,该方法依据图像梯度进行。利用地面约束以及大部分车辆外形受两条直线约束的事实,可得到车辆的姿态。fung等用高精度摄像机观察车辆的运动来估计车辆形状,通过估计特征点(车体拐角处)得到车辆轮廓。基本思想是高特征点的移动速度大于低特征点的移动速度,因为高特征点离摄像机近,车辆轮廓可用与车辆识别。

国内关于车型识别研究的主要方法可以概括为:

(1)基于人工智能的方法:

人工智能的方法中,最具有代表性的就是神经网络。神经网络是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。在车型识别方面,主要是利用神经网络进行车型识别,也可采用神经网络与其它技术结合,如神经网络与模糊技术结合、神经网络与分形技术结合等等。

(2)基于小波变换的车型识别:

小波变换是以某些特殊函数为基将数据过程或数据系列变换为级数系列以发现它的类似频谱的特征,从而实现数据处理。小波变换是空间(时间)和频率的局部变换,因而能有效地从信号中提取信息。通过伸缩和平移等运算功能可对函数或信号进行多尺度的细化分析,解决了fourier变换不能解决的许多困难问题。



技术实现要素:

本发明的目的在于解决各种场合车辆车型的实际需求,并且速度能达到实时检测需求。

本发明所采用的技术方案为:首先使用一张初始图像进行背景建模。对于新输入的图像,通过激活算法检测新图像的中的运动物体。若检测到运动物体,则将图像传入粗分类算法检测是否为车辆。若粗分类算法判定该运动物体为车辆,则提取该图像的特征向量,并将特征向量传入细分类算法,检测当前车辆的类型并输出结果。

步骤1:激活算法检测

首先用一张无车辆的图像作为背景建模的初始化图像。提取这幅图像中的n个像素的像素值组成一个集合,作为初始的背景像素集

b(xi)={b1(xi),…,bk(xi),…,bn(xi)}。

随后每一帧图像的像素值i(xi)都会与这个集合中的值进行比较,如下式:

其中bk(xi)是背景像素集合中的任意一个像素值,r(xi)为设定的阈值。即新的像素值i(xi)与背景像素集合中任意一个像素值的距离小于阈值r(xi)的个数小于规定的数量#min时,则判断当前像素值为前景像素。

当前景像素的数量在一幅图像中的比例大于阈值tfore时,则判断当前有大型运动物体进入。

步骤2:粗分类算法检测

若激活算法判断当前有大型运动物体进入时,系统就将图片送入粗分类检测算法。粗分类检测算法用于确定当前运动物体是否为车辆。

由前一步检测出的运动物体,存在可能性最多的就是行人和车辆。与行人相比,车辆的特点在于其外观比较规则,多为近似方形或梯形,因此对车辆进行边缘提取,会存在非常多的平行线特征。粗分类算法就是通过对于平行线的检测来对车辆和行人进行快速的分类,达到对车辆检测的目的。

1)首先通过边缘检测算法对车辆的边缘进行提取。这里使用经典的canny算子对于边缘进行提取;

2)对提取出的边缘使用hough变换,找出峰值点,进行直线的检测;

3)针对检测出的直线可能存在断裂以及不连续的情况,计算位于同一条直线上的若干条线段之间的距离,若距离小于阈值l,则认为这些线段属于同一直线;

4)针对上述步骤检测出的所有直线,计算每一条直线的斜率k;

5)计算每两条直线之间的斜率相对差。若小于误差阈值t1,则认为这两条直线为平行线。统计所有平行线的组数s。

6)若平行线的组数s大于阈值t2,则将当前的运动物体判断为车辆。

步骤3:车辆特征提取

收集大量车辆图片,对一个改进型激活函数的卷积神经网络进行训练。该神经网络的特点为:卷积层使用relu函数(见说明书附图2)进行激活,在下采样层使用tanh函数(见说明书附图3)进行激活。

传统的卷积神经网络仅使用relu函数进行激活。relu函数是线性修正,即对计算值小于0的结果都置0。这项修正引入了稀疏性,即对于某些神经元进行抑制。优点是有适度稀疏引导的能力,能够大大加快收敛速度。但是缺点在于,如果卷积神经网络的每一层都使用relu函数作为激活函数,就可能会引起过度的稀疏而导致很多重要信息的流失。

本发明通过结合relu函数和tanh函数,在卷积层使用relu函数进行激活,在下采样层使用tanh函数进行激活,能够弥补仅适用relu函数造成的过度稀疏问题,提高提取特征的鲁棒性。

通过训练一个改进型激活函数的卷积神经网络,我们可以将新的样本图片输入,并在卷积层将其神经元的的值进行输出,作为该样本的特征向量。

同时,对于图片我们提取它的hog特征。hog特征采用的是16×16的窗口大小,对于40×40大小的图像,用检测窗口扫描整张图像并计算每个块的特征向量,最终通过检测窗口生成整幅图像的hog特征,即得到了576维的hog特征向量。

将hog特征向量与神经网络提取出的特征向量进行融合,作为该样本最终的特征向量。

步骤4:细分类算法检测

细分类算法使用多分类svm分类器。该svm分为训练和检测两步。

训练部分:收集不同车型大量样本图片及其对应的标签。对训练样本进行预处理,包括灰度化、尺度统一等预处理操作。将每个样本送入训练好的改进型激活函数的卷积神经网络,得到样本的特征向量。同时提取该样本的hog特征,与神经网络提取的特征向量进行融合,作为该样本最终的特征向量。

为了保证分类的实时性以及精度要求,先对特征进行pca降维,删除一些冗余信息。通过降维后的特征及样本对应的标签,训练svm分类器,并通过交叉验证法优化svm的模型参数。这样就完成了svm模型的训练。

检测部分:对将待分类图像进行预处理,包括灰度化、尺度统一等预处理操作。将每个样本送入训练好的改进型激活函数的卷积神经网络,得到样本的特征向量。同时提取该样本的hog特征,与神经网络提取的特征向量进行融合,作为该样本最终的特征向量,并利用在训练过程中的pca参数对特征进行降维处理。最终将特征输入到训练好的svm分类器中进行识别,得到最终的车型结果。

附图说明

图1为施工现场实时车型识别算法的流程图。

图2为relu函数曲线

图3为tanh函数曲线

具体实施方式

下面结合具体实施例,对本发明的技术方案做进一步的详细说明。

以下实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

实施例

本实施例对一段工地入口处的视频进行车辆识别算法的检测,该视频从实际监控摄像头中获取。具体的实施方法包括以下步骤:

步骤1:背景建模

对于第一张没有车辆进入的初始图像,作为背景建模的初始化图像。提取这幅图像中的n个像素的像素值组成一个集合,作为初始的背景像素集

b(xi)={b1(xi),…,bk(xi),…,bn(xi)}。

步骤2:运动物体检测

接下来的每一帧图像的像素值i(xi)都会与这个集合中的值进行比较,如下式:

其中bk(xi)是背景像素集合中的任意一个像素值,r(xi)为设定的阈值。即新的像素值i(xi)与背景像素集合中任意一个像素值的距离小于阈值r(xi)的个数小于规定的数量#min时,则判断当前像素值为前景像素。

当前景像素的数量在一幅图像中的比例大于阈值tfore时,则判断当前有大型运动物体进入。

步骤3:粗分类

1)首先通过边缘检测算法对车辆的边缘进行提取。这里使用经典的canny算子对于边缘进行提取;

2)对提取出的边缘使用hough变换,找出峰值点,进行直线的检测;

3)针对检测出的直线可能存在断裂以及不连续的情况,计算位于同一条直线上的若干条线段之间的距离,若距离小于阈值l,则认为这些线段属于同一直线;

4)针对上述步骤检测出的所有直线,计算每一条直线的斜率k;

5)计算每两条直线之间的斜率相对差。若小于误差阈值t1,则认为这两条直线为平行线。统计所有平行线的组数s。

6)若平行线的组数s大于阈值t2,则将当前的运动物体判断为车辆。

步骤4:特征提取

收集不同车型大量样本图片及其对应的标签。对训练样本进行预处理,包括灰度化、尺度统一等预处理操作。将每个样本送入训练好的改进型激活函数的卷积神经网络,得到样本的特征向量。同时提取该样本的hog特征,与神经网络提取的特征向量进行融合,作为该样本最终的特征向量。

步骤5:细分类

将待分类样本图片进行预处理,包括灰度化、尺度统一等预处理操作。将每个样本送入训练好的改进型激活函数的卷积神经网络,得到样本的特征向量。同时提取该样本的hog特征,与神经网络提取的特征向量进行融合,作为该样本最终的特征向量,并利用在训练过程中的pca参数对特征进行降维处理。最终将特征输入到训练好的svm分类器中进行识别,得到最终的车型结果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1