一种智能车辆型号识别方法与流程

文档序号:15351462发布日期:2018-09-04 23:23阅读:737来源:国知局

本发明涉及城市智慧交通、图像搜索技术,尤其涉及一种智能车辆型号识别方法。



背景技术:

汽车是人类文明必不可少的重要发明,作为当今社会的主要交通工具发挥了巨大价值,但是随着汽车工业的发展,汽车型号外观日益增多,同质化严重,利用计算机算法通过汽车外观图片识别车辆型号成为一个难题。

随着深度学习等人工智能技术的发展,图像物体分类、检测等问题得到了突破性的进展,许多开创新深度神经网络模型被发明出来。针对图像分类的网络模型有lenet、vgg、resnet等卷积神经网络模型,针对图像物体检测的模型有yolo、fasterrcnn等。这些模型主要以卷积神经网络为主,其特点是利用卷积神经网络对图像等高维特征的抽象学习能力,网络深度增加,学习到的特征抽象层级也更高。

汽车型号识别问题与图像物体分类问题有很多相似性,但是汽车型号识别问题其分类粒度较细,介于物体分类和人脸识别之间,因此可以借鉴人脸识别问题的解决方法。tripletloss损失函数被google用于其facenet进行人脸识别和聚类问题,并在多个人脸识别数据集上取得了较好的成绩。假设有三联样本组(xa,xp,xn),xa为某一对象的标准样本,xp为同一对象的的样本,称为正例样本,xn为来自其他对象的样本,成为负例样本。在映射函数作用下,定义该三联样本的损失函数为:

其中,α>0为超参数表示不同对象样本的最小间隔。α值越大,表示期望的对象间距越大,但是可能造成训练难度增大,甚至无法收敛等问题,因此需要合理设置α值。对n个三联样本组,其总的tripletloss损失函数为:

本发明将利用深度卷积神经网络实现映射函数



技术实现要素:

为了解决以上技术问题,本发明提出了一种智能车辆型号识别方法,由计算机视觉算法智能识别图像中的汽车类型。能够帮助车辆、交通管理部门管理车辆和交。

本发明将车辆图像映射成为低维欧式空间向量,通过计算向量间欧式距离判断车辆型号。

通过深度卷积神经网络学习图像特征,实现从图像到低维欧式空间向量的映射,同时利用特殊的tripletloss损失函数训练该深度卷积网络,使同样型号的汽车图像在欧式空间中的向量具有更近的距离,从而实现对不同汽车型号类别的识别。

搭建深度卷积网络,使用大量三联样本训练该网络,使其具有映射相同型号汽车图片距离小于不同型号汽车图片距离的能力。

首先以resnet-34卷积神经网络作为原型构建模型主体,输入层设定为256×256的rgb彩色图像,输出层有128个神经元。网络所有神经元激活函数采用relu函数。神经网络模型具体结构如附图1所示。在输出层对输出的128维向量υ=[p1,…,pi,…,p128]t进行l2归一化,即

训练采用小批量随机梯度下降法,从该mini-batch中选取三联样本输入到神经网络中,归一化之后,计算tripletloss。选取方法为随机选取10例标准样本,从该对象剩余样本中随机选取10例正例样本,从非正例样本中随机选取100张图像作为负例样本。对于一张标准样本xai和一张正例样本xpi与10例负例样本构成10例三联样本。则每个汽车类型的样本图像不少于20例,汽车总类型数目不少于11例。

训练时,在线采用更新参数法,一次迭代所有汽车类型之后更新一次模型参数。初始化采用随机初始化,学习率初始化为0.01。每5000次迭代后,学习率降低为原来十分之一。模型达到满意正确率之后停止训练,得到确定模型

本发明的有益效果是

本方法应用最新的深度神经网络和较细粒度的图像识别方法解决车辆类型的智能识别问题,具有一次训练随时应用的特点,能够解决训练样本中未出现的车辆型号分类问题,大大减小了训练成本,降低了应用难度。

附图说明

附图1resnet-34卷积神经网络具体结构;

附图2模型训练流程图。

具体实施方式

下面对本发明的内容进行更加详细的阐述:

本发明通过深度卷积神经网络学习图像特征,实现从图像到低维欧式空间向量的映射,同时利用特殊的tripletloss损失函数训练该深度卷积网络,使同样型号的汽车图像在欧式空间中的向量具有更近的距离,从而实现对不同汽车型号类别的识别。

具体操作如下

1、收集不同汽车型号的图像数据集。以车头正面图像和车位正面图像为主。汽车颜色可以变化,模型会忽略汽车颜色,通过汽车头部和尾部结构设计确认汽车型号,如区分奥迪q3和奥迪q5,不区分黑色奥迪q5和白色奥迪q5。所有图像均需有对应的汽车型号标签作为后续模型训练选取样本的依据。没类型号的图像不少于20张,汽车类型数不少于11个。汽车类型数增多会使模型训练时间变长,但是有助于提高模型识别精确度,对于需要高精确度的应用场景,应尽量多收集汽车类型图像。

2、训练模型使用神经网络编程框架实现发明内容所述的修改后的resnet-34深度卷积网络。编程框架可选pytorch、tensorflow等。设定学习率、学习率更新规则、终止条件等细节后,使用收集的图像数据集训练模型令α=0.6。

3、模型的应用。首先确定所需识别的汽车型号,然后准备图像,如已在数据集中则可以直接使用已有图像。将待识别车型图像和已有车型图像输入到神经网络,归一化得到低维向量后计算平均距离,与训练时设定的α阈值对比,小于该阈值则为同一型号。例如汽车型号为a,该型号图像为aimg_1,aimg_2,aimg_3,将每张图像输入到神经网络归一化,得到相应的低维向量υa_1,υa_2,υa_3。待判定汽车图像为ximg,输入到神经网络归一化,得到相应的低维向量υx。计算υx与υa_1,υa_2,υa_3的平均欧式距离,若小于α则判定ximg为汽车类型a。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1