一种基于卷积神经网络针对车辆识别任务中异类检测方案

文档序号:33710631发布日期:2023-03-31 23:39阅读:48来源:国知局
一种基于卷积神经网络针对车辆识别任务中异类检测方案
一种基于卷积神经网络针对车辆识别任务中异类检测方案
1.技术领域
2.本发明属于网络图像分类领域和分布外数据(out-of-distribution,ood)异类检测领域。特别涉及针对保证系统能准确识别车辆的情况下,同时可以对异类数据进行检测的需求,设计了一种基于卷积神经网络针对车辆识别任务中异类检测方案。
3.

背景技术:

4.针对交通车辆识别系统而言,系统所接受的输入样本除了车辆以外,还很有可能包括行人、动物、指示牌等数据,这些对于系统来说均为异类数据。因此,系统是否能够有效检测出异类样本已然成为一个重要课题。
5.现有的一些传统检测异类数据方法,就是在训练网络的阶段,扩大所用到的非异类数据集和异类数据集。但是,由于在项目的实际应用中,异类数据的分布是不可知的,所以在这个方法中,要用到的异类数据训练集会非常庞大,同时,网络的架构也会十分的庞大,这会让整个网络的训练过程变得非常复杂繁琐,且计算量非常巨大。
6.此外,已有学多学者通过其他方法进行 ood 数据的检测。例如在2017年,由hendrycks和gimpel等人在论文《a baseline for detecting misclassified and out-of-distributionexamples in neural networks》提出的一个检测异类数据的基准方法baseline。他们对网络的softmax层设定了一个阈值,通过改阈值来输入数据进行检测,判断是否为异类数据。
7.在这之后,很多学者都在此方法上做出优化,进行改进。但无论如何,这类方法主要是利用网络倒数第二层的特征输出来进行异类数据的检测。2019年,abdelzad等人在文章《why relu networks yield high-confidence pre-dictions far away from the training data and how to mitigate the problem》中提到,网络倒数第二层经过训练后,主要提取的是作用于非异类样本分类任务的特征。但是当输入异类样本的时候,仅利用该层提取的特征并不能有效将非异类样本和异类样本区分开来。其他学者,如hein、andriushchenko和bitterwolf等人也提到过,基于softmax层的检测方法在最后结果输出的时候,会不可避免地为异类样本分配很高的置信度。这几乎是网络普遍存在的一个问题。
8.

技术实现要素:

9.为了解决现存技术存在的一些问题,本发明的目的是提供一种基于网络针对车辆识别任务中异类检测的方案。其利用辅助训练数据集提升网络对异类样本的鉴别能力,然后利用gram矩阵提取样本蕴含在网络中各层次特征相关系数的范围,利用该范围作为异类样本检测的判断依据。该方法优于传统方法异类检测的效果。
10.本发明的方案所采用的技术方案是:一种基于卷积神经网络针对车辆识别任务中
异类检测方案。
11.一种基于卷积神经网络针对车辆识别任务中异类检测方案,其特征在于,包括以下步骤:步骤1:准备数据集;步骤2:训练网络;步骤3:计算gram矩阵;步骤4:对测试数据进行异类检测。
12.作为优选,步骤1的具体实现包括以下子步骤:步骤1.1:数据集包括用于训练网络的车辆数据集,用于辅助训练的非车辆数据集,以及用于测试的数据集,三个数据集互不相交;步骤1.2:对上述训练数据集及逆行数据增强及预处理,其中,所述数据增强包括对图像进行一系列变换和加干扰进一步扩大数据集。
13.作为优选,步骤2的具体实现包括以下子步骤:步骤2.1:建立网络,所建立的网络包含多个卷积层和至少一个全连接层;步骤2.2:将训练数据集输入至网络进行训练,假设车辆数据集具有c个类别,而辅助非车辆的辅助数据集均被分类到第c+1个类别;步骤2.3:将网络迭代多次训练,直至其对训练数据集的分类正确率达到一个较高且稳定的值。
14.作为优选,步骤3的具体实现包括以下子步骤:步骤3.1:计算网络每一层的1到p阶gram矩阵;步骤3.2:计算gram矩阵对应的特征相关系数的范围,该范围由gram矩阵中的最大值和最小值确定。
15.作为优选,步骤4的具体实现包括以下子步骤:步骤4.1:将测试数据集输入至系统,计算当前输入样本所在网络层中gram矩阵对应的特征相关系数,并与其当前层特征相关系数的最值范围进行比较,得到对应的系数偏差值;步骤4.2:计算当前输入样本在整个系统中的总体偏差值;步骤4.3:利用该总体偏差值判断当前输入是否为异类样本输入。
16.本发明方法与现有的技术相比有如下的优点和有益效果:首先,本发明方法并不需要提前真实的异类数据,这保证了系统在训练阶段不需要大量的数据进行训练以及所构建的网络结构规模并不会十分巨大,这大大减小了系统的运算量;其次,网络在训练过程中运用到了一个辅助训练的非车辆数据集,这使得网络对异类样本会更加敏感,更加容易区分非异类样本与异类样本。最后,利用了gram矩阵提取网络中各层次的特征系数,而不是仅提取了用于图像样本分类的深层次特征,这使得系统更能有效检测异类数据。因此,本发明相比于传统方法,异类检测的效果会更好。
17.附图说明
18.图1:本发明实施例的应用场景示例图。
19.图2:本发明实施例的方法流程图。
20.图3:本发明实施例中使用的bit数据集样本示意图。
21.图4:本发明实施例中使用的gtsrb数据集样本示意图。
22.图5:本发明实施例中使用的cats vs dogs数据集样本示意图。
23.图6:本发明实施例中使用的inria数据集样本示意图。
24.图7:本发明实施例中利用gram矩阵提取特征相关系数的示意图。
25.具体实施方式
26.为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
27.图1所示的是本发明一种基于卷积神经网络针对车辆识别任务中异类检测方案的应用场景示例。
28.请见图2,本发明提供一种基于卷积神经网络针对车辆识别任务中异类检测方案,主要包括以下四个部分:准备数据集、训练网络、计算gram矩阵、对测试数据进行异类检测。
29.步骤1:准备数据集;步骤1.1:数据集包括车辆数据集,用于辅助训练的非车辆数据集,以及用于测试的异类样本数据集,三个数据集互不相交。车辆数据集的样本来自于bit车辆数据集,其包含9850幅车辆图像。这些图像按车辆类型分为以下六类:公共汽车,小型客车,小型货车,轿车,suv和卡车,如图3所示;此外,将德国交通标识数据集gtsrb中的12630张图片作为辅助数据集,如图4所示;最后,由动物数据集dogs vs cats和行人数据集inria作为异类样本数据集,分别如图5、图6所示;步骤1.2:由于收集的数据集有限,需要对图像进行一系列变换操作来进一步扩大数据集,也成为数据增强。数据增强的同时有利于提高算法的泛化能力。数据增强的操作包括如下:利用灰度反相变换处理样本图像;然后进行旋转变换,左右各旋转3
°
;然后再进行平移变换,上下左右分别平移1个像素;最后,采用随机添加高斯模糊、高斯噪声的方法进一步扩大数据集。数据增强后,还需要对数据进行预处理,将全部图像归一化为32
×
32的图像。
30.步骤2:训练网络;步骤2.1:建立resnet34神经网络。本发明实施例中,对于resnet34模型,网络训练的迭代次数为120次;步骤2.2:将训练数据集输入至网络进行训练,任意一个输入对应一个真实标签
,而网络的预测标签为。假设车辆数据集具有c个类别,而用于辅助训练的非车辆数据集均被分类到第c+1个类别。在本发明实施例中,c取6。在本系统中,网络的目标函数为:其中,

为网络各层的参数,为辅非车辆数据集中,某个样本在网络最后一层的特征表示。目标函数的第一项为车辆数据样本的常规交叉熵公式,第二项用于将来自于辅助数据集的样本都归类为第类。而最后一项的作用是,对于任意一个来自于辅助数据集的样本,使其softmax的每一类输出概率都趋向于。在本发明实施例中,取值0.05;步骤2.3:将网络迭代多次训练,直至其对训练数据集的分类正确率达到一个较高且稳定的值。
31.步骤3:计算gram矩阵,如图7所示;步骤3.1:计算网络每一层中1到p阶的gram矩阵,其某一阶矩阵定义如下公式:其中,为当前阶数,为当前网络层,为网络第层的特征输出。在本发明实施例中,p取10,因此

的取值范围是[1,10]。这是因为,当阶数

过小的时候,无法很好计算出各特征之间的联系,但当阶数

过大的时候(超过10),网络的异类检测性能不仅没有得到卓越的提升,而且计算参数的代价也会非常巨大;步骤3.2:计算gram矩阵对应的特征相关系数的范围,该范围由gram矩阵中的最大值和最小值确定。
[0032]
步骤4:对测试数据进行异类检测;步骤4.1:将测试数据集输入至系统,计算当前输入样本的特征相关系数与偏差值;步骤4.1.1:将网络第层中第阶的gram矩阵打平为1维数组得到,计算当前输入样本在中某一特征相关系数;步骤4.1.2:计算当前输入样本在中某一特征相关系数的偏差值,具体公式如下:
步骤4.1.3:计算当前输入样本在网络的某一层中,gram矩阵对应的特征相关系数偏差值,具体公式如下:其中,表示网络第层的通道数。
[0033]
步骤4.1.4:计算当前输入样本在整个网络中的总体偏差值,公式如下:步骤4.2:利用该总体偏差值判断当前输入是否为异类输入。具体方法是,在系统可以判断出高达95%的异类数据样本(即95%tpr)的条件下,计算出一个阈值。若当前输入对应的特征相关偏差值

(d)大于阈值τ,那么系统判断该输入为异类数据样本;反之,为车辆数据样本。公式如下:本发明方案有如下评价指标:fpr(95%tpr)、auroc。fpr(95%tpr)表示当真阳性率(tpr)高达95%的时候,一个负样本被系统错误识别为正样本的概率;auorc:即roc曲线下的面积。
[0034]
本发明利用辅助训练数据集和gram矩阵,实现了一种基于卷积神经网络针对车辆识别任务中异类检测方案,该方案不仅保证了系统能够对车辆样本进行准确分类,并且使得系统有效检测出异类数据,进一步提高了该车辆识别系统的泛化性与准确率。
[0035]
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
[0036]
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1