一种基于词袋模型的卡口无牌车辆车型识别方法
【技术领域】
[0001] 本发明涉及一种基于词袋模型的卡口无牌车辆车型识别方法,属于图像处理与分 析在智能视频监控上的应用。
【背景技术】
[0002] 车型识别技术由于车辆本身金属特征,易受光照影响、特征点少,且对车牌定位依 赖性较强,同种类车辆车型较多,因而研究难度相当大。目前治安卡口系统车型识别一般是 通过检测车牌信息,从而精确定位出前脸区域,通过对车前脸作相应分析判断出车辆型号。 而该系统目前方法在定位精准程度上,对前脸的定位精确程度要求较高,而当前脸定位不 精确或是车牌定位失败时,车型识别的过程将无法进行。
【发明内容】
[0003] 本发明所要解决的技术问题是提供一种治安卡口系统下无牌车辆车型识别方法, 作为现有卡口系统车型识别的补充,本发明识别率较高,对前脸定位要求低,且耗时较少, 能够满足现实使用中对实时性的要求。
[0004] 为解决上述技术问题,本发明所采用的技术方案是:一种治安卡口系统无牌车辆 识别方法,其特征在于,包括以下部分:
[0005] S01、读入一批卡口车辆图像,采用直方图分析法完成车辆定位后的图像,包括各 个车型的车辆;
[0006] S02、提取车辆的前脸区域:采用Roberts算子对图像进行边缘检测,将边缘检测 图像进行密度连接,对连接后的图像作相应分析得到车脸的水平边界,对水平分割后的图 像再次进行密度连接,分割出车脸的垂直边界,最终得到车脸图像;
[0007] S03、对车脸图像进行分块,提取图像块的尺度不变局部特征算子特征;
[0008] S04、训练各类车辆车型,生成训练模板:训练图像为各个车型的车前脸图像,每个 车型包括30张图像。利用K-means聚类成词袋模型字典,并构造空间信息,最后采用支持 向量机对训练图像进行训练,得到训练模型;
[0009] S05、对测试图像进行车型分类:将每个图像块映射到词袋的字典中后,测试图像 即表示为视觉词汇的直方图形式,同时构造词典模型的空间信息,采用支持向量机支持向 量机对其进行分类;
[0010] 作为本发明的进一步改进,所述步骤S02具体为:
[0011] (1)采用Roberts算子对输入图像Im进行边缘检测得到边缘图Im_edge,计算Im_ edge中像素个数edge_sum,当edge_sum > 4000时,密度连接阈值设为Tr = 40,当edge_ sum < 4000时,密度连接阈值Tr = 30 ;
[0012] (2)对边缘图Im_edge作密度连接操作,采用10X30大小的滑动窗口进行计算,滑 动单位为5,当窗口内像素数大于Tr时,将该窗口水平方向下半部分所对应的图像位置像 素全部置为255,依次滑动窗口,最终得到密度连接后图像Im_conn ;
[0013] (3)对密度连接图像Im_conn进行行方向求和,并计算得到和为非零的行位置 conn_hz,根据conn_hz中相邻元素的差进行区分,当相邻2个值大于5时分为2部分,依次 查看conn_hz中的值,从而将Im_conn中斑点按水平方向分为几个部分,针对这几个部分, 分别根据位置、宽度、像素个数进行分析,排除不可能的区域,得到车脸的水平位置;
[0014] (4)对水平分割后的图像再次进行密度连接,分割出车脸的垂直边界,最终得到车 脸图像;
[0015] 作为本发明的进一步改进,所述步骤S03具体为:
[0016] 将车脸图像I进行规则的网格分割,分成块Pi、块p2、块ρη (η为块数量),每个块为 16Χ 16像素,并对每个图像块进行稠密尺度不变局部特征算子特征描述,最终图像I将得 至lj 128Χη维的特征向量{山,d2. . dj. . dn},dj表示第j个块的特征向量,维数为128 ;
[0017] 作为本发明的进一步改进,所述步骤S04具体为:
[0018] (1)将所有训练图像的稠密尺度不变局部特征算子特征采用K-means方法将距离 较近的特征合为一类,最终将训练图像特征分成N类,从而生成词汇数是N的词袋模型词典 (即聚类中心)V = {wp w2. . wk. . wN},其中wk表示第k个聚类中心词汇;
[0019] (2)把每幅训练图像表示成视觉单词的直方图形式,计算每个块到视觉词汇的最 小欧式距离,将每幅图像的所有分块分别映射到词典中,所有训练图像即可表示成关于词 袋模型视觉词典的直方图表示;
[0020] (3)将训练图像的特征送入支持向量机支持向量机进行训练,所采用的核函数为 histogram intersection kernel,最终得到训练模型;
[0021] 作为本发明的进一步改进,所述步骤S05具体为:
[0022] (1)计算块特征到词汇的最小欧式距离,从而将图像块映射到所属的视觉单词wk, k代表图像I的第j个块的特征向量分配到的wk的序号,该图像即可表示为视觉单词的直 方图形式;
[0023] (2)找到相同标记的块,在图像坐标系中,以图像原点为中心,图像块的位置假设 为该块的中心点,将相同标号的图像块按照到原点距离的大小进行升序排列;
[0024] (3)当排序完成以后,构造词袋模型全局空间信息:计算相邻两两图像块Xl、x#x 轴正方向的夹角,通过计算每个视觉单词%的角度直方图信息h(wk)(采用6个bin), 即可完成全局空间信息的构造;
[0025] (4)构造词袋模型局部空间信息:将标记完成后将图像中所有块量化成关于自身 标记的矩阵,此后开始对标记矩阵进行统计,设定3X3的滑动窗口,每次滑动单位为1,以 滑动窗口内中心元素为参考,扫描与其相邻的8个元素的值是否相等,相等则将相应元素 设为'1',否则为'〇',最后统计各中心元素'1'值的个数,即完成相同图像块的频率直方图 统计过程;
[0026] (5)将计算得到的全局角度信息与局部频率信息进行归一化,并结合到一起组成 7XN的空间信息,N表示词典大小,结合传统词袋模型模型,将具有空间信息的词袋模型送 入支持向量机分类器进行分类,所采用的核函数为histogram intersection kernel。
[0027] 本发明的有益效果是,将结合空间信息的词袋模型模型应用在卡口系统车型识别 上,识别率较高,且相比现有方案更优,同时大大降低了对车脸定位精确程度的要求,实现 了不依靠车牌定位来截取前脸信息,能够满足一般应用要求。
【附图说明】
[0028] 图1为本发明所提供的一种基于词袋模型的卡口无牌车辆车型识别流程图。
【具体实施方式】
[0029] 下面结合附图所示的各实施方式对本发明进行详细说明,但应当说明的是,这些 实施方式并非对本发明的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、 或者结构上的等效变换或替代,均属于本发明的保护范围之内。
[0030] 针对词袋模型模型忽略视觉单词之间联系而导致分类效果降低的问题,以及车型 识别对车脸定位精准等问题,本发明提出了一种治安卡口车型识别方法,下面结合附图进 行详细说明:
[0031] 如图1所示,为本发明所提供的一种基于词袋模型的卡口无牌车辆车型识别方法
【具体实施方式】中的流程示意图。在本实施方式中,一种卡口系统下车型识别方法,其包括以 下部分:
[0032] S01、读入一批卡口车辆图像,采用直方图分析法完成车辆定位后的图像,包括各 个车型的车辆。
[0033] S02、提取车辆的前脸区域;
[0034] 所述步骤S02具体为:
[0035] (1)采用Roberts算子对输入图像Im进行边缘检测得到边缘图Im_edge,计算Im_ edge中像素个数edge_sum,当edge_sum > 4000时,密度连接阈值设为Tr = 40,当edge_ sum < 4000时,密度连接阈值Tr = 30 ;
[0036] (2)对边缘图Im_edge作密度连接操作,采用10X30大小的滑动窗口进行计算,滑 动单位为5,当窗口内像素数大于Tr时,将该窗口水平方向下半部分所对应的图像位置像 素全部置为255,依次滑动窗口,最终得到密度连接后图像Im_conn ;
[0037] (3)对密度连接图像Im_conn进行行方向求和,并计算得到和为非零的行位置 conn_hz,根据conn_hz中相邻元素的差进行区分,当相邻2个值大于5时分为2部分,依次 查看conn_hz中的值,从而将Im_conn中斑点按水平方向分为几个部分,针对这几个部分, 分别根据位置、宽度、像素个数进行分析,排除不可能的区域,得到车脸的水平位置;
[0038] (4)对水平分割后的图像再次进行密度连接,分割出车脸的垂直边界,最终得到车 脸图像;
[0039] S03、对车脸图像进行分块,提取图像块的尺度不变局部特征算子特征;
[0040] 所述步骤S03具体为:
[0041 ] 将车脸图像I进行规则的网格分割,分成块Pi、块p2、块ρη (η为块数量),每个块为 16Χ 16像素,并对每个图像块进行稠密尺度不变局部特征算子特征描述,最终图像I将得 至lj 128Χη维的特征向量{山,d2. . dj. . dn},dj表示第j个块的特征向量,维数为128 ;
[0