一种基于车辆热点区域的概率聚合的套牌车检测方法
【专利摘要】一种基于车辆热点区域的概率聚合的套牌车检测方法,包括以下步骤:S1.卡口数据的提取;S2.卡口数据的清洗;S3.计算卡口间流向概率;S4.计算行为异常车辆清单:根据S2中提取出来的每一辆车的卡口对,计算卡口对概率,按照概率低于设定阈值Ti的次数,降序排列,根据需要选取前N行作为行为异常车辆清单;S5.计算车辆热点区域卡口点;S6.计算车辆在两热点区域卡口点之间通行的概率;S7.根据S6所得卡口间概率,对所有卡口进行聚合;S8.根据车辆卡口聚合情况计算车辆套牌概率Z。本发明克服随机性的卡口号牌识别错误,利用车辆活动区域相对固定的特性,筛选出套牌嫌疑度较大的车辆、大大缩小嫌疑范围、实用性良好。
【专利说明】
-种基于车辆热点区域的概率聚合的套牌车检测方法
技术领域
[0001 ]本发明设及智能交通领域,具体设及一种套牌车检测方法。
【背景技术】
[0002] 套牌车俗称克隆车,是指通过伪造或者非法套取其它车辆号牌及行驶证等手续上 路行驶的车辆。随着经济的发展,车辆保有量越来越多,套牌车也不断增加。套牌车会扰乱 公安机关对公共安全的管控,由于套牌车没有合法手续和保险,一旦发生交通事故,驾驶人 极易逃逸。套牌车还为犯罪活动提供作案工具,大大增加了破案难度。套牌车会逃避各种税 费,造成国家税费的大量流失,并扰乱运输市场的秩序。套牌车会损坏真车主的合法权益, 在车辆交通违法、事故处理等方面,真车主往往要充当"冤大头"。
[0003] 套牌车运一违章行为的识别查处难度很大,民警在执勤过程中很难短时间根据车 牌及外观特征人工判断出车辆是否为套牌车。现在已经有一些基于卡口数据的套牌车自动 化识别方法。卡口指的是,采用先进的光电、计算机、图像处理、模式识别、远程数据访问等 技术,对监控路段的机动车道、非机动车道进行全天候实时监控并记录相关图像数据,并自 动获取车辆的通过时间、地点、行驶方向、号牌号码、号牌颜色、车身颜色等数据。
[0004] 已公开的专利及审查中的专利中,主要分成=大类,1、基于图像识别,通过车辆特 征进行判断。2、基于辅助装置:例如安装电子车牌,预留安全密码等等。3、基于卡口数据,对 车辆轨迹进行分析。
[0005] 基于第一类方法的专利有:
[0006] -:申请号[201510102368.3]提出的,基于识别车辆的车牌号和品牌信息的套牌 车检测方法。1、识别车辆的车牌号和品牌信息,若车牌号和品牌信息不对应,则将该车辆 加入套牌车嫌疑库;2、对加入套牌车嫌疑库的车辆进行精确判别,去除误报的车辆;3)统计 车辆在套牌车嫌疑库中出现的次数,当某车辆的出现次数超过设定值即寸发出警报。
[0007] 二:申请号[201410333789.2]提出的,一种基于车辆身份识别的套牌车识别的方 法与装置。1、从图片或视频中提取出车辆,识别该车辆特征。2、为与交管所数据库进行比 对,当发现车辆某些特征与数据库内特征不匹配时,进行报警。2、在市区内卡口进行稽查布 控,当发现特征相同的车辆在同一时间的不同位置出现时,则进行套报警。3、历史数据进行 比对,当发现车牌号码相同的车辆,车辆其他特征不相同时,进行报警。
[000引 W上专利方法中,天气、光线等因素会干扰图像的识别,部分国产车和进口车外形 较为相似,也会给识别造成困难。存在原车和套牌车品牌、型号相同则无法检测等缺陷。
[0009] 基于第二类方法的专利有:
[0010] 一:申请号[201320365827.3]提出的,一种基于超高频射频识别技术的假、套牌车 辆识别装置。基于超高频射频识别技术的假、套牌车辆识别装置,通过射频识别读写设备对 汽车上的电子标签进行检测,并对电子标签内的信息进行判断,然后与车牌图像采集设备 得出的车牌号码进行比对,进行套牌车判别。
[0011] 二:申请号[200910107671.7]提出的,一种基于安全密码的机动车套牌假牌违法 行为检测方法。交警内部车辆管理系统平台预留车辆安全检测密码;执法交警手持远程控 制终端输入被检查车辆区域代码和车牌号码;与注册信息对比;输入被查车辆安全检测密 码;输入密码与预留密码自动对比,判断是否套牌假牌。
[0012] W上专利需要设及到额外的平台建设和车辆改造。
[0013] 基于第=类方法的专利有:
[0014] -:申请号[201210438702.9]提出的,一种基于时间交集的套牌车检测方法。获 取车辆进入和离开该位置的时刻W及在该位置的停留时间段,两两配对,如果对应的停留 时间段有交集,则存在套牌车,如果无交集,则根据两点之间的理论最短时间和实际时间差 来判断是否存在套牌车。该方案中,理论最短时间计算复杂,设及到路网结构,路段长度,交 通拥堵度等诸多参数。
[0015] 二:申请号[201310730531.1 ]提出的,一种套牌车车辆的区域自动捕获方法。在封 闭的区域边界设置监控点,如果车辆从该区域驶出,但是没有驶入信息,则判定该车辆为套 牌车辆。该方案中的封闭区域在实际中难W实现。
[0016] 申请号[201310034242.引提出的,一种基于道路网格化的套牌车车辆的捕获 方法。将城市道路区域依据网格切分原则进行网格化,检验同一车牌号车辆按时间序列的 网格轨迹是否连续,若出现不连续的网格轨迹,则将该网格轨迹对应的车牌号作为疑似套 牌车车牌号码。该方案需要详细的路网结构。
[0017] 四:申请号[201410094882.2]提出的,一种基于卡口连通性的套牌分析的方。1、根 据车辆经过卡口的顺序是否和预先保存的卡口连通信息一致,如果不一致,再根据预先保 存的卡口连通信息确定任一不一致的卡口到其相邻卡口的所有可达路径,判断所述可达路 径中是否存在一条路径,该条路径经过的卡口数量小于等于预设值N,如果是,则所述车牌 未套牌,否则,所述车牌存在套牌。
[0018] 现有的方法均是基于单次车辆行驶轨迹进行判断。实际情况中,由于卡口号牌识 别错误的存在,W上算法得出的套牌车嫌疑清单往往达到几万甚至几十万个。
[0019] 随机性的卡口号牌识别错误指的是由于光照、角度等因素,车牌在部分卡口或者 时间段能够正确识别,部分卡口或者时间段识别成其他车牌。运种情况占号牌识别错误的 绝大部分。非随机性号牌识别错误主要是由于车辆号牌污损引起的,该车牌会被所有卡口 识别成固定的错误号牌。例车牌号"浙A****r,其中字符R右下角被遮挡,但是其余部分均 很清晰,所有卡口均将该车牌识别成了 "浙A***冲"。
【发明内容】
[0020] 为了克服已有套牌车辆检测方法的由于存在随机性的卡口号牌识别错误、嫌疑范 围过大、实用性较差的不足,本发明提供一种克服随机性的卡口号牌识别错误,利用车辆活 动区域相对固定的特性,筛选出套牌嫌疑度较大的车辆、大大缩小嫌疑范围、实用性良好的 基于车辆活动热点区域的概率聚合的套牌车检测方法。
[0021] 本发明解决其技术问题所采用的技术方案是:
[0022] -种基于车辆热点区域的概率聚合的套牌车检测方法,所述套牌车辆检测方法包 括W下步骤:
[0023] SI.卡口数据的提取:获取卡口过车记录数据,保留需要的维度,包括卡口编号、卡 口方向、号牌号码、号牌种类,过车时间;
[0024] S2.卡口数据的清洗;
[0025] S3.计算卡口间流向概率,过程如下:
[0026] 3.1、根据行车轨迹,提取卡口向量:将卡口数据按照号牌号码,卡口过车时间进行 排序,得到每一辆车的行车轨迹,用所经过的卡口序列化a,Kb,Kc ? Ki ? Kn ?)表示,提取每一 辆行车轨迹中相邻的卡口对,形成卡口向量序列化a,Kb) ?化i,Kj) ? dK 3,表示车辆经过的 第a个卡口,向量化a,Kb)表示车辆顺序经过两个卡口Ka和Kb,且Ka和Kb在行车轨迹中相邻;
[0027] 3.2、计算卡口间流向概率:对卡口Ki计数,得到Ki卡口流出车辆总和,用count化i) 表示。对向量化i,Kj)计数,得到卡口Ki到卡口Kj通行车辆总和,用count化i ,Kj)表示。卡口Ki 到卡口 Kj的流向概率为Pu = count化i,Kj) /counUKi);
[0028] S4.计算行为异常车辆清单:根据S2中提取出来的每一辆车的卡口对,计算卡口对 概率,按照概率低于设定阔值Tl的次数,降序排列,根据需要选取前N行,作为行为异常车辆 清单,咐^§实际需要选取;
[0029] S5.计算车辆热点区域卡口点:热点活动区域卡口点指的是车辆经常被捕获的卡 口,统计车辆在每个卡口点出现的次数,如果大于设定的阔值Mv,则认为该卡口是车辆的热 点活动区域卡口点;
[0030] S6.计算车辆在两热点区域卡口点之间通行的概率:对每一辆车在S5中计算的热 点卡口做笛卡尔积,并且根据S2计算的概率,给每一对卡口进行赋值,并且选取正反向中较 大的概率;如果卡口IQ到卡口Kj的概率P化i ,Kj)<卡口Kj到卡口Ki的概率P化j,Ki ),那么将 P化j,Ki)赋值给卡口对化i,Kj);
[0031 ] S7.根据S6所得卡口间概率,对所有卡口进行聚合,确保各个分组内部,对于任一 卡口对化1,町),存在一条路径从Ki到町,路径上所有相邻卡口对的概率均不小于设定阔值 Ti,各个分组之间,对于任一卡口Ki,其他组不存在卡口K j,满足P化i,Kj)大于设定的阔值 Ti;
[0032] S8.计算车辆套牌的概率,根据车辆卡口聚合情况计算车辆套牌概率Z,Z = N*i* S4,N表示车辆热点卡口总数,i取决于分组数量L,如果L = 2,i = 1,如果L = 3,i = 1/2,否则i =0 ; S取决于分组中卡口的数量比,NAi表示每一组中卡口的数量;s = max(NAi , 2)/max (Nai , I),max(NAi , I)表示数量最大的一个,max(NAi ,2)表示数量第二大的。
[0033] 进一步,所述步骤S7中个,聚合过程如下:
[0034] Step7.1.获取可W车辆号牌清单;
[0035] Step7.2.从号牌清单中取出一个号码,根据号码,获取该号牌热点活动区域卡口 化1,1(2,1(3---1(11),记为数组40,并且根据车辆出现在该卡口的次数倒叙排列;
[0036] Step7.3.将AO中的第一个卡口 Kl添加到数组Al中,并且将Kl从AO中去除;
[0037] Step7.4.判断Kl与AO中每一个卡口之间的无向概率Q化l,Ki)是否大于阔值Ti,如 果是,将Ki添加到Al和空数组4_116*,并且将Ki从数组AO中去除;
[003引 Step7.5 .从数组A_new中取出一个卡口 K j,判断K j与AO中每一个卡口之间的无向 概率Q化j,Ki)是否大于阔值Ti,如果是,将Ki添加到Al和空数组4_116*,并且将Ki从数组AO 中去除,将K j从数组A_new中去掉;
[0039] Step7.6.重复 Step7.5,直到 A_new 为空;
[0040] Step7.7.增加数组Ai,重复步骤Step7.3-7.6;
[0041 ] Step7.8.重复 Step7.7,直到 AO 为空;
[0042] Step7.9.重复Step7.2-7.8,直到号牌清单为空。
[0043] 再进一步,所述步骤S2中,卡口数据的清洗过程如下:
[0044] 2.1、清洗重复记录;
[0045] 2.2、清洗脏数据,所述脏数据是指号牌号码不符合命名规则的记录;
[0046] 2.3、确定时间区间,清洗该区间内记录不齐全的卡口数据,运些情况包括卡口损 坏和断电导致卡口无法工作,或者网络中断和磁盘容量不足导致数据未能存储,清洗该卡 口所有数据。
[0047] 更进一步,所述步骤S4中,阔值Tl根据卡口号牌识别正确率F进行设定,对卡口Ki而 言,Ti的取值应满足F<=EjPij<F-Ti,其中j满足Pij〉Ti,,卡日号牌识别正确率F=l-(通过卡 口的但是号牌不在号牌库中的过车记录数)/(所有过车记录数),Tl表示卡口Ki的阔值,PiJ 表示卡口 Pi到其他卡口的概率。
[0048] 本发明的技术构思为:在基于通行概率检测车辆套牌方法为基础,利用车辆热点 活动区域特性,缩小排查范围。
[0049] 实际使用中,由于光线、角度、号牌污损等因素,卡口对于号牌的识别率无法达到 100 % (-般在96 % -98 %左右)。车牌在大部分卡口或者时间段能够正确识别,小部分卡口 或者时间段识别成其他车牌,识别错误的卡口点往往分布是随机的,且通行次数较少。同 时,正常家庭用车基本上会行驶在比较固定的路线上,识别正确的卡口点往往分布在运些 固定路线上,且次数较多。因此去掉通过次数较少的卡口点,可W将大部分识别错误的卡口 进行排除。
[0050] 车辆经常通过的卡口往往在空间上具有连续性。如果运些卡口点明显分布呈现两 个社区,且社区间关联很弱,说明很有可能是两辆车分别在两个区域活动,也就是说明该车 的套牌可能性较高。
[0051 ]本发明的有益效果主要表现在:能够在一定程度上克服卡口随机性的号牌识别错 误,极大的缩小排查范围、实用性良好;无需依赖路网结构,适用性较强。
【附图说明】
[0052] 图1是基于车辆活动热点区域的概率聚合的套牌车检测方法的流程图。
[0053] 图2是正常的车辆热点卡口分布,其特点是卡口之间具有较强的关联性。
[0054] 图3是疑似套牌车辆热点卡口分布,其特点是明显分布成两个社区。
[0055] 图4是较易识别错误的车辆热点卡口分布,其特点是分布成多个社区。
【具体实施方式】
[0056] 下面结合附图对本发明作进一步描述。
[0057] 参照图1~图4,一种基于车辆活动热点区域的概率聚合的套牌车检测方法,包括 如下步骤:
[0058] SI.数据的提取:获取卡口过车记录数据,保留需要的维度,包括卡口编号、卡口方 向、号牌号码、号牌种类,过车时间。(卡口编号唯一确定卡口路口位置,卡口方向确定卡口 拍摄方向,即行车方向,号牌种类和号牌号码唯一确定一辆机动车)
[0059] 本实施例抽取了杭州市1月1日-1月27日489个卡口记录的数据,总共129534497 条,卡口数据格式如下表1: 「00601
[0061] 表 1
[0062] 其中KKID+FXBH唯一确定一个卡口,HPHM+HP化唯一确定一辆汽车。JGSJ精确到秒, (W下步骤中,卡口 ID包含了卡口方向,号牌号码包含了号牌种类,不再寶述)
[0063] S2.数据的清洗,过程如下:
[0064] 2.1、清洗重复数据:对于卡口,捕捉一辆经过的车辆时,可能会产生多条数据,造 成数据的重复,如下表2所示:
[00 化]
[0066] 表 2
[0067] 第3条和第4条过车记录所经过的卡口 ID-致,且过车时间相同,运种属于重复记 录。
[0068] 原因是由于卡口捕获车辆的时候,可能会产生多条记录。定义同一车辆,同一卡 口,且时间误差不超过阔值A T(本实施例设为4秒钟)的记录为重复记录,去除重复记录。
[0069] 2.2、清洗脏数据:由于号牌号码是卡口系统根据图片识别,存在一定数量的车牌 字符,卡口无法识别,记录中的号牌号码不符合命名规则,具体包括:"无法识别","WJLL", 号牌号码含有符号^"。清洗该部分数据,部分案例如下表3所示:
[0071] 表3
[0072] 3.3、清洗记录不齐全的卡口数据:实际情形下,由于断电、断网、卡口损坏等因素, 部分卡口的数据存在缺失。对于记录不齐全的卡口数据,该卡口数据均予W清洗。
[0073] 本案例中,选取的时间区间为1月1日至1月27日,累计489个卡口中有169个卡口至 少1天有数据缺失,清洗运些卡口所有的数据。
[0074] 卡口数据缺失定义如下:如果卡口一天的过车记录小于日均过车记录的1/20,该 卡口运一天数据缺失。
[00巧]S3.计算卡口间流向概率
[0076] 3.1首先确定行车轨迹,并提取卡口向量
[0077] 行车轨迹确定过程:按照号牌号码,过车时间排序即可得到行车轨迹。行车轨迹包 含=个部分(卡口 ID,号牌号码,过车时间),表示车辆依次经过的卡口和过车时间。格式如 下:本实施例共有2123568条行车轨迹,如下表4所示(省略号部分为未显示部分)。
[007引
[C
[0080] 表 4
[0081] 提取卡口向量:对于同一辆车行车轨迹上相邻的两个卡口,依次取出来,作为卡口 向量。对于S3案例,可取出六个向量(31000300007402,31000300010702)、 (31000300010702,31000300010904)、(31000300010904,31000300004504)、 (31000300004504,31000300004502)、(31000300004502,31000300019902)、 (31000300019902,31000300005402)〇
[0082] 对本实施例中的2123568条行车轨迹,分别提取向量,所有的行车轨迹可W取出的 向量为85259515个。
[0083] 3.2.计算卡口间流向概率
[0084] 统计所有的向量化,Kj ),可W得到从卡口 Ki流出,流向卡口 Kj的车辆数。统计Ki,我 们可W得到从Ki流出的车辆总数,得到如下表5所示(省略号部分为未显示部分)。
[0085]
[OC
[0087]表 5
[008引卡口流向概率在另一种维度上体现了卡口分布和路网结构。如果卡口分布或者路 网结构发生显著变化,该概率需要重新计算(朝夕车道、限行等不需要重新计算)。
[0089] S4.计算行为异常车辆清单
[0090] 我们已经在S3中提取了每一辆车的行车轨迹。一个有N个点的行车轨迹对应N-I个 卡口向量,每一个卡口向量,对应一个卡口流向概率,也就是说一个有N个点组成的行车轨 迹对应N-I个概率值,如下表6:
[0091] _
[0092] 表 6
[0093] 表6 中,43、44、46、410和414概率均低于1'1。
[0094] 本实施例中,计算卡口阔值Ti的计算过程如下:
[00M] 4.1、首先统计所有卡口过车总数和号牌错误数(号牌号码不在号牌库中的车辆)。 总的过车数量为:87383083,号牌错误数为:2524476;可W计算出卡口号牌识别正确率F为 97.1%。
[0096] 4.2、对每一个卡口计算阔值Ti:例如对于卡口 31000300015401,与其他各个卡口 间的概率按照降序排列如下表7所示(省略号部分为未显示部分):
Luu/u」
[0099] 对卡口Ki而言,Ti的取值应满足F< = E jPij<F+Ti,其中j满足Pij〉Ti,本案例中,如果 Ti取值为0.268 %,E jPu = 96.930% <F,如果Ti取值为0.255%,F< E jPu = 97.198% <FWi, 如果1'1取值为0.135%,。?^ = 97.333%〉叶1'1,所^对于卡口31000300015401,阔值1'1二 0.255%。
[0100] 按照如上方法,我们计算每一个卡口对应的Tl,得到如下表8(省略号部分为未显 示部分):
[0102] 表8
[0103] 在本实施例中,我们发现该段包含14个点的行车轨迹中,有5次概率小于阔值Ti。
[0104] 将运14个卡口点显示到地图上,发现运14个卡口点明显分布成两条轨迹,其中kl、 42、44、45、410、411、412、413运8个点明显呈现一条轨迹,43、46、47、48、49、414明显呈一条 轨迹。
[0105] 嫌疑度排序:Qi小于阔值Ti 一次,我们记为有一次行为异常,如果行为异常次数较 多,说明该车轨迹在空间的不连续性非常高,也就是说套牌的可能性很高。重复步骤S6,我 们可W得到每一辆车行为异常的次数,按照行为异常的次数降序,可W得到行为异常车辆 清单,部分结果如下表9:
[0106]
[0107]
[010引表9
[0109] S5.计算车辆热点区域卡口。
[0110] 5.1、统计按照号牌分组,车辆在每一个卡口出现的次数,并且按照出现次数降序, 对于车辆"浙ANOM****"可W得到如下表10:
[0111]
[0112]
[0113] 表10
[0114] 5.2、计算车辆对应的阔值Mv。对于车辆"浙ANOM****",各个卡口点出现次数的平 均值是11.3,因此,其阔值Mv设置为11.3*80 % =9.1。
[0115] 5.3、获取车辆热点活动区域卡口。根据出现次数大于均值80 %运一约束,表中序 号为1-15的卡口是车辆车辆"浙ANOM****"活动热点区域卡口。
[0116] S6.计算车辆两辆热点区域卡口点之间通行的概率:
[0117] 对车辆热点活动区域的卡口点做笛卡尔积,得到卡口对,并且根据S5中的概率,给 每一对卡口对进行赋值,并且选取正反向中较大的概率。
[011引 W车辆"浙ANOM****"为例,累计15个热点活动区域卡口点,做笛卡尔积之后可W 得到225个卡口对,然后给每一个卡口对赋值,例如在S5中P(3 1000300020402, 31000300023902)=51.4%,P(31000300023902,31000300020402) = 1.4%,那么Q (31000300020402,31000300023902) =Q(31000300023902,31000300020402) =51.4% ,Q 化i,Kj)表示卡口 Ki和Kj之间无向通行概率。
[0119] S7.根据S6所得卡口间概率,对所有卡口进行聚合。
[0120] 在本实施例中,卡口通过概率连接的方式进行聚合。
[0121] Step7.1.获取可W车辆号牌清单。
[0122] Step7.2.从号牌清单中取出一个号码,根据号码,获取该号牌热点活动区域卡口 化1,K2,K3 ? ? ? Kn),记为数组AO,并且根据车辆出现在该卡口的次数倒叙排列。
[0123] Step7.3.将AO中的第一个卡口 Kl添加到数组Al中,并且将Kl从AO中去除。
[0124] Step7.4.判断Kl与AO中每一个卡口之间的无向概率Q化l,Ki)是否大于阔值Ti,如 果是,将Ki添加到Al和空数组4_116*,并且将Ki从数组AO中去除。
[01巧]Step7.5 .从数组A_new中取出一个卡口 K j,判断K j与AO中每一个卡口之间的无向 概率Q化j,Ki)是否大于阔值Ti,如果是,将Ki添加到Al和空数组4_116*,并且将Ki从数组AO 中去除,将K j从数组A_new中去掉。
[01 %] Step7.6.重复 Step7.5,直到 A_new 为空。
[0127] Step7.7.增加数组Ai,重复步骤Step7.3-7.6。
[012 引 Step7.8.重复 Step7.7,直到 AO 为空。
[01巧]Step7.9.重复Step7.2-7.8,直到号牌清单为空。
[0130]通过W上运算,可W获取所有车辆热点活动区域卡口点的聚合情况。
[0131 ] S8.根据卡口点的聚合情况,计算车辆套牌概率Z。
[0132] 如果所有卡口都分到Al组,也就是说车辆所有热点活动区域卡口都能够连接起 来,如图3所示,那么说明车辆经常活动的区域是处在一个连接程度比较紧密的地方,该车 辆套牌可能性较小。
[0133] 如果卡口比较均匀的分到Al组合A2组中,说明车辆热点活动区域能够明显的分成 两个社区,如图4所示,那么说明车辆活动在两个连接程度较低的区域,同时考虑到该车辆 有多次不正常的跳转行为,说明该车辆套牌可能性较高。
[0134] 如果卡口分布在多个组中,说明可能有多个车牌误识别成该辆车,分组越多,说明 该车辆的套牌可能性越小。
[0135] 在本实施例中,部分计算结果如下表11(按照行为异常次数排序):
[013 引
[0139] 表11
[0140] 本实施中,当嫌疑度Z大于等于1的时候,我们认为该车具有较高的套牌概率,我们 可W发现,在行为异常次数最多的前100辆车当中,仅有6辆车嫌疑度Z大于1,也就是把100 辆车的排查范围缩小到了 6辆车。
【主权项】
1. 一种基于车辆热点区域的概率聚合的套牌车检测方法,其特征在于:所述套牌车辆 检测方法包括以下步骤:51. 卡口数据的提取:获取卡口过车记录数据,保留需要的维度,包括卡口编号、卡口方 向、号牌号码、号牌种类,过车时间;52. 卡口数据的清洗;53. 计算卡口间流向概率,过程如下: 3.1、 根据行车轨迹,提取卡口向量:将卡口数据按照号牌号码,卡口过车时间进行排 序,得到每一辆车的行车轨迹,用所经过的卡口序列(K a,Kb,K。· L · Kn ·)表示,提取每一辆 行车轨迹中相邻的卡口对,形成卡口向量序列(Ka,Kb) · (ΚηΚ」)· I a,表示车辆经过的第a 个卡口,向量(Ka,Kb)表示车辆顺序经过两个卡口 1和&,且1和&在行车轨迹中相邻; 3.2、 计算卡口间流向概率:对卡口 Ki计数,得到Ki卡口流出车辆总和,用count (Ki)表 示。对向量(Ki,Kj)计数,得到卡口Ki到卡口Kj通行车辆总和,用cou nt(Ki,Kj)表示。卡口Ki 到卡口 Kj 的流向概率为Pij = count (Ki,Kj) /count (Ki);54. 计算行为异常车辆清单:根据S2中提取出来的每一辆车的卡口对,计算卡口对概 率,按照概率低于设定阈值h的次数,降序排列,根据需要选取前N行,作为行为异常车辆清 单,N根据实际需要选取;55. 计算车辆热点区域卡口点:热点活动区域卡口点指的是车辆经常被捕获的卡口,统 计车辆在每个卡口点出现的次数,如果大于设定的阈值M v,则认为该卡口是车辆的热点活 动区域卡口点;56. 计算车辆在两热点区域卡口点之间通行的概率:对每一辆车在S5中计算的热点卡 口做笛卡尔积,并且根据S2计算的概率,给每一对卡口进行赋值,并且选取正反向中较大的 概率;如果卡口Ki到卡口Kj的概率P(Ki,Kj)〈卡口Kj到卡口Ki的概率?(1(」,灯),那么将? (K j,Ki)赋值给卡口对(Ki,K j); S7 .根据S6所得卡口间概率,对所有卡口进行聚合,确保各个分组内部,对于任一卡口 对(I,心),存在一条路径从1到1,路径上所有相邻卡口对的概率均不小于设定阈值,各 个分组之间,对于任一卡口 Ki,其他组不存在卡口 Kj,满足P (Ki,Kj)大于设定的阈值Ti; S8.计算车辆套牌的概率,根据车辆卡口聚合情况计算车辆套牌概率Z,Z = N*i*s4,N表 示车辆热点卡口总数,i取决于分组数量L,如果L = 2,i = 1,如果L = 3,i = 1/2,否则i = 0; s 取决于分组中卡口的数量比,NAi表示每一组中卡口的数量;s=max(NAi,2)/max(Nai,1), max(NAi,l)表示数量最大的一个,max(NAi,2)表示数量第二大的。2. 如权利要求1所述的一种基于车辆热点区域的概率聚合的套牌车检测方法,其特征 在于:所述步骤S7中个,聚合过程如下: Step7.1.获取可以车辆号牌清单; Step7.2.从号牌清单中取出一个号码,根据号码,获取该号牌热点活动区域卡口(K1, K2,Κ3 · · · Kn),记为数组A0,并且根据车辆出现在该卡口的次数倒叙排列; Step7.3.将Α0中的第一个卡口 Κ1添加到数组Α1中,并且将Κ1从Α0中去除; Step7.4.判断K1与A0中每一个卡口之间的无向概率Q(Kl,Ki)是否大于阈值Ti,如果 是,将Ki添加到A1和空数,并且将Ki从数组A0中去除; Step7.5.从数组A_new中取出一个卡口Kj,判断Kj与A0中每一个卡口之间的无向概率Q (Kj,Ki)是否大于阈值Ti,如果是,将Ki添加到A1和空数组六_11 ew,并且将Ki从数组AO中去 除,将K j从数组A_new中去掉; Step7 · 6 ·重复 Step7 · 5,直到 A_new 为空; Step7 · 7 ·增加数组Ai,重复步骤Step7 · 3-7 · 6; Step7 · 8 ·重复 Step7 · 7,直到 A0 为空; Step7 · 9 ·重复Step7 · 2-7 · 8,直到号牌清单为空。3. 如权利要求1或2所述的一种基于车辆热点区域的概率聚合的套牌车检测方法,其特 征在于:所述步骤S2中,卡口数据的清洗过程如下: 2.1、 清洗重复记录; 2.2、 清洗脏数据,所述脏数据是指号牌号码不符合命名规则的记录; 2.3、 确定时间区间,清洗该区间内记录不齐全的卡口数据,这些情况包括卡口损坏和 断电导致卡口无法工作,或者网络中断和磁盘容量不足导致数据未能存储,清洗该卡口所 有数据。4. 如权利要求1或2所述的一种基于车辆热点区域的概率聚合的套牌车检测方法,其特 征在于:所述步骤S4中,阈值根据卡口号牌识别正确率F进行设定,对卡口1而言,的取 值应满足F〈= Σ jPij〈F-Ti,其中j满足PiATi,,卡口号牌识别正确率F= 1-(通过卡口的但是 号牌不在号牌库中的过车记录数)/(所有过车记录数),Ti表示卡口 Ki的阈值,Pij表示卡口 Pi 到其他卡口的概率。
【文档编号】G08G1/017GK106022296SQ201610380318
【公开日】2016年10月12日
【申请日】2016年6月1日
【发明人】蒋伶华, 李建元, 陈涛, 李丹, 温晓岳
【申请人】银江股份有限公司