一种高速公路车辆逃费行为数据分析方法

文档序号:8412546阅读:882来源:国知局
一种高速公路车辆逃费行为数据分析方法
【技术领域】
[0001] 本发明涉及高速公路信息化管理系统,特别是从高速公路运营所产生的大量计算 机数据中使用数据分析与挖掘手段找出车辆逃费行为数据分析方法。
【背景技术】
[0002] 现代高速公路管理中,逃费行为造成经济损失,同时破坏正常的运营秩序,带来安 全隐患。我国高速公路迅猛发展20余年来,车辆逃费的手段日趋多样,其中换卡逃费易于 操作且作案隐蔽,难于查处。传统管理模式下,查处换卡逃费车辆主要有以下手段:(1)现 场人工盘查,即收费站作业员依据经验盘查可疑车辆。(2)后台数据人工检视,使用SQL, EXCEL等手段定期(如每月)对营运数据进行人工抽查和判读,从而追缴逃款或建立预警名 单,辅助现场盘查。
[0003] 传统方法在当下高速公路管理信息化的建设中有着诸多局限。首先,凭借人员的 经验对可疑车辆现场盘查缺乏统一的标准,水平良莠不齐,精准度不高。其次,人工盘查与 后台数据检视往往耗时耗力,效率低下。再者,后台数据分析存在操作上的难度,如:出入口 车牌匹配率低,数据量非常庞大,预编卡发放导致的无车牌记录,佐证信息少。
[0004] 在车辆逃费规模日益扩大,而同时人工查处的手段和效率又无法有效治理的现状 与困局下,

【发明内容】

[0005] 发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于数 据分析与挖掘的查处高速公路换卡逃费行为的方法。
[0006] 为了解决上述技术问题,本发明公开了一种针对高速公路换卡逃费行为数据分析 与挖掘的方法,包括以下步骤:
[0007] 步骤1,采集所需数据,包括:用于逃费分析的收费记录数据以及用于抽取照片取 证分析结果的路段卡口数据和服务区卡口数据,收费记录数据记为数据集S,路段卡口数据 和服务区卡口数据记为数据集K ;收费记录数据包含各收费站出入车辆进收费站和出收费 站的时间戳、车辆出入收费站被拍照识别的车牌记录(即车牌图像),路段卡口数据包含路 段卡口(即安装在高速公路路面上对指定车道内机动车进行不间断自动检测和记录的装 置,例如设置休息区进出口以及一些特定位置进行超速抓拍的装置)对过往车辆抓拍后所 识别的车牌号及原始影像数据,服务区卡口数据包含服务区卡口对出入服务区车辆抓拍后 所识别的车牌号及原始影像数据;
[0008] 步骤2,对数据集S中的记录数据进行预处理,并检测是否符合要求;删除不符合 要求的记录数据,保留符合要求的记录数据;
[0009] 步骤3,计算步骤2数据集S保留的记录数据中车辆出入收费站被拍照识别的车牌 记录之间的Levenshitein距离,并追加到每条记录数据末尾,保存为新数据集S 1;
[0010] 步骤4,对数据集S1的全部记录数据按照不同的Levenshtein距离大小进行频度 分析,获得频度分布直方图;
[0011] 步骤5,基于步骤4的频度分布直方图,使用大津算法求出最大类间方差时的分割 阈值T ;
[0012] 步骤6,使用步骤5求出的阈值T,对步骤3获得的数据集51进行分割,将 Levenshtein距离大于阈值T的记录数据保存为数据集S2;
[0013] 步骤7,对数据集S2进行匹配查找,找到疑似换卡记录对,结果储存为数据集S 3;
[0014] 步骤8,对数据集S3中的记录按照各收费站出入车辆的车辆出入时间戳、车辆出入 收费站被拍照识别的车牌记录在数据集K中查找是否存在对应记录,若存在对应记录,则 提取对应路段卡口和服务区卡口的原始影像数据。
[0015] 至此疑似换卡逃费的车牌和行驶记录以及影像证据均已获得。
[0016] 本发明步骤2中的预处理方法是删除数据集S中不能被分析的记录数据,判断方 法是若数据集S中的车牌记录不全或缺失,即判定车牌是无效车牌并删除该条记录数据。
[0017] 本发明步骤2中的预处理方法包含删除数据集S中正常通行的车辆记录数据,判 断方法是若车辆出入收费站被拍照识别的车牌记录相符,则删除该条记录数据。
[0018] 本发明步骤7中所述对数据集S2进行的匹配查找是基于容错换卡模型进行的两 两匹配查找,方法如下:S i, 分别是数据集S2中第i条和第j条收费记录数据,收费记录数 据Si, 同时满足以下条件时,判定S 1与\为一对疑似换卡记录数据:
【主权项】
1. 一种高速公路车辆逃费行为数据分析方法,其特征在于,包括以下步骤: 步骤1,采集所需数据,包括:用于逃费分析的收费记录数据以及用于抽取照片取证分 析结果的路段卡口数据和服务区卡口数据,收费记录数据记为数据集S,路段卡口数据和服 务区卡口数据记为数据集K ;收费记录数据包含各收费站出入车辆进收费站和出收费站的 时间戳、车辆出入收费站被拍照识别的车牌记录,路段卡口数据包含路段卡口对过往车辆 抓拍后所识别的车牌号及原始影像数据,服务区卡口数据包含服务区卡口对出入服务区车 辆抓拍后所识别的车牌号及原始影像数据; 步骤2,对数据集S中的记录数据进行预处理,并检测是否符合要求;删除不符合要求 的记录数据,保留符合要求的记录数据; 步骤3,计算步骤2数据集S保留的记录数据中车辆出入收费站被拍照识别的车牌记录 之间的Levenshitein距离,并追加到每条记录数据末尾,保存为新数据集S1; 步骤4,对数据集S1的全部记录数据按照不同的Levenshtein距离大小进行频度分析, 获得频度分布直方图; 步骤5,基于步骤4的频度分布直方图,使用大津算法求出最大类间方差时的分割阈值 T ; 步骤6,使用步骤5求出的阈值T,对步骤3获得的数据集51进行分割,将Levenshtein 距离大于阈值T的记录数据保存为数据集S2; 步骤7,对数据集S2进行匹配查找,找到疑似换卡记录对,结果储存为数据集S 3; 步骤8,对数据集&中的记录按照各收费站出入车辆的车辆出入时间戳、车辆出入收费 站被拍照识别的车牌记录在数据集K中查找是否存在对应记录,若存在对应记录,则提取 对应路段卡口和服务区卡口的原始影像数据。
2. 根据权利要求1所述的一种高速公路车辆逃费行为数据分析方法,其特征在于,步 骤2中的预处理方法是删除数据集S中不能被分析的记录数据,判断方法是若数据集S中 的车牌记录不全或缺失,即判定车牌是无效车牌并删除该条记录数据。
3. 根据权利要求2所述的一种高速公路车辆逃费行为数据分析方法,其特征在于,步 骤2中的预处理方法包含删除数据集S中正常通行的车辆记录数据,判断方法是若车辆出 入收费站被拍照识别的车牌记录相符,则删除该条记录数据。
4. 根据权利要求1所述的一种高速公路车辆逃费行为数据分析方法,其特征在于,步 骤7中所述对数据集S2进行的匹配查找是基于容错换卡模型进行的两两匹配查找,方法如 下:Si, 别是数据集S 2中第i条和第j条收费记录数据,收费记录数据S i,同时满足 以下条件时,判定31与\为一对疑似换卡记录数据: ^KPen) ~ ^KPex)八 ^KPex) ~ ^KPenJ (1) sKtbn) ^ sKten) ^ Si(TEX) V sKten) ^ sKtbn) ^ Si(TEX) (2) 其中,Pen和P EX分别为车辆进收费站和出收费站的车牌号,T EN和T EX分别为车辆进收费 站和出收费站的时间戳,·和·%hi分别为数据集S2中第i条收费记录数据中车辆进 收费站和出收费站的车牌号,分别为第j条收费记录数据中车辆进收费站 和出收费站的车牌号,和分别为数据集S2中第i条收费记录数据中车辆进收 费站和出收费站的时间戳,^σ£)ν)和·%7·βχ)分别为数据集S2中第j条收费记录数据中车辆 进收费站和出收费站的时间戳。
5. 根据权利要求1所述的一种高速公路车辆逃费行为数据分析方法,其特征在于,步 骤7中所述对数据集S2进行的匹配查找是基于容错换卡模型进行的两两匹配查找,方法如 下:Si, 别是数据集s 2中第i条和第j条收费记录数据,收费记录数据s i,同时满足 以下条件时,判定31与\为一对疑似换卡记录数据: sKTen) ^ sKTen) ^ sJ(Tex) V SKTbn) < SKTen) < Si(jEx) (3) levisi(fEN),sj(fEX{)S AT Λ levisi'(j>EX、,Sj(尸 en))SAT (4) 其中,Pen和P EN分别为车辆进收费站和出收费站的车牌号,T EN和T EX分别为车辆进收费 站和出收费站的时间戳,和4(pMy分别为数据集S2中第i条收费记录数据中车辆进 收费站和出收费站的车牌号,分别为第j条收费记录数据中车辆进收费站 和出收费站的车牌号,分别为数据集S2中第i条收费记录数据中车辆进收 费站和出收费站的时间戳,分别为数据集S 2中第j条收费记录数据中车辆 进收费站和出收费站的时间戳为第i条收费记录数据中车辆进收费站 的车牌号Pen和第j条收费记录数据中车辆出收费站的车牌号P EX之间的Levenshtein距 离,为第i条收费记录数据中车辆出收费站的车牌号ρΕχ和第j条收费 记录数据中车辆进收费站的车牌号P en之间的Levenshtein距离,Δ T的值等于大津算法所 求出的阈值,若-(5,:(^>5/(^〇和^(^(^ >%^;)的值不大于八1',则51与5』为一对 疑似换卡记录。
6. 根据权利要求1所述的一种高速公路车辆逃费行为数据分析方法,其特征在于,步 骤7中所述对数据集&进行的匹配查找是基于改良换卡模型,对数据集S 2编制哈希表,以 哈希检索法对数据集S2进行匹配查找,方法如下:S i,分别是数据集S2中第i条和第j条 收费记录数据,收费记录数据Si, Sj茜足以下条件时,判定S 1与\为一对疑似换卡记录数 据: leviSi{PEN)>Sj(^Ex)) =〇Λ lev{SD,SKPEN{) S AT 或 (5) lev(^SiQ,EXySjQ,EN-)) - 0 Λ ?6ν{β?^ΡΕΝ')Α(βΕχ^) S AT 其中,Pen和Pb(分别为车辆进收费站和出收费站的车牌号,和·%分别为数据 集S2中第i条收费记录数据中车辆进收费站和出收费站的车牌号,和5/(Ρεχ)分别为 第j条收费记录数据中车辆进收费站和出收费站的车牌号,-〇>ΕΛ?),为第i条收 费记录数据中车辆进收费站的车牌号Pen和第j条收费记录数据中车辆出收费站的车牌号 Pex之间的Levenshtein距离,为第i条收费记录数据中车辆出收费站 的车牌号Pex和第j条收费记录数据中车辆进收费站的车牌号P EN之间的Levenshtein距 离,ΔΤ的值等于大津算法所求出的阈值T。
【专利摘要】本发明涉及一种高速公路车辆逃费行为数据分析方法,包括:步骤1,采集收费数据,记为数据集S,以及对应路段卡口和服务区卡口数据,记为数据集K;步骤2,预处理数据集S,保留符合要求的记录数据;步骤3,计算保留的记录数据中车辆出入收费站的车牌记录之间的Levenshitein距离,并追加到每条记录末尾作为新数据集S1;步骤4,对S1频度分析,获得频度分布直方图;步骤5,根据频度分布直方图求出最大类间方差时的分割阈值T;步骤6,将S1中Levenshtein距离大于T的记录数据保存为数据集S2;步骤7,在S2中查找疑似换卡记录对,结果保存为数据集S3;步骤8,在K中查找是否存在与S3中的记录数据相对应的记录。
【IPC分类】G06F17-30
【公开号】CN104731879
【申请号】CN201510102666
【发明人】齐家, 刘若泽, 冒兵, 卞加佳, 焦枫, 邱伟军
【申请人】江苏省邮电规划设计院有限责任公司
【公开日】2015年6月24日
【申请日】2015年3月9日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1