本发明属于交通大数据的卡口数据信息识别领域,具体涉及车辆群行程时间异常值过滤系统及过滤方法,主要应用于城市路网下的车辆群行程时间异常值过滤。
背景技术:
1、随着智能交通系统的快速发展,交通监控系统也愈发成熟,利用视频检测技术和车牌识别技术采集到的交通卡口数据中包含着所有通过车辆的行程时间信息,如何从中提取出准确的车辆群行程时间是分析城市出行特征的关键之一。对研究城市车辆出行规律具有重要意义,可以为城市建设、管理和控制提供完整且准确的数据依据。
2、交通卡口数据具有采集手段成熟、附加成本低、数据精度高、应用范围广等优点,这些数据中隐含着许多交通信息,包括车辆出行行程时间等信息。通过卡口数据可以计算所有通过车辆的行程时间,但由于受到各种环境、设备以及车辆停车活动等因素的影响,行程时间数据中往往存在许多异常值,而现有的异常值过滤方法往往假设行程时间服从单峰正态分布,然后利用均值和标准差对行程时间异常值进行过滤。然而在城市道路上的车辆行程时间往往不服从正态分布,且由于停车活动较多,会出现较大的异常值,仅以均值和标准差进行过滤往往无法取得良好的过滤效果。因此需要一种方法对车辆群行程时间异常值进行有效过滤。
技术实现思路
1、本发明的目的是为了解决传统异常值过滤方法难以获得全面且准确的车辆群行程时间的问题,而提出一种车辆群行程时间异常值过滤系统及过滤方法。
2、一种车辆群行程时间异常值过滤系统包括:
3、交通卡口数据预处理模块、车辆群行程时间获取模块、统计时间窗确定模块、车辆群行程时间异常值过滤模块;
4、所述交通卡口数据预处理模块用于对交通卡口数据进行数据预处理,获得预处理后的交通卡口数据,将预处理后的交通卡口数据发送给车辆群行程时间获取模块;
5、所述交通卡口数据为城市交叉口处实时抓拍的通过车辆的数据,包含车辆的车牌号码、号牌种类、抓拍时间、抓拍地点;
6、所述号牌种类代表车辆类型;
7、所述抓拍时间代表车辆通过交叉口的时间;
8、所述抓拍地点代表交叉口的位置;
9、所述车辆群行程时间获取模块用于基于预处理后的交通卡口数据得到每辆车的出行链,然后提取出每辆车出行链中相邻交叉口间的时间差,将相邻交叉口间的时间差发送给车辆群行程时间异常值过滤模块;
10、所述统计时间窗确定模块用于根据交通卡口数据统计全天的流量时间分布,根据全天的流量时间分布特征设置统计时间窗,将统计时间窗发送给车辆群行程时间异常值过滤模块;
11、所述车辆群行程时间异常值过滤模块用于过滤车辆群行程时间异常值,得到所有时间窗的行程时间样本集。
12、一种车辆群行程时间异常值过滤系统的过滤方法具体过程为:
13、步骤一、利用交通卡口数据预处理模块对交通卡口数据进行数据预处理,获得预处理后的交通卡口数据;
14、所述交通卡口数据为城市交叉口处实时抓拍的通过车辆的数据,包含车辆的车牌号码、号牌种类、抓拍时间、抓拍地点;
15、所述号牌种类代表车辆类型;
16、所述抓拍时间代表车辆通过交叉口的时间;
17、所述抓拍地点代表交叉口的位置;
18、步骤二、利用车辆群行程时间获取模块对预处理后的交通卡口数据进行处理,得到每辆车的出行链,然后提取出每辆车出行链中相邻交叉口间的时间差;
19、步骤三、利用统计时间窗确定模块统计交通卡口数据全天的流量时间分布,根据全天的流量时间分布特征设置统计时间窗;
20、步骤四、利用车辆群行程时间异常值过滤模块过滤车辆群行程时间异常值,得到所有时间窗的行程时间样本集。
21、本发明的有益效果为:
22、本发明以大规模交通卡口数据为基础,针对现有传统异常值过滤方法或其他手段无法获取准确的车辆群行程时间的问题,提出了一种改进的车辆群行程时间异常值过滤方法。本发明首先对交通卡口数据进行预处理,计算出路段行程时间,然后根据流量的时间分布特征确定统计时间窗,进而采用基于统计的方法对行程时间异常值进行过滤,得到全面且准确的车辆群行程时间数据,为城市交通相关研究提供可靠的数据依据。
1.一种车辆群行程时间异常值过滤系统,其特征在于:所述系统包括:
2.基于权利要求1所述的一种车辆群行程时间异常值过滤系统的过滤方法,其特征在于:所述方法具体过程为:
3.根据权利要求2所述的一种车辆群行程时间异常值过滤系统的过滤方法,其特征在于:所述步骤一中利用交通卡口数据预处理模块对交通卡口数据进行数据预处理,获得预处理后的交通卡口数据;具体过程为:
4.根据权利要求3所述的一种车辆群行程时间异常值过滤系统的过滤方法,其特征在于:所述步骤二中利用车辆群行程时间获取模块对预处理后的交通卡口数据进行处理,得到每辆车的出行链,然后提取出每辆车出行链中相邻交叉口间的时间差;具体方法如下:
5.根据权利要求4所述的一种车辆群行程时间异常值过滤系统的过滤方法,其特征在于:所述步骤四中利用车辆群行程时间异常值过滤模块过滤车辆群行程时间异常值,得到所有时间窗的行程时间样本集;具体过程为:
6.根据权利要求5所述的一种车辆群行程时间异常值过滤系统的过滤方法,其特征在于:所述步骤四二中基于行程时间样本集中行程时间的对数、行程时间样本集对数的均值和行程时间样本集对数的标准差,过滤掉行程时间样本集对数的均值距2倍标准差以外的数据,得到更新后的行程时间样本集ttwi1;具体过程为:
7.根据权利要求6所述的一种车辆群行程时间异常值过滤系统的过滤方法,其特征在于:所述步骤四三中将ttwi1中的行程时间按照升序排列,计算行程时间中位值将ttwi1以中位值分为上、下两部分,分别记为ttwi1u,ttwi1d,这两部分中的行程时间样本数记为n;具体过程为:
8.根据权利要求7所述的一种车辆群行程时间异常值过滤系统的过滤方法,其特征在于:所述步骤四四中分别计算ttwi1u、ttwi1d与中位值的平均欧式距离dwi1u、dwi1d,以平均欧氏距离为条件过滤,得到进一步更新后的行程时间样本集ttwi2;具体过程为: