一种基于多维数据的交通异常点检测方法

文档序号:6715955阅读:214来源:国知局
一种基于多维数据的交通异常点检测方法
【专利摘要】本发明涉及一种基于多维数据的交通异常点检测方法,该方法对微波设备获取的每条路段连续一段时间内的流量、速度和车道占有率数据,先根据速度数据计算路段的历史拥堵概率,通过对比最近时间的交通状态指标值定义路段的正、负异常,再从负异常的路段中用基于密度的局部异常因子方法计算异常度,并结合正负异常因子计算加权异常度并排序。本发明方法采用多指标数据,考虑了样本空间数据分布不均匀的情况,通过结合交通数据本身特性,避免了基于密度的局部异常因子方法的局部有限性,能有效检测出道路异常点,帮助交管部门指挥道路交通,调节优化道路的使用效率,具有通用性强、可行性强、可靠性高、适用性强的特点。
【专利说明】一种基于多维数据的交通异常点检测方法

【技术领域】
[0001] 本发明涉及智能交通领域,尤其涉及一种基于多维数据的交通异常点检测方法。【背景技术】
[0002] 随着城市经济的快速发展,城市交通中机动车数量不断增加,如何有效调控交通 流量,优化道路的使用效率,疏导道路的交通状况,成为城市智能交通领域研究的重点。而 其中的一个关键技术就是对城市交通的异常进行检测,即通过一定的技术手段检测出城市 交通中出现异常的路段。异常点的检测是城市交通公共信息服务的主要内容,也是交通管 理部门部署警力、疏导道路交通的必要手段。交通异常点的检测一般是采用车流量数据进 行分析,但该做法没有考虑交通数据本身特性,会将正常数据检测为异常,如出现红灯的时 间不固定而导致的某时段某路段流量出现变化的情况。因此采用多指标数据检测交通道路 异常点来克服单个指标的片面性和较大误差。在异常点检测中,通过采用技术手段对多指 标数据进行分析计算,得出交通异常的路段,包括正异常和负异常,正异常指好的异常,即 交通状态相比以前变好了;负异常指坏的异常,即交通状态相比以前变坏了,负异常的路段 是交通管理部门重点关注的路段,因此本发明主要考虑负异常的情况。
[0003] 目前对交通异常点检测的研究较少,一般只是单纯的拥堵检测。异常点检测可采 用离群点检测的方法,主要有基于模型的方法,基于邻近度的方法,基于聚类的方法以及基 于密度的方法。基于模型的方法要求事先知道数据服从什么分布,对多维数据的检测性较 差;基于邻近度的方法不适用于交通大数据集,对参数选择较敏感,且无法满足交通数据分 布不均匀的需求;基于聚类的方法其检测结果与簇类个数的选取有关,会出现误判现象,即 使是不需预先选择簇类个数的DBSCAN方法对于簇的边界样本同样会出现误判,且不能较 好反映多维数据;基于密度的方法能有效适用于分布不均匀的多维交通数据,且在交通异 常点检测中对参数的选择不敏感。为了定量给出交通异常点,设计一种基于多维数据的交 通异常点检测方法是十分有必要的。


【发明内容】

[0004] 本发明为克服上述的不足之处,目的在于提供一种基于多维数据的交通异常点检 测方法,该方法对微波设备获取的每条路段连续一段时间内的流量、速度和车道占有率数 据,先根据速度数据计算路段的历史拥堵概率,通过对比最近时间的交通状态指标值定义 路段的正、负异常,再从负异常的路段中用基于密度的局部异常因子方法计算异常度,并结 合正负异常因子计算加权异常度。本发明方法采用多指标数据,考虑了样本空间数据分布 不均匀的情况,通过结合交通数据本身特性,避免了基于密度的局部异常因子方法的局部 有限性,能有效检测出道路异常点,帮助交管部门指挥道路交通,调节优化道路的使用效 率。
[0005] 本发明是通过以下技术方案达到上述目的:一种基于多维数据的交通异常点检测 方法,包括如下步骤:
[0006] (1)采集微波监控路段的交通特征数据;
[0007] (2)计算每条路段的历史拥堵概率;
[0008] (3)根据每条路段的交通特征数据来判断并定义路段的正负异常;
[0009] (4)采用基于密度的局部离群因子算法计算异常度;
[0010] (5)通过步骤(2)与步骤(4)得到的结果计算加权异常度;
[0011] (6)对步骤(5)得到的结果进行排序,得到前T个加权异常度最大的路段,T为预 先设置的阈值;
[0012] (7)输出前T个加权异常度最大的路段。
[0013] 作为优选,所述步骤(1)所述的交通特征数据包括微波监测路段的车流量、车辆 速度、车道占有率三类数据。
[0014] 作为优选,所述步骤(2)计算每条路段的历史拥堵概率是以车辆速度数据为对 象,计算速度小于V的数据占有率;历史拥堵概率的计算式子如下所示:
[0015]

【权利要求】
1. 一种基于多维数据的交通异常点检测方法,其特征在于包括如下步骤: (1) 采集微波监控路段的交通特征数据; (2) 计算每条路段的历史拥堵概率; (3) 根据每条路段的交通特征数据来判断并定义路段的正负异常; (4) 采用基于密度的局部离群因子算法计算异常度; (5) 通过步骤(2)与步骤(4)得到的结果计算加权异常度; (6) 对步骤(5)得到的结果进行排序,得到前T个加权异常度最大的路段,T为预先设 置的阈值; (7) 输出前T个加权异常度最大的路段。
2. 根据权利要求1所述的一种基于多维数据的交通异常点检测方法,其特征在于:所 述步骤(1)所述的交通特征数据包括微波监测路段的车流量、车辆速度、车道占有率三类 数据。
3. 根据权利要求1或2所述的一种基于多维数据的交通异常点检测方法,其特征在于: 所述步骤(2)计算每条路段的历史拥堵概率是以车辆速度数据为对象,计算速度小于V的 数据占有率;历史拥堵概率的计算式子如下所示:
其中,P(i)为第i条路段的历史拥堵概率,v(i)为第i条路段的微波速度数据,sum为 求个数函数。
4. 根据权利要求1或2所述的一种基于多维数据的交通异常点检测方法,其特征在于: 所述步骤(3)判断并定义路段的正负异常的规则为若交通状态为畅通,则正负异常因子为 flag= 0-p;若交通状态为非畅通,则正负异常因子为flag= 1-p;flag>O为负异常, flag彡0为正异常。
5. 根据权利要求1所述的一种基于多维数据的交通异常点检测方法,其特征在于:所 述步骤(4)计算异常度的基于密度的局部离群因子算法包括如下步骤: 1) 对输入的m*n数据D计算D中所有对象的K距离邻域,其中m为数据对象的个数,n 为维度; 2) 计算对象p与其K距离邻域对象的可达距离,其中可达距离是该对象的K距离与该 对象和对象P的距离之间的较大值: reach_dist_k(p,〇) =max{K_distance(o),dist(p,o)}; 3) 计算对象p的局部可达密度: lrd_k(p) = |N_k(p)I/E〇eN-k(p)reach_dist_k(p,〇) 其中局部可达密度是对象的K距离邻域内所有对象的可达距离之和与K距离邻域内的 对象个数之比的倒数; 4) 计算对象p的局部离群因子:
5) 重复步骤1)至4),求出所有输入数据的局部离群因子,若有r条路段,每条路段有 m,个数据对象,则可得到!个m,维的LOF序列,LOF值就是所求的异常度。
6. 根据权利要求5所述的一种基于多维数据的交通异常点检测方法,其特征在于:所 述步骤1)计算D中对象的K距离邻域的方法如下: a) 采用欧式距离或曼哈顿距离,数据D的距离矩阵为dist:m*m的对称矩阵,计算每两 个对象间的距离; b) 对每个对象与其他对象的距离进行排序,第K个最小距离即为K距离[distance; c) 得到每个对象的K距离邻域: N_k(p) ={pIdist(p,q) ^K_distance(p)} 其中每个对象的K距离邻域即为与其的距离不大于其K距离的对象的集合。
7. 根据权利要求1所述的一种基于多维数据的交通异常点检测方法,其特征在于:所 述步骤(5)计算加权异常度是以负异常路段的LOF异常度乘以代表历史拥堵概率的正负异 常因子flag得到路段的加权异常度,计算式子如下: WLOF(i) =L0F(i)lastXflag(i) 其中,LOF(i)last是第i条负异常路段的最后一个LOF值,flag(i)是第i条路段的负 异常因子,WLOF(i)是第i条路段的加权异常度。
8. 根据权利要求3所述的一种基于多维数据的交通异常点检测方法,其特征在于:所 述的速度V为0km/h-20km/h中的任意一个速度值。
9. 根据权利要求1所述的一种基于多维数据的交通异常点检测方法,其特征在于:所 述的阈值T设置为5。
【文档编号】G08G1/01GK104504901SQ201410837207
【公开日】2015年4月8日 申请日期:2014年12月29日 优先权日:2014年12月29日
【发明者】李丹, 李建元, 王浩, 张麒, 顾超 申请人:浙江银江研究院有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1