基于距离度量学习的交通警情等级预测方法
【技术领域】
[0001] 本发明属于智能交通领域,具体涉及一种城市交通警情等级预测方法。
【背景技术】
[0002] 随着经济的迅速发展,城市交通系统中机动车保有量的快速增长导致发生交通事 故、交通拥堵的概率大大增加,当前城市交通状态发布和诱导都是针对单个路段、局部区 域,主要面对道路上的机动车驾驶者,对于交通管理人员更希望获得宏观区域的交通警情 等级,对未来某个时间段内的区域警情等级进行有效的预测有助于交通管理部门优化警力 部署、制定相应的预案,缓解重点地区的交通压力。
[0003] 专利201410610003. 7采集包含工作日、非工作日且包含重大节假日交通流数据, 将相同连续时间段交通流数据重组为自然数,建立短时交通流数据库,将当前交通流重组 数据与短时交通流数据库中历史数据进行大小比对,截取相似样本空间,利用偏差最小的 两个样本进行预测,该方法仅侧重于考虑时间因素对交通流数据的影响,没有引入天气因 素且未揭示各个特征属性之间的内在联系;专利200510113396. 1通过观测交通流量和动 态,以及诸如一天中的时间和一周中的日子、假期、学校状况、诸如体育比赛等大型集会的 时间安排和性质、天气预报、交通事件报告、和建设与封路等其它环境数据,预测拥塞地点 并用于离线和实时的自动路线推荐和计划,该方法将交通系统抽象成一组随机变量来进行 关于交通流量和拥塞的预报,仅对交通参与者有效,不能对交通管理者提供决策支持。本专 利与上述专利有本质不同,数据来源方面综合考虑天气因素、时间因素、环境因素等对城市 交通警情等级的影响,并通过广义马氏度量学习方法提取各个特征属性的权值,充分揭示 各个属性对交通警情等级影响的重要程度,根据学习的特征属性权值对交通警情等级进行 预测。
【发明内容】
[0004] 为了克服已有交通警情判别方式的无预测功能、准确性较差的不足,本发明提供 了一种有效实现预测、准确性较好的基于距离度量学习的交通警情等级预测方法。
[0005] 本发明解决其技术问题所采用的技术方案是:
[0006] 一种基于距离度量学习的交通警情等级预测方法,包括以下步骤:
[0007] 步骤1 :多维数据整理和交通警情等级分类
[0008] 采集历史天气数据、历史重大活动数据、建设和封路环境数据与工作日、节假日和 历史交通警情数共同构成关于交通警情的多维历史数据库,当前时刻的交通流量和上一时 刻的流量密切相关,将连续的历史交通警情数据按照等时间段切分为η个片段作为训练样 本,每个训练样本片段包括天气属性、重大活动属性、环境因素属性、工作日和节假日属性, 根据交通管理部门提供的交通警情阈值对η个训练样本进行交通警情等级分类;
[0009] 步骤2 :距离度量学习提取分类后的交通警情样本所对应的多维特征属性权值
[0010] 根据步骤1得出η个已标记训练样本构成的一个样本空间,该样本空间中各个元 素之间的距离称为度量,其中距离是定义在向量空间中的一种函数,指两个元素在空间中 相隔的长度,也就是说可以将某个空间中的所有对象投影到一个新的度量空间中;选取η 个训练样本构成包含多维特征属性的样本空间X,其中X = (X1, x2, …,χη),xi对应第i 个样本代表的多维特征属性,式(1)是样本空间X中\和^_样本点间的马氏距离,其中矩 阵A是我们需要学习的距离度量矩阵,矩阵A中的每一行代表一个历史样本,每一列对应样 本中的一维特征属性
【主权项】
1. 一种基于距离度量学习的交通警情等级预测方法,其特征在于:所述预测方法包括 以下步骤: 步骤1 :多维数据整理和交通警情等级分类 采集历史天气数据、历史重大活动数据、建设和封路环境数据与工作日、节假日和历史 交通警情数共同构成关于交通警情的多维历史数据库,当前时刻的交通流量和上一时刻的 流量密切相关,将连续的历史交通警情数据按照等时间段切分为η个片段作为训练样本, 每个训练样本片段包括天气属性、重大活动属性、环境因素属性、工作日和节假日属性,根 据交通管理部门提供的交通警情阈值对η个训练样本进行交通警情等级分类; 步骤2 :距离度量学习提取分类后的交通警情样本所对应的多维特征属性权值 根据步骤1得出η个已标记训练样本构成的一个样本空间,该样本空间中各个元素之 间的距离称为度量,其中距离是定义在向量空间中的一种函数,指两个元素在空间中相隔 的长度,也就是说可以将某个空间中的所有对象投影到一个新的度量空间中;选取η个训 练样本构成包含多维特征属性的样本空间X,其中X = (Xl,x2, X3,…,xn),Xi对应第i个样 本代表的多维特征属性,式(1)是样本空间X中\和^_样本点间的马氏距离,其中矩阵A 是我们需要学习的距离度量矩阵,矩阵A中的每一行代表一个历史样本,每一列对应样本 中的一维特征属性
式(1)中的A是样本空间X的协方差矩阵,样本空间X中的每个样本均带有交通警情 等级标签,故在最小化相同警情等级S(S e X)中样本之间的马氏距离平方和的同时,约束 不同警情等级D(D e X)中样本之间的马氏距离和,马氏距离和大于预设阈值,目标函数模 型如式(2),式(3)所示:
其中,A多O表示A为半正定矩阵,由目标函数模型求取距离度量学习矩阵A的过程是 一个凸优化问题,采用牛顿法对上述凸优化问题进行求解,最终学习到的距离度量矩阵为 一个稀疏的对角阵; 步骤3 :带权值的欧氏距离寻找与当前特征属性最相似的K个历史交通警情 使用欧氏距离计算K近邻需首先对各个特征属性进行归一化,假定样本空间X中的样 本点X包含k维特征属性,样本点之间的近邻一般由欧氏距离来度量,设第i个样本点为 X, =(χΧ,- ,χ?),其中X;表示第i个样本第1个特征属性值,两个样本xJP Xj之间的欧氏 距离定义为公式(4):
给定一个待预测的交通警情样本X,,由标准欧氏距离可计算出样本Xq与历史样本空间 中最近邻的K个样本X1, X2, ···,Xk,样本之间的距离是根据样本的所有特征计算的,步骤2中 距离度量学习矩阵得出的权值对特征属性与交通警情等级之间的权重关系进行了量化,定 义含多维特征属性权值的交通警情相似度如公式(5),式中X q为待预测的交通警情样本,X h 属于X = (X1, x2, x3,…,xn)为η个历史交通警情数据中的一个样本,每个样本包含k维特 征属性,分母加上0.0 l是为了避免当蛘与W相等时出现分母为O的情况,
其中W1是第1个特征的权重,由步骤2中距离度量学习得到对角矩阵A,对角线上的 值即为特征属性权值,训练得到的权值根据特征属性一一对应,由公式(5)计算当前特征 属性与历史交通警情数据库中各个样本的相似度,相似度最大的前K个历史交通警情数据 X1, X2,…,1£作为当前交通警情等级预测的参考; 步骤4 :K近邻相似交通警情等级投票 X1, X2,…,Xk为步骤3得出的K个最相似历史交通警情样本,其中每一个样本X i所属的 类别均已知,统计K个最相似历史交通警情等级,将出现频率最高的类别作为交通警情等 级预测结果,K值是一个自定义的常数。
2.如权利要求1所述的一种基于距离度量学习的交通警情等级预测方法,其特征在 于:随机将历史交通警情数据分为两部分,一部分作为训练样本,一部分作为测试样本,训 练样本中含有交通警情等级类别标签,测试样本中去除交通警情等级类别标签,经步骤3 计算出前K个最相似的交通警情等级,取出现频率最高的警情等级与测试样本原有的警情 等级进行对比,交叉验证本方法的准确率,通过选取不同的K值,对每个K值做100次交叉 验证计算出平均准确率,选择准确率最大的K值作为交通警情等级预测的投票数。
【专利摘要】一种基于距离度量学习的交通警情等级预测方法,对已知天气数据、时间数据、环境数据等情况下的城市交通警情等级进行预测,将整理好的多维历史数据根据交警指挥部门要求进行分类,利用广义马氏距离度量方法对分类标记后的多维历史数据进行学习,则距离度量学习矩阵获得了各个特征属性对交通警情等级的权值,权值大的特征属性对分类贡献度大,根据带权值的欧氏距离计算当前的多维数据与历史数据的相似度,选择与当前数据最相似的K个历史数据进行警情等级投票,得票高的警情等级作为当前交通警情等级的预测结果。本发明有效实现预测、准确性较好。
【IPC分类】G06Q10-04, G06Q50-26, G06K9-62
【公开号】CN104834977
【申请号】CN201510250180
【发明人】王浩, 李建元, 陈涛, 顾超
【申请人】浙江银江研究院有限公司
【公开日】2015年8月12日
【申请日】2015年5月15日