具有在线优化能力的高速公路交通事件持续时间预测方法
【专利摘要】本发明公开了一种具有在线优化能力的高速公路交通事件持续时间预测方法,本发明选择三种具有更新能力的单体预测模型实现融合预测,通过动态分析各单体预测模型的误差,利用误差反比例法来动态分配各自的权值;当获取一定的新交通事件后,对各单体预测模型及其参数进行修正优化,并对比分析修正前后的模型优劣,选择更优的模型参与融合预测。待又获得一定新的交通事件后,再对模型进行优化处理,并对比择优使用。在优化过程中,若有新的交通事件需要预测时,则沿用原模型实施预测,待优化完成后择优使用。可使得每次预测时预测模型不必存储和检索大量数据,也可保障预测的时效性。提高高速公路交通事件持续时间的预测精度,提高公路网运行效率。
【专利说明】具有在线优化能力的高速公路交通事件持续时间预测方法
【技术领域】
[0001] 本发明涉及交通运行状态分析领域,特别涉及一种高速公路交通事件持续时间在 线融合预测技术。
【背景技术】
[0002] 交通拥堵已经成为世界上很多国家面临的主要交通问题之一,交通事件(如交通 事故、车辆抛锚、天气状况等)是造成高速公路交通拥堵的主要原因之一。近年来随着我国 社会和经济的快速发展、汽车工业的迅速扩张,城市化进程逐步加快,我国机动车拥有量猛 增,交通需求迅速增长。随着交通流量的增加,车速的加快、危险品运输种类的增加等,高速 公路交通拥挤、交通事故等频频发生,由交通事件造成的交通堵塞、交通延误及二次事故的 发生也必然上升,造成严重的人员伤亡和财产损失。此外,公路的安全和畅通一直是国家主 干公路网交通管理中的两大重心,而交通突发事件情况下的应急处置管理,则是非常态交 通管理的核心。若能够及时获得高速路网上的交通信息、准确地掌握路网的交通拥挤状态, 将有助于道路交通管理人员充分利用交通系统的时空资源,确定最佳的紧急救援方案、交 通管控措施以和安全隐患排除对策,对道路的交通流进行管理和引导,缓解交通拥挤,从而 有效地减少交通延误、减少交通运行风险、提高交通事件管理的水平。为此,对交通事故持 续时间实施有效的预测,对于事件现场状况和未来走势的理解和预测、应急资源需求和资 源调度、应急预案生成和交通组织管理决策优化等方面,具有重要的意义。
[0003] 在交通事件持续时间预测方面,当前国内外对此研究的预测方法主要可以分为两 大块:一类是基于统计分析的模型,主要包括基于概率分布的预测方法、基于条件概率的 预测方法、回归分析模型、时间序列模型等;一类是不考虑分布特点的预测模型,主要包括 模糊逻辑模型、决策树预测模型、非参数回归模型等。各种方法都具有一定的优点,但也存 在局限性。交通事件是随机事件,它不仅受道路交通系统中各要素的制约,还受到社会、自 然等多种偶然因素的影响(如天气、事故类型、到场时间、占用车道数、涉及车辆数、伤亡人 数、救援车辆数等随机因素),而当前单一的交通事件持续时间预测模型,均不能在不同时 亥IJ、不同情况下保持绝对较好的预测精度,并且,不同的预测模型各有其优点和缺点,相互 间并不排斥,而是相互联系、相互补充。为此,可以通过融合不同预测模型,取长补短,以提 高预测精度。对于融合预测方法,其关键的一个方面是对各单体预测模型权值的动态确定, 权值确定的合理程度直接决定着预测精度的高低。
[0004] 清华大学的李瑞敏和赵小强基于多元回归模型、决策树模型(CHAID和CART树的 决策树模型)、离散选择模型(多元Logit模型、顺序Probit模型),建立了层析分析综合 预测方法。通过比较不同预测模型的误差,用层次分析方法求取各模型的权值,进而对各单 体预测模型的预测结果加权叠加以实现融合预测。结果表明层次分析综合模型提高了预测 精度。采用多个单体预测模型实施融合预测更具有效。
[0005] 随着时间推移,道路行车环境的变化或改善以及运管部门对交通事件管控能力的 提升等,交通事件特性会发生变化,未来影响交通事件的相关显著性因素将会与当前和历 史事件有所区别,并且同一类型事件的持续时间也将发生变化。而当前国内外已提出的单 体预测模型、融合预测模型使用的是静态和离线的算法,无法对模型中的参数值和内部结 构进行在线调整,这将导致预测模型预测精度的下降。
【发明内容】
[0006] 有鉴于此,本发明所要解决的技术问题是提供一种具有在线优化能力的高速公路 交通事件持续时间预测方法。
[0007] 本发明的目的是这样实现的:
[0008] 本发明提供的具有在线优化能力的高速公路交通事件持续时间预测方法,包括以 下步骤:
[0009] 步骤1 :从事件数据库中读取当前待预测交通事件的属性信息,并判别当前待预 测交通事件所属的事件类型;
[0010] 步骤2 :基于当前待预测交通事件的信息,利用各单体预测模型对当前待预测交 通事件的持续时间分别进行单独预测,获得各单体预测模型的预测结果;
[0011] 步骤3 :将各单体预测模型实施融合预测;根据误差反比例法的加权叠加融合策 略进行预测结果融合生成融合预测结果;
[0012] 步骤4 :将单体预测模型各自预测结果及融合预测结果存储于事件数据库中,同 时存储交通事件信息,并在事件数据库中做预测结果标识以区分不同模型的预测结果;做 事件标识以区分不同的交通事件;
[0013] 步骤5 :完成当前待预测交通事件持续时间预测后,获取交通事件的实际持续时 间,同时计算各单体预测模型对当前交通事件的预测误差,存于事件数据库中,并与当前事 件及其预测结果匹配;若当前事件持续时间在规定的一定时间内一直被记录为空或为〇的 异常情况,则交通事件不做处理,直接转至步骤10 ;
[0014] 步骤6 :该类交通事件新增计数值自增1 ;
[0015] 步骤7 :对当前待预测交通事件和历史交通事件持续时间数据进行处理,获取当 前待预测交通事件的实际持续时间和历史交通事件持续时间的均值,对该类交通事件的持 续时间参数估计值进行修正;
[0016] 步骤8 :根据交通事件的类型,在事件数据库中找寻同类型的事件,并获取各历史 交通事件的信息,计算各单体预测模型对该类各历史交通事件持续时间的预测误差e/ ;
[0017] 步骤9 :利用各单体预测模型预测误差求取各模型的融合权重;求取各单体预测 模型对该类型交通事件的预测误差之和及其平均值,获得各单体预测模型的预测误差值; 并利用误差反比例法求取各单体预测模型的融合权重;
[0018] 步骤10 :判断该类型交通事件是否大于预测次数阈值n,如果否,则判断有无新的 交通事件需要预测,如果是,则返回至步骤1 ;
[0019] 步骤11 :将新增的n起交通事件与历史交通事件进行综合分析,对各单体预测模 型的参数进行优化;
[0020] 步骤12 :判断模型或参数是否优化完成,若优化完成,则转至步骤13 ;否则判断当 前是否有新的交通事件需要预测其持续时间,若有,则返回步骤1,并利用原模型实施预测, 若无,则继续判断模型或参数是否优化完成;
[0021] 步骤13 :将重新标定参数或重新修正后的各单体预测模型与原单体预测模型作 对比分析;在事件数据库中,随机选择各类事件若干,利用各单体预测模型的新旧模型分别 对不同的交通事件持续时间进行预测,并统计各事件预测的精度;针对某一类交通事件,若 新模型的预测精度优于原模型,则采用新模型实施下次预测,同时,存储各自预测结果及误 差;否则,沿用原模型实施下次预测;
[0022] 步骤14 :利用择优后的模型对未来交通事件的持续时间实施预测,若有新的交通 事件需要预测其持续时间,则返回步骤1。
[0023] 进一步,所述步骤3中的融合预测采用误差反比例法的加权叠加融合策略进行, 具体过程如下:
[0024] S31 :读取三种单体预测模型各自的预测结果;
[0025]S32 :读取三种单体预测模型各自的融合权重;
[0026] S33 :利用融合权重对各单体预测模型预测结果加权求和;
[0027] S34 :获得交通事件持续时间融合预测结果;
[0028] S35 :将预测结果存储于事件数据库中。
[0029] 进一步,所述步骤7中的持续时间参数估计值修正具体过程如下:
[0030] S71 :剔除明显非有效数据,所述明显非有效数据包括事件持续时间为0、事件本 身信息记录缺少数据项较多、信息重复录入的数据;
[0031]S72:计算持续时间数据的均值和三倍均方差3 0t,若离群值的偏差大于3 0t,则 判定为异常值并剔除;
[0032] S73 :求取经数据预处理后的事件持续时间数据的均值,并对模型中的相关持续时 间参数估计值进行修正。
[0033] 进一步,所述步骤9中的融合权重计算采用通过误差均值的倒数求取,具体过程 如下:
[0034] S911 :初始化各单体预测模型的融合权重均设置为0 ;
[0035] S912 :获得三种单体预测模型近k次的预测误差;
[0036] S913 :分别求取三种单体预测模型近k次的预测误差之和;
[0037] S914 :判断某单体预测模型误差和是否为0,如果是,则对该单体预测模型的误差 之和赋值为〇. 01 ;
[0038] S915 :如果否,则分别求取三种单体预测模型近k次误差的均值;
[0039]S916 :分别求取三种预测模型误差均值的倒数;
[0040]S917 :分别求取三种预测模型误差均值的倒数之和;
[0041]S918 :分别求取各模型误差均值的倒数占三模型误差均值倒数之和的比例;
[0042] S919 :获得三种单体预测模型各自的融合权重。
[0043] 进一步,所述步骤9中的融合权重计算采用通过误差和的倒数求取,具体过程如 下:
[0044] S921 :初始化各单体预测模型的融合权重均设置为0 ;
[0045]S922 :获得三种单体预测模型近k次的预测误差;
[0046] S923 :分别求取三种单体预测模型近k次的预测误差之和;
[0047] S924 :判断某单体预测模型误差和是否为0,如果是,则对该单体预测模型的误差 之和赋值为0. 01 ;
[0048] S925:如果否,则分别求取各模型误差之和的倒数占三模型误差和的倒数之和的 比例;
[0049] S926 :获得三种单体预测模型各自的融合权重。
[0050] 进一步,所述步骤11中的各单体预测模型参数优化具体过程如下:
[0051] S111 :数据预处理,以剔除异常数据,并将数据信息数字化、统一规范化处理;包 括如下两大部分:
[0052] 1)去噪处理,剔除异常数据,包括事件持续时间为0、持续时间过长、事件本身信 息记录缺少数据项和信息重复录入数据;去噪的方法采用对比同样特征事件的持续时间数 据,剔除出其中离群较远的点,并判断事件信息记录的完整性;实施步骤如下:
[0053] A.首先,剔除明显非有效数据,包括事件持续时间为0、事件本身信息记录缺少数 据项较多、信息重复录入等数据;
[0054] B.其次,计算持续时间数据的均值和三倍均方差3〇 t,即若离群值的偏差大于 3 〇t,则判定为异常值并剔除;
[0055] C.最后,将处理后的事件数据存储于有效事件数据表中;
[0056] 2)数字化处理,对文字的记录信息做数字化处理,将影响因素的定性描述进行定 量标定,并对其赋值;对于事件数据信息的数字化处理,将事件信息存储于历史事件数据库 时,同时实现对各种信息的数字化预处理,并将处理结果与事件信息匹配存储于历史事件 数据库中;
[0057]S112 :影响因素显著性分析;
[0058] 利用方差分析法对各因素进行显著性分析,取显著性水平为0. 01至0. 05,若分析 后获得的显著因素太少或模型需要包含较多变量时,则增大显著性水平,取值为〇. 1 ;
[0059] S113 :对各单体预测模型做参数优化或模型修正,具体如下:
[0060] 1)对于多元回归预测模型,在新增交通事件后,对各因素重新做显著性分析,重 新选择或补充模型变量,采用逐步回归方法按以下步骤来实现并重新标定各变量的回归系 数:
[0061] SA1 :完成数据处理及因素的显著性分析;
[0062] SA2 :对变量标准化;
[0063] SA3 :计算相关系数矩阵;
[0064]SA4 :确定F检验值(FI、F2);
[0065]SA5 :开始实施逐步计算;
[0066]SA6:变量引入处理:计算未引入变量的偏回归平方和Vi,比较大小并计算最大者 的F值;
[0067] SA7:判断检验值F>F1是否成立,如果否,则输出原始回归方程,并做效果检验、 完成并输出结果,结束处理;
[0068]SA8 :如果是,则已入选变量数增1 ;
[0069] SA9:做相关系数矩阵变换;
[0070]SA10:判断已入选变量数< 2是否成立,如果是,则返回步骤SA6;
[0071] SA11 :如果否,则进行变量剔除处理:计算已引入变量的偏回归平方和Vi,比较大 小并计算最小者的F值;
[0072] SA12 :判断F<F2是否成立,如果否,则返回步骤SA6 ;
[0073] SA13 :如果是,则已引入变量数减1 ;返回步骤SA9。
[0074] 2)对于贝叶斯决策树预测模型,模型优化具体过程如下:
[0075] SB1 :完成数据处理及因素的显著性分析;
[0076] SB2:判断当前各显著性因素是否已处理完成,如果是,则求取该类交通事件实际 持续时间的均值;并修正模型中的持续时间估计值;进入到步骤SB6 ;如果否,则判断是否 存在某一新的显著因素,进入下一步;
[0077] SB3:如果是,则根据受该因素影响的事件来修正模型结构及持续时间估计值,进 入到步骤SB6 ;
[0078] SB4 :如果否,判断是否存在多个影响显著的新因素,如果否,则进入到步骤SB6 ;
[0079] SB5 :如果是,则利用贝叶斯推理方法重构决策树结构;
[0080] SB6 :输出模型的优化结果;
[0081] SB7:结束分析处理。
[0082] 3)对于基于生存分析的预测模型,模型优化具体过程如下:
[0083] SCI:完成数据处理及因素的显著性分析;
[0084] SC2 :采用参数加速失效模型建立模型的基本形式;
[0085] SC3 :确定模型的变量组;
[0086] SC4 :利用极大似然估计法求解模型的参数值;
[0087] SC5 :求取模型对应的AIC值;
[0088] SC6 :判断全部处理完成是否成立,如果否,则返回步骤SC3 ;
[0089] SC7 :如果是,则找寻AIC值为最小的模型及对应的参数值;
[0090] SC8 :输出模型及对应的参数值。
[0091] 本发明的有益效果在于:本发明提供的一种具有在线优化能力的高速公路交通事 件持续时间预测方法,对模型进行在线优化更新,适应随时间变化的交通事件特性,可以提 高高速公路交通事件持续时间的预测精度,进而,有助于提升高速路网交通管控的智能化 水平,提高对公众的服务水平,促进公路网运行效率的提高。由于实施运行中,需要已建立 了历史事件数据库、交通事件持续时间预测事件数据库(统称为事件数据库),并设已存储 有各单体预测模型针对不同类型事件的预测结果及误差;此外,预测时需能够较及时地获 取交通事件的属性信息,并存储于事件数据库中,因为事发时能较及时地获取交通事件的 属性信息并存储于历史事件数据库中,可保障预测的有效实施。并且,对新发生事件的各属 性信息的记录均是按规定进行有效的记录,仅会存在极少的错误记录。
[0092] 在该融合预测方法中,将各单体预测模型融合权值的分析确定和模型优化及择优 处理置于预测完成后进行,可使得每次预测时预测模型不必存储和检索大量数据,也可保 障预测的时效性。
[0093] 本发明选择三种具有更新能力的单体预测模型实现融合预测,通过动态分析各单 体预测模型的误差,利用误差反比例法来动态分配各自的权值;当获取一定的新交通事件 后,对各单体预测模型及其参数进行修正优化,并针对不同类型的事件,对比分析修正前后 的模型优劣,通过精度对比的择优机制,选择更优的模型参与融合预测。待又获得一定新的 交通事件后,再对模型进行优化处理,并对比择优使用。在优化过程中,若有新的交通事件 需要预测时,则沿用原模型实施预测,待优化完成后择优使用。
【专利附图】
【附图说明】
[0094] 为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进 一步的详细描述,其中:
[0095] 图1示出了具有在线优化能力的高速公路交通事件持续时间预测方法的流程示 意图;
[0096] 图2示出了各单体预测模型融合预测流程图;
[0097] 图3示出了各单体预测模型融合权重通过误差均值的倒数求取来确定的流程图;
[0098] 图4示出了各单体预测模型融合权重通过误差和的倒数求取来确定的流程图; [0099] 图5示出了多元回归预测模型优化流程图;
[0100] 图6示出了贝叶斯决策树模型优化流程图;
[0101] 图7示出了贝叶斯决策树修正前示意图;
[0102] 图8示出了贝叶斯决策树修正后示意图;
[0103] 图9示出了基于生存(风险)分析的预测模型优化流程图。
【具体实施方式】
[0104] 以下将参照附图,对本发明的优选实施例进行详细的描述。应当理解,优选实施例 仅为了说明本发明,而不是为了限制本发明的保护范围。
[0105] 实施例1
[0106] 如附图所示,本发明提供的具有在线优化能力的高速公路交通事件持续时间预测 方法,包括以下步骤:
[0107] 步骤1 :从事件数据库中读取当前待预测交通事件的属性信息,并判别当前待预 测交通事件所属的事件类型;
[0108] 步骤2 :基于当前待预测交通事件的信息,利用各单体预测模型对当前待预测交 通事件的持续时间分别进行单独预测,获得各单体预测模型的预测结果;
[0109] 步骤3 :将各单体预测模型实施融合预测;根据误差反比例法的加权叠加融合策 略进行预测结果融合生成融合预测结果;
[0110] 步骤4 :将单体预测模型各自预测结果及融合预测结果存储于事件数据库中,同 时存储交通事件信息,并在事件数据库中做预测结果标识以区分不同模型的预测结果;做 事件标识以区分不同的交通事件;
[0111] 步骤5 :完成当前待预测交通事件持续时间预测后,获取交通事件的实际持续时 间,同时计算各单体预测模型对当前交通事件的预测误差,存于事件数据库中,并与当前事 件及其预测结果匹配;若当前事件持续时间在规定的一定时间内一直被记录为空或为〇的 异常情况,则交通事件不做处理,直接转至步骤10 ;
[0112] 步骤6 :该类交通事件新增计数值自增1 ;
[0113] 步骤7 :对当前待预测交通事件和历史交通事件持续时间数据进行处理,获取当 前待预测交通事件的实际持续时间和历史交通事件持续时间的均值,对该类交通事件的持 续时间参数估计值进行修正;
[0114] 步骤8 :根据交通事件的类型,在事件数据库中找寻同类型的事件,并获取各历史 交通事件的信息,计算各单体预测模型对该类各历史交通事件持续时间的预测误差< ;
[0115] 步骤9:利用各单体预测模型预测误差求取各模型的融合权重;求取各单体预测 模型对该类型交通事件的预测误差之和及其平均值,获得各单体预测模型的预测误差值; 并利用误差反比例法求取各单体预测模型的融合权重;
[0116] 步骤10 :判断该类型交通事件是否大于预测次数阈值n,如果否,则判断有无新的 交通事件需要预测,如果是,则返回至步骤1 ;
[0117] 步骤11 :将新增的n起交通事件与历史交通事件进行综合分析,对各单体预测模 型的参数进行优化;
[0118] 步骤12 :判断模型或参数是否优化完成,若优化完成,则转至步骤13 ;否则判断当 前是否有新的交通事件需要预测其持续时间,若有,则返回步骤1,并利用原模型实施预测, 若无,则继续判断模型或参数是否优化完成;
[0119] 步骤13 :将重新标定参数或重新修正后的各单体预测模型与原单体预测模型作 对比分析;在事件数据库中,随机选择各类事件若干,利用各单体预测模型的新旧模型分别 对不同的交通事件持续时间进行预测,并统计各事件预测的精度;针对某一类交通事件,若 新模型的预测精度优于原模型,则采用新模型实施下次预测,同时,存储各自预测结果及误 差;否则,沿用原模型实施下次预测;
[0120] 步骤14 :利用择优后的模型对未来交通事件的持续时间实施预测,若有新的交通 事件需要预测其持续时间,则返回步骤1。
[0121] 所述步骤3中的融合预测采用误差反比例法的加权叠加融合策略进行,具体过程 如下:
[0122] S31 :读取三种单体预测模型各自的预测结果;
[0123] S32 :读取三种单体预测模型各自的融合权重;
[0124] S33 :利用融合权重对各单体预测模型预测结果加权求和;
[0125]S34 :获得交通事件持续时间融合预测结果;
[0126] S35 :将预测结果存储于事件数据库中。
[0127] 所述步骤7中的持续时间参数估计值修正具体过程如下:
[0128] S71 :剔除明显非有效数据,所述明显非有效数据包括事件持续时间为0、事件本 身信息记录缺少数据项较多、信息重复录入的数据;
[0129] S72 :计算持续时间数据的均值和三倍均方差3 〇t,若离群值的偏差大于3 〇 t,则 判定为异常值并剔除;
[0130] S73 :求取经数据预处理后的事件持续时间数据的均值,并对模型中的相关持续时 间参数估计值进行修正。
[0131] 所述步骤9中的融合权重计算采用通过误差均值的倒数求取,具体过程如下:
[0132] S911 :初始化各单体预测模型的融合权重均设置为0 ;
[0133] S912 :获得三种单体预测模型近k次的预测误差;
[0134] S913 :分别求取三种单体预测模型近k次的预测误差之和;
[0135]S914 :判断某单体预测模型误差和是否为0,如果是,则对该单体预测模型的误差 之和赋值为0. 01 ;
[0136]S915:如果否,则分别求取三种单体预测模型近k次误差的均值;
[0137]S916:分别求取三种预测模型误差均值的倒数;
[0138]S917:分别求取三种预测模型误差均值的倒数之和;
[0139]S918:分别求取各模型误差均值的倒数占三模型误差均值倒数之和的比例;
[0140] S919 :获得三种单体预测模型各自的融合权重。
[0141] 所述步骤9中的融合权重计算采用通过误差和的倒数求取,具体过程如下:
[0142] S921:初始化各单体预测模型的融合权重均设置为0;
[0143] S922:获得三种单体预测模型近k次的预测误差;
[0144] S923:分别求取三种单体预测模型近k次的预测误差之和;
[0145] S924:判断某单体预测模型误差和是否为0,如果是,则对该单体预测模型的误差 之和赋值为〇. 01 ;
[0146]S925:如果否,则分别求取各模型误差之和的倒数占三模型误差和的倒数之和的 比例;
[0147]S926:获得三种单体预测模型各自的融合权重。
[0148] 所述步骤11中的各单体预测模型参数优化具体过程如下:
[0149]S111:数据预处理,以剔除异常数据,并将数据信息数字化、统一规范化处理;包 括如下两大部分:
[0150] 1)去噪处理,剔除异常数据,包括事件持续时间为0、持续时间过长、事件本身信 息记录缺少数据项和信息重复录入数据;去噪的方法采用对比同样特征事件的持续时间数 据,剔除出其中离群较远的点,并判断事件信息记录的完整性;实施步骤如下:
[0151] A.首先,剔除明显非有效数据,包括事件持续时间为0、事件本身信息记录缺少数 据项较多、信息重复录入等数据;
[0152]B.其次,计算持续时间数据的均值和三倍均方差3〇 t,即若离群值的偏差大于 3 〇t,则判定为异常值并剔除;
[0153]C.最后,将处理后的事件数据存储于有效事件数据表中;
[0154] 2)数字化处理,对文字的记录信息做数字化处理,将影响因素的定性描述进行定 量标定,并对其赋值;对于事件数据信息的数字化处理,将事件信息存储于历史事件数据库 时,同时实现对各种信息的数字化预处理,并将处理结果与事件信息匹配存储于历史事件 数据库中;
[0155]S112:影响因素显著性分析;
[0156] 利用方差分析法对各因素进行显著性分析,取显著性水平为0. 01至0. 05,若分析 后获得的显著因素太少或模型需要包含较多变量时,则增大显著性水平,取值为0. 1 ;
[0157]S113:对各单体预测模型做参数优化或模型修正,具体如下:
[0158]1)对于多元回归预测模型,在新增交通事件后,对各因素重新做显著性分析,重 新选择或补充模型变量,采用逐步回归方法按以下步骤来实现并重新标定各变量的回归系 数:
[0159]SA1:完成数据处理及因素的显著性分析;
[0160]SA2:对变量标准化;
[0161]SA3:计算相关系数矩阵;
[0162]SA4:确定F检验值(FI、F2);
[0163]SA5:开始实施逐步计算;
[0164]SA6:变量引入处理:计算未引入变量的偏回归平方和Vi,比较大小并计算最大者 的F值;
[0165]SA7:判断检验值F>F1是否成立,如果否,则输出原始回归方程,并做效果检验、 完成并输出结果,结束处理;
[0166]SA8:如果是,则已入选变量数增1;
[0167]SA9:做相关系数矩阵变换;
[0168]SA10:判断已入选变量数< 2是否成立,如果是,则返回步骤SA6;
[0169]SA11:如果否,则进行变量剔除处理:计算已引入变量的偏回归平方和Vi,比较大 小并计算最小者的F值;
[0170]SA12:判断F<F2是否成立,如果否,则返回步骤SA6;
[0171]SA13:如果是,则已引入变量数减1;返回步骤SA9。
[0172] 2)对于贝叶斯决策树预测模型,模型优化具体过程如下:
[0173]SB1:完成数据处理及因素的显著性分析;
[0174]SB2:判断当前各显著性因素是否已处理完成,如果是,则求取该类交通事件实际 持续时间的均值;并修正模型中的持续时间估计值;进入到步骤SB6;如果否,则判断是否 存在某一新的显著因素,进入下一步;
[0175]SB3:如果是,则根据受该因素影响的事件来修正模型结构及持续时间估计值,进 入到步骤SB6;
[0176]SB4:如果否,判断是否存在多个影响显著的新因素,如果否,则进入到步骤SB6;
[0177]SB5:如果是,则利用贝叶斯推理方法重构决策树结构;
[0178]SB6:输出模型的优化结果;
[0179]SB7:结束分析处理。
[0180] 3)对于基于生存分析的预测模型,模型优化具体过程如下:
[0181]SCI:完成数据处理及因素的显著性分析;
[0182]SC2:采用参数加速失效模型建立模型的基本形式;
[0183]SC3:确定模型的变量组;
[0184]SC4:利用极大似然估计法求解模型的参数值;
[0185]SC5:求取模型对应的AIC值;
[0186]SC6:判断全部处理完成是否成立,如果否,则返回步骤SC3;
[0187]SC7:如果是,则找寻AIC值为最小的模型及对应的参数值;
[0188]SC8:输出模型及对应的参数值。
[0189] 实施例2
[0190] 本实施例与实施例1的区别仅在于:
[0191] 本实施例提供的具有在线优化能力的高速公路交通事件持续时间预测方法,包括 如下步骤:
[0192] 步骤1 :从事件数据库中读取当前待预测交通事件的属性信息,并判别该交通事 件所属的事件类型;
[0193] 交通事件属性信息可从事件数据库读取外,也可以选择由事件信息输入模块直接 及时输入,但优选事件数据库读取方式。
[0194] 步骤2:基于当前交通事件的信息,利用各单体预测模型(多元回归预测模型、贝 叶斯决策树预测模型、基于生存(风险)分析的预测模型)对该事件的持续时间分别进行 单独预测,获得各单体预测模型的预测结果;
[0195] 步骤3:将各单体预测模型实施融合预测。根据误差反比例法的加权叠加融合策 略进行预测结果融合,融合预测机制参见图2 ;
[0196]在相同时间下,对同一交通事件,各单体预测模型的预测精度仍有高低之分,因 此,为了进一步提高预测精度,减少预测误差,需要对各单体预测模型进行融合预测。融合 的思想是充分考虑各个单体预测模型在历史时间里的预测精度以及模型本身的适用环境。 本发明采用误差反比例法确定权重,其原则是权重与误差大小成反比,即误差大的给予小 的权重,误差小的给予大的权重。通过对各单体预测模型的预测结果加权叠加实现融合预 测。
[0197] 步骤4:将单体预测模型各自预测结果及融合预测结果存储于历史交通事件持续 时间预测事件数据库中,同时存储事件信息,并在事件数据库中做预测结果标识以区分不 同模型的预测结果、做事件标识以区分不同的交通事件;
[0198] 步骤5:完成当前交通事件持续时间预测后,获取事件的实际持续时间,同时计算 各单体预测模型对当前事件的预测误差,存于事件数据库中,并与当前事件及其预测结果 匹配。若当前事件持续时间在规定的一定时间内(根据运管部门对业务的要求设定,如要 求事发后24小时或48小时内)一直被记录为空或为0等异常情况,则此事件可不做处理, 直接转至步骤10。
[0199] 步骤6 :该类事件新增计数值自增1,即有countE+l;
[0200] 步骤7 :对当前事件和历史事件持续时间数据进行处理,获取当前事件的实际持 续时间和历史交通事件持续时间的均值,以此对贝叶斯决策树模型中该类事件的持续时间 参数估计值进行修正;主要包括如下几部分:
[0201] (1)首先,剔除明显非有效数据,包括事件持续时间为0、事件本身信息记录缺少 数据项较多、信息重复录入等数据;
[0202] (2)其次,利用持续时间数据的均值和标准差做进一步处理。可利用均值和三倍均 方差(3 〇t)来处理,即若离群值的偏差大于3 〇t,则有理由将之判定为异常值并剔除;
[0203] (3)求取经数据预处理后的事件持续时间数据的均值,并以此对模型中的相关持 续时间参数估计值进行修正。
[0204] 随着时间推移,道路行车环境的变化或改善以及运管部门对交通事件管控能力的 提升,未来发生的交通事件的特性及其持续时间将会与历史交通事件有所区别,为此,需要 将新交通事件的实际持续时间和历史交通事件持续时间综合分析,求取该类事件持续时间 的均值,重新给出持续时间估计值,这样可将行车环境和管控能力的变化反映其中,以在一 定程度上减小贝叶斯决策树模型对未来交通事件持续时间的预测误差。
[0205] 步骤8:根据事件的类型,在历史交通事件持续时间预测事件数据库中找寻同类 型的事件,并获取各历史交通事件的信息,主要需包括各单体预测模型对该类各历史交通 事件持续时间的预测误差
[0206] 针对不同类型的交通事件,用同一种预测模型,其预测精度也存在差异,则需要根 据事件类型统计各单体预测模型的预测误差。
[0207] 步骤9 :利用各单体预测模型预测误差求取各模型的融合权重。求取各单体预测 模型对该类型交通事件的预测误差之和及其平均值,获得各单体预测模型的预测误差值。 并利用误差反比例法求取各单体预测模型的融合权重,为未来进行该类交通事件持续时间 融合预测提供各单体预测模型的权重值。各单体预测模型的融合权重确定方法流程参见图 3、图 4 ;
[0208] 步骤10 :判断该类型事件是否已预测n次(n> 1,即事件数据库中该类事件已新 增n起,有countE =n),如果预测次数未达到n次,便判断有无新的事件需要预测,若有则 返回至步骤1。
[0209] 步骤11 :将新增的n起交通事件与历史交通事件进行综合分析,对各单体预测模 型的参数进行优化或做模型修正;实施的主要步骤如下:
[0210] (1)数据预处理,以剔除异常数据,并将数据信息数字化、统一规范化处理;主要 包括如下两大部分:
[0211] 1)去噪处理。主要是剔除异常数据,如事件持续时间为0、持续时间特别长(如超 过24h)、事件本身信息记录缺少数据项较多、信息重复录入等。去噪的方法是通过对比同样 特征事件的持续时间数据,剔除出其中离群较远的点,并判断事件信息记录的完整性。此处 可利用持续时间数据的均值和标准差来剔除离群较远的点。实施步骤如下:
[0212] A.首先,剔除明显非有效数据,包括事件持续时间为0、事件本身信息记录缺少数 据项较多、信息重复录入等数据;
[0213] B.其次,利用持续时间数据的均值和标准差做进一步处理。可利用均值和三倍均 方差(3 〇t)来处理,即若离群值的偏差大于3 〇t,则有理由将之判定为异常值并剔除。
[0214] C.最后,将处理后的事件数据(包括事件的各属性信息)存储于"有效事件数据 表"中,以便为后续工作(如模型优化)做数据准备。
[0215] 2)数字化处理。主要是对文字的记录信息等做数字化处理,是将影响因素的定性 描述进行定量标定,并对其赋值。对于事件数据信息的数字化处理,可在将事件信息存储于 历史事件数据库时,同时实现对各种信息的数字化预处理,并将处理结果与事件信息匹配 存储于历史事件数据库中。
[0216] (2)影响因素显著性分析;
[0217] 在所有影响因素中,有的因素影响可能很大,而有的因素则影响很小。为了减少预 测成本,提高预测精度,需要从多种因素中找出主要影响因素,区别各因素的影响程度,此 夕卜,测定的变量越多,实施的难度就越大。可利用方差分析法对各因素进行显著性分析,一 般可取显著性水平为0. 01或0. 05,但若分析后获得的显著因素太少或模型需要包含较多 变量时,应增大显著性水平,如取值为〇. 1。
[0218] (3)对各单体预测模型做参数优化或模型修正。
[0219] 1)对于多元回归预测模型,其模型优化机制参见图5。
[0220] 由于影响事件持续时间因素繁多复杂,随机性强,因此,对历史事件所包含信息的 不断补充完善,考虑更多的影响因素,将会有助于提高预测精度。此外,初始模型建立时采 用的样本毕竟有限,对某些因素的显著性分析可能存在欠充分,则需要在新增事件后,对各 因素重新做显著性分析,重新选择或补充模型变量,并重新标定各变量的回归系数,此处采 用逐步回归方法实现。
[0221] 2)对于贝叶斯决策树预测模型,模型优化机制参见图6。
[0222] 随着时间的推移,道路行车环境的变化或改善以及运管部门对交通事件管控能力 的提升等,会影响交通事件持续时间的长短,需要将新增事件与历史事件综合分析,重新修 正预测时间参数估计值或决策树结构,此外,当有更多的事件数据可用于进行显著性分析 时,可以进一步对决策树进行完善和细化,有助于提高预测精度。
[0223] 3)对于基于生存(风险)分析的预测模型,模型优化机制参见图9。
[0224] 对于基于生存分析的预测模型,模型的参数估计值的时间稳定性需要大量的数据 来验证。因此,在获取新的事件后,需要将新增事件与历史事件综合分析,重新修正参数估 计值。在完成数据处理和因素显著性分析后,对模型进行参数优化或模型修正。
[0225] 步骤12 :判断模型或参数是否优化完成,若优化完成,则转至步骤13 ;否则判断当 前是否有新的交通事件需要预测其持续时间,若有,则返回步骤1,并利用原模型实施预测, 若无,则继续判断模型或参数是否优化完成。
[0226] 步骤13 :将重新标定参数或重新修正后的各单体预测模型与原单体预测模型作 对比分析。在事件数据库中,随机选择各类事件若干,利用各单体预测模型的新旧模型分别 对不同的交通事件持续时间进行预测,并统计各事件预测的精度。针对某一类交通事件,若 新模型的预测精度优于原模型,则采用新模型实施下次预测,同时,存储各自预测结果及误 差。否则,沿用原模型实施下次预测;
[0227] 由于利用新交通事件与历史交通事件综合分析,重新标定模型参数或做模型修正 后,新旧模型对各类交通事件持续时间的预测精度可能存在不一致性,需要对不同类型的 交通事件分别进行对比分析,以对新旧模型择优使用。
[0228] 步骤14 :利用择优后的模型对未来交通事件的持续时间实施预测,若有新的交通 事件需要预测其持续时间,则返回步骤1。
[0229] 实施例3
[0230] 本实施例与实施例2的区别仅在于:
[0231] 参见图1,具有在线优化能力的高速公路交通事件持续时间预测方法,包括如下步 骤:
[0232] 步骤1 :从事件数据库中读取当前待预测交通事件的属性信息,并判别该交通事 件所属的事件类型;
[0233] 交通事件属性信息可从事件数据库读取外,也可以选择由事件信息输入模块直接 及时输入,但优选数据库读取方式。
[0234] 步骤2 :基于当前交通事件的信息,利用各单体预测模型(多元回归预测模型、贝 叶斯决策树预测模型、基于生存(风险)分析的预测模型)对该事件的持续时间分别进行 单独预测,获得各单体预测模型的预测结果;
[0235] 步骤3 :将各单体预测模型实施融合预测。根据误差反比例法的加权叠加融合策 略进行预测结果融合,融合预测机制参见图2 ;
[0236] 在相同时间下,对同一交通事件,各单体预测模型的预测精度仍有高低之分,因 此,为了进一步提高预测精度,减少预测误差,需要对各单体预测模型进行融合预测。融合 的思想是充分考虑各个单体预测模型在历史时间里的预测精度以及模型本身的适用环境。 本发明采用误差反比例法确定权重,其原则是权重与误差大小成反比,即误差大的给予小 的权重,误差小的给予大的权重。通过对各单体预测模型的预测结果加权叠加实现融合预 测。
[0237] 对预测结果进行融合,计算公式为:
【权利要求】
1.具有在线优化能力的高速公路交通事件持续时间预测方法,其特征在于:包括以下 步骤: 步骤1:从事件数据库中读取当前待预测交通事件的属性信息,并判别当前待预测交 通事件所属的事件类型; 步骤2 :基于当前待预测交通事件的信息,利用各单体预测模型对当前待预测交通事 件的持续时间分别进行单独预测,获得各单体预测模型的预测结果; 步骤3 :将各单体预测模型实施融合预测;根据误差反比例法的加权叠加融合策略进 行预测结果融合生成融合预测结果; 步骤4 :将单体预测模型各自预测结果及融合预测结果存储于事件数据库中,同时存 储交通事件信息,并在事件数据库中做预测结果标识以区分不同模型的预测结果;做事件 标识以区分不同的交通事件; 步骤5 :完成当前待预测交通事件持续时间预测后,获取交通事件的实际持续时间,同 时计算各单体预测模型对当前交通事件的预测误差,存于事件数据库中,并与当前事件及 其预测结果匹配;若当前事件持续时间在规定的一定时间内一直被记录为空或为0的异常 情况,则交通事件不做处理,直接转至步骤10 ; 步骤6 :该类交通事件新增计数值自增1 ; 步骤7 :对当前待预测交通事件和历史交通事件持续时间数据进行处理,获取当前待 预测交通事件的实际持续时间和历史交通事件持续时间的均值,对该类交通事件的持续时 间参数估计值进行修正; 步骤8:根据交通事件的类型,在事件数据库中找寻同类型的事件,并获取各历史交通 事件的信息,计算各单体预测模型对该类各历史交通事件持续时间的预测误差; 步骤9 :利用各单体预测模型预测误差求取各模型的融合权重;求取各单体预测模型 对该类型交通事件的预测误差之和及其平均值,获得各单体预测模型的预测误差值;并利 用误差反比例法求取各单体预测模型的融合权重; 步骤10 :判断该类型交通事件是否大于预测次数阈值n,如果否,则判断有无新的交通 事件需要预测,如果是,则返回至步骤1 ; 步骤11 :将新增的n起交通事件与历史交通事件进行综合分析,对各单体预测模型的 参数进行优化; 步骤12 :判断模型或参数是否优化完成,若优化完成,则转至步骤13 ;否则判断当前 是否有新的交通事件需要预测其持续时间,若有,则返回步骤1,并利用原模型实施预测,若 无,则继续判断模型或参数是否优化完成; 步骤13 :将重新标定参数或重新修正后的各单体预测模型与原单体预测模型作对比 分析;在事件数据库中,随机选择各类事件若干,利用各单体预测模型的新旧模型分别对不 同的交通事件持续时间进行预测,并统计各事件预测的精度;针对某一类交通事件,若新模 型的预测精度优于原模型,则采用新模型实施下次预测,同时,存储各自预测结果及误差; 否则,沿用原模型实施下次预测; 步骤14 :利用择优后的模型对未来交通事件的持续时间实施预测,若有新的交通事件 需要预测其持续时间,则返回步骤1。
2. 根据权利要求1所述的具有在线优化能力的高速公路交通事件持续时间预测方法, 其特征在于:所述步骤3中的融合预测采用误差反比例法的加权叠加融合策略进行,具体 过程如下: 531 :读取三种单体预测模型各自的预测结果; 532 :读取三种单体预测模型各自的融合权重; 533 :利用融合权重对各单体预测模型预测结果加权求和; 534 :获得交通事件持续时间融合预测结果; 535 :将预测结果存储于事件数据库中。
3. 根据权利要求1所述的具有在线优化能力的高速公路交通事件持续时间预测方法, 其特征在于:所述步骤7中的持续时间参数估计值修正具体过程如下: 571 :剔除明显非有效数据,所述明显非有效数据包括事件持续时间为0、事件本身信 息记录缺少数据项较多、信息重复录入的数据; 572 :计算持续时间数据的均值和三倍均方差3 〇t,若离群值的偏差大于3 〇 t,则判定 为异常值并剔除; 573 :求取经数据预处理后的事件持续时间数据的均值,并对模型中的相关持续时间参 数估计值进行修正。
4. 根据权利要求1所述的具有在线优化能力的高速公路交通事件持续时间预测方法, 其特征在于:所述步骤9中的融合权重计算采用通过误差均值的倒数求取,具体过程如下: 5911 :初始化各单体预测模型的融合权重均设置为0 ; 5912 :获得三种单体预测模型近k次的预测误差; 5913 :分别求取三种单体预测模型近k次的预测误差之和; 5914 :判断某单体预测模型误差和是否为0,如果是,则对该单体预测模型的误差之和 赋值为〇. 01 ; 5915 :如果否,则分别求取三种单体预测模型近k次误差的均值; 5916 :分别求取三种预测模型误差均值的倒数; 5917 :分别求取三种预测模型误差均值的倒数之和; 5918 :分别求取各模型误差均值的倒数占三模型误差均值倒数之和的比例; 5919 :获得三种单体预测模型各自的融合权重。
5. 根据权利要求1所述的具有在线优化能力的高速公路交通事件持续时间预测方法, 其特征在于:所述步骤9中的融合权重计算采用通过误差和的倒数求取,具体过程如下: 5921 :初始化各单体预测模型的融合权重均设置为0 ; 5922 :获得三种单体预测模型近k次的预测误差; 5923 :分别求取三种单体预测模型近k次的预测误差之和; 5924 :判断某单体预测模型误差和是否为0,如果是,则对该单体预测模型的误差之和 赋值为〇. 01 ; 5925 :如果否,则分别求取各模型误差之和的倒数占三模型误差和的倒数之和的比 例; 5926 :获得三种单体预测模型各自的融合权重。
6. 根据权利要求1所述的具有在线优化能力的高速公路交通事件持续时间预测方法, 其特征在于:所述步骤11中的各单体预测模型参数优化具体过程如下: sill:数据预处理,以剔除异常数据,并将数据信息数字化、统一规范化处理;包括如 下两大部分: 1) 去噪处理,剔除异常数据,包括事件持续时间为0、持续时间过长、事件本身信息记 录缺少数据项和信息重复录入数据;去噪的方法采用对比同样特征事件的持续时间数据, 剔除出其中离群较远的点,并判断事件信息记录的完整性;实施步骤如下: A. 首先,剔除明显非有效数据,包括事件持续时间为0、事件本身信息记录缺少数据项 较多、信息重复录入等数据; B. 其次,计算持续时间数据的均值和三倍均方差3 〇t,即若离群值的偏差大于3 〇 t,则 判定为异常值并剔除; C. 最后,将处理后的事件数据存储于有效事件数据表中; 2) 数字化处理,对文字的记录信息做数字化处理,将影响因素的定性描述进行定量标 定,并对其赋值;对于事件数据信息的数字化处理,将事件信息存储于历史事件数据库时, 同时实现对各种信息的数字化预处理,并将处理结果与事件信息匹配存储于历史事件数据 库中; S112:影响因素显著性分析; 利用方差分析法对各因素进行显著性分析,取显著性水平为〇. 01至〇. 05,若分析后获 得的显著因素太少或模型需要包含较多变量时,则增大显著性水平,取值为0. 1 ; S113 :对各单体预测模型做参数优化或模型修正,具体如下: 1) 对于多元回归预测模型,在新增交通事件后,对各因素重新做显著性分析,重新选择 或补充模型变量,采用逐步回归方法按以下步骤来实现并重新标定各变量的回归系数: SA1 :完成数据处理及因素的显著性分析; SA2 :对变量标准化; SA3 :计算相关系数矩阵; SA4 :确定F检验值(F1、F2); SA5 :开始实施逐步计算; SA6 :变量引入处理:计算未引入变量的偏回归平方和Vi,比较大小并计算最大者的F值; SA7 :判断检验值F>F1是否成立,如果否,则输出原始回归方程,并做效果检验、完成 并输出结果,结束处理; SA8 :如果是,则已入选变量数增1 ; SA9 :做相关系数矩阵变换; SA10 :判断已入选变量数< 2是否成立,如果是,则返回步骤SA6 ; SA11 :如果否,则进行变量剔除处理:计算已引入变量的偏回归平方和Vi,比较大小并 计算最小者的F值; SA12 :判断F<F2是否成立,如果否,则返回步骤SA6 ; SA13 :如果是,则已引入变量数减1 ;返回步骤SA9 ; 2) 对于贝叶斯决策树预测模型,模型优化具体过程如下: SB1 :完成数据处理及因素的显著性分析; SB2 :判断当前各显著性因素是否已处理完成,如果是,则求取该类交通事件实际持续 时间的均值;并修正模型中的持续时间估计值;进入到步骤SB6 ;如果否,则判断是否存在 某一新的显著因素,进入下一步; SB3:如果是,则根据受该因素影响的事件来修正模型结构及持续时间估计值,进入到 步骤SB6 ; SB4 :如果否,判断是否存在多个影响显著的新因素,如果否,则进入到步骤SB6 ; SB5 :如果是,则利用贝叶斯推理方法重构决策树结构; SB6 :输出模型的优化结果; SB7 :结束分析处理; 3)对于基于生存分析的预测模型,模型优化具体过程如下: SCI:完成数据处理及因素的显著性分析; SC2 :采用参数加速失效模型建立模型的基本形式; SC3 :确定模型的变量组; SC4 :利用极大似然估计法求解模型的参数值; SC5 :求取模型对应的AIC值; SC6 :判断全部处理完成是否成立,如果否,则返回步骤SC3 ; SC7 :如果是,则找寻AIC值为最小的模型及对应的参数值; SC8 :输出模型及对应的参数值。
【文档编号】G08G1/00GK104408907SQ201410604118
【公开日】2015年3月11日 申请日期:2014年10月31日 优先权日:2014年10月31日
【发明者】孙棣华, 赵敏, 刘卫宁, 罗例东 申请人:重庆大学