本发明公开了一种面向区域道路交通安全分析和改善的区域边界事故聚合方法。
背景技术:
基于交通分析小区建立的事故预测模型是分析交通事故成因重要工具,并能为交通安全系统规划、设计和施行提供重要参考。而将区域离散的事故点聚合成区域累计事故频次,是事故建模的关键。而通常交通分析小区的边界是事故高发地段,这是由于一方面交通分析小区的划分通常以主干道为区域边界,这些地段本身暴露影响因子(如车流量、出行量)较高,而属于事故高发地段;另一方面,根据地理学第一定律,边界区域更容易受到周边多个区域解释变量的影响,因此有可能发生更多的交通事故。因此对这些边界事故的聚合将直接影响事故预测建模及随后的事故致因分析,这也既是所谓的边界效应。解决边界效应主要包含两个关键,其一是如何甄别一起交通事故是发生在区域边界还是区域内部,其二是如何将边界事故聚合到相关的交通分析小区。其中边界事故的聚合为当前突破边界效应关键,目前学者们主要采用了简单权重分配方案。主要包括等权分配,等权事故增益分配,基于暴露因子比权重分配等。然而这样简单的权重分配方案未能有效结合事故发生机理,从而可能影响事故预测建模。
技术实现要素:
为了解决目前对于边界效应采用简单权重分配导致未能有效结合事故发生机理的技术问题,本发明提供一种能够得到更加合理的拟合优度的在宏观交通安全分析视野下的边界事故聚合方法。为了实现上述技术目的,本发明的技术方案是,一种面向区域道路交通安全分析和改善的区域边界事故聚合方法,包括以下步骤,步骤一:建立区域层次的贝叶斯空间层级模型作为事故预测模型,区域层次是指将每个交通分析小区划分为与其他交通分析小区相邻的边界区域以及不相邻的中心区域,两个相邻的边界区域组成缓冲区域,对于交通分析小区i,即TransitAnalysisZone,简写为TAZi,其一段时间内的事故累计频次记为Yi,则Yi~Poisson(eiθi)其中,θi为事故风险因子,ei为风险暴露因子;同时对事故风险因子建模为:其中xi为交通分析小区i内的解释变量,α为截距参数,β为固定参数,δi表示无结构的随机效应,服从正态分布δi~N(0,1/τh),为空间随机效应,服从条件自回归先验即CAR先验,即其中τh表示δi的离散度,表示空间随机效应期望,τi表示空间随机效应离散度,ωij表示TAZi与TAZj的邻接关系,τc表示离散系数先验。步骤二:定义交通分析小区内的事故集合为Y,其中边界区域事故集合为Yb中心区域事故集合为Y\b,且满足下列关系:Y=Y\b∪Yb建立区域事故预测模型,以λ作为期望事故频次,基于参数λ的取值完成边界事故分配,定义H为事故预测模型的其它参数,则有:[{Yb}|{Y\b},λ,H][λ|Y,H][H|Y,λ]对指定交通分析小区i,总体事故频次Yi计算公式如下:其中{Y\b}i表示TAZi的中心区域事故频次,{Yb}q表示缓冲区域q的事故频次,Qi表示TAZi所有的相邻缓冲区域的集合,N表示TAZ数量,ljq表示TAZj是否与缓冲区域q相邻,基于公式(a1)~(a3)完成算法迭代,直至第k次迭代结果不再更新所述的方法,所述的每个交通分析小区的边界区域的宽度为d,两个相邻的边界区域组成缓冲区域的宽度为2d。所述的方法,所述的步骤二中,首先根据交通分析小区的边界区域的宽度,从相邻的两个交通分析小区中的缓冲区域所发生的事故中,划分分别属于这相邻的两个交通分析小区的边界区域事故集合Yb。所述的方法,所述的事故预测模型的其它参数H,包括截距参数α,固定参数β及模型残差系数。本发明的技术效果在于,提出了一种基于迭代的数据放大算法,能有效融入对区域事故发生机理的考量,实现对边界事故最合理的聚合。相比与传统的权重分配方案。本专利通过构建贝叶斯层级模型,有效整合了包括风险暴露因子(日车辆行驶里程),区域级的交通事故解释变量,空间结构等影响交通事故的因素,并将这些因素通过层级模型估计区域事故率平均期望,代表区域事故发生可能性。基于这个可能性完成的边界事故分配,聚合过程将比传统的无信息分配(等权分配)或单一信息分配(暴露因子比值分配)更加合理。下面结合附图对本发明作进一步说明。附图说明图1为边界区域邻接结构示意图。具体实施方式本发明设计的事故预测模型为区域层次的贝叶斯空间层级模型,对于交通分析小区i(i=1,2,…,N),即TransitAnalysisZone,简写为TAZi,其一段时间内的事故累计频次记为Yi,于是Yi服从泊松分布,即:Yi~Poisson(eiθi)(1)其中,θi为事故风险因子,ei为风险暴露因子;同时对事故风险因子建模为:其中xi为区域内的解释变量,β固定参数,δi表示无结构的随机效应,服从正态分布δi~N(0,1/τh),为空间随机效应,服从CAR先验,即其中τh表示δi的离散度;表示空间随机效应期望,τi表示空间随机效应离散度,ωij表示TAZi与TAZj的邻接关系,τc表示离散系数先验。边界区域事故聚合迭代放大算法如图1,所示,我们以两个相互邻接的交通分析小区为例(三个及以上相邻小区分析类似),阐释具体算法流程如下:定义交通分析小区内的事故集合为Y,其中区域边界事故集合为Y\b,内部事故集合为Y\b,且满足下列关系:Y=Y\b∪Yb(8)显然对于TAZA(或TAZB),总的事故频次YA(或YB)依赖于中心区域事故频次{Y\b}A(或{Y\b}B)及缓冲区域事故频次{Yb},通过设定合适的缓冲区域宽度d,即可以得到内部事故频次{Y\b}A(或{Y\b}B)。而从缓冲区域事故集合中划分得到{Yb}A和{Yb}B具体操作如下:假设缓冲区域的事故数据是缺失的,仅基于TAZ内部事故计数,可以建立TAZ事故预测模型,并估计期望事故频次λ。由于期望事故频次实际上即反映TAZ发生事故可能性的度量,于是可基于参数λ的取值完成边界事故分配。定义H为上述事故预测模型的其它参数,于是算法的核心操作可用三个公式表述:(a1)[{Yb}|{Y\b},λ,H],(a2)[λ|Y,H],(a3)[H|Y,λ]。公式(a1)表示基于参数λ,H以及指定TAZ内部事故频次{Y\b}完成该TAZ边界事故{Yb}的估计;公式(a2)表示基于TAZ整体事故频次Y及参数H,完成对参数λ的估计;公式(a3)则是基于Y和λ完成对H的估计。其中对指定TAZi,总体事故频次计算公式如下:其中{Y\b}i表示TAZi的内部区域事故频次,{Yb}q表示缓冲区域q的事故频次(Qi表示TAZi所有的相邻缓冲区域的集合),N表示TAZ数量,ljq表示TAZj是否与缓冲区域q相邻,基于公式(a1)~(a3)完成算法迭代,直至第k次迭代结果不再更新下面给出不同方法的比较对比:我们基于美国佛罗里达州希尔斯伯勒郡738个交通分析小区在2009年发生的交通事故统计数据为例,采用本专利算法与现有的分配算法,完成边界事故聚合,并构建事故预测模型,其结果如下表所示:表1不同边界事故聚合方法对比上表1中MAD表示模型平均绝对偏差,通常越小越好;MSPE表示模型平均误差平方和,通常越小越好。R2表示模型决定系数,越接近1越好。DIC表示偏差信息度,越小越好。通过对比表1中四种聚合方法构建的事故预测模型,可以发现,本专利所提出的数据迭代放大算法相比其他算法的拟合优度表现更好。这表明本专利所提出的边界事故数据聚合方法相比与其他算法,对于进一步探究事故发生机理将会产生更多帮助。