McMaster事件检测算法的一种自动寻参方法与流程

文档序号:13236492阅读:555来源:国知局
McMaster事件检测算法的一种自动寻参方法与流程

本发明属于交通状态自动检测领域,具体公开一种实现mcmaster事件检测算法的自动寻参方法,适用于高速公路及城市快速路交通拥堵类型的判别。



背景技术:

近年来,随着我国道路建设迅猛发展,公路网交通拥挤频频出现。为了满足实时监测道路交通状态这一需求,交通拥挤自动识别算法(automatictrafficcongestionidentification,aci)被广泛的引入到交通管理系统中,为交通管理带来了极大的便利。但是,在使用部分aci算法进行自动判别交通状态时,发现其只能判断是否发生拥堵,而不能判断拥堵的类型(即常发性拥堵和偶发性拥堵)。这给交通管理者带来极大的不便,因为不同拥堵类型发生的原因不同,所对应的交通管控措施也不同。

由mcmaster大学开发的mcmaster算法首次将常发性拥堵的检测列入检测范围,并与偶发性拥堵区分开来。mcmaster是一种基于突变理论的算法。它不仅能识别拥堵,而且能确定拥堵类型。该算法是基于以下前提:当交通从拥堵状态向非拥挤状态变化时,流量和密度变化平稳,而速度表现为突然的变化。通过分析大量历史数据,得到流量-占有率的关系,并通过与实测数据的比较,判断是否发生拥堵,并分辨具体发生的是常发性拥堵还是偶发性拥堵。

但是,在实际工程应用中,mcmaster算法的使用受到了限制,主要是因为mcmaster算法需要确定参数,通过该参数确定一条非拥挤区域的下限分界线(lowerboundofuncongesteddata,lud)。现阶段lud分界线的确定并没有科学的方法进行指导,只能通过人工观察并凭借经验反复调试而确定。而且,不同的路段的lud分界线一般不同,所以无法将在一条路段上人工确定的lud分界线直接用于另外一条路段上,所以人工确定方法的泛化能力较差。

因此,如何寻找到一种能够自动获取mcmaster参数的方法,降低参数选取时候的人为依赖,对于提升mcmaster算法的准确性和在不同路段下的可移植性有着重要的作用。



技术实现要素:

有鉴于此,本发明所要解决的技术问题是寻找到一种方法能够自动确定mcmaster事件检测算法参数以确定lud分界线,从而提升mcmaster算法的准确性和在不同路段下的可移植性。

为达到上述目的,本发明提供如下技术方案,一种mcmaster事件检测算法的一种自动寻参方法,包括以下步骤:s1在获取大量交通数据的前提下,对流量和占有率分别进行统计分析,确定交通流量和占有率的分布模型;s2采用最大似然会计法估计流量、占有率分布模型的参数;s3计算分位数确定流量-占有率转折点的大致区间;s4搜索转折区间内最佳转折点。

进一步,所述步骤s3包括以下子步骤:

s31求得标准正态分布的z分位数,获得标准正态分布的不同z分位数{z0.5,z0.55,z0.6,...,z0.85,z0.90,z0.95}的取值;

s32根据普通正态分布和标准正态分布的转换式计算非标准正态分布流量、占有率每个分位数所对应的流量和占有率原始值;

s33根据流量、占有率和流量-占有率散点图确定流量-占有率转折点的大致区间。

进一步,所述步骤s4包括以下子步骤:

s41在转折区域内任意选择初始点并构造局域;

s42在此区域内以粒子群群算法随机设置m个点并计算m个点的目标函数值以得到局域最优点;

s43局域最优点作为下一次迭代的方向,直到满足预定的精度要求或迭代次数即停止迭代。

进一步,所述步骤s4具体为:

(1)根据步骤s3确定的矩形区域,确定参数的搜索空间:并在搜索空间内任意选择起始点p=(oi,qi);

(2)设置优化目标函数fp如下:

其中:

(3)在搜索空间内随机设置n个起始中心点p(oi,qi),i=1,2,...,n,并设置梯度迭代次数s;

(4)以pi为中心,根据局域大小w,按下式计算局域的大小:

[p-w,p+w]

(5)设置粒子群优化参数:如精度f,随机点数量m,局域最大迭代次数n,惯性因子ω,粒子群个体最优权重系数c1,粒子群全局最优权重系数c2;

(6)在当前局域内随机产生m个点作为粒子;

(7)依据目标函数,计算每个粒子所表示mcmaster划分曲线的正确划分样本数

(8)更新每个粒子pi的位置和速度;

(9)判断每个粒子或是否超过迭代次数ni>n,若满足转(7),不满足则转(10);

(10)求得该局域内所有粒子的局域最优值pi_best;

(11)判断i>n,若不大于,则n个起始中心点每一个的最优点还没计算完成,转(4),否则转(12);

(12)比较每个局域最优点,得到整体全局最优点pglobal,对应得到该点的目标函数值fglobal;

(13)判断fglobal>f或梯度迭代次数s>s,若满足则结束,若不满足则转(14);

(14)计算每个局域最优点pi_best向整体最优点pglobal移动梯度,并更新每个局域最优点的位置,后转步骤(4)。

本发明的有益效果在于:

本发明通过一种能够自动获取mcmaster参数的方法,降低参数选取时候的人为依赖,对于提升mcmaster算法的准确性和在不同路段下的可移植性有着重要的作用。

附图说明

为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:

图1为某隧道一周流量分布图;

图2为某隧道一周占有率分布图;

图3为某隧道一周流量-占有率散点图;

图4为梯度方向示意图;

图5为步骤s4的算法流程图;

图6为本发明的算法流程图。

具体实施方式

下面将结合附图,对本发明的优选实施例进行详细的描述。

lud分界线之所以难以确定主要是受到以下方面的影响:①数据的不平衡性影响lud分界线的确立。由于采用真实道路中采集到的交通数据构建流量-占有率模板,故非拥堵点远远多于拥堵点。这样错判拥堵数据为非拥堵对准确率的影响不大,这往往会造成人为确立的lud分界线分类准确率已经很好的假象;②部分拥堵点和非拥堵点存在混杂的现象。由于真实交通流的复杂性,导致部分非拥堵数据和拥堵数据比较接近,使得在流量-占有率模板上两者的散点比较接近,从而人为划分lud分界线难以准确划分。

因此,能使mcmaster算法自动寻参从而确定lud分界线的方法的思路是从数据本身出发,找到分类准确率与参数之间的显示表达式,并优化使之最大。即将此问题转化为一个优化问题。

为了解决上述问题,本发明在获取大量交通数据(流量、占有率)的前提下,对交通流量和占有率分别进行统计分析,首先确定其分布模型。然后,基于此分布模型,利用最大似然估计,得到分布模型的参数点估计。并在此基础上,推算出不同z分位数的取值范围,从而得到流量和占有率的取值范围。根据流量和占有率的取值范围,可以在流量-占有率二维散点图中确定一矩形区域。最后,通过在此矩形区域搜索,得到使分类效果最佳的点,得到lud曲线,从而获取mcmaster参数。

具体包括以下步骤:

第一步:确定交通数据(流量、占有率)分布模型

(1)获取一周交通流量、占有率数据。

(2)对流量、占有率数据进行偏度检验。

设流量、占有率数据为随机变量x,则每一个流量、占有率的观测数据则为随机变量x的样本观测值{x1,x2,...,xi,...xn}。首先计算随机变量x的样本均值μ。样本均值μ的计算公式如下:

然后计算随机变量x的3阶标准矩(即偏度):

现有如下假设:

若计算出偏度则拒绝原假设h0而接受备择假设h1,即证明样本来自于非正态总体。若计算出偏度则接受原假设而h0拒绝备择假设h1。此时样本可能来自于正态分布总体,也可能来自双峰对称分布总体。

(3)作流量、占有率数据直方图

对流量数据,以流量大小作为横轴,以频数作为纵轴。将流量划分为[0,60),[60,90),[90,120),[120,150),[150,180),[180,210),[210,240)共7个组别,横轴标出每个组的端点。统计每个组别样本的频数,即可得流量直方图(如图1所示)。

对占有率数据,以占有率大小作为横轴,以频数作为纵轴。将占有率划分为[0,5),[5,10),[10,15),[15,20),[20,100)共5个组别,横轴标出每个组的端点。统计每个组别样本的频数,即可得占有率直方图(如图2所示)。

观察流量、占有率直方图可知,流量与占有率均为单峰分布,即证明样本满足正态分布。

第二步:最大似然估计法估计交通数据(流量、占有率)分布模型的参数。

由于流量、占有率都满足正态分布,且正态分布的概率密度函数如下:

因此需要计算正态分布两个关键参数:总体均值μ和总体方差σ2

使用最大似然估计法估计总体均值μ和总体方差σ2。将从车检器得到的每一组观测数据视为样本xi,则样本空间为{x1,x2,...,xi,...xn}。首先构造似然函数:

然后,对于似然函数左右两边同时取对数,得:

再分别对总体均值μ和总体方差σ2求偏导数,得:

将总体均值μ和总体方差σ2视为未知数,求上述方程组,得:

则总体均值μ和总体方差σ2分别可用最大似然估计代替。

第三步:计算分位数确定流量-占有率转折点的大致区间

如图3所示,流量-占有率存在先增大后减小的趋势,所以流量-占有率必然存在转折区域。由三相交通流理论可知,越过转折点之后的数据被认为是拥堵流。由于lud分界线表示最小非拥堵数据和拥堵数据之间的分界线,所以故lud分界线必然经过此转折区域。

(1)获取非标准正态分布分位数值。

首先,求得标准正态分布的z分位数,查询标准正态分布表,获得标准正态分布的不同z分位数{z0.5,z0.55,z0.6,...,z0.85,z0.90,z0.95}的取值。

然后,根据普通正态分布和标准正态分布的转换式:

可分别计算非标准正态分布流量、占有率每个分位数所对应的流量和占有率原始值。

(2)作流量-占有率散点图

获取一周流量、占有率,作流量-占有率散点图(如图3所示)。找到x轴和y轴不同分位数对应的原始值,并作过原始值点作平行于x轴和y轴的平行线。观察由这些平行线组成的矩形区域,选择包含转折区域最大的矩形区域。则此矩形区域四条边对应的点即为流量和占有率围成矩形转折区域的极值点。

第四步:搜索转折区间内最佳转折点

mcmaster算法原理是作出lud分界线以区分拥堵与非拥堵,常发性拥堵和偶发性拥堵。lud分界线常用一条直线表示,由于lud分界线过坐标轴原点,故lud分界线表达式为其中k1、k2为转折点区域斜率极值,ya1、ya2为转折点区域在y轴极值点。参数k和ya共同影响其分类效果。

如图3所示:参数k主要影响非拥堵区域和偶发性拥堵区域的划分,参数ya主要影响常发性拥堵和偶发性拥堵区域的划分。故参数k与参数ya共同影响分类准确率。

为了使得mcmaster算法分类效果最佳,需在转折区域内找到最佳转折点使得分类效果最佳。所以,这里将分类问题转化为参数优化问题。

关于参数优化问题已经有很多的解决方法,但这里的难点在于:mcmaster算法的性能(这里是分类正确率)与待选参数k、ya之间并无显式连续函数表达式,所以不能进行微分,故梯度下降法不能够直接使用。

这里将利用梯度下降法的思想,结合分类效果最佳,得到其目标函数。目标函数如下:

其中(qi,oi)表示第i个观测值的流量和占有率数据,ci代表第i个观测值的真实类标签(0代表非拥堵、1代表拥堵)。ya代表转折区域右边直线,ci'代表第i个观测值的真实类标签(0代表偶发性拥堵、1代表常发性拥堵)。

首先在转折区域内任意选择初始点并构造局域;然后,在此区域内以粒子群群算法随机设置m个点并计算m个点的目标函数值得到局域最优,并以此局域最优点作为下一次迭代的方向,也就是梯度方向进行迭代,直到满足预定的精度要求或迭代次数即停止迭代。该算法的具体过程如图4所示。

(1)根据第三步确定的矩形区域,确定参数的搜索空间:并在搜索空间内任意选择起始点p=(oi,qi)。

(2)设置优化目标函数fp如下:

其中:

(3)在搜索空间内随机设置n个起始中心点p(oi,qi),i=1,2,...,n,并设置梯度迭代次数s。

(4)以pi为中心,根据局域大小w,按下式计算局域的大小:

[p-w,p+w]

(5)设置粒子群优化参数:如精度f,随机点数量m,局域最大迭代次数n,惯性因子ω,粒子群个体最优权重系数c1,粒子群全局最优权重系数c2。

(6)在当前局域内随机产生m个点作为粒子。

(7)依据目标函数,计算每个粒子所表示mcmaster划分曲线的正确划分样本数

(8)更新每个粒子pi的位置和速度。粒子位置和速度更新公式如下:

xi(t+1)=xi(t)+vi(t+1)

vi(t+1)=vi(t)+c1*r*(pi_best(t)-xi(t))

+c2*r*(pg_best(t)-xi(t))

式中,xi(t)表示第t个迭代周期内粒子pi的位置,vi(t)表示第t个迭代周期内粒子pi的速度,c1和c2是取正值的加速常数,r为从0到1的随机数。截止于第t个迭代周期第i个粒子的历史最优值写作pi_best,而pg_best表示截止于第t个迭代周期所有粒子的全局最优值。

(9)判断每个粒子fpi>f或是否超过迭代次数ni>n,若满足转(7),不满足则转(10)。

(10)求得该局域内所有粒子的局域最优值pi_best。

(11)判断i>n,若不大于,则n个起始中心点每一个的最优点还没计算完成,转(4),否则转(12)。

(12)比较每个局域最优点,得到整体全局最优点pglobal,对应得到该点的目标函数值fglobal。

(13)判断fglobal>f或梯度迭代次数s>s,若满足则结束,若不满足则转(14)。

(14)计算每个局域最优点pi_best向整体最优点pglobal移动梯度,并更新每个局域最优点的位置,后转(4)

最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1