本发明涉及公共交通信息处理技术领域,具体地说是一种一种基于深度时空卷积循环网络的路网状态预测方法。
背景技术:
经济的快速发展大大提高了人们对交通的需求,交通拥堵问题日益突出。智能交通系统被认为是缓解交通拥堵的重要途径,从网络层面对交通拥堵进行预测对智能交通系统有着重要的意义。
在道路交通的研究中,通常包括路段和路网的分别,路段通常是指某一段道路路,而路网是指在某一个预定区域中,多条公路相互交错形成的网状交通系统。
现有技术对于道路的拥堵预测中,大部分是从路段层面进行拥堵预测,预测模型主要采用了arimr,kalman滤波,bp神经网络等方法。这些方法虽然对于路段层面的交通拥堵预测有着较高的精度,但是功能过于单一,难以把握路网的拥堵情况,其采用的方法相对比较简单如果放大到路网的层面,对于预测会产生较大的偏差。
近年来,现有技术中逐渐将深度学习用于交通拥堵,例如采用递归神经网络挖掘某一主干道状态演变的时序规律,从而做出精确预测。但是现有技术中的预测方法往往难以考虑不同路段之间的空间关系以及支路信息对主干道的影响;因此其预测范围仅限于主干道,也存在较大的局限性。
技术实现要素:
本发明为解决以上现有技术的不足而提出的,本发明要解决的技术问题是提供一种基于深度学习的路网状态预测方法,具体是利用卷积神经网络提取路网中各个路段拥堵情况在空间上的特征采用递归神经网络在挖掘路网状态在时序上的演变规律从而实现从网络层面对路网状态进行预测。
为了解决上述问题,本发明提供的技术方案包括:
一种基于深度学习的路网状态预测方法,其特征在于,所述方法包括如下步骤:
步骤一:建立样本集,并划分训练集和测试集
选取目标路网,将路网划分为k个路段,并对各个路段进行编号,记为(1,2,3,…,k),将一天24小时分成各个时间长度一样的时间段;首先,计算各个路段在每个时间段的平均速度,平均速度的计算方法是:在某一时间段内,在某一路段通过的所有车辆平均速度的均值,如式(1)所示,其中n代表在该时间段在该路段通过的车辆数目,a代表路网中的第a个路段,a∈(1,2,···,k),j是时间段编号,s代表该路段的长度,δt代表时间段的长度,
若某一路段在δt内没有车辆通过,在用上一个时间段的平均速度替代当前时间段的平均速度,即va,j=va,j-1;
其次,将各个路段的平均速度投影到路网中,建立路网中各个路段与该路段的平均速度的对应关系;
最后,对路网所在的地理区域进行网格化处理,划分为多个网格,划分好网格后对每个网格进行取值,对没有路段的网格区域,其取值为零;当一网格有一条路段通过的时候,网格的值为这条路段的速度值;当一网格有多条路段通过的时候,网格的值为这些路段的速度均值;从而将每个时间段的路网状态用一张图片来表达,记为pj,待预测的路网状态可用一个状态向量来表示,记为记为vj+m,vj+m=[v1,j+m,v2,j+m,…,vk,j+m],其中m代表未来第m个时间段。
步骤二,路网状态预测模型建模
所述路网状态预测模型包括卷积神经网络和递归神经网络两个部分,所述卷积神经网络用于提取路网空间特征,所述递归神经网络用于提取路网演变的时序规律;
所述卷积神经网络的建模包括:首先,确定输入输出变量,输入变量是某一路网状态pj,输出变量为该路网状态的特征表达向量,用x(j),维度大小与vj相同;其次,构建深度卷积神经网络模型,设置卷积神经网络的结构参数,输出层神经元个数与该路网的路段数目相同;通过“输入层-卷积层-池化层-输出层”结构的深度卷积神经网络提取路网中各个路段之间的联系;
所述递归神经网络的建模包括:构建输入层、隐藏层以及输出层,其中采用lstm单元作为隐藏层单元;所述的神经网络包含两层递归神经网络,基于在前预定数量时间段的特征预测未来某一个时间段的路网状态;将卷积神经网络的输出作为递归神经网络的输入,用于学习输入特征序列之间的时序变化模式,再将其输入到输出层做预测,所述递归神经网络模型具体表示为:
其中,
步骤三,未来某一时间段路网状态预测
将用于预测的在前路网状态数据作为输入变量输入到步骤二中已训练好的模型中,获得输出向量,该输出向量就是所预测的下一个时间段的路网状态。
本专利通过深度卷积神经网络提取路网中各个路段之间的联系;通过递归神经网络用于提取路网演变的时序规律;充分考虑路网时空信息的条件下可以获得更精确的路网交通状态的预测。
附图说明
图1为本发明基于深度学习的路网状态预测方法流程图;
图2为路网网格化处理过程示意图
图3为路网网格化示例图
图4为卷积神经网络结构
图5为卷积神经网络空间特征提取示意图
图6为深度学习网络结构示意图
具体实施方式
下面结合附图对本专利的具体实施方式进行详细说明,需要指出的是,该具体实施方式仅仅是对本专利优选技术方案的举例,并不能理解为对本专利保护范围的限制。
本具体实施方式提供了一种基于深度学习的路网状态预测方法,如图1所示,本具体实施方式的方法包括如下步骤:
步骤一:建立样本集,并划分训练集和测试集,选取某一路网如图2a所示,将路网划分为各个小路段,假设分为k个路段,并对各个路段进行编号,记为(1,2,3,…,k),将一天24小时分成各个时间长度一样的时间段(比如每2分钟作为一个时间段)。
首先,计算各个路段在每个时间段的平均速度。平均速度的计算方法是:在某一时间段内,在某一路段通过的所有车辆平均速度的均值,如式(1)所示,其中n代表在该时间段在该路段通过的车辆数目,a代表路网中的第a个路段,a∈(1,2,···,k),j是时间段编号,s代表该路段的长度,δt代表时间段的长度,
若某一路段在δt内没有车辆通过,在用上一个时间段的平均速度替代当前时间段的平均速度,即va,j=va,j-1。
其次,将各个路段的平均速度投影到路网中,如图2b所示,灰度不同代表速度不同。所述投影,即是建立路网中各个路段与该路段的平均速度的对应关系。当对应关系确定后,路网中各个位置不同路段的平均速度也就确定了。
最后,对路网进行网格化处理,将路网划分为网格,划分好网格后对每个网格进行取值,每个网格的取值取决于路段的速度值。具体而言,空白区域,即没有路段的网格区域,其取值为零;以路网的一小片区域(如图3a所示)为例,假设两条路段的速度分别为20km/h、30km/h,如图3b所示。所有路段穿过的网格的值为该路段的速度值;当某一网格有多条路段通过的时候,网格的值为这些路段的速度均值(如图3c所示);然后对所有网格做归一化处理,得到的结果如图3c所示,因此每个时间段的路网状态可以用一张图片来表达,记为pj,待预测的路网状态可用一个状态向量来表示,vj+m,vj+m=[v1,j+m,v2,j+m,…,vk,j+m],其中m代表未来第m个时间段。°
本发明具体实施方式为考虑前15个时间段的路网状态预测未来第m时间段的路网状态,因此本发明的单个样本形如[(pj-14,pj-13,…,pj),(vj+m)],整个样本集为所有时间段样本的集合,然后将样本集按照一定的比例划分训练集和测试集。
步骤二,路网状态预测模型建模。该部分包括两个部分,一个是卷积神经网络提取路网空间特征,另一个是递归神经网络提取路网演变的时序规律。
卷积神经网络建模,首先,确定输入输出变量。输入变量是某一路网状态pj,其实质为一张图片,其大小取决于路网的大小,输出变量为该图片的特征表达向量,用x(j)表示,维度大小与vj相同。其次,构建深度卷积神经网络模型,设置卷积神经网络的结构参数,输出层神经元个数与该路网的路段数目相同。通过“输入层-卷积层-池化层-输出层”结构的卷积神经网络提取路网中各个路段之间的联系,所述深度卷积神经网络的结构如图4所示。如图5所示,使用上述深度卷积神经网络主要表现为浅层网络可以提取距离较近的路段之间的空间信息。这样能够充分考虑不同路段之间的空间影响特性,从而有利于对于交通情况的预测。如图5的a中区域1内的不同路段可视为距离较近的路段,而深层网络可以挖掘距离较远路段的空间信息,如图5的a中区域1内的路段相对于区域2内的路段视为距离较远的路段。
在完成卷积神经网络特征提取基础上,建立递归神经网络预测模型,所述的递归神经网络包括输入层、隐藏层以及输出层。本发明为了充分考虑路网状态演变的时序特性,采用lstm(longshort-termmemory,长短时记忆)单元作为隐藏层单元,如图6所示,所述的神经网络包含两层递归神经网络,基于前15个时间段的特征预测未来某一个时间段的路网状态,将卷积神经网络的输出作为递归神经网络的输入,用于学习输入特征序列之间的时序变化模式,在将其输入到输出层做预测。具体表示如下:
其中,
步骤三,未来某一时间段路网状态预测。将测试数据的输入变量输入到步骤二中已训练好的模型中,获得输出向量,那么该向量就是所预测的下一个时间段的路网状态。
在本具体实施方式中,卷积神经网络在提取局部特征有着巨大的优越性,而在路网中,距离较近的路段之间往往有着较强的联系,递归神经网络在时序预测已经取得巨大的成功,路网的演化过程具有很强的时序性特点,前几个时间段的路网状态特征对后几个时间段的路网状态有着重要影响。因此综合卷积神经网络和递归神经网络的特点,可以挖掘路网状态的时空特征。
实施例一
本实施例,所使用的数据由某公司提供的北京市某一路网,数据包括9个字段,如表1所示,路段数据是每2分钟更新一次,其中与本发明有直接关系数据字段包括时间,路段编号,速度三个字段,时间跨度3个月,路段数目为278个。
本发明的实现路线包括以下几步:
步骤一:建立样本集,并划分训练集和测试集,选取某一路网如图1a所示,将路网划分为各个小路段,共包含278个路段,并对各个路段进行编号,记为(1,2,3,…,278),将一天24小时分成各个时间长度一样的时间段(每2分钟作为一个时间段)。
首先,计算各个路段在每个时间段的平均速度。平均速度的计算方法是:在某一时间段内,在某一路段通过的所有车辆平均速度的均值,如式(1)所示,其中n代表在该时间段在该路段通过的车辆数目,a代表路网中的第a个路段,a∈(1,2,···,278),j是时间段编号,s代表该路段的长度,δt代表时间段的长度,
若某一路段在δt内没有车辆通过,在用上一个时间段的平均速度替代当前时间段的平均速度,即va,j=va,j-1。
其次,将各个路段的平均速度投影到路网中,如图2b所示,灰度不同代表速度不同。
最后,对路网进行网格化处理,将路网划分为网格,每个网格的取值取决于路段的速度值,空白区域取值为零,以路网的一小片区域(如图3a所示)为例,假设两条路段的速度分别为20km/h、30km/h,所有路段穿过的网格的值为该路段的速度值,当某一网格有多条路段通过的时候,网格的值为这些路段的速度均值(如图3c所示),然后对所有网格做归一化处理,得到的结果如图1c所示,因此每个时间段的路网状态可以用一张图片来表达,记为pj,待预测的路网状态可用一个状态向量来表示,记为vj+m,vj+m=[v1,j+m,v2,j+m,…,v278,j+m],在本案例中,m={1,20}。
本实施例中考虑前15个时间段的路网状态预测未来m时间段的路网状态,因此本发明的单个样本形如[(pj-14,pj-13,…,pj),(vj+m)],整个样本集为所有时间段样本的集合,然后将样本集按照2:1的比例划分训练集和测试集,由于本发明采用的数据集每两分钟更新一次,3个月共有66240个样本,其中训练样集大小为43920个,测试集大小为22320个。
步骤二,路网状态预测模型建模。该部分包括两个部分,一个是卷积神经网络提取路网空间特征,另一个是递归神经网络提取路网演变的时序规律。
卷积神经网络建模,首先,确定输入输出变量。输入变量是某一路网状态pj,其实质为一张图片,其大小取决于路网的大小,输出变量为该图片的特征表达向量,用x(j)表示,维度大小与vj相同。其次,构建深度卷积神经网络模型,设置卷积神经网络的结构参数,卷积层采用relu激活函数,具体结构如表2所示。通过“输入层-卷积层-池化层-输出层”结构的卷积神经网络提取路网中各个路段之间的联系,如图5所示,主要表现为浅层网络可以提取距离较近的路段之间的空间信息(如图5a中两个蓝色路段可视为距离较近的路段),而深层网络可以挖掘距离较远路段的空间信息(如图5a中蓝色与红色路段可视为距离较近的路段)。
在完成卷积神经网络特征提取基础上,建立递归神经网络预测模型,所述的递归神经网络包括输入层、隐藏层以及输出层。本发明为了充分考虑路网状态演变的时序特性,采用lstm(longshort-termmemory,长短时记忆)单元作为隐藏层单元,如图6所示,所述的神经网络包含两层递归神经网络,具体结构如表2所示,基于前15个时间段的特征预测未来某一个时间段的路网状态,将卷积神经网络的输出作为递归神经网络的输入,用于学习输入特征序列之间的时序变化模式,在将其输入到输出层做预测。具体表示如下:
其中,
表2神经网络结构参数表
步骤三,未来某一时间段路网状态预测。将测试数据的输入变量输入到步骤二中已训练好的模型中,获得输出向量,那么该向量就是所预测的下一个时间段的路网状态。
本案例的实现采用python编程实现,本发明将与其他深度神经网络结构(卷积神经网络,递归神经网络)作对比,其结构如表2所示,其中卷积神经网络仅考虑路网中各路段之间的空间关系,递归神经网络仅考虑路网演变的时序规律,根据该对比来体现本发明的优势所在,采用的评价指标有mape和rmse,表达式如下,其中,n为所有时段数目,n=22305,np=278×n=6200790。
本案例根据m取值的不同,分为两种测试,第一种m=1,即预测未来两分钟的路网状态(短时预测);第二种m=20,预测未来40分钟的路网状态(长时预测),测试结果如表3所示:
表3案例结果对比
从表3可知,本发明所搭建的模型在短时预测和长时预测均获得最小的误差,说明在充分考虑路网时空信息的条件下可以获得更精确的预测。因此从预测精度来看,本发明提供了一种更为准确且可靠的模型。
以上仅仅是本专利优选的具体实施方式而已,凡是在本专利发明构思下对本专利的特征进行的修改、删除和替换,由于其不脱离本发明的发明构思,因此均应当被纳入到本专利的保护范围之内。