1.本发明涉及交通预测领域,尤其涉及一种基于时空层次化网络的交通预测方法及系统。
背景技术:2.交通预测任务,是智能交通系统中实现交通管理、交通规划和交通控制的关键任务。交通预测任务旨在通过对当前和历史时刻的交通信息及交通相关外部条件进行分析,从而实现对未来时刻交通信息如交通流量、交通速度和交通密度等的预测。
3.当前的预测方法主要是将交通预测建模成为时间序列挖掘问题,但只考虑了时间相关性,而交通数据中的空间相关性在很大程度上被忽略了(例如不同道路或交通监测点之间的空间相关性),因而大大限制了交通预测准确率提升。
技术实现要素:4.为了解决上述技术问题,本发明的目的是提供一种基于时空层次化网络的交通预测方法及系统,针对层次区域结构的时空数据挖掘算法,同时借以深度学习手段提高交通预测结果准确率。
5.本发明所采用的第一技术方案是:一种基于时空层次化网络的交通预测方法,包括以下步骤:
6.获取交通数据并对交通数据进行预处理,构建得到层次区域增强网络和交通特征矩阵;
7.将层次区域增强网络和交通特征矩阵作为预测模型的输入,学习空间相关性和时间相关性,输出预测结果;
8.所述预测模型包括区域感知的空间相关性模型和区域感知的时间相关性模型。
9.进一步,所述获取交通数据并对交通数据进行预处理,构建得到层次区域增强网络和交通特征矩阵这一步骤,其具体包括:
10.获取原始交通数据;
11.根据原始道路网络和层次区域结构将区域作为虚拟节点加入到网络中,并对节点和区域以及区域之间的连接关系进行提取,建立层次区域增强网络
12.将原始交通数据中的交通时序信息建模为节点属性,构建交通特征矩阵
13.进一步,所述区域感知的空间相关性模型采用多层图注意力网络,所述区域感知的时间相关性模型采用多层门控循环单元神经网络,所述将层次区域增强网络和交通特征矩阵作为预测模型的输入,学习空间相关性和时间相关性,输出预测结果这一步骤,其具体包括:
14.图注意力网络依据层次区域增强网络的空间拓扑结构,将输入的交通特征矩阵转换为新的特征矩阵x
t
;
15.门控循环单元根据新特征矩阵x
t
,计算对应的隐藏状态矩阵h
t
;
16.交替经过图注意力网络、门控循环单元并递归多次地学习隐藏状态后,基于最后一步的隐藏状态矩阵h
t
,经过一个全连接层进行维度变换得到最终的预测结果
17.进一步,所述图注意力网络依据层次区域增强网络的空间拓扑结构,将输入的交通特征矩阵转换为新特征矩阵x
t
这一步骤,其具体包括:
18.对于将输入的交通特征矩阵在每个时间步长,基于注意力机制建模节点间、节点与区域间以及区域之间的区域感知的空间依赖关系,得到对应的新特征矩阵x
t
。
19.进一步,所述门控循环单元根据新特征矩阵x
t
,计算对应的隐藏状态矩阵h
t
这一步骤,其具体包括:
20.门控循环单元同时建模节点间、节点与区域间以及区域之间的区域感知的时间依赖关系;
21.基于新特征矩阵x
t
,以及上一个时间步长的隐藏状态矩阵h
t-1
,得到当前时间步长的隐藏状态矩阵h
t
。
22.进一步,所述门控循环单元包括一个重置门和一个更新门,所述重置门确定对过去时间步长的信息的遗忘程度,所述更新门确定将过去时间步长的信息传递到下一个隐藏状态的程度。
23.本发明所采用的第二技术方案是:一种基于时空层次化网络的交通预测系统,包括:
24.预处理模块,用于获取交通数据并对交通数据进行预处理,构建得到层次区域增强网络和交通特征矩阵;
25.预测模块,用于将层次区域增强网络和交通特征矩阵作为预测模型的输入,学习空间相关性和时间相关性,输出预测结果。
26.本发明方法及系统的有益效果是:本发明通过将原有路网扩展为一个层次区域增强网络,使其包含层次化区域结构信息,基于该网络,进一步构造区域感知的空间相关性模型和时间相关性模型,从而有效捕获交通数据中的时空相关性,提高交通流量预测的准确性。
附图说明
27.图1是本发明一种基于时空层次化网络的交通预测方法的步骤流程图;
28.图2是本发明具体实施例预测方法的数据处理过程示意图;
29.图3是本发明具体实施例建立层次区域增强网络的示意图;
30.图4是本发明具体实施例图注意力网络的数据处理示意图;
31.图5是本发明具体实施例门控单元示意图;
32.图6是本发明一种基于时空层次化网络的交通预测系统的结构框图。
具体实施方式
33.下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
34.交通时空数据涉及对路网中空间信息和不同时刻交通数据时序信息的编码,分别用交通路网及属性特征矩阵表示:交通道路被建模成一个无向无权图其中是由n个节点组成的节点集,vi对应第i个交通监测点,ε为边集合。除了将交通监测点间的拓扑结构建模为路网外,还需要将交通时序信息建模为节点属性,即路网的特征矩阵,如下所示:
35.时间步长t的交通信息被建模为路网的节点属性特征,表示为其中列向量f
t
的第i项表示时间步长t中第i个监测点的交通信息。交通特征矩阵表示p个历史步长和当前时间步长t中的交通信息,其中每一列表示对应单个步长内所有交通监测点的交通信息。
36.交通预测问题定义为,在t时刻,给定交通拓扑信息过去p个时间步长及当前步长的交通流量信息预测长度为q的未来时间步长内的流量信息即:
[0037][0038]
参照图1和图2,本发明提供了一种基于时空层次化网络的交通预测方法,该方法包括以下步骤:
[0039]
s1、获取交通数据并对交通数据进行预处理,构建得到层次区域增强网络和交通特征矩阵;
[0040]
具体地,本发明考虑交通网络中存在的层次化区域结构,在获取到交通时空数据后,需要通过数据预处理来构造层次区域增强网络,预处理得到的网络数据将进一步作为本发明中交通流量预测模型的输入。
[0041]
s2、将层次区域增强网络和交通特征矩阵作为预测模型的输入,学习空间相关性和时间相关性,输出预测结果;
[0042]
所述预测模型包括区域感知的空间相关性模型和区域感知的时间相关性模型。
[0043]
进一步作为本方法的优选实施例,所述获取交通数据并对交通数据进行预处理,构建得到层次区域增强网络和交通特征矩阵这一步骤,其具体包括:
[0044]
获取原始交通数据;
[0045]
将原始交通数据中的交通时序信息建模为节点属性,构建交通特征矩阵
[0046]
根据原始道路网络和层次区域结构对节点和区域以及区域之间的连接关系进行提取,建立层次区域增强网络
[0047]
具体地,建立过程如图3所示。图2左侧展示了一个具有15个节点的原始交通道路
网络。原始网络中的15个节点被划分到5个区域中,5个区域被进一步划分到2个更高层次的区域和中。图3右侧展示了构建层次区域增强网络的过程:添加7个虚拟节点v
16
,v
17
,v
18
,v
19
,v
20
,v
21
和v
22
分别代表区域和根据层次化的节点-区域、区域-区域隶属关系,以及区域之间的邻近关系向网络中添加新的连边。在所得到的区域增强网络中,新建立的节点连边使用虚线表示,其中,分别包含了节点-区域隶属关系(例如连边10-19、11-19、12-19、13-19)、区域-区域隶属关系(例如连边16-21、17-21、18-22、19-22、20-22)和区域-区域邻近关系(例如连边16-17、16-18、17-19、18-19、19-20、21-22)三种类型连边。
[0048]
具体地,在获取原始道路网络后,需要将其扩展为一个层次区域增强网络。同时考虑:1)节点之间,2)节点和区域之间,以及3)区域之间(包括相同及不同层次间)的空间/时间相关性,对节点和区域以及区域之间的连接关系进行提取。将区域视为虚拟节点添加到网络中,并更新节点间的连边。
[0049]
使用表示一个l层的层次化区域结构,其中表示第l层区域集合(共包含k
l
个区域)。假设原始道路网络中的每个节点都隶属于且仅属于一级区域中的一个。同样地,对于每一个l层的区域隶属于且仅属于l+1层区域中的一个。最后,使用来表示所有l层包含的个区域。
[0050]
基于原始网络结构和区域集合可以构建一个层次区域增强网络,表示为其中,节点集合被定义为原始节点集与区域虚拟节点集的并集,即:
[0051][0052]
其中,表示与第k个区域相关的虚拟节点。使用表示层次区域增强网络中的节点个数,则
[0053]
随后,定义增强边集合为了建模节点与区域间以及不同区域间的空间/时间相关性(包括相同及不同层次间),除了原始的节点-节点边外,层次区域增强边集必须另外包含节点-区域边和区域-区域边。有三种不同的情况:
[0054]
a)节点-区域隶属关系:如果节点vi直接隶属于区域(即是包含节点vi的最小区域),则在vi和之间建立一条节点-区域边;
[0055]
b)区域-区域隶属关系:如果区域是直接隶属于区域的子区域(即是包含
区域的最小区域),则在和之间建立一条区域-区域边;
[0056]
c)区域-区域邻近关系:如果区域和区域属于同一层次,并且在区域划分上具有邻近关系,则在和之间建立一条区域-区域边
[0057]
增强边集合是原始网络边集合ε以及通过上述步骤新增的边的并集。
[0058]
完成虚拟节点添加后,重新构建交通特征矩阵以反映在历史和当前时间步长里个节点的区域感知的交通信息。对原始节点,交通特征向量保持不变。每个新增的区域虚拟节点的特征向量为直接或间接隶属于该区域的原始节点的特征向量的平均值。即对于特征矩阵的前n行,特征值与原特征矩阵保持一致,对于其他行,特征值被定义为直接或间接隶属于对应区域的原始节点的特征向量的平均值,即
[0059]
进一步作为本方法的优选实施例,所述区域感知的空间相关性模型采用多层图注意力网络,所述区域感知的时间相关性模型采用多层门控循环单元,所述将层次区域增强网络和交通特征矩阵作为预测模型的输入,学习空间相关性和时间相关性,输出预测结果这一步骤,其具体包括:
[0060]
图注意力网络依据层次区域增强网络的空间拓扑结构,将输入的交通特征矩阵转换为新的特征矩阵x
t
;
[0061]
门控循环单元根据新特征矩阵x
t
,计算对应的隐藏状态矩阵h
t
;
[0062]
交替经过图注意力网络、门控循环单元并递归多次地学习隐藏状态后,基于最后一步的隐藏状态矩阵h
t
,经过一个全连接层进行维度变换得到最终的预测结果
[0063]
进一步作为本方法的优选实施例,所述图注意力网络依据层次区域增强网络的空间拓扑结构,将输入的交通特征矩阵转换为新特征矩阵x
t
这一步骤,其具体包括:
[0064]
对于将输入的交通特征矩阵在每个时间步长,基于注意力机制建模节点间、节点与区域间以及区域之间的区域感知的空间依赖关系,得到对应的新特征矩阵x
t
。
[0065]
具体地,图4展示了本发明所使用的图注意力网络(gat)的示意图,它通过注意力机制来对邻居节点做聚合操作,实现对不同邻居权重的自适应分配。对于节点v1,它首先对每一个邻域节点{v1,v2,v3,v4,v5,v6}分别求注意力系数α
11
,α
12
,α
13
,α
14
,α
15
α
16
},随后根据注意力系数对邻居节点的特征进行聚合,来学习新的特征向量[x
t
]
1,:
,作为门控循环单元(gru)的输入。由于输入的网络数据基于层次区域化结构进行了增强,因而使用gat可以建立起区域感知的节点权重自适应分配,从而捕获区域感知的空间相关性。
[0066]
使用图注意力网络(gat,graphattentionnetworks)建模节点之间、节点与区域之间、区域与区域之间的复杂空间依赖关系,自动捕捉节点对另一节点、节点对区域、区域对节点、区域对另一区域的重要性(注意力系数)。
[0067]
具体而言,使用图注意力层将节点的交通特征转换为更高层次的特征向量,编码节
点之间、节点与区域之间以及区域之间的复杂空间相关性。图注意力层的输入为层次区域增强网络中每个节点的交通特征向量,即其中输出为一组新的特征向量,即其中
[0068]
具体计算步骤如下:
[0069]
首先,对网络中的节点使用自注意力机制计算得到两两之间的注意力值:
[0070][0071]
其中,是一个权重矩阵,用于节点特征的线性变换。具体来说,本发明所使用的自注意力机制为一个单层前馈神经网络,包含一个线性变换向量和一个leakyrelu函数(参数α=0.2)作为激活函数,即:
[0072][0073]
其中,.
t
表示转置操作,||表示连接操作。对邻域节点使用softmax函数,得到归一化注意力系数:
[0074][0075]
其中,表示在层次区域增强网络中节点i的邻域节点。
[0076]
最后,对于每个节点,使用求得的归一化注意力系数对邻域节点特征求线性组合,来更新节点特征向量:
[0077][0078]
从而,对所有节点的输出特征矩阵构造如下:
[0079][0080]
进一步作为本方法优选实施例,所述门控循环单元根据新特征矩阵x
t
,计算对应的隐藏状态矩阵h
t
这一步骤,其具体包括:
[0081]
门控单元同时建模节点间、节点与区域间以及区域之间的区域感知的时间依赖关系;
[0082]
基于新特征矩阵x
t
,以及上一个时间步长的隐藏状态矩阵h
t-1
,得到当前时间步长的隐藏状态矩阵h
t
。
[0083]
具体地,门控单元原理示意图参照图5,使用门控循环单元(gru)构建时序神经网络来建模节点之间、节点与区域之间、区域与区域之间的复杂时间依赖关系。
[0084]
假设隐藏层中的单元数为h,使用表示在时间步长t-1时的隐藏状态矩阵。对于每一层神经网络,给定在t时刻的输入以及t-1时刻的隐藏状态门控循环单元的重置门和更新门可以分别由以下公式计算得到:
[0085][0086][0087]
其中,和为权重矩阵,为偏置向量。随后,计算时间步长t中的候选隐藏状态矩阵
[0088][0089]
其中,和为权重矩阵,为偏置向量。重置门r
t
用于控制当前时间步的候选隐藏状态包含前一时间步的隐藏状态的程度。
[0090]
基于前一时间步长的隐藏状态h
t-1
和当前的候选隐藏状态时间步长t的隐藏状态矩阵可以由更新门z
t
控制的加权线性组合计算得到,即:
[0091][0092]
最终,根据隐藏状态矩阵h
t
,使用全连接层计算最后的输出,即时间步长t的预测结果为:
[0093][0094]
其中,为权重矩阵,为偏置向量。
[0095]
最后,循环使用gat和gru来更新节点特征以及学习基于时序的隐藏状态,最后使用最终输出隐藏状态来进行交通流量预测,得到预测结果。
[0096]
在模型训练过程中,使用表示训练样本的真实结果,即增强网络中所有节点未来q个时间步长内交通信息的真实值。
[0097]
基于模型预测值和真实值模型的训练损失函数定义如下:
[0098][0099]
其中,φ表示模型的所有参数,λ为超参数,l
reg
(φ)为正则化项,用于防止模型过拟合。
[0100]
进一步作为本方法优选实施例,所述门控循环单元包括一个重置门和一个更新门,所述重置门确定对过去时间步长的信息的遗忘程度,所述更新门确定将过去时间步长的信息传递到下一个隐藏状态的程度。
[0101]
如图6所示,一种基于时空层次化网络的交通预测系统,包括:
[0102]
预处理模块,用于获取交通数据并对交通数据进行预处理,构建得到层次区域增强网络和交通特征矩阵;
[0103]
预测模块,用于将层次区域增强网络和交通特征矩阵作为预测模型的输入,学习空间相关性和时间相关性,输出预测结果。
[0104]
上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0105]
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本技术权利要求所限定的范围内。