一种智慧交通的时空同步图卷积神经网络及交通预测方法

文档序号:33635272发布日期:2023-03-29 00:21阅读:37来源:国知局
一种智慧交通的时空同步图卷积神经网络及交通预测方法

1.本发明涉及智能交通系预测技术领域,具体为一种智慧交通的时空同步图卷积神经网络及交通预测方法。


背景技术:

2.随着智能交通系统(intelligent traffic system,its)的发展,作为其关键组成部分的交通预测(traffic prediction)也愈发受到重视。交通预测是一种分析城市道路交通状况,包括车流量、行驶速度和车辆密度等,挖掘交通模式,预测道路交通趋势的过程。交通预测不仅是实现交通规划、交通管理和交通控制的前置要求,还是城市出行者选择合适的出行路线、提高出行效率的重要保障。然而,交通预测问题具有复杂的空间和时间依赖性,同时在时空两个维度上存在异质性,即不同区域、不同时段的交通模式不同,这使交通预测一直是一项具有挑战性的任务。
3.现有的交通预测方法可以分为模型驱动(model-driven)和数据驱动(data-driven)两大类。模型驱动方法需要基于先验知识进行全面而详细的系统建模,然而现实中,交通数据受多种因素的影响,难以获得准确的交通模型,同时现有的模型也无法准确描述复杂现实环境中交通数据的变化。数据驱动方法根据数据的统计规律来推断数据变化的趋势,从而实现对交通状态的预测和评估。随着交通预测研究的不断深入,出现了大量预测精度较高的方法,主要可分为参数或非参数两类模型。传统的参数化模型算法简单、计算方便,然而这些模型假设系统模型是静态的,因此无法反映交通数据的非线性和不确定性,不能克服交通事故等随机事件的干扰。非参数模型很好地解决了这些问题,并且只需要有足够的历史数据就可以从交通数据中自动学习统计规律。作为非参数模型的代表,深度神经网络因其能够很好地捕捉交通数据的动态特征并取得目前最好的预测效果而受到广泛关注。然而有部分方法仅考虑了时间相关性而忽略了空间相关性,使得交通数据的变化不受城市道路网络的约束,因此无法准确预测道路上的交通信息。另一部分方法使用卷积神经网络(convolutional neural network,cnn)提取空间特征,虽然取得很大的进展,但cnn本质上适用于欧几里德空间,如图像、规则网格等,对于拓扑结构复杂的交通网络具有局限性,因此不能从本质上描述交通数据的空间相关性。此外有学者利用图卷积神经网络(graph convolutional networks,gcn)提取交通路网的空间特征,利用循环神经网络(recurrent neural network,rnn)或其变体长短期记忆网络(long short-term memory,lstm)、门控循环单元(gated recurrent unit,gru)提取时间特征,也取得了较好的效果,然而这种方式使用单独的组件提取时间或空间特征,而忽略了时间特征与空间特征也存在关联,例如上一时刻的某条道路交通状况可能会对下一时刻的其周边道路产生影响,这将不利于提升预测结果的准确性。综上所述,当前工作中对于面向智慧交通系统的交通预测方法的研究仍存在以下不足:一、模型驱动方法需要基于先验知识进行全面而详细的系统建模,然而现实交通环境较为复杂,难以获得准确的交通模型,同时现有的模型也无法准确描述交通数据的变化。二、参数化的数据驱动方法假设系统模型是静态的,无法反映交通数
据的非线性和不确定性,不能克服交通事故等随机事件的干扰。三、部分基于深度学习的非参数化的数据驱动方法,未考虑空间相关性,使得交通数据的变化不受城市道路网络的约束,无法准确预测道路上的交通信息。四、部分基于深度学习的非参数化的数据驱动方法,引入cnn提取空间相关性,但cnn本质上适用于欧氏空间,对于拓扑结构复杂的交通网络具有局限性,因此不能从本质上描述其空间相关性。五、部分基于深度学习的非参数化的数据驱动方法,使用单独的组件提取时间或空间特征,而忽略了时间特征与空间特征也存在关联,这不利于提升预测结果的准确性。


技术实现要素:

4.本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本技术的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
5.鉴于上述存在的问题,提出了本发明。
6.因此,本发明解决的技术问题是:现有的交通预测方法存在难以获得准确的交通模型,不能克服交通事故等随机事件的干扰,无法准确预测道路上的交通信息,忽略了时间特征与空间特征也存在关联,以及如何解决交通预测问题中的时间相关性与空间相关性问题。
7.为解决上述技术问题,本发明提供如下技术方案:一种智慧交通的时空同步图卷积神经网络及交通预测方法,其特征在于:包括,
8.获取历史交通数据进行预处理,得到交通数据样本及邻接矩阵;
9.将所述样本输入及邻接矩阵输入至预设训练的目标网络模型中,由局部时空构建模块生成局部时空图及其邻接矩阵;
10.将所述局部时空图及其邻接矩阵输入至下层时空同步提取模块中,进行特征提取,生成局部时空特征矩阵;
11.将所述局部时空特征矩阵输入至下层时序分析模块中,进行全局时空特征分析,并获得最终预测值。
12.作为本发明所述的面向智慧交通系统的时空同步图卷积神经网络及交通预测方法,其特征在于:所述预处理包括,
13.获取所述交通数据,补全交通数据中的缺失值,并将数据标准化;
14.将所述标准化交通数据切片为样本,在样本内划分样本数据及标签,并将其矩阵化;
15.将所述交通路网拓扑转换为邻接矩阵形式。
16.作为本发明所述的面向智慧交通系统的时空同步图卷积神经网络及交通预测方法,其特征在于:时空同步图卷积神经网为混合神经网络模型,包括,
17.所述神经网络包含一个基于滑动窗口的局部时空图构建模块,一个基于切比雪夫图卷积的时空特征同步提取模块,一个基于gru与多头自注意力机制的时序分析模块;
18.对于一个包含若干步的序列化模型输入,则模型输出为有同样步数的序列,且每一步的输出仅与当前时间步及其之前的所有输入有关,而和所述当前时间步之后的所有输入无关。
19.作为本发明所述的面向智慧交通系统的时空同步图卷积神经网络及交通预测方法,其特征在于:所述局部时空图构建包括,
20.将所述样本中不同时刻的交通拓扑按序排列;
21.建立滑动窗口,在交通拓扑序列上,以预置好的步长向后滑动;
22.将窗口内交通数据中的道路节点与上一时刻、下一时刻的自身相连,添加自环,构造局部时空图的邻接矩阵;
23.根据所构造的局部时空拓扑,形成局部时空图数据矩阵。
24.作为本发明所述的面向智慧交通系统的时空同步图卷积神经网络及交通预测方法,其特征在于:时空特征同步提取包括,
25.将所述局部时空图数据矩阵及邻接矩阵进行切比雪夫图卷积;
26.将图卷积后的输出用relu函数激活,得到特征矩阵;
27.将特征矩阵切分,利用最大池化,剔除冗余信息,得到局部时空特征矩阵。
28.作为本发明所述的面向智慧交通系统的时空同步图卷积神经网络及交通预测方法,其特征在于:剔除冗余信息还包括:
29.若切分的特征矩阵符合筛选特征则保留符合筛选特征的特征矩阵信息,并导入新的有效信息集合;
30.若切分的特征矩阵符不合筛选特征则判断为冗余信息,进行剔除,不导入有效信息集合;
31.在对特征信息选择性筛选后,将由有效信息组成的有效信息集合进行整理得到局部时空特征矩阵。
32.作为本发明所述的面向智慧交通系统的时空同步图卷积神经网络及交通预测方法,其特征在于:时序分析包括,
33.将局部时空特征矩阵送入gru层,所述gru层由多个gru单元组成;
34.所述gru单元的输入为当前时刻的局部时空特征矩阵,和上一时刻gru单元输出的隐藏状态矩阵;
35.gru单元通过门控机制,计算当前时刻的隐藏状态矩阵,并送入下一时刻的gru单元及下层多头自注意力机制;
36.所述多头自注意力机制由多个标准化的自注意力机制模块堆叠构成;
37.多头自注意力机制将gru隐藏状态矩阵线性变换为三个矩阵q、k、v,并计算得到一个自注意力模块的注意力值;
38.将所有自注意力模块的计算结果拼接,得到多头自注意力机制模块的输出;
39.将多头自注意力机制模块的输出进行线性变化,得到预测结果。
40.作为本发明所述的面向智慧交通系统的时空同步图卷积神经网络及交通预测方法,其特征在于:时空同步图卷积神经网需进行训练,包括,
41.获取交通数据,补全缺失值,并进行标准化处理;
42.将交通数据切片,构造样本,划分样本数据及标签,并将其矩阵化;
43.提取交通拓扑,构造邻接矩阵;
44.基于滑动窗口构造局部时空图,生成局部时空邻接矩阵及数据矩阵;
45.利用局部时空邻接矩阵及数据矩阵进行切比雪夫图卷积,并用relu函数激活,得
到特征矩阵;
46.将特征矩阵裁切,并使用最大池化剔除冗余信息,得到局部时空特征矩阵;
47.作为本发明所述的面向智慧交通系统的时空同步图卷积神经网络及交通预测方法,其特征在于:时空同步图卷积神经网需进行训练的结果处理,
48.利用gru和多头自注意力机制处理局部时空特征矩阵,获得交通数据的全局时空特征;
49.利用全局时空特征获得与样本标签尺寸一致的交通预测数据。
50.作为本发明所述的面向智慧交通系统的时空同步图卷积神经网络及交通预测方法,其特征在于:还包括,
51.将所述神经网络模型输出的每一个样本的预测值与样本标签y,即真实交通数据作比较,并计算所有预测值元素与真实值元素yi之间的均方误差损失,如下,
52.根据计算出的损失使用反向传播算法更新模型权重,得到最佳网络参数。
53.本发明的有益效果:一、本发明提出的训练方式,结合提出的特征提取方式和预处理方法,仅需要送入交通数据及路网拓扑,模型便可完成交通预测任务,不需要基于先验知识进行建模,也不需要领域专家进行手动特征设计,即可获得具有较高预测精度的交通预测模型,在多个真实路网数据集的测试中,本发明提出的交通预测方法表现高于基于传统机器学习的预测方法;
54.二、本发明提出的交通预测方法可以准确表示交通数据的变化,能够反应交通数据的非线性和不确定性,能够在一定程度上克服交通事故、交通拥堵等随机事件的干扰;
55.三、本发明提出的时空同步图卷积神经网络同时考虑了时间与空间相关性,所采用的切比雪夫图卷积方式能够有效描述交通路网的复杂关系,并利用gru与多头自注意力机制实现特征的全局分析,使模型具备长期预测能力;
56.四、本发明提出的时空同步图卷积神经网络通过构造局部时空图,将时间特征与空间特征转换至同一维度,并利用神经网络同时提取时空相关性,能够提取交通数据中时间特征与空间特征之间的关联,具有较强的特征提取能力。
附图说明
57.为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
58.图1为本发明一个实施例所述的一种智慧交通的时空同步图卷积神经网络及交通预测方法的流程示意图;
59.图2为本发明一个实施例所述的一种智慧交通的时空同步图卷积神经网络及交通预测方法的时空同步图卷积神经网络模型结构示意图;
60.图3为本发明一个实施例所述的一种智慧交通的时空同步图卷积神经网络及交通预测方法的局部时空图构建方法示意图;
61.图4为本发明一个实施例所述的一种智慧交通的时空同步图卷积神经网络及交通预测方法的时空特征同步提取模块及过滤操作示意图;
62.图5为本发明一个实施例所述的一种智慧交通的时空同步图卷积神经网络及交通预测方法的时序分析模块中gru单元示意图;
63.图6为本发明一个实施例所述的一种智慧交通的时空同步图卷积神经网络及交通预测方法的时序分析模块中多头自注意力机制示意图;
64.图7为本发明一个实施例所述的一种智慧交通的时空同步图卷积神经网络及交通预测方法的时空相关性示意图;
65.图8为本发明一个实施例所述的一种智慧交通的时空同步图卷积神经网络及交通预测方法的数据切片示意图。
具体实施方式
66.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
67.在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
68.其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
69.本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
70.同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
71.本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
72.实施例1
73.参照图1,其展示了面向智慧交通系统的时空同步图卷积神经网络及交通预测方法的主要步骤,预处理流程将交通数据进行补全,将其切片为尺寸统一的数据样本,并在样
本中构造合适的样本标签。将样本依次送入预测模型,模型会将数据样本重构为局部时空图,并送入后续的特征提取模块,得到与输入样本的标签尺寸一致的预测值,计算所有样本与预测值之间的均方差损失并求和即可的到模型的总损失。最后利用反向传播算法更新模型权重,反复训练直至模型收敛,或是损失值趋于0。
74.s1:读取交通数据,对数据进行补全与标准化,具体处理过程如下:
75.①
检测交通数据是否存在空值,若存在则将其用0补全;
76.②
获取交通数据中的最大值max和min;
77.利用下式对交通数据进行标准化。
78.s2:对标准化后的数据进行切片处理构造样本数据及其标签,
79.①
设置样本数据部分包含l
seq
个时间片数据,标签部分包含l
pre
个时间片数据,则样本长度为l
seq
+l
pre

80.②
从交通数据的头部开始截取l
seq
+l
pre
时间片数据作为一个样本,其中前l
seq
个时间片数据即为样本数据,剩余数据即为样本标签;
81.③
截取完一个样本后,将切片的起始位置向后移动一个时间片,截取下一个样本;
82.重复步骤

直至将交通数据遍历完毕。
83.根据交通数据的路网拓扑构造邻接矩阵,在本例中交通数据的拓扑中相邻道路节点以三元组的形式表示[from,to,cost],from表示起始道路节点,to表示目标道路节点,cost表示两个道路节点之间的距离开销,在本例中为了便于计算仅考虑道路节点之间的连接关系,而不考虑距离开销,将节点编号,构造一个n
×
n的全零矩阵,依照以下规则填入道路节点之间的连接关系,即可完成邻接矩阵的构造。
[0084][0085]
时空同步提取模块需要提取局部时空图中的时空相关性;
[0086]
时序分析模块,利用局部时空相关性,分析交通数据的全局时空特征,主要包含gru和多头自注意力机制两个阶段
[0087]
应该说明的是,本实施例中的目标模型,即一类具有指定特征的基于深度学习的交通预测模型,所述指定特征是:对于一个包含若干步的序列化模型输入,模型输出为有同样步数的序列,且每一步的输出仅与到这步为止的所有输入有关,而和该时间步之后的所有输入无关,一个典型的满足所述要求的模型如图2所示,该模型由基于滑动窗口的局部时空图构建模块、时空同步提取模块、时序分析模块构成,其结构和功能包括:
[0088]
基于滑动窗口的局部时空图构建模块的运行机制如图3所示。在这一模块中,窗口以预先设置好的步长sw在由历史数据组成的时间序列上向后滑动,而在每一次滑动前,窗口内的lw个时间片上的道路节点均与相邻时刻的自身相连,并添加自环,构成一个新的拓扑,即局部时空图,之后再将窗口内时间片的交通数据组合构造与局部时空图对应的数据矩阵。局部时空图的邻接矩阵的尺寸为l
wn×
lwn,数据矩阵尺寸为1
×
lwn。而一个数据长度为l
seq
的样本将产生d
in
个局部时空图,因此样本的数据矩阵x

尺寸将变为d
in
×
lwn,输入维度d
in
的计算方式如下:
[0089]
lw+sw(d
in-1)=l
seq
[0090]
其中d
in
也是后续时空同步提取模块的输入维度。
[0091]
时空同步提取模块用于同时提取局部时空图中的时空相关性。如图4所示,该模块包含两个切比雪夫图卷积层和一个过滤层。切比雪夫图卷积层能够接收上层数据,并对其进行卷积操作,从而实现道路节点特征的聚合,之后对提取的特征添加偏置项并利用激活函数relu函数激活,便可得到转换后的特征值,切比雪夫图卷积层的运算操作可以进行如下表示:
[0092][0093][0094][0095][0096][0097][0098]
其中,d
l
为第l层图卷积的输出维度,也是l+1层的输入维度,为第l层图卷积的输出维度,也是l+1层的输入维度,表示局部时空图的邻接矩阵,是第l+1层切比雪夫图卷积层的输入,第一层的输入即为d为a

的度矩阵,l为拉普拉斯矩阵,λ
max
为l的最大特征值,权重值wk和偏置量b均为可学习的参数,wk和tk共同构成卷积核,σ表示激活函数,此处采用relu作为激活函数。由于切比雪夫多项式的定义域为[-1,1],因此需要将l归一化,进而得到
[0099]
此外,时空同步提取模块中还添加了一个过滤层实现对无用信息的去除。过滤层效果如图4所示。过滤层主要包括两个操作,即数据裁切与过滤。数据裁切就是将最后一层图卷积操作的输出拆分为lw个个d
out
表示最后一层图卷积的输出维度。而数据过滤则使用了最大池化操作(max-pooling)实现,即将裁切出的所有h
(f)

进行逐元素比较,并取出其中的最大值。这样可以减少特征矩阵的数据量,降低模型后续操作的计算开销,同时也避免了无效信息对模型训练的干扰。过滤层操作的表示如下:
[0100][0101]
其中,h
fl
为时空同步提取模块输出结果,也是后续时序分析模块的输入。
[0102]
时序分析模块包含gru和多头自注意力机制两个部分,图5展示了一个gru单元的结构,其中每个gru单元的输入包括上一个时刻gru单元输出的隐藏状态和上层时空同步提取模块输出的当前时刻局部时空特征,并输出当前时刻的隐藏状态至下一个gru单元。在gru单元中,r
t
为复位门,用于控制对上一时刻状态信息的忽略程度;u
t
为更新门,用于控制上一时刻状态的保留程度;c
t
用于控制当前t时刻状态的保留程度。每个gru单元的计算过
程如下:
[0103][0104][0105][0106]ht
=u
t
·ht-1
+(1-u
t
)
·ct
[0107]
其中,
·
表示逐点乘法,wu、wr、wc表示权重,bu、br、bc表示偏差,均为可训练的参数;h
t-1
为上一时刻gru单元输出的隐藏状态,h
t
为当前时刻gru单元的输出,为时空同步提取模块输出的当前时刻局部时空特征。
[0108]
时序分析模块中的多头自注意力机制由多个标准化的自注意力模块堆叠而成,结构如图6所示。多头自注意力机制接收来自上层gru网络的输出,通过线性函数将其映射为三个矩阵q(query)、k(key)、v(value),注意力机制的计算过程如下:
[0109][0110]
其中,dk表示k的维度,qi、kj、vj分别表示q、k和v中的向量,m表示k、v中的向量数。因为采用了自注意力机制,所以q、k、v的尺寸是相同的。
·
表示逐点乘积运算,用于相似度计算以获得权重,然后通过除以进行放缩,以避免运算结果陷入较小的梯度内,利用softmax函数实现权重的标准化。
[0111]
s3.最后,计算vj的加权和,得到一个区块的注意力值,经过多次注意力计算,得到一个头部的注意力值。与之对应的矩阵表达形式如下:
[0112][0113]
而第i个平行头的注意力headi的计算过程如下:
[0114][0115]
其中,分别是q、k和v的线性映射矩阵,将若干个平行头得到的结果进行拼接,并对其进行一次线性变换,即可得到与样本尺寸相同的最终预测结果,计算过程如下:
[0116][0117]
其中,n
head
表示平行头个数,multihead表示多头自注意力模块的最终计算结果,concat表示矩阵拼接操作,w
output
表示线性变换的权重,prediction表示交通预测值。
[0118]
整个模型每一层都保证输入和输出序列具有相同的步数,同时,信息总是单向传递的,这意味着每一步的输出仅与到这步为止的所有输入有关,而和这步之后的所有输入
无关。
[0119]
优选的,本发明基于滑动窗口构造局部时空图,利用切比雪夫图卷积、gru和多头自注意力机制组成的神经网络,实现时空相关性的同步提取,即可高效地完成交通预测任务,并获得良好的预测结局。
[0120]
实施例2
[0121]
参照图2-8,为本发明的一个实施例,提供了一种智慧交通的时空同步图卷积神经网络及交通预测方法,为了验证本发明的有益效果,通过经济效益计算和仿真实验进行科学论证。
[0122]
本发明地第二个实施例不同于第一个实施例的是,提供了一种智慧交通的时空同步图卷积神经网络及交通预测方法的详细验证说明,具体包括:
[0123]
本实施例中的交通预测方法包括,数据预处理阶段、局部时空图构建阶段和神经网络训练阶段。
[0124]
本实施例的预处理包括,数据补全、标准化、切片、矩阵化以及邻接矩阵构造五个阶段,预处理的输入为序列化的交通数据,目的是补全交通数据中缺失的数据,并对交通数据进行标准化处理,随后利用切片将交通数据构造为数据样本,并将样本转换为矩阵形式,形成序列化样本,具体操作步骤如下:
[0125]
读取交通数据,对数据进行补全与标准化,具体处理过程如下:
[0126]
检测交通数据是否存在空值,若存在则将其用0补全;
[0127]
获取交通数据中的最大值max和min;
[0128]
利用下式对交通数据进行标准化,将数据映射至[0,1],x'即为标准化后的交通数据。
[0129][0130]
对标准化后的数据进行切片处理构造样本数据及其标签,其过程如图8所示,具体处理过程如下:
[0131]
设置样本数据部分包含l
seq
个时间片数据,标签部分包含l
pre
个时间片数据,则样本长度为l
seq
+l
pre

[0132]
从交通数据的头部开始截取l
seq
+l
pre
时间片数据作为一个样本,其中前l
seq
个时间片数据即为样本数据,剩余数据即为样本标签;
[0133]
截取完一个样本后,将切片的起始位置向后移动一个时间片,截取下一个样本;
[0134]
重复步骤

直至将交通数据遍历完毕。
[0135]
将每个样本数据和标签分别转化为l
seq
×
n和l
pre
×
n的矩阵,构造形式统一的数据样本将有利后续的模型训练,本实例中每个时间片聚合了5分钟内的交通数据,且设置l
seq
=12,l
pre
=12,因此样本的数据部分和标签部分各包含了一小时的数据,而样本数据将被送入模型训练,且预测值的尺寸与样本标签一致,因此可以认为是利用一小时的数据来预测下一小时的数据,这一做法与主流的交通预测任务相符。
[0136]
根据交通数据的路网拓扑构造邻接矩阵,在本例中交通数据的拓扑中相邻道路节点以三元组的形式表示[from,to,cost],from表示起始道路节点,to表示目标道路节点,cost表示两个道路节点之间的距离开销,在本例中为了便于计算仅考虑道路节点之间的连
接关系,而不考虑距离开销,将节点编号,构造一个n
×
n的全零矩阵,依照以下规则填入道路节点之间的连接关系,即可完成邻接矩阵的构造。
[0137][0138]
在本实施例中,时空同步图卷积神经网络一共包含三个阶段,分别是局部时空图构造,时空特征同步提取以及时序分析,预处理阶段中的样本数据被送入神经网络,构造成为局部时空图,接着局部时空图将被送入由切比雪夫图卷积层和过滤层组成的时空同步提取模块,获得局部时空相关性,之后局部特性将被送入由gru和多头注意力机制组成的时序分析模块,从全局的角度进一步提取时空特征,模型最终将输出预测值,并用于损失计算。具体过程如下:
[0139]
如图3所示,局部时空图构建包含滑动窗口采样,邻接矩阵合并以及数据矩阵重构三个阶段,具体操作如下:
[0140]
在样本数据的时序维度上构建滑动窗口,设置窗口长度lw=3,即窗口内包含3个时间片的样本数据,滑动窗口的起点即为样本数据中第一个时间片;
[0141]
将窗口内的3个时间片的交通拓扑中的道路节点与相邻时刻的自身相连构造局部时空图邻接矩阵a',并为每个节点添加自环,即为局部时空图邻接矩阵添加一个相同尺寸的单位矩阵;
[0142]
根据局部时空图的邻接矩阵构造新的数据矩阵,相关时刻的样本数据矩阵由原先的3
×
n矩阵重新拼接为一个1
×
3n的向量;
[0143]
将滑动窗口后移sw=1个时间步,并重复步骤

和步骤

[0144]
重复步骤

直至遍历完所有的样本数据;
[0145]
将产生的局部时空图数据向量构造为一个矩阵,即为局部时空图数据矩阵x',矩阵的尺寸为d
in
×
3n,d
in
=10,计算方式如下:
[0146]
lw+s
wdin-1=l
seq
[0147]
lw=3,sw=1,l
seq
=12
[0148]
时空同步提取模块需要提取局部时空图中的时空相关性,如图4所示,其主要包含切比雪夫图卷积和过滤两个阶段,具体过程如下:
[0149]
获取局部时空图的邻接矩阵a',并求出对应的度矩阵d;
[0150]
利用邻接矩阵a'和度矩阵d计算,局部时空图的拉普拉斯矩阵l,计算方式如下:
[0151][0152]
计算l的最大特征值λ
max
,并计算归一化后的拉普拉斯矩阵计算方式如下:
[0153]
计算切比雪夫多项式tk,k为多项式阶数,计算方式如下:
[0154][0155]
[0156]
设置权重值wk,与tk构成卷积核与上层输出h
(l)
相乘求和,添加偏置项b,再由激活函数σ激活,即可获得聚合后的局部时空特征,本实施例中,激活函数采用relu激活函数,上述第l+1层切比雪夫图卷积结果h
l+1
的计算过程如下:
[0157][0158]h(0)
=x',l=0,1,2,

[0159]
其中,h
(0)
表示第1层切比雪夫图卷积层的输入,即为局部时空图构建模块的输出x'。
[0160]
重复步骤

,直至完成预期的图卷积次数,在本实施例中仅堆叠了两层切比雪夫图卷积,因此只需重复一次,即可获得切比雪夫图卷积部分的最终输出其中d
out
为最后一次图卷积的输出维度;
[0161]
如图4所示,过滤层将h
(f)
裁剪成并利用最大池化操作过滤冗余信息,获得时空同步提取模块的输出h
fl
,过滤层计算过程如下:
[0162][0163]
时序分析模块,利用局部时空相关性,分析交通数据的全局时空特征,主要包含gru和多头自注意力机制两个阶段,其中gru部分的结构如图5所示,具体过程如下:
[0164]
设置初始隐藏状态h
t
为全零矩阵;
[0165]
利用当前时刻的时空同步提取模块的输出和上一时刻gru单元的输出h
t-1
,分别计算当前时刻复位门r
t
、更新门u
t
以及c
t
,计算过程如下:
[0166][0167][0168][0169]
其中,
·
表示逐点乘法,wu、wr、wc表示权重,bu、br、bc表示偏差,均为可训练的参数,σ表示激活函数,此处采用sigmoid激活函数;
[0170]
利用r
t
、u
t
以及c
t
计算当前时刻gru单元的隐藏状态h
t
,计算过程如下:
[0171]ht
=u
t
·ht-1
+(1-u
t
)
·ct
[0172]
重复步骤

与步骤

,计算t+1时刻的隐藏状态h
t+1

[0173]
重复步骤

,直至所有时刻的隐藏状态被计算完毕;
[0174]
本实施例中,时序分析模块的多头自注意力机制的结构如图6所示,具体操作过程如下:
[0175]
利用线性变化,将gru模块输出的隐藏状态h
t
,映射为三个矩阵q、k和v,并用qi、ki、vi分别表示q、k、v中的向量;
[0176]
利用qi和逐点相乘进行相似度计算,接着除以进行放缩,dk为k的维度,随后利用softmax函数实现权重的标准化,计算vj的加权和,得到一个区块的注意力值,计算过程及其矩阵形式如下:
[0177][0178][0179]
经过多次注意力计算,得到一个头部的注意力值,每个平行头注意力headi的计算过程如下:
[0180][0181]
其中,分别是q、k和v的线性映射矩阵;
[0182]
将全部平行头的结果进行拼接,并对其进行一次线性变换,即可得到与样本尺寸相同的预测值,计算过程如下:
[0183][0184]
其中,multihead表示多头目注意力机制的最终计算结果,concat表示矩阵拼接操作,w
output
为线性变换的权重,prediction表示交通预测值。
[0185]
计算样本标签与预测值之间的差,并取均方和再做平均,即可得到模型训练的总损失,计算过程如下:
[0186][0187]
反向传播算法更新模型权重,直至模型收敛,或是损失值趋于0,得到最佳网络参数。
[0188]
完成上述模型训练过程,即可得到最优的模型参数。将测试样本输入模型,即可得到测试样本的交通预测值。将测试样本预测值与测试样本标签进行比较即可确定模型的最终预测性能。若模型预测精度符合实际预测任务的需求,即可将交通数据依照本实施例中提供的方法,进行预处理,构造出尺寸合适的数据样本,送入神经网络模型,便可以获得下阶段的交通预测数据。
[0189]
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1