基于多源交通数据的公交路网分区方法、系统、设备和介质

文档序号：29700942发布日期：2022-04-16 14:26阅读：139来源：国知局

1.本发明涉及智能交通技术领域，特别是涉及一种基于多源交通数据的公交路网分区方法、系统、计算机设备和存储介质。

背景技术：

2.当前城市道路公交系统已形成以常规公交为主体、以定制公交等需求响应型公交为有效补充的发展局面，对提升公交服务品质、缓解部分乘客出行难等起到了重要作用。然而，在常规公交服务中，道路交通状态和乘客需求等外部因素变化时常导致车辆无法按既定运营方案发挥其核定运输效率；即便需求响应型公交服务强调以灵活的运营方案满足乘客个性化出行需求，其实际服务效果(如准时性、系统可靠性等)仍然受道路交通状态影响而存在不确定性。公交车辆在行驶过程中，与路网交通状态、乘客出行需求间存在复杂的交互关系，公交资源优化配置及公交效能的提高依赖于对这种交互关系的识别。宏观基本图可揭示出同质路网中车辆平均流量、密度、速度之间的规律，为识别上述交互关系提供了可行途径。然而，对路网宏观交通规律(宏观基本图)的识别以路网的同质性划分为前提，目前虽然已有针对社会车和多模式交通的路网分区研究，但还未有专门针对公交路网分区的研究。由于公交车具有与私家车不同的运行特性，公交路网有其自身运行规律，因而有必要专门针对公交路网分区进行研究。
3.当前已有的路网分区方法大多是针对社会车运行路网和多模式交通路网，前者以社会车交通数据为依据开展，可揭示社会车路网运行规律，但由于研究对象及数据特点不同，并不适用于公交路网分区；后者综合社会车和公交车路段速度(或密度)进行路网划分，然而，由于公交线路在路网中的覆盖面有限，对于同时存在社会车和公交车交通数据的路段，在多模式交通子区划分中综合考虑社会车和公交车路段速度(或密度)确定路段的归属子区，而对于只有社会车交通数据的路段，则只能以社会车路段速度(或密度)为依据确定其归属子区，这意味着这些路段的子区归属完全无法基于公交车运营数据做出划分，因此，基于其分区结果所识别的公交路网宏观基本图(公交路网运行规律)无疑会存在偏差，不利于对公交运行规律的认识。

技术实现要素：

4.为了解决上述现有技术问题的不足，本发明提供了一种基于多源交通数据的公交路网分区方法、系统、计算机设备和存储介质，该方法融合实际路网中的公交车进出站gps数据、出租车gps数据以及道路结构数据等进行路网交通参数计算；采用神经网络模型对数据缺失路段进行公交路段速度补齐；以公交车路段速度和路段邻接关系为依据，采用初始小区生成、子区合并和边界调整三步法将异质公交路网划分为子区内部速度均匀、子区间速度差异显著的多个子区，从而能够准确识别大规模路网中公交系统在与外部环境交互作用下所具有的运行规律，为公交系统资源优化配置提供决策依据。
5.本发明的第一个目的在于提供一种基于多源交通数据的公交路网分区方法。
6.本发明的第二个目的在于提供一种基于多源交通数据的公交路网分区系统。
7.本发明的第三个目的在于提供一种计算机设备。
8.本发明的第四个目的在于提供一种存储介质。
9.本发明的第一个目的可以通过采取如下技术方案达到：
10.一种基于多源交通数据的公交路网分区方法，所述方法包括：
11.在研究区域内，根据出租车gps数据和公交车进出站gps数据，计算公交车路段速度；其中包括对仅有出租车数据的路段，采用神经网络模型预测公交车路段速度；
12.根据所述公交车路段速度和路段邻接关系，实现公交路网分区；
13.对公交路网分区得到的子区，根据公交车进出站gps数据以及路网数据，计算公交车路网交通参数，从而得到公交路网宏观基本图。
14.进一步的，对所有同时有公交车进出站和出租车数据的路段：对于任意路段i，分别根据公交车进出站gps数据和出租车gps数据，计算路段i的公交车的路段速度和社会车的路段速度；对于任意路段i，以社会车路段速度和路段起/终点经纬度、路段长度、车道数、有无公交车专用道作为输入参数，使用皮尔逊相关系数描述所述输入参数与公交车路段速度间的相关性，选择相关系数绝对值大的输入参数作为路段i的输入参数；将所有路段的输入参数作为样本集；
15.根据路段，将样本集划分为训练集和测试集；
16.利用训练集对神经网络模型进行训练，得到最终的预测模型；
17.对仅有出租车gps数据的路段，将该路段的输入参数输入最终的预测模型，得到公交车路段速度。
18.进一步的，所述利用训练集对神经网络模型进行训练，得到最终的预测模型，具体包括：
19.对于训练集中的任意路段i，以路段i的输入参数作为神经网络模型的输入数据；
20.对所述输入数据进行数据归一化；
21.将归一化的数据分别输入所述神经网络模型中的循环神经网络和卷积神经网络，分别得到对应的路段i的预测公交车路段速度；
22.根据路段i的公交车路段速度和路段i的预测公交车路段速度，采用均方根误差和平均绝对误差计算出公交车路段速度预测误差，将精度最高的神经网络模型作为最终的预测模型。
23.进一步的，所述根据出租车gps数据和公交车进出站gps数据，计算公交车路段速度，还包括：
24.对有公交车进出站数据的路段，结合公交车进出站gps数据和公交线路的路网分布信息，计算公交车路段速度，具体为：
25.利用公交线路在路网的分布信息和路网拓扑结构将路网中的道路细分为若干路段；根据路段上不同线路的公交车速度，计算所述路段的公交车平均路段速度。
26.进一步的，所述根据所述公交车路段速度和路段邻接关系，实现公交路网分区，具体包括：
27.根据路网中不同路段的邻接关系以及所述公交车路段速度，采用密度峰值聚类法和区域生长法生成初始小区；
28.对所述初始小区进行合并，得到合并子区；
29.对所述合并子区的边界进行调整，从而实现公交路网分区。
30.进一步的，所述根据路网中不同路段的邻接关系以及所述公交车路段速度，采用密度峰值聚类法和区域生长法生成初始小区，具体包括：
31.计算任意路段i与其他路段的曼哈顿距离之和si，并将si降序排列；
32.对排序后的si，计算相邻两数间的差值，差值最大处之前的所有si对应的路段作为初始小区中心；若在差值最大处之前有n个路段，则意味着生成了n个初始小区；
33.选择任意初始小区中心，识别与该小区内路段相邻的路段；根据初始小区加入各邻接路段之后的公交车速度方差和各邻接路段到小区中心的距离，选取最优路段加入初始小区；重复此步骤，直至所有路段全部聚类进入初始子区。
34.进一步的，所述对所述初始小区进行合并，得到合并子区，具体包括：
35.设定分区数量为p，在保证初始小区间相互邻接的前提下，以合并子区公交车路段速度总方差最小为目标，采用遗传算法对所述初始小区进行合并，得到合并子区；
36.所述采用遗传算法对所述初始小区进行合并，得到合并子区，具体包括：
37.染色体为1
×
n的向量，n为初始小区数量；采用实数进行编码，染色体每个基因位上的数字代表该初始小区被划入的子区；
38.以小区间邻接关系为依据，随机将相邻小区合并为一个子区，生成染色体；对染色体进行合法性检查，只有子区内部连通且每个子区不为空的染色体才能成为合法染色体；重复此步骤直至生成初始种群；
39.采用轮盘赌原则随机选择一个染色体作为父代染色体，基于子区的邻接关系进行交叉操作，具体为：针对选择出的父代染色体，在可交叉的位置中随机选择两个基因位进行交叉，检查交叉后染色体的合法性，只有合法的染色体才能进行下一步操作；
40.采用轮盘赌原则随机选择一个染色体作为父代染色体，基于子区的邻接关系进行变异操作，具体为：采用轮盘赌原则随机选择一个染色体，随机选择变异点，对染色体进行变异并检查变异后染色体合法性；重复此步骤，直至变异后的染色体通过合法性检查；
41.用上一代种群中的最优染色体替代当前种群中的最差染色体；
42.若达到规定的迭代次数，则得到p个合并子区；否则，返回采用轮盘赌原则随机选择一个染色体作为父代染色体，基于子区的邻接关系进行交叉操作，并执行后续操作。
43.进一步的，所述对所述合并子区的边界进行调整，从而实现公交路网分区，具体包括：
44.识别位于合并子区边界且与所述合并子区仅有较少邻接路段的路段；
45.将所述路段划入与所述合并子区相邻的合并子区，若相邻的合并子区的公交路段速度总方差降低，则将所述路段调整进入相邻合并子区；
46.返回识别位于合并子区边界且与所述合并子区仅有较少邻接路段的路段，并执行后续操作，直至公交路段速度总方差不再下降，从而实现公交路网分区。
47.本发明的第二个目的可以通过采取如下技术方案达到：
48.一种基于多源交通数据的公交路网分区系统，所述系统包括：
49.公交车路段速度计算模块，用于在研究区域内，根据出租车gps数据和公交车进出站gps数据，计算公交车路段速度；其中包括对仅有出租车数据的路段，采用神经网络模型
预测公交车路段速度；
50.公交路网分区模块，用于根据所述公交车路段速度和路段邻接关系，实现公交路网分区；
51.公交路网宏观基本图生成模块，用于对公交路网分区得到的子区，根据公交车进出站gps数据以及路网数据，计算公交车路网交通参数，从而得到公交路网宏观基本图。
52.本发明的第三个目的可以通过采取如下技术方案达到：
53.一种计算机设备，包括处理器以及用于存储处理器可执行程序的存储器，所述处理器执行存储器存储的程序时，实现上述的公交路网分区方法。
54.本发明的第四个目的可以通过采取如下技术方案达到：
55.一种存储介质，存储有程序，所述程序被处理器执行时，实现上述的公交路网分区方法。
56.本发明相对于现有技术具有如下的有益效果：
57.1、本发明针对部分道路缺乏公交运营数据的情况，融合实际路网中的公交车进出站gps数据、出租车gps数据以及道路结构数据，提出了采用神经网络预测模型对数据缺失路段进行公交路段速度补齐。
58.2、本发明在初始小区生成过程中先采用密度峰值聚类法确定初始小区中心，再将周边速度相似路段聚类形成初始小区，有利于降低初始子区内的公交路段速度方差，保证了初始小区内部速度的均匀性，从而使得最终划分出的公交路网子区内部均质度更高且子区间的差异性更显著，能更好地满足公交路网子区划分的要求。
59.3、本发明经过后续的子区合并和边界调整，可得到子区内部速度更均匀、子区间差异更明显的公交路网划分结果，从而提高公交路网划分质量。
60.4、本发明提供的方法可对大规模异质公交路网进行分区并识别公交路网宏观基本图，所得结果可以为公交管理与控制决策提供参考依据。
附图说明
61.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。
62.图1为本发明实施例1的基于多源交通数据的公交路网分区方法的流程图。
63.图2为本发明实施例1的路段划分示意图。
64.图3为本发明实施例1的基于数据融合的公交车路段速度补齐的流程图。
65.图4为本发明实施例1的皮尔逊相关系数示意图。
66.图5(a)为本发明实施例1的循环神经网络预测流程。
67.图5(b)为本发明实施例1的卷积神经网络预测流程
68.图6为本发明实施例1的公交路网分区的流程图。
69.图7为本发明实施例1的染色体编码示意图。
70.图8为本发明实施例1的交叉操作示意图。
71.图9为本发明实施例1的变异操作示意图。
72.图10为本发明实施例2的16子区的公交路网分区。
73.图11(a)为本发明实施例2的不同分区方法的子区均质度。
74.图11(b)为本发明实施例2的不同分区方法的子区间相似性。
75.图12(a)为本发明实施例2的本发明分区与多模式交通路网分区的子区均质度。
76.图12(b)为本发明实施例2的本发明分区与多模式交通路网分区的子区间相似性。
77.图13为本发明实施例2的16子区的公交子区平均流量-密度。
78.图14为本发明实施例3的基于多源交通数据的公交路网分区系统的结构框图。
79.图15为本发明实施例4的计算机设备的结构框图。
具体实施方式
80.为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。应当理解，描述的具体实施例仅仅用以解释本技术，并不用于限定本技术。
81.实施例1：
82.如图1所示，本实施例提供了一种基于多源交通数据的公交路网分区方法，该方法包括以下步骤：
83.s101、在研究区域内，根据出租车gps数据和公交车进出站gps数据，计算公交车路段速度。
84.(1)计算社会车路段速度。
85.假定载客出租车行驶行为与社会车行驶行为类似，可通过载客出租车gps数据计算社会车路段平均速度，如公式(1)所示：
[0086][0087]
式中，v
(c)
(j,m)为在j路段、m时段的社会车平均速度(m/s)，c代表社会车；r为在j路段、m时段的社会车行程编号；r为在j路段、m时段的社会车行程总数量；t
(c)
(r,m)和d
(c)
(r,m)分别为社会车行程r在j路段、m时段的行驶时间(s)和行驶距离(m)；t
(c)
(j,m)和d
(c)
(j,m)分别为在j路段、m时段社会车的总行驶时间和行驶距离。
[0088]
(2)计算公交车路段速度。
[0089]
与传统公交相比，除停站行为外，按需服务公交车辆与传统公交车辆的路上行驶行为非常相似，剔除停站行为后的传统公交车路上行驶状态也可代表按需服务公交车的路上行驶状态，故可通过现有公交车gps数据还原两类公交车的行驶状态并估计公交车路网的路段速度：
[0090][0091]
式中，v
(b)
(j,m)为在j路段、m时段的公交车平均速度(m/s)，b代表公交车；r为在j路段、m时段的公交车行程编号；r为在j路段、m时段的公交车行程总数量；t
(c)
(r,m)和d
(c)
(r,m)分别为公交车行程r在j路段、m时段的行驶时间(s)和行驶距离(m)；t
(b)
(j,m)和d
(b)
(j,m)分别为所有公交车在j路段、m时段的总行驶时间和行驶距离。
[0092]
由于可采用的公交运行数据为公交车进出站gps数据，只能计算出公交车在公交站间的平均速度，精度不足，故需采用适当方法减少由于数据原因导致的估计误差；此外，路网中部分道路无公交车线路覆盖，需要对该类路段进行公交速度补齐。
[0093]
进一步的，步骤s101包括：
[0094]
s1011、对有公交车进出站数据的路段，结合公交车进出站gps数据和公交线路的路网分布信息，计算公交车路段速度。
[0095]
单独采用公交车进出站gps数据仅能计算出每辆公交车在公交车站间道路上的平均速度，无法反映出公交车在站间道路的不同区段的速度差别，不利于掌握公交车在路网不同道路上的速度规律。
[0096]
在实际公交路网中，公交线路在部分道路上会有重叠，因此可以利用公交线路在路网的分布信息和路网拓扑结构将路网中的道路细分为若干路段，然后，根据每个路段上不同线路的公交车速度去计算该路段上的公交车平均路段速度。该方法可以在更小的路段长度内估计公交车路段速度，更好地反映出公交车在不同路段上的速度差异。公交车站间道路的路段划分如图2所示，路段划分完成以后，利用公式(2)可计算出公交车路段速度。
[0097]
s1012、对仅有出租车数据的路段，采用神经网络模型预测其公交车路段速度。
[0098]
对仅有出租车数据的路段，需要进行公交车路段速度补齐。由于路网中公交车速度受交通总流量(以社会车为主体)、道路条件等因素影响，故可依据社会车路段速度、道路结构等因素与公交车路段速度间的关系进行速度补齐，如图3所示。
[0099]
(1)针对所有同时有公交车进出站gps和出租车gps(因为载客出租车的行驶行为与社会车相似，故在社会车gps数据采集受限的情况下，可采用出租车gps数据分析社会车路段速度)数据覆盖的路段：
[0100]
(1-1)对于任意路段i，根据公式(1)计算出社会车的路段速度，根据步骤s1011提供的方法计算出公交车的路段速度。
[0101]
(1-2)对于任意路段i，以社会车路段速度和路段起/终点经纬度、路段长度、车道数、有无公交车专用道等道路结构数据作为输入参数；使用皮尔逊相关系数描述输入参数与公交车路段速度间的相关性，从而得到路段i的输入参数。
[0102]
相关系数绝对值越大(接近1或-1)表示输入参数和输出参数之间的相关性越强；反之，说明相关性越弱。选择相关系数绝对值大的输入参数作为路段i的输入参数，即为神经网络预测模型的输入数据(输入矩阵)。例如，假设皮尔逊相关系数如图4所示，则选择出租车(社会车)路段速度、路段i的起点和终点的经度作为神经网络预测模型的输入矩阵。
[0103]
(1-3)样本集包括所有路段的输入参数。根据路段，将样本集划分为训练集和测试
集。本实施例划分的比例是7:3。例如，有1000个路段同时有出租车和公交车gps数据，那么选择700条路段的输入参数作为训练集，300条路段的输入参数作为测试集。
[0104]
(2)利用训练集对神经网络模型进行训练，得到最终的预测模型。
[0105]
对于训练集中的任意路段i，以路段i的输入参数作为神经网络模型的输入数据，采用神经网络模型预测公交车gps数据缺失路段的公交车路段速度。其中，采用的神经网络模型包括循环神经网络(rnn、lstm、gru)和卷积神经网络(conv2d)。
[0106]
进一步的，步骤(2)具体包括：
[0107]
(2-1)对输入数据归一化。
[0108]
神经网络中的sigmoid函数和tanh函数对0到1之间的数字最敏感，故将模型所有的输入数据和输出值都转换为z-score分值，如下所示：
[0109][0110]
其中，z(x)为变量x的z-score分值，μ为总体均值，σ为总体标准差。
[0111]
(2-2)公交路段速度预测。
[0112]
采用循环神经网络(rnn、lstm、gru)和卷积神经网络(conv2d)对公交车速度进行预测，即采用rnn、lstm、gru和conv2d四种神经网络模型对公交车路段速度进行预测。
[0113]
rnn、lstm、gru循环神经网络预测流程如图5(a)所示，经归一化后的输入特征矩阵被放入输入层，首先在全连接层中进行计算，将数据映射到更高维度，接着进入激活函数relu层以增加数据的非线性特征，然后数据被传递到循环神经网络模型的内核(rnn或lstm或gru)，再进入激活函数relu层，最后经线性函数层整合数据，输出路段i的公交车路段速度预测矩阵。
[0114]
conv2d卷积神经网络预测流程如图5(b)所示，经归一化后的输入特征矩阵被放入输入层，首先进入卷积层，再进入激活函数relu层，接着经过最大池化层以凸显有用的特征值，然后进入全连接层，最后输出路段i的公交车路段速度预测矩阵。
[0115]
(2-3)公交车路段速度预测结果评价。
[0116]
采用均方根误差(rmse)和平均绝对误差(mae)分别对循环神经网络和卷积神经网络得到的公交车路段速度预测矩阵进行评估，如公式(4)-(5)所示。根据均方根误差和平均绝对误差计算出路段i的公交车路段速度预测误差，选择预测精度最高的神经网络模型作为最终的预测模型。
[0117][0118][0119]
其中，yi指任意路段i的实际公交车路段速度(m/s)；指路段i的公交车路段速度预测值(m/s)；i是指样本数量。
[0120]
本实施例选择均方根误差和平均绝对误差两个指标同时最小的神经网络模型(lstm)作为最终的预测模型。
[0121]
(3)对仅有出租车gps数据的路段，将该路段的输入参数输入最终预测模型，得到预测公交车路段速度。
[0122]
根据步骤(1-2)可知，本实施例中仅有出租车gps数据的路段i的输入参数为路段i的出租车(社会车)速度、路段i的起点和终点的经度。
[0123]
s102、根据公交车路段速度和路段邻接关系，实现公交路网分区。
[0124]
公交路网划分的目的是将在公交速度(或密度)上具有强相似性和高关联度的路段聚类成子区，以便发掘子区交通规律。公交路网划分需满足以下基本要求：(1)同一子区内路段速度(或密度)差异尽量小、不同子区之间的差异尽可能大；(2)在空间上确保子区路网的连通性和紧凑性。为减少分区算法在大规模路网划分时的计算工作量，本文采用初始小区生成、子区合并和边界调整三步法划分公交路网，算法流程如图6所示。
[0125]
进一步的，步骤s102具体包括：
[0126]
s1021、根据路网中不同路段的邻接关系以及公交车路段速度，生成初始小区。
[0127]
初始小区由彼此连通且公交车路段速度非常相近的若干路段组成，初始小区生成就是将具有上述特征的路段进行聚类的过程。初始小区的规模一般较小(即初始小区所包含的路段数量不会太多)。本方法采用密度峰值聚类法和区域生长法生成路网初始小区。密度峰值聚类算法可识别出任意形状数据，能直观地找到类数量和类中心，具有较好的鲁棒性；区域生长法可基于邻接关系将初始小区中心周围满足条件的路段聚类到初始小区中，二者结合可很好地满足初始小区生成的要求。生成初始小区的目的是便于以初始小区作为基础单元，进一步对初始小区进行合并，最终形成路网子区。与直接以单个路段为基础单元去划分路网子区相比，可以极大地减少路网分区的计算工作量。
[0128]
初始小区生成的步骤为：
[0129]
(1)计算路段局部密度ρi和相对距离δi，如公式(6)-(7)所示：
[0130][0131][0132]
其中，d
ij
为路段i与j的距离，本实施例从公交车路段速度和路段起始位置两个方面来衡量不同路段间的距离。各路段间的距离可以构成一个距离矩阵，dc为截断距离，本实施例取位于距离矩阵行数2％处的值作为截断距离；i为路段序号集；ii是i的子集，其由满足ii＝{k,k∈i,ρk＞ρi}的路段序号组成。
[0133]dij
的计算如公式(8)所示：
[0134][0135]
其中，vi表示路段i的公交车路段速度经标准化以后的值，lati和loni分别表示路段i起始位置的经纬度经标准化以后的值。
[0136]
(2)根据路段局部密度和相对距离，选择初始小区中心。
[0137]
首先，计算路段i与路段j之间相对密度ρ和相对距离δ的曼哈顿距离，如公式(9)所示：
[0138]mij
＝|ρ
i-ρj|+|δ
i-δj|
ꢀꢀꢀ
(9)
[0139]
式中，m
ij
为路段i与路段j的曼哈顿距离，||表示取绝对值。
[0140]
然后，计算各路段与其他路段的曼哈顿距离之和并将si降序排列。对排序后的si，依次计算相邻两数间的差值，找到差值变化最大处，位于差值变化最大处之前的所有路段即为初始小区中心。假设在差值最大处之前有n个路段，则意味着可生成n个初始小区。
[0141]
(3)选择任意初始小区中心，识别与该小区相邻的路段；分别计算初始小区加入各邻接路段之后的公交车速度方差和各邻接路段到小区中心的距离，基于topsis算法选取一个最优路段加入初始小区。通过该方式形成初始小区可以降低初始小区内部路段间的公交车路段速度差异，同时保证初始小区的紧凑性和内部的连通性，从而更好地满足路网分区的基本要求。
[0142]
topsis算法如下；
[0143]
对每个初始小区n,构建规范决策矩阵如下：
[0144][0145]
其中，an矩阵为备选路段集合的规范决策矩阵，是小区n的公交车路段速度集合，备选路段j的公交车路段速度，sn为小区n的备选路段集合，var()表示求公交车速度方差，dis()表示计算路段j到小区n的中心cenn的距离。
[0146]
在此基础上，构造加权规范矩阵并计算各备选路段到正理想解和负理想解的距离，如公式(10)、(11)所示：
[0147][0148][0149]
其中，a
je
是加权规范矩阵中的元素，we是属性e的权重，u是备选路段集合中的路段数，和分别是属性e的正理想解和负理想解，和分别是第j个路段到正理想解和负理想解的距离。
[0150]
根据各路段的综合评价指标选取最优的路段j
*
并入初始子区n，j
*
的选择如公式(12)所示：
[0151][0152]
(4)每次选取一条路段加入到小区中，不断迭代直至所有路段全部聚类进入初始小区。初始小区的生成过程可以看成是以小区中心为起点的一个不断生长的过程。
[0153]
s1022、对初始小区进行合并，得到合并子区。
[0154]
根据初始小区划分结果，计算初始小区间的邻接关系，如果初始小区i和初始小区j之间有道路连通，则认为这两个小区相邻。邻接关系可用逻辑变量表示，当两个初始小区相邻时取值为1，否则，取值为0。
[0155]
设定分区数量为p，在保证子区内部连通(即构成子区的初始小区间相互邻接)的前提下，以子区公交车路段速度总方差最小为目标(目标函数如公式(13)所示)，寻找初始小区间的最优合并方式。
[0156][0157]
式中，是子区p中的路段数量，是子区p中公交车路段速度集合，是子区p中公交车路段速度方差均值，p是路网划分的子区数量。
[0158]
本实施例采用遗传算法寻求最优子区合并方案，具体过程如下：
[0159]
(1)编码规则。染色体为1
×
n的向量，n为初始小区数量；采用实数进行编码，染色体每个基因位上的数字代表该初始小区被划入的子区，如图7所示。
[0160]
(2)初始化种群。以小区间邻接关系为依据，随机将相邻小区合并为一个子区，生成染色体；对染色体进行合法性检查，只有子区内部连通且每个子区不为空的染色体才能成为合法染色体；重复以上步骤直至生成初始种群。
[0161]
计算染色体的虚拟适应度，在染色体的分区方案下计算得到的公交车路段速度总方差越小则染色体的虚拟适应度越高，虚拟适应度值越高的染色体在种群生存的优势越大。
[0162]
(3)采用轮盘赌原则随机选择染色体作为父代染色体，基于子区的邻接关系进行交叉操作，交叉操作规则如下：
[0163]
针对选择出的父代染色体，在可交叉的位置中随机选择两个基因位进行交叉，检查交叉后染色体的合法性(子区内部必须连通)。交叉操作如图8所示，该图表示经过交叉操作以后，第2个初始小区的归属子区由9更改为14，而第n个初始小区的归属子区由14更改为9，当然进行交叉操作后的染色体须满足同一个子区内部连通的要求，只有合法的染色体才能进行下一步遗传操作。
[0164]
(4)采用轮盘赌原则随机选择一个染色体作为父代染色体，基于子区的邻接关系进行变异操作。随机选择一个染色体，随机选择变异点，对染色体进行变异并检查变异后染色体合法性；重复变异操作，直至变异后的染色体通过合法性检查。变异操作如图9所示，该图表示经过变异操作以后，第4个初始小区的归属子区由13更改为5，同样，进行变异操作后的染色体须满足同一个子区内部连通的要求(即合法性)，只有合法的染色体才能进行下一步遗传操作。
[0165]
(5)精英保留策略。
[0166]
为提高遗传算法的求解效果，采用精英保留策略，即用上一代种群中的最优染色体替代当前种群中的最差染色体。
[0167]
(6)重复执行步骤(3)-(5)，直至达到规定的迭代次数(即终止条件)，结束计算，得到p个子区的合并结果。
[0168]
s1023、对子区的边界进行调整，从而最终实现公交路网分区。
[0169]
边界调整的目的是为子区边界上的路段搜寻更适宜的子区，进一步降低公交车路段速度总方差(即公式(10)所示的目标函数)。边界调整的步骤为：
[0170]
(1)识别位于子区边界且与本子区仅有较少邻接路段的路段；
[0171]
(2)尝试将该路段划入与其相邻的子区，若该路段划入该相邻子区后，公交路段速度总方差降低，则将该路段调整进入相邻子区；否则，不对该路段进行任何操作。
[0172]
(3)遍历子区边界上所有符合条件的路段，直至公交路段速度总方差不再下降。
[0173]
(4)输出p个子区的划分结果。
[0174]
s103、对公交路网分区得到的子区，根据公交车进出站gps数据以及路网数据，计算公交车路网交通参数，得到公交路网宏观基本图。
[0175]
其中，公交车路网交通参数包括公交路网平均流量、平均密度。
[0176]
根据如下公式计算出各子区的公交车平均密度和公交车平均流量：
[0177][0178][0179][0180]
其中，k
(b)
(j,m)为在j路段、m时段的公交车平均密度(veh/km)；b代表公交车；t
(b)
(r,m)和d
(b)
(r,m)分别为公交车行程r在j路段、m时段的行驶时间(s)和行驶距离(m)；t
(b)
(j,m)和d
(b)
(j,m)分别为所有公交车在j路段、m时段的总行驶时间和行驶距离；l(j)是j路段的长度(m)；τ为交通数据集计时段长度(s)；k
(b)
(m)是子区区域路网按路段长度加权的平均公交车密度；j是子区区域内公交车路段数量；l为子区区域路网内的总车道长度；q
(b)
(m)是子区区域内公交车平均流量(veh/km)；s(j)是j路段的车道数；t
(b)
(m)和d
(b)
(m)分别为在j路段、m时段公交车的总行驶时间和总行驶距离。
[0181]
本领域技术人员可以理解，实现上述实施例的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成，相应的程序可以存储于计算机可读存储介质中。
[0182]
应当注意，尽管在附图中以特定顺序描述了上述实施例的方法操作，但是这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。相反，描绘的步骤可以改变执行顺序。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。
[0183]
实施例2：
[0184]
本实施例采用深圳市南山区、福田区和罗湖区的公交路网，以及2016年5月24日该区域内的公交车进出站gps数据和出租车gps数据进行公交路网划分实验，路网交通参数计算时间间隔为10min，在不同分区数量下分别进行30次划分实验。
[0185]
以子区均质度(asv)和子区间相似性(nsk)为评价指标，其计算公式如下所示：
[0186][0187][0188][0189][0190]
其中，k，kn为不同子区，neighbor(k)为与子区k相邻的子区；size[neighbor(k)]为与子区k相邻的子区数量；vi为路段i的公交路段速度；nk是子区k的路段数；k是子区数量；var(vk)是子区k的公交路段速度方差；u(vk)、为子区k、kn的公交路段速度均值。
[0191]
子区均质度以所有子区的子区内公交车路段速度方差均值来表示，数值越小说明子区内部同质性越高，越能满足公交路网划分的要求；子区间相似性反映子区与其相邻子区间的相似程度，数值越小，说明子区与其相邻子区的差异越大，越能满足路网划分中对子区间差异的要求。
[0192]
分区实验后，计算asv和nsk均值，结果如表1所示。在分区数量p为16时，实际分区效果如图10所示。
[0193]
表1各分区数量下的评价指标值(这个表的行数调整了一下)
[0194][0195]
与采用k-means方法进行公交路网分区相比，采用本发明所得到的asv和nsk更优，如图11所示。这说明本发明能获得子区内部均质度更高且子区间差异更明显的分区方案；加之，本发明的分区方法保证了子区内部的连通性和紧凑性，故认为本发明提供的方法能够很好地满足公交路网划分的要求。
[0196]
与多模式交通路网分区方式相比，本发明提供的方法所得到的asv和nsk明显更优，如图12所示，说明本发明方法能够更好地进行公交路网分区，从而更好的识别公交路网运行规律。
[0197]
本发明提供的方法可有效识别公交路网宏观基本图(公交路网运行规律)，利用深圳市同区域2016年5月24日-26日的公交车进出站gps数据、出租车gps数据以及路网数据等计算公交路网交通参数，以16子区为例，可识别出子区公交平均流量(以每公里计)-密度关
系，如图13所示。
[0198]
采用二次多项式函数对各子区宏观基本图进行拟合，在95％置信区间下，平均拟合优度r2为0.8853，均方根误差均值为0.1238；而多模式交通路网分区后，对其观测到的公交宏观基本图进行拟合，平均拟合优度r2为0.8585，均方根误差均值为0.1338。通过对比可知，与多模式交通路网分区相比，通过本发明进行公交路网分区后，可以观测到拟合优度较好地宏观基本图，这为将公交路网宏观基本图应用于公交管理和控制提供了良好的基础。
[0199]
实施例3：
[0200]
如图14所示，本实施例提供了一种基于多源交通数据的公交路网分区系统，该系统包括公交车路段速度计算模块1401、公交路网分区模块1402和公交路网宏观基本图生成模块1403，其中：
[0201]
公交车路段速度计算模块1401，用于在研究区域内，根据出租车gps数据和公交车进出站gps数据，计算公交车路段速度；其中包括对仅有出租车数据的路段，采用神经网络模型预测公交车路段速度；
[0202]
公交路网分区模块1402，用于根据所述公交车路段速度和路段邻接关系，实现公交路网分区；
[0203]
公交路网宏观基本图生成模块1403，用于对公交路网分区得到的子区，根据公交车进出站gps数据以及路网数据，计算公交车路网交通参数，从而得到公交路网宏观基本图。
[0204]
本实施例中各个模块的具体实现可以参见上述实施例1，在此不再一一赘述；需要说明的是，本实施例提供的系统仅以上述各功能模块的划分进行举例说明，在实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。
[0205]
实施例4：
[0206]
本实施例提供了一种计算机设备，该计算机设备可以为计算机，如图15所示，其通过系统总线1501连接的处理器1502、存储器、输入系统1503、显示器1504和网络接口1505，该处理器用于提供计算和控制能力，该存储器包括非易失性存储介质1506和内存储器1507，该非易失性存储介质1506存储有操作系统、计算机程序和数据库，该内存储器1507为非易失性存储介质中的操作系统和计算机程序的运行提供环境，处理器1502执行存储器存储的计算机程序时，实现上述实施例1的公交路网分区方法，如下：
[0207]
在研究区域内，根据出租车gps数据和公交车进出站gps数据，计算公交车路段速度；其中包括对仅有出租车数据的路段，采用神经网络模型预测公交车路段速度；
[0208]
根据所述公交车路段速度和路段邻接关系，实现公交路网分区；
[0209]
对公交路网分区得到的子区，根据公交车进出站gps数据以及路网数据，计算公交车路网交通参数，从而得到公交路网宏观基本图。
[0210]
实施例5：
[0211]
本实施例提供了一种存储介质，该存储介质为计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时，实现上述实施例1的公交路网分区方法，如下：
[0212]
在研究区域内，根据出租车gps数据和公交车进出站gps数据，计算公交车路段速度；其中包括对仅有出租车数据的路段，采用神经网络模型预测公交车路段速度；
[0213]
根据所述公交车路段速度和路段邻接关系，实现公交路网分区；
[0214]
对公交路网分区得到的子区，根据公交车进出站gps数据以及路网数据，计算公交车路网交通参数，从而得到公交路网宏观基本图。
[0215]
综上所述，本发明通过融合实际路网中的公交车进出站gps数据、出租车gps数据以及道路结构数据等进行路网交通参数计算；采用神经网络模型对数据缺失路段进行公交路段速度补齐；以公交车路段速度和路段邻接关系为依据，采用初始小区生成、子区合并和边界调整三步法将异质公交路网划分为子区内部速度均匀、子区间速度差异显著的多个子区，从而为识别公交路网运行规律奠定基础，并为公交资源优化配置提供决策依据。
[0216]
需要说明的是，本实施例的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0217]
综上所述，本发明以公交路网划分为研究对象，融合实际路网中的公交车进出站gps数据、出租车gps数据以及道路结构数据，提出了采用神经网络预测模型对数据缺失路段进行公交路段速度补齐，然后以公交车路段速度及路段邻接关系为依据对公交路网进行划分，并且采用密度峰值聚类法确定初始小区中心，然后将速度相近的相邻路段聚类形成初始小区，有利于降低初始子区内的公交路段速度方差，经过后续的子区合并和边界调整后，可得到子区内部速度更均匀、子区间差异更明显的公交路网划分结果，从而提高公交路网划分质量。本发明提供的方法可将异质公交路网进行同质性划分，为识别公交运行规律奠定基础。
[0218]
以上所述，仅为本发明专利较佳的实施例，但本发明专利的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明专利所公开的范围内，根据本发明专利的技术方案及其发明构思加以等同替换或改变，都属于本发明专利的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：韩霜严坤海傅惠王叶飞
技术所有人：广东工业大学
我是此专利的发明人

上一篇：一种掘锚机滚筒用机械大臂内置接线盒结构的制作方法
上一篇：光学成像镜头的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。