本发明涉及公交线路运营时间特征分析和划分,具体涉及一种基于时间序列聚类的公交运营时段划分方法。
背景技术:
1、公交线路全天的运营时间通常跨度较大,在一天中的不同时间段乘客需求和道路交通状况会有很大的波动,进而影响了公交车辆的行程时间,对公交到发时间准点性造成了显著的影响。根据不同时段的特征对全天运营时间进行合理的划分是提高服务水平的关键。目前,在公交的实际运营中,通常是根据当地通勤时间规律并结合历史经验,给定线路的高、平、低峰起止时间,这一方法准确性不高,且容易忽视不同时段的特征差异。
技术实现思路
1、针对现有技术的不足,本发明旨在提供一种基于时间序列聚类的公交运营时段划分方法,利用较容易获取的行程时间数据反映乘客需求和道路交通状况在各时段的特征,兼顾考虑了行程时间对公交到发准点性的影响。
2、为了实现上述目的,本发明采用如下技术方案:
3、基于时间序列聚类的公交运营时段划分方法,包括以下步骤:
4、步骤1:输入公交线路的行程时间数据和对应的发车时刻,根据线路服务水平要求设置同时段行程时间的允许标准偏差和公交运营时段最小长度,作为时段划分参数;时段划分参数包括同时段内的行程时间前向标准偏差δ-、后向标准偏差δ+、公交运营时段最小长度tmin;
5、步骤2:按发车时刻统计行程时间数据集:具有相同发车时刻的行程时间数据归入同一数据集,将发车时刻记为该数据集对应的时间戳;统计各数据集的中位数,并各数据集转化为中位数与时间戳表示的样本特征点;各样本特征点对应不同的发车时间戳,且发车时间戳按“小时:分钟”(即hh:mm)格式计,所有发车时间戳代表了目标线路全天运营时间段;
6、步骤3:使用处理得到的所有样本特征点进行多中心聚类,不预设聚类中心数量,而是通过对样本特征点的分析、迭代和更新找到最合适聚类中心数,进而得到样本特征点的聚类结果;
7、步骤4:根据聚类结果,对样本特征点进行基于时间顺序的合并:每个样本特征点对应一个类别标签和一个时间戳标签,先按时间戳顺序对所有样本特征点进行排序,然后在得到的序列中,若相邻两个样本特征点拥有相同的类别标签,则合并至同一个时段;合并完成后,检验是否存在某时段的长度小于步骤1中设置的公交运营时段最小长度值tmin,将其与前一时段或后一时段进行合并。
8、进一步地,步骤1中,所述时段划分参数还包括最大时段划分数n。
9、进一步地,步骤1中,若某一数据集合为x={x1,x2,x3,…,xn-,xn},中位数为m,小于中位数的数据集合为x-={xi|xi<m,xi∈x},大于中位数的数据集合为x+={xi|xi>m,xi∈x},则前向偏差σ-为:后向偏差σ+为此处|*|表示集合的元素数量,而前向标准偏差δ-、后向标准偏差δ+分别为前向偏差和后向偏差的标准值,前向标准偏差δ-、后向标准偏差δ+表示了行程时间数据的波动范围。
10、进一步地,步骤3中,所述多中心聚类的具体过程如下:
11、3.1)输入样本特征点集s,初始聚类中心数m=1,并从所有样本特征点中随机选择一个作为初始聚类中心c1;
12、3.2)依次计算所有样本特征点s∈s与各聚类中心ci,i=1,2…,m间的距离差:ds={dsi=|s-ci||i=1,2…,m},然后将样本特征点s∈s归入距离最近的中心i所对应的类别中,i=argmin ds(i);
13、3.3)所有样本特征点完成归类后,将各类所包含的样本特征点中位数设置为该类新的聚类中心,并与更新前的聚类中心对比;若存在某聚类中心位置发生变化,则返回步骤3.2),否则转至步骤3.4);
14、3.4)各聚类中心不再变化后,计算各类中样本特征点对应的所有原行程时间数据集的前向偏差和后向偏差:若所有类对应的行程时间数据集合均满足σ-≤δ-且σ+≤δ+,则聚类完成输出聚类结果,即每个样本特征点将新增一个类别标签;否则,令聚类中心数m=m+1并随机选择一个样本特征点作为新增类的聚类中心,然后返回3.2)。
15、进一步地,步骤4中,若存在某时段的长度小于tmin需要进一步合并时,需分别计算该时段与前一时段或后一时段合并的情况下,所得新时段内对应的行程时间数据集的前向偏差和后向偏差:若向前一时段合并所得的前向偏差和后向偏差均小于向后一时段合并所得的前向偏差和后向偏差,则与前一时段合并;若向后一时段合并所得的前向偏差和后向偏差均小于向前一时段合并所得的前向偏差和后向偏差,则与后一时段合并;否则计算两种情况下所得的前向偏差和后向偏差之和,与前向偏差和后向偏差之和较小的时段合并;若存在多个时段长度小于tmin,则按照时段长度由小到大的顺序依次进行合并;若不存在,则时段划分完成,输出结果。
16、更进一步地,若预设了最大时段划分数n且在步骤1-步骤4完成后所得时段数仍大于n,则按剩余时段长度由小到大的顺序继续进行相邻时段的合并,直至时段数量减少至n时,输出时段划分结果。
17、本发明的有益效果在于:本发明方法利用行程时间来刻画公交运营时段特征,数据获取简便易行,实现了基于运营特征的时段划分,能够有效帮助提高公交运营准点性、提升服务水平,具备实际应用价值。
18、具体地,本发明所提出的基于时间序列的多中心聚类算法可以兼顾无给定目标时段数、给定目标时段数两种场景,可供公交运营者根据实际情况选用,适用范围更广;同时,时段划分是公交时刻表设计的基础,本发明在基于历史数据分析的基础上对公交运营时段进行划分,考虑了不同时段的运营特性,能够帮助提高时刻表的准确性、提升公交运营的服务水平。
1.基于时间序列聚类的公交运营时段划分方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,步骤1中,所述时段划分参数还包括最大时段划分数n。
3.根据权利要求1所述的方法,其特征在于,步骤1中,若某一数据集合为x={x1,x2,x3,…,xn-,xn},中位数为m,小于中位数的数据集合为x-={xi|xi<m,xi∈x},大于中位数的数据集合为x+={xi|xi>m,xi∈x},则前向偏差σ-为:后向偏差σ+为此处|*|表示集合的元素数量,而前向标准偏差δ-、后向标准偏差δ+分别为前向偏差和后向偏差的标准值,前向标准偏差δ-、后向标准偏差δ+表示了行程时间数据的波动范围。
4.根据权利要求1所述的方法,其特征在于,步骤3中,所述多中心聚类的具体过程如下:
5.根据权利要求1所述的方法,其特征在于,步骤4中,若存在某时段的长度小于tmin需要进一步合并时,需分别计算该时段与前一时段或后一时段合并的情况下,所得新时段内对应的行程时间数据集的前向偏差和后向偏差:若向前一时段合并所得的前向偏差和后向偏差均小于向后一时段合并所得的前向偏差和后向偏差,则与前一时段合并;若向后一时段合并所得的前向偏差和后向偏差均小于向前一时段合并所得的前向偏差和后向偏差,则与后一时段合并;否则计算两种情况下所得的前向偏差和后向偏差之和,与前向偏差和后向偏差之和较小的时段合并;若存在多个时段长度小于tmin,则按照时段长度由小到大的顺序依次进行合并;若不存在,则时段划分完成,输出结果。
6.根据权利要求2所述的方法,其特征在于,若预设了最大时段划分数n且在步骤1-步骤4完成后所得时段数仍大于n,则按剩余时段长度由小到大的顺序继续进行相邻时段的合并,直至时段数量减少至n时,输出时段划分结果。