一种城市空中交通UAM流量预测方法及系统

文档序号:31341708发布日期:2022-08-31 10:28阅读:527来源:国知局
一种城市空中交通UAM流量预测方法及系统
一种城市空中交通uam流量预测方法及系统
技术领域
1.本发明涉及数据预测技术领域,尤其涉及一种城市空中交通uam流量预测方法及系统。


背景技术:

2.近年来,随着急速城镇化和汽车消费的扩张,城市交通拥堵问题日益严峻,而通过限行等方式控制交通出行量、扩建城市道路和发展公共交通等措施仍然难以解决大型城市的交通拥堵问题。而城市空中交通(urban air mobility,简称uam)作为一种全新的交通出行模式,其运行在城市的低空区域,可以有效避免挤占城市地面交通资源,是缓解城市交通拥堵问题的全新方案。
3.目前,由于城市空中交通这种新型出行方式尚处于发展前期阶段,尚未有城市普及uam这种出行方式,因此现阶段对uam的潜在流量预测十分困难。
4.现有的对城市空中交通需求预测方法多采用logit模型进行交通出行方式划分,或构建数学模型来判断潜在的uam出行需求。而利用logit模型划分出行方式,需要提前通过出行数据对logit模型进行参数标定,但是在缺少uam出行样本的情况下如何标定logit模型的参数确保能够对出行方式进行准确划分是一个难题。另一方面,通过数学模型来判断潜在的uam旅行这种方式得到的结果很大程度依赖于模型的具体参数设置,难以从客观事实的角度去预测真实的潜在uam流量。


技术实现要素:

5.鉴于上述的分析,本发明实施例旨在提供一种城市空中交通uam流量预测方法及系统,用以解决现有缺少uam出行样本的情况下流量预测困难的问题。
6.一方面,本发明实施例提供了一种城市空中交通uam流量预测方法,包括如下步骤:基于同一区域,构建训练样本集,训练样本集包括uam地区的交通出行目标样本集和非uam地区的地面交通出行辅助样本集;根据非uam地区中uam起降点位置构建泰森多边形集合;基于改进的boosting算法对训练样本集进行迭代训练得到多个弱分类器;其中每次训练时根据当前弱分类器对目标样本集的分类错误率,设置当前弱分类器的权重和更新目标样本集的样本权重,以及结合辅助样本集中样本的分类标签和置信概率,更新辅助样本集的样本权重和原始标签,根据更新后的训练样本集训练下一个弱分类器;加权组合各弱分类器得到预测模型;再次获取非uam地区的地面交通出行数据作为待预测数据集,传入预测模型中,将被分类为uam的待预测数据映射至泰森多边形集合中,预测出非uam地区的uam出行流量。
7.基于上述方法的进一步改进,训练样本集中每个样本包括出行特征向量和原始标签,其中出行特征向量包括:出行时长、出行费用、出行距离、出行者年龄、出行时段、出行者
性别、出行者最高学历、出行者是否拥有私家车和出行者年收入,目标样本集的原始标签包括:uam、公交、地铁、出租车和私家车;辅助样本集的原始标签包括:公交、地铁、出租车和私家车。
8.基于上述方法的进一步改进,当前弱分类器对目标样本集的分类错误率是目标样本集中分类标签与原始标签不一致的样本权重之和。
9.基于上述方法的进一步改进,当前弱分类器的权重通过下式设置:目标样本集的样本权重通过下式更新:其中,αk为第k个弱分类器的权重,ek为第k个弱分类器对目标样本集的分类错误率,为目标样本集中第i个样本在第k个弱分类器中的样本权重,为目标样本集中第i个样本的出行特征向量,为目标样本集中第i个样本的原始标签,为目标样本集中第i个样本在第k个弱分类器中的分类标签,为更新样本权重时目标样本集中第i个样本在第k个弱分类器中分类正确或错误时的值。
10.基于上述方法的进一步改进,结合辅助样本集中样本的分类标签和置信概率,更新辅助样本集的样本权重和原始标签,包括:对辅助样本集中分类标签为非uam的样本更新样本权重;将辅助样本集中分类标签为uam的样本作为待处理样本,获取各待处理样本被当前弱分类器分类到的叶子结点中的样本集合,并计算出各待处理样本的uam置信概率;按uam置信概率从大到小排序各待处理样本后,将uam置信概率前z的待处理样本的原始标签更新为uam,并更新所有待处理样本的样本权重,其中,z∈1,2,...,z
max-1,z
max
为待处理样本的数量。
11.基于上述方法的进一步改进,通过下式对辅助样本集中分类标签为非uam的样本更新样本权重:权重:其中,为辅助样本集中被分类为非uam的第jn个样本在第k个弱分类器中的样本权重,为辅助样本集中被分类为非uam的第jn个样本的出行特征向量,为辅助样本集中被分类为非uam的第jn个样本的原始标签,为辅助样本集中被分类为非
uam的第jn个样本在第k个弱分类器中的分类标签,为更新样本权重时辅助样本集中被分类为非uam的第jn个样本在第k个弱分类器中分类正确或错误时的值。
12.基于上述方法的进一步改进,各待处理样本的uam置信概率是各待处理样本所在的样本集合中原始标签为uam的样本数量的比例。
13.基于上述方法的进一步改进,通过下式更新所有待处理样本的样本权重:其中,为辅助样本集中第ju个待处理样本,为辅助样本集中第ju个待处理样本在第k个弱分类器中的样本权重,为各待处理样本所在的样本集合,为uam置信概率前z的待处理样本所在的样本集合。
14.基于上述方法的进一步改进,待预测数据集中每条数据包括出行起止点的经纬度坐标、出行特征向量和原始标签;将被分类为uam的待预测数据映射至泰森多边形集合中,预测出uam出行流量,包括:对被分类为uam的待预测数据,依次根据每条待预测数据的起止点的经纬度坐标,得到每个起点和终点所在的泰森多边形;将该泰森多边形对应的uam起降点之间的流量递增1;汇总uam起降点中任意两点间的流量,预测出uam出行流量。
15.另一方面,本发明实施例提供了一种城市空中交通uam流量预测系统,包括:数据处理模块,用于基于同一区域,构建训练样本集,训练样本集包括uam地区的交通出行目标样本集和非uam地区的地面交通出行辅助样本集;根据非uam地区中uam起降点位置构建泰森多边形集合;以及,再次获取非uam地区的地面交通出行数据作为待预测数据集;模型训练模块,用于基于改进的boosting算法对训练样本集进行迭代训练得到多个弱分类器;其中每次训练时根据当前弱分类器对目标样本集的分类错误率,设置当前弱分类器的权重和更新目标样本集的样本权重,以及结合辅助样本集中样本的分类标签和置信概率,更新辅助样本集的样本权重和原始标签,根据更新后的训练样本集训练下一个弱分类器;加权组合各弱分类器得到预测模型;流量预测模块,用于将待预测数据集传入预测模型中,将被分类为uam的待预测数据映射至泰森多边形集合中,预测出非uam地区的uam出行流量。
16.与现有技术相比,本发明至少可实现如下有益效果之一:1、实现在城市尚未覆盖uam出行方式的情况下,利用有大量标注的非uam地区样本的地面交通出行数据,来辅助uam地区较少的样本训练出行方式分类模型,同时在训练过程中实现在非uam地区样本中生成选择uam的样本,提高了分类准确性,这为现阶段对uam起降点流量预测提供了一个全新的解决方案;2、结合泰森多边形更合理地表示不同uam起降点的服务区域,建立出行起止对和uam起降点的关联关系,从而实现uam起降点之间的流量预测;
3、基于规划阶段决策者自主选择的uam起降点位置集合,通过本方案的预测方法得到uam起降点间的流量预测结果,根据预测结果综合评估,取消流量偏低的uam起降点,或者参考预测流量调整uam起降点基础设施建设规模,从而辅助uam起降点选址和建设等决策工作。
17.本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。
附图说明
18.附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件:图1为本发明实施例1中城市空中交通uam流量预测方法流程图。
具体实施方式
19.下面结合附图来具体描述本发明的优选实施例,其中,附图构成本技术一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
20.实施例1本发明的一个具体实施例,公开了一种城市空中交通uam流量预测方法,如图1所示,包括如下步骤:s11:基于同一区域,构建训练样本集,训练样本集包括uam地区的交通出行目标样本集和非uam地区的地面交通出行辅助样本集;根据非uam地区中uam起降点位置构建泰森多边形集合。
21.需要说明的是,目标样本集和辅助样本集在时间范围上属于同一时期的交通出行数据,例如同为2021年的交通出行调查数据,在空间范围上目标样本集来自于uam地区,辅助样本集则来自于同一区域的非uam地区,比如同一城市的非uam地区,其中uam地区表示覆盖uam出行方式的地区,非uam地区为未覆盖uam出行方式的地区。
22.具体来说,训练样本集中每个样本包括出行特征向量和原始标签,其中出行特征向量包括:出行时长、出行费用、出行距离、出行者年龄、出行时段、出行者性别、出行者最高学历、出行者是否拥有私家车和出行者年收入;原始标签是训练样本集中每个出行者每次选择的出行方式,其中目标样本集的原始标签包括:uam、公交、地铁、出租车和私家车;辅助样本集的原始标签包括:公交、地铁、出租车和私家车。由于本发明的预测目标uam出行方式具有远距离出行的特点,因此不考虑步行或骑行等出行方式。
23.目标样本集ta和辅助样本集tb分别表示为:分别表示为:其中,n为目标样本集的样本数量,m为辅助样本集的样本数量;目标样本集ta中第
i个样本的出行特征向量(i=1,2,...,n),辅助样本集tb中第j个样本的出行特征向量(j=1,2,...,m)分别表示为:(j=1,2,...,m)分别表示为:其中,出行特征向量中,为出行时长(分钟),,为出行费用(元),,为出行距离(千米),这三种特征是连续型特征;,为出行者年龄,,为出行时段,,为出行者性别,,为出行者最高学历,,为出行者是否拥有私家车,,为出行者年收入,这六种特征是离散型特征。
24.示例性地,出行者性别={男,女},出行者最高学历={小学,初中,高中,专科,本科,研究生,未受教育},出行时段={0,1,2,3,4,5,6}分别对应一天的6个时段,其中:0代表00:00-06:00,1代表06:00-10:00,2代表10:00-13:00,3代表13:00-16:00,4代表16:00-20:00,5代表20:00-24:00,出行者是否拥有私家车={是,否},出行者年收入={5万以下,5-10万,10-20万,20-50万,50万以上}。
25.目标样本集ta中第i个样本的原始标签(i=1,2,...,n),辅助样本集tb中第j个样本的原始标签(j=1,2,...,m)分别表示为:(j=1,2,...,m)分别表示为:需要说明的是,本实施例基于规划部门提前拟定的uam起降点位置构建泰森多边形集合,对t个uam起降点构建泰森多边形,每个泰森多边形内仅包含一个起降点,其中第t个泰森多边形p
t
覆盖区域代表位于其中的第t个uam起降点的服务范围。结合泰森多边形更合理地表示了不同uam起降点的服务区域,建立了出行起止对和uam起降点的关联关系,便于实现uam起降点之间的流量预测。
26.具体来说,构建泰森多边形集合的步骤如下:

由t个uam起降点构建delaunay三角网,同时对每个三角形进行编号,并记录每个三角形的三个uam起降点;

记录每个uam起降点的相邻三角形,即在已构建的三角网中找到以该uam起降点为顶点的所有三角形;

依次计算每个uam起降点的相邻三角形的外接圆圆心,连接这些外接圆圆心即得到包含当前uam起降点的泰森多边形,放入泰森多边形集合中。
27.s12:基于改进的boosting算法对训练样本集进行迭代训练得到多个弱分类器;其中每次训练时根据当前弱分类器对目标样本集的分类错误率,设置当前弱分类器的权重和更新目标样本集的样本权重,以及结合辅助样本集中样本的分类标签和置信概率,更新辅
助样本集的样本权重和原始标签,根据更新后的训练样本集训练下一个弱分类器。
28.需要说明的是,本步骤是利用有大量标注的辅助集,来辅助样本数较少的目标样本集训练出行方式分类模型(即多个弱分类器),同时在训练过程中自动实现辅助样本集中uam样本的生成。
29.通过以下步骤s121-步骤s126详细说明每次迭代训练的过程:s121:初始化训练样本集的样本权重。
30.具体来说,首先根据目标样本集和辅助样本集的数量均匀分布各自的样本权重,即目标样本集中初始样本权重为1/n,辅助样本集中初始样本权重为1/m。
31.其次,对目标样本集和辅助样本集分别设置归一化权重ρa和ρ
b ,即使归一化后的两个数据集样本权重之和为1,示例性地,当两个样本集数量接近时,ρa和ρb均可设置为0.5,那么目标样本集中初始样本权重更新为ρa/n,辅助样本集中初始样本权重更新为ρb/m。
32.最后,经过归一化更新后目标样本集和辅助样本集的初始样本权重之和满足下式:其中,为目标样本集中第i个样本的初始归一化后的样本权重,为辅助样本集中第j个样本的初始归一化后的样本权重。
33.合并目标样本集和辅助样本集,完成训练样本集的初始化。
34.s122:根据训练样本集生成弱分类器。
35.优选地,弱分类器采用cart(classification and regression tree,分类回归树)模型,具体来说,训练过程包括:

根据训练样本集中每个样本的出行特征向量,计算每个特征的每一个切分点的样本权重加权基尼系数;

选择加权基尼系数最小的特征及对应切分点作为最优特征和最优切分点,根据最优特征和最优切分点将训练样本集分配到两个子节点中;

对两个子节点递归调用上述



,直到满足停止条件,生成第k个弱分类器gk(x),k=1,2,...,k,其中k为最大迭代次数。
36.示例性地,设置k为10,则得到10个弱分类器。
37.s123:根据当前弱分类器对目标样本集的分类错误率,设置当前弱分类器的权重和更新目标样本集的样本权重。
38.需要说明的是,当前弱分类器对目标样本集的分类错误率是目标样本集中分类标签与原始标签不一致的样本权重之和,通过下式计算得到:签与原始标签不一致的样本权重之和,通过下式计算得到:其中,ek为第k个弱分类器对目标样本集的分类错误率,n为目标样本集中的样本数量,为目标样本集中第i个样本在第k个弱分类器中的样本权重,为目标样本集中
第i个样本的出行特征向量,为目标样本集中第i个样本的原始标签,为目标样本集中第i个样本在第k个弱分类器中的分类标签,为计算分类错误率时目标样本集中第i个样本在第k个弱分类器中分类正确或错误时的值,当分类正确时,该值为0,当分类错误时,该值为1。
39.如果目标样本集ta的错误率越低,那么当前弱分类器的权重αk应该越大,因此,当前弱分类器的权重通过下式设置:目标样本集中每个样本权重更新策略为:当其中样本分类正确时,则降低样本权重,当其中样本分类错误时,则增大样本权重,使下一轮训练的弱分类器重点关注分类错误的这部分目标样本,通过下式更新其中每个样本权重:下式更新其中每个样本权重:其中,为目标样本集中第i个样本更新后的权重,用于训练第k+1个弱分类器;为更新样本权重时目标样本集中第i个样本在第k个弱分类器中分类正确或错误时的值,当分类正确时,该值为1,当分类错误时,该值为-1。
40.s124:结合辅助样本集中样本的分类标签和置信概率,更新辅助样本集的样本权重和原始标签。
41.具体来说,根据辅助样本集中各样本的分类标签进行分类处理,包括:

对辅助样本集中分类标签为非uam的样本更新样本权重。
42.当辅助样本集中的样本被分类为非uam,即公交、地铁、出租车和私家车中任一种时,分类正确的样本则认为其特征空间和目标样本集相似,则增大其样本权重;当分类错误时,则认为其特征空间和目标数据集差异较大,则减小其样本权重,因此,通过下式对辅助样本集中分类标签为非uam的样本更新样本权重:样本集中分类标签为非uam的样本更新样本权重:其中,为辅助样本集中第jn个样本更新后的权重,用于训练第k+1个弱分类器;辅助样本集中被分类为非uam的第jn个样本在第k个弱分类器中的样本权重,为辅助样本集中被分类为非uam的第jn个样本的出行特征向量,为辅助样本集中被分类为非uam的第jn个样本的原始标签,为辅助样本集中被分类为非uam的第jn个
样本在第k个弱分类器中的分类标签,为更新样本权重时辅助样本集中被分类为非uam的第jn个样本在第k个弱分类器中分类正确或错误时的值,当分类正确时,该值为1,当分类错误时,该值为-1。
43.②
将辅助样本集中分类标签为uam的样本作为待处理样本,获取各待处理样本被当前弱分类器分类到的叶子结点的样本集合,并计算出各待处理样本的uam置信概率;按uam置信概率从大到小排序各待处理样本后,将uam置信概率前z的待处理样本的原始标签更新为uam,并更新所有待处理样本的样本权重,其中,z∈1,2,...,z
max-1,z
max
为待处理样本的数量。
44.需要说明的是,由于辅助样本集中不存在原始标签为uam的样本,因此辅助样本集中的样本被分类为uam时,结果一定为错误,作为待处理样本进行下面的处理。
45.获取待处理样本被当前弱分类器分类到的叶子结点的样本集合,根据其中的样本数量dv,计算出待处理样本的uam置信概率,即样本集合中原始标签为uam的样本数量的比例,用下式表示:按uam置信概率从大到小排序各待处理样本后,选取uam置信概率前z的待处理样本所在的样本集合,对样本集合中待处理样本的原始标签进行修改,用分类标签“uam”更新原始标签,即:需要说明的是,z是经验值,根据实际样本量和uam置信概率来设置,z∈1,2,...,z
max-1,z
max
为待处理样本的数量。
46.通过下式更新所有待处理样本的样本权重:其中,为辅助样本集中第ju个待处理样本,为辅助样本集中第ju个待处理样本在第k个弱分类器中的样本权重,为各待处理样本所在的样本集合,为uam置信概率前z的待处理样本所在的样本集合。
47.通过上述两种情况,完成对辅助样本集的样本权重的更新,即:s125:归一化目标样本集和辅助样本集的样本权重。
48.需要说明的是,为保证更新后的样本权重仍为一个概率分布,使用下式的规范化因子zk:
通过下式对目标样本集更新后的权重和辅助样本集更新后的权重进行归一化:进行归一化:归一化后的样本权重满足和为1,如下所示:合并目标样本集和辅助样本集的归一化后的样本权重,作为更新后的训练样本集的样本权重。s126:判断当前迭代次数是否达到最大迭代次数,如果已达到,则退出迭代,完成多个弱分类器的训练;如果未达到,根据更新后的训练样本集,返回至步骤s122,训练下一个弱分类器。
49.s13:加权组合各弱分类器得到预测模型。
50.具体来说,通过下式得到预测模型:s14:再次获取非uam地区的地面交通出行数据作为待预测数据集,传入预测模型中,将被分类为uam的待预测数据映射至泰森多边形集合中,预测出非uam地区的uam出行流量。
51.需要说明的是,用于预测uam流量的待预测数据集仍然来自于与辅助样本集相同的非uam地区,但数据的时间范围不同,而且在处理数据时,除了获取每个出行者的出行特征向量和原始标签,还需要根据出行者的出行记录,提取出起止点的经纬度坐标。
52.具体来说,待预测数据集tc表示如下:其中,l为待预测数据集的样本数量,,分别为第l个样本的起止点的经纬度坐标,l=1,2,...,l。
53.将待预测数据集传入式(23)得到的预测模型f(x),根据下式得到每条待预测数据的各种出行方式概率,而出行方式概率最大时的出行方式即为预测的分类结果:其中,出行方式包括:uam、公交、地铁、出租车和私家车。
54.由于本实施例是预估城市空中交通uam出行流量,因此仅考虑最大出行方式概率为uam的待预测数据,即通过预测模型被分类为uam的待预测数据,表示当该地区覆盖uam出行方式时,该出行者会优先选择uam出行方式。
55.示例性地,采集某区域非uam地区4月份的出行数据1万条用于预测,其中有500条数据最大出行方式概率为uam,即表示这500条数据被预测为uam出行,那么当非uam地区覆
盖了uam出行方式后,在4月份,这1万条出行数据中将有这500个出行选择uam出行。
56.需要说明的是,将被分类为uam的待预测数据映射至所述泰森多边形集合中,预测出uam出行流量的步骤包括:对被分类为uam的待预测数据,依次根据每条待预测数据的起止点的经纬度坐标,得到每个起点和终点所在的泰森多边形;将该泰森多边形对应的uam起降点之间的流量递增1;汇总uam起降点中任意两点间的流量,预测出uam出行流量。
57.具体来说,uam起降点中p点和q点间的流量用下式计算得到:点和q点间的流量用下式计算得到:其中,u=1,2,...,l,表示待测试数据集中第u条数据被分类为uam,r
p
和rq分别表示uam起降点中p点和q点所在的泰森多边形覆盖区域,和分别表示待测试数据集中第u条数据的起止点的经纬度坐标。
58.优选地,对t个uam起降点建立t
×
t的uam流量矩阵,矩阵中每个元素表示该元素所对应的两个起降点间的流量。
59.与现有技术相比,本实施例提供的一种城市空中交通uam流量预测方法,实现在城市尚未覆盖uam出行方式的情况下,利用有大量标注的非uam地区样本的地面交通出行数据,来辅助uam地区较少的样本训练出行方式分类模型,同时在训练过程中实现在非uam地区样本中生成选择uam的样本,提高了分类准确性,这为现阶段对uam起降点流量预测提供了一个全新的解决方案;结合泰森多边形更合理地表示不同uam起降点的服务区域,建立出行起止对和uam起降点的关联关系,从而实现uam起降点之间的流量预测;根据预测结果综合评估,取消流量偏低的uam起降点,或者参考预测流量调整uam起降点基础设施建设规模,从而辅助uam起降点选址和建设等决策工作。
60.实施例2本发明的另一个实施例,公开了一种城市空中交通uam流量预测系统,从而实现实施例1中的uam流量预测方法。各模块的具体实现方式参照实施例1中的相应描述。包括:数据处理模块,用于基于同一区域,构建训练样本集,训练样本集包括uam地区的交通出行目标样本集和非uam地区的地面交通出行辅助样本集;根据非uam地区中uam起降点位置构建泰森多边形集合;以及,再次获取非uam地区的地面交通出行数据作为待预测数据集;模型训练模块,用于基于改进的boosting算法对训练样本集进行迭代训练得到多个弱分类器;其中每次训练时根据当前弱分类器对目标样本集的分类错误率,设置当前弱分类器的权重和目更新标样本集的样本权重,以及结合辅助样本集中样本的分类标签和置信概率,更新辅助样本集的样本权重和原始标签,根据更新后的训练样本集训练下一个弱分类器;加权组合各弱分类器得到预测模型;流量预测模块,用于将待预测数据集传入预测模型中,将被分类为uam的待预测数
据映射至泰森多边形集合中,预测出非uam地区的uam出行流量。
61.由于本实施例uam流量预测系统与前述uam流量预测方法相关之处可相互借鉴,此处为重复描述,故这里不再赘述。由于本系统实施例与上述方法实施例原理相同,所以本系统也具有上述方法实施例相应的技术效果。
62.本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
63.以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1