本发明涉及降雨积水的交通管理领域,具体而言,涉及针对路网结构以及地表特征对区域积水的影响预测及降雨场景下的道路速度预测方法。
背景技术:
1、径流,即降雨、融雪或灌溉水中,未被吸收或蒸发而在地表流动或从地下渗出的部分。城市结构中,绿地、水体等低影响开发设施对于降水有着渗透、存储、调节的作用;然而,建筑表面、道路路面的结构会作用于雨水径流,影响降雨的汇流与传输。因此,城市结构的不合理设计与利用,可能导致出现积水甚至内涝。
2、交通系统的运行对降雨等不良天气十分敏感。降雨对交通系统的影响日益严重。一方面,降雨可能会破坏交通系统的连接结构,造成道路拓扑结构部分(车道关闭)或彻底(道路封闭)改变,进而影响城市居民的出行需求以及分布;另一方面,降雨还会干扰驾驶员行车,例如地面雨水会降低摩擦系数导致制动困难、降雨量过大会干扰视线等。进一步而言,降雨对路网结构、路面以及驾驶员操作的影响,最终体现于路段通行能力下降,导致出现拥堵,严重时还会威胁机动车、非机动车、行人安全。
3、另一方面,互联网技术与地图技术(如开源地图技术、基于位置信息的服务)的发展,使得获取准确、小时空尺度的天气数据,大范围、矢量化的路网数据以及高质量、准实时的道路交通数据成为可能,为降雨的交通影响研究提供了新数据源和新思路。
4、速度在《公路通行能力手册》中被选为服务水平评价的指标之一。降雨场景下,路段速度往往会呈现不同的规律。从理论基础角度来看,速度能够较为直观地刻画交通流,如经典的“流量-密度-速度”基本图就将速度作为描述交通流状态的要素之一;从数据资源角度来看,速度数据的获取方法多样,浮动车调查、gps、超声波监测等经典交通调查方法都可得到车辆或路段的速度情况。降雨场景下道路速度的分析与预测是降雨交通影响分析的重要内容,在交通管控、交通安全等领域都有着重要的理论研究与应用价值。
5、现有研究中的预测方法可以分为参数模型以及非参数模型。参数模型的代表有卡尔曼滤波、线性回归、时间序列模型等。非参数模型的代表有随机森林、支持向量回归和深度学习等。例如,2021年刊登在《journal of transportation engineering,part a:systems》题为《improving short-term travel speed prediction with high-resolution spatial and temporal rainfall data》文章里,corey等基于雷达与雨量计数据构建了基于lasso模型、支持向量机模型、随机森林模型以及k近邻模型的组合预测模型。
6、但现有方法在以下方面存在不足:
7、1、降雨量空间估计方面。降雨量空间估计相关研究中,采用的数据时空粒度较大。从空间角度来看,研究多以流域、城市群等大尺度的区域为分析对象,对街道等级展开分析的研究较少;从时间角度来看,研究多采用档案化的历史数据,实时性有待提高。
8、2、区域与路段积水分析方面。降雨积水相关的研究,或模型复杂、计算量大,或仅从数据角度出发而缺少对“降雨-路网-积水”这一流程的全面考虑。单纯基于自然降雨情况估计或直接对于位置固定且离散的历史积水点进行建模,可能会使得模型的解释能力降低,进而造成该模型适用性弱、难以推广;针对城市尺度进行降雨过程模拟,对数据种类要求多、精度要求高,输出结果的准确性受输入材料的影响大,同时计算成本较高。
9、3、现有的降雨场景速度预测模型没有单独考虑降雨或积水风险作为输入,并且在引入降雨因素时灵活性较低,多忽略降雨量的时空序列特点,使用大时空粒度的降雨数据展开研究。
10、4、侧重从速度数据的分析与挖掘的角度对比降雨前后数据集统计量、指标的变化,而较少对降雨的作用机制以及作用程度展开分析。实时的交通流预测与精细的交通管控需要对降雨的影响进行更客观、更细节的刻画。
技术实现思路
1、本发明的目的在于提供一种基于积水风险预测等级的路段速度多步预测方法,是基于smote均衡以及logistic回归的路段积水风险分析模型的积水风险等级预测进行的lstm多元时间序列多步预测模型道路速度预测方法。
2、为了实现本发明目的,本发明提供的基于积水风险预测等级的路段速度多步预测方法,包括如下步骤:
3、s1、基于地图数据,提取路网特征及地面特征数据,结合降雨数据构建降雨数据集以及带有降雨天气的城市路段速度时间长序列数据集,构建积水网络;
4、s2、将积水风险点列表数据与地图结合,构建积水风险区间,并将当日降雨量与当日最大n小时降雨量作为基于集成插值法的降雨量输入模型,所得的网格降雨量估计值输入积水风险预测模型,构建网格积水风险样本案例库;
5、s3、smote过采样,通过在特征空间进行线性插值,将样本量稀少的中高风险网格数量扩样至与低风险相同,解决样本类别不平衡问题,并将不同时长降雨量、道路交叉点类型、路段线形、路段密度、路段级配及地表覆盖区域类型及高程数据作为积水风险预测模型的候选变量,并进行候选输入变量共线性分析;
6、s4、运用基于smote均衡以及logistic回归的模型计算得到积水风险分类等级以及积水风险值,并最终与矢量路网相交,得到细粒度的路段积水风险值;
7、s5、建立带有降雨天气的城市路段速度时间长序列数据集,根据数据集提取路段速度序列的趋势分量作为速度预测模型因变量,以分解得到的路段速度序列周期分量,结合降雨数据集中各路段所在位置处的降雨量与积水风险值,再合并统计得到的路段以及路段所在网格的路网特征值作为自变量;
8、s6、基于滑动窗口重构趋势路段速度序列以及对应的特征值序列,融合路段积水风险值、路段趋势速度与均值速度值、路网特征值的静态/准静态数据,形成速度预测模型输入输出数据集;
9、s7、使用基于时段的以及基于路段的两种输入数据集划分方式,分别进行数据集滑动重构并进行随机划分得到训练集与测试集,训练集输入lstm网络并通过adam优化器进行更新迭代,最后使用训练后的对测试集进行预测,随机重复五次划分过程,计算各次建模得到误差指标的均值用于评价模型表现,并利用iqr算法对城市路段速度预测序列进行异常值判别,以检测路段速度在预测时段内的异常波动,对路网状态进行评价。
10、进一步的,步骤s1包括如下子步骤:
11、s101、基于osm地图数据,使用dbscan算法对曲线节点进行识别与聚类,提取获得路段、交叉口等路网特征;
12、s102、先构建分析范围边界向外1km的缓冲区,后依据缓冲区生成1km网格,形成积水网络;
13、s103、基于lbs数据集子路段长度数据,同时使用osm数据补充lbs数据集中道路几何信息,计算得到路段的位置信息,将子路段长度与路段速度及行程时间进行关联,综合计算得到各路段速度序列数据集;
14、s104、以研究时段为时间基点,结合osm路网数据计算得到降雨数据集;
15、s105、依据osm数据中兴趣面(aoi)的信息,对地表情况进行筛选、组合,以实现分类,得到用地类型及高程等地面特征。
16、在所述步骤s2中,进一步有:
17、s201、政府部门发布的积水风险点列表数据与s103步骤所得的文本地址地理编码结合,得到列表积水风险点经纬度信息;
18、s202、取积水风险点为圆心,500m为半径(即直径1km),构建积水风险区间;
19、进一步的,所述s3具体包括:
20、s301、基于python第三方imblearn库实现smote过采样,将样本量稀少的中高风险网格数量扩样至与低风险相同;
21、s302、计算候选输入变量的相关系数矩阵,以0.8为阈值,识别|r|>0.8的变量对;
22、s303、基于相关系数值剔除出部分变量之后,计算剩余候选输入变量的vif值,选取输入变量。
23、进一步的,步骤s5包括如下子步骤:
24、s501、针对数据集编写代码,对研究区域内各道路的速度序列进行分解,提取得到区域内各路段速度序列的趋势分量,速度序列为较长时段的数据时,分解应用的是基于stl的分解的模型,若序列为短时间数据,则运用加法模型进行序列分解;
25、s502、路段速度序列中的趋势分量作为模型的因变量引入;
26、s503、输入两个具有时变特性的时间序列作为模型其中两个自变量,分别为路段降雨量和路段速度序列周期分量,运用步骤s103中基于stl的路段速度序列分解方法,提取得到各路段的速度序列周期分量;
27、s504、模型输入时段特征、路网结构特征、路段积水风险值以及道路的趋势速度均值作为剩余自变量。
28、在所述步骤s7中,进一步有:
29、s701、无论是使用基于时段的还是基于路段的数据集划分方式,都以8:2的比例随机划分训练集与测试集;
30、s702、基于时段的数据集,使用训练集训练模型,并针对每个测试集中的样本进行预测;
31、s703、基于路段的数据集,首先需要滑动训练集的速度序列,生成样本,输入模型进行训练,随后针对测试集中的时间序列,进行滑动重构以及多步预测,得到其速度预测折线;
32、s704、使用训练后的对测试集进行预测,随机重复五次划分过程,计算各次建模得到误差指标的均值用于评价模型表现;
33、s705、在基于lstm的多步预测模型的基础上,比较预测输出序列与临近的历史序列;
34、s706、根据iqr公式,当输出窗口的速度均值超出阈值范围时,则认为路段速度在预测时段内将出现异常波动。
35、与现有技术相比,本发明的有益效果至少如下:
36、(1)本发明综合性强、适用性广。本发明综合了多种积水影响因素进行积水风险预测,构建smote-logistic模型,分层预测(风险有无、风险高低),考虑数据平衡,同时变量作用分析更细致,准确度高于其他传统方法。本发明可适应不同地区下的交通网络,因而具有较强的实用性。
37、(2)本发明基于开源地图数据,引入基于径流系数、渗透、坡度等考虑路网的工程结构影响因素,进一步反映了城市道路网的交通特征,能够成功估计路段各处积水风险值以及网格的积水风险等级,分级准确度较不考虑路网结构的对照模型有着显著的提升,且空间划分更加细微。
38、(3)本发明融合了细时空粒度的降雨情况,灵活引入不同降雨量统计,引入大粒度以及小粒度的降雨量数据可以进一步提高风险等级划定的准确度,比引入单一降雨量数值的模型更有优势。