基于信令数据的建成环境与轨道客流分布关系确定方法与流程

文档序号:20956134发布日期:2020-06-02 20:25阅读:174来源:国知局
基于信令数据的建成环境与轨道客流分布关系确定方法与流程
本发明属于交通大数据的信令数据信息识别领域,尤其是针对轨道交通线网规划、轨道站点优化和轨道站点周边城市规划等领域,该方法可用于评估城市不同区域建成环境对轨道客流分布的影响程度和相关性关系,为其提供定量分析技术支撑。
背景技术
:随着各国城市的不断扩张,居民出行特征逐渐多元化,由于长距离、大容量的轨道交通能够满足城市居民的主要出行需求,成为城市交通骨干。然而轨道交通车站客流来源去向分布如何,是否会按照相关规划预期结果一直受到行业规划者与政府部门的关注。通常,轨道交通建设可提高区域的交通可达性,为不同城市区域带来人流,促进城市活力,而站点周边的城市建成环境好坏也影响轨道站点客流量吸引力,被认为是车站客流的主要影响因素之一。随着站点周边环境精细化综合开发的需求的提出,如何聚焦到具体地块或者热点区域对站点客流的量化贡献,而非周边建成环境的整体相关性分析仍需进一步研究。手机信令作为移动端与基站交互的数据,具有非连续以及时空触发不规律的特性,并可通过交互基站的位置区(lac)、编号(cid)等信息实现移动端的粗略定位,为基于信令数据的出行od、出行速度等研究提供基础。城市建成环境是指为包括大型城市环境在内的人类活动而提供的人造环境,其中人的出行目的地通常被称为城市兴趣点(pointofinterest,poi),在愈加综合的城市建成环境中,不同类型的城市poi出现更为聚集甚至重叠的情况,形成团状聚集态。然而传统交通四阶段法大多只从宏观对轨道交通线网客流进行评估,由于成本高耗时长而少有微观角度评估站外客流分布,afc数据则只能获取站点的进出站客流总量,难以追踪客流来源去向。通过手机信令数据获取区域热点区域,分析客流热点区域与城市建成环境的相互关系,有助于轨道交通规划中,准确分析轨道站点最优选址,定量支撑轨道站点布局及优化,为轨道交通发展规划提供定量依据。因此本发明基于手机信令数据,利用时空聚类与sem模型,对轨道出行乘客站外热点区域,完成基本预处理与信号漂移、乒乓切换等预处理后,基于信令触发规则、tdoa和st-dbscan进行提取;同时基于sem实现不同城市环境不同类型站点的热点区域客流与城市建成环境的关系,同时量化评估各类因素的作用系数。本发明通过研究利用手机信令数据与城市建成环境数据,实现轨道客流影响因素量化分析与提取,为把握轨道线网站外客流分布,轨道站点选址优化提供基础,对轨道交通发展规划提供定量依据。技术实现要素:为了克服现有技术的上述缺点,本发明提出了基于信令数据的建成环境与轨道客流分布关系确定方法,旨在解决城市范围内基于手机信令数据与城市建成环境的轨道交通客流影响因素提取,尤其是综合复杂城市发展建设环境下不同城市区域多种类型站点客流影响因素。本发明运用中心城区范围海量信令数据与城市建成环境(poi,城市公共交通设施)数据,在完成数据基本预处理和个体信令数据提取后,筛选轨道出行个体;利用tdoa与st-dbscan识别出站客流分布热点区域,利用sem量化提取轨道出行客流主要影响因素。其中,特别分析了综合复杂城市发展建设环境下不同城市区域多种类型站点客流影响因素。本发明解决其技术问题所采用的技术方案是:基于信令数据的建成环境与轨道客流分布关系确定方法,包括如下步骤:步骤一、创建轨道信息数据库和城市建成环境数据库,保存用户出行信令数据、城市兴趣点数据以及城市公共交通设施数据;步骤二、删除重复缺失数据、通信失败和小样本数据,将存在轨道出行的信令数据按时间排序;步骤三、剔除乒乓切换与信号漂移数据,形成用户出行手机信令基础数据;步骤四、基于停留时空特性识别乘客轨道出行目的地;步骤五、基于时空聚类算法识别轨道站热点范围,根据热点基站数量量化热点区域;步骤六、建立轨道客流分布与建成环境关联关系模型。与现有技术相比,本发明的积极效果是:本发明针对目前轨道客流影响因素评估提取中,存在的数据动态性差、研究精度不足、判别方法依赖经验判定等问题,提出了基于手机信令和城市建成环境的轨道站点客流因素提取方法,利用限幅滤波实现信令数据预处理,利用tdoa与st-dbscan量化识别轨道热点区域,利用sem与城市建成环境数据,实现乘客热点区域客流影响因素评估与提取;并结合城市不同地区与站点类型,对比不同站点影响因素差异。具体包括:一、基于限幅滤波的信令数据预处理为保障通信质量,手机信令数据通常海量繁杂,需对数据进行预处理,包括删除重复数据、缺失数据、通信失败数据和小样本数据的基本数据处理,再按唯一识别号msid以及获取时间对信令数据排序,利用限幅滤波,通过速度阈值去除信号漂移数据与乒乓切换数据,获取每个个体的完整信令数据。二、基于tdoa与st-dbscan的客流热点区域提取在个体每日信令数据中,结合信令触发规则与tdoa识别个体出站站点,再根据各基站停留时间确定轨道出行目的地。完成所有客流出行目的地识别后,以基站坐标为xy轴,基站中客流数量为z轴,利用st-dbscan识别热点范围,并取其前85%且轨道客流大于4的基站作为真实热点范围,根据范围基站数量确定热点区域。三、基于sem的轨道交通换乘站点提取在热点区域识别的基础上,统计各个热点区域建成环境特征(各类poi数量、公共交通设施数量与属性)、站点热点区域数量,利用spss信效度检验各种因素对轨道客流的影响效果,剔除cronbach'sα及累计解释方差低贡献度低的影响因素,预先确定变量间相互关系后,利用sem实现因素重分类与因素间量化评估提取。本发明的优点在于:基于信令识别出行目的地方面,2g及以后的通信网络中,信令数据触发规则基本相似,均将记录个体msid、触发时间、lac、cid,结合基站布设特性,在3g/4g等后续通信网络中仍可实现个体轨道出站及目的地点识别;基于城市热点活动区域识别方面,相比传统四阶段法微观评估站外客流分布成本高耗时长,afc数据难以追踪客流来源去向的问题,充分利用信令数据覆盖人群广、实时动态性强的特点,可深入挖掘不同时段(工作日、节假日等)不同区域(中心区、郊区等)不同类型站点(首末站、换乘站、普通站等)的聚集特性,利用st-dbscan将基站客流数量纳入聚类因素,能有效找寻人群聚集区域并消除离散点;基于客流影响因素方面,充分利用城市建成环境数据,深入细化各种影响因素而非宏观建成环境对轨道客流的影响,利用sem分析因素影响程度,针对城市建设综合开发的情况下,不同城市设施间相互影响的特征,解除其他方法中变量间相互独立的硬性条件,获取不同因素对轨道客流真实的影响效果。本发明为把握轨道线网站外客流分布,轨道站点选址优化提供基础,对轨道交通发展规划提供定量依据。附图说明本发明将通过例子并参照附图的方式说明,其中:图1为轨道客流影响因素提取流程图;图2为限幅滤波过滤对比图;图3为出站识别流程图;图4为st-dbscan参数标定过程图;图5为吸引热点范围分布图;图6为热点区域提取参数标定图;图7为初始因素间预设关系图;图8为影响因素间最终关系图。具体实施方式首先对本发明涉及到的手机信令数据各个字段进行解析。(1)手机信令数据触发信令事件后,检测与解析产生接口可获取对应信令数据,包括:手机切换所产生的手机信令数据,主要包括移动台识别号(mobilestationid,msid),时间戳(timestamp),位置区(lac),小区号(cid),事件编号(eventid)等信息,手机信令主要字段的具体含义如下。移动台识别号(msid)是移动用户识别码(imsi)处理得到,是蜂窝移动通信网中识别个体移动用户的32位唯一号码。imsi结构为移动国家号mcc+移动网号+移动用户识别码的15位数字编码。时间戳(timestamp)记录信令数据触发时间,通常为“年/月/日,时/分/秒”标准时间格式。蜂窝小区编码(cid)与移动台(ms)直接进行信息交互的系统,蜂窝小区最小单位。位置区识别码(lac)由若干基站区组成,包含多个蜂窝小区,当移动台离开位置区时将向系统进行强迫位置登记,当在同一位置区时仅需在当前位置区下属各个小区中寻呼。flag表示该条信令数据是否成功获得手机的国际移动用户识别码(imsi)。flag=0表示已捕捉到用户识别信息,反之flag=1,为保障识别有效性,识别数据必须保障flag=0。信令事件(eventid)包括开关机、接发短信、主被叫、位置区更新、上网等,不同地区信令事件编号存在差异。以某城市某日中心城区全部信令数据、轨道站点数据、基站数据及轨道基站数据为基础构建城市轨道交通数据库,以城市poi数据、城市公共交通设施数据为基础建立城市建成环境数据库。在数据基础预处理上提取个体信令数据,利用限幅滤波去除乒乓切换数据与信号漂移数据,利用信令数据tdoa与st-dbscan分析轨道客流热点区域,利用sem识别提取城市建成环境对轨道客流的影响因素及影响效果,总体识别流程如附图1所示。所述方法中主要包含以下步骤:步骤一:创建轨道信息数据库、城市建成环境数据库轨道信息数据库包括四类数据:1)信令数据:存储实验采集与城市区域的所有信令数据,包括移动台识别号、时间戳、位置区编码、蜂窝小区编码、flag、信令事件等字段。2)城市基站数据:存储城市所有基站信息,包括基站编号、位置区编码、蜂窝小区编码、经度、纬度等字段。3)轨道基站数据:仅包含轨道交通系统内部基站,字段类型同城市基站数据。4)轨道站点数据:存储轨道各站点信息,包括站点线路、站点编号、站点经度、站点纬度、站点类型(换乘/非换乘)等字段。城市建成环境包括两类数据:1)城市poi数据:共餐饮、公园、购物、景点、酒店、生活服务、停车场、住宅小区、休闲体育、学校、药店、政府机构12类数据,包括名称、地址、经度、纬度、所属细分类别。2)公共交通设施数据:包括公交站点数据与对应线路数据,包括站点名称、经度、纬度、所属线路。步骤二:数据预处理与提取2.1数据基础预处理(1)重复数据剔除大量完全重复数据容易对分析造成影响,因此相同数据仅保留一条。(2)缺失数据剔除字段缺失数据容易造成字段错位、识别异常,该类数据需直接剔除。(3)通信失败数据剔除通信失败数据容易造成用户位置信息偏差,需根据eventid进行删除。同时flag=1导致捕捉到用户唯一识别号获取失败,也需要剔除。2.2提取轨道出行数据并排序将预处理后信令数据按msid与时间戳进行排序,形成以个体为单位的手机信令基础数据。2.3数据过滤(1)小样本数据剔除信令数量过少难以分析出行行为,因此删除个体一日lac,cid变化少于3的数据。(2)乒乓切换处理个体位于基站服务范围边界时,移动端常发生乒乓切换。造成大量数据冗余,因此建立长度为n的滑动时间窗口,当滑动时间窗口第n项(即最后一项)与第一项相同且时间间隔小于1s时视为乒乓切换,记录该片段直到第n项与第一项不同,最后仅保留乒乓切换中的不同项,时间间隔为乒乓切换时间间隔的平均值。(3)信号漂移处理信号的不稳定传播可能造成漂移,漂移信号与移动端交互时,信令数据将包含该漂移基站经纬度,干扰影响路径识别。顺序计算两条信令间的速度数据,当速度大于设定阈值时,删除第二条数据,反复迭代直到所有速度均小于特定阈值,限幅滤波过滤前后对比如附图2所示。最终数据结果如下所示。表1信令数据样例步骤三:轨道客流热点区域提取1.轨道出行目的地识别(1)识别进站站点。以msid为识别号,提取个体所有出行信令数据q。以laci和cidi作为对象,将q与轨道基站数据库me匹配,第一次出现(lacm,cidm)∈me(lac,cid)且eventidm=7/8时,第m条信令作为进站数据,其对应轨道站点视为轨道出行进站点。(2)匹配出站信令。以qm为起点继续与轨道基站数据库me匹配,第一次出现(lacn,cidn)me(lac,cid)且eventidn=7/8时,第n条信令作为出站数据。(3)识别出站站点。利用三角定位tdoa确定信令数据qn大致位置,结合最短路径法识别出站站点。出站识别流程如附图3所示。(4)出站目的地识别。计算相邻信令数据时间间隔,当时间间隔大于30min时将前一个基站视为该次轨道出行停留点。(5)完成识别后,若该个体当日无信令数据则结束识别,否则返回步骤(1)。2.热点区域识别(1)st-dbscan算法参数标定。st-dbscan包括三类参数:核心点空间半径eps、距离δt及聚类阈值个数minpts。当某基站点空间半径eps及数量距离δt内轨道用户数量大于minpts时,将该点视为核心点,再找寻与其密度相连的点进行聚类。通过计算不同停留时间累积分布,找寻95%轨道交通用户数量作为参数δt;所有的点间距排序可发现不同类型基站点间距存在明显差异,间距突变点间距为eps,找寻过程如附图4。根据距离间隔定义,聚类最小样本点数minpts应与δt相同,以此可标定三个参数。(2)热点范围识别。以基站经度、纬度、轨道出行用户停留数量作为聚类的三个维度,利用st-dbscan识别初始轨道客流吸引热点范围,识别结果如附图5所示。(3)热点区域识别。对每个热点范围,选择前85%且轨道客流大于4的基站作为原始热点区域,选择过程如附图6所示。并根据原始热点区域基站数量划定真实热点区域。1)若存有一个热点基站,将基站周围50m为半径的范围视为热点区域。2)若存有若干热点基站且按线性排列,将每个基站周围50m为半径的相并范围视为热点区域。3)若存有若干热点基站且按团状分布,将顶点基站周围50m半径及其间连线内相并范围视为热点区域。步骤四:轨道客流影响因素提取1.初始因素选择设置与信效度检验(1)初始因素选择初始因素选择需考虑城市建成环境的各个部分,包括轨道交通自身建设对客流的影响,因此初始因素包括四类:城市poi、轨道站点属性、公共交通设施及轨道客流。城市poi包括餐饮、公园、购物、景点、酒店、生活服务、停车场、住宅小区、休闲体育、学校、药店、政府机构共12个类别,轨道站点属性包括是否换乘站、是否首末站、热点区域基站数量、站点周边热点区域共4类。公共交通设施包括公交站点个数、公交线路个数、是否客运场站共3类。客流量包括热点区域客流量与轨道站点客流量共2类。初始因素间预设关系如附图7所示。(2)信效度检验将站点流量及建成环境统计数据导入spss数据相关性分析软件,根据数据相关性指标cronbach'sα、成分(因子载荷)、kmo值及累计解释方差,通过对指标的信度检验与效度检验筛选建成环境中主要影响因素,相关计算公式如下:c=f1+f2+…+fn(4)其中公式(1)为cronbach'sα计算方法,公式(2)中为因子载荷,公式(3)中为kmo计算结果,公式(4)为累计解释方差计算结果,其代表提取主成分包含原有因子的信息量,这些参数均要求大于0.5(50%),某日客流与建成环境统计结果如下表。表2建成环境信效度检验2.轨道客流影响因素提取剔除影响因素较小的变量后,将其余变量导入结构方程模型sem中,评估影响因素间相关关系的合理性,并根据参数要求修改变量间关系,最终变量间相互关系如附图8所示,导出各因素对轨道客流的影响效果如下表所示。可以得到城市poi对站点客流量有最直接最显著的影响,其中餐饮、购物、生活服务、休闲体育、酒店影响最大。公共交通设施则通过影响城市poi分布间接影响车站客流量,其中公交站点数量影响最大,这也说明轨道交通乘客较少再换乘其他公共交通设施。表3建成环境显变量间相互关系表4建成环境潜变量间相互关系路径standardizedestimates.e.c.r.p景点<---城市兴趣点.647.0069.990***政府机构<---城市兴趣点.713---药店<---城市兴趣点.773.08112.788***学校<---城市兴趣点.946.20910.680***休闲体育<---城市兴趣点.952.17910.492***住宅小区<---城市兴趣点.882.06212.364***停车场<---城市兴趣点.376.1863.753***生活服务<---城市兴趣点.965.81811.221***酒店<---城市兴趣点.905.0979.767***购物<---城市兴趣点.9201.25810.202***公园<---城市兴趣点.611.0036.633***餐饮<---城市兴趣点1.007.79010.931***客运场站<---公共交通设施.281.0002.845.004公交站点<---公共交通设施1.073---公交线路<---公共交通设施.553.0065.202***基站数量<---车站客流量1.003---集聚区域客流量<---车站客流量.688.1878.813***集聚区域客流量<---客运场站.13016.9912.276.023酒店<---景点.102.3173.500***当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1