一种利用手机信令数据判别城市功能区的方法与流程

文档序号:21003315发布日期:2020-06-05 22:54阅读:627来源:国知局
一种利用手机信令数据判别城市功能区的方法与流程

本发明属于交通运输技术领域。可准确判别城市功能区性质,可用于大数据进行城市计算研究。



背景技术:

在大数据时代,城市中的各种数据如gps轨迹数据、ic卡刷卡数据、共享数据、手机数据以及社交网络数据,在定位城市个体出行位置、描述个体出行行为中提供重要基础数据。与此同时,城市出行需求及布局较大依托城市功能布局,城市交通拥堵给城市的生活质量大打折扣,严重影响城市生活品质,为缓解城市交通拥堵,找到交通拥堵发生的本质,挖掘城市功能空间布局,掌握城市交通出行需求空间分布,为缓解城市交通拥堵措施的提出提供重要理论支撑和决策依据。

传统的城市功能分区研究大多是采用土地利用类型现状图、调查问卷、遥感等数据,利用各种聚类或者建立指标体系等方法来对城市功能区域进行划分。数据的获取不仅耗时耗力效率低成本高,且确定权重系数时主观因素太强。总之,以往对城市功能区识别研究,多是高成本、低效率,缺乏数据的引导。大数据时代到来为城市计算提供了重要的数据基础,而手机数据作为记录人行为特征的数据,为城市功能区识别研究提供重要的数据来源。



技术实现要素:

针对手机信令数据具有人的活动属性进行识别城市功能问题,本发明提出一种基于交通小区不同时段通讯强度聚类计算的城市功能区识别方法,为城市计算以及交通和城市规划提供重要数据支撑。

本发明采用的技术方案为一种利用手机信令数据判别城市功能区的方法,首先,对手机信令数据进行清洗,提取通讯用户数据集,并选取城市交通小区为研究对象;然后,统计各交通小区基站数量并确定其与基站关系,并按5分钟间隔统计各交通小区用户通讯量,并区分周末和工作日;其次,基于各交通小区面积,计算工作日和周末平均通讯强度,得到工作日和非工作日通讯强度矩阵;再次,计算交通小区标签,利用k-means算法对工作日和非工作日通讯强度矩阵聚类,确定各交通小区的功能用地标签,并对工作日和非工作日聚类结果进行时间分布展示;最后,确定不同标签功能特性,根据工作日和非工作日时间分布中峰值数量、峰值强度、峰值时段以及通讯强度随时间变化特征等,确定不同标签代表交通小区的功能区。本发明可提升手机信令数据对城市功能区的判别精度,为手机数据进行城市计算研究提供重要方法依据。

方法如下:手机信令数据携带用户通讯活动类型,同时能够记录用户的位置信息,因此,利用手机信令数据,能够记录用户接打电话及位置信息,对于位置信息可以识别用户的空间分布。与此同时,用户通讯活动类型与用户所在位置城市功能特性具有较大联系。因而,不同城市功能区域的用户,其活动类型强度在时间和空间分布特性具有很大差异,在很大程度上反应了城市用地特征,因此,不同特性能够区别不同城市功能分布,根据这一特性,完成手机数据城市功能区识别。

具体方法和步骤如下:

步骤1:对原始手机信令数据进行处理,根据手机信令数据事件类型字段,确定手机数据中发生通讯用户数据,也即剔除没有发生通讯事件的用户数;

步骤2:统计交通小区基站数量,确定交通小区为研究对象,提取手机信令数据中基站数据,并进行空间可视化处理,同时,利用arcgis软件统计交通小区内基站数量,并确定交通小区和基站的对应关系;

步骤3:统计交通小区通讯量,根据时间划分,对通讯用户数据按照5分钟时间间隔并区分工作日和非工作日进行统计;

步骤4:计算通讯强度矩阵,基于统计的交通小区通讯量,结合交通小区面积计算结果,计算各交通小区不同时段下通讯强度,并对工作日和周末分别进行取平均处理,分别得到工作日和周末下5分钟时间间隔的平均通讯强度矩阵;

步骤5:交通小区标签计算,基于步骤4得到的交通小区平均通讯强度矩阵,利用k-means聚类算法,对工作日和周末下交通小区的平均通讯强度矩阵聚类分析,得到不同聚类类别,也就是不同交通小区标签,确定不同交通小区所在类别,也即确定交通小区城市功能标签;

步骤6:确定不同标签功能特性,基于得到的交通小区标签,利用用户在工作日和周末中出行分布特性不同,主要考虑在时间分布中峰值数量、峰值强度、峰值时段以及通讯强度随时间变化不同等特征,确定不同交通小区标签代表不同的城市功能特性,也就确定了不同标签功能特性,进而可以得到不同交通小区的城市功能区属性。

本发明具有以下有益效果:

该发明的基础数据来源于无线通信网络,相对问卷调查、现场采集等方式,手机定位数据获取无须另外布置采集设备,具有费用低廉,记录周期长,覆盖范围广的优点。

附图说明

图1.手机信令数据下的城市功能区判别流程图。

图2.交通小区基站数据统计结果示意图。

图3交通小区面积计算结果示意图。

图4通讯强度矩阵聚类结果图。

具体实施方式

下面结合附图对本发明详细描述其具体实施过程。整体过程如图1:手机信令数据下的城市功能区判别流程所示。首先,对手机信令数据进行清洗,提取通讯用户数据集,并选取城市交通小区为研究对象;然后,统计各交通小区基站数量,并按5分钟间隔统计各交通小区用户通讯量,并区分周末和工作日;其次,基于各交通小区面积,计算工作日和周末平均通讯强度,得到工作日和非工作日通讯强度矩阵;再次,计算交通小区标签,利用k-means算法对工作日和非工作日通讯强度矩阵聚类,确定各交通小区的功能用地标签;最后,确定不同标签功能特性,根据工作日和非工作日时间分布中峰值数量、峰值强度、峰值时段以及通讯强度随时间变化特征等,确定不同标签交通小区的功能区。

以北京市三环内区域为例,选取6种城市功能属性进行研究,如图2所示,聚类得到了6种城市功能属性标签。

步骤1:对原始数据进行处理,得到三环内发生通讯事件的用户数集;

步骤2:统计各交通小区的基站数据,主要通过arcgis软件进行处理,通过交通小区图层和基站图层进行关联分析,得到交通小区包含的基站数据及其对应关系,如图2所示;

步骤3:统计交通小区通讯量,分别提取工作日和周末下5分钟间隔的交通小区通讯量,结果如表1所示;

表1交通小区通讯量分布

步骤4:计算通讯强度矩阵,基于arcgis软件计算交通小区面积,计算结果如图3所示。根据交通小区通讯量矩阵,计算每个交通小区在每个5分钟间隔内的平均通讯强度,分别得到工作日和周末下5分钟时间间隔的平均通讯强度矩阵;

步骤5:交通小区标签计算,在确定6种聚类基础上,利用k-means聚类算法对平均通讯强度矩阵进行聚类计算,分别得到工作日和周末下交通小区的城市功能标签,如图4所示;

步骤6:确定不同标签功能特性,基于图4聚类结果时间分布,考虑在时间分布中峰值数量、峰值强度、峰值时段以及通讯强度随时间变化等特征,确定cluster1为办公区,cluster2为公园或风景区,cluster3为居住区,cluster4为文教区,cluster5为商业区,cluster6为混合区。

最后应说明的是:以上示例仅用以说明本发明而并非限制本发明所描述的技术方案;因此,尽管本说明书参照上述的示例对本发明已进行了详细的说明,但是,本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换;而一切不脱离发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1