一种基于条件随机场的城市人口移动数据模型分析方法
【技术领域】
[0001] 本发明提出了一种基于条件随机场的城市人口移动数据模型分析方法,该方法结 合天气因素分析城市居民通过地铁移动的目的地分布。该方法将轨道交通客流和天气数据 关联,预测各个0D对客流量,然后归一化得到出站概率向量来表示居民出站点即居民移动 目的地分布,而后依据实时刷卡数据和轨道交通基础数据模拟乘客出行,统计出轨道交通 网络全路网客流分布。本发明旨在挖掘轨道交通客流与天气因素的相关关系,分析天气因 素对城市人口移动的影响,预测城市居民通过地铁去往的目的地分布。
【背景技术】
[0002] 现在人们越来越重视健康出行,在出行时对室外空气质量的考虑越来越看重,因 此城市人口移动受到天气因素越来越大的影响。现在在分析城市人口移动、预测乘客出行 目的地方面,大多数客流预测算法只是考虑算法客流序列自身的特征,而没有与影响客流 变化的因素结合,因此本专利申请在图模型的基础上结合客流序列与天气因素对乘客出站 进行预测,以达到分析城市人口通过地铁移动的分布的目的。同时,在预测乘客出站的基础 上提出一种统计客流分布的方法,即时计算路网客流分布。
【发明内容】
[0003] 本发明的目的在于提出一种基于条件随机场的城市人口移动数据模型分析方法。 该方法将轨道交通客流和天气因素关联,结合历史客流数据和天气数据,预测各个站点到 其它站点的出站概率向量,然后对于乘客实时刷卡数据,预测乘客的出站点和出行路径,并 模拟乘客出行,统计轨道交通网络客流分布。这种算法将轨道交通客流与天气因素关联,更 加准确的预测乘客的出站点和全路网客流分布。
[0004] 本发明解决其技术问题所采取的技术方案是:通过历史数据训练模型得到客流预 测模型,计算各个站点的出站概率向量,之后,通过对实时乘客进站数据进行模拟,统计全 路网客流分布。首先将一天依据客流特征划分为η个时段,针对每个0D对建立客流预测模 型,将天气数据和历史客流作为模型输入,预测出该0D对的客流序列;然后对每个站点,归 一化其到其它站点的客流序列得到该站点的出站概率向量;最后实时获取乘客进站数据, 预测乘客出站点和出行路径,对每条数据进行出行模拟,统计得到全路网各个站点的客流 量和各辆列车上的客流量。
[0005] 本发明的详细技术方案如下:一种基于条件随机场的城市人口移动数据模型分析 方法包括两个步骤:
[0006] 步骤一:预测站点到其它站点的出站概率向量:依据历史客流数据和天气数据训 练条件随机场客流预测模型,输入天气数据预测每个0D对客流序列,归一化计算各个站点 出站概率向量。
[0007] (1)条件随机场模型建立
[0008] 见图2,将一天划分为η个时段,天气数据(温度、空气质量、是否下雨)Χ= {Xi,x2, . . .,xj作为模型的输入数据,0D对客流数据Y= {y^y2, . . .,yj作为模型的输出 数据。模型中变量χ和y包括两种相互关系,一种是观察变量和输出变量之间的关系,一种 是输出变量之间的时间序列关系。
[0009] 观察变量和输出变量之间的关系称为联合势能,采用二次的函数gt(yt,X;α,β) 表示,表达式如下所示:
[0011] 式中:
[0012] gt(yt,χ;α,β):联合势能函数
[0014] zt:t时段是否下雨这一状态
[0015] v.j:v.j= {1,2}分别表示下雨和不下雨两种状态
[0016] < :t时段v。状态下二次变量的参数
[0017] t时段v〗状态下一次变量yt的参数
[0018]输出变量之间的关系称为相互势能,采用二次函数匕匕^+以;λ)表示,表达式 如下所示:
[0020]式中:
[0021]ft(yt,yt+1,χ;λ):相互势能函数
[0023] zt:t时段是否下雨这一状态
[0024] vj:vj= {1, 2}分别表示下雨和不下雨两种状态
[0025] :t时段\状态下相邻变量ytyt+1的参数
[0026] 在联合势能函数和相互势能函数的基础上,条件随机场客流预测模型的条件概率 P(yIχ)的表达式为:
[0028] 式中:
[0029]p(y|χ;α,β,λ):条件随机场客流预测模型的条件概率
[0031] Τ:客流序列每天划分的时段数
[0032]依据历史客流数据和历史天气数据对模型的条件概率p(y|X;a,β,λ)使用梯 度下降算法进行优化迭代得到模型的最优参数。
[0033] (2)预测0D对客流序列
[0034] 由于乘客在出行时一般由进站点的天气因素影响,因此本发明提出的条件随机场 模型将进站点的天气数据作为输入。在(1)中,本发明对各个0D对进行训练得到各自的参 数,将天气数据输入可以得到站点0到站点Di的客流序列为{yi,yf2,...,yi}。因此本发明对各 个0D对进行预测,得到每个0D对的客流序列。
[0035] (3)出站概率向量计算:对一个进站点在不同时间段归一化该站到其它站点的客 流序列,计算出出站点概率向量;
[0036] 出站概率向量计算方法如下:
[0037] 对于一个站点0,输入天气数据预测从该站点到其它m个站点的客流序列分 别为丨yi,y〗,...,yi} (i=i,各….?Β),则在k时段,站点〇到其它m个站点的客流向量为 iyi,y〗,...,yr】,对客流向量进行归一化得到该站点在k时段到其它m个站点的客流比例,即
表示k时段m个站点客流总和。该客流比例表明乘客 从0站点出发到达其它站点的比例,对于一条乘客进站数据,该向量表示乘客去往其它各 个站点的概率,即为站点0的出站概率向量。对每个计算其去往其它站点的出站概率向量, 得到全路网站点的出站概率矩阵,用于预测乘客的出站站点。
[0038] 步骤二:实时获取乘客进站数据,模拟乘客出行,统计轨道交通网络全路网客流分 布。
[0039] (1)出站站点预测:依据刷卡记录时间所属的时间段,搜索该时间段进站点的出 站向量,依据随机数所属的区间预测出站点;
[0040] (2)出行路径选择:对于一个记录的进展点和出站点,依据历史该0D对路径客流 比例的统计数据,分配一条出行路径给该条记录。
[0041] (3)模拟乘客出行:以轨道交通基础数据(发车时间、行车速度等)和乘客的进站 时间、预测的出站点,模拟乘客的在轨道网络中的出行情况。
[0042] (4)计算全路网客流分布:模拟每个乘客的出行,将乘客出行数据存入数据库,综 合所有乘客的出行数据统计出轨道交通网络各个站点和列车的实时客流量。
[0043] 其中,列车上实时客流量统计方法如下:
[0044] 当乘客进站后到达站台,依据列车时刻表和列车运行时间计算出将要到达的列车 i,则列车i的客流量f\+l,当列车到达乘客的目的站点后乘客下车,列车的客流量为fi=f;-1。对每个乘客的出行,列车的客流量做如上的统计,依据乘客的出行状态变化,即 可统计出列车上即时客流量。
[0045] 其中,站点客流量统计方法如下:
[0046] 车站的客流量为当前时刻车站内客流量,加上进入站点的客流量,减去离开站点 的客流量,其中进站客流量包括刷卡进站客流量和从列车上下来进入站点的客流量,离开 站点的客流量包括刷卡出站客流量和上车离开站点客流量,数学表达式如下:
[0047]=Ν'- +N取+Nm - -NOTi
[0048] 式中:
[0049] \ :站点s在t时刻客流量
[0050] :站点s在t时刻刷卡进站客流量
[0051] I/r,:站点s在t时刻从列车上下车进站客流量
[0052] Iqs,:站点s在t时刻刷卡出站客流量
[0053] :站点s在t时刻上车离开站点客流量。
[0054] 优点及功效:本发明一种基于条件随机场的城市人口移动数据模型分析方法,实 时预测乘客出站站点,在预测基础上模拟乘客出行情况并统计路网客流分布,其优点是:基 于目前天气因素(如空气质量)对乘客出行影响越来越大,本发明将轨道交通客流与天气 因素关联,从影响客流变化的内在因素出发,挖掘天气因素与客流的深层次关系,达到了提 高预测乘客出站站点精确度和路网客流分布统计准确度度的目的。
【附图说明】
[0055] 图1是基于条件随机场的城市人口移动数据模型的全过程流程图。
[0056] 图2是基于条件随机场的城市人口移动数据模型示意图。
[0057] 图中符号说明如下:
[0058] 输入序列71{1 =l,2,...,n}表示在每天第i个时段0D对的客流量;输出序列 xji= 1,2,. . .,n}表示进站站点在第i个时段的天气数据,其中h表示温度,8;表示空气 质量,1^表示是否下雨。
【具体实施方式】
[0059] 本发明是一种基于条件随机场的城市人口移动数据模型分析方法。该方法将轨道 交通客流和天气因素关联,预测乘客出站站点,之后通过乘客出行模拟统计全路网客流分 布。
[0060] 实施方法包括两个步骤,分别是训练预测模型生成出站概率向量和实时数据预测 出站点模拟出行。如图1、图2所示,具体步骤如下所示:
[0061] 步骤一结合历史客流数据和天气数据,训练模型并生成出站概率向量
[0062] 步骤一将历史每天的客流数据和天气数据每天划分为η个时段。将于轨道交通 网络一个进站0到第i个站客流数据依据划分的时段进行聚合,生成客流时间序列 狀忒,…,y"} (m...m)作为模型的输出变量,同时将天气数据(温度、空气质量、是否 下雨)也同样生成时间序列X= {Xl,X2,...,XJ作为模型的输入序列,采用梯度下降算法 对模型的参数进行优化得到模型的最优参数,即可得到进站〇到其它出站Di的客流预测模 型。在训练处客流预测模型后,在预测天,将当天的天气数据按时段生成天气数据时间序列 输入模型,模型即可以计算出进站0到其它出站Di的客流序列{S〈名,...次,} (i=l,2,.…m)a 对于轨道交通网络中,对每个站点进行模型训练和客流序列预测,获取轨道交通每个站点 到其它站