人口流动数据的获取方法、装置及计算机可读存储介质与流程

文档序号:16090512发布日期:2018-11-27 22:57阅读:357来源:国知局

本发明涉及数据统计技术领域,尤其涉及人口流动数据的获取方法、装置及计算机可读存储介质。



背景技术:

随着中国城市的不断发展以及城市化进程的推进,人们的活动范围增大,活动频率也大大提高。由此诱发越来越突出的交通问题,城市交通已经逐渐无法满足居民日常出行。

现有技术中,依据当前的人流量情况特征制定交通发展政策,编制道路交通、轨道交通规划、公交规划、停车站场规划、行人过街设施规划。解决由于交通能力不足导致居民日常出行受阻,人群庞大造成踩踏事件等问题。

然而,由于人的活动具有不确定性,未来一段时间的人口流动情况极有可能与当前情况不同,单靠当前的人流量情况特征规划的交通安排并不能符合未来人口的活动需求,无法有效地解决交通问题。



技术实现要素:

本发明的主要目的在于提供一种人口流动数据的获取方法、装置及计算机可读存储介质,旨在解决单靠当前的人流量情况特征规划的交通安排并不能符合未来人口的活动需求,无法有效地解决交通问题的技术问题。

为实现上述目的,本发明提供一种人口流动数据的获取方法,获取目标区域内的人口流动数据,所述人口流动数据至少包括区域人口密度、人口发生量以及人口吸引量中的一个;

根据所述人口流动数据获取所述目标区域对应的时间序列,所述时间序列包括所述人口流动数据、时间和区域;

根据所述时间序列、预设时间段以及预设模型计算所述目标区域内所述预设时间段内的人口流动数据,其中,所述预设模型与时间序列、时间段以及所述人口流动数据相关。

优选地,所述根据所述人口流动数据获取所述目标区域对应的时间序列的步骤包括:

获取预设周期,其中,所述预设周期小于或等于所述预设时间段;

根据所述预设周期将所述人口流动数据划分为多个时间向量;

由所述时间向量组成所述目标区域对应的时间序列。

优选地,所述根据所述时间序列、预设时间段以及预设模型计算所述目标区域内所述预设时间段内的人口流动数据的步骤包括:

获取所述目标区域对应的自回归积分滑动平均模型;

根据所述人流时间序列、所述时间段以及所述目标区域对应的自回归积分滑动平均模型计算所述目标区域内所述预设时间段内的人口流动数据。

优选地,所述人口流动数据的获取方法包括:

获取所述目标区域内的待预测人口流动数据,根据所述待预测人口流动数据获取所述目标区域对应的待预测时间序列;

采用平稳性的单位根检验方法从所述待预测时间序列中获取稳定时间序列;

采用共轭矩阵下降法训练得到自回归积分滑动平均模型的多组阶层和阶数;

由多组阶层和阶数组成多个所述自回归积分滑动平均模型;

计算所述自回归积分滑动平均模型的赤池信息量准则;

取所述赤池信息量准则数值最小的所述自回归积分滑动平均模型作为所述目标区域的自回归积分滑动平均模型。

优选地,所述根据所述时间序列、预设时间段以及预设模型计算所述目标区域内所述预设时间段内的人口流动数据的步骤包括:

从所述目标区域对应的时间序列中获取所述预设时间段对应的时间序列;

获取所述预设时间段对应的时间序列的临近时间序列,其中,采用临近算法从所述目标区域对应的时间序列中获取所述临近时间序列;

从所述目标区域对应的时间序列中获取所述临近时间序列对应的目标时间序列;

根据所述目标时间序列获取所述目标区域内所述预设时间段的人口流动数据。

优选地,所述从所述目标区域对应的时间序列中获取所述临近时间序列对应的目标时间序列的步骤包括:

从所述目标区域对应的时间序列中获取所述临近时间序列中各个时间向量对应的目标时间向量,其中,所述对应为周期对应;

由所述目标时间向量组成所述目标时间序列。

优选地,所述从所述目标区域对应的时间序列中获取所述预设时间段对应的时间序列的步骤包括:

计算所述预设时间段包含所述预设周期的个数;

从所述目标区域对应的时间序列中依次获取所述个数的所述时间向量;

由获取到的所述时间向量组成所述预设时间段对应的时间序列。

优选地,所述获取目标区域内的人口流动数据的步骤包括:

获取所述目标区域内的通信数据;

根据所述通信数据获取所述目标区域内的人口流动数据。

此外,为实现上述目的,本发明还提供一种人口流动数据的获取装置,其特征在于,所述人口流动数据的获取装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的人口流动数据的获取程序,所述人口流动数据的获取程序被所述处理器执行时实现如上所述的人口流动数据的获取方法的步骤。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有人口流动数据的获取程序,所述人口流动数据的获取程序被处理器执行时实现如上所述的人口流动数据的获取方法的步骤。

本发明实施例提出的一种人口流动数据的获取方法、装置及计算机可读存储介质,为了预测一个目标区域未来某一时间段内的人口流动情况,需要以过去一段时间该目标区域的人口流动情况为依据,其中,人口流动情况可以由人口流动数据以数字化的形式表现,人口流动数据有区域人口密度、人口发生量以及人口吸引量。因此,首先获取目标区域内的人口流动数据,再将人口流动数据整理统计为目标区域对应的包含人口流动数据、时间与区域的时间序列,进而根据所述时间序列、预设时间段以及预先训练好的与时间序列、时间段以及所述人口流动数据相关的预设模型计算出未来所述预设时间段内所述目标区域内的人口流动数据。利用时间序列的思想,将目标区域内的人口流动数据生成对应的时间序列,再利用预设模型根据时间序列计算出未来目标区域预设时间段内的人口流动数据,人口流动数据的计算更加准确,根据准确计算出的人口流动数据掌握城市交通需求总量、主要交通发生源和吸引源、出行的时空分布、交通方式分布等,为政府制定交通安排提供有效数据,能够有效地解决交通问题。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图;

图2为本发明人口流动数据的获取方法第一实施例的流程示意图;

图3为本发明人口流动数据的获取方法第二实施例的流程示意图;

图4为本发明人口流动数据的获取方法第三实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例的主要解决方案是:

获取目标区域内的人口流动数据,所述人口流动数据至少包括区域人口密度、人口发生量以及人口吸引量中的一个;

根据所述人口流动数据获取所述目标区域对应的时间序列,所述时间序列包括所述人口流动数据、时间和区域;

根据所述时间序列、预设时间段以及预设模型计算所述目标区域内所述预设时间段内的人口流动数据,其中,所述预设模型与时间序列、时间段以及所述人口流动数据相关。

由于现有技术依据当前的人流量情况特征制定交通发展政策,编制道路交通、轨道交通规划、公交规划、停车站场规划、行人过街设施规划。然而,由于人的活动具有不确定性,未来一段时间的人口流动情况极有可能与当前情况不同,单靠当前的人流量情况特征规划的交通安排并不能符合未来人口的活动需求,无法有效地解决交通问题。

本发明提供一种解决方案,为了预测一个目标区域未来某一时间段内的人口流动情况,需要以过去一段时间该目标区域的人口流动情况为依据,其中,人口流动情况可以由人口流动数据以数字化的形式表现,人口流动数据有区域人口密度、人口发生量以及人口吸引量。因此,首先获取目标区域内的人口流动数据,再将人口流动数据整理统计为目标区域对应的包含人口流动数据、时间与区域的时间序列,进而根据所述时间序列、预设时间段以及预先训练好的与时间序列、时间段以及所述人口流动数据相关的预设模型计算出未来所述预设时间段内所述目标区域内的人口流动数据。利用时间序列的思想,将目标区域内的人口流动数据生成对应的时间序列,再利用预设模型根据时间序列计算出未来目标区域预设时间段内的人口流动数据,人口流动数据的计算更加准确,根据准确计算出的人口流动数据掌握城市交通需求总量、主要交通发生源和吸引源、出行的时空分布、交通方式分布等,为政府制定交通安排提供有效数据,能够有效地解决交通问题。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。

本发明实施例终端可以是PC,也可以是智能手机、平板电脑、便携计算机等具有数据分析功能的可移动式终端设备。

如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及人口流动数据的获取程序。

在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的人口流动数据的获取程序,并执行以下操作:

获取目标区域内的人口流动数据,所述人口流动数据至少包括区域人口密度、人口发生量以及人口吸引量中的一个;

根据所述人口流动数据获取所述目标区域对应的时间序列,所述时间序列包括所述人口流动数据、时间和区域;

根据所述时间序列、预设时间段以及预设模型计算所述目标区域内所述预设时间段内的人口流动数据,其中,所述预设模型与时间序列、时间段以及所述人口流动数据相关。

进一步地,处理器1001可以调用存储器1005中存储的人口流动数据的获取程序,还执行以下操作:

获取预设周期,其中,所述预设周期小于或等于所述预设时间段;

根据所述预设周期将所述人口流动数据划分为多个时间向量;

由所述时间向量组成所述目标区域对应的时间序列。

进一步地,处理器1001可以调用存储器1005中存储的人口流动数据的获取程序,还执行以下操作:

获取所述目标区域对应的自回归积分滑动平均模型;

根据所述人流时间序列、所述时间段以及所述目标区域对应的自回归积分滑动平均模型计算所述目标区域内所述预设时间段内的人口流动数据。

进一步地,处理器1001可以调用存储器1005中存储的人口流动数据的获取程序,还执行以下操作:

获取所述目标区域内的待预测人口流动数据,根据所述待预测人口流动数据获取所述目标区域对应的待预测时间序列;

采用平稳性的单位根检验方法从所述待预测时间序列中获取稳定时间序列;

采用共轭矩阵下降法训练得到自回归积分滑动平均模型的多组阶层和阶数;

由多组阶层和阶数组成多个所述自回归积分滑动平均模型;

计算所述自回归积分滑动平均模型的赤池信息量准则;

取所述赤池信息量准则数值最小的所述自回归积分滑动平均模型作为所述目标区域的自回归积分滑动平均模型。

进一步地,处理器1001可以调用存储器1005中存储的人口流动数据的获取程序,还执行以下操作:

从所述目标区域对应的时间序列中获取所述预设时间段对应的时间序列;

获取所述预设时间段对应的时间序列的临近时间序列,其中,采用临近算法从所述目标区域对应的时间序列中获取所述临近时间序列;

从所述目标区域对应的时间序列中获取所述临近时间序列对应的目标时间序列;

根据所述目标时间序列获取所述目标区域内所述预设时间段的人口流动数据。

进一步地,处理器1001可以调用存储器1005中存储的人口流动数据的获取程序,还执行以下操作:

从所述目标区域对应的时间序列中获取所述临近时间序列中各个时间向量对应的目标时间向量,其中,所述对应为周期对应;

由所述目标时间向量组成所述目标时间序列。

进一步地,处理器1001可以调用存储器1005中存储的人口流动数据的获取程序,还执行以下操作:

计算所述预设时间段包含所述预设周期的个数;

从所述目标区域对应的时间序列中依次获取所述个数的所述时间向量;

由获取到的所述时间向量组成所述预设时间段对应的时间序列。

进一步地,处理器1001可以调用存储器1005中存储的人口流动数据的获取程序,还执行以下操作:

获取所述目标区域内的通信数据;

根据所述通信数据获取所述目标区域内的人口流动数据。

参照图2,本发明人口流动数据的获取方法第一实施例,所述人口流动数据的获取方法包括:

步骤S10,获取目标区域内的人口流动数据,所述人口流动数据至少包括区域人口密度、人口发生量以及人口吸引量中的一个。

为了预测一个目标区域未来某一时间段内的人口流动情况,需要以过去一段时间该目标区域的人口流动情况为依据。其中,人口流动情况可以由人口流动数据以数字化的形式表现,人口流动数据有区域人口密度、人口发生量(O量)以及人口吸引量(D量)。

所述人口流动数据可以是通过目标区域内的通讯数据、视频监控以及现场采集等方法获取。

近年来,移动通讯技术以及定位技术的快速发展,有很多基于手机数据获取交通数据的研究。移动通信网络包含移动通信基站及其发射信号和移动台(主要指手机)。随着手机拥有量的与日俱增,城市居民已经普及了手机的使用,手机可以作为一个居民随身的出行探测器,实时返回居民的出行位置信息,利用移动通信网络设施分析人口流动情况已经具备实际应用的条件。因此,采用目标区域内的通信数据,根据通讯数据来获取目标区域内的人口流动情况的具体方法为:统计目标区域内的固定时间段内,基站与手机之间传输的信令,进而根据信令数据获取目标区域内手机的流动数据,以手机的流动数据作为目标区域内的人口流动数据。与传统的视频监控和现场采集相比通过通信数据采集人口流动数据的数据采集更加准确,数据采集效率也大大提高。

步骤S20,根据所述人口流动数据获取所述目标区域对应的时间序列,所述时间序列包括所述人口流动数据、时间和区域。

步骤S30,根据所述时间序列、预设时间段以及预设模型计算所述目标区域内所述预设时间段内的人口流动数据,其中,所述预设模型与时间序列、时间段以及所述人口流动数据相关。

时间序列是对某一个或者一组变量x(t)进行观察测量,将在一系列时间t1,t2,...,tn所得到的离散数字组成的序列集合。1927年数学家提出建立自回归模型(AR模型)来预测市场变化的规律。后来在AR模型的启发下,建立了移动平均模型(MA模型),当时主要应用在经济分析和市场预测上。

将获取到的人口流动数据按预设周期划分为多个时间向量,有多个时间向量组成目标区域的时间序列,其中,目标区域的时间序列中的变量包括人口流动数据、时间和区域。需要指出的是,该预设周期的时长大小小于或等于需要预测的预设时间段。进一步,根据时间序列、预设时间段以及事先训练好的预设模型计算出目标区域内预设时间段内的人口流动数据。预设模型为根据过去一段时间目标区域内的人口流动数据训练出的,与时间序列、时间段以及人口流动数据相关。其中,训练预设模型时采用的人口流动数据对应的采集时间段,通常会长于步骤S10中获取的人口流动数据对应的采集时间段,即训练预设模型时采集的数据量高于使用预设模型时输入的数据量。准确计算出未来一段时间内的人口流动数据,可以根据计算出的人口流动数据掌握城市交通需求总量、主要交通发生源和吸引源、出行的时空分布、交通方式分布等,为政府制定交通发展政策,编制道路交通、轨道交通规划、公交规划、停车站场规划、行人过街设施规划。解决由于交通能力不足导致居民日常出行受阻,人群庞大造成踩踏事件等问题,能够有效地解决交通问题。

例如,需要预测未来1小时内的人口流动数据时,预设时间段为1小时,获取目标区域内过去5小时的人口流动数据,预设周期可取0.5小时,则将5小时的人口流动数据以0.5小时为周期划分为10个时间向量,并有这10个时间向量组成时间序列。将该时间序列以及预设时间段1小时输入预设模型,即可得到未来1小时对应的时间序列,由未来1小时对应的时间序列得到相应的人口流动数据。

在本实施例中,为了预测一个目标区域未来某一时间段内的人口流动情况,需要以过去一段时间该目标区域的人口流动情况为依据,其中,人口流动情况可以由人口流动数据以数字化的形式表现,人口流动数据有区域人口密度、人口发生量以及人口吸引量。因此,首先获取目标区域内的人口流动数据,再将人口流动数据整理统计为目标区域对应的包含人口流动数据、时间与区域的时间序列,进而根据所述时间序列、预设时间段以及预先训练好的与时间序列、时间段以及所述人口流动数据相关的预设模型计算出未来所述预设时间段内所述目标区域内的人口流动数据。利用时间序列的思想,将目标区域内的人口流动数据生成对应的时间序列,再利用预设模型根据时间序列计算出未来目标区域预设时间段内的人口流动数据,人口流动数据的计算更加准确,根据准确计算出的人口流动数据掌握城市交通需求总量、主要交通发生源和吸引源、出行的时空分布、交通方式分布等,为政府制定交通安排提供有效数据,能够有效地解决交通问题。

进一步的,参照图3,本发明人口流动数据的获取方法第二实施例,基于上述第一实施例,所述步骤S30包括:

步骤S31,获取所述目标区域对应的自回归积分滑动平均模型。

步骤S32,根据所述人流时间序列、所述时间段以及所述目标区域对应的自回归积分滑动平均模型计算所述目标区域内所述预设时间段内的人口流动数据。

在本实施例中采用自回归积分滑动平均模型(AMARI模型)作为所述目标区域对应的所述预设模型来计算目标区域内所述预设时间段内的人口流动数据。

在系统中存储有预先训练好的多个区域的AMARI模型,因此,在计算目标区域内预设时间段内的人口流动数据时,根据目标区域的ID获取该目标区域对应的AMARI模型,加载目标区域对应的AMARI模型,再传入目标区域对应的时间序列以及预设时间段,即可预测出未来预设时间段内该目标区域的人口流动数据。例如,预测区域i未来m小时内的人口流量数据时,加载预测区域i对应的ARIMAi的模型,传入区域i对应的已发生的时间序列计算得到接下来m个量(预设周期为1小时,将m小时划分为m个时间向量)对应的时间序列由中各个向量相加即可得到预测区域i未来m小时内的人口流量数据。

所述目标区域对应的自回归积分滑动平均模型的训练方法包括:

获取所述目标区域内的待预测人口流动数据,根据所述待预测人口流动数据获取所述目标区域对应的待预测时间序列;采用平稳性的单位根检验方法从所述待预测时间序列中获取稳定时间序列;采用共轭矩阵下降法训练得到自回归积分滑动平均模型的多组阶层和阶数;由多组阶层和阶数组成多个所述自回归积分滑动平均模型;计算所述自回归积分滑动平均模型的赤池信息量准则;取所述赤池信息量准则数值最小的所述自回归积分滑动平均模型作为所述目标区域的自回归积分滑动平均模型。

具体地,自回归积分滑动平均模型的训练步骤如下:

(1)待预测数据转化为每个区域对应的时间序列{yt}。

(2)检验时间序列{yt}是否是平稳的时间序列,使用kpss检验方法,原假设为稳定的序列,设p-value=0.05,右侧单边检验即统计值小于p-value接受原假设。本专利采用启发式搜索,默认设从0开始到2阶进行差分平稳检验,然后挑选最平稳的序列作为接下来的时间序列{yt}。

(3)自回归移动平均,时间序列{yt}满足:yt=φ1yt-1+...+φpyt-p+εt-θ1εt-1-...-θqεt-q,即时间序列服从(p,q)阶自回归移动模型,即ARIMA(p,0,q)。

(4)确定p和q。对平稳时间序列做其自相关图和偏自相关图,跟据自相关偏相关图的拖尾截尾的性质来确定p和q的值。本专利采用启发式搜索的方式去确定p和q,是用赤池信息量准则AIC(Akaike Information Criterion)来评估选择最优的ARIMA模型。我们使用的是AIC的近似值,而不是精确的值。对于每一个p和q进行一次拟合,采用共轭矩阵下降法作为优化算法CGD(conjugate gradient descent),得到对应AMARI模型。

(5)计算每个ARIMA模型的AIC值,AIC=(2k-2L)/n

假设条件是模型的误差服从独立正态分布。其中k是所拟合模型中参数的数据,L是对数似然值,n是观测值数。

(6)取AIC最小模型,作为最优的模型。

(7)本发明划分区域为多个小区,即有多个区域Id,对应多个时间序列,而每一个ARIMA模型都得经过步骤(1)-(6)计算得到,在传统的单机模式已经不再适用,本专利采用分布式计算框架spark,把多个区域的时间序列的计算过程分布式计算化。然后把每个模型保存为parquet格式,供后期计算人口流动数据时调用。

在本实施例中,在系统中存储有预先训练好的多个区域的AMARI模型,因此,在计算目标区域内预设时间段内的人口流动数据时,根据目标区域的ID获取该目标区域对应的AMARI模型,加载目标区域对应的AMARI模型,再传入目标区域对应的时间序列以及预设时间段,即可预测出未来预设时间段内该目标区域的人口流动数据。采用自回归积分滑动平均模型(AMARI模型)作为所述目标区域对应的所述预设模型计算目标区域内所述预设时间段内的人口流动数据,提高人口流动数据预测的准确性。

进一步的,参照图4,本发明人口流动数据的获取方法第三实施例,基于上述第一或第二实施例,所述步骤S30包括:

本实施例采用KNN临近算法预测目标区域预设时间段内的人口流动数据。KNN算法的基本思路是根据距离函数计算待预测数据x和每个已知历史数据的距离,选择与待预测数据距离最小的K个数据作为x的K个最近邻,最后根据x的k个最近邻判断x的类型。

为提高KNN临近算法计算出来的人口流动数据的准确性,本实施例通过临近算法计算出已知时间段对应的临近时间序列,再根据临近时间序列计算出所述预设时间段对应的目标时间序列,进而根据预设时间段的目标时间序列获取所述预设时间段内的人口流动数据。

步骤S33,从所述目标区域对应的时间序列中获取所述预设时间段对应的时间序列。

由于所述目标区域对应的时间序列为多个时间向量组成,预从时间序列中选取预设时间段对应的序列,则需要计算所述预设时间段包含所述预设周期的个数。然后从所述目标区域对应的时间序列中依次获取所述个数的所述时间向量,为了与预测的人口流动数据关联性较高,可获取时间点距离预设时间段的较近的时间向量为所述预设时间段对应的时间向量,由获取到的所述时间向量组成所述预设时间段对应的时间序列。

步骤S34,获取所述预设时间段对应的时间序列的临近时间序列,其中,采用临近算法从所述目标区域对应的时间序列中获取所述临近时间序列。

步骤S35,从所述目标区域对应的时间序列中获取所述临近时间序列对应的目标时间序列。

步骤S36,根据所述目标时间序列获取所述目标区域内所述预设时间段的人口流动数据。

从所述临近时间序列中各个时间向量对应的目标时间向量,其中,所述对应为周期对应;由所述目标时间向量组成所述目标时间序列。

采用临近算法在目标区域对应的时间序列中,获取所述预设时间段对应的时间序列的临近时间序列。

由上述实施例可知,目标区域对应的时间序列是由预设周期划分的多个向量组成的,因此相邻两个时间向量的时间间隔为一个周期。在上述获取预设时间段对应的时间序列时,若以预设时间段为周期,可计算出获取的预设时间段对应的时间序列与目标时间序列间也存在时间上的周期关系。故,获取预设时间段对应的时间序列与目标时间序列间的序列周期数,则在时间序列中寻找临近时间序列中各个时间向量周期对应的向量作为目标时间向量,其中,周期对应的周期数与所述对应为周期对应上述序列周期数相同。由所述目标时间向量组成所述目标时间序列。再将目标时间序列中的各个时间向量加权之和作为所述目标区域内所述预设时间段的人口流动数据。

例如,将已知的n个时间段的人口流动数据(OD量或人口密度)组成一个时间序列{x1,x2,...,xn;y},其中,前n项表示这个历史数据的n个不同时段的人口流动数据,最后一项y表示第n+1个时间段的人口流动数据。由于人口流动趋势一般伴随着周期性变化,例如工作日中的早晚高峰和平峰的波动一般相似。例如数据集由连续100个工作日(连续24周)的OD量组成,用来预测第25周的5个工作日的OD量,就需要从前23周的五个工作日数据中找出第24周的五个工作日OD量的k个最近邻。具体操作是:对数据集组成的长度为100的时间序列{x1,x2,...,x100},以向量a0={x96,x97,...,x100}为基础,经过时间往前推移,顺序提取23个长度为5的子序列:a1={x91,x92,...,x95},a2={x86,x87,...,x90},…,a23={x1,x2,...,x5},然后在这些子序列中找到a0={x96,x97,...,x100}的k个最近邻。通过计算,我们在a1,a2,...,a23中找出了向量a0={x96,x97,...,x100}的k个最近邻,记为β1,β2,...,βk。因为是用{x96,x97,...,x100}去预测{x101,x102,...,x105},两者的序列周期为1,所以这k个向量的下一个周期的向量被认为是{x101,x102,...,x105}的最近邻。假如β1,β2,...,βk的这些向量的下一个周期的向量分别是δ1,δ2,...,δk,分别对着向量δ1,δ2,...,δk进行加权求和就可以得到预测值。同理,若采用a2={x86,x87,...,x90}预测{x101,x102,...,x105},则两者的序列周期为3,则β1,β2,...,βk的下3个周期的向量为{x101,x102,...,x105}的最近邻。

在本实施例中,从所述目标区域对应的时间序列中依次获取所述个数的所述时间向量,为了与预测的人口流动数据关联性较高,可获取时间点距离预设时间段的较近的时间向量为所述预设时间段对应的时间向量,由获取到的所述时间向量组成所述预设时间段对应的时间序列。再采用临近算法从所述目标区域对应的时间序列中获取所述预设时间段对应的临近时间序列,再从所述目标区域对应的时间序列中获取所述临近时间序列对应的目标时间序列,最后,根据所述目标时间序列获取所述目标区域内所述预设时间段的人口流动数据。本实施例采用KNN临近算法预测目标区域预设时间段内的人口流动数据。为提高KNN临近算法计算出来的人口流动数据的准确性,本实施例通过临近算法计算出已知时间段对应的临近时间序列,再根据临近时间序列计算出所述预设时间段对应的目标时间序列,进而根据预设时间段的目标时间序列获取所述预设时间段内的人口流动数据。

此外,本发明实施例还提出一种人口流动数据的获取装置,所述人口流动数据的获取装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的人口流动数据的获取程序,所述人口流动数据的获取程序被所述处理器执行时实现如上各个实施例所述的人口流动数据的获取方法的步骤。

此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有人口流动数据的获取程序,所述人口流动数据的获取程序被处理器执行时实现如上各个实施例所述的人口流动数据的获取方法的步骤。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1