时空轨迹向量构建方法、终端设备及计算机存储介质与流程

文档序号:19350446发布日期:2019-12-06 21:20阅读:321来源:国知局
时空轨迹向量构建方法、终端设备及计算机存储介质与流程

本申请涉及智能交通数据分析技术领域,特别是涉及一种时空轨迹向量构建方法、终端设备及计算机存储介质。



背景技术:

随着世界各个现代化城市的兴起与发展,城市规模逐步增大,城市人口逐步增多,城市时时刻刻都在产生大量交通数据。而智能时代的到来,使得这些海量交通数据有了用武之地。智能化分析交通流量数据为解决城市拥堵、犯罪预防等问题提供了很好的解决方案。

一般在数据分析和挖掘步骤有:数据预处理、数据表示、数据建模和结果分析。数据表示对数据分析和挖掘有很大的影响,它直接影响到模型的选择和结果准确性的提高。交通数据的分析侧重到交通中的卡口过车数据,通常会把过车的轨迹数据按照卡口编号根据时间序列进行编码,组成一条过车时空轨迹数据,然后再进行后续的建模等工作。

但是,在数据表示中,只引用时间信息无法很准确地组成一条过车时空轨迹数据,导致后续的数据建模和结果分析产生一定的误差和影响。



技术实现要素:

本申请提供了一种时空轨迹向量构建方法、终端设备及计算机存储介质,主要解决的技术问题是如何引入多种信息组成过车时空轨迹数据。

为解决上述技术问题,本申请提供了一种时空轨迹向量构建方法,所述构建方法包括:

获取多个过车数据,其中,多个所述过车数据包括时间信息和位置信息;

基于多个所述过车数据的时间信息和位置信息,建立时空语料库;

基于所述时空语料库,采用预设规则对多个所述过车数据进行切分,获取多个所述过车数据对应的时空轨迹,以得到多个所述过车数据对应的时空轨迹语料库,并生成时空轨迹向量。

为解决上述技术问题,本申请还提供了一种终端设备,所述终端设备包括存储器以及与所述存储器耦接的处理器;

其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现如上述的时空轨迹向量构建方法。

为解决上述技术问题,本申请还提供了一种计算机存储介质,所述计算机存储介质用于存储程序数据,所述程序数据在被处理器执行时,用以实现如上述的时空轨迹向量构建方法。

与现有技术相比,本申请的有益效果是:终端设备获取多个过车数据,其中,多个过车数据包括时间信息和位置信息;基于多个过车数据的时间信息和位置信息,建立时空语料库;基于时空语料库,采用预设规则对多个过车数据进行切分,获取多个过车数据对应的时空轨迹,以得到多个过车数据对应的时空轨迹语料库,并生成时空轨迹向量。本申请通过同时引用过车数据中的时间信息和位置信息,构建一种创新型的时空轨迹向量表示方法,能够更好地表示和体现卡口过车的轨迹数据,为智能交通数据分析的建模等后续步骤提供有力的、合理的表示方法。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。其中:

图1是本申请提供的时空轨迹向量构建方法第一实施例的流程示意图;

图2是本申请提供的时空轨迹向量构建方法第二实施例的流程示意图;

图3是监测区域内每天分钟级别上卡口抓拍过车记录的示意图;

图4是本申请提供的时空轨迹向量构建方法第三实施例的流程示意图;

图5是本申请提供的终端设备一实施例的结构示意图;

图6是本申请提供的计算机存储介质一实施例的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。

为解决单一信息无法组成准确的过车时空轨迹数据的问题,本申请提出了一种时空轨迹向量构建方法,具体请参阅图1,图1是本申请提供的时空轨迹向量构建方法第一实施例的流程示意图。本申请的时空轨迹向量构建方法至少引入过车数据的时间信息和位置信息,基于时间信息和位置信息,终端设备可以组成准确的过车时空轨迹数据。

具体地,如图所示,本实施例的时空轨迹向量构建方法包括以下步骤:

s101:获取多个过车数据,其中,多个过车数据包括时间信息和位置信息。

其中,本实施例的时空轨迹向量构建方法应用于一种终端设备,终端设备至少包括处理器,用于执行本实施例的时空轨迹向量构建方法。

终端设备获取多个过车数据,过车数据的获取可以直接从现有的交通大数据开源平台或者从交通管理部门获取。其中,过车数据包括时间信息和位置信息。

具体地,过车数据需要包括监控区域内的卡口点位位置信息,如经纬度(latitude,longitude)信息等;还需要包括预设时间段,如一个月内的卡口抓拍过车记录数据,其中,卡口抓拍过车记录数据包括时间信息。如果卡口抓拍过车记录数据中存储有经纬度等位置信息,卡口点位位置信息也可以直接在卡口抓拍过车记录数据内提取。

因为在极端情况下近一段时间内的抓拍记录不能保证所有卡口点位都有过车数据,为保证监控区域内的所有卡口点位不能缺少,此时,终端设备需要从现有的交通大数据开源平台或者交通管理部门获取所有的卡口点位位置信息。

由于在原始过车数据集合中可能会存在部分异常数据,在获取过车数据后,终端设备还可以对过车数据进行预处理。具体地,终端设备判断每个过车数据中是否包括抓拍时间的时间信息和包括经纬度信息的位置信息中的所有信息。若过车数据中缺失时间信息和位置信息中的任一种信息,终端设备直接剔除对应的过车数据,以免在后续时空预料库出现数据缺失的问题。

终端设备对原始过车数据中的重复数据、无效数据进行清洗,有利于数据分析。

s102:基于多个过车数据的时间信息和位置信息,建立时空语料库。

其中,终端设备提取过车数据中的时间信息和位置信息,并根据预设组合方式将时间信息和位置信息融合在一起,以形成时空信息。终端设备进一步将多个过车数据以及对应的时空信息组成一时空语料库,时空语料库中的过车数据基于时空信息的顺序排列。

其中,时空语料库是最终构建时空轨迹向量的基础元素。

s103:基于时空语料库,采用预设规则对多个过车数据进行切分,获取多个过车数据对应的时空轨迹,以得到多个过车数据对应的时空轨迹语料库,并生成时空轨迹向量。

其中,终端设备采用预设规则对多个过车数据进行切分,以在时空语料库中获取每个车辆对应的过车数据,并根据时空信息将多个过车数据组成对应的时空轨迹。终端设备进一步将多条时空轨迹组合为空轨迹语料库,并将时空语料库和时空轨迹语料库作为输入词嵌入训练算法,生成卡口时空轨迹向量;具体算法包括但不局限于word2vec的cbow和skip-gram模型。经过成功的卡口时空轨迹模型训练后,卡口时空轨迹向量能够表征上下文的结果,可以作为智能交通分析和挖掘的重要基础内容,例如用以车辆的同行挖掘、目的地推荐、好友推荐等。

终端设备通过利用卡口时空语料库和卡口时空轨迹语料库训练词嵌入模型,充分挖掘时空轨迹中的上下文信息,包括但不局限于词嵌入模型,还可以是其它能够编码体现上下文信息的模型,例如rnn(recurrentneuralnetwork,循环神经网络)、lstm(longshort-termmemory,长短期记忆网络)、gru(gatedrecurrentunit,门控循环单元)等。

在本实施例中,终端设备获取多个过车数据,其中,多个过车数据包括时间信息和位置信息;基于多个过车数据的时间信息和位置信息,建立时空语料库;基于时空语料库,采用预设规则对多个过车数据进行切分,获取多个过车数据对应的时空轨迹,以得到多个过车数据对应的时空轨迹语料库,并生成时空轨迹向量。本申请通过同时引用过车数据中的时间信息和位置信息,构建一种创新型的时空轨迹向量表示方法,能够更好地表示和体现卡口过车的轨迹数据,为智能交通数据分析的建模等后续步骤提供有力的、合理的表示方法。

对于图1所示实施例中的步骤s102,本申请进一步提出了另一种具体的方法。具体请参阅图2,图2是本申请提供的时空轨迹向量构建方法第二实施例的流程示意图。

如图所示,本实施例的时空轨迹向量构建方法具体提出了以下方法:

s201:基于多个过车数据的时间信息,设置多个时间阈值。

其中,终端设备对过车数据中的时间信息进行划分并统计分析。以20190514084025为例,终端设备将此信息识别为2019年5月14日08点40分25秒,并提取0840,含义是每天分钟级别上卡口抓拍过车记录。如图3所示,图3是监测区域内每天分钟级别上卡口抓拍过车记录。

终端设备可以根据图3在时间粒度编码上设置多个时间阈值,每个时间阈值代表不同的时间间隔,设置时间阈值的依据包括车流量信息。例如,车流量为10000~14000对应的时间段的起始时间和结束时间设置为第一时间阈值,车流量6000~10000对应的时间段的起始时间和结束时间设置为第二时间阈值,车流量6000~2000对应的时间段的起始时间和结束时间设置为第三时间阈值。在其它实施例中,终端设备也可以采用不同的车流量信息作为设置时间阈值的依据,在此不再赘述。

s202:基于多个时间阈值将时间信息划分为不同的时间语料库。

其中,终端设备基于多个时间阈值将一天内不同时间段划分为不同的时间语料库。例如,凌晨到上午7点每个半小时设置一个时间节点(0000,0030,0100,...,0630,0700);根据图3所示,上午7点到10点为抓拍记录高峰,终端设备每间隔一分钟设置一个时间节点(0701,0702,...,0959,1000),以此类推。终端设备将多个时间语料库可组成表示为:t={t1,t2,t3,...,tm},其中,m为时间段的个数。

s203:将过车数据的二维经纬度信息映射为一维卡口编码信息。

其中,终端设备使用geohash算法将二维的卡口经纬度编码重新编码并映射到一维空间,以形成一维卡口编码信息,记录为g={g1,g2,g3,...gn},其中,n为监测区域内卡口的总数量大小。终端设备使用geohash编码表示卡口位置信息在后续步骤中更方便操作,且保留了卡口位置特征信息。

s204:基于一维卡口编码信息建立空间语料库。

其中,终端设备基于一维卡口编码信息g建立空间语料库。

s205:融合时间信息和一维卡口编码信息,以得到过车数据的时空信息。

s206:基于过车数据的时空信息建立时空语料库。

其中,终端设备融合卡口空间位置geohash编码g和时间编码t,以得到最终的卡口时空语料库其中,表示卡口gj在时间点ti的编码值。例如,监测区域内有1000个卡口,每天每间隔一分钟划分为一个时间点,则卡口时空语料库的大小为1000*24*60级别,这个时间粒度可以根据实际情况调整,如s202中所示,在此不再赘述。

具体地,以卡口a为例在时间节点08点30分的编码为a0830,08点31分的编码为a0831;同样地,卡口b在15点的编码为b1500。以此类推,终端设备根据时间信息和位置信息将多个过车数据组成卡口时空语料库gt={...,a0830,a0831,a0832,...,e1500,e1530,...}。这里的卡口a和卡口b是由卡口的位置信息经过geohash算法编码得来,如a卡口的经纬度为(41.257924,-95.938081),根据geohash算法转换成4c2af967eb5df8,长度可以根据终端设备的需求控制,长度越长精度越高。这样卡口a在时间节点08点30分的编码为4c2af967eb5df80830,08点31分的编码为4c2af967eb5df80831,以此类推构建整个卡口时空语料库gt,具体时间间隔根据监测区域内车辆流量设定不同的阈值。

在本实施例中,终端设备在对时空轨迹编码时,融合了轨迹的空间位置信息和时间属性信息,相较于对空间位置信息和时间属性信息的拼接,即同时保留了空间信息和时间信息,同时也减少了词嵌入的步骤。如果是空间位置信息和时间属性信息的拼接,后续训练过程中至少需要两次预训练词向量,而本实施例的编码方式仅需一次预训练词向量。

对于图1所示实施例中的步骤s103,本申请进一步提出了另一种具体的方法。具体请参阅图4,图4是本申请提供的时空轨迹向量构建方法第三实施例的流程示意图。

如图所示,本实施例的时空轨迹向量构建方法具体提出了以下方法:

s301:分析多个车辆信息,获得第一车辆对应的多个第一过车数据,以得到第一车辆的离散轨迹点。

其中,卡口抓拍的行车记录是离散的轨迹点,在实际应用中需要将离散的轨迹点串联成一条完整的轨迹。

在本实施例中,终端设备首先需要提取第一车辆的多个过车数据。具体地,过车数据中还包括车辆信息。终端设备通过车辆信息中的车牌号或其它信息识别出属于第一车辆的多个过车数据,以得到第一车辆的离散轨迹点。

s302:判断离散轨迹点中第一轨迹点与相邻轨迹点的时间间隔是否大于预设时间阈值。

其中,终端设备遍历第一车辆的所有离散轨迹点,判断离散轨迹点中是否存在第一轨迹点与相邻的其它轨迹点的时间间隔大于或等于预设时间阈值。若存在,则进入s303。

s303:将第一轨迹点设置为第一车辆的行程结束轨迹点。

其中,终端设备采用时间规则对离散轨迹点进行切分。当满足上述s302的条件时,即说明对于第一车辆而言,大于预设时间阈值没有抓拍记录,终端设备将该第一轨迹点记录为第一车辆的行程结束轨迹点,即产生第一车辆对应的一条卡口时空轨迹

终端设备重复上述步骤以将监测区域内的所有过车数据进行切分,以获取卡口时空轨迹语料库t={t′1,t′2,...,t′p}。

具体地,若卡口时空轨迹语料库表示为则其中每一行代表一辆车的行程轨迹,列数的大小表示经过的轨迹点数量,其中,卡口时空轨迹语料库t中的列数不完全相等,即每辆车经过的轨迹点数量可以不相同。

为实现上述实施例的时空轨迹向量构建方法,本申请还提出了一种终端设备,具体请参阅图5,图5是本申请提供的终端设备一实施例的结构示意图。

终端设备400包括存储器41和处理器42,其中,存储器41和处理器42耦接。

存储器41用于存储程序数据,处理器42用于执行程序数据以实现上述实施例的时空轨迹向量构建方法。

在本实施例中,处理器42还可以称为cpu(centralprocessingunit,中央处理单元)。处理器42可能是一种集成电路芯片,具有信号的处理能力。处理器42还可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器42也可以是任何常规的处理器等。

本申请还提供一种计算机存储介质,如图6所示,计算机存储介质500用于存储程序数据,程序数据在被处理器执行时,用以实现如本申请时空轨迹向量构建方法实施例中所述的方法。

本申请时空轨迹向量构建方法实施例中所涉及到的方法,在实现时以软件功能单元的形式存在并作为独立的产品销售或使用时,可以存储在装置中,例如一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1