一种基于云端的轨迹计算方法、系统与流程

文档序号:14294269阅读:302来源:国知局

本发明涉及计算机软件领域、云计算领域,特别涉及一种基于云端的轨迹计算方法、系统。



背景技术:

gps轨迹是采用gps轨迹记录仪采集的一系列户外活动的位置点,每个点至少包括日期、时间、经度、纬度、海拔信息,有的轨迹记录仪还包含速度等信息。而将gps轨迹配上通讯部分,就可以将运动体的行进轨迹实时传输到网络,供相关使用者第一时间分享,这方面带有gps芯片的智能手机将是主要的载体。大多数的手机软件都能够完成轨迹的多种方式的记录、实时上传和分享。

目前的运动轨迹计算方法大多采用gps轨迹图定位,主要存在如下的缺陷:

1)现有的gps轨迹图定位容易出现偏差大、存在漂移、不计步的情况,在日常生活中,轨迹图的应用尤为广泛,像行车轨迹、走路轨迹、跑步轨迹等,这些都是基于gps卫星定位来实现的。但是由于恶劣天气、高层建筑、手机机型等因素的影响,gps卫星定位难免会受到外界不同程度的干扰,最终导致gps轨迹图定位偏差大、漂移、不计步。

2)现有gps轨迹图定位耗电量大,当gps处于不断的工作状态时,电量就会亏损得非常快,这是因为设备在不停的接收传输数据,这个过程很耗电。特别是当手机电量不足的时候,gps轨迹图定位的记录功能就会失效。



技术实现要素:

本发明要解决的技术问题是,一种利用用户的历史跑步记录整合大数据运算,计算得到用户当前的运动轨迹的基于云端的轨迹计算方法,可降低耗电量,有效克服定位偏差大、漂移、不计步等问题。

解决上述技术问题,本发明提供了一种基于云端的轨迹计算方法,包括如下步骤:

用户上传gps定位数据至云端,在云端建立运动轨迹数据库,

对所述运动轨迹数据库中所有用户的历史运动轨迹数据进行机器学习,提取出规律路径,

将规律路径拟合作为用户的真实跑步轨迹。

更进一步,提取出规律路径的方法具体包括:

采集得到样本路径,

对轨迹路径聚类,

筛选得到支撑路径。

更进一步,所述规律路径按照设定的网格尺寸完成提取。

更进一步,所述网格尺寸大小为:10英寸。

更进一步,所述规律路径,用以表示用户经常访问的完整轨迹路线。

更进一步,所述支撑路径,用以表示,用户每次经过同一路线,产生的一条路径记录,所述支撑路径是对一条路线的一次访问实例。

更进一步,方法还包括:采用网格映射对所述gps定位数据进行预处理,

将gps点映射入预先划分好的坐标网格中,

当连续的gps点映射入同一网格时,压缩记录为一个时序格。

基于上述,本发明还提供了一种基于云端的轨迹计算系统,其特征在于,包括:数据预处理单元,路径聚类提取单元,

所述数据预处理单元,用以上传gps定位数据至云端,在云端建立运动轨迹数据库,

所述路径聚类提取单元,用以对所述运动轨迹数据库中所有用户的历史运动轨迹数据进行机器学习,提取出规律路径,将规律路径拟合作为用户的真实跑步轨迹。

更进一步,所述路径聚类提取单元,还用以根据所述运动轨迹数据库中用户每天产生的路径在一设定时间的历史时期内的依据时间对路径进行聚类,提取出运动规律路径。

更进一步,所述路径聚类提取单元,还用将所述规律路径上配置为规律路径的每一路段都被多条支撑路径所访问

本发明的有益效果:

1)在本发明中通过将轨迹数据上传至云端,剔除了外界因素的干扰,通过大量的轨迹数据上传至云端,通过大数据算法的分析拟合成预测路线,可不受空间、地域、时间等因素的限制,从而最大化减少了轨迹图定位偏差、漂移、不计步等问题。

2)本发明中解决了原gps定位耗电量大的问题,由于云轨迹计算方法不要求gps长期处于实时工作状态,很大程度上节省了通过定位带来的电量损耗。

3)本发明中还整合大数据运算,使得运动轨迹更精准。此外,随着用户使用时长、黏性的加深,运动轨迹也会随之更加精准、确定。

附图说明

图1是本发明一实施例中的方法流程示意图;

图2是图1中提取出规律路径的方法流程示意图;

图3是本发明一实施例中的系统结构示意图;

图4-图5是网格尺寸对计算性能的影响示意图;

图6-图9是规律路径提取示例示意图。

具体实施方式

现在将参考一些示例实施例描述本公开的原理。可以理解,这些实施例仅出于说明并且帮助本领域的技术人员理解和实施例本公开的目的而描述,而非建议对本公开的范围的任何限制。在此描述的本公开的内容可以以下文描述的方式之外的各种方式实施。

如本文中所述,术语“包括”及其各种变体可以被理解为开放式术语,其意味着“包括但不限于”。术语“基于”可以被理解为“至少部分地基于”。术语“一个实施例”可以被理解为“至少一个实施例”。术语“另一实施例”可以被理解为“至少一个其它实施例”。

在一组路径中,当em,n的访问频率(em,n.f)大于给定阈值α,则被称为频繁有向边(frequentdirectededge,fde)。

在一组路径中,被支撑路径频繁访问的是支撑有向边(supportdirectededge,sde)。

如图1所示是本发明一实施例中的方法流程示意图,本实施例中的一种基于云端的轨迹计算方法,包括如下步骤:

步骤s100用户上传gps定位数据至云端,在云端建立运动轨迹数据库,在步骤s100中包括但不限于数据的预处理方式,比如,异常点预处理、路径分割、网格映射以及停留区域检测。

在一些实施例中,由于受gps精度以及信号干扰等因素的影响,原始的gps数据中,通常包含一些异常点。这些异常点的存在会影响后续轨迹处理的精度和准确性。通过异常点预处理的方式能够去除异常点,确保轨迹处理的准确性。

在一些实施例中,路径分割,当gps轨迹中存在任一两种情景之一时,将其拆分为两条路径:

情景1,轨迹中存在停留区域;

情景2,相邻gps点的时隙大于一定阈值,很可能是用户关闭了gps设备,或者gps设备在一段时间内未接收到卫星信号等原因造成的。

由于从gps轨迹中去除停留区域时留下了一个较大的时隙。可以统一检测gps点间的时隙,当大于某一时间阈值时,就进行路径分割。

在一些实施例中,采用网格映射对所述gps定位数据进行预处理,将gps点映射入预先划分好的坐标网格中,当连续的gps点映射入同一网格时,压缩记录为一个时序格。

在一些实施例中,当用户在某一区域驻留超过一段时间,则该区域可能是用户的一个停留区域。

在一些实施例中,当在一个连续的gps轨迹中,发现了一个停留区域,则将轨迹拆分为两段:通往和离开该区域的轨迹,并同时从gps轨迹中删除停留区域的数据点。

在一些实施例中,还包括采用均值(或中值)滤波器、kalman和粒子滤波器进行轨迹数据预处理。

在一些实施例中,停留区域检测还可以采用gidofalvig,pedersentb.mininglong,sharablepatternsintrajectoriesofmovingobjects[j].geoinformatica,2009,13(1):27-55.中的方法。

步骤s101对所述运动轨迹数据库中所有用户的历史运动轨迹数据进行机器学习,提取出规律路径,经过步骤s100中的数据准备,用户的轨迹日志被形式化为一系列的时序格链表存放至云端数据库中,将从时序格链表中挖掘出用户的规律出行路径,并识别每条路径的交通模式。

步骤s102将规律路径拟合作为用户的真实跑步轨迹。

上述步骤中,用户的轨迹是用户行为的重要组成部分,其包括但不限于:用户的出行信息、用户的出行习惯、生活经验等。而随着gps智能终端的普及,越来越多的人开始习惯于记录并分享轨迹日志。基于这些日志,可以分析并挖掘出用户的一些行为特征,从而为用户提供个性化的基于位置的智能服务,有效地提升和改善用户的应用体验。

作为本实施例中的优选,请参考图2是图1中提取出规律路径的方法流程示意图,提取出规律路径的方法具体包括:

步骤s200采集得到样本路径,

步骤s201对轨迹路径聚类,用户每天会产生大量的路径,要从一段历史时期的所有路径中,提取出规律路径,运算量是很大的。但由于规律路径发生在每天的近似时刻,因而,可以先依据时间对路径进行聚类。由于用户在周末及工作日通常会有不同的生活习惯,所以本文按照时刻和路径发生的日期分别对路径进行聚类。

步骤s202筛选得到支撑路径。用户的规律路径是指用户经常访问的完整路线。用户每次经过同一路线,均会产生一条路径记录,称为该路线的支撑路径。所述支撑路径是对一条路线的一次访问实例。如果一条路线要成为规律路径,必有多条支撑路径。故规律路径上的每一路段都会被多条支撑路径所访问。

所述筛选得到支撑路径的方法具体包括:

step1计算频繁有向边,支撑路径的特征是:它会频繁访问大部分有向边。通过频繁有向边可找到支撑路径。

step2提取支撑路径,提取出所有可能的支撑路径,

step3提取支撑有向边有了支撑路径,则统计出被支撑路径频繁访问的支撑有向边,

step4更新支撑路径,从支撑路径集中去除错误的支撑路径,即可完成更新。

所述规律路径,用以表示用户经常访问的完整轨迹路线。

所述支撑路径,用以表示,用户每次经过同一路线,产生的一条路径记录,所述支撑路径是对一条路线的一次访问实例。

请参考,图4-图5是网格尺寸对计算性能的影响示意图作为本实施例中的优选,所述规律路径按照设定的网格尺寸完成提取,图4-图5给出了网格尺寸对算法性能的影响分析。图4给出了随着网格尺寸的变化,轨迹映射误差和时序格数量的变化趋势。随着网格尺寸的增大,轨迹的映射误差呈线性增加,而时序格数量呈指数下降。图5给出了时序格数量对算法计算性能的影响曲线。随着时序格数量的增加,规律路径提取所需的计算时间呈明显上升趋势。因而网格尺寸的选择,需要在网格误差和网格数量上做适当的调整。从图5中可以看出,当网格尺寸大于10”后,网格数量的减少趋势明显放缓,而误差仍在持续增加。同时网格尺寸为10”时,平均映射误差约为50m左右,满足城市大部分道路的分辨距离。综上所述,本文选取网格大小为10”。

作为本实施例中的优选,所述网格尺寸大小为:10英寸。

图6-图9是规律路径提取示例示意图,演示了一个实际的规律路径提取过程。图6是一组包含有13条路径的tr。图7、图8分别是1~3轮循环后得到的支撑路径。第3轮循环后,支撑路径的数量不再发生变化,运行结束。图4(d)为最终提取的规律路径。从图9可以看出:每条支撑路径在细节上都有细微的差别,显示了算法的鲁棒性。

请参考图3是本发明一实施例中的系统结构示意图,本实施例中的一种基于云端的轨迹计算系统,包括:数据预处理单元1,路径聚类提取单元2,

所述数据预处理单元1,用以上传gps定位数据至云端,在云端建立运动轨迹数据库,所述路径聚类提取单元2,用以对所述运动轨迹数据库中所有用户的历史运动轨迹数据进行机器学习,提取出规律路径,将规律路径拟合作为用户的真实跑步轨迹。在所述数据预处理单元1将定位数据上传到云端后,通过在所述路径聚类提取单元2中进行历史的路线机器学习,可以帮这些应用实时预测路线。基于几千万用户建立一整套运动轨迹数据库,将所有用户大规模的轨迹数据进行有效管理和组织,再结合大数据算法对用户所有历史轨迹数据进行分析与评估,拟合成一条最接近用户的真实跑步轨迹。随着用户使用时长、黏性的加深,运动轨迹也会随之更加精准、确定。

在所述路径聚类提取单元2中为了找到不同移动物体共享的代表性路径或共同趋势,通常需要将类似的轨迹组合成族。一般的聚类方法是用特征向量表示轨迹,表示两个轨迹之间的相似度与它们的特征向量之间的距离。然而,由于不同的轨迹包含不同和复杂的属性,例如长度,形状,采样率,点数和它们的顺序,所以不同的轨迹生成具有均匀长度的特征向量是不容易的。此外,难以将轨迹中的点的顺序和空间属性编码为其特征向量。故,在所述路径聚类提取单元2中可以首先使用地图匹配算法将轨迹投影到道路网络上,然后使用图聚类算法在路网上找到子图。

作为本实施例中的优选,所述路径聚类提取单元2,还用以根据所述运动轨迹数据库中用户每天产生的路径在一设定时间的历史时期内的依据时间对路径进行聚类,提取出运动规律路径。

作为本实施例中的优选,所述路径聚类提取单元2,还用将所述规律路径上配置为规律路径的每一路段都被多条支撑路径所访问。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

总体而言,本公开的各种实施例可以以硬件或专用电路、软件、逻辑或其任意组合实施。一些方面可以以硬件实施,而其它一些方面可以以固件或软件实施,该固件或软件可以由控制器、微处理器或其它计算设备执行。虽然本公开的各种方面被示出和描述为框图、流程图或使用其它一些绘图表示,但是可以理解本文描述的框、设备、系统、技术或方法可以以非限制性的方式以硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其它计算设备或其一些组合实施。

此外,虽然操作以特定顺序描述,但是这不应被理解为要求这类操作以所示的顺序执行或是以顺序序列执行,或是要求所有所示的操作被执行以实现期望结果。在一些情形下,多任务或并行处理可以是有利的。类似地,虽然若干具体实现方式的细节在上面的讨论中被包含,但是这些不应被解释为对本公开的范围的任何限制,而是特征的描述仅是针对具体实施例。在分离的一些实施例中描述的某些特征也可以在单个实施例中组合地执行。相反对,在单个实施例中描述的各种特征也可以在多个实施例中分离地实施或是以任何合适的子组合的方式实施。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1