数据处理的方法、装置和系统与流程

文档序号：20998593发布日期：2020-06-05 22:26阅读：来源：国知局

技术特征：

1.一种数据处理的方法，包括：

依据待查询对象和待查询时间段从第一类计算引擎中获取所述待查询对象的签名数据；

依据所述签名数据从所述第一类计算引擎中获取候选集合；

通过所述第一类计算引擎将所述候选集合中所有签名数据的轨迹向量数据与所述待查询对象的签名数据对应的轨迹向量数据进行相似度计算，得到与所述待查询对象轨迹相似的伴随对象。

2.根据权利要求1所述的方法，其中，在得到与所述待查询对象轨迹相似的伴随对象之后，所述方法还包括：

依据所述伴随对象获取与所述待查询对象轨迹相似的设备列表。

3.根据权利要求1所述的方法，其中，在依据待查询对象和待查询时间段从第一类计算引擎中获取所述待查询对象的签名数据之前，所述方法还包括：

依据时间片对终端进行采样，得到每个时间片的位置数据；

依据所述每个时间片的位置数据进行哈希计算，得到签名数据；

依据所述每个时间片的位置数据进行压缩，得到压缩后的轨迹向量数据；

将所述签名数据和所述压缩后的轨迹向量数据由第二类计算引擎同步至第一类计算引擎。

4.根据权利要求3所述的方法，其中，所述依据时间片对终端进行采样，得到每个时间片的位置数据包括：

当所述时间片内有多个轨迹点时，通过计算所述多个轨迹点的位置数据均值、位置数据中位数或最后一个轨迹点的位置数据，得到所述时间片的位置数据。

5.根据权利要求3所述的方法，其中，所述依据时间片对终端进行采样，得到每个时间片的位置数据包括：

当所述时间片内没有轨迹点时，将前一个时间片的位置数据或后一个时间片的位置数据确定为所述时间片的位置数据。

6.根据权利要求3所述的方法，其中，所述依据所述每个时间片的位置数据进行哈希计算，得到签名数据包括：

将所述位置数据进行对齐处理，得到轨迹向量；

从所述轨迹向量中随机获取轨迹点，组成局部轨迹向量；

对所述局部轨迹向量进行哈希计算，得到所述签名数据。

7.根据权利要求3所述的方法，其中，所述依据所述每个时间片的位置数据进行压缩，得到压缩后的轨迹向量数据包括：

对所述每个时间片的位置数据进行掩码计算，得到压缩后的轨迹向量数据。

8.根据权利要求1至7中任一项所述的方法，其中，所述依据待查询对象和待查询时间段从第一类计算引擎中获取所述待查询对象的签名数据包括：

获取所述待查询对象和所述待查询时间段；

依据所述待查询对象和所述待查询时间段在所述第一类计算引擎中查询，得到所述待查询对象在所述待查询时间段的签名数据。

9.根据权利要求1至7中任一项所述的方法，其中，所述依据待查询对象和待查询时间段从第一类计算引擎中获取所述待查询对象的签名数据包括：

当获取所述待查询对象在所述待查询时间段的轨迹数据时，通过对所述轨迹数据进行分片，得到轨迹向量；

依据所述轨迹向量进行在线签名，得到所述待查询对象的签名数据。

10.根据权利要求1所述的方法，其中，所述依据所述签名数据从所述第一类计算引擎中获取候选集合包括：

依据所述签名数据的桶编号，在所述第一类计算引擎中进行查询，得到桶编号相同的签名数据集合；

将所述签名数据集合确定为第一候选集。

11.根据权利要求10所述的方法，其中，在所述将所述签名数据集合确定为所述第一候选集之后，所述方法还包括：

根据预设距离公式计算所述第一候选集中的签名数据与所述签名数据之间的距离；

对所述距离进行排序，得到第二候选集。

12.根据权利要求11所述的方法，其中，所述通过所述第一类计算引擎将所述候选集合中所有签名数据的轨迹向量数据与所述待查询对象的签名数据对应的轨迹向量数据进行相似度计算，得到与所述待查询对象轨迹相似的伴随对象包括：

通过所述第一类计算引擎，将所述第二候选集中签名数据对应的移动设备的轨迹向量数据，与所述待查询对象的签名数据的轨迹向量数据进行相似度计算，得到多个计算结果；

依据预设顺序排列所述多个计算结果的相似度，将位于前n个的计算结果确定为所述与所述待查询对象轨迹相似的伴随对象。

13.一种数据处理的装置，包括：

提取模块，用于依据待查询对象和待查询时间段从第一类计算引擎中获取所述待查询对象的签名数据；

获取模块，用于依据所述签名数据从所述第一类计算引擎中获取候选集合；

计算模块，用于通过所述第一类计算引擎将所述候选集合中所有签名数据的轨迹向量数据与所述待查询对象的签名数据对应的轨迹向量数据进行相似度计算，得到与所述待查询对象轨迹相似的伴随对象。

14.一种数据处理的系统，包括：第一类计算引擎和第二类计算引擎，其中，所述第二类计算引擎，用于依据时间片对终端进行采样，得到每个时间片的位置数据；依据所述每个时间片的位置数据进行哈希计算，得到签名数据；依据所述每个时间片的位置数据进行压缩，得到压缩后的轨迹向量数据；将所述签名数据和所述压缩后的轨迹向量数据由所述第二类计算引擎同步至所述第一类计算引擎；

所述第一类计算引擎，用于依据待查询对象和待查询时间段从第一类计算引擎中获取所述待查询对象的签名数据；依据所述签名数据获取候选集合；通过所述第一类计算引擎将所述候选集合中所有签名数据的轨迹向量数据与所述待查询对象的签名数据对应的轨迹向量数据进行相似度计算，得到与所述待查询对象轨迹相似的伴随对象。

15.一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行：权利要求1所述的数据处理的方法。

技术总结
本发明公开了一种数据处理的方法、装置和系统。其中，该方法包括：依据待查询对象和待查询时间段从第一类计算引擎中获取待查询对象的签名数据；依据签名数据从第一类计算引擎中获取候选集合；通过第一类计算引擎将候选集合中所有签名数据的轨迹向量数据与待查询对象的签名数据对应的轨迹向量数据进行相似度计算，得到与待查询对象轨迹相似的伴随对象。本发明解决了从海量的轨迹数据中找出与目标轨迹的相似度高的其它轨迹的过程中海量数据带来的计算效率低的技术问题。

技术研发人员：罗净;朱洪波
受保护的技术使用者：阿里巴巴集团控股有限公司
技术研发日：2018.11.29
技术公布日：2020.06.05

完整全部详细技术资料下载

当前第2页1 2