一种轨迹数据的追踪与预测方法、装置及介质

文档序号:31635061发布日期:2022-09-24 03:27阅读:53来源:国知局
一种轨迹数据的追踪与预测方法、装置及介质

1.本发明涉及轨迹追踪技术领域,特别是涉及一种轨迹数据的追踪与预测方法、装置及介质。


背景技术:

2.随着移动智能设备和位置服务的广泛使用,大量信令轨迹数据得以被采用并持久化存储。该数据以大量移动对象的行驶轨迹为内容,不仅刻画了每条轨迹移动的实时状态,而且蕴含着丰富的轨迹移动的模式规律,为移动轨迹的追踪与预测提供了前所未有的机遇。因此,越来越多的应用从轨迹数据中分析其移动过程中的行为偏好和特征,挖掘移动模式与规律,从而进行移动轨迹的追踪与预测。
3.现有的移动轨迹数据的追踪与预测由于数据的稀疏性问题通常面临着冷启动用户或者冷启动路径。例如,冷启动用户可能有很少的历史轨迹,而其他用户可能面临位于不熟悉的区域的移动轨迹。现有的模型进行追踪与预测需要大量的训练数据,若在冷启动用户或者冷启动路径这样的少样本数据发现序列模式和用户偏好却成为一种严重的挑战,故在支持冷启动预测方面无效,导致轨迹追踪与预测的准确度降低。
4.因此,寻求一种轨迹数据的追踪与预测方法是本领域技术人员亟需要解决的。


技术实现要素:

5.本发明的目的是提供一种轨迹数据的追踪与预测方法、装置及介质,解决了现有的模型进行追踪预测无法支持冷启动用户及冷启动路径的预测问题,同时提高轨迹追踪与预测的准确度。
6.为解决上述技术问题,本发明提供一种轨迹数据的追踪与预测方法,包括:
7.获取当前用户的待预测轨迹数据;
8.将待预测轨迹数据进行聚类初始化得到网络初始化参数;
9.根据网络初始化参数对第一基模型进行参数更新,并将支持集内的轨迹数据输入至参数更新后的第一基模型以得到初始化结果,对初始化结果进行损失处理得到损失结果,其中,支持集内的轨迹数据由待预测轨迹数据与用户对应的历史轨迹数据的关系确定得到;
10.根据损失结果对第二基模型进行参数更新,并将查询集内的预测轨迹数据输入至参数更新后的第二基模型以得到预测结果,其中查询集内的数据为待预测轨迹数据。
11.优选地,将待预测轨迹数据进行聚类初始化得到网络初始化参数,包括:
12.获取当前用户的历史轨迹数据;
13.通过加权策略将历史轨迹数据构建当前用户的空间分布;
14.通过全连接层将空间分布转换得到当前用户的出行偏好向量;
15.通过全连接层对出行偏好向量进行线性映射得到查询向量;
16.根据查询向量与多个聚类参数进行余弦相似度得到对应的相似度分数,并组合成
相似度矩阵;
17.获取原始参数记忆向量和上一个待预测轨迹数据对应的网络参数与预测层全局参数,其中,首个参数记忆向量为原始参数记忆向量,网络参数由上一个待预测轨迹数据对应的损失结果得到,预测层全局参数由上一个待预测轨迹数据对应的第二基模型得到的损失结果,并根据第二基模型得到的损失结果进行处理得到的参数;
18.根据网络参数与原始参数记忆向量的关系确定当前参数记忆向量;
19.根据当前参数记忆向量与相似度矩阵的关系确定网络参数偏置;
20.根据预测层全局参数与网络参数偏置的关系得到网络初始化参数。
21.优选地,支持集内的轨迹数据由待预测轨迹数据与当前用户的历史轨迹数据的关系确定得到,包括:
22.获取除当前用户之外的其他用户的历史轨迹数据;
23.通过轨迹相似度策略在当前用户的历史轨迹数据中确定与待预测轨迹数据相似的第一目标轨迹数据;
24.通过出行偏好相关策略在其他用户的历史轨迹数据中确定与待预测轨迹数据相关的第二目标轨迹数据;
25.将第一目标轨迹数据、第二目标轨迹数据与待预测轨迹数据的待预测轨迹子序列数据存储至支持集以作为支持集内的轨迹数据。
26.优选地,损失结果对应的网络参数的确定过程包括以下步骤:
27.将支持集内的轨迹数据输入至第一基模型得到对应的时空预测向量;
28.将多个时空预测向量与出行偏好向量的关系确定对应的连接向量;
29.通过余弦相似度确定多个连接向量之间的相关性,并通过全连接层确定对应的权重值;
30.根据支持集内的轨迹数据对应的损失结果与权重值的关系确定损失结果对应的网络参数。
31.优选地,第一基模型与第二基模型的结构相同,其中第一基模型的建立包括以下步骤:
32.将待预测轨迹数据对应的地理区域划分为多个访问网格,并根据待预测轨迹中访问点的位置转换为由多个访问网格组成的轨迹数据;
33.将多个访问网格的轨迹数据转换为对应的密集向量;
34.获取相邻两个访问网格之间的时间间隔与真实地理距离;
35.将密集向量、时间间隔和真实地理距离输入至时空预测学习模型以输出各访问点对应的隐藏状态;
36.通过fcn全连接网络将连接向量转换为下一个访问网格的概率分布,并获取最大的概率分布作为第一基模型对应的初始化结果,其中连接向量由时空预测向量与出行偏好向量的关系确定,时空预测向量由最后一个访问点对应的隐藏状态得到。
37.优选地,根据初始预测结果进行损失处理得到损失结果,包括:
38.获取初始预测结果的真实位置的独热向量;
39.根据独热向量与下一个访问网格的概率分布得到对应的损失结果。
40.优选地,还包括:
41.对预测结果进行损失处理得到最终损失结果;
42.获取最终损失结果对应的预测层全局参数以便下一个待预测轨迹数据的追踪与预测。
43.为解决上述技术问题,本发明还提供一种轨迹数据的追踪与预测装置,包括:
44.获取模块,用于获取当前用户的待预测轨迹数据;
45.初始化模块,用于将待预测轨迹数据进行聚类初始化得到网络初始化参数;
46.第一输入模块,用于根据网络初始化参数对第一基模型进行参数更新,并将支持集内的轨迹数据输入至参数更新后的第一基模型以得到初始化结果,对初始化结果进行损失处理得到损失结果,其中,支持集内的轨迹数据由待预测轨迹数据与用户对应的历史轨迹数据的关系确定得到;
47.第二输入模块,用于根据损失结果对第二基模型进行参数更新,并将查询集内的预测轨迹数据输入至参数更新后的第二基模型以得到预测结果,其中查询集内的数据为待预测轨迹数据。
48.为解决上述技术问题,本发明还提供一种轨迹数据的追踪与预测装置,包括:
49.存储器,用于存储计算机程序;
50.处理器,用于执行计算机程序时实现如上述轨迹数据的追踪与预测方法的步骤。
51.为解决上述技术问题,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述轨迹数据的追踪与预测方法的步骤。
52.本发明提供的一种轨迹数据的追踪与预测方法,包括:获取当前用户的待预测轨迹数据;将待预测轨迹数据进行聚类初始化得到网络初始化参数;根据网络初始化参数对第一基模型进行参数更新,并将支持集内的轨迹数据输入至参数更新后的第一基模型以得到初始化结果,对初始化结果进行损失处理得到损失结果,其中,支持集内的轨迹数据由待预测轨迹数据与用户对应的历史轨迹数据的关系确定得到;根据损失结果对第二基模型进行参数更新,并将查询集内的预测轨迹数据输入至参数更新后的第二基模型以得到预测结果,其中查询集内的数据为待预测轨迹数据。该方法通过获取当前用户的待预测轨迹数据,当前用户可以是冷启动用户,其待预测轨迹数据可以是冷启动路径对应的轨迹数据,基于元学习的模型对待预测轨迹数据进行追踪与预测,由于元学习可以解决移动信令轨迹的少样本问题,解决了现有的模型进行追踪预测无法支持冷启动用户及冷启动路径的预测问题,同时提高轨迹追踪与预测的准确度。
53.另外,本发明还提供了一种轨迹数据的追踪与预测装置及介质,具有如上述轨迹数据的追踪与预测方法相同的有益效果。
附图说明
54.为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
55.图1为本发明实施例提供的一种轨迹数据的追踪与预测方法的流程图;
56.图2为本发明实施例提供的一种轨迹数据的追踪与预测方法的应用示意图;
57.图3为本发明实施例提供的一种基模型的应用示意图;
58.图4为本发明实施例提供的一种轨迹数据的追踪与预测装置的结构图;
59.图5为本发明实施例提供的另一种轨迹数据的追踪与预测装置的结构图。
具体实施方式
60.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
61.本发明的核心是提供一种轨迹数据的追踪与预测方法、装置及介质,解决了现有的模型进行追踪预测无法支持冷启动用户及冷启动路径的预测问题,同时提高轨迹追踪与预测的准确度。
62.为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
63.随着人们对畅通无阻、无处不在的高质量通信服务的需求提升,移动通信供应商需要有效及时地根据用户位置进行基站调度。在此背景下,准确地进行移动轨迹的追踪与预测,对于决定如何将用户数据在基站间调度至关重要。因此,本发明提供的移动轨迹的追踪与预测方法,以提供高质量的通信服务,确保在移动通信中高效的资源分配和管理。此外,在新型冠状病毒疫情下,疑似人员的及时排查和动态趋势判断也需要依靠移动轨迹的追踪与预测以避免帮助有关部门做到对疫情传播路径的“了如指掌”,实现细粒度、精准化的防疫抗疫。
64.图1为本发明实施例提供的一种轨迹数据的追踪与预测方法的流程图,如图1所示,该方法包括:
65.s11:获取当前用户的待预测轨迹数据;
66.具体地,用户的待预测轨迹数据通过该用户的历史轨迹数据中得到,这里的用户可以为冷启动用户,待预测轨迹数据可以是冷启动路径对应的轨迹数据,不做具体区分。
67.以a用户的轨迹数据t为例,这里的待预测轨迹数据是针对轨迹数据t的部分数据,轨迹数据t中的每个访问点为一个基站或者其他特殊点,例如分为l1、l2

lc。
68.s12:将待预测轨迹数据进行聚类初始化得到网络初始化参数;
69.基于聚类的网络初始化方法来为每条轨迹提供个性化的网络初始化参数,使共享的知识在具有相似旅行偏好的用户间迁移。该过程需要任务聚类以及聚类感知的参数记忆两个过程。
70.任务聚类是考虑到不同出行偏好之间的差异存在影响,共享的知识应该根据用户的出行偏好在相似用户之间转移。由于用户的历史轨迹不仅可以反映用户的轨迹的起点和终点信息,还可以反映用户的常见路径选择,因此可以利用从用户历史数据得到的空间分布来学习用户的出行偏好。我们采用基于聚类的方法,将具有相似出行偏好的用户分组到同一聚类中,以更好地在相似用户之间传递共享的知识。
71.聚类感知的参数记忆是为了捕捉和迁移聚类中潜在的用户偏好和移动模式,我们设计了一个聚类感知参数记忆m
p
∈rk×d×m来存储不同聚类的基模型中预测层的参数。参数
记忆在初始化步骤中提供个性化的网络参数以驱动知识在具有相似出行偏好的用户间迁移。
72.s13:根据网络初始化参数对第一基模型进行参数更新,并将支持集内的轨迹数据输入至参数更新后的第一基模型以得到初始化结果,对初始化结果进行损失处理得到损失结果;
73.其中,支持集内的轨迹数据由待预测轨迹数据与用户对应的历史轨迹数据的关系确定得到;
74.真正有效的轨迹采样方法以生成有意义的支持集,使其结合用户和轨迹相关知识对初始网络进行个性化微调。为了进一步使初始网络适应当前的任务,需要使用由任务相关轨迹组成的支持集来局部更新模型。为了提供足够的个性化信息,根据待预测轨迹数据与用户的历史轨迹数据的关系确定的支持集,同时将用户相关知识和轨迹相关知识结合起来进行微调。
75.需要说明的是,支持集的生成的目的是提供与任务相关的信息对初始网络也就是第一基模型进行微调,实现个性化的模型自适应。由于轨迹追踪与预测中的个性化不仅面向用户,而且面向轨迹,因此支持集期望包含用户(当前用户和其他用户)和轨迹相关内容。
76.将步骤s13中的根据网络初始化参数对第一基模型进行参数更新,并将支持集内的轨迹数据输入至参数更新后的第一基模型以得到初始化结果。支持集内的轨迹数据包括当前用户的待预测轨迹数据和用户的历史轨迹数据,这里得到的初始化结果是针对支持集内的轨迹数据得到的,其中,用户的待预测轨迹数据的待预测轨迹子序列数据得到的初始化结果也包括在内。需要说明的是,在支持集内的待预测轨迹数据的待预测轨迹子序列数据是需要找到与t轨迹数据最接近的轨迹。
77.同时,根据步骤s12中得到的网络初始化化参数对第一基模型进行参数更新,继续根据支持集内每条轨迹通过参数更新后的第一基模型进行预测,得到的初始化结果,进而根据初始化结果得到损失结果,损失处理中的损失函数是真实未来位置的负对数似然值。
78.s14:根据损失结果对第二基模型进行参数更新,并将查询集内的预测轨迹数据输入至参数更新后的第二基模型以得到预测结果;
79.其中查询集内的数据为待预测轨迹数据。
80.考虑到生成的支持集同时包含当前用户以及其他用户的轨迹数据,且每条轨迹具有不同的空间分布,因此若权重相同可能会导致次优结果,故自适应地为支持集中的每条轨迹分配一个合理的权重,对于权重如何生成可以根据支持集内的轨迹之间的相关性,也可以根据当前用户和其他用户的偏好移动轨迹的相关性,或者两者均考虑生成的权重值,根据权重值对损失结果进行加权求和得到的网络参数,以用于第二基模型的参数更新,实现局部更新。
81.同时,将查询集内的用户t轨迹数据也就是待预测轨迹数据以及网络参数输入至第二基模型,可以得到当前用户的预测结果,也就是lc+1的轨迹数据以完成当前的预测内容。
82.本发明提供的一种轨迹数据的追踪与预测方法,包括:获取当前用户的待预测轨迹数据;将待预测轨迹数据进行聚类初始化得到网络初始化参数;根据网络初始化参数对第一基模型进行参数更新,并将支持集内的轨迹数据输入至参数更新后的第一基模型以得
到初始化结果,对初始化结果进行损失处理得到损失结果,其中,支持集内的轨迹数据由待预测轨迹数据与用户对应的历史轨迹数据的关系确定得到;根据损失结果对第二基模型进行参数更新,并将查询集内的预测轨迹数据输入至参数更新后的第二基模型以得到预测结果,其中查询集内的数据为待预测轨迹数据。该方法通过获取当前用户的待预测轨迹数据,当前用户可以是冷启动用户,其待预测轨迹数据可以是冷启动路径对应的轨迹数据,基于元学习的模型对待预测轨迹数据进行追踪与预测,由于元学习可以解决移动信令轨迹的少样本问题,解决了现有的模型进行追踪预测无法支持冷启动用户及冷启动路径的预测问题,同时提高轨迹追踪与预测的准确度。
83.在上述实施例的基础上,步骤s12中的将待预测轨迹数据进行聚类初始化得到网络初始化参数,包括:
84.获取当前用户的历史轨迹数据;
85.通过加权策略将历史轨迹数据构建当前用户的空间分布;
86.通过全连接层将空间分布转换得到当前用户的出行偏好向量;
87.通过全连接层对出行偏好向量进行线性映射得到查询向量;
88.根据查询向量与多个聚类参数进行余弦相似度得到对应的相似度分数,并组合成相似度矩阵;
89.获取原始参数记忆向量和上一个待预测轨迹数据对应的网络参数与预测层全局参数,其中,首个参数记忆向量为原始参数记忆向量,网络参数由上一个待预测轨迹数据对应的损失结果得到,预测层全局参数由上一个待预测轨迹数据对应的第二基模型得到的损失结果,并根据第二基模型得到的损失结果进行处理得到的参数;
90.根据网络参数与原始参数记忆向量的关系确定当前参数记忆向量;
91.根据当前参数记忆向量与相似度矩阵的关系确定网络参数偏置;
92.根据预测层全局参数与网络参数偏置的关系得到网络初始化参数。
93.具体地,获取当前用户的历史轨迹数据,图2为本发明实施例提供的一种轨迹数据的追踪与预测方法的应用示意图,如图2所示,通过加权策略将历史轨迹数据构建当前用户的空间分布,由于每个用户都有其熟悉的区域和路径选择,因此用户的出行偏好对于移动轨迹的追踪与预测具有重要意义。而个人历史数据不仅可以表明其路径的起始和终点信息和频繁访问的区域,还可以表明他常见的移动路径,因此,通过构建用户历史轨迹的空间分布来学习其出行偏好。用户u的空间分布被定义为su=(w(g1),w(g2),

,w(gm)),其中m表示网格的总数,w(gj)表示网格gj的权重。为了表示每个网格的访问频率及其对用户的独特重要性,采用tf-idf加权策略来构建用户的空间分布,其公式如下:
[0094][0095]
w(gj)=tf(gj)
×
idf(gj)
[0096]
其中,tf(gj)为gj网格在用户历史轨迹中的频率,表示gj出现在中的次数,是所有网格在中出现的次数总和;idf(gj)为gj对于用户u的区分能力,是用户总数,是历史轨迹包含gj的用户数量。
[0097]
为了从用户u的空间分布su中学习用户出行偏好,使用激活函数连接的两个全连接层将su转换为一个低维表示当前用户的出行偏好向量
[0098]
为了实现为每条历史轨迹数据对其用户进行的集群分配,根据得到的出行偏好向量pu,通过全连接层对其进行线性映射得到查询向量q
t
,其公式如下:
[0099]qt
=wq·
pu+bq其中,wq为权重,bq为预设参数;
[0100]
根据查询向量和每个学习到的聚类中心的聚类参数进行余弦相似度得到对应的相似度分数其公式如下:
[0101][0102]
其中,《q
t
,ck》为查询向量q
t
与聚类中心ck之间的余弦相似度,k为聚类数。需要说明的是,所有集群的中心在训练前都是随机初始化,且在训练期间不断更新。根据得到的相似度分数,组合成相似度矩阵s
t
∈rk,是由查询向量q
t
与不同聚类中心之间的相似度得分组成的相似度矩阵。
[0103]
当前的聚类感知参数记忆用于存储不同聚类的基模型中的预测层的参数,故获取上一个待预测轨迹数据对应的网络参数预测层全局参数φ
pre
以及当前的原始参数记忆向量m
p
,其中,预测层全局参数由上一个待预测轨迹数据对应的第二基模型得到的损失结果,并根据第二模型得到的损失结果进行处理得到的参数。
[0104]
根据网络参数与原始参数记忆向量的关系确定当前参数记忆向量以进行更新,其公式如下:
[0105][0106]
其中,为张量积,γ为m
p
的更新率,为在支持集上学习后的预测层的参数。
[0107]
根据当前参数记忆向量m
p
与相似度矩阵s
t
∈rk的关系确定网络参数偏置b
t
,其公式如下:
[0108]bt
=(s
t
)
t
·mp
[0109]
其中,b
t
∈rd×m中的d为预测层的输入向量维度,m为所有网格的总数。
[0110]
将网络参数偏置视为个性化偏差项,轨迹可以在广义知识的基础上学习每个聚类中的共享知识,基于网络参数偏置得到预测层的个性化初始参数,也就是网络初始化参数,根据预测层全局参数φ
pre
与网络参数偏置b
t
的关系得到网络初始化参数θ
pre
,其公式如下:
[0111]
θ
pre
=φ
pre-τb
t
其中,φ
pre
是预测层的全局参数,τ用于控制初始化参数θ
pre
时考虑多少b
t
的个性化更新率。
[0112]
综上,聚类感知的参数记忆有两个结构,一个是检索记忆的读头,一个是更新记忆的写头,对于读头是根据轨迹与每个聚类的相似度得分通过读头从记忆中检索网络参数b
t
;写头是将在训练过程中更新聚类感知的参数记忆向量。
[0113]
本发明实施例提供的为每个任务提供个性化的网络初始化参数,相较于传统的云学习为所有任务学习一个全局共享的初始网络,由于不同的用户可能有不同的出行偏好和移动模式,可以通过历史轨迹数据中不同的轨迹起始和终点信息以及路径选择中反映出。
避免忽略个人的出行偏好,混合不相关的移动模式,产生的次优结果,使得共享的知识在具有相似出行偏好的用户间迁移,提供个性化的网络初始化参数。
[0114]
在上述实施例的基础上,步骤s13中的支持集内的轨迹数据由待预测轨迹数据与当前用户的历史轨迹数据的关系确定得到,包括:
[0115]
获取除当前用户之外的其他用户的历史轨迹数据;
[0116]
通过轨迹相似度策略在当前用户的历史轨迹数据中确定与待预测轨迹数据相似的第一目标轨迹数据;
[0117]
通过出行偏好相关策略在其他用户的历史轨迹数据中确定与待预测轨迹数据相关的第二目标轨迹数据;
[0118]
将第一目标轨迹数据、第二目标轨迹数据与待预测轨迹数据的待预测轨迹子序列数据存储至支持集以作为支持集内的轨迹数据。
[0119]
具体地,考虑到支持集中的轨迹来自不同的用户,且具有不同的空间分布,设计了一个权重生成器,为不同的轨迹分配不同的权重,以实现有效的模型自适应。
[0120]
为了结合用户相关知识,用户自身数据应被用于学习用户的出行偏好。首先,查询待预测轨迹数据的待预测轨迹子序列t
1,c-1
通常遵循与查询用户的出行偏好,且与查询轨迹具有相同的序列模式,因此应包含在支持集中。此外,用户的历史数据可以反映其熟悉的区域和常见的路径选择,从而表明个人出行偏好。然而,支持集应该足够小以避免过高的计算成本,因此支持集只需要包含一部分最相关的个人数据。
[0121]
依据轨迹相似度和偏好接近程度两个方面生成支持集。轨迹相似度,由于相关的轨迹通常与t
1,c-1
具有高度相似的子序列,从该用户的历史轨迹中选择m1条最相似的轨迹进行微调,也就是第一目标轨迹数据,其中相似性根据与t
1,c-1
的最长公共子序列(lcss)来计算,公式如下:
[0122][0123][0124]
其中,是的由前t个访问网格组成的轨迹子序列,是的第t个访问网格,是和t
1,c
的最长共同子序列的长度。
[0125]
由于支持集也需包含与轨迹相关的知识,所以应该进一步利用更多相关的轨迹来学习查询轨迹的序列模式。由于具有高空间相似性的轨迹往往具有相似的移动规律,因此应使用最相似的轨迹来提供与轨迹相关的知识。然而,具有不同用户偏好的轨迹可能会有完全不同的后续移动,即使在空间上是相似的。因此,不仅考虑轨迹的空间相似性,还考虑用户偏好的接近程度来衡量轨迹的相关性。
[0126]
在其他用户的历史轨迹中选择m2条最相关的轨迹也就是第二目标轨迹数据进行微调,其出行偏好相关性度的公式如下:
[0127][0128]
其中,是通过最长公共子序列计算得到的相似度,是用户偏好的余弦相似度。
[0129]
将第一目标轨迹数据、第二目标轨迹数据与待预测轨迹数据的待预测轨迹子序列数据存储至支持集以作为支持集内的轨迹数据,表示如下:
[0130]
其中,t
1,c-1
为待预测轨迹数据的待预测轨迹子序列数据,为第一目标轨迹数据,即用户的相关历史数据,为第二目标轨迹数据,为空间上相似的轨迹数据。
[0131]
本实施例提供的支持集的数据生成,在提供与任务相关的信息来微调初始网络,以实现个性化的模型自适应。除了个人数据外,支持集还应该包含空间上相似的轨迹,以包括轨迹相关信息用于模型自适应,这使得在用户位于不熟悉区域的情况下也能够进行更准确的预测。
[0132]
在上述实施例的基础上,现有的支持集中的所有样本采用相同的权重来对初始网络进行微调,这是基于所有样本对模型适应于当前任务同等重要的假设。然而,实际上,支持集中的轨迹来自于不同旅行偏好的用户,且具有不同的空间分布,它们对模型自适应会产生不同程度的重要性,因此,不同的轨迹应该有不同的权重。然而,现有方法忽略了支持集内轨迹的差异性以及对模型微调不同的重要性。损失结果对应的网络参数的确定过程包括以下步骤:
[0133]
将支持集内的轨迹数据输入至第一基模型得到对应的时空预测向量;
[0134]
将多个时空预测向量与出行偏好向量的关系确定对应的连接向量;
[0135]
通过余弦相似度确定多个连接向量之间的相关性,并通过全连接层确定对应的权重值;
[0136]
根据支持集内的轨迹数据对应的损失结果与权重值的关系确定损失结果对应的网络参数。
[0137]
具体地,考虑到生成的支持集同时包含个人的和其他用户的知识,且每条轨迹具有不同的空间分布,因此它们的权重相同可能会导致次优结果。因此,需要设计一个权重生成器,自适应地为支持集中的每条轨迹分配一个合理的权重,以实现有效的模型自适应。为了合理地为不同的轨迹分配权重,应该充分考虑轨迹之间的相关性。直观地看,空间高度相似的轨迹能更准确地反映查询轨迹的序列模式,因此它们期望获得较高的权重。
[0138]
同样,具有相似用户偏好的移动轨迹也应得到较高的权重。因此,权重的分配应同时考虑轨迹的空间相似性和用户偏好间的接近程度。通过stlstm学习到的时空预测向量表示与用户的出行偏好向量表示连接以同时考虑这两个因素,即连接向量然后,通过计算其余弦相似度来测量轨迹之间的相关性,并使用一个全连通层来获得权重,其公式如下:
[0139]
[0140]
其中,表示生成的支持集中的第j条轨迹,t为单例查询集中的查询轨迹,是和z
t
之间的余弦相似度。
[0141]
根据支持集内的轨迹数据对应的损失结果与权重值的关系确定损失结果对应的网络参数,通过加权和的方式得到网络参数。
[0142]
具体地,在传统神经网络中,参数被随机初始化,并在大量训练数据下收敛到良好的局部最优。类似地,局部更新旨在微调初始网络,以通过一个有意义的支持集来适应每个任务。首先,局部网络参数θ
*
由全局共享的初始参数φ
*
推导出,即:θ
*

φ
*
。特别地,按照聚类感知的参数记忆部分对基模型的预测层的参数θ
pre
进行个性化初始化以在每个聚类中迁移共享的知识。然后,通过最小化生成的支持集中每条轨迹的预测损失用生成的权值加权地更新局部网络,其公式如下:
[0143][0144]
其中,β为局部更新的学习率,表示为生成的支持集中的轨迹生成的权重。
[0145]
本发明实施例提供的通过设定权重生成器实现自适应支持集中的每条轨迹分配一个合理的权重,避免导致次优结果,进而得到一个待更新的网络参数。
[0146]
在上述实施例的基础上,基模型基于已经行进的部分轨迹进行轨迹的追踪与预测,其包括轨迹建模、用户出行偏好的建模和最后的轨迹追踪与预测三个内容,本发明中提到的第一基模型和第二基模型的结构相同,以第一模型的建立包括以下步骤:
[0147]
将待预测轨迹数据对应的地理区域划分为多个访问网格,并根据待预测轨迹中访问点的位置转换为由多个访问网格组成的轨迹数据;
[0148]
将多个访问网格的轨迹数据转换为对应的密集向量;
[0149]
获取相邻两个访问网格之间的时间间隔与真实地理距离;
[0150]
将密集向量、时间间隔和真实地理距离输入至时空预测学习模型以输出各访问点对应的隐藏状态;
[0151]
通过fcn全连接网络将连接向量转换为下一个访问网格的概率分布,并获取最大的概率分布作为第一基模型对应的初始化结果,其中连接向量由时空预测向量与出行偏好向量的关系确定,时空预测向量由最后一个访问点对应的隐藏状态得到。
[0152]
具体地,图3为本发明实施例提供的一种基模型的应用示意图,如图3所示,给定用户u的一条轨迹t的行驶部分轨迹t
1,c
={l1,l2,

,lc},也就是将待预测轨迹数据对应的地理区域划分为多个访问网格,根据待预测轨迹中访问点c的位置转换为由多个访问网格组成的轨迹数据。进一步将多个访问网格的轨迹数据转换为对应的密集向量,也就是应用查找层将序列中的每个访问网格lj的独热向量转换为密集的向量表示从而可以将行驶部分轨迹t
1,c
表示为{e1,e2,

,ec}。
[0153]
然后,获取相邻两个访问网格之间的时间间隔与真实地理距离,进一步将密集向量、时间间隔和真实地理距离输入至时空预测学习模型以输出各访问点对应的隐藏状态。因此利用时空长短期记忆模型(spatial-temporal long-short term memory,stlstm),对
行驶轨迹的序列信息进行建模,其公式如下:
[0154]hj
=stlstm(h
j-1
,ej,s
j-1
,q
j-1
),j=1,
…c[0155]
其中,h0、s0和q0为0,表示stlstm在第j步的隐藏状态,d1为隐藏状态向量的维数;s
j-1
和q
j-1
分别表示连续访问点l
j-1
和lj之间的时间间隔和真实地理距离。
[0156]
在轨迹追踪与预测中结合了轨迹序列信息和用户出行偏好来完成追踪与预测任务。通过fcn全连接网络将连接向量转换为下一个访问网格的概率分布,其公式如下:
[0157][0158][0159]
其中,p
t
表示网格的概率分布,fcn是由两个全连接层组成的全连接网络,是由参数θ
pre
构成的预测层(即全连接层),它将由fcn得到的向量映射到概率分布,是最大的概率分布。
[0160]
需要说明的是,获取最大的概率分布作为第一基模型对应的初始化结果,其中,本实例中的连接向量是由时空预测向量与出现偏好向量的关系确定,在上述实施例中已经详细赘述,在此不展开说明。其时空预测向量是根据最后一个访问点对应的隐藏状态得到。
[0161]
本发明实施例提供的基模型,针对少样本学习,通过学习所有任务的广义初始网络,然后利用新任务的少量实例对网络进行微调,可以实现对新任务的快速适应。
[0162]
在上述实施例的基础上,步骤s13中的根据初始化结果进行损失处理得到损失结果,包括:
[0163]
获取初始预测结果的真实位置的独热向量;
[0164]
根据独热向量与下一个访问网格的概率分布得到对应的损失结果。
[0165]
具体地,使用交叉熵作为损失函数,是一个经常与softmax分类器对应的多类对数损失函数,其具体公式如下:
[0166][0167]
其中,y
t
∈rm是真实位置的独热表示,m是目标网格的数量。
[0168]
本发明实施例提供的得到的损失结果,便于后续的基模型参数的更新。
[0169]
在具体实施例中,使用多个任务的查询集全局更新网络,以学习一个全局共享的初始网络。故该方法还包括:
[0170]
对预测结果进行损失处理得到最终损失结果;
[0171]
获取最终损失结果对应的预测层全局参数以便下一个待预测轨迹数据的追踪与预测。
[0172]
具体地,根据每条训练轨迹的查询集上的损失之和,采用一步梯度下降更新全局参数φ
*
,其公式如下。
[0173][0174]
其中,λ为全局更新的学习率,为训练集,为轨迹t的查询集的预测损失。本地更新和全局更新都是通过反向传播来计算的。
[0175]
本发明实施例提供的全局更新模型的参数用于后续的任务的参数更新,提高该模型的追踪与预测的准确率。
[0176]
上述详细描述了轨迹数据的追踪与预测方法对应的各个实施例,在此基础上,本发明还公开与上述方法对应的轨迹数据的追踪与预测装置,图4为本发明实施例提供的一种轨迹数据的追踪与预测装置的结构图。如图4所示,轨迹数据的追踪与预测装置包括:
[0177]
获取模块11,用于获取当前用户的待预测轨迹数据;
[0178]
初始化模块12,用于将待预测轨迹数据进行聚类初始化得到网络初始化参数;
[0179]
第一输入模块13,用于根据网络初始化参数对第一基模型进行参数更新,并将支持集内的轨迹数据输入至参数更新后的第一基模型以得到初始化结果,对初始化结果进行损失处理得到损失结果,其中,支持集内的轨迹数据由待预测轨迹数据与用户对应的历史轨迹数据的关系确定得到;
[0180]
第二输入模块14,用于根据损失结果对第二基模型进行参数更新,并将查询集内的预测轨迹数据输入至参数更新后的第二基模型以得到预测结果,其中查询集内的数据为待预测轨迹数据。
[0181]
由于装置部分的实施例与上述的实施例相互对应,因此装置部分的实施例请参照上述方法部分的实施例描述,在此不再赘述。
[0182]
对于本发明提供的一种轨迹数据的追踪与预测装置的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述轨迹数据的追踪与预测方法相同的有益效果。
[0183]
图5为本发明实施例提供的另一种轨迹数据的追踪与预测装置的结构图,如图5所示,该装置包括:
[0184]
存储器21,用于存储计算机程序;
[0185]
处理器22,用于执行计算机程序时实现轨迹数据的追踪与预测方法的步骤。
[0186]
本实施例提供的轨迹数据的追踪与预测装置可以包括但不限于平板电脑、笔记本电脑或者台式电脑等。
[0187]
其中,处理器22可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器22可以采用数字信号处理器(digital signal processor,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器22也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(central processing unit,cpu);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器22可以集成有图像处理器(graphics processing unit,gpu),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器22还可以包括人工智能(artificial intelligence,ai)处理器,该ai处理器用于处理有关机器学习的计算操作。
[0188]
存储器21可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器21还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器21至少用于存储以下计算机程序211,其中,该计算机程序被处理器22加载并执行之后,能够实现前述任一实施例公开的轨迹数据的追踪与预测方法的相关步骤。另外,存储器21所存储的资源还可以包括操作系统212和
数据213等,存储方式可以是短暂存储或者永久存储。其中,操作系统212可以包括windows、unix、linux等。数据213可以包括但不限于轨迹数据的追踪与预测方法所涉及到的数据等等。
[0189]
在一些实施例中,轨迹数据的追踪与预测装置还可包括有显示屏23、输入输出接口24、通信接口25、电源26以及通信总线27。
[0190]
领域技术人员可以理解,图5中示出的结构并不构成对轨迹数据的追踪与预测装置的限定,可以包括比图示更多或更少的组件。
[0191]
处理器22通过调用存储于存储器21中的指令以实现上述任一实施例所提供的轨迹数据的追踪与预测方法。
[0192]
对于本发明提供的一种轨迹数据的追踪与预测装置的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述轨迹数据的追踪与预测方法相同的有益效果。
[0193]
进一步的,本发明还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器22执行时实现如上述轨迹数据的追踪与预测方法的步骤。
[0194]
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(randomaccess memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0195]
对于本发明提供的一种计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述轨迹数据的追踪与预测方法相同的有益效果。
[0196]
作为一种具体实施例,基于pytorch框架对提出的模型进行实现,并使用adam优化器进行训练。对于真实世界的轨迹数据集,所有的轨迹被随机分为70%用于训练,10%用于验证,其余的20%用于测试。根据以下参数设置来训练网络:网格的嵌入向量大小d1为100,用户偏好的向量维数d2为10,预测层的输入向量维数d为64。局部更新和全局更新的初始学习率β和λ分别为0.01和0.0001。个性化更新率τ为0.05,参数记忆的更新率γ为0.01。
[0197]
为了评估其方法的有效性,基模型ptp与最先进的轨迹追踪与预测模型(desppd、flashback、deepmove、stlstm、hst-lstm)进行了比较。选取的该方法采用的metaptp模型与处理冷启动问题的方法进行了比较,即基于迁移学习的模型ptp-ft和基于元学习的模型maml。对ptp-ft、maml和metaptp采用相同的基模型ptp。此外,进一步将该模型与其几个变体进行了比较以评估metaptp中每个模块的有效性,包括metaptp-i去掉了基于软聚类的初始化方法并对所有任务采用相同的初始网络,metaptp-us只使用查询轨迹子序列作为微调的支持集,metaptp-u只使用查询轨迹子序列和空间上相似的轨迹作为微调的支持集,metaptp-s只使用查询轨迹子序列和用户的历史数据作为进行微调的支持集,metaptp-w去除了自适应权重生成器并对支持集中的所有轨迹使用相同的权值。具体的实验结果如表1所示:
[0198]
表1:实验结果对比
[0199][0200]
从上表中可以看出,基模型ptp比所有现有的轨迹追踪与预测的方法性能更好。其中,除层次扩展模型hst-lstm外,stlstm是现有方法中最好的方法。这是因为stlstm采用了一种很好的方法来融合时空信息和序列信息。因此,继续采用stlstm来进行轨迹建模。ptp进一步根据用户的空间分布建模用户偏好,从而改进了所有指标。
[0201]
基模型ptp是轨迹追踪与预测最有效的元学习基模型。此外,基于迁移学习的模型(ptp-ft)和基于元学习的模型的表现(maml和metaptp)都优于基模型,说明迁移学习和元学习都能在一定程度上缓解冷启动问题。然而,ptp-ft的性能不如maml,这证明了元学习在轨迹预测的少样本问题中比迁移学习表现更好,因为它能够捕获不同轨迹之间的泛化知识。最后,metaptp进一步提高了maml的性能,证明了该模型的优越性。这可以解释为,metaptp不仅可以通过软聚类方法提供个性化的网络初始化,而且还可以通过有意义的支持集和权重生成器来支持有效的模型自适应。
[0202]
通过与模型变体的实验比较,可以看出metaptp-i的性能比metaptp更差,因为一个全局共享网络直接用于初始化所有任务的模型,这证明了基于软聚类的方法有助于为每条轨迹获得合适的初始网络,并在具有相似旅行偏好的用户之间传递共享的知识。metaptp-us的性能比metaptp更差,这证实了生成的支持集对于个性化适应是有用的。此外,metaptp-s和metaptp-u的表现都优于metaptp-us,这进一步证明了用户自己的数据和空间上相似的轨迹可以为发现用户的旅行偏好和轨迹的序列模式提供有意义的用户和轨迹相关的知识。对于权重生成器,metaptp-w的表现不如metaptp,这表明支持集中的轨迹期望获得合理的权重,从而有效地使初始网络适应于每个任务。最后,metaptp成功地获得了超过所有变体的最佳性能。
[0203]
基于软聚类的网络初始化方法对于获得每个任务的个性化初始化网络是必要的。此外,生成的支持集通过结合用户和轨迹相关知识进行模型微调也具有重要意义,权重生成器则通过为支持集中的每条轨迹分配合理的权重有助于有效的模型自适应。
[0204]
以上对本发明所提供的一种轨迹数据的追踪与预测方法、装置及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
[0205]
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将
一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1