本技术实施例涉及数据挖掘,尤其涉及一种获取轨迹相似的移动对象的方法、装置、设备及存储介质。
背景技术:
1、近年来,随着rfid和gps等无线通信技术的不断发展和广泛应用,全球范围内的各种移动对象都可以得到有效的定位和跟踪,由此产生了海量的移动对象轨迹数据,而这些数据中蕴含着丰富的信息。移动对象的时空轨迹是记录移动对象位置、属性和时间的序列。时间、空间和属性是地理现象的三个基本特征,也是gis数据库的三种基本组成数据。
2、目前大部分应用只对移动对象的原始轨迹进行了简单的利用,并没有进行更加深入的分析。移动对象轨迹相似度度量在轨迹挖掘领域和基于位置的服务等领域具有广阔的应用前景。此外,移动对象轨迹相似度度量还可以用于公共安全、交通调度、城市规划、推荐系统、广告系统、隐私保护以及异常检测等领域中。
3、目前对于移动对象的轨迹相似度计算大多集中于时间相似度方面,计算得到的轨迹相似度维度单一,导致精确度较低。
技术实现思路
1、本技术实施例提供一种获取轨迹相似的移动对象的方法、装置、设备及存储介质,能够解决轨迹相似度计算精确度低的问题,提升轨迹相似度计算精确度,提高获取轨迹相似的移动对象的准确性。
2、在第一方面,本技术实施例提供了一种获取轨迹相似的移动对象的方法,包括:
3、获取满足时空相似度要求的第一类移动对象;
4、根据预设相似度公式和第一目标移动对象的轨迹,对所述第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值;
5、根据所述轨迹相似度值筛选出满足预设要求的第二目标移动对象,所述第二目标移动对象与第一目标移动对象的轨迹相似。
6、进一步的,所述获取满足时空相似度要求的第一类移动对象,包括:
7、获取所述第一目标移动对象经过的目标卡口和对应过卡时间;
8、筛选出满足时空相似度要求的第一类移动对象,所述时空相似度要求包括移动对象经过目标卡口的过卡时间和所述第一目标移动对象经过目标卡口的过卡时间的偏差不超过第一阈值。
9、进一步的,所述获取满足时空相似度要求的第一类移动对象之后,包括:
10、获取所述第一目标移动对象经过的所有卡口的序列,得到目标卡口序列;
11、获取所述第一类移动对象经过的所有卡口的序列,得到待比对卡口序列;
12、将所述待比对卡口序列和所述目标卡口序列进行比较处理,得到最长公共子序列。
13、进一步的,所述根据预设相似度公式和第一目标移动对象的轨迹,对所述第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值,包括:
14、根据所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过卡口的时间差值以及所述最长公共子序列进行计算处理,得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值;
15、根据所述两条轨迹经过所有相同卡口的时间差的绝对值的期望值、所述最长公共子序列、所述第一目标移动对象轨迹中经过的卡口数量、放大因子和时间偏差容忍度进行计算处理,得到所述第一类移动对象中每一移动对象的轨迹相似度值。
16、进一步的,所述根据所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过卡口的时间差值以及所述最长公共子序列进行计算处理,得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值,包括:
17、根据公式计算得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值,其中e(δt)代表两条轨迹经过所有相同卡口的时间差的绝对值的期望值,p代表最长公共子序列,δti代表所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过对应卡口的时间差值。
18、进一步的,所述根据所述两条轨迹经过所有相同卡口的时间差的绝对值的期望值、所述最长公共子序列、所述第一目标移动对象轨迹中经过的卡口数量、放大因子和时间偏差容忍度进行计算处理,得到所述第一类移动对象中每一移动对象的轨迹相似度值,包括:
19、根据公式
20、
21、计算得到所述第一类移动对象中每一移动对象的轨迹相似度值,其中sim代表每一移动对象的轨迹相似度值,e(δt)代表两条轨迹经过所有相同卡口的时间差的绝对值的期望值,p代表最长公共子序列,p0代表第一目标移动对象轨迹中经过的卡口数量,mf代表放大因子,tt代表时间偏差容忍度。
22、进一步的,所述根据所述轨迹相似度值筛选出满足预设要求的第二目标移动对象,包括:
23、根据所述轨迹相似度值,筛选出轨迹相似度值最高的移动对象为所述第二目标移动对象;
24、或,根据所述轨迹相似度值,筛选出轨迹相似度值超过第二阈值的移动对象为所述第二目标移动对象。
25、在第二方面,本技术实施例提供了一种获取轨迹相似的移动对象的装置,包括:
26、第一类移动对象确定单元,用于获取满足时空相似度要求的第一类移动对象;
27、轨迹相似度计算单元,用于根据预设相似度公式和第一目标移动对象的轨迹,对所述第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值;
28、第二目标移动对象获取单元,用于根据所述轨迹相似度值筛选出满足预设要求的第二目标移动对象,所述第二目标移动对象与第一目标移动对象的轨迹相似。
29、进一步的,所述第一类移动对象确定单元,还用于获取所述第一目标移动对象经过的目标卡口和对应过卡时间;
30、筛选出满足时空相似度要求的第一类移动对象,所述时空相似度要求包括移动对象经过目标卡口的过卡时间和所述第一目标移动对象经过目标卡口的过卡时间的偏差不超过第一阈值。
31、进一步的,所述轨迹相似度计算单元,还用于获取所述第一目标移动对象经过的所有卡口的序列,得到目标卡口序列;
32、获取所述第一类移动对象经过的所有卡口的序列,得到待比对卡口序列;
33、将所述待比对卡口序列和所述目标卡口序列进行比较处理,得到最长公共子序列。
34、进一步的,所述轨迹相似度计算单元,还用于根据所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过卡口的时间差值以及所述最长公共子序列进行计算处理,得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值;
35、根据所述两条轨迹经过所有相同卡口的时间差的绝对值的期望值、所述最长公共子序列、所述第一目标移动对象轨迹中经过的卡口数量、放大因子和时间偏差容忍度进行计算处理,得到所述第一类移动对象中每一移动对象的轨迹相似度值。
36、进一步的,所述轨迹相似度计算单元,还用于根据公式
37、
38、计算得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值,其中e(δt)代表两条轨迹经过所有相同卡口的时间差的绝对值的期望值,p代表最长公共子序列,δti代表所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过对应卡口的时间差值。
39、进一步的,所述轨迹相似度计算单元,还用于根据公式
40、
41、计算得到所述第一类移动对象中每一移动对象的轨迹相似度值,其中sim代表每一移动对象的轨迹相似度值,e(δt)代表两条轨迹经过所有相同卡口的时间差的绝对值的期望值,p代表最长公共子序列,p0代表第一目标移动对象轨迹中经过的卡口数量,mf代表放大因子,tt代表时间偏差容忍度。
42、进一步的,所述第二目标移动对象获取单元,用于根据所述轨迹相似度值,筛选出轨迹相似度值最高的移动对象为所述第二目标移动对象;
43、或,根据所述轨迹相似度值,筛选出轨迹相似度值超过第二阈值的移动对象为所述第二目标移动对象。
44、在第三方面,本技术实施例提供了一种获取轨迹相似的移动对象的设备,包括:
45、存储器以及一个或多个处理器;
46、所述存储器,用于存储一个或多个程序;
47、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的获取轨迹相似的移动对象的方法。
48、在第四方面,本技术实施例提供了一种存储计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的获取轨迹相似的移动对象的方法。
49、本技术实施例通过获取满足时空相似度要求的第一类移动对象,根据预设相似度公式和第一目标移动对象的轨迹,对第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值,根据轨迹相似度值筛选出满足预设要求的第二目标移动对象,第二目标移动对象与第一目标移动对象的轨迹相似。采用上述技术手段,可以通过满足时空相似度要求后再通过预设相似度公式进行轨迹相似度值的计算,以此可避免轨迹相似度计算精确度低的问题,提升轨迹相似度计算精确度。此外,通过计算得到的轨迹相似度值筛选出满足预设要求的与第一目标移动对象轨迹相似的第二目标移动对象,可以在轨迹相似度值的前提下进一步地筛选出轨迹相似的移动对象,提高获取轨迹相似的移动对象的准确性。