一种基于k-means的轨迹周期模式挖掘方法与流程

文档序号:28380573发布日期:2022-01-07 22:56阅读:165来源:国知局
一种基于k-means的轨迹周期模式挖掘方法与流程

1.本发明涉及一种基于k-means的轨迹周期模式挖掘方法,可以用于飞机、船舶等移动目标的轨迹处理的问题,特别适用于飞机、船舶等移动目标活动轨迹周期规律模式挖掘。


背景技术:

2.当前位置获取技术的进步产生了大量的飞机、船舶轨迹数据,这些数据蕴涵了非常丰富的信息。轨迹数据挖掘,指根据物体运行的历史轨迹,获取目标物体潜在的运动信息。通过计算飞机、船舶等移动目标的轨迹数据,有助于分析其活动情况,并预测目标未来活动去向。传统轨迹挖掘方法对于原始轨迹数据的属性有较高要求,或者需要专家手动添加标签等,且无法进行较为全面的挖掘,因此急需一种能够满足日益增长的轨迹需求的适应性轨迹挖掘方法。


技术实现要素:

3.本发明所要解决的技术问题在于避免上述背景技术中的不足之处,提供一种基于k-means的轨迹周期模式挖掘方法。本发明提出的方法能够弥补标签驱动的分类方法的不足,通过探寻数据之间地域关系来获取到其周期规律信息,更加符合轨迹的实际物理意义,通过周期匹配与新类生成等规则避开了人为指定聚类数k的问题,并且使轨迹周期规律更好地被挖掘与分析,作为无监督的聚类方法具有收敛速度快、聚类效果优、可解释性强等特点。
4.本发明所要解决的技术问题是由以下技术方案实现的:
5.一种基于k-means的轨迹周期模式挖掘方法,包含以下步骤:
6.(1)获取当前目标的全部轨迹数据,并进行预处理;所述预处理包括对离群点的去除以及将全部轨迹数据转变为具有统一的物理意义的点列;
7.(2)对当前目标的每一段轨迹数据进行基于物理质心的聚类与匹配,具体为:采用k-means算法,首先在不指定k值的基础上,通过计算当前待匹配轨迹的质心与已有类簇之间质心的距离,确定将当前待匹配轨迹加入到已有类簇,或者直接创建新类以表示一个新的目标地域活动轨迹类簇;并动态调整有轨迹更新的类簇的质心,直至全部轨迹聚类完成;
8.(3)针对所有目标地域活动轨迹类簇,首先判断类簇及其包含轨迹的数量,确定数据挖掘的有效性,并将有效的类簇中轨迹所存在的到访地域周期进行记录与输出。
9.其中,步骤(1)具体包括以下步骤:
10.(101)从原始数据中提取出目标的轨迹数据;
11.(102)对目标的轨迹数据中超出目标轨迹合法范围的数据进行清洗,所述目标轨迹合法范围根据目标数据集中目标所述位置范围的上下界进行确定;
12.(103)将目标的轨迹数据转变为具有统一的物理意义的点列;
13.(104)对目标的轨迹数据进行封装。
14.其中,步骤(2)具体包括以下步骤:
15.(201)对当前目标的全部轨迹进行质心计算,所述质心计算过程为:使用gps的经纬度计算公式将点列的经纬度信息转换为欧式距离,并且基于欧式距离将点列的质心进行计算求解;
16.(202)使用k-means算法对轨迹进行聚类,聚类标准为质心之间的距离,即计算当前待匹配轨迹与已有类簇之间的质心距离,当距离高于指定的阈值,则当前待匹配轨迹被聚为新的类簇,并且当前待匹配轨迹的质心即为新类簇的质心,当距离低于指定的阈值,则将当前待匹配轨迹添加到当前所匹配到的类簇之中,并且将当前所匹配类簇的质心进行更新,使得类簇的质心整体表征类簇中全部轨迹所代表的地域,直至全部轨迹聚类完成。
17.本发明相比背景技术具有如下优点:
18.1、本发明所用的算法计算效率高;
19.2、本发明具有易于实现与调试的特点;
20.3、本发明具有易于扩展、兼容性强、参数灵活调节的特点。
附图说明
21.图1为本发明实施例部分提供的一种基于k-means的轨迹周期模式挖掘方法的工作流程示意图;
22.图2为本发明在测试数据上的运行结果,菱形和正方形表示两个不同活动周期的区域中心。
具体实施方式
23.下面,结合附图和具体实施方式对本发明作进一步说明。
24.如图1所示,本实施例提供的一种基于k-means的轨迹周期规律挖掘方法,包括以下步骤:
25.(1)获取目标的全部轨迹数据,并对该目标的轨迹数据进行预处理,所述预处理步骤包括,对离群点的去除以及将轨迹数据转变为具有统一的物理意义的点列,然后对轨迹进行封装处理;具体为:
26.(101)从原始数据中提取出目标的轨迹数据;
27.(102)对目标的轨迹数据中超出目标轨迹合法范围的数据进行清洗,所述目标轨迹合法范围根据目标数据集中目标所述位置范围的上下界进行确定;
28.(103)将目标的轨迹数据转变为具有统一的物理意义的点列;
29.(104)对目标的轨迹数据进行封装。
30.(2)对当前目标的每一段轨迹数据进行基于物理质心的聚类与匹配,具体为:
31.(201)对目标的轨迹数据进行聚类初始化,所述的聚类初始化过程为:首先对目标中的全部轨迹进行质心计算,所述质心计算过程为:使用globalpositioningsystem(gps)的经纬度计算公式将原有点列的经纬度信息转换为欧式距离,并且基于欧式距离将点列的质心进行计算求解并且封装进步骤1中的轨迹封装数据结构中,而聚类的数量将会由模型在比对之后自行确定,从而无需去人为设置以减少误差,提高可用性与灵活性;
32.(202)使用k-means算法对轨迹进行聚类,聚类标准为质心之间的距离,即计算当前待匹配轨迹与已有类簇之间的质心距离,当距离高于指定的阈值,则当前待匹配轨迹被
聚为新的类簇,并且当前待匹配轨迹的质心即为新类簇的质心,当距离低于指定的阈值,则将当前待匹配轨迹添加到当前所匹配到的类簇之中,并且将当前所匹配类簇的质心进行更新,使得类簇的质心整体表征类簇中全部轨迹所代表的地域,直至全部轨迹聚类完成。利用基于物理距离的聚类方式进行轨迹规划,可以使得划分结果具备有很好的实际意义与可解释性,并且可以调节的阈值为该算法带来更多的灵活性以及使用用途。
33.(3)针对k均值聚类所产生的目标地域活动轨迹类簇,首先判断类簇及其包含轨迹的数量以确定数据挖掘的有效性,并将有效的类簇中轨迹所存在的到访地域周期进行记录与输出。
34.完成基于k-means的轨迹周期模式挖掘。
35.如图2所示,本实施例提供的一种基于k-means的轨迹周期规律挖掘方法的运行结果可以表述为:
36.(1)图2包含某一活动对象的两个活动轨迹簇及其活动区域中心。其中,虚线轨迹簇的质心为菱形坐标点;实线轨迹簇的质心为正方形坐标点。
37.(2)根据输出的计算结果,该图所包含改该对象活动的周期规律描述为:
38.(201)第一个活动区域中心是(124.402176,33.190666),即为图中的菱形点。在该区域上的活动规律是:星期四-》(间隔1天)-》星期五-》(间隔5天)-》星期三-》(间隔5天)-》星期一-》(间隔2天)-》星期三-》(间隔1天)-》星期四-》(间隔1天)-》星期五。具体解释为:该对象在此区域中心附近的活动具有周期规律,星期四在区域中心附近活动,间隔1天后的星期五有活动轨迹产生,间隔5天后的星期三有活动轨迹产生,间隔5天后的星期一有活动轨迹产生,间隔2天后的星期三有活动轨迹产生,间隔1天后的星期四有活动轨迹产生,间隔1天后的星期五有活动轨迹产生;
39.(202)第二个活动区域中心是(124.759136,27.426964),即为图中的正方形点。在该区域上的活动规律是:星期三-》(间隔7天)-》星期三-》(间隔3天)-》星期六-》(间隔3天)-》星期二-》(间隔10天)-》星期五。具体解释为:该对象在此区域中心附近的活动具有周期规律,星期三在区域中心附近活动,间隔7天后的星期三有活动轨迹产生,间隔3天后的星期六有活动轨迹产生,间隔3天后的星期二有活动轨迹产生,间隔10天后的星期五有活动轨迹产生。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1