本发明涉及海上交通领域,更具体的说,是涉及一种新的船舶轨迹聚类方法。
背景技术:
船舶自动识别系统(automaticidentificationsystem,简称ais系统)由岸基(基站)设施和船载设备共同组成,是一种新型的集网络技术、现代通讯技术、计算机技术、电子信息显示技术为一体的数字助航系统和设备。ais被强制安装在船舶上,能够实时获取船舶mmsi、位置、航速、航向、船首向、船舶形状、吃水等信息,能够应用于数字化船舶安全监测工作中。
船舶轨迹聚类对于船舶行为挖掘以及船舶异常研究至关重要。船舶轨迹聚类的方法包括基于模型的方法、基于密度的方法、基于划分的方法、基于网格的聚类方法、基于分层的方法以及基于混合的方法。这些方法都是将船舶轨迹看做矢量值,对矢量进行聚类。
k-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。k-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量最优分类,使得评价指标最小。算法采用误差平方和准则函数作为聚类准则函数。算法过程如下:
1)从n个文档随机选取k个文档作为质心;
2)对剩余的每个文档测量其到每个质心的距离,并把它归到最近的质心的类;
3)重新计算已经得到的各个类的质心;
4)迭代2~3步直至新的质心与原质心相等或小于指定阈值,算法结束。
技术实现要素:
目前船舶轨迹聚类的方法都是将船舶轨迹作为矢量进行聚类本发明的目的是为了克服现有技术中的不足,提出一种新的船舶轨迹聚类方法,将船舶轨迹作为四维点进行聚类,利用该发明能够更有效提取船舶轨迹的一些特征,从而应用到船舶行为特征的研究中。
本发明的目的是通过以下技术方案实现的。
本发明的新的船舶轨迹聚类方法,包括以下步骤:
第一步,对ais数据进行预处理,将属性值明显错误的项删除(如属性值为空,经纬度不在研究范围内);
第二步,基于ais数据提取船舶轨迹;
第三步,将每条船舶轨迹的起始点的经纬度和终点的经纬度作为船舶轨迹的特征值,即每条船舶轨迹的表示方式为(longa,longb,lata,latb);其中,longa为起始点的经度,longb为终点的经度,lata为起始点的纬度,latb为终点的纬度;
第四步,利用k-means空间聚类法对船舶轨迹进行聚类;其中,两条船舶轨迹间的距离公式如下:
与现有技术相比,本发明的技术方案所带来的有益效果是:
目前船舶轨迹聚类的方法都是将船舶轨迹作为矢量进行聚类,而本发明提出一种将船舶轨迹作为四维点进行聚类的方法。该方法相较于传统的船舶轨迹聚类方法计算更简单,更能提取船舶轨迹中的某些重要的参数,能够应用于船舶行为挖掘研究中。
附图说明
图1是本发明新的船舶轨迹聚类方法的流程图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,下面结合附图对本发明进行进一步详细说明。应当理解为此处所描述的具体实施例仅仅用以解释本发明,并不用于限制本发明的保护范围。
本发明的新的船舶轨迹聚类方法,将船舶的轨迹以四维点来表示。如图1所示,具体实现过程如下:
第一步,对ais数据进行预处理,将属性值明显错误的项删除(如属性值为空,经纬度不在研究范围内等)。
第二步,基于ais数据提取船舶轨迹。对复杂轨迹进行轨迹划分,将子轨迹作为聚类对象。
第三步,将每条船舶轨迹的起始点的经纬度和终点的经纬度作为船舶轨迹的特征值,即每条船舶轨迹的表示方式为(longa,longb,lata,latb);其中,longa为起始点的经度,longb为终点的经度,lata为起始点的纬度,latb为终点的纬度。
第四步,利用k-means空间聚类法对船舶轨迹进行聚类。聚类的类别个数根据海域船舶交通情况确定。其中,两条船舶轨迹间的距离公式如下:
尽管上面结合附图对本发明的功能及工作过程进行了描述,但本发明并不局限于上述的具体功能和工作过程,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可以做出很多形式,这些均属于本发明的保护之内。