本发明涉及计算机技术领域,具体涉及一种利用移动通信数据识别交通工具类别的方法。
背景技术
交通是一座城市乃至一个国家的命脉。得益于国民经济的增长以及科学技术的革新进步,人们的出行方式日渐丰富,“智能交通”的概念也应运而生。交通工具类别的识别,是“智能交通”中的一个重要课题,对于道路交通的部署和优化,有着深远的指导意义。目前主流的交通工具识别技术,主要有传感器技术和数字图像处理技术两大类。传感器技术即在道路上设置传感器以采集和记录交通工具的速度,重量,体积等信息,从而识别交通工具的类别,这类方法需要铺设大量的设备,前期建设与后期维护的成本较高,难以实现全面覆盖;数字图像处理技术,则利用监控摄像装置拍摄到的车辆的图像,提取其中的车辆标志,车辆形状等特征,对交通工具的类别作出判断,然而,这种方法对拍摄到的图像质量有较高的要求,若拍摄的画面分辨率较低,或是在雨雪雾天等恶劣天气条件下,识别的准确率会大幅下降。
专利cn104835320a公开了一种基于移动通信数据的交通流估算方法,其通过筛选出指定路段的基站地址序列,计算相邻蜂窝中用户数量差值绝对值的加权平均值,以估算某一时间段内的交通流量。但是,目前尚未有一种基于移动通信数据对用户所乘坐的交通工具类别进行判断的有效方法。
技术实现要素:
本发明的目的是为了解决现有技术中的上述缺陷,提供一种利用移动通信数据识别交通工具类别的方法,该方法基于移动设备与基站通信时产生的状态信息,通过移动设备在不同时间所处的基站位置的变化,形成一系列轨迹片段,对这些轨迹片段进行特征提取,利用提取出的特征识别出轨迹片段的交通工具类别。
本发明的目的可以通过采取如下技术方案达到:
一种利用移动通信数据识别交通工具类别的方法,包含以下步骤:
步骤s1、获取原始数据。从蜂窝式移动通信网络的通信数据中获取移动设备用户所在基站的状态信息数据,记作时空点四元组集合a=<userid,timestamp,longitude,latitude>,其中userid表示能够区分不同用户的信息字段(如移动设备id、网卡mac地址或手机号码),timestamp为时间戳,即该位置信息产生的时间点,longitude与latitude分别表示基站的经度和纬度,记用户总数为nu。
步骤s2、从用户的时空点序列中划分轨迹片段。利用步骤s1中获取的数据,得到各个移动用户所历经的时空点序列,通过计算用户在各个位置的停留时间长度,判断出用户每次移动的起点与终点。用户在某一时间段内,进行一次移动所产生的时空点序列,即为一条轨迹片段。如此可将一个用户的所有时空点序列,划分为一系列轨迹片段。
步骤s2的具体实施方法如下:
步骤s201、在步骤s1所提取到的时空四元组集合中,将相同userid的记录构成该用户的轨迹时空点序列,记作
ai,j=<useridi,timestampi,j,longitudei,j,latitudei,j>。
步骤s202、将每一用户的数据点按照timestamp升序排列,得到按时间变化的数据点序列,记为
步骤s203、剔除步骤s202每一用户的序列si中的异常点,将si更新为:
步骤s204、将经过步骤s203处理后的每一用户的全体时空序列点qi,分割成一系列轨迹片段。
步骤s205、将步骤s204得到的所有用户的轨迹片段进行汇总,记作
其中nti表示用户i的轨迹总数,
步骤s3、计算步骤s2中的不同用户轨迹片段之间的匹配关系,并构建匹配关系的拓扑结构图。
步骤s3的具体实施步骤如下:
步骤s301、对每一个满足
步骤s302、构建全体轨迹片段间,匹配关系的拓扑结构图。匹配关系的拓扑结构图记为g={v,e},v为顶点的集合,全体轨迹片段集合πall与图顶点集合v为一一对应关系,将轨迹片段
步骤s4、定义轨迹片段的各类属性特征以及基于这些判别交通工具类别的规则集,用于识别交通工具的类别。
其中,轨迹片段
额定行驶速度,即交通工具正常行驶时所能达到的速度,记为
额定行驶加速度,即交通工具正常行驶中加、减速时,所能达到的加速度,记为
位移,即轨迹片段起点到终点的直接距离,记为
标准速度与标准加速度,即交通工具所能达到的速度与加速度;
行驶路程,记为
聚集系数,即轨迹片段
频数,即该用户存在历经相似位置的轨迹片段数量,记为
步骤s5、按以下方法识别所有轨迹片段的交通工具类别:从交通工具类别未知的轨迹片段中,按一定规则寻找出一条匹配轨迹数较多的轨迹片段,运用步骤s4中的规则集识别该驾驶人轨迹片段的交通工具类别;之后利用步骤s3中构建的拓扑结构图,寻找出该轨迹片段匹配的所有轨迹片段,并将它们的交通工具类别标记为与该轨迹片段相同的类别;之后再从交通工具类别未知的轨迹片段中,按规则寻找出驾驶人轨迹片段,如此循环往复,直至所有轨迹片段的交通工具类别均已识别完成。
步骤s5的具体实施步骤如下:
步骤s501、令ks5=1;
步骤s502、按照一定的规则,从交通工具类别未知的轨迹片段中,选取一条匹配轨迹数较多的轨迹片段
步骤s503、利用步骤s4中构建的规则集,识别
步骤s504、记
其中,e为图g的边集,将
步骤s505、令
步骤s506、若图g中的顶点数大于0,则依然存在交通工具类别未知的轨迹片段,令ks5=1,转步骤s502;若顶点数等于0,则所有轨迹片段的交通工具类别均已确定,整个识别过程全部完成。
进一步地,所述的步骤s203中,剔除异常点的具体过程如下:计算相邻两点ai,j到ai,j+1间的用户移动速度
进一步地,所述的步骤s204中,将每一用户的全体时空序列点qi,分割成一系列轨迹片段的具体步骤为:
步骤s20401、令ks204=1,j=1
步骤s20402、创建新的轨迹片段序列
步骤s20403、计算数据点
步骤s20404、若ks204=mi-1,则结束执行,否则令ks204=ks204+1,转步骤s20403。
进一步地,所述的步骤s301中,计算时空匹配度
步骤s30101、选定时间间隔
其中len(·)表示轨迹片段的长度,即时空点的个数,时间窗口大小tw为轨迹片段
步骤s30102、记
其中
tw1=[tbegin,tbegin+tw)
tw2=[tbegin+tw,tbegin+2tw)
twn-1=[tbegin+(nw-2)tw,tbegin+(nw-1)tw)
twnw=[tbegin+(nw-1)tw,tend]
步骤s30103、记sp,λ(k),sq,μ(k)分别为
其中,
步骤s30104、计算
进一步地,所述的步骤s4中额定行驶速度
轨迹片段
将上述速度值序列
进一步地,所述的步骤s4中额定行驶加速度
进一步地,所述的步骤s4中行驶路程
进一步地,所述的步骤s4中聚集系数
进一步地,所述的步骤s4中频数
a、令l=1,
b、计算
c、若
d、若l=ep,其中,ep为用户p的轨迹片段总数,则
进一步地,所述的步骤s4中判别交通工具类别的规则集定义如下:
规则s401、根据
若
若
若
若
若
若
其中,vwalk,vbike,vlow,vmid1,vmid2,vhigh均为预先设定的参数,其取值应满足vwalk<vbike<vlow<vmid1<vmid2<vhigh;
规则s402、就路程与位移的比值
规则s403、根据
若
若
若
其中,dislong,clucoach均为预先设定的参数;
规则s404、若若
规则s405、若
规则s406、若
进一步地,所述的步骤s502中,选取轨迹片段
规则(1):
若满足规则(1)的轨迹片段不唯一,则
若满足规则(2)的轨迹片段仍然不唯一,则
本发明相对于现有技术具有如下的优点及效果:
本发明所提出的一种利用移动通信数据识别交通工具类别的方法,无需安装额外的传感器和视频监控设备,不依赖车辆的各类参数信息,仅通过精确度较低的基站定位信息,即可较为准确地识别交通工具的类别。
附图说明
图1是本发明实施例中利用移动通信数据的识别交通工具的总体流程图;
图2是本发明实施例中划分轨迹片段的流程图;
图3是本发明实施例中计算匹配关系的流程图;
图4是本发明实施例中判别交通工具类别的规则集示意图;
图5是本发明实施例中识别所有轨迹片段交通工具类别的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
如附图1所示,一种利用移动通信数据识别交通工具类别的方法,主要包含如下步骤:
步骤s1、获取原始数据。从蜂窝式移动通信网络的通信数据中获取移动设备用户所在基站的状态信息数据,记作时空点四元组集合(a=<userid,timestamp,longitude,latitude>),其中userid表示能够区分不同用户的信息字段(如移动设备id、网卡mac地址或手机号码),timestamp为时间戳,即该位置信息产生的时间点,longitude与latitude分别表示基站的经度和纬度。记用户总数为nu。
步骤s2、从用户的时空点序列中划分轨迹片段。利用步骤s1中获取的数据,得到各个移动用户所历经的时空点序列,通过计算用户在各个位置的停留时间长度,判断出用户每次移动的起点与终点。用户在某一时间段内,进行一次移动所产生的时空点序列,即为一条轨迹片段。如此可将一个用户的所有时空点序列,划分为一系列轨迹片段。
步骤s3、计算步骤s2中的不同用户轨迹片段之间的匹配关系,并构建匹配关系的拓扑结构图。
步骤s4、定义轨迹片段的各类属性特征以及基于这些特征进行判别的规则集,用于识别交通工具的类别。
步骤s5、按以下方法识别所有轨迹片段的交通工具类别。从交通工具类别未知的轨迹片段中,按一定规则寻找出一条匹配轨迹数较多的轨迹片段,运用步骤s4中的规则集识别该驾驶人轨迹片段的交通工具类别;之后利用步骤s3中构建的拓扑结构图,寻找出该轨迹片段匹配的所有轨迹片段,并将它们的交通工具类别标记为与该轨迹片段相同的类别;之后再从交通工具类别未知的轨迹片段中,按规则寻找出驾驶人轨迹片段,如此循环往复,直至所有轨迹片段的交通工具类别均已识别完成。
如附图2所示,步骤s2的具体实施方法如下:
步骤s201、将步骤s1中提取到的时空四元组集合,将相同userid的记录构成该用户的轨迹时空点序列,并将每一用户的时空点序列按照timestamp升序排列。用户i的第j个时空点记作:
ai,j=<useridi,timestampi,j,longitudei,j,latitudei,j>。
用户i的全体时空点序列记为
步骤s202、剔除步骤s201每一用户的序列si中的异常点:计算相邻两点ai,j到ai,j+1间的用户移动速度
步骤s203、将经过步骤s202处理后的各个用户的时空序列点qi,分割为一系列轨迹片段,具体步骤如下:
步骤s20301、令ks203=1,r=1,j=1;
步骤s20302、记
步骤s20303、设定tborder为20分钟,计算数据点ai,k+1与ai,k的时间差
步骤s20304、若k=m-1,则结束执行,否则令k=k+1,r=r+1,转步骤s20303。
步骤s204、将步骤s203得到的所有用户的轨迹片段进行汇总,记作:
其中nti表示用户i的轨迹片段总数。
步骤s3的具体实施步骤如下:
步骤s301、对每一个满足
步骤s30101、选定时间间隔
其中len(·)表示轨迹片段的长度,即时空点的个数。tw为轨迹片段
步骤s30102、记
tw1=[tbegin,tbegin+tw)
tw2=[tbegin+tw,tbegin+2tw)
twn-1=[tbegin+(nw-2)tw,tbegin+(nw-1)tw)
twnw=[tbegin+(nw-1)tw,tend]
步骤s30103、记sp,λ(k),sq,μ(k)分别为
其中,
步骤s30104、计算
若
步骤s302、构建全体轨迹片段间,匹配关系的拓扑结构图。匹配关系的拓扑结构图记为g={v,e},v为顶点的集合,全体轨迹片段集合пall与图顶点集合v为一一对应关系,将轨迹片段
步骤s4的具体实施步骤如下:定义轨迹片段
1.额定速度,即交通工具正常行驶时所能达到的速度,记为
将上述瞬时速度值序列
2.额定加速度,即交通工具正常行驶中加(减)速时,所能达到的加速度,记作
3.位移,即轨迹片段起点到终点的直接距离(忽略所有中间点的路程)。记为
4.行驶路程,记为
5.聚集系数,即轨迹片段
6.频数,即该用户存在历经相似位置的轨迹片段数量,记为
步骤a、令l=1,
步骤b、计算
步骤c、若
步骤d、若l=ep(ep为用户p的轨迹片段总数),则
如附图4所示,基于上述特征,定义判别交通工具类别的规则集如下:
规则s401、根据
vwalk,vbike,vlow,vmid1,vmid2,vhigh分别设定为6km/h,20km/h,30km/h,40km/h,140km/h,200km/h。
规则s402、就路程与位移的比值
规则s403、根据
其中,设定dislong为30km,设定clucoach为10。
规则s404、若
规则s405、若
规则s406、若
步骤s5的具体实施步骤如下:
步骤s501、令ks5=1。
步骤s502、按以下规则,从交通工具类别未知的轨迹片段中,选取一条轨迹片段
规则(1):
若满足规则(1)的轨迹片段不唯一,则
若满足规则(2)的轨迹片段仍然不唯一,则
步骤s503、利用步骤s4中构建的规则集,识别
步骤s504、记
其中,e为图g的边集。将
步骤s505、令
步骤s506、若图g中的顶点数大于0,则依然存在交通工具类别未知的轨迹片段,令ks5=1,转步骤s502。若顶点数等于0,则所有轨迹片段的交通工具类别均已确定,整个过程全部完成。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。