一种利用移动通信数据识别交通工具类别的方法与流程

文档序号:16326987发布日期:2018-12-19 05:58阅读:302来源:国知局
一种利用移动通信数据识别交通工具类别的方法与流程

本发明涉及计算机技术领域,具体涉及一种利用移动通信数据识别交通工具类别的方法。

背景技术

交通是一座城市乃至一个国家的命脉。得益于国民经济的增长以及科学技术的革新进步,人们的出行方式日渐丰富,“智能交通”的概念也应运而生。交通工具类别的识别,是“智能交通”中的一个重要课题,对于道路交通的部署和优化,有着深远的指导意义。目前主流的交通工具识别技术,主要有传感器技术和数字图像处理技术两大类。传感器技术即在道路上设置传感器以采集和记录交通工具的速度,重量,体积等信息,从而识别交通工具的类别,这类方法需要铺设大量的设备,前期建设与后期维护的成本较高,难以实现全面覆盖;数字图像处理技术,则利用监控摄像装置拍摄到的车辆的图像,提取其中的车辆标志,车辆形状等特征,对交通工具的类别作出判断,然而,这种方法对拍摄到的图像质量有较高的要求,若拍摄的画面分辨率较低,或是在雨雪雾天等恶劣天气条件下,识别的准确率会大幅下降。

专利cn104835320a公开了一种基于移动通信数据的交通流估算方法,其通过筛选出指定路段的基站地址序列,计算相邻蜂窝中用户数量差值绝对值的加权平均值,以估算某一时间段内的交通流量。但是,目前尚未有一种基于移动通信数据对用户所乘坐的交通工具类别进行判断的有效方法。



技术实现要素:

本发明的目的是为了解决现有技术中的上述缺陷,提供一种利用移动通信数据识别交通工具类别的方法,该方法基于移动设备与基站通信时产生的状态信息,通过移动设备在不同时间所处的基站位置的变化,形成一系列轨迹片段,对这些轨迹片段进行特征提取,利用提取出的特征识别出轨迹片段的交通工具类别。

本发明的目的可以通过采取如下技术方案达到:

一种利用移动通信数据识别交通工具类别的方法,包含以下步骤:

步骤s1、获取原始数据。从蜂窝式移动通信网络的通信数据中获取移动设备用户所在基站的状态信息数据,记作时空点四元组集合a=<userid,timestamp,longitude,latitude>,其中userid表示能够区分不同用户的信息字段(如移动设备id、网卡mac地址或手机号码),timestamp为时间戳,即该位置信息产生的时间点,longitude与latitude分别表示基站的经度和纬度,记用户总数为nu。

步骤s2、从用户的时空点序列中划分轨迹片段。利用步骤s1中获取的数据,得到各个移动用户所历经的时空点序列,通过计算用户在各个位置的停留时间长度,判断出用户每次移动的起点与终点。用户在某一时间段内,进行一次移动所产生的时空点序列,即为一条轨迹片段。如此可将一个用户的所有时空点序列,划分为一系列轨迹片段。

步骤s2的具体实施方法如下:

步骤s201、在步骤s1所提取到的时空四元组集合中,将相同userid的记录构成该用户的轨迹时空点序列,记作

ai,j=<useridi,timestampi,j,longitudei,j,latitudei,j>。

步骤s202、将每一用户的数据点按照timestamp升序排列,得到按时间变化的数据点序列,记为

步骤s203、剔除步骤s202每一用户的序列si中的异常点,将si更新为:

步骤s204、将经过步骤s203处理后的每一用户的全体时空序列点qi,分割成一系列轨迹片段。

步骤s205、将步骤s204得到的所有用户的轨迹片段进行汇总,记作

其中nti表示用户i的轨迹总数,表示用户i的第η条轨迹片段。

步骤s3、计算步骤s2中的不同用户轨迹片段之间的匹配关系,并构建匹配关系的拓扑结构图。

步骤s3的具体实施步骤如下:

步骤s301、对每一个满足(其中×表示集合的笛卡尔积),的轨迹片段对计算其时空匹配度(mb为预先设定的匹配度的阈值,其值应当接近于1),则轨迹片段匹配轨迹片段记为则轨迹片段存在一个子片段,与轨迹片段与在时间与空间上高度匹配,可以认为用户q在该段时间内与用户p乘坐同一辆交通工具。若则说明轨迹片段不匹配轨迹片段记为至此,得出匹配关系。

步骤s302、构建全体轨迹片段间,匹配关系的拓扑结构图。匹配关系的拓扑结构图记为g={v,e},v为顶点的集合,全体轨迹片段集合πall与图顶点集合v为一一对应关系,将轨迹片段在图中所对应的顶点记为为图中有向边的集合表示从顶点指向顶点的边)。

步骤s4、定义轨迹片段的各类属性特征以及基于这些判别交通工具类别的规则集,用于识别交通工具的类别。

其中,轨迹片段的各类属性特征如下:

额定行驶速度,即交通工具正常行驶时所能达到的速度,记为

额定行驶加速度,即交通工具正常行驶中加、减速时,所能达到的加速度,记为

位移,即轨迹片段起点到终点的直接距离,记为

标准速度与标准加速度,即交通工具所能达到的速度与加速度;

行驶路程,记为

聚集系数,即轨迹片段在同一时间段乘坐同一交通工具的人数,记为

频数,即该用户存在历经相似位置的轨迹片段数量,记为

步骤s5、按以下方法识别所有轨迹片段的交通工具类别:从交通工具类别未知的轨迹片段中,按一定规则寻找出一条匹配轨迹数较多的轨迹片段,运用步骤s4中的规则集识别该驾驶人轨迹片段的交通工具类别;之后利用步骤s3中构建的拓扑结构图,寻找出该轨迹片段匹配的所有轨迹片段,并将它们的交通工具类别标记为与该轨迹片段相同的类别;之后再从交通工具类别未知的轨迹片段中,按规则寻找出驾驶人轨迹片段,如此循环往复,直至所有轨迹片段的交通工具类别均已识别完成。

步骤s5的具体实施步骤如下:

步骤s501、令ks5=1;

步骤s502、按照一定的规则,从交通工具类别未知的轨迹片段中,选取一条匹配轨迹数较多的轨迹片段

步骤s503、利用步骤s4中构建的规则集,识别的交通工具类别;

步骤s504、记匹配的轨迹片段集合为

其中,e为图g的边集,将中,所有轨迹片段的交通工具类别标记为与相同的类别;

步骤s505、令从图g的顶点集合v中删去集合中所有轨迹片段所对应的顶点,并从图g的边集e中,删去所有包含有被删去的顶点的边;

步骤s506、若图g中的顶点数大于0,则依然存在交通工具类别未知的轨迹片段,令ks5=1,转步骤s502;若顶点数等于0,则所有轨迹片段的交通工具类别均已确定,整个识别过程全部完成。

进一步地,所述的步骤s203中,剔除异常点的具体过程如下:计算相邻两点ai,j到ai,j+1间的用户移动速度判断该速度是否大于预先设定的阈值vmax,若否,则保留点aij;若是,则从序列中删除点ai,j+1并更新j=j+1,重复该步骤至j=n结束。由此将si更新为:

进一步地,所述的步骤s204中,将每一用户的全体时空序列点qi,分割成一系列轨迹片段的具体步骤为:

步骤s20401、令ks204=1,j=1

步骤s20402、创建新的轨迹片段序列为当前轨迹片段的起点;

步骤s20403、计算数据点的时间差判断是否大于预先设定的阈值tborder,若是,则为当前的轨迹片段的终点,相应地,为下一条轨迹片段的起点,令ks204=ks204+1,j=j+1,转步骤s20402;若否,则在现有轨迹片段lj的末尾添加点转步骤s20404;

步骤s20404、若ks204=mi-1,则结束执行,否则令ks204=ks204+1,转步骤s20403。

进一步地,所述的步骤s301中,计算时空匹配度的过程如下:

步骤s30101、选定时间间隔

其中len(·)表示轨迹片段的长度,即时空点的个数,时间窗口大小tw为轨迹片段中相邻时空点的最小时间差与轨迹片段中相邻时空点的最小时间差的较小者;

步骤s30102、记

其中分别表示轨迹片段的起点时间戳,分别表示轨迹片段的终点时间戳。将时间区间[tbegin,tend]以tw为间隔划分为个不重叠的时间窗口,各时间窗口分别记为:

tw1=[tbegin,tbegin+tw)

tw2=[tbegin+tw,tbegin+2tw)

twn-1=[tbegin+(nw-2)tw,tbegin+(nw-1)tw)

twnw=[tbegin+(nw-1)tw,tend]

步骤s30103、记sp,λ(k),sq,μ(k)分别为中,时间戳落在时间窗口twk内的时空点集合,易知每一个sp,λ(k)与sq,μ(k)中至多只有一个元素,计算匹配的点数计算公式如下:

其中,为预先设定的阈值。

步骤s30104、计算对于的匹配度mr,计算公式如下:

进一步地,所述的步骤s4中额定行驶速度的计算方式如下:

轨迹片段通过相邻两个时空点的速度记作

将上述速度值序列按照值从大到小排序,则的值取为排序后的速度值的前top%的平均值,其中top为预先设定的参数。

进一步地,所述的步骤s4中额定行驶加速度的计算方式如下:将轨迹片段通过相邻三个时空点的瞬时加速度记作将上述加速度值序列按照值从大到小排序,则的值取为排序后的速度值的前top%的平均值。

进一步地,所述的步骤s4中行驶路程的计算公式如下:

进一步地,所述的步骤s4中聚集系数匹配的轨迹数,即在拓扑结构图g中对应的顶点的出度。

进一步地,所述的步骤s4中频数的计算步骤如下:

a、令l=1,

b、计算的最长公共子序列,其计算方式如下:记为轨迹片段的前l1个时空点与轨迹片段的前l2个位置的最长公共子序列的长度,其计算公式如下:

c、若其中,fb为预先设定好的阈值,其值接近于1,len(·)表示轨迹片段的长度,则令

d、若l=ep,其中,ep为用户p的轨迹片段总数,则计算完成,否则令l=l+1,转到步骤b。

进一步地,所述的步骤s4中判别交通工具类别的规则集定义如下:

规则s401、根据的取值,按如下技术方案对交通工具类别进行判别:

所属区间为[0,vwalk),则交通工具类别为无交通工具,即步行;

所属区间为[vbike,vlow),则交通工具类别为低速机动车,并转至使用规则s402作进一步判别;

所属区间为[vlow,vmid1),则交通工具类别为摩托车;

所属区间为[vmid1,vmid2),则交通工具类别为各类汽车、地铁或普快列车,并转至使用规则s403作进一步判别;

所属区间为[vmid2,vhigh),则交通工具类别为动车;

则交通工具类别为高铁;

其中,vwalk,vbike,vlow,vmid1,vmid2,vhigh均为预先设定的参数,其取值应满足vwalk<vbike<vlow<vmid1<vmid2<vhigh;

规则s402、就路程与位移的比值以及聚集系数两个特征做进一步判别。若(其中rateroad为预先设定的参数),则轨迹的交通工具类别为在公路上行驶的低速机动车,否则交通工具类别应当为在非公路上行驶的低速机动车。若(其中clutour为预先设定的参数),则轨迹的交通工具类别为载客低速机动车,为非载客低速机动车。

规则s403、根据的取值,按以下技术方案对交通工具类别进行判别:

则交通工具类别为货车或小轿车,并按规则s404作进一步判别,

则交通工具类别为短途客运机动车,并按规则s405作进一步判别,

则交通工具类别为长途客运机动车,并按规则s406作进一步判别,

其中,dislong,clucoach均为预先设定的参数;

规则s404、若若其中accar为预先设定的参数,则轨迹的交通工具类别为货车,反之标记为小轿车;

规则s405、若其中clusub为预先设定的参数,且取值远大于clucoach,则轨迹的交通工具类别为市内轨道交通工具,若其中freqbus为预先设定的参数,则轨迹的交通工具类别为公共汽车,若则标记轨迹的交通工具类别为非公共汽车的其他客车。

规则s406、若其中clutrain为预先设定的参数,且取值远大于clucoach,则标记轨迹的交通工具类别为普快列车,反之标记轨迹的交通工具类别为长途客车。

进一步地,所述的步骤s502中,选取轨迹片段所按照的规则为:

规则(1):在图g中的对应顶点的出度最多,即匹配的轨迹数最多,

若满足规则(1)的轨迹片段不唯一,则应满足规则(2):为满足规则(1)的所有轨迹片段中,行驶路程最长的;

若满足规则(2)的轨迹片段仍然不唯一,则可以为满足规则(2)的轨迹片段中的任意一个。

本发明相对于现有技术具有如下的优点及效果:

本发明所提出的一种利用移动通信数据识别交通工具类别的方法,无需安装额外的传感器和视频监控设备,不依赖车辆的各类参数信息,仅通过精确度较低的基站定位信息,即可较为准确地识别交通工具的类别。

附图说明

图1是本发明实施例中利用移动通信数据的识别交通工具的总体流程图;

图2是本发明实施例中划分轨迹片段的流程图;

图3是本发明实施例中计算匹配关系的流程图;

图4是本发明实施例中判别交通工具类别的规则集示意图;

图5是本发明实施例中识别所有轨迹片段交通工具类别的流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例

如附图1所示,一种利用移动通信数据识别交通工具类别的方法,主要包含如下步骤:

步骤s1、获取原始数据。从蜂窝式移动通信网络的通信数据中获取移动设备用户所在基站的状态信息数据,记作时空点四元组集合(a=<userid,timestamp,longitude,latitude>),其中userid表示能够区分不同用户的信息字段(如移动设备id、网卡mac地址或手机号码),timestamp为时间戳,即该位置信息产生的时间点,longitude与latitude分别表示基站的经度和纬度。记用户总数为nu。

步骤s2、从用户的时空点序列中划分轨迹片段。利用步骤s1中获取的数据,得到各个移动用户所历经的时空点序列,通过计算用户在各个位置的停留时间长度,判断出用户每次移动的起点与终点。用户在某一时间段内,进行一次移动所产生的时空点序列,即为一条轨迹片段。如此可将一个用户的所有时空点序列,划分为一系列轨迹片段。

步骤s3、计算步骤s2中的不同用户轨迹片段之间的匹配关系,并构建匹配关系的拓扑结构图。

步骤s4、定义轨迹片段的各类属性特征以及基于这些特征进行判别的规则集,用于识别交通工具的类别。

步骤s5、按以下方法识别所有轨迹片段的交通工具类别。从交通工具类别未知的轨迹片段中,按一定规则寻找出一条匹配轨迹数较多的轨迹片段,运用步骤s4中的规则集识别该驾驶人轨迹片段的交通工具类别;之后利用步骤s3中构建的拓扑结构图,寻找出该轨迹片段匹配的所有轨迹片段,并将它们的交通工具类别标记为与该轨迹片段相同的类别;之后再从交通工具类别未知的轨迹片段中,按规则寻找出驾驶人轨迹片段,如此循环往复,直至所有轨迹片段的交通工具类别均已识别完成。

如附图2所示,步骤s2的具体实施方法如下:

步骤s201、将步骤s1中提取到的时空四元组集合,将相同userid的记录构成该用户的轨迹时空点序列,并将每一用户的时空点序列按照timestamp升序排列。用户i的第j个时空点记作:

ai,j=<useridi,timestampi,j,longitudei,j,latitudei,j>。

用户i的全体时空点序列记为其中,ni为用户i的时空点个数。

步骤s202、剔除步骤s201每一用户的序列si中的异常点:计算相邻两点ai,j到ai,j+1间的用户移动速度其中,dist(·,·)表示两个时空点基站之间的距离。判断vij是否大于预先设定的阈值vmax(本实施例中,vmax取600km/h),若否,则保留点aij;若是,则从序列中删除点ai,j+1并更新j=j+1,重复该步骤至j=n结束。由此将si更新为:其中,mi为剔除异常点之后,用户i剩余的时空点个数,满足mi≤ni。

步骤s203、将经过步骤s202处理后的各个用户的时空序列点qi,分割为一系列轨迹片段,具体步骤如下:

步骤s20301、令ks203=1,r=1,j=1;

步骤s20302、记创建新的轨迹片段序列为当前轨迹片段的起点;

步骤s20303、设定tborder为20分钟,计算数据点ai,k+1与ai,k的时间差判断是否大于预先设定的阈值tborder,若是,则为当前的轨迹片段的终点,相应地,ai,k+1为下一条轨迹片段的起点,令k=k+1,j=j+1,r=1,转步骤s20302;若否,则记在现有轨迹片段lj的末尾添加点转步骤s20304。

步骤s20304、若k=m-1,则结束执行,否则令k=k+1,r=r+1,转步骤s20303。

步骤s204、将步骤s203得到的所有用户的轨迹片段进行汇总,记作:

其中nti表示用户i的轨迹片段总数。

步骤s3的具体实施步骤如下:

步骤s301、对每一个满足的轨迹片段对其中×表示集合的笛卡尔积,如附图3所示,按如下方式计算匹配关系:

步骤s30101、选定时间间隔

其中len(·)表示轨迹片段的长度,即时空点的个数。tw为轨迹片段中相邻时空点的最小时间差与轨迹片段中相邻时空点的最小时间差的较小者。

步骤s30102、记

其中分别表示轨迹片段的起点时间戳;分别表示轨迹片段的终点时间戳。将时间区间[tbegin,tend]以tw为间隔划分为个不重叠的时间窗口,各时间窗口分别记为:

tw1=[tbegin,tbegin+tw)

tw2=[tbegin+tw,tbegin+2tw)

twn-1=[tbegin+(nw-2)tw,tbegin+(nw-1)tw)

twnw=[tbegin+(nw-1)tw,tend]

步骤s30103、记sp,λ(k),sq,μ(k)分别为中,时间戳落在时间窗口twk内的时空点集合,易知每一个sp,λ(k)与sq,μ(k)中至多只有一个元素,计算匹配的点数计算公式如下:

其中,smin预先设定为50米。

步骤s30104、计算对于的匹配度mr,计算公式如下:

(mb设定为0.9),则轨迹片段匹配轨迹片段记为则轨迹片段存在一个子片段,与轨迹片段与在时间与空间上高度匹配,可以认为用户q在该段时间内与用户p乘坐同一辆交通工具。若则说明轨迹片段不匹配轨迹片段记为至此,得出匹配关系。

步骤s302、构建全体轨迹片段间,匹配关系的拓扑结构图。匹配关系的拓扑结构图记为g={v,e},v为顶点的集合,全体轨迹片段集合пall与图顶点集合v为一一对应关系,将轨迹片段在图中所对应的顶点记为为图中有向边的集合(表示从顶点指向顶点的边)。

步骤s4的具体实施步骤如下:定义轨迹片段的各类属性特征及其计算方式如下:

1.额定速度,即交通工具正常行驶时所能达到的速度,记为其计算方式如下:将轨迹片段通过相邻两个时空点的瞬时速度记作

将上述瞬时速度值序列

按照值从大到小排序,则的值取为排序后的速度值的前top%的平均值,其中top设定为20。

2.额定加速度,即交通工具正常行驶中加(减)速时,所能达到的加速度,记作其计算方式如下:将轨迹片段通过相邻三个时空点的瞬时加速度记作将上述瞬时加速度值序列按照值从大到小排序,则的值取为排序后的速度值的前top%的平均值。

3.位移,即轨迹片段起点到终点的直接距离(忽略所有中间点的路程)。记为其计算公式为:

4.行驶路程,记为其计算公式为:

5.聚集系数,即轨迹片段在同一时间段乘坐同一交通工具的人数,记为匹配的轨迹数,即在拓扑结构图g中对应的顶点的出度。

6.频数,即该用户存在历经相似位置的轨迹片段数量,记为

其计算步骤如下:

步骤a、令l=1,

步骤b、计算的最长公共子序列,其计算方式如下:记为轨迹片段的前l1个时空点与轨迹片段的前l2个位置的最长公共子序列的长度,其计算公式如下:

步骤c、若(fb设定为0.9;len(·)表示轨迹片段的长度),则令

步骤d、若l=ep(ep为用户p的轨迹片段总数),则

计算完成,否则令l=l+1,转到步骤b。

如附图4所示,基于上述特征,定义判别交通工具类别的规则集如下:

规则s401、根据的取值,按下述方案对交通工具类别进行判别:

vwalk,vbike,vlow,vmid1,vmid2,vhigh分别设定为6km/h,20km/h,30km/h,40km/h,140km/h,200km/h。

规则s402、就路程与位移的比值以及聚集系数两个特征做进一步判别。若(rateroad的数值设定为3),则轨迹的交通工具类别为在公路上行驶的低速机动车(电动自行车),否则交通工具类别应当为在非公路上行驶的低速机动车。若(clutour的数值设定为10),则轨迹的交通工具类别为载客低速机动车(景区观光车),为非载客低速机动车(电动巡逻车)。

规则s403、根据的取值,按下述方案对交通工具类别进行判别:

其中,设定dislong为30km,设定clucoach为10。

规则s404、若(stdacccar设为5m/s2),则轨迹的交通工具类别为货车,反之标记为小轿车。

规则s405、若(clusub设定为100),则轨迹的交通工具类别为市内轨道交通工具(地铁,轻轨),若(其中freqbus的数值,设定为数据集天数跨度的5倍)。则轨迹的交通工具类别为公共汽车,若则标记轨迹的交通工具类别为非公共汽车的客车(校车,单位班车,旅游大巴)。

规则s406、若(clutrain设定为100),则标记轨迹的交通工具类别为普快列车,反之标记轨迹的交通工具类别为长途客车。

步骤s5的具体实施步骤如下:

步骤s501、令ks5=1。

步骤s502、按以下规则,从交通工具类别未知的轨迹片段中,选取一条轨迹片段

规则(1):在图g中的对应顶点的出度最多,即匹配的轨迹数最多。

若满足规则(1)的轨迹片段不唯一,则应满足规则(2):为满足规则(1)的所有轨迹片段中,行驶路程最长的。

若满足规则(2)的轨迹片段仍然不唯一,则可以为满足规则(2)的轨迹片段中的任意一个。

步骤s503、利用步骤s4中构建的规则集,识别的交通工具类别。

步骤s504、记匹配的轨迹片段集合为

其中,e为图g的边集。将中,所有轨迹片段的交通工具类别标记为与相同的类别。

步骤s505、令从图g的顶点集合v中删去集合中所有轨迹片段所对应的顶点,并从图g的边集e中,删去所有包含有被删去的顶点的边。

步骤s506、若图g中的顶点数大于0,则依然存在交通工具类别未知的轨迹片段,令ks5=1,转步骤s502。若顶点数等于0,则所有轨迹片段的交通工具类别均已确定,整个过程全部完成。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1