1.本发明涉及数据处理领域,尤其涉及一种交通数据的数据聚类方法、装置、设备及介质。
背景技术:2.挖掘城市交通拥堵特征有利于交通管理部门合理规划治理资源,但交通拥堵并不是一成不变的,在不同时间段和不同地点具有不同的特点,如何在海量数据中挖掘分析出具有价值的信息成为智能交通领域的一个热点。聚类是城市交通数据挖掘中一种重要的无监督机器学习方法,该方法将给定的一组数据按照样本点的分布、相似性等特点分成若干个类簇,同一类簇中的样本点具有较高的相似性,不同类簇中样本点相似性较低。
3.目前,主流聚类算法按算法过程和聚类条件可分为五个大类:基于划分、密度、层次、网格以及模型的聚类方法。其中基于密度的聚类算法通常具有在各类数据集上适用性强、对噪声数据不敏感以及无需事先设定类簇数量等特点,是数据挖掘领域应用非常广泛的一类算法。
4.2014年,rodriguez等在《science》上发表了一种新型密度峰值聚类(clustering by fast search and find of density peaks,dpc)算法,该算法不仅可以快速找到聚类中心、识别数据集类簇数量,而且适用于大规模数据的聚类分析。依靠dpc算法步骤简单和适用性广等特点,近年来该算法已经广泛应用于图像分割、语义聚类、算法优化等学科前沿领域。
5.发明人在实现本发明的过程中意识到,现有的方式是通过特定局部密度与相对距离计算全体样本点局部密度与相对距离值,并构建决策图,选出类簇中心,最后分配剩余样本点。但这种方式依然存在明显的局限性:1)计算样本点局部密度时没有考虑样本周围的分布结构,导致许多簇的丢失;2)决策图中干扰点过多,难以准确选择类簇中心;3)两密度不同的类簇距离较近时聚类效果不佳;4)对于复杂结构的数据集来说,仅仅通过将数据点分配给距离最近的聚类中心点所属类簇容易出现“多米诺骨牌效应”,从而导致对于交通数据的聚类效果不佳。
技术实现要素:6.本发明实施例提供一种交通数据的数据聚类方法、装置、计算机设备和存储介质,以提高交通数据的数据聚类精准度。
7.为了解决上述技术问题,本技术实施例提供一种交通数据的数据聚类方法,所述交通数据的数据聚类方法包括:获取初始交通数据;对所述交通数据进行数据清洗,并进行标准化处理,得到标准化数据,并将所述标准化后的每条数据作为一个样本数据,将每个所述样本数据投射到坐标系中作为一个样本点;
计算各个样本点的局部密度和相对距离;根据所述局部密度和所述相对距离,确定类簇中心;基于所述类簇中心,依据密度可达与密度梯度下降对每个所述样本点进行聚类。
8.可选地,所述基于所述类簇中心,依据密度可达与密度梯度下降对每个所述样本点进行聚类包括:将每个类簇中心作为当前样本点;依次遍历判断所述当前样本点截断距离内的其他点是否密度可达或密度梯度下降;若每个所述当前样本点截断距离内的其他点均密度可达或密度梯度下降,则确定所述类簇中心为目标中心,并根据所述目标中心进行聚类。
9.可选地,在所述依次遍历判断所述当前样本点截断距离内的其他点是否密度可达或密度梯度下降之后,所述方法还包括:若存在截断距离内的其他点密度可达或密度梯度下降的当前样本点,则返回所述根据所述局部密度和所述相对距离,确定类簇中心的步骤继续执行。
10.可选地,将与所述类簇中心的距离小于预设距离阈值的样本点作为已分配样本点,将与任意一个聚类中心的距离均大于预设距离阈值的样本点作为待分配样本点,采用如下方式判断密度可达:计算所述待分配样本点j与所述已分配样本点i的距离d
ij
小于截断距离dc;若所述样本点j的局部密度大于预设密度阈值α时,称作样本点到样本点j密度可达:其中,ρ表示全部样本点局部密度升序排列的结果,β取值为(0,1),ceil()函数表示对输入值的向上取整,n为样本总数,ρ
ceil(ρ
×
n)
为集合内后ceil(β
×
n)位置的值, n表示对数据集总体划分的类簇数量,labeli表示样本点i所在类簇标签,其值为0时表示该样本点待分配类簇。
11.可选地,所述密度梯度下降通过如下式子确定:其中, dc为截断距离,d
ij
为待分配样本点j与已分配样本点i的距离。
12.可选地,所述对所述交通数据进行数据清洗,并进行标准化处理,得到标准化数据包括:对所述交通数据按照预设方式进行数据分割和格式化处理,得到格式化数据;采用均值法对包含交通属性的格式化数据进行数据填充,并对填充后的数据进行标准化转换,得到所述标准化数据。
13.为了解决上述技术问题,本技术实施例还提供一种交通数据的数据聚类装置,包括:数据获取模块,用于获取初始交通数据;
数据预处理模块,用于对所述交通数据进行数据清洗,并进行标准化处理,得到标准化数据,并将所述标准化后的每条数据作为一个样本数据,将每个所述样本数据投射到坐标系中作为一个样本点;距离计算模块,用于计算各个样本点的局部密度和相对距离;簇心确定模块,用于根据所述局部密度和所述相对距离,确定类簇中心;样本聚类模块,用于基于所述类簇中心,依据密度可达与密度梯度下降对每个所述样本点进行聚类。
14.可选地,所述样本聚类模块包括:样本点选取单元,用于将每个类簇中心作为当前样本点;遍历单元,用于依次遍历判断所述当前样本点截断距离内的其他点是否密度可达或密度梯度下降;聚类单元,用于若每个所述当前样本点截断距离内的其他点均密度可达或密度梯度下降,则确定所述类簇中心为目标中心,并根据所述目标中心进行聚类。
15.可选地,所述装置还包括:循环模块,用于若存在截断距离内的其他点密度可达或密度梯度下降的当前样本点,则返回所述根据所述局部密度和所述相对距离,确定类簇中心的步骤继续执行。
16.可选地,所述数据预处理模块包括:数据格式化单元,用于对所述交通数据按照预设方式进行数据分割和格式化处理,得到格式化数据;数据标准化单元,用于对包含交通属性的格式化数据进行数据填充,并对填充后的数据进行标准化转换,得到所述标准化数据。
17.为了解决上述技术问题,本技术实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述交通数据的数据聚类方法的步骤。
18.为了解决上述技术问题,本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述交通数据的数据聚类方法的步骤。
19.本发明实施例提供的交通数据的数据聚类方法、装置、计算机设备及存储介质,通过获取初始交通数据;对交通数据进行数据清洗,并进行标准化处理,得到标准化数据,并将标准化数据中的每条数据作为一个样本数据,将每个样本数据投射到坐标系中作为一个样本点;计算各个样本点的局部密度,通过引入样本点的k近邻点位置信息计算样本点相对距离,大量减少决策图中干扰点数量;根据局部密度和相对距离,确定类簇中心;基于类簇中心,依据密度可达与密度梯度下降对每个样本点进行聚类。实现通过相对距离和局部密度方式确定类簇中心进行聚类,减少干扰点数量,提高聚类准确性。
附图说明
20.为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获
得其他的附图。
21.图1是本技术可以应用于其中的示例性系统架构图;图2是本技术的交通数据的数据聚类方法的一个实施例的流程图;图3是根据本技术的交通数据的数据聚类装置的一个实施例的结构示意图;图4是根据本技术的计算机设备的一个实施例的结构示意图。
具体实施方式
22.除非另有定义,本文所使用的所有技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同;本文在申请的说明书中所使用的术语只是为了描述具体的实施例,不是旨在于限制本技术;本技术的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本技术的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
23.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
24.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
25.请参阅图1,如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
26.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。
27.终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、mp3播放器( moving picture experts group audio layer iii,动态影像专家压缩标准音频层面3 )、mp4播放器( moving picture experts group audio layer iv,动态影像专家压缩标准音频层面4 )、膝上型便携计算机和台式计算机等等。
28.服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
29.需要说明的是,本技术实施例所提供的交通数据的数据聚类方法由服务器执行,相应地,交通数据的数据聚类装置设置于服务器中。
30.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器,本技术实施例中的终端设备101、102、103具体可以对应的是实际生产中的应用系统。
31.请参阅图2,图2示出本发明实施例提供的一种交通数据的数据聚类方法,以该方
法应用在图1中的服务端为例进行说明,详述如下:s201:获取初始交通数据。
32.具体地,通过大数据爬取或者数据接口传输的方式,获取初始交通数据。
33.在一具体可选实施方式中,数据来源于政府数据开放平台出租车行车数据,相对于私家车行车数据,出租车行车数据不涉及公民隐私问题,具有易获得、可用性强的特点;而公交车行驶数据通常具有固定的路线,受公交车公司线路规划影响较大,缺乏灵活性,很难反应城市交通流真实情况。
34.本文选取的数据为xx年xx月xx日xx市出租车的行车数据,原始数据集2134124条信息,记录时间间隔没有固定数值,以秒为单位,每条数据包含17个属性,如表1所示:表1 数据集字段描述需要说明的是,本实施例选取原数据集中的6个字段的数据和自动生成样本序号作为初始交通数据:plate_num(车牌号)、gps_time(gps时间)、gps_speed(gps速度)、direction(方向)、gps_longitude(gps经度)、gps_latitude(gps纬度)以及id(每条数据编号),实际可根据应用需求进行灵活选择,此处不作具体限定,其中gps_time字段为字符串
形式,字符串前半段表示日期,后半段分别表示时分秒数值;gps_speed数据的单位为km/h;direction数据取值范围为0-360,以正北方向为0,顺时针取出租车行车方向角度值;id项编号为0-2134123。
35.s202:对交通数据进行数据清洗,并进行标准化处理,得到标准化数据,并将标准化数据中的每条数据作为一个样本数据,将每个样本数据投射到坐标系中作为一个样本点。
36.由于数据来源具有多样性,存在大量非标准格式值、噪声值和异常值,获取到的初始交通数据并不可以直接使用,而数据挖掘对原数据集格式、维度等要求高,低质量数据集往往会造成数据挖掘效果欠佳。因此在计算前需要进行数据预处理,以提高数据集的可用性并减少后续计算的复杂度。数据预处理通常有三种方法:数据集成、数据清洗和冗余消除。本实施例中源数据集需要统一各字段格式,确保不存在大量数据冗余情况;但数据集中存在大量空缺值和异常值,因此数据预处理主要是对难以计算的非结构化数据进行标准化处理,以及采取数据清洗消除大部分数据冗余、异常值和空缺项。
37.第一,数据是通过调用政府数据开放平台提供的接口,以get的请求方式进行下载,由于网页限制每个page的row值,因此设置每个page存储5000行,通过427个page进行下载,并存储在txt文件中。再将txt文件中除第一行之外的426个表头全部删除,得到原始数据集。
38.第二,依据字段将本实施例所需要的6个字段的列数据进行读取,存储在csv文件中以方便后续对数据集的分割、读取以及计算等操作,并加入“id”字段,在写入csv文件过程中每写入一行添加对应编号。
39.由于gps_time字段的数据格式为字符串形式,并不是标准化的格式,为后续的计算造成很大困难,因此需要将数据集中每条gps_time的字符串数据进行切割,由于该字段前9个字符串均为“20181001”的形式,因此不做处理,分别将[10,11]、[12,13]和[14,15]位置上的字符串进行切割,并转化成整型,然后以结果时间的格式进行计算,最后得到一个统一的以秒为单位的标准化格式。
[0040]
关于坐标系,由上表可知gps_longitude和gps_latitude两个属性值与日常所用经纬度取值范围并不适配,前两位数值作为车辆定位的经度和纬度,将该值除以600,000,得到wgs 84坐标系下的经纬度,将计算所得经纬度值分别作为longitude和latitude属性值。
[0041]
第三,清除空缺数据和异常数据,gps_time、gps_speed、direction、gps_longitude、gps_latitude这五个字段均是车载gps上传的数据,受到车辆环境影响会出现部分不合实际的数据值,如gps_time的取值范围为[20181001/000000,20181001/235959],而全域机动车最高时速为120km/h,因此gps_speed取值范围为[0,120];经换算过后,gps_longitude的取值范围为 [113.46,114.37],gps_latitude的取值范围为 [22.27,22.52];对于部分坐标数据异常或空缺的记录,采用均值插值法的方式进行插值,由于出租车轨迹具有无规律性,因此根据前后两个轨迹点的时间和坐标点的信息进行插值,将点i-1至点i+1的轨迹近似看作为匀速直线运动,具体数学表达式如下:
其中, longitudei和latitudei表示第i个点的经度和纬度,timei表示第i个点的时间属性的值。
[0042]
继续以s201中的示例为例,得到的标准化数据中每个样本包括7条属性,具体如表2所示:表2 标准化数据的字段在一具体可选实施方式中,对交通数据进行数据清洗,并进行标准化处理,得到标准化数据包括:对交通数据按照预设方式进行数据分割和格式化处理,得到格式化数据;数据标准化单元,用于对包含交通属性的格式化数据进行数据填充,并对填充后的数据进行标准化处理,得到标准化数据。
[0043]
s203:计算各个样本点的局部密度和相对距离。
[0044]
目前,对于时空数据挖掘有四种类型:时空聚类、时空分类、时空模式挖掘和异常检测。时空数据聚类与经典的聚类相似,将数据集中时间和空间维度上相似的对象划分到一个类簇中, 使得不同类簇样本间的相似度足够小,而同类簇间样本相似度足够大。
[0045]
本实施例中对出租车时空数据处理的聚类算法属于时空数据挖掘范畴,目的在于找出交通拥堵在时间和空间上分布的规律;而交通拥堵的显著特征为大量车辆聚集在同一区域,因此本实施例选取密度聚类(clustering by fast search and find of density peaks,dpc)算法作为基础,但dpc算法存在类簇中心选取精度低和分配策略单一等问题,因而提出dpc算法的改进算法,对交通拥堵区域进行聚类分析,克服了dpc算法和其他聚类算法适用范围小和结果依赖输入参数等问题。
[0046]
dpc算法过程中值和值的计算方法直接决定了样本点在决策图上的分布情况,准确选取类簇中心对dpc算法的聚类结果具有重要意义。但标准dpc算法在决策图中类簇中心往往离群性不够或干扰点较多,以至于难以准确选取类簇中心。
[0047]
在样本点数量过多的情况下干扰点数量多,很难准确选取类簇中心,可能导致聚类效果不佳,本实施例使用样本点的k近邻位置信息计算相对距离,通过计算样本点最近邻更高密度点到该样本点k近邻点集合的最近距离值作为该样本点的相对距离,δi的计算公式为:(3-3)其中,=样本点j为距离样本点i最近的更高局部密度点,样本点x为样本点i的k近邻点集合中的一个样本点。
[0048]
通过公式(3-3),类簇内大部分非局部密度最大样本点相对距离值会为0,类簇边缘点相对距离会大幅度减小,而类簇中心点相对距离会基本保持不变,表现在决策图中为:大部分干扰点纵坐标值为0,从而突出了类簇中心。
[0049]
s204:根据局部密度和相对距离,确定类簇中心。
[0050]
具体地,将局部密度和相对距离作为坐标轴,构建决策图,基于决策图上点的分布,确定有效的类簇中心。
[0051]
dpc算法中样本点分配策略直接决定算法聚类结果,简单的将样本点分配给最近的更高密度点所在类簇,可能会在一些“条形”数据集中聚类效果不佳,而dbscan算法的优势在于对“条形”数据集的处理,其中“密度可达”的思想是它的关键所在,因此引入dbscan算法中密度可达的思想,从而提升dpc算法对于“条形”数据集的处理效果;凸型数据集具有类簇中心密度较大与簇边缘点密度下降的显著特征,因此在分配策略中加入密度梯度下降的概念,从而可以更有效的处理凸型数据。
[0052]
s205:基于类簇中心,对每个样本点进行聚类。
[0053]
在一具体可选实施方式中,基于类簇中心,依据密度可达与密度梯度下降对每个样本点进行聚类包括:将每个类簇中心作为当前样本点;依次遍历判断当前样本点截断距离内的其他点是否密度可达或密度梯度下降;若每个当前样本点截断距离内的其他点均密度可达或密度梯度下降,则确定类簇中心为目标中心,并根据目标中心进行聚类。
[0054]
可选地,在依次遍历判断当前样本点截断距离内的其他点是否密度可达或密度梯度下降之后,该方法还包括:若存在截断距离内的其他点密度可达或密度梯度下降的当前样本点,则返回根据局部密度和相对距离确定类簇中心的步骤继续执行。
[0055]
本实施例中,将与类簇中心的距离小于预设距离阈值的样本点作为已分配样本点,将与任意一个聚类中心的距离均大于预设距离阈值的样本点作为待分配样本点,采用如下方式判断密度可达:计算待分配样本点j与已分配样本点i的距离d
ij
小于截断距离dc;若样本点j的局部密度大于预设密度阈值α时,称作样本点i到样本点j密度可达:
其中,ρ表示全部样本点局部密度升序排列的结果,β取值为(0,1),ceil()函数表示对输入值的向上取整,n为样本总数ρ
ceil(ρ
×
n)
为集合内后ceil(β
×
n)位置的值,n表示对数据集总体划分的类簇数量, labeli表示样本点i所在类簇标签,其值为0时表示该样本点待分配类簇。
[0056]
可选地,密度梯度下降通过如下式子确定:其中,dc为截断距离,d
ij
为待分配样本点j与已分配样本点i的距离。
[0057]
本实施例中,获取初始交通数据;对交通数据进行数据清洗,并进行标准化处理,得到标准化数据,并将标准化后的每条数据作为一个样本数据,将每个样本数据投射到坐标系中作为一个样本点;计算各个样本点的局部密度和相对距离;根据局部密度和相对距离,确定类簇中心;基于类簇中心,依据密度可达与密度梯度下降对每个样本点进行聚类。实现通过计算相对距离和局部密度的方式确定类簇中心进行聚类,减少干扰点数量,提高聚类准确性。
[0058]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0059]
图3示出与上述实施例交通数据的数据聚类方法一一对应的交通数据的数据聚类装置的原理框图。如图3所示,该交通数据的数据聚类装置包括数据获取模块31、数据预处理模块32、距离计算模块33、簇心确定模块34和样本聚类模块35。各功能模块详细说明如下:数据获取模块31,用于获取初始交通数据;数据预处理模块32,用于对交通数据进行数据清洗,并进行标准化处理,得到标准化数据,并将标准化后的每条数据作为一个样本数据,将每个样本数据投射到坐标系中作为一个样本点;距离计算模块33,用于计算各个样本点的局部密度和相对距离;簇心确定模块34,用于根据局部密度和相对距离,确定类簇中心;样本聚类模块35,用于基于类簇中心,依据密度可达与密度梯度下降对每个样本点进行聚类。
[0060]
可选地,样本聚类模块35包括:样本点选取单元,用于将每个类簇中心作为当前样本点;遍历单元,用于依次遍历判断当前样本点截断距离内的其他点是否密度可达或密度梯度下降;聚类单元,用于若每个当前样本点截断距离内的其他点均密度可达或密度梯度下降,则确定类簇中心为目标中心,并根据目标中心进行聚类。
[0061]
可选地,该装置还包括:循环模块,用于若存在截断距离内的其他点密度可达或密度梯度下降的当前样本点,则返回根据局部密度和相对距离确定类簇中心的步骤继续执行。
[0062]
可选地,数据预处理模块32包括:数据格式化单元,用于对交通数据按照预设方式进行数据分割和格式化处理,得
到格式化数据;数据标准化单元,用于对包含交通属性的格式化数据进行数据填充,并对填充后的数据进行标准化转换,得到标准化数据。
[0063]
关于交通数据的数据聚类装置的具体限定可以参见上文中对于交通数据的数据聚类方法的限定,在此不再赘述。上述交通数据的数据聚类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以以硬件形式内嵌或独立于计算机设备的处理器中,也可以以软件形式存储于计算机设备的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0064]
为解决上述技术问题,本技术实施例还提供计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
[0065]
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件连接存储器41、处理器42、网络接口43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit,asic)、可编程门阵列(field-programmable gate array,fpga)、数字处理器 (digital signal processor,dsp)、嵌入式设备等。
[0066]
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
[0067]
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或d界面显示存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘、智能存储卡(smart media card, smc)、安全数字(secure digital, sd)卡、闪存卡(flash card)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如电子文件的控制的程序代码等。此外,所述存储器41还可以用于临时存储已经输出或者将要输出的各类数据。
[0068]
所述处理器42在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的程序代码或者处理数据,例如运行电子文件的控制的程序代码。
[0069]
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
[0070]
本技术还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机
可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的交通数据的数据聚类方法的步骤。
[0071]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机、计算机、服务器、空调器、或者网络设备等)执行本技术各个实施例所述的方法。
[0072]
显然,以上所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例,附图中给出了本技术的较佳实施例,但并不限制本技术的专利范围。本技术可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本技术的公开内容的理解更加透彻全面。尽管参照前述实施例对本技术进行了详细的说明,对于本领域的技术人员而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本技术说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本技术专利保护范围之内。