一种考虑城市道路网络约束的同位模式发现方法及装置与流程

文档序号:12471333阅读:301来源:国知局
一种考虑城市道路网络约束的同位模式发现方法及装置与流程

本发明涉及空间数据模式挖掘领域,具体涉及一种考虑城市道路网络约束的同位模式发现方法及装置。



背景技术:

在过去的几十年里,人口、住房、基础设施的发展以及就业规模的扩大,使得我国的城市发展局面呈现突飞猛进的态势。随着科学技术的快速发展和数据资源的日益膨胀,后续“智慧城市”将逐渐转向集成处理多源空间数据,而城市基础服务设施数据涵盖了城市各类要素的位置和属性信息,作为城市基础数据库的关键,如何从中抽取有用的分布规律和模式特征信息,以指导新城镇的合理规划、合理布局成为目前城市发展的关键问题。城市设施数据大多以点的形式存在,解决点模式发现的常用方法即“同位模式挖掘”,该技术在近几年得到了蓬勃发展,目前已经在种群分布、公共安全、环境管理等领域得到了广泛的应用。

同位模式挖掘,即是从现实的点数据集中挖掘一系列在空间上存在相互依赖关系的特征类型组合,一般包括两步:首先,通过预先设定的距离阈值,在均质的欧氏空间上确定不同特征的个体是否存在邻近关系,建立二阶实体邻接关系表;然后,利用频繁项挖掘方法得到显著的同位模式。

然而,真实的城市空间存在着各种制约因素,利用这种挖掘框架存在着很大的局限性:第一,传统方法大多基于欧式距离,认为平面空间是均质和各向同性的。然而,真实城市空间中,与人相关的很多现象都发生于交通网络,如交通事故、街头事件、基础设施的分布等。第二,传统方法使用一刀切的距离阈值对实例的邻近关系做是非判断,将在阈值以内的实例间较近距离和较远距离同等对待。实际上,根据地理学第一定律,相近的事物联系更紧密,因此近距离实例关系对模式流行指数大小的影响,要大于远距离的实例关系。在上述两个前提下,使用传统算法会直接导致最终结果出现偏差,使得一些原本并不流行的模式被错误的判定为同位模式,或者一些有趣的模式被忽略。

城市公共服务设施是城市基础数据库的重要内容,对其空间分布的特征研究可为城市规划、决策提供重要的科学依据。城市的集约化发展倡导设施的合理化配置,对城市设施分布的模式发现即是实现这一目标的前提。传统上对于空间的理解是均质的,而城市中的设施大多分布在人为导致的、以道路骨架为限制因素的欧式空间中,常规的同位模式挖掘方法必然不能很好解决城市问题。



技术实现要素:

本发明旨在解决上面描述的问题。本发明的目的是提供解决以上问题的一种考虑城市道路网络约束的同位模式发现方法及装置。

本发明提供了一种考虑城市道路网络约束的同位模式发现方法,包括:为地图投影下的目标区域构建二阶实例邻近关系表,所述二阶实例邻近关系表中包含此目标区域内所有实例距与其可达距离在预设距离衰减阈值内并且类型不同的实例对集合以及它们的可达距离值;根据预设距离衰减阈值和所述二阶实例邻近关系表计算得到各实例在与此实例类型不同的其它类型实例集合影响下的网络核密度值;根据所述网络核密度值计算得到各实例集合对其它类型的实例集合的平均影响力;根据所述平均影响力计算各候选同位模式的流行度,根据预设流行度阈值确定候选同位模式中流行的同位模式。

上述方法还具有以下特点:所述构建二阶实例邻近关系表包括:

将多个邻近实例对及与其对应的实例之间的可达距离值存储在一个二维哈希表TIns_net2中,该表中的每个细胞单元,通过如下式的一个三元组集合表达:

TIns_net2(ex,ey)={<oi,oj,Rdis(oi,oj)>,...},

其中,(ex,ey)为两空间对象实例,oi,oj为两邻近实例,Rdis(oi,oj)为两邻近实例之间的可达距离值;

根据

Rdis(oi,oj)=g(y)*(oi-oj)net(t)|ht

计算两邻近实例之间的可达距离值,其中,Rdis(oi,oj)为所述两邻近实例之间的可达距离值,g(y)为二值函数,若实例oi到实例oj的沿路方向与道路通行方向相反,取值为0,否则取值为1,(oi-oj)net(t)为实例oi到实例oj的所用的最短路径时间,ht为基于路径时间的密度衰减阈值,是求取最短路径时间的一个约束条件,表示实例间的可达距离必须满足ht阈值,否则实例oi到实例oj不可达。

上述方法还具有以下特点:所述根据预设距离衰减阈值和所述二阶实例邻近关系表计算得到各实例在与此实施的类型不同的其它类型实例集合影响下的网络核密度值包括:

根据

计算类型为ex的实例oi在类型为ey的实例集合O’(ey)影响下的网络核密度值,

其中,为类型为ex的实例oi在类型为ey的实例集合O’(ey)影响下的网络核密度值,

为区域上所有类型为ey的实例集合的子集,

nmax为区域上单个类型的实例个数的最大值,

n(O’(ey)->oi)为O’(ey)中的实例到oi可达的实例对数量,

该式的计算结果取值范围为(0,1]。

上述方法还具有以下特点:根据所述网络核密度值计算得到各实例集合对其它类型的实例集合的平均影响力包括:

根据

计算实例集合O’(ey)对实例集合O’(ex)的平均影响力,

其中,为实例集合O’(ey)对实例集合O’(ex)的平均影响力,

为类型为ex的实例oi在类型为ey的实例集合O’(ey)影响下的网络核密度值,

为区域上所有类型为ex的实例集合的子集,

n(O’(ex))为实例集合O’(ex)中的实例个数,

n(ex)为区域内所有类型为ex的实例数量。

上述方法还具有以下特点:所述根据所述平均影响力计算各候选同位模式的流行度,根据预设流行度阈值确定候选同位模式中流行的同位模式包括:

根据

计算给定的候选模式的流行度,

其中,PICP为给定的候选模式的流行度,取值范围为(0,1],

Tins_netCP为由候选模式CP的团实例构成的实例表,该实例表是将所述二阶实例邻近关系表Tins_net2中涉及到CP中类型的非重复实例对通过团实例连接得到的,

min(.)用来求算输入集合的最小值,

用来求算类型为ex的实例在实例表Tins_netCP上的投影,

为实例集合对实例集合的平均影响力;

当针对一候选同位模式计算得到的流行度大于设定的流行度阈值时,确定所述此候选模式为流行的同位模式。

本发明还提供了一种考虑城市道路网络约束的同位模式发现装置,包括:二阶实例邻近关系表构建模块,用于为地图投影下的目标区域构建二阶实例邻近关系表,所述二阶实例邻近关系表中包含此目标区域内所有实例距与其可达距离在预设距离衰减阈值内并且类型不同的实例对集合及它们之间的可达距离值;

网络核密度计算模块,用于根据预设距离衰减阈值和所述二阶实例邻近关系表计算得到各实例在与此实例类型不同的其它类型实例集合影响下的网络核密度值;

平均影响力计算模块,用于根据所述网络核密度值计算得到各实例集合对其它类型的实例集合的平均影响力;

流行的同位模式获取模块,用于根据所述平均影响力计算各候选同位模式的流行度,根据预设流行度阈值确定候选同位模式中流行的同位模式。

上述装置还具有以下特点:所述二阶实例邻近关系表构建模块,具体用于将多个邻近实例对及与其对应的实例之间的可达距离值存储在一个二维哈希表TIns_net2中,该表中的每个细胞单元,通过如下式的一个三元组集合表达:

TIns_net2(ex,ey)={<oi,oj,Rdis(oi,oj)>,...},

其中,(ex,ey)为两空间对象实例,oi,oj为两邻近实例,Rdis(oi,oj)为两邻近实例之间的可达距离值;

根据

Rdis(oi,oj)=g(y)*(oi-oj)net(t)|ht

计算两邻近实例之间的可达距离值,其中,Rdis(oi,oj)为所述两邻近实例之间的可达距离值,

g(y)为二值函数,若实例oi到实例oj的沿路方向与道路通行方向相反,取值为0,否则取值为1,

(oi-oj)net(t)为实例oi到实例oj的所用的最短路径时间,

ht为基于路径时间的密度衰减阈值,是求取最短路径时间的一个约束条件,表示实例间的可达距离必须满足ht阈值,否则实例oi到实例oj不可达。

上述装置还具有以下特点:所述网络核密度计算模块,具体用于根据

计算类型为ex的实例oi在类型为ey的实例集合O’(ey)影响下的网络核密度值,

其中,为区域上所有类型为ey的实例集合的子集,

nmax为区域上单个类型的实例个数的最大值,

n(O’(ey)->oi)为O’(ey)中的实例到oi可达的实例对数量,

该式的计算结果取值范围为(0,1],描述了在网络约束下,实例集合O’(ey)对实例oi的影响力大小;

上述装置还具有以下特点:所述平均影响力计算模块,具体用于根据

计算实例集合O’(ey)对实例集合O’(ex)的平均影响力,

其中,为类型为ex的实例oi在类型为ey的实例集合O’(ey)影响下的网络核密度值,

为区域上所有类型为ex的实例集合的子集,

n(O’(ex))为实例集合O’(ex)中的实例个数,

n(ex)为区域内所有类型为ex的实例数量。

上述装置还具有以下特点:所述流行的同位模式获取模块,具体用于根据

计算给定的候选模式的流行度,

其中,PICP为给定的候选模式的流行度,取值范围为(0,1],

Tins_netCP为由候选模式CP的团实例构成的实例表,该实例表是将所述二阶实例邻近关系表Tins_net2中涉及到CP中类型的非重复实例对通过团实例连接得到的,

min(.)用来求算输入集合的最小值,

用来求算类型为ex的实例在实例表Tins_netCP上的投影,

为实例集合对实例集合的平均影响力;

当针对一候选同位模式计算得到的流行度大于设定的流行度阈值时,确定所述此候选模式为流行的同位模式。

本发明提出一种考虑城市道路网络约束的同位模式发现方法,在传统同位模式发现方法的基础上做了两个扩展:

(1)基于城市空间设施点的相互联系发生于网络路径距离而非欧式距离的事实,将空间核函数的方法置于网络结构中,用考虑了城市道路通行能力、方向等属性信息的特定服务时间内的可达性指标,取代传统的二维欧式距离来度量空间设施之间的邻近程度。

(2)改造传统的判断模式有趣程度的流行指数,将原始的单纯通过实例连接数计算的指标,加入可达距离权重这一调节参数。本发明相比该领域现有的其他方法,尊重了“人们的移动主要依赖于城市中的道路网络”的事实和“地理学第一定律”,因此提高了同位模式挖掘在城市设施数据上的准确度,而且更具现实意义和实用价值。

附图说明

构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明的实施例一提供的一种考虑城市道路网络约束的同位模式发现方法的流程图;

图2是构建二阶实例邻近关系表的方法示意图;

图3是由候选同位模式的团实例构成的实例表示意图;

图4是根据本发明的实施例二提供的一种考虑城市道路网络约束的同位模式发现装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。

为了更好的对本发明的实施例所提供的技术方案进行阐述,首先对如下概念进行说明:

Shp数据:shapefile的简称,是ESRI公司开发的一种空间数据开放格式,该格式的空间图形要素和对应的二维属性通过索引文件进行管理。

同位模式:同位模式C是一组空间特征的子集,其中,C中包含的类型的个数称作长度,或者阶。在挖掘问题中,常用到的概念有流行同位模式和候选同位模式两种,它们在表现形式上没有区别,但暗含的意义不同。候选同位模式是具有潜在同位关系的一组特征类型,一般由比其阶数低或高的流行同位模式求得,若其本身通过流行度验证,就会变为流行的同位模式。若候选同位模式的阶等于n,则称其为候选n阶同位模式或流行n阶同位模式。

团实例:是一组具有不同类型的实例的集合,这些实例在空间上两两邻近。

实例表:为了方便模式计算,会将团实例所属的类型按照固定的顺序排列(如模式中类型的字典序),并以表的形式存储。

本发明提供一种考虑城市道路网络约束的同位模式发现方法及装置。输入为同一地图投影下目标区域的道路线状Shp数据和服务设施点状Shp数据O={o1,o2,…,on},n为设施的个数。服务设施数据(以下称为实例)经过敏感数据剔除、坐标转化和完备性处理,保证每条数据包含设施点类型、X和Y坐标,这些设施数据涉及到的类型集合为E={e1,e2,…,em},m为设施的类型个数。区域上类型为ex的实例保存在集合O(ex)中,其实例的个数记作n(ex)。道路网数据经过拓扑检查、坐标转化和完备性处理,保证每条数据包含道路等级、类型、方向信息,此外,还需要设定距离阈值h和流行度阈值PI_pre。数据输出为满足条件的同位模式。

下面结合附图详细描述本发明的示例性实施例考虑城市道路网络约束的同位模式发现方法及装置。

实施例一

图1是示出根据本发明实施例一的考虑城市道路网络约束的同位模式发现方法的流程图。

步骤101,为地图投影下的目标区域构建二阶实例邻近关系表,二阶实例邻近关系表中包含此目标区域内所有实例距与其可达距离在预设距离衰减阈值内并且类型不同的各实例的可达距离值。

在网络同位模式挖掘的前提下,需要找到不同类型的实例点之间是否可达,若可达距离在阈值h以内,则说明这两个实例点是邻近的。城市道路网络具有通行方向和通行能力的差异,因此,实例A到B可达并不意味着B到A可达。在该假设下,构建网络空间核密度约束下的二阶实例邻近关系表的流程如下:第一,将道路网转化为基于路段的线性参考系统,路段即为相邻两个道路交叉点之间的线段;第二,把每个路段划分为等长的线性弧段,称之为基础线性单元;第三,为区域中的所有实例找到与其可达距离在h以内的、且与其类型不同的实例,将实例邻近关系和其可达距离存储在一个m*m的二维哈希表中,该表定义为网络空间核密度约束下的二阶实例邻近关系表TIns_net2。如图2所示,*表示非空的细胞单元,第x行,第y列的细胞单元的三元组集合记作TIns_net2(ex,ey)。实例表中的每个细胞单元存储对应二阶模式(ex,ey)的邻近实例对和其可达距离值,通过一个三元组集合TIns_net2(ex,ey)={<oi,oj,Rdis(oi,oj)>,...}表达。

假设位置x处有一类型为ex的实例oi,oi的邻近实例及它们的可达距离的计算方法是:将离oi最近的基础线性单元作为发生元,搜索离发生元最短路径长度在阈值h以内的类型不同的实例点,将oi和这些实例点配对并保留其距离值。

若考虑网络方向和通行能力,实例oi到oj的可达距离Rdis(oi,oj)可表达为:

Rdis(oi,oj)=g(y)*(oi-oj)net(t)|ht (1)

上式中,g(y)为二值函数,若oi到oj的沿路方向与道路通行方向相反,取值为0,否则取值为1;(oi-oj)net(t)是oi到oj的最短路径时间,ht表示基于路径时间的密度衰减阈值,是求取最短路径时间的一个约束条件,表示实例的可达距离必须满足ht阈值,否则oi到oj不可达。

步骤102,根据预设距离衰减阈值和二阶实例邻近关系表计算得到各实例在与此实例类型不同的其它类型实例集合影响下的网络核密度值。

空间核密度值在网络空间中可表达为:

上式中,f(x)为空间位置x处的核密度值;h为距离衰减阈值,是与x有邻近关系的实例点的距离最高门限;(x-oi)net为x与邻近实例点oi的网络可达距离;n为与x的距离小于h的实例点数;K表示空间权重函数,该函数几何意义是,随着位置x到每个实例点的距离增大,其密度值逐渐变小。很多学者证明了K的选择对模式分布结果的影响不大,在本发明中,我们选择高斯函数作为权重函数。高斯函数的表达公式如下:

上式中,exp(.)表示以自然常数e为底的指数函数。K(x)拥有典型的“钟型”曲线特征,其有三个可调的参数a、b和c,其中,a决定了曲线的峰值高度,b确定了峰值出现的横坐标的位置,c决定了曲线的幅宽。本发明采用了标准的二维高斯核函数,令a=c=1,且b=0。

在常规的同位模式挖掘中,实例连接做了无方向性处理,然而,在考虑道路约束的情况下,实例连接需要考虑方向性。在这一前提下,实例oi(类型为ex)在类型为ey的实例集合O’(ey)影响下的网络核密度值定义为:

上式中,是区域上所有类型为ey的实例集合的子集,nmax是区域上单个类型的实例个数的最大值,n(O’(ey)->oi)为O’(ey)中的实例到oi可达的实例对数量。该式由网络空间核密度模型变形而来,取值范围为(0,1],描述了在网络约束下,集合O’(ey)对实例oi的影响力大小。

步骤103,根据网络核密度值计算得到各实例集合对其它类型的实例集合的平均影响力。

基于公式(4),实例集合O’(ey)对实例集合O’(ex)的平均影响力通过下式计算:

上式中,n(O’(ex))表示集合O’(ex)中的实例个数,n(ex)表示区域上所有类型为ex的实例数量。相比常规的同位模式挖掘方法,平均影响力同时强调了候选模式中不同类型实例之间的相互联系和单个类型实例在候选模式中的参与程度。

步骤104,根据平均影响力计算各候选同位模式的流行度,根据预设流行度阈值确定候选同位模式中流行的同位模式。

基于公式(5),以下给出基于网络核密度的候选模式的流行度PICP的计算公式:

上式中,PICP为给定的候选模式的流行度,取值范围为(0,1],随着候选模式长度的增加,PICP也会相应减小,Tins_netCP为由候选模式CP的团实例构成的实例表,该实例表是将所述二阶实例邻近关系表Tins_net2中涉及到CP中类型的非重复实例对通过团实例连接得到的(如图3所示),min(.)用来求算输入集合的最小值,用来求算类型为ex的实例在实例表Tins_netCP上的投影,为实例集合对实例集合的平均影响力。

当针对一候选同位模式计算得到的流行度PICP大于设定的流行度阈值PI_pre时,确定此候选模式为流行的同位模式。

图4是示出根据本发明实施例二的考虑城市道路网络约束的同位模式发现装置的结构示意图。

参照图4,考虑城市道路网络约束的同位模式发现装置包括:

二阶实例邻近关系表构建模块401,用于为地图投影下的目标区域构建二阶实例邻近关系表,所述二阶实例邻近关系表中包含此目标区域内所有实例距与其可达距离在预设距离衰减阈值内并且类型不同的实例对集合和它们之间的可达距离值;

网络核密度计算模块402,用于根据预设距离衰减阈值和所述二阶实例邻近关系表计算得到各实例在与此实例类型不同的其它类型实例集合影响下的网络核密度值;

平均影响力计算模块403,用于根据所述网络核密度值计算得到各实例集合对其它类型的实例集合的平均影响力;

流行的同位模式获取模块404,用于根据所述平均影响力计算各候选同位模式的流行度,根据预设流行度阈值确定候选同位模式中流行的同位模式。

其中,二阶实例邻近关系表构建模块401,具体用于将多个邻近实例对及与其对应的实例之间的可达距离值存储在一个二维哈希表TIns_net2中,该表中的每个细胞单元,通过如下式的一个三元组集合表达:

TIns_net2(ex,ey)={<oi,oj,Rdis(oi,oj)>,...},

其中,(ex,ey)为两空间对象实例,oi,oj为两邻近实例,Rdis(oi,oj)为两邻近实例之间的可达距离值;

根据

Rdis(oi,oj)=g(y)*(oi-oj)net(t)|ht

计算两邻近实例之间的可达距离值,其中,Rdis(oi,oj)为所述两邻近实例之间的可达距离值,

g(y)为二值函数,若实例oi到实例oj的沿路方向与道路通行方向相反,取值为0,否则取值为1,

(oi-oj)net(t)为实例oi到实例oj的所用的最短路径时间,

ht为基于路径时间的密度衰减阈值,是求取最短路径时间的一个约束条件,表示实例间的可达距离必须满足ht阈值,否则实例oi到实例oj不可达。

其中,所述网络核密度计算模块402,具体用于根据

计算类型为ex的实例oi在类型为ey的实例集合O’(ey)影响下的网络核密度值,

其中,为区域上所有类型为ey的实例集合的子集,

nmax为区域上单个类型的实例个数的最大值,

n(O’(ey)->oi)为O’(ey)中的实例到oi可达的实例对数量,

该式的计算结果取值范围为(0,1],描述了在网络约束下,实例集合O’(ey)对实例oi的影响力大小;

其中,所述平均影响力计算模块403,具体用于根据

计算实例集合O’(ey)对实例集合O’(ex)的平均影响力,

其中,为类型为ex的实例oi在类型为ey的实例集合O’(ey)影响下的网络核密度值,

为区域上所有类型为ex的实例集合的子集,

n(O’(ex))为实例集合O’(ex)中的实例个数,

n(ex)为区域内所有类型为ex的实例数量。

其中,所述流行的同位模式获取模块404,具体用于根据

计算给定的候选模式的流行度,

其中,PICP为给定的候选模式的流行度,取值范围为(0,1],

Tins_netCP为由候选模式CP的团实例构成的实例表,该实例表是将所述二阶实例邻近关系表Tins_net2中涉及到CP中类型的非重复实例对通过团实例连接得到的,

min(.)用来求算输入集合的最小值,

用来求算类型为ex的实例在实例表Tins_netCP上的投影,

为实例集合对实例集合的平均影响力;

当针对一候选同位模式计算得到的流行度大于设定的流行度阈值时,确定所述此候选模式为流行的同位模式。

本发明提出一种考虑城市道路网络约束的同位模式发现方法,在传统同位模式发现方法的基础上做了两个扩展:

(1)基于城市空间设施点的相互联系发生于网络路径距离而非欧式距离的事实,将空间核函数的方法置于网络结构中,用考虑了城市道路通行能力、方向等属性信息的特定服务时间内的可达性指标,取代传统的二维欧式距离来度量空间设施之间的邻近程度。

(2)改造传统的判断模式有趣程度的流行指数,将原始的单纯通过实例连接数计算的指标,加入可达距离权重这一调节参数。本发明相比该领域现有的其他方法,尊重了“人们的移动主要依赖于城市中的道路网络”的事实和“地理学第一定律”,因此提高了同位模式挖掘在城市设施数据上的准确度,而且更具现实意义和实用价值。

上面描述的内容可以单独地或者以各种方式组合起来实施,而这些变型方式都在本发明的保护范围之内。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现,相应地,上述实施例中的各装置/单元可以采用硬件的形式实现,也可以采用软件功能装置的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案而非限制,仅仅参照较佳实施例对本发明进行了详细说明。本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1