POI信息处理方法和装置与流程

文档序号:13890358阅读:350来源:国知局

本发明涉及互联网技术领域,特别是涉及一种poi(pointofinterest,兴趣点)信息处理方法和装置。



背景技术:

随着互联网技术的发展,涌现出多种分析用户行为的研究。其中,可以通过用户的活动轨迹对用户行为进行分析。用户的活动轨迹可以根据用户的地理位置信息来确定。在传统的方式中,地理位置信息采用的仅仅是gps(globalpositioningsystem,全球定位系统)信息,信息过于匮乏。由于缺乏相应的环境信息,所以很难对不同区域中的用户活动轨迹进行比较。如何对不同区域中的用户活动轨迹进行比较成为目前需要解决的一个技术问题。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种可以跨区域对用户活动轨迹进行比较的poi信息处理方法和装置。

一种poi信息处理方法,所述方法包括:

获取多个终端所处的位置信息;

将所述位置信息映射到poi空间,在所述poi空间中检索与所述位置信息对应的预设范围内的poi信息;

将所述位置信息标记为终端在poi空间中的轨迹点,利用多个轨迹点生成终端对应的活动轨迹;

利用所述活动轨迹和所述poi信息计算多个终端彼此之间的相似度。

在其中一个实施例中,所述将所述位置信息映射到poi空间,在所述poi空间中检索与所述位置信息对应的预设范围内的poi信息的步骤包括:

根据所述位置信息确定所述终端在电子地图中的定位网格;

获取在所述定位网格预设范围内对应的多个附近网格;

在所述定位网格和所述附近网格中进行兴趣点检索,得到与所述位置信息对应的预设范围内的poi信息。

在其中一个实施例中,在所述利用所述活动轨迹和所述poi信息计算多个终端彼此之间的相似度的步骤之后,还包括:

获取计算多个终端彼此之间相似度的距离函数;

利用多个终端的活动轨迹和距离函数提取多个终端在poi空间中的空间向量。

在其中一个实施例中,在所述根据所述多个终端彼此之间的相似度提取多个终端在poi空间中的空间向量的步骤之后,还包括:

获取预测模型;

将多个终端的空间向量输入所述预测模型;

通过所述预测模型预测多个终端对应的消费倾向。

在其中一个实施例中,在所述利用所述活动轨迹和所述poi信息计算多个终端彼此之间的相似度的步骤之后,还包括:

提取相似度在预设范围内的多个活动轨迹;

将所述相似度在预设范围内的多个活动轨迹记录为相似轨迹;

在所述通过所述预测模型预测多个终端对应的消费倾向的步骤之后,还包括:

根据消费倾向获取对应的推荐信息,将所述推荐信息发送至相似轨迹对应的多个终端。

一种poi信息处理装置,所述装置包括:

获取模块,用于获取多个终端所处的位置信息;

检索模块,用于将所述位置信息映射到poi空间,在所述poi空间中检索与所述位置信息对应的预设范围内的poi信息;

记录模块,用于将所述位置信息标记为终端在poi空间中的轨迹点;

轨迹生成模块,利用多个轨迹点生成终端对应的活动轨迹;

计算模块,用于利用所述活动轨迹和所述poi信息计算多个终端彼此之间的相似度。

在其中一个实施例中,所述检索模块还用于根据所述位置信息确定所述终端在电子地图中的定位网格;获取在所述定位网格预设范围内对应的多个附近网格;在所述定位网格和所述附近网格中进行兴趣点检索,得到与所述位置信息对应的预设范围内的poi信息。

在其中一个实施例中,所述获取模块还用于获取计算多个终端彼此之间相似度的距离函数;

所述装置还包括:

向量提取模块,用于利用多个终端的活动轨迹和距离函数提取多个终端在poi空间中的空间向量。

在其中一个实施例中,所述获取模块还用于获取预测模型;

所述装置还包括:

输入模块,用于将多个终端的空间向量输入所述预测模型;

预测模块,用于通过所述预测模型预测多个终端对应的消费倾向。

在其中一个实施例中,所述获取模块还用于提取相似度在预设范围内的多个活动轨迹;所述记录模块还用于将所述相似度在预设范围内的多个活动轨迹记录为相似轨迹;所述获取模块还用于根据消费倾向获取对应的推荐信息;

所述装置还包括:

发送模块,用于将所述推荐信息发送至相似轨迹对应的多个终端。

上述poi信息处理方法和装置,通过将多个终端所处的位置信息映射到poi空间,在poi空间中检索与位置信息预设范围内的poi信息,将所述位置信息标记为终端在poi空间中的轨迹点,利用多个轨迹点生成终端对应的活动轨迹。由于poi信息能够反映终端所处的环境状况,因此通过根据活动轨迹和所述poi信息计算多个终端彼此之间的相似度,能够实现跨区域对不同用户的活动轨迹进行比较。

附图说明

图1为一个实施例中poi信息处理方法的流程图;

图2为一个实施例中九宫格检索的示意图;

图3为一个实施例中圆圈检索的示意图;

图4为一个实施例中在电子地图中显示poi信息的示意图;

图5为一个实施例中服务器的结构示意图;

图6为一个实施例中poi信息处理装置的结构示意图;

图7为另一个实施例中poi信息处理装置的结构示意图;

图8为再一个实施例中poi信息处理装置的结构示意图;

图9为还一个实施例中poi信息处理装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

在一个实施例中,如图1所示,提供了一种poi信息处理方法,以该方法应用于服务器为例进行说明,具体包括:

步骤102,获取多个终端所处的位置信息。

终端可以具有定位功能,通过该定位功能可以捕获到终端所处地理位置的位置信息。位置信息可以采用经度和纬度来表示。终端将所处的位置信息上传至服务器。多个终端可以同时向服务器上传位置信息,也可以分别在不同的时间向服务器上传位置信息。

步骤104,将位置信息映射到poi空间,在poi空间中检索与位置信息对应的预设范围内的poi信息。

poi空间是指包括poi信息的空间。其中,poi信息包括名称、类别、经度和纬度等。poi空间可以是多个维度,维度可以根据poi信息中的类别来确定。例如,维度包括:金融、教育、餐饮和娱乐等。poi空间也可以视为一个多维空间。不同的poi可以位于不同的建筑物,也可以位于同一建筑物内。服务器可以将多个终端上传的位置信息映射至poi空间中,在poi空间中检索出与位置信息对应的预设范围内的多个维度的poi信息。

在其中一个实施例中,将位置信息映射到poi空间,在poi空间中检索与位置信息对应的预设范围内的poi信息的步骤包括:根据位置信息确定终端在电子地图中的定位网格;获取在定位网格预设范围内对应的多个附近网格;在定位网格和附近网格中进行兴趣点检索,得到与位置信息对应的预设范围内的poi信息。

服务器在电子地图上可以预先划分了多个网格,所划分出的多个网格可以在电子地图上显示,也可以隐藏。网格可以按照预设尺寸进行划分。进一步的,为了提高检索效果,不同地区还可以采用不同的预设尺寸来划分网格。在建筑物密集的地区划分网格采用的尺寸可以小于在建筑物稀疏的地区划分网格所采用的尺寸。例如,在建筑物密集的地区的电子地图上划分网格所采用的尺寸为50米,在建筑物稀疏的地区的电子地图上划分网格所采用的尺寸为200米。

服务器根据终端上传的位置信息确定终端在电子地图中对应的网格,将该网格作为终端在poi空间中的定位网格。服务器获取定位网格预设范围内的多个网格,将这多个网格作为定位网格的附近网格。预设范围的多个网格可以是与定位网格相邻的网格。例如,网格采用正方形,定位网格与相邻的网格组成九宫格。如图2所示,中间黑色网格为定位网格,与黑色网格相邻的网格为附近网格。服务器在进行兴趣点检索时,可以根据定位网格和其相邻网格组成的九宫格进行兴趣点检索。由此得到与位置信息对应的预设范围内多个维度的poi信息。

预设范围的多个网格也可以以定位网格的中心点为圆心,以预设距离为半径得到的圆周范围内的多个网格。例如,网格采用正方形,如图3所示,其中黑色网格为定位网格,与圆周相交以及圆周范围的网格(除定位网格之外的网格)都称为附近网格。服务器进行兴趣点检索时,可以在于圆周相交以及圆周范围的网格进行兴趣点检索。由此得到与位置信息对应的预设范围内多个维度的poi信息。

传统的信息检索方式中,是采用全盘扫描的方式,如果需要检索终端所在位置预设范围内的多个poi信息,需要对终端所在地区的所有兴趣点进行全盘扫描。传统方式中的全盘扫描采用笛卡尔积算法,会导致计算时间过长并且使得计算复杂度过高,对信息检索的效率造成严重影响。本实施例中,在检索poi信息时,不需要进行全盘扫描,通过在定位网格和多个附近网格中进行兴趣点检索,能够快速得到在终端所在位置的预设范围内的多个poi信息,有效提高了检索效率。

不同区域的poi可以是相接近的,例如,深圳的科技园与北京的中关村相比,企业、银行、餐厅、休闲等兴趣点的分布在一定程度上是相接近的。poi信息反映了终端所在位置的环境状况,由此通过poi信息可以对不同区域的用户进行比较和分析。

步骤106,将位置信息标记为终端在poi空间中的轨迹点,利用多个轨迹点生成终端对应的活动轨迹。

服务器保持终端上传的位置信息,并且将位置信息记录为终端在poi空间中的轨迹点。服务器获取多个轨迹点,利用多个轨迹点生成终端在poi空间中的活动轨迹。终端对应的活动轨迹也就是用户的活动轨迹。在生成终端对应的活动轨迹之前,为了避免异常的轨迹点混入至活动轨迹中,服务器获取所有的轨迹点进行聚类分析,将异常的轨迹点作为噪声点进行去噪处理,以此剔除异常的轨迹点。

为了进一步提高对活动轨迹比较的有效性,poi信息中还可以增加时间维度。时间维度对应的时间可以是终端上传位置信息的时间。服务器获取预设时间内的多个轨迹点,利用这些轨迹点来生成在预设时间内终端在poi空间中的活动轨迹。例如,预设时间为上午9:00-10:00。服务器可以在该时间段内对多个终端对应的活动轨迹进行比较。终端可以有一条活动轨迹,也可以有多条活动轨迹。由于时间段相同,服务器能够得到更接近多个的活动轨迹,从而能进一步提高对活动轨迹分析的有效性。

步骤108,利用活动轨迹和poi信息计算多个终端彼此之间的相似度。

服务器获取终端对应的活动轨迹和poi信息,分别计算两两终端之间的轨迹距离。轨迹距离也可以称为终端彼此之间的相似度。服务器可以采用frechet距离算法(一种度量空间距离的算法)或者hausdorff距离算法(一种度量空间距离的算法)等对计算终端与终端之间的轨迹距离。计算终端与终端之间的轨迹距离的距离函数可以如下:

其中,a(α(t))表示a终端在poi空间中的活动轨迹;b(β(t)表示b终端在poi空间中的活动轨迹;α(t)表示a终端在poi空间中的活动轨迹的参数函数;β(t)表示b终端在poi空间中的活动轨迹的参数函数;α(t)与β(t)可以是相同也可以不同;f(a,b)表示求解使得max{d(a(α(t)),b(β(t)))}的最小的值,将该最小值作为a终端与b终端之间的相似度。

服务器采用上述方式可以分别计算多个终端彼此之间的相似度。相似度越高,表示终端之间的轨迹越接近,相似度越低,表示终端之间的轨迹差别越多。轨迹越接近,也就表示用户的活动越接近。由此便于对用户群体进行分类分析。

本实施例中,通过将多个终端所处的位置信息映射到poi空间,在poi空间中检索与位置信息预设范围内的poi信息,将位置信息标记为终端在poi空间中的轨迹点,利用多个轨迹点生成终端对应的活动轨迹。由于poi信息能够反映终端所处的环境状况,因此通过根据活动轨迹和poi信息计算多个终端彼此之间的相似度,能够实现跨区域对不同用户的活动轨迹进行比较。

在一个实施例中,在利用活动轨迹和poi信息计算多个终端彼此之间的相似度的步骤之后,还包括:获取计算多个终端彼此之间相似度的距离函数;利用多个终端的活动轨迹和距离函数提取多个终端在poi空间中的空间向量。

本实施例中,为了进一步对用户行为进行分析,还需要提取出终端在poi空间中的空间向量。由于终端对应的活动轨迹不是等长的,而且活动轨迹中的轨迹点的数量也可能是不同的,在进行用户行为分析时不能直接使用原始的轨迹数据进行计算,而且传统的特征工程方法在提取空间向量时存在人力成本过高、信息损耗较大的问题。

本实施例中,为了能够在海量数据中快速提取出多个终端在poi空间中的空间向量,服务器可以采用多个终端对应的活动轨迹和距离函数对轨迹数据进行压缩,提取出多个终端的空间向量。其中,轨迹数据包括活动轨迹和poi信息。距离函数包括计算多个终端彼此之间相似度的距离函数。例如,服务器可以采用mds(multidimensionalscaling,多维标度分析)-fastmapping(快速映射)算法,利用多个终端的活动轨迹和距离函数对多个终端对应的轨迹数据进行压缩,从而提取出等长的空间向量。由此能够有效减少空间向量提取过程中所耗费的人力成本和时间成本,并且能够确保信息留存率。

进一步的,服务器在提取空间向量之前,还可以对轨迹数据进行降维处理。例如,poi信息包括20个维度,空间向量可以包括10个维度。通过降维处理可以剔除多余信息,进而得到与用户行为分析关系更紧密的信息。

在一个实施例中,在根据多个终端彼此之间的相似度提取多个终端在poi空间中的空间向量的步骤之后,还包括:获取预测模型;将多个终端的空间向量输入预测模型;通过预测模型预测多个终端对应的消费倾向。

本实施例中,服务器在提取到多个终端在poi空间中的空间向量之后,可以利用空间向量对终端对应的消费倾向进行预测。具体的,服务器可以建立一个模型,利用多个终端的空间向量对该模型进行训练,得到预测模型。

服务器可以将终端的空间向量输入预测模型,通过预测模型对空间向量进行计算,得到终端对应的出入频率超过第一预设值的多个poi。服务器将出入频率超过第一预设值的多个poi作为出入频率较高的poi。其中,出入频率可以是指出入在一定时间段内对终端所出入各个的poi的次数。服务器根据出入频率较高的poi来预测终端对应的消费倾向。例如,服务器将a终端的空间向量输入预测模型,根据终端对应的poi信息得到终端出入频率较高的3个poi,分别是金融机构、教育机构和健身场所。那么服务器就可以根据这3个poi来预测该用户的消费倾向为金融理财、教育投入和健身。由此能够在海量用户中更加精准得到的目标用户。

除了对单个用户的消费倾向进行预测之外,服务器还可以对多个用户的群体消费倾向进行预测。服务器可以将多个终端的空间向量输入预测模型,通过预测模型对多个空间向量进行类聚,得到多个终端出入量超过第二预设值的多个poi。服务器根据出入量超过第二预设值的多个poi来预测群体消费倾向。例如,服务器将10万个终端的空间向量输入预测模型,得到出入量排名前3位的poi,分别为餐厅、金融机构和医疗机构。由此可以预测群体消费倾向为美食、金融理财和医疗。进而可以有助于开发与消费倾向相关联的业务和产品。

在一个实施例中,在利用活动轨迹和poi信息计算多个终端彼此之间的相似度的步骤之后,还包括:提取相似度在预设范围内的多个活动轨迹;将相似度在预设范围内的多个活动轨迹记录为相似轨迹;在通过预测模型预测多个终端对应的消费倾向的步骤之后,还包括:根据消费倾向获取对应的推荐信息,将推荐信息发送至相似轨迹对应的多个终端。

本实施例中,活动轨迹的相似度越高,表示用户行为的相似度越高。服务器可以提取相似度在预设范围内的多个活动轨迹,将相似度在预设范围内的多个活动轨迹记录为相似轨迹。服务器可以采用上述实施例中提供的方法对用户的消费倾向进行预测。由于相似轨迹对应的多个终端出入的poi相似,由此不需要对相似轨迹的多个终端逐一预测其消费倾向,可以只预测其中一个终端对应的消费倾向即可了解具有相似轨迹的多个终端对应的消费倾向,有效提高了多个终端消费倾向的预测效率。由于消费倾向是根据终端出入的poi来进行预测的,不受地理位置的限制,因此可以对不同区域的具有相似轨迹的多个终端进行预测。服务器可以获取与消费倾向对应的推荐信息,将推荐信息发送至相似轨迹对应的多个终端。从而方便快捷的向多个终端发送推荐消息,进而使得相似度接近的多个用户能够了解到相关的推荐信息。

在一个实施例中,终端上安装了应用程序,通过运行该应用程序,终端可以展示电子地图。终端可以通过应用程序访问服务器,并且通过应用程序将位置信息上传至服务器。服务器获取终端的位置信息,在电子地图中确定终端的所在位置。通过应用程序可以在电子地图中展示终端所在地理位置。将位置信息映射到poi空间,在poi空间中检索与位置信息对应的预设范围内的poi信息。服务器将检索到的预设范围内的poi信息返回至终端,显示在电子地图上。

如果同一个网格内存在多个相同类型的场所,可以在电子地图中标识相同类型的场所数量。如果相同类型的场所中不同的网格内,可以电子地图中分别标识出该场所。如果在电子地图上没有标识场所数量,可以认为场所数量为1,也可以在电子地图下方用文字标识出场所数量。服务器将添加场所信息的电子地图返回至终端。终端接收添加场所信息的电子地图,并进行展示。如图4所示,为终端中展示的添加场所信息的电子地图。在终端附近的场所包括1家加油站、4家餐厅和1家医院。

传统的方式中,在电子地图的展示页面中可以有多个控件,其中包括查询附近环境的控件,例如,该控件为“附近”。点击“附近”后终端会展示兴趣点的分类页面,如果用户想要通过终端导航至某个兴趣点,需要手动选择兴趣点类型,才可以了解兴趣点的信息。这个过程中需要用户多次手动操作,操作不够简便灵活。而本实施例中,只需获得终端的位置信息即可检索到附近的多个poi信息,不需要用户多次手动操作,即可了解附近兴趣点信息,给用户带来了方便。当用户可以选择所需的兴趣点时,终端可以根据poi信息快速进行导航。

在一个实施例中,如图5所示,提供了一种服务器500,包括通过系统总线连接的处理器501、内存储器502、非易失性存储介质503和网络接口504。其中,该服务器的非易失性存储介质503中存储有操作系统5031和poi信息处理装置5032,poi信息处理装置5032用于实现不需要用户多次手动操作即可方便快捷的获取到附近的多个场所信息。服务器500的处理器501用于提供计算和控制能力,被配置为执行一种poi信息处理方法。服务器500的内存储器502为非易失性存储介质中的poi信息处理装置5032的运行提供环境,内存储器502中可储存有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种poi信息处理方法。服务器500的网络接口504用于据以与外部的终端通过网络连接通信,比如获取终端的位置信息以及向终端发送添加多个场所信息的电子地图等。服务器500可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的服务器的限定,具体的服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,如图6所示,提供了一种poi信息处理装置,其特征在于,装置包括:获取模块602、检索模块604、记录模块606、轨迹生成模块608和计算模块610,其中:

获取模块602,用于获取多个终端所处的位置信息。

检索模块604,用于将位置信息映射到poi空间,在poi空间中检索与位置信息对应的预设范围内的poi信息。

记录模块606,用于将位置信息标记为终端在poi空间中的轨迹点。

轨迹生成模块608,利用多个轨迹点生成终端对应的活动轨迹。

计算模块610,用于利用活动轨迹和poi信息计算多个终端彼此之间的相似度。

在一个实施例中,检索模块604还用于根据位置信息确定终端在电子地图中的定位网格;获取在定位网格预设范围内对应的多个附近网格;在定位网格和附近网格中进行兴趣点检索,得到与位置信息对应的预设范围内的poi信息。

在一个实施例中,获取模块602还用于获取计算多个终端彼此之间相似度的距离函数;如图7所示,该装置还包括:向量提取模块612,用于利用多个终端的活动轨迹和距离函数提取多个终端在poi空间中的空间向量。

在一个实施例中,获取模块602还用于获取预测模型;如图8所示,该装置还包括:输入模块614和预测模块616,其中:

输入模块614,用于将多个终端的空间向量输入预测模型。

预测模块616,用于通过预测模型预测多个终端对应的消费倾向。

在一个实施例中,获取模块602还用于提取相似度在预设范围内的多个活动轨迹;记录模块606还用于将相似度在预设范围内的多个活动轨迹记录为相似轨迹;获取模块602还用于根据消费倾向获取对应的推荐信息;如图9所示,该装置还包括:发送模块618,用于将推荐信息发送至相似轨迹对应的多个终端。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1