一种模式与偏好感知的poi推荐方法及系统的制作方法
【专利摘要】本发明公开了一种模式与偏好感知的POI推荐方法,所述方法包括:通过将GPS数据集中的地理位置信息转换为语义信息,考虑位置流行度与用户熟悉度,对用户的移动行为进行建模,并发现目标用户的潜在好友,从潜在好友的行为模型中,挖掘出候选服务,给候选服务打分,从而为目标用户推荐前k个候选服务。本发明可以实现个性化的POI推荐,解决了实际环境中位置有限性与数据稀疏性问题,同时利用移动轨迹描述方法反映用户的兴趣与偏好,进而提高系统可扩展性,为未来基于位置的社交网络中个性化路线推荐提供有益的解决思路。
【专利说明】
-种模式与偏好感知的PO I推荐方法及系统
技术领域
[0001] 本发明设及网络通信领域,特别设及一种模式与偏好感知的POI推荐方法及系统。
【背景技术】
[0002] 基于位置的社交网络(Xbs化)(例如:Foursquare JacebookPlaceJwitterW 及街 旁等)是利用用户的签到信息,将在线社交网络和物理位置结合起来,W实现虚拟世界中基 于位置的服务资源的共享与传播。近年来,由于大量传感器嵌入的智能移动设备的广泛应 用,使得LBS化获得了空前发展。其中,智能手机无疑成为用户最青睐的设备。用户可W通过 智能手机无处不在地访问互联网,并且使用基于位置的应用,W体验各种各样的网络服务, 例如:多媒体服务、实时新闻、W及交通信息等。经Nokia预测显示,随着移动用户数量的急 剧增加,未来移动数据总量将增加1000倍。根据国际电信联盟(ITU)最近的一封报告显示, 到2020年,将会有大约250亿个可连接的设备。由于数据量的快速增加,第一个关于大数据 的ITU标准已经在2015年被提出来。大量的网络服务被推送到移动用户端,用户可W根据自 己的喜好选择不同的服务。但是,由于服务数量的增加,用户常常收到许多无用的服务信 息,W导致当前状态下用户需要的服务被淹没。因此,未来服务推荐系统所面临的挑战不是 "从任何地点、在任何时刻、向任何人推荐服务",而是"从合适的地点、在合适的时刻、向合 适的用户、推荐合适的服务"。
[0003] POI推荐是伴随着LBSNs出现的一种新的服务推荐类型,与传统的服务推荐不同, POI推荐更关注于向用户推荐个性化的、服务体验质量(QoE)保证的服务。利用上下文信息 (例如:时间、地理位置、社交关系等),P〇I推荐系统可W为用户提供智能的、定制的服务选 项。在该领域中研究主题主要包括:位置预测、用户行为分析、移动模式建模、W及社交关系 检测等。其中,用户行为分析和移动模式建模得到了学术界的广泛关注。
[0004] 在实现本发明的过程中,发明人发现现有技术至少存在W下问题:
[0005] 第一、只考虑地理位置信息不能有效地实现POI推荐,并且在实际环境中常常存在 数据稀疏性问题;第二、现存的POI推荐系统没有考虑用户访问位置的顺序性,针对用户来 说,不同的访问顺序将会产生不同的兴趣与偏好;第S、现存的POI推荐系统不能很好地适 应不同种类的POI分类,因此可扩展性较低。
【发明内容】
[0006] 为了解决服务推荐过程中的位置有限性与数据稀疏性问题,提高系统可扩展性, 并为用户推荐满足其兴趣与偏好的个性化服务,本发明提供了一种模式与偏好感知的POI 推荐方法及系统。所述技术方案如下:
[0007] -种模式与偏好感知的POI推荐方法,所述方法包括:
[000引利用语义轨迹转换方法,将GI^数据集中的地理位置信息转换为语义信息;
[0009] 根据位置流行度与用户熟悉度,对用户的移动行为进行建模;
[0010] 根据用户偏好模型,获取目标用户的潜在好友;
[0011] 根据潜在好友的行为模式,挖掘出候选服务,给候选服务打分,从而为目标用户推 荐前k个POI服务。
[0012] 所述语义轨迹转换根据如下方法获取:
[0013] 对GPS数据集中的原始点进行聚类,得到具有一定驻留行为的停留点;
[0014] 计算每一类型i在一个停留区域中所占的权重;
[0015] 对停留点再进行一次聚类,计算每一个位置以的坐标,然后计算每一类型i在位置 中所占的权重,最后聚类位置的特征向量,得到位置所属的类别。
[0016] 所述用户移动行为建模根据如下方法获取:
[0017] 将用户和位置作为中屯、节点和权威节点,中屯、节点的值表示用户熟悉度,权威节 点的值表示位置流行度,对于每一类型C,计算用户熟悉度Mf C/)和位置流行度王^(只);
[0018] 分别定义和表示用户熟悉度和位置流行度的特征向量,利用迭代的方法, 计算每一类型的用户熟悉度,W及相应类型的位置流行度。
[0019] 所述潜在好友发现根据如下方法获取:
[0020] 定义path为位置轨迹和语义轨迹中长度为1的子序列,W表示用户的活动顺序;
[0021] 利用流行性和时间间隔,计算用户之间的path相似度;
[0022] 考虑地理空间和语义空间所在的比重,计算用户m和U2的相似度,对相似度的值排 序,从而发现目标用户的潜在好友;
[0023] 所述方法还包括:
[0024] 从用户的语义轨迹集合中提取长度为n的子序列;
[0025] 判断该子序列是否在一天内,如果不在一天内,则删除该子序列,重新提取下一个 子序列;
[0026] 判断该子序列是否在移动模式集合内,如果是,则对应子序列的访问次数加1,如 果否,则将其添加至模式集合,并将访问次数加1;
[0027] 当访问次数小于一定阀值时,删除该子序列;
[0028] 根据访问次数的值,对子序列进行排序。
[0029] 所述POI服务推荐根据如下方法获取:
[0030] 基于提取出的移动模式,为目标用户挖掘出具有长度为n的连续子序列;
[0031] 从潜在好友的行为模型中,挖掘出候选服务,并且计算候选服务的得分,然后将候 选服务按照其分数进行排序,最后为目标用户推荐前k个POI服务。
[0032] 所述方法还包括:
[0033] 从目标用户的行为模型中提取目标用户的移动模式;
[0034] 从相似用户集合中提取相似用户的移动模式;
[0035] 按照相似用户的相似度,将相似用户降序排列;
[0036] 判断相似用户的移动模式是否和目标用户的移动模式相同,如果是,则将该相似 用户的移动模式加入到候选服务集合中,如果否,则删除该用户,重新匹配下一个相似用 户;
[0037] 将候选服务按照得分高低进行排序,为目标用户推荐前k个POI服务。
[0038] -种模式与偏好感知的POI推荐系统,所述系统包括语义轨迹转换模块、路径提取 模块、移动模式提取模块、潜在好友发现模块、候选服务挖掘模块W及POI推荐模块,其中,
[0039] 所述语义轨迹转换模块,用于将基于位置的社交网络数据集中的地理位置信息转 换为语义信息;
[0040] 所述路径提取模块,用于提取每一个用户的位置路径和语义路径;
[0041] 所述移动模式提取模块,用于提取每一个用户的移动模式;
[0042] 所述潜在好友发现模块,用于发现目标用户的潜在好友集合;
[0043] 所述候选服务挖掘模块,用于从潜在好友中挖掘适合用户行为模式的候选服务;
[0044] 所述POI推荐模块,用于从候选服务中挑选前k个服务推荐给目标用户。
[0045] 本发明实施例提供的技术方案带来的有益效果是:
[0046] 通过将GPS数据集中的地理位置信息转换为语义信息,考虑位置流行度与用户熟 悉度,对用户的移动行为进行建模,并发现目标用户的潜在好友,从潜在好友的行为模型 中,挖掘出候选服务,给候选服务打分,从而为目标用户推荐前k个候选服务。本发明实施例 提供的方案,可W实现个性化的POI推荐,解决了实际环境中位置有限性与数据稀疏性问 题,同时利用移动轨迹描述方法反映用户的兴趣与偏好,进而提高系统可扩展性,为未来基 于位置的社交网络中个性化路线推荐提供有益的解决思路。
【附图说明】
[0047] 图1是本发明实施例一提供的模式与偏好感知的POI推荐方法原理流程图;
[0048] 图2是本发明实施例一提供的语义转换示意图;
[0049] 图3是本发明实施例一提供的移动模式提取算法示意图。
[0050] 图4是本发明实施例一提供的个性化服务推荐算法示意图。
[0051] 图5是本发明实施例二提供的模式与偏好感知的POI推荐系统结构示意图。
【具体实施方式】
[0052] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方 式作进一步地详细描述。
[0053] 本发明提出了一种模式与偏好感知的POI推荐方法,目的是为用户推荐符合其生 活模式与偏好的个性化服务,有效解决位置有限性与数据稀疏性问题,同时利用移动轨迹 描述方法反映用户的兴趣与偏好,提高系统可扩展性。
[0054] 本发明提供的用户偏好模型,将GPS数据集中的地理位置信息转换为语义信息,并 考虑位置流行度与用户熟悉度,对用户的移动行为进行建模;根据用户偏好模型,获取目标 用户的潜在好友;再根据潜在好友的行为模式,挖掘出候选服务,给候选服务打分,从而为 目标用户推荐前k个候选服务。
[00对实施例一
[0056] 如图1所示,为本发明实施例提供的模式与偏好感知的POI推荐方法原理流程图, 其中,
[0057] 步骤10,利用语义轨迹转换方法,将GPS数据集中的地理位置信息转换为语义信 息。
[0058] 在基于位置的社交网络中,每一个用户都拥有其签到的地理位置信息。利用运些 信息,我们可W预测用户未来的活动位置,并且为用户推荐基于兴趣点(POI)的服务。但是, 由于地理位置的有限性及数据稀疏性,我们不能很好地从原始的地理位置信息中挖掘出相 似的用户。如图2所示,表示的是=个用户生成的=条移动轨迹(A,B,C),左半部分是位置轨 迹,右半部分是相应的语义轨迹。在比较用户相似性时,如果只考虑地理空间上位置轨迹之 间的距离,那么A和B更相似;但是,实际上从语义空间的角度来看,C和B更相似。并且,C和B 之间具有相同的语义轨迹序列"看病^购物^休闲"。因此,用户C可W为用户B推荐该语义 轨迹所对应的位置轨迹序列"医院3^商场3^公园3"。
[0059] 对GI^数据集中的原始点进行聚类,得到具有一定驻留行为的停留点。该聚类方法 可W表示为:
[0060]
公式(I )
[0061] 为了将地理位置信息转换为语义信息,本发明利用TF-IDF思想,每一类型i在一个 停留区域中所占的权重可W被计算为:
[0062]
公卖(2)
[0063]为了唯一标识用户的活动行为,本发明对停留点再进行一次聚类,每一个位置以 的坐标可W被计算为:
[0065]同时,每一类型i的权重值可W被计算为:「00661
[QHAyl 1 公式。)
公乂(4) 公式(5 )
[0068] 从而完成了地理位置信息到语义信息的转换,通过聚类每一个位置的特征向量, 本发明可W得到每一位置所属的种类类别。
[0069] 步骤20,根据位置流行度与用户熟悉度,对用户的移动行为进行建模。
[0070] 为了进一步体现用户对位置的了解程度。在构建用户偏好模型时,本发明将位置 流行度和用户熟悉度考虑在内。
[0071] 基于HITS算法,本发明分别将用户和位置作为中屯、节点和权威节点。中屯、节点的 值表示用户熟悉度,权威节点的值表示位置流行度。对于每一类型C,用户熟悉度W,'00和 公、式(6 ) 位置流行度(/))可W被计算为:[0072]
[0 公式(7) H-
[0074] 其中,M嗦示用户-位置矩阵,表示用户i访问位置j的次数,表示用户i 对每一类型C的熟悉度,/3;)表示每一类型C中位置j的流行度。
[0075] 利用迭代的方法,本发明分别定义if和^表示用户熟悉度和位置流行度的特征 向量,最终的迭代过程可W被计算为:
[0076] 公式(8)
[0077] 公式(9)
[0078] 其中,n表示迭代次数。初始化, 该迭代过程终止。
[0079] 因此,本发明得到了每一类型的用户熟悉度,W及相应类型的位置流行度,从而构 建了用户偏好模型。
[0080] 步骤30,根据用户偏好模型,获取目标用户的潜在好友。
[0081] 利用GPS数据集与POI数据集,本发明可W挖掘出用户的兴趣和偏好。例如,如果一 个人经常去体育馆或健身房,那么他/她很可能喜欢运动。一般情况下,两个用户的移动轨 迹在地理空间和语义空间上的距离越近,他们将拥有更相似的兴趣与偏好。因此,本发明可 W利用包含位置轨迹信息和语义轨迹信息的用户偏好模型来为目标用户发现其潜在的相 似用户。
[0082] 利用IDF值,每一个位置和类型的流行性可W被计算为:
[0083]
公式no)
[0084] 其中,N表示位置的总个数,化表示位置L的个数,nc表示具有类型C的位置的个数。
[0085] 本发明定义path为位置轨迹和语义轨迹中长度为1的子序列,W表示用户的活动 顺序。
[0086] 同时,在计算用户相似性时,本发明将时间间隔考虑在内,运里的时间是每一个 path的开始时间。时间间隔越短,用户相似度越高。
[0087] 利用流行性和时间间隔,用户之间的path相似度可W被计算为:
[008引 公式(11 )
[C 公式(12)
[0090] 其中,1表示path的长度,I ti-t21表示两条path的时间间隔。
[0091] 通过考虑地理空间和语义空间所在的比重,用户Ul和U2的相似度可W被计算为:
[0092]
公式(1.3.)
[0093] 其中,Wl和Wg分别表示位置path和语义path的权重,m表示用户Ui和U2所具有的公 共path的长度。
[0094] 对Sim的值进行排序,本发明可W发现目标用户的潜在好友。
[00M]具体的移动模式提取算法如图3所示,其中,
[0096] 1)提取长度为n的子序列。
[0097] 2)判断子序列是否在一天内,如果不在一天内,则返回步骤1)。
[0098] 3)判断子序列是否在移动模式集合内。
[0099] 4)删除不满足阀值的子序列。
[0100] 5)对子序列排序。
[0101 ]步骤40,根据潜在好友的行为模式,挖掘出候选服务,给候选服务打分,从而为目 标用户推荐前k个POI服务。
[0102] 基于提取出的移动模式,本发明可W为目标用户挖掘出具有长度为n的连续子序 列。
[0103] 从潜在好友的行为模型中,本发明挖掘出候选服务,并且候选服务的得分可W被 计算为:
[01041
公乂(1斗)
[0105] 因此,将Scorep(S)的值排序,本发明可W为目标用户P推荐前k个POI服务。
[0106] 具体的个性化服务推荐算法如图4所示,其中,
[0107] 1)提取目标用户的移动模式。
[0108] 2)提取相似用户的移动模式
[0109] 3)将相似用户按降序排列。
[0110] 4)判断相似用户的移动模式是否和目标用户的移动模式相同,如果否,则返回步 骤3),匹配下一个相似用户。
[0111] 5)将提取出的移动模式加入到候选服务集合中。
[0112] 6)候选服务排序,为目标用户推荐前k个POI服务。
[0113] 实施例二
[0114] 如图5所示,本发明实施例提供了一种模式与偏好感知的POI推荐系统,包括语义 轨迹转换模块100、路径提取模块200、移动模式提取模块300、潜在好友发现模块400、候选 服务挖掘模块500 W及POI推荐模块600,具体如下:
[0115] 语义轨迹转换模块100,用于将基于位置的社交网络数据集中的地理位置信息转 换为语义信息;
[0116] 路径提取模块200,用于提取每一个用户的位置路径和语义路径;
[0117] 移动模式提取模块300,用于提取每一个用户的移动模式;
[0118] 潜在好友发现模块400,用于发现目标用户的潜在好友集合;
[0119] 候选服务挖掘模块500,用于从潜在好友中挖掘适合用户行为模式的候选服务;
[0120] POI推荐模块600,用于从候选服务中挑选前k个服务推荐给目标用户。
[0121] 需要说明的是:上述实施例提供的模式与偏好感知的POI推荐系统在推荐个性化 服务时,仅W上述各功能模块的划分进行举例说明,实际应用中,可W根据需要而将上述功 能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,W完成W上 描述的全部或者部分功能。另外,上述实施例提供的数据传输装置与数据传输方法实施例 属于同一构思,其具体实现过程详见方法实施例,运里不再寶述。
[0122] 上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0123] 综上所述,在本发明实施例中,通过将GI^数据集中的地理位置信息转换为语义信 息,考虑位置流行度与用户熟悉度,对用户的移动行为进行建模,并发现目标用户的潜在好 友,从潜在好友的行为模型中,挖掘出候选服务,给候选服务打分,从而为目标用户推荐前k 个候选服务。本发明实施例提供的方案,可W实现个性化的POI推荐,解决了实际环境中位 置有限性与数据稀疏性问题,同时利用移动轨迹描述方法反映用户的兴趣与偏好,进而提 高系统可扩展性,为未来基于位置的社交网络中个性化路线推荐提供有益的解决思路。
[0124] 本领域普通技术人员可W理解实现上述实施例的全部或部分步骤可W通过硬件 来完成,也可W通过程序来指令相关的硬件完成,所述的程序可W存储于一种计算机可读 存储介质中,上述提到的存储介质可W是只读存储器,磁盘或光盘等。
[0125] W上所述仅为本发明的较佳实施例,并不用W限制本发明,凡在本发明的精神和 原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种模式与偏好感知的POI推荐方法,其特征在于,所述方法包括: 利用语义轨迹转换方法,将GPS数据集中的地理位置信息转换为语义信息; 根据位置流行度与用户熟悉度,对用户的移动行为进行建模; 根据用户偏好模型,获取目标用户的潜在好友; 根据潜在好友的行为模式,挖掘出候选服务,给候选服务打分,从而为目标用户推荐前 k个POI服务。2. 如权利要求1所述的方法,其特征在于,所述语义轨迹转换方法包括: 对GPS数据集中的原始点进行聚类,得到具有一定驻留行为的停留点; 计算每一类型i在一个停留区域中所占的权重; 对停留点再进行一次聚类,计算每一个位置L1的坐标,然后计算每一类型i在位置中所 占的权重,最后聚类位置的特征向量,得到位置所属的类别。3. 如权利要求1所述的方法,其特征在于,所述用户移动行为建模包括: 将用户和位置作为中心节点和权威节点,中心节点的值表示用户熟悉度,权威节点的 值表示位置流行度,对于每一类型C,计算用户熟悉度MfGl和位置流行度/4(/4: 分别定义和表示用户熟悉度和位置流行度的特征向量,利用迭代的方法,计算 每一类型的用户熟悉度,以及相应类型的位置流行度。4. 如权利要求1所述的方法,其特征在于,所述潜在好友发现方法包括: 定义path为位置轨迹和语义轨迹中长度为1的子序列,以表示用户的活动顺序; 利用流行性和时间间隔,计算用户之间的path相似度; 考虑地理空间和语义空间所在的比重,计算用户UjPu2的相似度,对相似度的值排序, 从而发现目标用户的潜在好友。5. 如权利要求4所述的方法,其特征在于,所述方法还包括: 从用户的语义轨迹集合中提取长度为η的子序列; 判断该子序列是否在一天内,如果不在一天内,则删除该子序列,重新提取下一个子序 列; 判断该子序列是否在移动模式集合内,如果是,则对应子序列的访问次数加1,如果 否,则将其添加至模式集合,并将访问次数加1; 当访问次数小于一定阀值时,删除该子序列; 根据访问次数的值,对子序列进行排序。6. 如权利要求1所述的方法,其特征在于,所述POI服务推荐方法,包括: 基于提取出的移动模式,为目标用户挖掘出具有长度为η的连续子序列; 从潜在好友的行为模型中,挖掘出候选服务,并且计算候选服务的得分,然后将候选服 务按照其分数进行排序,最后为目标用户推荐前k个POI服务。7. 如权利要求6所述的方法,其特征在于,所述方法还包括: 从目标用户的行为模型中提取目标用户的移动模式; 从相似用户集合中提取相似用户的移动模式; 按照相似用户的相似度,将相似用户降序排列; 判断相似用户的移动模式是否和目标用户的移动模式相同,如果是,则将该相似用户 的移动模式加入到候选服务集合中,如果否,则删除该用户,重新匹配下一个相似用户; 将候选服务按照得分高低进行排序,为目标用户推荐前k个POI服务。8. -种模式与偏好感知的POI推荐系统,其特征在于,所述系统包括语义轨迹转换模 块、路径提取模块、移动模式提取模块、潜在好友发现模块、候选服务挖掘模块以及POI推荐 模块,其中, 所述语义轨迹转换模块,用于将基于位置的社交网络数据集中的地理位置信息转换为 语义信息; 所述路径提取模块,用于提取每一个用户的位置路径和语义路径; 所述移动模式提取模块,用于提取每一个用户的移动模式; 所述潜在好友发现模块,用于发现目标用户的潜在好友集合; 所述候选服务挖掘模块,用于从潜在好友中挖掘适合用户行为模式的候选服务; 所述POI推荐模块,用于从候选服务中挑选前k个服务推荐给目标用户。
【文档编号】G06F17/30GK106021305SQ201610291350
【公开日】2016年10月12日
【申请日】2016年5月5日
【发明人】许长桥, 关建峰, 朱亮
【申请人】北京邮电大学