基于移动行为的用户稳定点发现方法和系统的制作方法

文档序号:7941146阅读:205来源:国知局
专利名称:基于移动行为的用户稳定点发现方法和系统的制作方法
技术领域
本发明涉及通信领域中业务支撑的技术,具体地,涉及基于移动行为的用户稳定点发现方法及系统。
背景技术
随着移动通信设备的普及,移动网络中基于位置信息的服务(LBS,LocationBased Service)越来越成为热点。移动用户的位置信息可描述用户移动轨迹,结合用户身份更容易契合实际消费和需求模式,其巨大的市场规模和良好的应用前景正成为全球各大运营商和科研机构关注的焦点。从移动运营商的角度,分析用户群体的时空行为信息,可以得到更为准确细致的人群分布以及行为习惯模式,从而提供更为贴心及时的个性化服务。因此,基于移动行为的数据挖掘、关系识别、精准营销等都是具有战略意义的课题。其中,如何根据用户的移动行为发现其稳定点分布既是分析基础也是提升性能的优化方向。用户稳定点指人群在日常移动行为中,停留时间较长并具有明显时间规律的位置点,典型的稳定点包括居住地(O,origin)和工作地(D, destination),以下将居住地和工作地简称为0D。移动运营商积累了海量的用户移动行为数据,但基于这些大规模时空数据开展的研究和支撑应用还不深入,成果还不够丰富。研究不同类型的移动用户在时间和空间上的行为规律,可以挖掘出其时空的稳定点,并结合用户属性和通信记录深入剖析其个性或群体特征,这对移动增值服务应用十分有价值。在现有技术中,面向移动领域的用户稳定点发现方法尚未成型,多是面向特定领域的OD识别策略和方法,未考虑利用移动通信行为特征和大规模时空数据处理机制,难以在移动领域直接复用。

经归纳整理,与本发明相关的现有技术方案主要包含以下几种1、交通调查方式获取用户稳定点。该方案主要通过周期性的大范围交通问卷或者上门调查(2-5年为一周期)的方式获取用户的信息,包括工作地、居住地、常去的地点、出行时间等与用户稳定点密切相关的信息。此外,也有通过在部分区域间的小范围抽样,估计不同区域间的用户移动规律和稳定用户个数来获取用户稳定点的方法,在城市交通规划、建设管理方面应用较为广泛。2、GPS数据获取用户稳定点。该方案主要利用了用户智能手机的GPS定位功能,周期性(I分钟-1小时)记录该手机的位置点信息,形成用户的行为轨迹模式,并从中得到用户的稳定点信息。该方案得到用户的位置信息一般较为精确,但易受手机终端、计算规模和室内空间等限制,普及率低。3、泊点发现朴素算法。该算法引入了用户历史通话数据,先对用户进行过滤,删除通话次数较少的用户,再将通话时段粗略划分为白天与夜晚,分别选取通话次数最多的基站作为泊点,该算法只利用了通话数据的频次特征,对于用户非频繁行为、通话数据稀缺等情况,表达能力不足,不能完全适用移动应用场景。在实现本发明过程中,发明人发现现有技术中至少存在如下问题
1、传统方案成本代价高、实施周期长、采样率低,难以全面覆盖,继而无法同时保证精度和及时性;2、现有方案未考虑充分发挥海量用户移动行为数据的价值,特别是通信数据和位置切换数据的时空特性;3、现有方案多基于特定应用场景进行稳定点分析,缺乏适用于移动领域的通用解决方案。

发明内容
本发明的目的是针对现有技术中用户稳定点的发现方法精度较低的缺陷,提出一种基于移动行为的用户稳定点发现方法及系统。为实现上述目的,根据本发明的一个方面,提供了一种基于移动行为的用户稳定点发现方法。 根据本发明实施例的基于移动行为的用户稳定点发现方法,包括将用户的原始位置切换数据、用户交往通信记录和基站信息进行结构化处理,生成结构化的用户位置切换数据信息;以时间为序将用户位置切换数据信息进行排列,抽取出每位用户的空间移动行为轨迹序列;利用基站摆动对、相同经纬度点合并和/或限制通行能力的策略去除空间移动行为轨迹序列中的异常位置点,合并得到新的空间移动行为轨迹序列;在新的空间移动行为轨迹序列中选择停留时间最长的小区编码,如果用户在已选择的停留时间最长的小区编码所代表的正常位置点停留时间占总停留时间达到预设区间值,则位置点为该用户的稳定点。在上述技术方案中,确定正常位置点为该用户的稳定点的条件还包括用户在异常位置点的停留时间未超过总停留时间的预设比例值。在上述技术方案中,预设区间值为50% -100%。在上述技术方案中,预设比例值为50%。在上述技术方案中,利用基站摆动对的策略去除空间移动行为轨迹序列中的异常位置点的步骤具体包括基于泰森多边形中的基站相邻关系或基站空间距离,确定相互切换的基站摆动对,并对基站摆动对进行合并处理。在上述技术方案中,利用相同经纬度点合并的策略去除空间移动行为轨迹序列中的异常位置点的步骤具体包括判断新的空间移动行为轨迹序列中不同的小区编码是否对应相同的经纬度,将经纬度相同的小区编码定义为新的小区编码,再将连续两个位置点为相同的新的小区编码进行合并处理。在上述技术方案中,利用限制通行能力的策略去除空间移动行为轨迹序列中的异常位置点的步骤具体包括空间移动行为轨迹序列中的用户在进入第一位置点一段时间后进入第二位置点,如果第一位置点与第二位置点之间的距离大于设定的异常距离值,则将第二位置点设定为异常位置点。在上述技术方案中,在在合并得到新的空间移动行为轨迹序列的步骤与选择停留时间最长的小区编码的步骤之间还包括增强通话频率高且通话次数下限高的基站频繁度,得到周期性显著的基站区域并在空间移动行为轨迹序列中进行标记,并得到优化后的具有时空特性的空间移动行为轨迹序列。为实现上述目的,根据本发明的另一个方面,提供了一种基于移动行为的用户稳定点发现系统。根据本发明实施例的基于移动行为的用户稳定点发现系统,包括数据清洗转换模块,用于将用户的原始位置切换数据、用户交往通信记录和基站信息进行结构化处理,生成结构化的用户位置切换数据信息;移动行为轨迹提取模块,用于以时间为序将用户位置切换数据信息进行排列,抽取出每位用户的空间移动行为轨迹序列;位置信息融合优化模块,用于利用基站摆动对、相同经纬度点合并和/或限制通行能力的策略去除空间移动行为轨迹序列 中的异常位置点,合并得到新的空间移动行为轨迹序列;稳定点发现模块,用于在新的空间移动行为轨迹序列中选择停留时间最长的小区编码,如果用户在已选择的停留时间最长的小区编码所代表的正常位置点停留时间占总停留时间达到预设区间值,则位置点为该用户的稳定点。在上述技术方案中,在稳定点发现模块中,确定正常位置点为该用户的稳定点的条件还包括用户在异常位置点的停留时间未超过总停留时间的预设比例值。在上述技术方案中,在稳定点发现模块中,预设区间值为50% -100%。在上述技术方案中,在稳定点发现模块中,预设比例值为50%。在上述技术方案中,位置信息融合优化模块包括摆动对确定合并子模块,用于基于泰森多边形中的基站相邻关系或基站空间距离,确定相互切换的基站摆动对,并对基站摆动对进行合并处理。在上述技术方案中,位置信息融合优化模块包括经纬度合并子模块,用于判断新的空间移动行为轨迹序列中不同的小区编码是否对应相同的经纬度,将经纬度相同的小区编码定义为新的小区编码,再将连续两个位置点为相同的新的小区编码进行合并处理。在上述技术方案中,位置信息融合优化模块包括限制通行能力子模块,用于空间移动行为轨迹序列中的用户在进入第一位置点一段时间后进入第二位置点,如果第一位置点与第二位置点之间的距离大于设定的异常距离值,则将第二位置点设定为异常位置点。在上述技术方案中,位置信息融合优化模块还包括频繁度优化子模块,用于增强通话频率高且通话次数下限高的基站频繁度,得到周期性显著的基站区域并在空间移动行为轨迹序列中进行标记,并得到优化后的具有时空特性的空间移动行为轨迹序列。
本发明的基于移动行为的用户稳定点发现方法和系统,基于具有时空特性的用户移动行为轨迹,充分发挥海量用户移动行为数据(特别是通信数据和位置切换数据)价值,通过用户移动行为轨迹提取和位置信息融合优化策略,突出用户移动行为轨迹数据的时间和空间规律,从而利用时段划分的方式发现用户在不同时间段的稳定点分布,提升识别精度和适用范围。本发明的基于移动行为的用户稳定点发现方法和系统,利用基站摆动对、相同经纬度点合并、限制通行能力以及基站频繁度增强等策略消除通信中非频繁行为和数据稀疏的影响,并去除大规模数据中的异常点和歧义点。本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。


附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中图1为根据本发明实施例的基于移动行为的用户稳定点发现系统的系统架构示意图;图2为根据本发明实施例的时间标签Timestamp的示例截图;图3为根据本发明 实施例涉及基站摆动对的Voronoi图;图4为根据本发明实施例的基于移动行为的用户稳定点发现的方法流程图;图5为根据本发明实施例的基于移动行为的用户稳定点发现系统的结构示意图。
具体实施例方式以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。本发明提出了一种基于移动行为的用户稳定点发现方法和系统,其系统架构如图1所示,该系统逻辑上分为数据层、处理层和挖掘层,具体包括1、数据层a)用户位置切换数据以CELL为粒度记录用户在不同位置之间的切换,可从移动A接口网络信令侧采集,只要用户的手机处于开机状态,位置信息就被记录。数据说明如表I所示表I
权利要求
1.一种基于移动行为的用户稳定点发现方法,其特征在于,包括将用户的原始位置切换数据、用户交往通信记录和基站信息进行结构化处理,生成结构化的用户位置切换数据信息;以时间为序将所述用户位置切换数据信息进行排列,抽取出每位用户的空间移动行为轨迹序列;利用基站摆动对、相同经纬度点合并和/或限制通行能力的策略去除所述空间移动行为轨迹序列中的异常位置点,合并得到新的空间移动行为轨迹序列;在所述新的空间移动行为轨迹序列中选择停留时间最长的小区编码,如果所述用户在已选择的停留时间最长的小区编码所代表的正常位置点停留时间占总停留时间达到预设区间值,则所述位置点为该用户的稳定点。
2.根据权利要求1所述的方法,其特征在于,确定所述正常位置点为该用户的稳定点的条件还包括所述用户在异常位置点的停留时间未超过总停留时间的预设比例值。
3.根据权利要求1或2所述的方法,其特征在于,利用基站摆动对的策略去除所述空间移动行为轨迹序列中的异常位置点的步骤具体包括基于泰森多边形中的基站相邻关系或基站空间距尚,确定相互切换的基站摆动对,并对所述基站摆动对进行合并处理。
4.根据权利要求1或2所述的方法,其特征在于,利用相同经纬度点合并的策略去除所述空间移动行为轨迹序列中的异常位置点的步骤具体包括判断新的空间移动行为轨迹序列中不同的小区编码是否对应相同的经纬度,将经纬度相同的小区编码定义为新的小区编码,再将连续两个位置点为相同的所述新的小区编码进行合并处理。
5.根据权利要求1或2所述的方法,其特征在于,利用限制通行能力的策略去除所述空间移动行为轨迹序列中的异常位置点的步骤具体包括所述空间移动行为轨迹序列中的用户在进入第一位置点一段时间后进入第二位置点, 如果第一位置点与第二位置点之间的距离大于设定的异常距离值,则将第二位置点设定为异常位置点。
6.根据权利要求1或2所述的方法,其特征在于,在合并得到新的空间移动行为轨迹序列的步骤与选择停留时间最长的小区编码的步骤之间还包括增强通话频率高且通话次数下限高的基站频繁度,得到周期性显著的基站区域并在空间移动行为轨迹序列中进行标记,并得到优化后的具有时空特性的空间移动行为轨迹序列。
7.一种基于移动行为的用户稳定点发现系统,其特征在于,包括数据清洗转换模块,用于将用户的原始位置切换数据、用户交往通信记录和基站信息进行结构化处理,生成结构化的用户位置切换数据信息;移动行为轨迹提取模块,用于以时间为序将所述用户位置切换数据信息进行排列,抽取出每位用户的空间移动行为轨迹序列;位置信息融合优化模块,用于利用基站摆动对、相同经纬度点合并和/或限制通行能力的策略去除所述空间移动行为轨迹序列中的异常位置点,合并得到新的空间移动行为轨迹序列;稳定点发现模块,用于在所述新的空间移动行为轨迹序列中选择停留时间最长的小区编码,如果所述用户在已选择的停留时间最长的小区编码所代表的正常位置点停留时间占总停留时间达到预设区间值,则所述位置点为该用户的稳定点。
8.根据权利要求7所述的系统,其特征在于,在所述稳定点发现模块中,确定所述正常位置点为该用户的稳定点的条件还包括所述用户在异常位置点的停留时间未超过总停留时间的预设比例值。
9.根据权利要求7或8所述的系统,其特征在于,所述位置信息融合优化模块包括 摆动对确定合并子模块,用于基于泰森多边形中的基站相邻关系或基站空间距离,确定相互切换的基站摆动对,并对所述基站摆动对进行合并处理。
10.根据权利要求7或8所述的系统,其特征在于,所述位置信息融合优化模块包括 经纬度合并子模块,用于判断新的空间移动行为轨迹序列中不同的小区编码是否对应相同的经纬度,将经纬度相同的小区编码定义为新的小区编码,再将连续两个位置点为相同的所述新的小区编码进行合并处理。
11.根据权利要求7或8所述的系统,其特征在于,所述位置信息融合优化模块包括 限制通行能力子模块,用于所述空间移动行为轨迹序列中的用户在进入第一位置点一段时间后进入第二位置点,如果第一位置点与第二位置点之间的距离大于设定的异常距离值,则将第二位置点设定为异常位置点。
12.根据权利要求7或8所述的系统,其特征在于,所述位置信息融合优化模块还包括频繁度优化子模块,用于增强通话频率高且通话次数下限高的基站频繁度,得到周期性显著的基站区域并在空间移动行为轨迹序列中进行标记,并得到优化后的具有时空特性的空间移动行为轨迹序列。
全文摘要
本发明公开了一种基于移动行为的用户稳定点发现方法及系统,其中,该方法包括1)生成结构化的用户位置切换数据信息;2)以时间为序将用户位置切换数据信息进行排列,抽取出每位用户的空间移动行为轨迹序列;3)合并得到新的空间移动行为轨迹序列;4)如果用户在该小区编码所代表的正常位置点停留时间占总停留时间达到预设区间值,则位置点为该用户的稳定点。本发明的基于移动行为的用户稳定点发现方法和系统,突出用户移动行为轨迹数据的时间和空间规律,从而利用时段划分的方式发现用户在不同时间段的稳定点分布,提升识别精度和适用范围。
文档编号H04W4/02GK103052022SQ201110315058
公开日2013年4月17日 申请日期2011年10月17日 优先权日2011年10月17日
发明者吴晶, 胡可云, 陶振武, 颜红燕 申请人:中国移动通信集团公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1