基于移动用户信令数据的跨城通勤用户识别方法及装置与流程

文档序号:33728265发布日期:2023-04-06 01:52阅读:48来源:国知局
基于移动用户信令数据的跨城通勤用户识别方法及装置

本发明属于信息,具体涉及一种基于移动用户信令数据的跨城通勤用户识别方法及装置。


背景技术:

1、随着城市化和交通工具的发展,以及大城市对周边经济的辐射带动作用,居住地和工作地分属不同地区的现象愈加显著,很多人选择跨城通勤,这带来一定的人口管理难点,例如在流行病控制、公共安全管理、城市交通规划等领域。

2、传统的跨城通勤人口监管可以通过高速路口收费站、火车站、机场等卡口获取,但是面临着数据分散、片面等问题,不能反映全区域的跨城通勤人口情况。移动通信技术的飞速进步为跨城通勤人口监管提供了良好的技术支撑。移动用户的信令业务频繁,包括电话短信业务、上网业务、位置更新业务等等,高频的通信行为产生海量的时空信息数据,可以在一定程度上很好地反映移动用户的行动轨迹。工信部2020年10月的统计数据显示,我国目前移动电话用户有16亿,其中4g用户为12.9亿,移动互联网用户为13.3亿;北京市有移动用户3904.4万,4g用户3212.2万。

3、信令数据中信令类型包括隧道更新、服务请求、切换、位置更新、隧道建立、隧道删除、附着、通话主叫开始、开机、收短信、通话主叫结束、去附着、关机、通话被叫开始、发短信、通话被叫结束、收彩信等。统计结果显示2020年9月北京市移动用户的开机、关机信令数据占信令数据的比例约为0.25%,因此移动用户的手机基本处于开机状态,基于信令数据判断用户是否在市内是合理的。

4、目前基于移动信令数据对通勤行为的研究主要针对城内通勤,对于跨城通勤的人口分析还未开展。此外,现有的通勤分析有采用先特征抽取,再聚类分析的方法,这在处理一个城市百千万人口的信令数据时不可行,因为一般情况下,现有的计算集群难以支撑聚类分析所需的海量运算。


技术实现思路

1、为弥补现有跨城通勤分析的空白,并结合实际情况,本发明实施例提供一种基于移动用户信令数据的跨城通勤用户识别方法及装置,利用工作用户、居住用户数据和移动用户信令数据,识别出满足条件的目标用户,合并为跨城通勤用户,识别结果能够比较客观准确地反映当前城市的跨城通勤用户统计数据。

2、为实现上述目的,本发明采用如下技术方案:

3、一种基于移动用户信令数据的跨城通勤用户识别方法,其步骤包括:

4、1)基于每一周期的白天时间段与夜间时间段,在目标区域的移动用户信令数据中分别提取每一移动用户的该周期白天信令数据与该周期夜间信令数据,从而获取该周期日工作用户与该周期日居住用户;

5、2)依据该周期日工作用户的该周期夜间信令数据与该周期日居住用户的该周期白天信令数据,分别得到该周期夜间信令消失用户与该周期白天信令消失用户;

6、3)利用全部移动用户在设定时间段内成为该周期夜间信令消失用户或该周期白天信令消失用户的次数,得到跨城通勤用户识别结果。

7、进一步地,移动用户信令数据的类型包括:话单数据、电路交换域数据和/或分组交换域数据。

8、进一步地,移动用户信令数据的信息包括:用户名、时间戳和日期。

9、进一步地,分析移动用户信令数据信息的方法包括:分布式计算框架spark。

10、进一步地,通过以下步骤提取每一移动用户的该周期白天信令数据与该周期夜间信令数据:

11、1)在移动用户信令数据中,获取该周期内所有的用户名与信令时间戳字段并去重;

12、2)利对去重后的数据,按用户名进行信令时间戳排序,得到每一移动用户的该周期信令时间戳序列;

13、3)基于不同时间段,在该周期信令时间戳序列中提取该周期白天信令数据与该周期夜间信令数据。

14、进一步地,通过以下步骤得到该周期夜间信令消失用户:

15、1)若一该周期日工作用户的该周期夜间信令数据为空,则记为all类夜间信令消失用户;

16、2)在排除掉all类夜间信令消失用户的该周期日工作用户中,若一该周期日工作用户的该周期夜间信令数据中的第一条信令数据时间戳,晚于夜间时间段起始时间后的m小时,则记为beg类夜间信令消失用户;

17、3)在排除掉all类夜间信令消失用户与beg类夜间信令消失用户的该周期日工作用户中,若一该周期日工作用户的该周期夜间信令数据中的最后一条信令数据时间戳,早于夜间时间段截止时间前的m小时,则记为end类夜间信令消失用户;

18、4)在排除掉掉all类夜间信令消失用户、beg类夜间信令消失用户及end类夜间信令消失用户的该周期日工作用户中,若该周期日工作用户的该周期夜间信令数据中任两条信令数据的时间戳差值大于等于m小时,则记为mid类夜间信令消失用户;

19、5)综合all类夜间信令消失用户、beg类夜间信令消失用户、end类夜间信令消失用户及mid类夜间信令消失用户,得到该周期夜间信令消失用户。

20、进一步地,通过以下步骤得到该周期白天信令消失用户:

21、1)若一该周期日居住用户的该周期白天信令数据为空,则记为all类白天信令消失用户;

22、2)在排除掉all类白天信令消失用户的该周期日居住用户中,若一该周期日居住用户的该周期白天信令数据中的第一条信令数据时间戳,晚于白天时间段起始时间后的n小时,则记为beg类白天信令消失用户;

23、3)在排除掉all类白天信令消失用户与beg类白天信令消失用户的该周期日居住用户中,若一该周期日居住用户的该周期白天信令数据中的最后一条信令数据时间戳,早于白天时间段截止时间前的n小时,则记为end类白天信令消失用户;

24、4)在排除掉掉all类白天信令消失用户、beg类白天信令消失用户及end类白天信令消失用户的该周期日居住用户中,若该周期日居住用户的该周期白天信令数据中任两条信令数据的时间戳差值大于等于n小时,则记为mid类白天信令消失用户;

25、5)综合all类白天信令消失用户、beg类白天信令消失用户、end类白天信令消失用户及mid类白天信令消失用户,得到该周期白天信令消失用户。

26、进一步地,跨城通勤用户识别结果包括:市内工作市外居住月通勤用户和市内居住市外工作月通勤用户。

27、进一步地,通过以下策略得到市内工作市外居住月通勤用户和市内居住市外工作月通勤用户:

28、1)当任一移动用户在设定时间段内被识别为该周期夜间信令消失用户的次数大于阈值,则被认为是市内工作市外居住月通勤用户;

29、2)当任一移动用户在设定时间段内被识别为该周期白天信令消失用户的次数大于阈值,则被认为是市内居住市外工作月通勤用户;

30、一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一所述方法。

31、一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执上述任一所述方法。

32、与现有技术相比,本发明具有以下优势:

33、1、本发明弥补了基于移动用户信令数据识别跨城通勤用户的空白,可用于区域人口监管;

34、2、本发明采用全市人口的信令数据计算识别夜间、白天信令消失用户,结果具有可靠性和实际应用参考价值;

35、3、本发明采用分布式计算框架spark分析处理海量数据,计算过程高效。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1