本申请涉及数据分析处理,具体涉及一种基于信令数据的职住地提取方法、装置、电子设备、及计算机程序产品。
背景技术:
1、用户的职住地提取,或职住地分析,即为识别用户的工作地点和居住地点。能准确获取用户的职住地将有助于疫情防控、精准营销、城市规划等各个领域。
2、一些现有的用户职住地提取方法会基于用户的手机信令数据来对固定时间段内每个用户的定位数据进行聚类分析,如此计算量巨大,无法适用于大数据分析,而且在长时间的跨度下,用户可能不只是处于工作状态和居家状态,还可能常去某个兴趣点娱乐,这会造成数据有大量噪音,并且导致较差的聚类结果,使得所提取的用户职住地不够准确。
技术实现思路
1、本申请实施例提供一种基于信令数据的职住地提取方法,用以解决提取用户职住地不够准确的技术问题。
2、第一方面,本申请实施例提供一种基于信令数据的职住地提取方法,包括:
3、基于用户信令数据,划分用户工作时间段和用户居家时间段;
4、根据在所述用户工作时间段内和在所述用户居家时间段内的用户停留点数据及停留点停留时长数据,筛选得到第一工作地和第一居住地;
5、对所述第一工作地和所述第一居住地进行分布检验,得到最终工作地和最终居住地。
6、在一个实施例中,所述基于用户信令数据,划分用户工作时间段和用户居家时间段,包括:
7、基于用户信令数据,预设初始用户工作及居家时间段;
8、通过随机算法为所述初始用户工作及居家时间段新增时间段或删减时间段,得到变化用户工作及居家时间段;
9、根据在所述变化用户工作及居家时间段内的用户停留点数据及停留点停留时长数据,筛选出划分时间点,利用所述划分时间点划分所述变化用户工作及居家时间段,得到最终用户工作时间段和最终用户居家时间段。
10、在一个实施例中,所述根据在所述变化用户工作及居家时间段内的用户停留点数据及停留点停留时长数据,筛选出划分时间点,利用所述划分时间点划分所述变化用户工作及居家时间段,得到最终用户工作时间段和最终用户居家时间段,包括:
11、根据在所述变化用户工作及居家时间段内的用户停留点数据及停留点停留时长数据,筛选出符合第一预设停留条件的若干候选划分时间点;
12、在若干候选划分时间点中,筛选出符合第二预设停留条件的候选划分时间点作为最终划分时间点;
13、利用所述最终划分时间点划分所述变化用户工作及居家时间段,得到最终用户工作时间段和最终用户居家时间段。
14、在一个实施例中,所述第一预设停留条件为停留点停留时长超过一小时;所述第二预设停留条件为停留点停留时长最小。
15、在一个实施例中,所述根据在所述用户工作时间段内和在所述用户居家时间段内的用户停留点数据及停留点停留时长数据,筛选得到第一工作地和第一居住地,包括:
16、根据用户一天在所述用户工作时间段内和在所述用户居家时间段内的用户停留点数据及停留点停留时长数据,筛选出用户一天分别在所述用户工作时间段内和所述所述用户居家时间段内符合第三预设停留条件的若干工作停留点和若干居家停留点;
17、合并用户多天在所述用户工作时间段内和在所述用户居家时间段内的若干所述工作停留点和若干所述居家停留点,得到若干合并工作停留点和若干合并居家停留点;
18、根据若干所述合并工作停留点和若干所述合并居家停留点的停留点停留时长数据和停留次数数据,筛选得到所述第一工作地和所述第一居住地。
19、在一个实施例中,所述根据若干所述合并工作停留点和若干所述合并居家停留点的停留点停留时长数据和停留次数数据,筛选得到所述第一工作地和所述第一居住地,具体为:
20、分别对若干所述合并工作停留点和若干所述合并居家停留点的停留点停留时长值和停留次数进行加权求和评分,根据评分结果筛选得到所述第一工作地和所述第一居住地。
21、在一个实施例中,所述对所述第一工作地和所述第一居住地进行分布检验,得到最终工作地和最终居住地,包括:
22、根据若干所述合并工作停留点和若干所述合并居家停留点的评分结果,得到若干所述合并工作停留点之间和若干所述合并居家停留点之间的评分差异值;
23、当若干所述合并工作停留点之间的评分差异值和若干所述合并居家停留点之间的评分差异值均大于预设阈值时,将若干所述合并工作停留点的评分结果中最高的一个作为所述第一工作地,且将若干所述合并居家停留点的评分结果中最高的一个作为所述第一居住地;
24、当若干所述合并工作停留点之间的评分差异值和若干所述合并居家停留点之间的评分差异值中的至少一个小于或等于预设阈值时,将若干所述合并工作停留点和/或若干所述合并居家停留点对应的用户标记为异常用户。
25、第二方面,本申请实施例提供一种一种基于信令数据的职住地提取装置,包括:
26、时间段划分模块,用于:基于用户信令数据,划分用户工作时间段和用户居家时间段;
27、第一工作地和第一居住地筛选模块,用于:根据在所述用户工作时间段内和在所述用户居家时间段内的用户停留点数据及停留点停留时长数据,筛选得到第一工作地和第一居住地;
28、最终工作地和最终居住地得到模块,用于:对所述第一工作地和所述第一居住地进行分布检验,得到最终工作地和最终居住地。
29、第三方面,本申请实施例提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面所述的基于信令数据的职住地提取方法的步骤。
30、第四方面,本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面所述的基于信令数据的职住地提取方法的步骤。
31、本申请实施例提供的基于信令数据的职住地提取方法及装置,能够对不同的用户分别划分用户工作时间段和用户居家时间段,然后直接根据在用户工作时间段内和在用户居家时间段内的用户停留点数据及停留点停留时长数据,先筛选得到第一工作地和第一居住地,然后再对第一工作地和第一居住地进行分布检验,得到最终工作地和最终居住地,使得有效保证了提取用户职住地的准确性,同时降低了数据处理的复杂程度,使得本申请实施例提供的基于信令数据的职住地提取方法及装置能被广泛应用。
1.一种基于信令数据的职住地提取方法,其特征在于,包括:
2.根据权利要求1所述的基于信令数据的职住地提取方法,其特征在于,所述基于用户信令数据,划分用户工作时间段和用户居家时间段,包括:
3.根据权利要求2所述的基于信令数据的职住地提取方法,其特征在于,所述根据在所述变化用户工作及居家时间段内的用户停留点数据及停留点停留时长数据,筛选出划分时间点,利用所述划分时间点划分所述变化用户工作及居家时间段,得到最终用户工作时间段和最终用户居家时间段,包括:
4.根据权利要求3所述的基于信令数据的职住地提取方法,其特征在于,所述第一预设停留条件为停留点停留时长超过一小时;所述第二预设停留条件为停留点停留时长最小。
5.根据权利要求1-4任一项所述的基于信令数据的职住地提取方法,其特征在于,所述根据在所述用户工作时间段内和在所述用户居家时间段内的用户停留点数据及停留点停留时长数据,筛选得到第一工作地和第一居住地,包括:
6.根据权利要求5所述的基于信令数据的职住地提取方法,其特征在于,所述根据若干所述合并工作停留点和若干所述合并居家停留点的停留点停留时长数据和停留次数数据,筛选得到所述第一工作地和所述第一居住地,具体为:
7.根据权利要求6所述的基于信令数据的职住地提取方法,其特征在于,所述对所述第一工作地和所述第一居住地进行分布检验,得到最终工作地和最终居住地,包括:
8.一种基于信令数据的职住地提取装置,其特征在于,包括:
9.一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的基于信令数据的职住地提取方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的基于信令数据的职住地提取方法的步骤。