基于信令数据的空心村识别方法、装置、设备及存储介质与流程

文档序号:31851778发布日期:2022-10-19 01:22阅读:99来源:国知局
基于信令数据的空心村识别方法、装置、设备及存储介质与流程

1.本发明涉及大数据处理技术领域,具体而言,涉及一种基于信令数据的空心村识别方法、装置、设备及存储介质。


背景技术:

2.随着工业化、城镇化的发展,“空心村”问题日益突出,外围建设繁华,村内冷清和大量闲置的聚落现象,被称之为“空心村”。农村“空心村”的存在很大程度上浪费了有限的土地资源,影响了农村居民生活环境质量的提高,也影响了农村经济的发展,因此如何有效识别“空心村”也是一个重要的研究方向。
3.现有的“空心村”的识别方法主要是通过传统的统计调查手段、电力数据等方式识别。但是,现有的识别方法存在时效性差且操作繁琐、耗费人力物力,针对季节性空心化的问题,存在识别缺陷。


技术实现要素:

4.本发明的目的之一在于提供一种基于信令数据的空心村识别方法、装置、设备及存储介质,用以提高空心村识别效率和准确性。
5.本发明的实施例可以这样实现:第一方面,本发明提供一种基于信令数据的空心村识别方法,所述方法包括:确定多个时间周期,并在每个时间周期内,获取多个目标用户在第一目标时间段内所属目标区域的第一信令数据集、在第二目标时间段内的第二信令数据集;所述第二目标时间段与目标法定节日的假期天数匹配;根据每个所述时间周期对应的所述第一信令数据集和所述第二信令数据集,确定每个所述时间周期内,位于待识别村的位置区域内的居住地和停留地;其中,所述待识别村位于所述目标区域内;基于所述居住地和所述停留地的数量比例,确定每个所述时间周期对应的所述待识别村为空心村的概率;若全部所述概率的平均值小于预设阈值,则确定所述待识别村为空心村。
6.第二方面,本发明提供一种基于信令数据的空心村识别装置,包括: 获取模块,用于:确定多个时间周期,并在每个时间周期内,获取多个目标用户在第一目标时间段内所属目标区域的第一信令数据集、在第二目标时间段内的第二信令数据集;所述第二目标时间段与目标法定节日的假期天数匹配;确定模块,用于:根据每个所述时间周期对应的所述第一信令数据集和所述第二信令数据集,确定每个所述时间周期内,位于待识别村的位置区域内的居住地和停留地;其中,所述待识别村位于所述目标区域内;所述确定模块,还用于基于所述居住地和所述停留地的数量比例,确定每个所述时间周期对应的所述待识别村为空心村的概率;识别模块,用于若全部所述概率的平均值小于预设阈值,则确定所述待识别村为空心村。
7.第三方面,本发明提供一种设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现第一
方面所述的方法。
8.第四方面,本发明提供一种存储介质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,所述计算机可执行指令促使处理器实现第一方面所述的方法。
9.本发明提供的一种基于信令数据的空心村识别方法、装置、设备及存储介质,首先获得每个时间周期内的所属目标区域内的第一信令数据集和第二信令数据集,第一信令数据集是目标用户在第一时间段内的产生的,第二信令数据是目标用户在目标法定节假日内产生的,然后针对每个时间周期,确定位于待识别村位置区域内的居住地和停留地,并基于居住地和停留地的数量比例,得到每个时间周期内,待识别村为空心村的概率,最后基于全部时间周期的这些概率的平均值与预设阈值的比较结果,得到待识别村的识别结果,可以看出,在上述方法中,利用了不同时间段内产生的信令数据来确定目标用户的居住地和停留地,得到待识别村为空心村的概率,最终通过与预设阈值比较,得到识别结果,识别效率快,并通过多个事件周期的观察,可以避免单次识别结果可能存在的偏差,保证识别结果的准确率,整个过程利用了法定节假日内的信令数据,以及非法定节假日的时间段内的信令数据,使得识别结果能够反映季节性空心的实际现象。
附图说明
10.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
11.图1为本发明实施例提供的设备的结构示意图;图2为本发明实施例提供的基于信令数据的空心村识别方法的示意性流程图;图3为本发明实施例提供的步骤s202的示意性流程图;图4为本发明实施例提供的基于信令数据的空心村识别方法的另一种示意性流程图;图5为本发明实施例提供的步骤s205的示意性流程图;图6为本发明实施例提供的基于信令数据的空心村识别装置的功能模块图。
具体实施方式
12.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
13.因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
14.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一
个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
15.在本发明的描述中,需要说明的是,若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
16.此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
17.需要说明的是,在不冲突的情况下,本发明的实施例中的特征可以相互结合。
18.在城镇建设的过程中,外围建设繁华,村内冷清和大量闲置的聚落现象,被称之为“空心村”,随着工业化、城镇化的发展,“空心村”问题日益突出,如何及时的识别出空心村,对城镇建设、土地资源管理而言尤为重要。
19.当前空心村识别的方案,存在两种方案,一种是通过传统的统计调查手段,另一种是通过电力数据进行测算,上述两种方案均存在移动的缺陷。
20.对第一种方案,在实际运用中,通常有以下明显不足:1)虽然人口普查的准确性最高,但是由于普查间隔时间久,全量普查的更新频率低,在城镇化快速发展的背景下,显然无法满足城市日常管理、设施配置的需求。
21.2) 人口变动调查的样本则更少,抽样调查的抽样率低,显然影响了数据的可用性。
22.3)被调查对象的配合度不可控所带来的误差。对抽样调查和变动调查而言,均需要被调查者的充分配合,才能获取比较准确的数据,而近些年来,随着用户对个人隐私的重视程度提升,其本身的配合度也存在一定的未知,这些显然会放大调查结果的可信度。
23.对第二种方案,则存在如下的问题:无法与人口数据直接对应起来,当前的电表数据以户来计算,即便存在多人外出务工的情况,对户而言,仍然不属于空心化,这在季节性空心化(即行政村的空心化现象呈现季节性变化)问题的反映上,存在明显缺陷。
24.也就是说,现有的“空心村”的识别方法存在时效性差且操作繁琐、耗费人力物力,针对季节性空心化的问题,存在识别缺陷。
25.为了解决上述问题,本发明实施例提供的一种基于信令数据的空心村识别方法,能够快速的识别监测各个行政村空心化的情况,尤其针对季节性空心化问题,能够准确有效的识别。
26.首先,本发明实施例将提供一种设备,该设备可以用来执行本发明实施例提供的基于信令数据的空心村识别方法,该设备具体可以是终端或服务器,终端具体可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群。
27.请参见图1,图1为本发明实施例提供的设备的结构示意图,如图1所示,设备100包括存储器101、处理器102和通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
28.存储器101可用于存储软件程序及模块,如本发明实施例提供的基于信令数据的空心村识别装置300的指令/模块,可以软件或固件(firmware)的形式存储于存储器101中
或固化在设备100的操作系统(operating system,os)中,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
29.其中,存储器101可以是但不限于,随机存取存储器(random access memory,ram),只读存储器(read only memory,rom),可编程只读存储器(programmable read-onlymemory,prom),可擦除只读存储器(erasable programmable read-only memory,eprom),电可擦除只读存储器(electric erasable programmable read-only memory,eeprom)等。
30.处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digital signal processing,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
31.可以理解,图1所示的结构仅为示意,设备100还可以包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1所示的各组件可以采用硬件、软件或其组合实现。
32.请参见图2,图2为本发明实施例提供的基于信令数据的空心村识别方法的示意性流程图,该方法包括:s200:确定多个时间周期,并在每个时间周期内,获取目标区域内多个目标用户在第一目标时间段内的第一信令数据集、在第二目标时间段内的第二信令数据集;第二目标时间段与目标法定节日的假期天数匹配;s202:根据每个时间周期对应的第一信令数据集和第二信令数据集,确定每个时间周期内,位于待识别村的位置区域内的居住地和停留地;其中,待识别村位于目标区域内;s204:基于居住地和停留地的数量比例,确定每个时间周期对应的待识别村为空心村的概率;s206:若全部概率的平均值小于预设阈值,则确定待识别村为空心村。
33.在上述方法中,首先获得每个时间周期内的所属目标区域内的第一信令数据集和第二信令数据集,第一信令数据集是目标用户在第一时间段内的产生的,第二信令数据是目标用户在目标法定节假日内产生的,然后针对每个时间周期,确定位于待识别村位置区域内的居住地和停留地,并基于每个时间周期内,位于待识别村的位置区域内的居住地和停留地的数量比例,得到每个时间周期内,待识别村为空心村的概率,最后基于全部时间周期的这些概率的平均值与预设阈值的比较结果,得到待识别村的识别结果,可以看出,在上述方法中,利用了不同时间段内产生的信令数据来确定目标用户的居住地和停留地,得到待识别村为空心村的概率,最终通过与预设阈值比较,得到识别结果,识别效率快,并通过多个事件周期的观察,可以避免单次识别结果可能存在的偏差,保证识别结果的准确率,整个过程利用了法定节假日内的信令数据,以及非法定节假日的时间段内的信令数据,使得识别结果能够反映季节性空心的实际现象。
34.下面将结合附图3至附图5对上述步骤s200至步骤s206进行详细介绍。
35.在步骤s200中、确定多个时间周期,并在每个时间周期内,获取目标区域内多个目标用户在第一目标时间段内的第一信令数据集、在第二目标时间段内的第二信令数据集;第二目标时间段与目标法定节日的假期天数匹配。
36.本实施例中,考虑到单次识别结果可能存在的偏差,因此可以观测多个时间周期的识别结果,融合每个时间周期的识别结果,得到与待识别村实际空心化情况的结果。本实施例可以设置至少三个时间周期,每个时间周期的时间间隔为一年,例如,假设第一目标时间段为2022年7月,那么三个时间周期可以按照2022年往前推,即2021年和2020年,那么就有2020年至2022年这三个时间周期。
37.本实施例中,在每个时间周期内,提取目标用户在第一目标时间段内产生的所属目标区域的第一信令数据集,目标区域的可以是某个城市,假设用户想了解成都市内某个行政村的空心化情况,则可以将目标区域设置为成都,第一信令数据集用来识别目标用户在目标区域内的居住地。
38.其中,第一目标时间段为该时间周期内任意一个月份,优选的,考虑到不同月份不同地区可能会因为农务活动(例如秋收、播种)等,因此,在确定第一目标时间段时,可以选择代表用户平时状态的月份,以及不存在本实施例中目标法定节假日的月份,这样一来,通过第一信令数据集识别出来的居住地与实际居住地比较符合。
39.每个目标时间周期内,目标用户在第二目标时间段的产生的全部信令数据组成该第二信令数据集,也就是说,第二信令数据是每个目标用户所属各个位置区域的信令数据,第二信令数据集用来识别目标用户的停留地,由于是采用目标法定节假日内的信令数据进行识别,得到的停留地有可能是目标用户的户籍所在地。
40.在本实施例中,第二目标时间段与目标法定节假日假期天数匹配,目标法定节假日指得是可能促使用户返回户籍所在地进行节日活动的法定节假日,例如,春节、清明节、端午节。假设目标法定节假日为春节,那么以除夕当天为界,将除夕前2天以及除夕后2天,共计5天,作为第二目标时间段。
41.在可选的实施方式中,春节、清明节、端午节均可作为本发明实施例中的目标法定节假日,但是不同法定节假日优先级不同,比如,上述三种法定节假期的优先级为:春节》清明节》端午节。本实施例中的优先级可以参照不同节假日的时间顺序来确定,时间越靠前,优先级越高。
42.可以理解的是,本实施例设置多个目标法定节假日,目的是当利用其中一个法定节假日对应的第二信令数据,无法得到待识别村的空心化识别结果,则选择比当前法定节假期优先级低一级的法定节假日继续进行识别,直到符合实际情况的识别结果。
43.本实施例中,目标用户指得是年龄在预设年龄段内的用户,考虑到季节性空心率更多的是描述劳动力人口的外出情况,因此通过引入入网时的年龄信息,限定为年龄在16-60岁(即预设年龄段)的劳动力群体为目标用户。
44.因此在可选的实施方式中,在上述步骤s200之前,还可以执行如下步骤以确定目标用户:a1:获取第一目标时间段所属目标区域的全部信令数据。
45.a2:识别每条信令数据中的用户,并获取用户的年龄信息。
46.a3:基于每条信令数据对应的用户的年龄信息,将年龄信息位于预设年龄段内的用户确定为目标用户。
47.通过上述实施方式,确定出目标用户,基于这些目标用户的信令数据来识别行政村的空心化结果,能够符合实际劳动力人口的外出情况。
48.得到第一信令数据集和第二信令数据集之后,即可执行步骤s202。
49.在步骤s202中、根据每个时间周期对应的第一信令数据集和第二信令数据集,确定每个时间周期内,位于待识别村的位置区域内的居住地和停留地。
50.其中,待识别村位于目标区域内,待识别村可以为一个或多个。
51.本实施例中,第一信令数据集可以识别出目标用户的居住地,第二信令数据集可以识别目标用户在法定节假日期间的停留地,分别筛选落入待识别村位置区域的居住地和停留地,居住地的数量可以看作是第一目标时间段内待识别存的人口规模、停留地的数量可以看作是第二目标时间段内待识别村的人口规模,结合这两个时间段的人口规模之比,进而得到待识别村的季节性空心率情况。
52.在可选的实施方式中,上述步骤s202可以如图3所示,图3为本发明实施例提供的步骤s202的示意性流程图:s202-1:根据每个时间周期对应的第一信令数据集,识别每个目标用户的居住地。
53.本实施例中,第一信令数据集是目标用户在第一目标时间段内所属目标区域的信令数据,由于第一目标时间段的选取原则是代表用户平时状态的时间段,那么通过第一信令数据集识别出来的居住地与实际居住地比较符合。
54.本实施例还给出了具体如何根据第一信令数据集识别目标用户居住地的实施方式,如步骤b1至步骤b4所示:b1:从每个时间周期对应的第一信令数据集中,提取每个目标用户在非工作时间段内的全部第一信令数据。
55.本实施例中,非工作时间段即晚间休息时段,例如20:00到次日凌晨8:00,非工作时间段的时长可以根据实际需求进行设置,为了确保识别出来的居住地的准确性,可以按照目标区域内统一的非工作时间来进行设置。
56.b2:基于目标用户的全部第一信令数据,确定目标用户在第一目标时间段内的全部驻留地、以及每个驻留地对应的驻留天数和驻留时长。
57.本实施例中,可以利用现有的任意一种数据挖掘技术来对目标用户的全部第一信令数据进行驻留位置识别,从而得到每个目标用户在第一目标时间段内的全部驻留地、以及每个驻留地对应的驻留天数和驻留时长,表示如下:其中,表征第i个目标用户对应的居地;ln表征第n个驻留地;表征在第一目标时间段内第i个目标用户在第ln个驻留的驻留时
长和驻留天数;30表征第一目标时间段的总天数。
58.b3:若全部驻留地的驻留天数均小于第一预设天数阈值,则将驻留时长最大的驻留地,作为目标用户的居住地;本实施例中,第一预设天数阈值可以基于第一目标时间段的时长来进行设置,例如,第一目标时间段为一个月,那么第一预设天数阈值可以设置为十天。
59.b4:若存在驻留天数大于或等于第一预设天数阈值的多个驻留地,则将驻留天数最多的驻留地,作为目标用户的居住地。
60.也就是说,在得到每个目标用户对应的全部驻留地、以及每个驻留地对应的驻留天数和驻留时长,先进行驻留天数的判断,存在如下情况:第一种:若全部驻留地的驻留天数均小于第一预设天数阈值,则将驻留时长最长的驻留地,作为居住地。
61.第二种:若仅仅存在一个驻留地的驻留天数大于或等于第一天数阈值,则将这个驻留地作为居住地。
62.第三种:若存在至少两个驻留地的驻留天数大于或等于第一天数阈值,则将这至少两个驻留地中,驻留时长最长的驻留地,作为居住地。
63.通过上述方式即可准确识别出目标用户的居住地。
64.s202-2:根据每个时间周期对应的第二信令数据集,识别每个目标用户的停留地。
65.本实施例中,第二信令数据集是目标用户在目标法定节假日期间产生的信令数据,不限制信令数据产生的地区。由于本实施例选择的是可能指示用户返回户籍所在地的目标法定节假日,因此,通过目标法定节假日期间的第二信令数据可以确定目标用户是否是待识别村的人口,进而可以确定待识别村是否发生人口外出导致季节性空心化的现象。
66.本实施例还给出了具体如何根据第二信令数据集识别目标用户在法定节假日期间的实施方式,如步骤c1至步骤c4所示:c1:从每个时间周期对应的第二信令数据集中,提取每个目标用户的全部第二信令数据。
67.本实施例中,与第一信令数据集不同的是,第二信令数据集并不需要进行非工作时段的筛选,在第二目标时间段内的任意时间内产生的信令数据均需要用来作为识别停留地的数据基础。
68.c2:基于目标用户的全部第二信令数据,确定目标用户在第二目标时间段内的全部驻留地、以及每个驻留地对应的驻留天数和驻留时长。
69.c3:若全部驻留地的驻留天数均小于第二预设天数阈值,则将驻留时长最大的驻留地,作为目标用户的停留地。
70.本实施例中,第二预设天数阈值则是基于第二目标时间段的时长来确定的,例如,假设第二目标时间段为除夕当日以及除夕前后各两天,共五天,那么第二预设天数阈值可以设置为三天,此处不作限定。
71.c4:若存在驻留天数大于或等于第二预设天数阈值的多个驻留地,则将驻留天数最多的驻留地,作为目标用户的停留地。
72.可以理解的是,确定停留地的判断方式与上述确定居住地的判断方式类似,此处不再赘述。
73.s202-3:将全部居住地和全部停留地与位置区域进行比较,确定位于位置区域内的居住地和停留地。
74.本实施例中,获得每个目标用户对应居住地和停留地之后,则可将居住地和停留地与待识别村的位置区域进行比较,筛选出落入待识别村的位置区域内的居住地和停留地,最后将落入待识别村的位置区域内的居住地的数量和停留地的数量之间的比值,作为待识别村为空心村的概率。
75.还需要说明的是,得到待识别村的居住地的数量和停留地的数量,相当于确定了待识别村的人口规模,考虑到春节期间人口太少的地区不作为考虑的行政村单元对象,实测表明部分行政村存在人口过少代表性不足的问题,所以若待识别村的人口规模大于100,则可以直接执行步骤s204;若人口规模不足100,通过夜间灯光数据辅助判断,即采用夜间灯光数据得到的灯光亮度变化,分别计算第一目标时间段以及第二目标时间段待识别村的灯光亮度值,用第一目标时间段灯光亮度值的与第二目标时间段的灯光亮度值的对比,同样作为季节性的空心率结果,为了保证结果的准确性,同样采用多个时间周期的观测平均得到最后的季节性空心率指标,与信令数据采用同样的阈值判断标准,得到待识别村的识别结果。
76.在步骤s204中、基于居住地和停留地的数量比例,确定每个时间周期对应的待识别村为空心村的概率。
77.在本发明实施例中,用居住地的数量除以停留地的数量,得到概率。可以理解的是,由于居住地是基于所属目标区域的第一信令数据识别得到的,停留地是基于目标用户在全国范围内的第二信令数据识别得到的,第一信令数据的数量显然要小于第二信令数据的数量,因此,得到的居住地的数量少于停留地的数量。
78.在步骤s206中、若全部概率的平均值小于预设阈值,则确定待识别村为空心村。
79.本实施例中,预设阈值可以基于实际经验进行设置,例如预设阈值为1.0,若平均值小于1.0,那么待识别村则为空心村,若大于或等于1.0,那么待识别村非空心村。
80.本实施例中,为了避免某个时间周期内存在数据异常,导致得到的概率不准确,因此,在执行步骤s206之前,可以先确定各个时间周期对应的概率是否满足一致性系数,若满足,则表明不存在数据异常的现象,若不满足,则需要对异常的时间周期的概率进行更新。所以可以参见图4,图4为本发明实施例提供的基于信令数据的空心村识别方法的另一种示意性流程图,该方法还可以包括:s205:若全部概率中,最大概率与最小概率的比值大于预设一致性系数,则更新最大概率,直到更新后的最大概率小于更新前的最大概率。
81.本实施例中,若全部概率中,最大概率与最小概率的比值小于或等于预设一致性系数,则可以直接执行步骤s206。反之,则需要先执行s205再执行s206。
82.其中,一致性系数可以根据实际经验进行设置,例如可以是1.2。
83.例如,假设确定了三个时间周期2020年、2021年和2022年各自的概率分别为r
o1
、r
o2
和r
o3
,其中,r
o1
《r
o2
《r
o3
,当r
o3
/ r
o1
》1.2,则需要对2022年对应的r
o3
进行更新,直到2020年、2021年和2022年的三个概率中,最大概率与最小概率的比值小于或等于1.2。
84.下面本实施例还给出了一种更新最大概率的实施方式,请参加图5,图5为本发明实施例提供的步骤s205的示意性流程图:
s205-1:基于更新后的第二信令数据集,确定每个时间周期内待识别村为空心村的新概率;其中,更新后的第二信令数据集是在更新后的第二目标时间段内产生的;更新后的目标时间段是在更新后的目标法定节假日的假期天数的基础上扩展得到的。
85.可以理解的是,当目标法定节假日和第二目标时间段更新后,则可以在每个时间周期内,提取更新后的第二目标时间段内的信令数据,作为每个时间周期对应的更新后的第二信令数据集。
86.例如,假设存在2020年、2021年和2022年三个时间周期,更新后的目标法定节假日为清明节,那么更新后的第二目标时间段内则为清明节假期3天及节前1天以及节后1天,共计5天的时间段,则可以分别在2020年、2021年和2022年各自对应的这5天内提取第二信令数据。
87.可选地,当需要更新最大概率的时候,可以基于预先设置的法定节假日优先级,重新确定出一个目标法定节假期,更新后的第二目标时间段的时长与更新前的第二目标时间段的时长相同,例如清明节或者端午节,同样使用时间累计法,以端午节为例,收集每个时间周期内,端午节假期3天及节前1天以及节后1天,共计5天的信令数据,在完成清洗的基础上,识别出用户在此期间的所有驻留地,针对每个驻留地,计算驻留地天数以及驻留时长,基于上述确定居住地类似的方法,得到每个时间周期内,目标用户在端午节的假期内的停留地,最终结合位于停留地和居住地的数量比例,得到每个时间周期更新后的新概率。
88.例如,假设确定了三个时间周期2020年、2021年和2022年各自的概率分别为r
o1
、r
o2
和r
o3
,其中,r
o1
《r
o2
《r
o3
,当r
o3
/ r
o1
》1.2,则基于上述实施例得到2020年、2021年和2022年各自对应的新概率r’o1
、r’o2
和r’o3
,然后再确定r’o1
、r’o2
和r’o3 中的最大值,假设为r’o3
,比较r’o3 与r
o3 的大小,若r’o3 大于r’o3
则继续执行上述更新过程,若r’o3 小于r’o3
则停止更新,将r’o3 作为新的最大概率。
89.s205-2:确定全部新概率中的最大值是否小于最大概率;若是,则执行s205-3:若否,则返回执行s205-1,直到新概率中的最大值是否小于最大概率。
90.s205-3:将新概率中的最大值作为最大概率。
91.本实施例中,在更新目标法定节假日以及第二目标时间段后,得到的新概率中,最大值小于更新前的最大概率,则计算新概率中的最大值和原先的最小概率的比值,若该比值小于预设一致性系数,则基于更新后的最大概率执行步骤s206,执行过程中,计算新的最大概率以及更新前的其他概率之间的平均值。
92.还可以理解的是,若得到的新概率中的最大值大于更新前的最大概率,那么继续更新目标法定节假日和第二目标时间段,依次获得更新后的第二信令数据集,依此类推,直到新概率中的最大值小于最初的最大概率。
93.通过上述方式对最大概率进行修正,以避免数据异常对识别结果的影响。
94.为了实现上述实施例中的各个步骤以实现相应的技术效果,本发明实施例提供的基于信令数据的空心村识别方法可以在硬件设备或者以软件模块的形式实现中执行,当基于信令数据的空心村识别方法以软件模块的形式实现时,本发明实施例还提供一种基于信令数据的空心村识别装置,请参见图6,图6为本发明实施例提供的基于信令数据的空心村
识别装置的功能模块图,该基于信令数据的空心村识别装置300可以包括:获取模块310,用于确定多个时间周期,并在每个时间周期内,获取目标区域内多个目标用户在第一目标时间段内的第一信令数据集、在第二目标时间段内的第二信令数据集;第二目标时间段与目标法定节日的假期天数匹配;确定模块320,用于根据第一手机信令数据集,识别出多个用户、每个用户在目标时间段内的居住地;获取每个用户在法定节日对应的统计天数内的第二手机信令数据集,并基于第二手机信令数据集和/或用户身份信息,识别每个用户的来源地;识别模块330,用于若每个用户对应的来源地与居住地一致,则确定用户为目标区域的本地人口;若每个用户对应的来源地与居住地不一致,则确定用户为目标区域的非本地人口。
95.可以理解的是,上述获取模块310、确定模块320和识别模块330可以协同的执行图2中的各个步骤以实现相应的技术效果。
96.在可选地实施方式中,该基于信令数据的空心村识别装置300还可以包括更新模块,用于:若全部概率中,最大概率与最小概率的比值大于预设一致性系数,则更新最大概率,直到更新后的最大概率小于更新前的最大概率。
97.在可选地实施方式中,更新模块,具体用于:基于更新后的第二信令数据集,确定每个时间周期内待识别村为空心村的新概率;其中,更新后的第二信令数据集是在更新后的第二目标时间段内产生的;更新后的第二目标时间段是在更新后的目标法定节假日的假期天数的基础上扩展得到的;确定全部新概率中的最大值是否小于最大概率;若是,则将新概率中的最大值作为最大概率;若否,则返回执行基于更新后的目标法定节假日和第二目标时间段,更新第二信令数据集的步骤,直到新概率中的最大值是否小于最大概率。
98.在可选地实施方式中,确定模块320,具体用于执行步骤a1至步骤a3、步骤b1至步骤b4、以及步骤c1至步骤c4以实现相应的技术效果。
99.本发明实施例还提供了一种存储介质,该存储介质存储有计算机可执行指令,该计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述基于信令数据的空心村识别方法,具体实现可参见方法实施例,在此不再赘述。
100.本发明实施例所提供的基于信令数据的空心村识别方法以及装置、的计算机程序产品,包括存储了程序代码的存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。
101.以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1