【技术领域】
本发明涉及计算机应用技术领域,尤其涉及一种人口吸引力的评估方法及装置、设备及可读介质。
背景技术:
由于各个区域经济发展速度的不同,所能容纳的劳动力的不同,造成各个区域对人口的吸引力便不相同。例如,城市为人口聚集较为密集的一个区域,城市的人口吸引力可以在一定程度上反映该城市的核心竞争力。
城市也叫城市聚落,是以非农业产业和非农业人口集聚形成的较大居民点。城市是人类文明的重要组成部分,城市也是伴随人类文明与进步发展起来的,城市在迅猛发展过程中会表现出对外的吸引力,城市吸引力本质上是对人口的吸引。现有技术中,评估城市人口吸引力的方式,主要通过人工收集gdp、就业、生活质量、薪酬和环境等数据进行评估。类似于对城市的人口吸引力的分析,可以分析各个省、县等区域的人口吸引力,以分析该区域的经济发展以及竞争力等等。
现有技术的各区域的人口吸引力的评估方法,由于需要人工采集的数据较多,运营成本较高;而且统计周期较长,导致人口吸引力的评估效率较低。
技术实现要素:
本发明提供了一种人口吸引力的评估方法及装置、设备及可读介质,用于提高人口吸引力的评估效率。
本发明提供一种人口吸引力的评估方法,所述方法包括:
基于目标区域中的常驻移动设备的数量,获取所述目标区域中预设时间周期内的常驻人口的流入量;
根据参考的多个区域中各所述区域在所述预设时间周期内的常驻人口的流入量,和目标区域中所述预设时间周期内的常驻人口的流入量,评估所述目标区域的人口吸引力指数。
进一步可选地,如上所述的方法中,基于目标区域中的常驻移动设备的数量,获取所述目标区域中预设时间周期内的常驻人口的流入量,具体包括:
基于所述目标区域中所述预设时间周期开始时的常驻移动设备的数量,获取所述目标区域中所述预设时间周期开始时的常驻人口的数量;
基于所述目标区域中所述预设时间周期结束时的常驻移动设备的数量,获取所述目标区域中所述预设时间周期结束时的常驻人口的数量;
根据所述目标区域中所述预设时间周期开始时的常驻人口的数量和所述预设时间周期结束时的常驻人口的数量,获取所述目标区域中所述预设时间周期内的常驻人口的流入量。
进一步可选地,如上所述的方法中,基于所述目标区域中所述预设时间周期开始时的常驻移动设备的数量,获取所述目标区域中所述预设时间周期开始时的常驻人口的数量,具体包括:
根据所述目标区域中所述预设时间周期开始时的常驻移动设备的数量和所述目标区域中常驻移动设备数量与常驻人口数量之间的转化系数,获取所述目标区域中所述预设时间周期开始时的常驻人口的数量;
对应地,基于所述目标区域中所述预设时间周期结束时的常驻移动设备的数量,获取所述目标区域中所述预设时间周期结束时的常驻人口的数量,具体包括:
根据所述目标区域中所述预设时间周期结束时的常驻移动设备的数量和所述目标区域中常驻移动设备数量与常驻人口数量之间的转化系数,获取所述目标区域中所述预设时间周期结束时的常驻人口的数量。
进一步可选地,如上所述的方法中,基于目标区域中的常驻移动设备的数量,获取所述目标区域中预设时间周期内的常驻人口的流入量之前,所述方法还包括:
根据所述目标区域的统计得到的人口数量、所述目标区域在统计时的所述常驻移动设备数量、人均可支配收入以及老龄化比例系数,使用线性回归拟合所述目标区域的常驻移动设备数量与常驻人口数量之间的转化系数。
进一步可选地,如上所述的方法中,根据所述目标区域中所述预设时间周期开始时的常驻移动设备的数量和所述目标区域中常驻移动设备数量与常驻人口数量之间的转化系数,获取所述目标区域中所述预设时间周期开始时的常驻人口的数量之前,所述方法还包括:
根据所述目标区域中的目标应用的所有移动用户的行为日志,统计所述目标区域中各种类型的移动设备的比例关系;
统计所述目标区域中所述预设时间周期开始时第一类型的常驻移动设备的数量;
根据目标区域中所述预设时间周期开始时所述第一类型的常驻移动设备的数量和所述目标区域中各种类型的移动设备的比例关系,获取所述目标区域中所述预设时间周期开始时的常驻移动设备的数量;
对应地,根据所述目标区域中所述预设时间周期结束时的常驻移动设备的数量和所述目标区域中常驻移动设备数量与常驻人口数量之间的转化系数,获取所述目标区域中所述预设时间周期结束时的常驻人口的数量之前,所述方法还包括:
统计所述目标区域中所述预设时间周期结束时所述第一类型的常驻移动设备的数量;
根据目标区域中所述预设时间周期结束时所述第一类型的常驻移动设备的数量和所述目标区域中各种类型的移动设备的比例关系,获取所述目标区域中所述预设时间周期结束时的常驻移动设备的数量。
进一步可选地,如上所述的方法中,统计所述目标区域中所述预设时间周期开始时或者结束时第一类型的常驻移动设备的数量,具体包括:
在所述预设时间周期开始时或者结束时,根据所述目标区域中的各所述第一类型的移动设备的定位日志,在所述目标区域中挖掘多个常驻簇;
根据各所述第一类型的移动设备的定位日志,挖掘对应的所述第一类型的移动设备在各所述常驻簇中的特征信息;
根据各所述第一类型的移动设备在各所述常驻簇中的特征信息和预先训练的随机森林模型,识别各所述第一类型的移动设备的各所述常驻簇的类型;所述类型包括家;
统计所述类型为家的所述常驻簇位于所述目标区域中的所有所述第一类型的移动设备的数量,作为所述目标区域中所述预设时间周期开始时或者结束时第一类型的常驻移动设备的数量。
进一步可选地,如上所述的方法中,根据参考的多个区域中各所述区域在所述预设时间周期内的常驻人口的流入量、所述目标区域中所述预设时间周期内的常驻人口的流入量,评估所述目标区域的人口吸引力指数,具体包括:
根据参考的多个区域中各所述区域在所述预设时间周期内的常驻人口的流入量和所述目标区域中所述预设时间周期内的常驻人口的流入量,计算各所述区域的所述预设时间周期内的平均常驻人口的流入量;
将所述目标区域中所述预设时间周期内的常驻人口的流入量除以各所述区域的所述预设时间周期内的平均常驻人口的流入量,得到所述目标区域的人口吸引力指数。
本发明提供一种人口吸引力的评估装置,所述装置包括:
获取模块,用于基于目标区域中的常驻移动设备的数量,获取所述目标区域中预设时间周期内的常驻人口的流入量;
评估模块,用于根据参考的多个区域中各所述区域在所述预设时间周期内的常驻人口的流入量,和目标区域中所述预设时间周期内的常驻人口的流入量,评估所述目标区域的人口吸引力指数。
进一步可选地,如上所述的装置中,所述获取模块,具体用于:
基于所述目标区域中所述预设时间周期开始时的常驻移动设备的数量,获取所述目标区域中所述预设时间周期开始时的常驻人口的数量;
基于所述目标区域中所述预设时间周期结束时的常驻移动设备的数量,获取所述目标区域中所述预设时间周期结束时的常驻人口的数量;
根据所述目标区域中所述预设时间周期开始时的常驻人口的数量和所述预设时间周期结束时的常驻人口的数量,获取所述目标区域中所述预设时间周期内的常驻人口的流入量。
进一步可选地,如上所述的装置中,所述获取模块,具体用于根据所述目标区域中所述预设时间周期开始时的常驻移动设备的数量和所述目标区域中常驻移动设备数量与常驻人口数量之间的转化系数,获取所述目标区域中所述预设时间周期开始时的常驻人口的数量;
所述获取模块,具体还用于根据所述目标区域中所述预设时间周期结束时的常驻移动设备的数量和所述目标区域中常驻移动设备数量与常驻人口数量之间的转化系数,获取所述目标区域中所述预设时间周期结束时的常驻人口的数量。
进一步可选地,如上所述的装置中,所述装置还包括:
拟合模块,用于根据所述目标区域的统计得到的人口数量、所述目标区域在统计时的所述常驻移动设备数量、人均可支配收入以及老龄化比例系数,使用线性回归拟合所述目标区域的常驻移动设备数量与常驻人口数量之间的转化系数。
进一步可选地,如上所述的装置中,所述装置还包括统计模块;
所述统计模块,用于根据所述目标区域中的目标应用的所有移动用户的行为日志,统计所述目标区域中各种类型的移动设备的比例关系;
所述统计模块,还用于统计所述目标区域中所述预设时间周期开始时第一类型的常驻移动设备的数量;
所述获取模块,还用于根据目标区域中所述预设时间周期开始时所述第一类型的常驻移动设备的数量和所述目标区域中各种类型的移动设备的比例关系,获取所述目标区域中所述预设时间周期开始时的常驻移动设备的数量;
对应地,所述统计模块,还用于统计所述目标区域中所述预设时间周期结束时所述第一类型的常驻移动设备的数量;
所述获取模块,还用于根据目标区域中所述预设时间周期结束时所述第一类型的常驻移动设备的数量和所述目标区域中各种类型的移动设备的比例关系,获取所述目标区域中所述预设时间周期结束时的常驻移动设备的数量。
进一步可选地,如上所述的装置中,所述统计模块,具体用于:
在所述预设时间周期开始时或者结束时,根据所述目标区域中的各所述第一类型的移动设备的定位日志,在所述目标区域中挖掘多个常驻簇;
根据各所述第一类型的移动设备的定位日志,挖掘对应的所述第一类型的移动设备在各所述常驻簇中的特征信息;
根据各所述第一类型的移动设备在各所述常驻簇中的特征信息和预先训练的随机森林模型,识别各所述第一类型的移动设备的各所述常驻簇的类型;所述类型包括家;
统计所述类型为家的所述常驻簇位于所述目标区域中的所有所述第一类型的移动设备的数量,作为所述目标区域中所述预设时间周期开始时或者结束时第一类型的常驻移动设备的数量。
进一步可选地,如上所述的装置中,所述评估模块,具体用于:
根据参考的多个区域中各所述区域在所述预设时间周期内的常驻人口的流入量和所述目标区域中所述预设时间周期内的常驻人口的流入量,计算各所述区域的所述预设时间周期内的平均常驻人口的流入量;
将所述目标区域中所述预设时间周期内的常驻人口的流入量除以各所述区域的所述预设时间周期内的平均常驻人口的流入量,得到所述目标区域的人口吸引力指数。
本发明还提供一种计算机设备,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的人口吸引力的评估方法。
本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的人口吸引力的评估方法。
本发明的人口吸引力的评估方法及装置、设备及可读介质,通过基于目标区域中的常驻移动设备的数量,获取目标区域中预设时间周期内的常驻人口的流入量;根据参考的多个区域中各区域在预设时间周期内的常驻人口的流入量,和目标区域中预设时间周期内的常驻人口的流入量,评估目标区域的人口吸引力指数。本发明的技术方案,可以弥补现有技术的不足,基于目标区域中的常驻移动设备的数量,实现对目标区域的人口吸引力指数的评估。与现有技术相比,本发明的技术方案,不用通过人工采集数据,仅通过一些数据的检测和分析便可以实现人口吸引力指数的评估,运营成本相对较低,而且与人工采集和统计相比,可以大大地节省评估周期,因此,能够有效地提高人口吸引力的评估效率。
【附图说明】
图1为本发明的人口吸引力的评估方法实施例的流程图。
图2为本实施例提供的城市人口流动示意图。
图3为本实施例提供的多个城市的人口吸引力指数的示意图。
图4为本发明的人口吸引力的评估装置实施例一的结构图。
图5为本发明的人口吸引力的评估装置实施例二的结构图。
图6为本发明的计算机设备实施例的结构图。
图7为本发明提供的一种计算机设备的示例图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
图1为本发明的人口吸引力的评估方法实施例的流程图。如图1所示,本实施例的人口吸引力的评估方法,具体可以包括如下步骤:
100、基于目标区域中的常驻移动设备的数量,获取目标区域中预设时间周期内的常驻人口的流入量;
本实施例的人口吸引力的评估方法的执行主体为人口吸引力的评估装置。本实施例的人口吸引力的评估装置可以为一个独立的实体。本实施例的人口吸引力的评估装置主要用于对一定目标区域的人口吸引力进行评估。本实施例的目标区域可以为一个省、一个城市、一个镇等等行政划分的区域;或者还可以采用其他地理参数来划分的区域。也就是说,本实施例的目标区域可以根据实际需求的粒度大小来调整。
与现有技术不同的是,现有技术的人口吸引力的评估主要靠人工采集数据。而由于移动设备如手机是现有的人们随身携带的一个必备设备,一个区域中移动设备的数量在一定程度上可以反映该区域中的人口的数量,据此,本实施例中基于对目标区域中的常驻移动设备的分析来实现人口吸引力的评估。
例如,该步骤100“基于目标区域中的常驻移动设备的数量,获取目标区域中预设时间周期内的常驻人口的流入量”,具体可以包括如下步骤:
(a1)基于目标区域中预设时间周期开始时的常驻移动设备的数量,获取目标区域中预设时间周期开始时的常驻人口的数量;
(a2)基于目标区域中预设时间周期结束时的常驻移动设备的数量,获取目标区域中预设时间周期结束时的常驻人口的数量;
(a3)根据目标区域中预设时间周期开始时的常驻人口的数量和预设时间周期结束时的常驻人口的数量,获取目标区域中预设时间周期内的常驻人口的流入量。
本实施例中,分析目标区域的人口吸引力,可以以预设时间周期为研究对象,该预设时间周期待分析的时间周期。例如,要分析某个目标区域一年的人口吸引力,预设时间周期便为一年。要分析某个目标区域一个季度的人口吸引力,预设时间周期便为一季度。
由于要分析目标区域的人口吸引力,便需要获取预设时间周期内,该目标区域的常驻人口的流入量。因此,可以基于目标区域中预设时间周期开始时的常驻移动设备的数量,获取目标区域中预设时间周期开始时的常驻人口的数量,再基于目标区域中预设时间周期结束时的常驻移动设备的数量,获取目标区域中预设时间周期结束时的常驻人口的数量。例如,在分析某个区域一季度或者一个月的人口吸引力的时候,可以抛去新增设备或者定位覆盖增长等因素的影响,利用目标区域中预设时间周期结束时的常驻人口的数量,减去预设时间周期开始时的常驻移动设备的数量,便得到该目标区域中预设时间周期内的常驻人口的流入量。
进一步可选地,该步骤(a1)“基于目标区域中预设时间周期开始时的常驻移动设备的数量,获取目标区域中预设时间周期开始时的常驻人口的数量”,具体可以包括:根据目标区域中预设时间周期开始时的常驻移动设备的数量和目标区域中常驻移动设备数量与常驻人口数量之间的转化系数,获取目标区域中预设时间周期开始时的常驻人口的数量。
由于一个目标区域中的常驻人口的数量和常驻人口使用的移动设备的数量不一定完全相等,但是常驻移动设备的数量和常驻人口的数量之间会存在一个对应关系,例如,本实施例中,假设该对应关系为常驻移动设备数量与常驻人口数量之间的转化系数,这样,统计到目标区域中预设时间周期开始时的常驻移动设备的数量之后,便可以将目标区域中预设时间周期开始时的常驻移动设备的数量,乘以该目标区域中常驻移动设备数量与常驻人口数量之间的转化系数,便得到该目标区域中预设时间周期开始时的常驻人口的数量。
同理,该步骤(a2)“基于目标区域中预设时间周期结束时的常驻移动设备的数量,获取目标区域中预设时间周期结束时的常驻人口的数量”,具体可以包括:根据目标区域中预设时间周期结束时的常驻移动设备的数量和目标区域中常驻移动设备数量与常驻人口数量之间的转化系数,获取目标区域中预设时间周期结束时的常驻人口的数量。
同理,也可以将目标区域中预设时间周期结束时的常驻移动设备的数量,乘以该目标区域中常驻移动设备数量与常驻人口数量之间的转化系数,便得到该目标区域中预设时间周期结束时的常驻人口的数量。
进一步可选地,在该步骤(a1)和(a2)之前,还可以包括如下步骤:根据目标区域的统计得到的人口数量、目标区域在统计时的常驻移动设备数量、人均可支配收入以及老龄化比例系数,使用线性回归拟合目标区域的常驻移动设备数量与常驻人口数量之间的转化系数。
本实施例中,通过分析影响常驻移动设备数量与常驻人口数量之间的转化系数的参数,来拟合常驻移动设备数量与常驻人口数量之间的转化系数。例如,一个目标区域,在不同时间点的人口数量和常驻移动设备的数量都不相同,而人口数量越多,相对的常驻移动设备的数量便越多。且由于移动设备的使用,必然需要用户消耗一定的资产购买移动设备,且在每个月需要支付一定的消费金额。因此该目标区域的人均可支配收入越高,相对地常驻移动设备数量的数量也会越高。另外,使用移动设备的用户偏向与年轻的一代,因此,目标区域的老龄化比例系数也会影响常驻移动设备数量与常驻人口数量之间的转化系数,对应地,老龄化比例系数越高,则表明年轻人的比例越低,则常驻移动设备的数量相对地便会越少;而老龄化比例系数越低,则表明年轻人的比例越高,则常驻移动设备的数量相对地便会越多。然后根据该目标区域多个时间点的统计得到的人口数量、目标区域在统计时的常驻移动设备数量、人均可支配收入以及老龄化比例系数,使用线性回归拟合目标区域的常驻移动设备数量与常驻人口数量之间的转化系数。实际应用中,拟合时,也可以参考其他可能会影响目标区域的常驻移动设备数量与常驻人口数量之间的转化系数的其他参数,在此不再一一举例赘述。其中在拟合时,使用的统计得到的人口数量可以采用相关的官方部门统计并公开的数据。
进一步可选地,步骤(a1)“基于目标区域中预设时间周期开始时的常驻移动设备的数量,获取目标区域中预设时间周期开始时的常驻人口的数量”之前,还可以包括:
(b1)根据目标区域中的目标应用的所有移动用户的行为日志,统计目标区域中各种类型的移动设备的比例关系;
在目前的市场上,用户使用的移动设备包括不同的类型,例如目前国内市场上使用的移动设备的类型主要包括android类型和ios类型,实际应用中,也可以包括少部分其他类型的移动设备,如window等。可以对目标区域的所有用户在某个目标应用上的行为日志,分析该目标区域的各种类型的移动设备的数量的比例。当然该目标应用为一个使用较为普及,基本上所有用户都会使用的应用。
例如,考虑到国内市场上其他类型的移动设备的数量较少,本实施例中可以作忽略,仅考虑android类型和ios类型的移动设备。由于手机百度是一款全民都知道较为常用的搜索应用。本实施例中,可以根据一个目标区域的手机百度的所有移动用户的行为日志,可以分析出来其中android类型的移动设备的数量和ios类型的移动设备的数量。然后取android类型的移动设备的数量和ios类型的移动设备的数量的比例,作为该目标区域中的android类型的移动设备和ios类型的移动设备的比例关系。
(b2)统计目标区域中预设时间周期开始时第一类型的常驻移动设备的数量;
本实施例中,以第一类型的移动设备为该目标区域中容易检测到的类型的移动设备。例如,本实施例中的第一类型的移动设备可以为android类型的移动设备。由于android类型的移动设备的操作系统的特殊性,在目标领域中,更便于对android类型的移动设备进行定位,从而便于对android类型的移动设备的数量进行统计。
例如,可选地,该步骤(b2)具体可以分别包括如下步骤:
(c1)在预设时间周期开始时,根据目标区域中的各第一类型的移动设备的定位日志,在目标区域中挖掘多个常驻簇;
例如,具体可以在目标区域中每个android类型的移动设备上或者android类型的移动设备的系统中或者android类型的移动设备上安装特定的应用(application;app),对android类型的移动设备进行定位,从而获取每一个android类型的移动设备的定位日志,并在目标区域的空间进行密度聚类的挖掘,例如可以采用基于密度的噪声应用空间聚类(density-basedspatialclusteringofapplicationswithnoise;dbscan)的算法进行密度聚类。密度聚类算法dbscan是一个比较有代表性的基于密度的聚类算法,与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。
本实施例中在预设时间周期开始时,挖掘目标区域中的多个常驻簇,也不是根据一个时间点的定位日志数据,而是需要该预设时间周期开始前的具有一定时间长度的预设时间段,且要求该预设时间段至少包括一至两个周期。例如可以包括一至两周的定位日志,才可以挖掘出该android类型的移动设备的多个常驻簇。因为在一至两个时间周期内,用户的行为具有一定的规律,例如,每周一至五在固定时间范围上班、回家,下班后可以在固定的时间段内去超市买东西或者去健身,周末也有固定的时间段去培训班、图书馆或者其他地方等等。本实施例中,挖掘出的常驻簇是根据移动设备的定位日志挖掘出的呆的时间长度较长的位置点。每一个常驻簇标识该移动设备呆的一个地方,例如,移动设备的用户的家的位置可以形成一个常驻簇;移动设备的用户的公司的位置可以形成一个常驻簇;若移动设备的用户不是常驻用户,经常去的酒店,酒店的位置便形成一个常驻簇;按照类似的方式,移动设备的用户经常去的其他地方也可以形成一个常驻簇。
(c2)根据各第一类型的移动设备的定位日志,挖掘对应的第一类型的移动设备在各常驻簇中的特征信息;
进一步地,还可以根据各第一类型的移动设备的定位日志,挖掘对应的第一类型的移动设备在各常驻簇中的特征信息。例如挖掘的各常驻簇的特征信息可以包括用户工作日在该常驻簇中呆的平均时间长度以及时间段分布、用户休息日在该常驻簇中呆的平均时间长度以及时间段分布。或者还可以包括在该常驻簇中使用的wifi的特征。该wifi的特征可以包括工作日使用该常驻簇中的wifi的平均时间长度以及时间段分布、休息日使用该常驻簇中的wifi的平均时间长度以及时间段分布;还可以包括连接该常驻簇中的wifi的天数比例,以及连接该常驻簇中的wifi的频次分布商等等。实际应用中,还可以挖掘各常驻簇的其他特征信息,在此不再一一距离赘述。
(c3)根据各第一类型的移动设备在各常驻簇中的特征信息和预先训练的随机森林模型,识别各第一类型的移动设备的各常驻簇的类型;该类型包括家;
本实施例中,还需要预先训练随机森林模型,训练该随机森林模型的时候,需要预先采集多条训练数据,每条训练数据包括该目标区域的一个第一类型如android类型的移动设备的各常驻簇中的特征信息,对于各常驻簇的特征信息具体包括哪些参数,可以参考上述实施例的记载,不再赘述。在每条训练数据中,android类型的移动设备的各常驻簇中的特征信息,可以组成一个一维向量,向量的每个位置的元素表示一种常驻簇的特征信息。且每条训练数据中,该android类型的移动设备的每个常驻簇的类型是已知的。然后可以利用各条训练数据训练该随机森林模型,训练时,可以输入每条训练数据的各个常驻簇的特征信息,使得随机森林模型输出各常驻簇的类型,训练时,由于各常驻簇的类型是已知的,若随机森林模型输出的常驻簇的类型不正确,可以调整随机森林模型的参数,使得其输出正确的常驻簇的类型。通过采用数条训练数据,对随机森林模型进行训练,可以确定随机森林模型的参数,从而确定随机森林模型。确定后的随机森林模型在使用时,向其输入第一类型的移动设备在各常驻簇中的特征信息,该随机森林模型便可以识别出该第一类型的移动设备的各常驻簇的类型,例如各常驻簇是家,还是公司,或者为健身房或者其他地方。
需要说明的是,本实施例中,训练随机森林模型时和使用该随机森林模型识别常驻簇类型时,所使用的第一类型的移动设备在各常驻簇中的特征信息中包括的参数必须是一致的。
(c4)统计类型为家的常驻簇位于目标区域中的所有第一类型的移动设备的数量,作为目标区域中预设时间周期开始时第一类型的常驻移动设备的数量。
由于本实施例中,最终是要统计该移动设备的用户是否为常驻用户,所以该目标区域中,只有移动设备的用户的常驻簇有家,该移动设备才为该目标区域的常驻移动设备,该移动设备的用户才可以为该目标区域的常驻用户。因此,本实施例中,可以统计类型为家的常驻簇位于目标区域中的所有第一类型的移动设备的数量,作为目标区域中预设时间周期开始时第一类型的常驻移动设备的数量。
(b3)根据目标区域中预设时间周期开始时第一类型的常驻移动设备的数量和目标区域中各种类型的移动设备的比例关系,获取目标区域中预设时间周期开始时的常驻移动设备的数量。
由于前面已经获取到目标区域中各种类型的移动设备的比例关系,和目标区域中预设时间周期开始时第一类型的常驻移动设备的数量,从而可以反推出目标区域中预设时间周期开始时的常驻移动设备的数量。
例如,在某区域中,以仅包括android类型的移动设备和ios类型的移动设备为例,若经过上述实施例中的步骤(b1)的统计,可以得知该区域中的android类型的移动设备和ios类型的移动设备的比例关系为4:1,假设该区域中的,每个用户使用一个移动设备,若步骤(c1)统计到目标区域中预设时间周期开始时android类型的常驻移动设备的数量w,那么反推出目标区域中预设时间周期开始时的ios类型的常驻移动设备的数量为w/4,那么目标区域中预设时间周期开始时的常驻移动设备(包括android类型的常驻移动设备和ios类型的常驻移动设备)的数量为5w/4。
对应地,可选地,步骤(a2)“基于目标区域中预设时间周期结束时的常驻移动设备的数量,获取目标区域中预设时间周期结束时的常驻人口的数量”之前,还可以包括如下步骤:
(d1)统计目标区域中预设时间周期结束时第一类型的常驻移动设备的数量;
同理,对于步骤(d1)“统计目标区域中预设时间周期结束时第一类型的常驻移动设备的数量”,具体可以包括如下步骤:
(e1)在预设时间周期结束时,根据目标区域中的各第一类型的移动设备的定位日志,在目标区域中挖掘多个常驻簇;
(e2)根据各第一类型的移动设备的定位日志,挖掘对应的第一类型的移动设备在各常驻簇中的特征信息;
(e3)根据各第一类型的移动设备在各常驻簇中的特征信息和预先训练的随机森林模型,识别各第一类型的移动设备的各常驻簇的类型;类型包括家;
(e4)统计类型为家的常驻簇位于目标区域中的所有第一类型的移动设备的数量,作为目标区域中预设时间周期结束时第一类型的常驻移动设备的数量。
(d2)根据目标区域中预设时间周期结束时第一类型的常驻移动设备的数量和目标区域中各种类型的移动设备的比例关系,获取目标区域中预设时间周期结束时的常驻移动设备的数量。
本实施例的步骤(d1)-(d2)以及(e1)-(e4),可以参考上述实施例中的步骤(b2)-(b3)以及(c1)-(c4)的具体实现方式,实现获取目标区域中预设时间周期结束时的常驻移动设备的数量,详细参考上述实施例的记载,在此不再赘述。
101、根据参考的多个区域中各区域在预设时间周期内的常驻人口的流入量,和目标区域中预设时间周期内的常驻人口的流入量,评估目标区域的人口吸引力指数。
由于单独一个目标区域的人口吸引力无法评判,本实施例的目标区域的人口吸引力必然是相对于其他区域而言。因此,本实施例中,需要参考多个区域中来实施。例如,按照上述实施例中的目标区域中预设时间周期内的常驻人口的流入量,可以获取到参考的多个区域中各个区域在设时间周期内的常驻人口的流入量,从而可以根据多个区域中各个区域在设时间周期内的常驻人口的流入量和目标区域中预设时间周期内的常驻人口的流入量,评估目标区域的人口吸引力指数。
例如,该步骤101“根据参考的多个区域中各区域在预设时间周期内的常驻人口的流入量、目标区域中预设时间周期内的常驻人口的流入量,评估目标区域的人口吸引力指数”,具体可以包括如下步骤:
(f1)根据参考的多个区域中各区域在预设时间周期内的常驻人口的流入量和目标区域中预设时间周期内的常驻人口的流入量,计算各区域的预设时间周期内的平均常驻人口的流入量;
(f2)将目标区域中预设时间周期内的常驻人口的流入量除以各区域的预设时间周期内的平均常驻人口的流入量,得到目标区域的人口吸引力指数。
具体地,也就是将参考的多个区域中各区域在预设时间周期内的常驻人口的流入量和目标区域中预设时间周期内的常驻人口的流入量求和之后,取平均,作为各区域的预设时间周期内的平均常驻人口的流入量。然后将目标区域中预设时间周期内的常驻人口的流入量除以各区域的预设时间周期内的平均常驻人口的流入量,得到目标区域的人口吸引力指数。这样,若目标区域的人口吸引力指数大于1,表示该目标区域的人口吸引力较大,大于参考的各区域的平均数。若目标区域的人口吸引力指数小于1,表示该目标区域的人口吸引力较小,小于参考的各区域的平均数。若目标区域的人口吸引力指数等于1,表示该目标区域的人口吸引力一般,等于参考的各区域的平均数。
本实施例的人口吸引力的评估方法,通过基于目标区域中的常驻移动设备的数量,获取目标区域中预设时间周期内的常驻人口的流入量;根据参考的多个区域中各区域在预设时间周期内的常驻人口的流入量,和目标区域中预设时间周期内的常驻人口的流入量,评估目标区域的人口吸引力指数。本实施例的技术方案,可以弥补现有技术的不足,基于目标区域中的常驻移动设备的数量,实现对目标区域的人口吸引力指数的评估。与现有技术相比,本实施例的技术方案,不用通过人工采集数据,仅通过一些数据的检测和分析便可以实现人口吸引力指数的评估,运营成本相对较低,而且与人工采集和统计相比,可以大大地节省评估周期,因此,能够有效地提高人口吸引力的评估效率。
下面以区域的粒度为城市,介绍本实施例的人口吸引力的评估方法的一种应用场景。图2为本实施例提供的城市人口流动示意图。如图2所示,以国内的几个大城市北京、上海、广州和深圳为例,每个城市都存在人口流入和人口流出的情况。图3为本实施例提供的多个城市的人口吸引力指数的示意图。如图3所示,每个城市的人口吸引力指数,都是按照上述实施例的人口吸引力的评估方法,评估出的。其中深圳的人口吸引力指数最高,远大于平均数。而还有一些中小城市的人口吸引力指数小于1,低于平均数。
图4为本发明的人口吸引力的评估装置实施例一的结构图。如图4所示,本实施例的人口吸引力的评估装置,具体可以包括:获取模块10和评估模块11。
其中获取模块10用于基于目标区域中的常驻移动设备的数量,获取目标区域中预设时间周期内的常驻人口的流入量;
评估模块11用于根据参考的多个区域中各区域在预设时间周期内的常驻人口的流入量,和获取模块10获取的目标区域中预设时间周期内的常驻人口的流入量,评估目标区域的人口吸引力指数。
本实施例的人口吸引力的评估装置,通过采用上述模块实现人口吸引力的评估的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
图5为本发明的人口吸引力的评估装置实施例二的结构图。如图5所示,本实施例的人口吸引力的评估装置在上述图4所示实施例的技术方案的基础上,进一步更加详细地介绍本发明的技术方案。
本实施例的人口吸引力的评估装置中,获取模块10具体用于:
基于目标区域中预设时间周期开始时的常驻移动设备的数量,获取目标区域中预设时间周期开始时的常驻人口的数量;
基于目标区域中预设时间周期结束时的常驻移动设备的数量,获取目标区域中预设时间周期结束时的常驻人口的数量;
根据目标区域中预设时间周期开始时的常驻人口的数量和预设时间周期结束时的常驻人口的数量,获取目标区域中预设时间周期内的常驻人口的流入量。
本实施例的人口吸引力的评估装置中,获取模块10具体用于根据目标区域中预设时间周期开始时的常驻移动设备的数量和目标区域中常驻移动设备数量与常驻人口数量之间的转化系数,获取目标区域中预设时间周期开始时的常驻人口的数量;
获取模块10具体还用于根据目标区域中预设时间周期结束时的常驻移动设备的数量和目标区域中常驻移动设备数量与常驻人口数量之间的转化系数,获取目标区域中预设时间周期结束时的常驻人口的数量。
进一步可选地,如图5所示,本实施例的人口吸引力的评估装置中,还包括拟合模块12。
拟合模块12用于根据目标区域的统计得到的人口数量、目标区域在统计时的常驻移动设备数量、人均可支配收入以及老龄化比例系数,使用线性回归拟合目标区域的常驻移动设备数量与常驻人口数量之间的转化系数。
对应地,获取模块10具体用于根据目标区域中预设时间周期开始时或者结束时的常驻移动设备的数量和拟合模块12拟合的目标区域中常驻移动设备数量与常驻人口数量之间的转化系数,获取目标区域中预设时间周期开始时或者结束时的常驻人口的数量。
进一步可选地,如图5所示,本实施例的人口吸引力的评估装置中,还包括统计模块13。
统计模块13根据目标区域中的目标应用的所有移动用户的行为日志,统计目标区域中各种类型的移动设备的比例关系;
统计模块13于统计目标区域中预设时间周期开始时第一类型的常驻移动设备的数量;
获取模块10于根据统计模块13统计的目标区域中预设时间周期开始时第一类型的常驻移动设备的数量和目标区域中各种类型的移动设备的比例关系,获取目标区域中预设时间周期开始时的常驻移动设备的数量;
对应地,统计模块13还用于统计目标区域中预设时间周期结束时第一类型的常驻移动设备的数量;
获取模块10还用于根据统计模块13统计的目标区域中预设时间周期结束时第一类型的常驻移动设备的数量和目标区域中各种类型的移动设备的比例关系,获取目标区域中预设时间周期结束时的常驻移动设备的数量。
进一步可选地,本实施例的人口吸引力的评估装置中,统计模块13具体用于:
在预设时间周期开始时或者结束时,根据目标区域中的各第一类型的移动设备的定位日志,在目标区域中挖掘多个常驻簇;
根据各第一类型的移动设备的定位日志,挖掘对应的第一类型的移动设备在各常驻簇中的特征信息;
根据各第一类型的移动设备在各常驻簇中的特征信息和预先训练的随机森林模型,识别各第一类型的移动设备的各常驻簇的类型;类型包括家;
统计类型为家的常驻簇位于目标区域中的所有第一类型的移动设备的数量,作为目标区域中预设时间周期开始时或者结束时第一类型的常驻移动设备的数量。
进一步可选地,本实施例的人口吸引力的评估装置中,评估模块11具体用于:
根据参考的多个区域中各区域在预设时间周期内的常驻人口的流入量和获取模块获取的目标区域中预设时间周期内的常驻人口的流入量,计算各区域的预设时间周期内的平均常驻人口的流入量;
将目标区域中预设时间周期内的常驻人口的流入量除以各区域的预设时间周期内的平均常驻人口的流入量,得到目标区域的人口吸引力指数。
本实施例的人口吸引力的评估装置,通过采用上述模块实现人口吸引力的评估的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
图6为本发明的计算机设备实施例的结构图。如图6所示,本实施例的计算机设备,包括:一个或多个处理器30,以及存储器40,存储器40用于存储一个或多个程序,当存储器40中存储的一个或多个程序被一个或多个处理器30执行,使得一个或多个处理器30实现如上图1所示实施例的人口吸引力的评估方法。图6所示实施例中以包括多个处理器30为例。
例如,图7为本发明提供的一种计算机设备的示例图。图7示出了适于用来实现本发明实施方式的示例性计算机设备12a的框图。图7显示的计算机设备12a仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,计算机设备12a以通用计算设备的形式表现。计算机设备12a的组件可以包括但不限于:一个或者多个处理器16a,系统存储器28a,连接不同系统组件(包括系统存储器28a和处理器16a)的总线18a。
总线18a表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
计算机设备12a典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12a访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28a可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)30a和/或高速缓存存储器32a。计算机设备12a可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34a可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18a相连。系统存储器28a可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明上述图1-图5各实施例的功能。
具有一组(至少一个)程序模块42a的程序/实用工具40a,可以存储在例如系统存储器28a中,这样的程序模块42a包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42a通常执行本发明所描述的上述图1-图5各实施例中的功能和/或方法。
计算机设备12a也可以与一个或多个外部设备14a(例如键盘、指向设备、显示器24a等)通信,还可与一个或者多个使得用户能与该计算机设备12a交互的设备通信,和/或与使得该计算机设备12a能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22a进行。并且,计算机设备12a还可以通过网络适配器20a与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器20a通过总线18a与计算机设备12a的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12a使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
处理器16a通过运行存储在系统存储器28a中的程序,从而执行各种功能应用以及数据处理,例如实现上述实施例所示的人口吸引力的评估方法。
本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所示的人口吸引力的评估方法。
本实施例的计算机可读介质可以包括上述图7所示实施例中的系统存储器28a中的ram30a、和/或高速缓存存储器32a、和/或存储系统34a。
随着科技的发展,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载,或者采用其他方式获取。因此,本实施例中的计算机可读介质不仅可以包括有形的介质,还可以包括无形的介质。
本实施例的计算机可读介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、rf等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。