1.本发明涉及时空大数据挖掘与时空分析领域,更具体地,涉及一种预测未来人口精细化空间分布的方法、系统及计算机可读存储介质。
背景技术:2.当前人口预测方法分为两大类:数学统计模型和人口学方法模型。常用的数学统计模型包括:logistic模型、gm(1,1)模型和arima模型等。该类模型只是从人口总量的统计特征出发,未充分考虑人口因素(男女比例,总和生育率和育龄妇女人口等)的影响。队列因素法作为人口学方法,能充分利用人口统计数据中的横向数据(即各年龄段信息)并有效结合人口变动因素(出生率、死亡率和迁移率),其预测结果既能反映人口总量又能反映人口结构体征。
3.人口数据空间化是指将人口统计数据在空间上进行离散化处理,实现人口统计数据由行政单元为单位向更小尺度的地理单元转换。众多人口数据空间化方法中,总体可以分为多元线性回归方法和机器学习方法,前者假设人口与人口空间分布指示性因子是线性关系,但两者间的关系更多为复杂的非线性关系。机器学习方法则能较好处理复杂的非线性关系。
4.现有的人口预测与人口空间化存在割裂的问题,即通过人口预测方法得到了未来人口总量和人口结构,但缺乏未来人口的空间分布信息,特别是精细化的人口空间分布信息。
5.现有技术中,公开号为:cn110716998a中国发明专利,于2020年1月21日公开了一种精细尺度人口数据空间化方法,包括如下步骤:一)从系统待处理区土地利用现状图层中调取土地利用数据;提取出待处理区的行政村边界图层;进行编行码匹配,建立地理信息空间数据库,计算该土地利用类型指数;采用双侧检验的皮尔逊(pearson)相关系数,分析各个村的土地利用类型指数与人口密度的相关关系;二)分别选取idw方法、多元回归方法和bp神经网络方法对人口数据进行空间化,并选择精度最高的方法进行最终人口数据空间化;三)精度验证。该方案是根据现有人口数据将其进行空间化处理,并没有对区域未来的人口空间化分布进行预测。
技术实现要素:6.本发明为克服上述现有人口预测只能得到未来人口总量不能反映未来人口空间分布特征的缺点缺陷,提供一种预测未来人口精细化空间分布的方法、系统及计算机可读存储介质。
7.本发明的首要目的是为解决上述技术问题,本发明的技术方案如下:
8.本发明第一方面提供了一种预测未来人口精细化空间分布的方法,包括以下步骤:
9.s1:确定人口分布指示性因子,获取待预测区域的人口分布指示性因子的图层数据;
10.s2:将待预测区域按照设定的尺度划分为若干研究区,计算每个研究区对应栅格的像元平均值;
11.s3:利用研究区像元平均值和人口计算待预测区域的人口分布指示性因子权重;
12.s4:模拟待预测区域的土地利用类型,得到待预测区域在预测年的建设用地栅格;
13.s5:结合建设用地栅格与人口分布指示性因子权重构建人口分布系数,得到人口空间化模型;
14.s6:设置人口变动参数,预测人口规模;
15.s7:将预测的人口规模输入至人口空间化模型,输出未来人口的精细化空间分布。
16.进一步地,所述人口分布指示性因子包括:pois点、道路、河流和地势高程,所述人口分布指示性因子的图层数据包括:pois图层、道路图层、河流图层和地势高程图。
17.进一步地,步骤s3所述的利用研究区像元平均值和人口计算待预测区域的人口分布指示性因子权重具体过程为:
18.将每个研究区像元平均值和人口数均输入至随机森林模型,输出待预测区域的人口分布指示性因子权重。
19.进一步地,在步骤s4中利用ca
‑
markov模型模拟待预测区域的土地利用类型,得到待预测区域在预测年的建设用地栅格。
20.进一步地,步骤s5的具体的过程为:
21.将待预测区域的人口分布指示性因子图层按人口分布指示性因子权重进行加权叠加,得到每个栅格的加权融合值,利用建设用地栅格筛选出建设用地栅格的加权融合值,进一步地通过计算每一个建设用地栅格加权融合值与研究区所有建设用地栅格加权融合总值的比值来构建人口分布系数,从而得到人口空间化模型。
22.进一步地,所述人口变动参数为总和生育率。
23.进一步地,在步骤s7中将预测的人口规模输入至人口空间化模型,人口空间化模型将预测的人口规模从行政单元映射至待预测区域的地理栅格单元,输出未来人口的精细化空间分布。
24.本发明第二方面提供了一种预测未来人口精细化空间分布的系统,其特征在于,该系统包括:存储器、处理器,所述存储器中包括预测未来人口精细化空间分布的方法程序,所述预测未来人口精细化空间分布的方法程序被所述处理器执行时实现如下步骤:
25.s1:确定人口分布指示性因子,获取待预测区域的人口分布指示性因子的图层数据;
26.s2:将待预测区域按照设定的尺度划分为若干研究区,计算每个研究区对应栅格的像元平均值;
27.s3:利用研究区像元平均值和人口计算待预测区域的人口分布指示性因子权重;
28.s4:模拟待预测区域的土地利用类型,得到待预测区域在预测年的建设用地栅格;
29.s5:结合建设用地栅格与人口分布指示性因子权重构建人口分布系数,得到人口空间化模型;
30.s6:设置人口变动参数,预测人口规模;
31.s7:将预测的人口规模输入至人口空间化模型,输出未来人口的精细化空间分布。
32.进一步地,所述人口分布指示性因子包括:pois点、道路、河流和地势高程,所述人口分布指示性因子的图层数据包括:pois图层、道路图层、河流图层和地势高程图。
33.本发明第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中包括预测未来人口精细化空间分布的方法程序,所述预测未来人口精细化空间分布的方法程序被处理器执行时,实现所述的一种预测未来人口精细化空间分布的方法的步骤。
34.与现有技术相比,本发明技术方案的有益效果是:
35.本发明一方面进行人口规模的预测,另一方面将待预测区域进行研究区划分,通过人口分布指示性因子的权重值与模拟出的土地利用类型结合构建人口空间化模型,将预测的人口规模输入至人口空间化模型得到未来人口精细化空间分布,解决了人口预测方法与人口空间化模型耦合问题,实现了预测未来人口精细化空间分布。
附图说明
36.图1为本发明一种预测未来人口精细化空间分布的方法流程图。
37.图2为本发明实施例二胎政策前后生育率变化图。
38.图3为本发明实施例z城市群2010年实际人口与2030年预测人口对比图。
39.图4为本发明实施例z城市群2010年与2030年建设用地变化情况对比图。
40.图5为本发明实施例z城市群2010年与2030年人口空间分布情况对比图。
具体实施方式
41.为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本技术的实施例及实施例中的特征可以相互组合。
42.在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
43.实施例1
44.如图1所示,本发明第一方面提供了一种预测未来人口精细化空间分布的方法,包括以下步骤:
45.s1:确定人口分布指示性因子,获取待预测区域的人口分布指示性因子的图层数据;
46.需要说明的是,在本发明中构建人口空间化模型首先要选择人口分布指示性因子,在选择人口分布指示性因子时需要从人口分布的主要影响因素出发,可以选择例pois点(例如,超市、学校和银行)、道路、河流和地势高程。
47.所述的人口分布指示性因子的图层数据pois图层、道路图层、河流图层和地势高程图,在实施例中,以z城市群为例,需要获取的数据包括:人口统计数据,2010,2015,2018三个年份该城市群的人口统计数据;区县级行政边界数据,1:100万gd省县级行政边界数据,需要说明的是,本发明中将z城市群作为待预测区域,以区县级行政单位作划分尺度,也就是说取现级行政单位为研究区域;土地利用类型数据,2005、2010和2015全国分辨率为
1km
×
1km土地利用类型数据,分为6大类25个小类;河流、道路数据,1:100万gd省河流、道路数据;poi数据,分为7类,包括:超市、公园、酒店,警察局、银行、学校、医院,源于百度地图api;
48.在获取了上述数据后还需要进行以下数据处理,(1)人口统计数据:根据2010年人口的各年龄人口占比,计算z城市群各区县各年龄人口数;(2)县级行政边界数据:在1:100万gd省县级行政边界矢量图层上,提取z城市群各区县边界,同时以2010年行政区划图进行校准;(3)土地利用类型数据:采用transverse mercator投影方式进行空间投影,对25个土地利用类型进行重分类为6类;(4)dem数据:采用transverse mercator投影方式进行空间投影,栅格大小采用最邻近法重采样为1km
×
1km;(5)河流、道路数据:在1:100万gd省河流、道路数据矢量图层上进行裁剪得到珠三角九市各区县河流、道路数据,通过欧式距离工具由矢量图层得到最近河流、道路的欧式距离栅格图层,栅格大小采用最邻近法重采样为1km
×
1km;(6)poi数据:通过核密度分析工具,将7类poi矢量点图层转换成7个密度栅格图层,栅格大小采用最邻近法重采样为1km
×
1km。
49.s2:将待预测区域按照设定的尺度划分为若干研究区,计算每个研究区对应栅格的像元平均值;
50.需要说明的是,本发明中将z城市群作为待预测区域,以县级行政单位为研究区域,根据步骤s1得到的栅格,分别计算每个研究区域的栅格的像元值,然后求平均,得到每个研究区域的像元的平均值,同时每个研究区均对应具体的人口数。
51.s3:利用研究区像元平均值和人口计算待预测区域的人口分布指示性因子权重;
52.更具体的,将每个研究区像元平均值和人口数均输入至随机森林模型,输出待预测区域的人口分布指示性因子权重。例如,一个待预测区域的人口分布指示性因子分别为:pois点的权重为0.5,、道路与河流的权重为0.3,地势高程的权重为0.2。需要说明的是,人口分布指示性因子与人口分布的关系并非简单的线性关系,随机森林模型作为机器学习方法,能较好处理复杂的非线性关系。
53.其中,随机森林模型处理的过程为:过程如下:a)首先从预处理的10个人口分布指示性因子图层中按区县范围提取对应的栅格像元数值,为了消除各区县范围大小不一的影响,采用区县栅格的平均像元值代替区县栅格的总像元值,b)利用区县人口数与该区县10个人口分布指示性因子的栅格平均像元值拟合随机森林模型,c)人口分布指示性因子输入拟合好的随机森林模型得到人口分布指示性因子权重。
54.s4:模拟待预测区域的土地利用类型,得到待预测区域在预测年的建设用地栅格;
55.在一个具体的实施例中,可以利用ca
‑
markov模型模拟待预测区域的土地利用类型,得到待预测区域在预测年的建设用地栅格。
56.需要说明的是,人口通常情况下只分布于建设用地(城镇用地,农村居民点和工业园区等),本发明预测的前提是,人口只分布于建设用地土地类型,为了预测未来人口的空间分布,则需进一步考虑建设用地随时间变化的问题,为此采用ca
‑
markov模型模拟预测土地利用类型,得到预测年的建设用地情况(也就是得到建设用地栅格)。
57.需要说明的是,ca
‑
markov模型模拟土地利用类型时,如何确定转换规则至关重要,本发明中在确定转换规则中考虑了我国“耕地红线”政策,即限定耕地不变。首先以2010年土地利用现状为基期数据模拟z城市群2015年土地利用数据,并采用z城市群2015年土地
利用现状图进行检验,总体kappa系数为0.97,大于0.75表示模拟效果好。通常情况下,利用ca
‑
markov模型进行土地利用类型模拟预测时,基年与预测年的年份间隔应与建立面积转移矩阵的初始年和末期年的年份间隔相一致,即以2015年土地利用现状为基础模拟预测2020年土地利用数据,再以2020年土地利用数据为基础模拟预测2025年土地利用数据,依此类推得到2030年土地利用数据,结果如图4所示。
58.s5:结合建设用地栅格与人口分布指示性因子权重构建人口分布系数,得到人口空间化模型;
59.需要说明的是,在得到预测年的建设用地的使用情况(建设用地的栅格),需要进一步的得到人口分布栅格,具体为:将待预测区域的人口分布指示性因子图层按人口分布指示性因子权重进行加权叠加,得到每个栅格的加权融合值,利用建设用地栅格筛选出建设用地栅格的加权融合值,进一步地通过计算每一个建设用地栅格加权融合值与研究区所有建设用地栅格加权融合总值的比值来构建人口分布系数,从而得到人口空间化模型。需要说明的是,对于一个待测区域得到了人口分布系数即得到了人口空间化模型。
60.s6:设置人口变动参数,预测人口规模;
61.需要说明的是,本发明采用队列因素法进行人口规模的预测,其中人口参数的设置是关键,其中总和生育率受政策影响明显,设置尤为关键,在设定总和生育率时,综合考虑了待预测区域当地政策和当地提出的总和生育率目标,更具体可以做如下设置,
①
育龄妇女年龄范围15—49岁;
②
总和生育率对二胎前后进行了设置,二胎政策前总和生育率设置为1.1,二胎政策后总和生育率设置为1.6,图2为总和生育率分解到各个年龄的生育率。根据设定的相关参数,以2010年z城市群城市各区县人口为基年,预测2030年人口规模,结果如图3所示。
62.s7:将预测的人口规模输入至人口空间化模型,输出未来人口的精细化空间分布。
63.需要说明的是,将步骤s6得到的预测人口规模输入至人口空间化模型,人口空间化模型将预测的人口规模从行政单元映射至待预测区域的地理栅格单元,输出未来人口的精细化空间分布,如图5所示。
64.本发明第二方面提供了一种预测未来人口精细化空间分布的系统,其特征在于,该系统包括:存储器、处理器,所述存储器中包括预测未来人口精细化空间分布的方法程序,所述预测未来人口精细化空间分布的方法程序被所述处理器执行时实现如下步骤:
65.s1:确定人口分布指示性因子,获取待预测区域的人口分布指示性因子的图层数据;
66.s2:将待预测区域按照设定的尺度划分为若干研究区,计算每个研究区对应栅格的像元平均值;
67.s3:利用研究区像元平均值和人口计算待预测区域的人口分布指示性因子权重;
68.s4:模拟待预测区域的土地利用类型,得到待预测区域在预测年的建设用地栅格;
69.s5:结合建设用地栅格与人口分布指示性因子权重构建人口分布系数,得到人口空间化模型;
70.s6:设置人口变动参数,预测人口规模;
71.s7:将预测的人口规模输入至人口空间化模型,输出未来人口的精细化空间分布。
72.进一步地,所述人口指示因子包括:pois点、道路、河流和地势高程,所述人口分布
指示性因子的图层数据包括:pois图层、道路图层、河流图层和地势高程图。
73.本发明第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中包括预测未来人口精细化空间分布的方法程序,所述预测未来人口精细化空间分布的方法程序被处理器执行时,实现所述的一种预测未来人口精细化空间分布的方法的步骤。
74.显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。