本发明属于地理信息系统
技术领域:
,涉及一种用于城市内涝风险评估的人口空间分布模拟方法,适用于城市内涝灾害后受灾人口统计。
背景技术:
:随着全球气候变化的加剧与城市化进程的快速发展,极端降雨频发,洪涝灾害日益成为我国各大城市面临的主要自然灾害。人口是洪涝灾害中最重要的受灾体,准确的人口时空分布信息是开展城市计算的重要依据。在传统的以行政区划为统计单元的城市人口计算过程中,一方面人口统计单元尺度太大,在精度上不能满足城市功能计算,另一方面,人口统计单元内部忽略了人口与地理要素之间的关联关系,未考虑统计单元内部的空间异构性,会造成在特定环境下的与人口分布相关的风险评估的不准确。另一种以移动终端定位信息、微博签到数据、公交刷卡记录等数据为基准反映出人口信息的方法,因为人口与此类数据并无联系,每个人或许拥有多部终端,或许没有终端,仅仅以终端数据来刻画人口数,并不能保证人口的完整性,所以此类方法并不适用于暴雨洪涝情景下的城市人口计算。在评估城市洪涝灾害时,建筑物是除人口以外的另一类重要承灾体。通过建筑物评估灾害风险,被认为是一种精细化程度高、效果好的方式。进而,如果能将将人口和建筑物两种承灾体有效结合,能较好地契合城市洪涝灾害评估的需要。为此,针对上述需求,设计一种方法/装置,用于解决实际系统中由于评估方法和尺度因素导致的城市内涝风险评估不精确、不及时的问题。技术实现要素:为克服现有技术的缺陷,本发明的目的在于提供一种基于城市内涝风险评估的人口空间分布模拟方法及装置,其针对现有技术中城市内涝风险评估技术,解决了现有技术中由于评估方法和尺度等因素,从而导致城市内涝风险评估,尤其是人口受灾评估不精确、不及时的问题;以极端暴雨引起的洪涝灾害中“无建筑则无人口”为假设前提,从灾害评估的角度,对城市人口统计数据进行降尺度处理,利用与城市人口具有高相关性的poi数据,实现了在建筑物尺度下的基于城市内涝风险评估时高效、精确的人口空间分布模拟。鉴于上述问题,本发明提供一种基于一种基于城市内涝风险评估的人口空间分布模拟方法及装置。第一方面,本发明提供一种基于城市内涝风险评估的人口空间分布模拟方法,该方法具体包括:s01:获取城市建筑物poi分类与高度信息,且进行区域内建筑物信息融合;s02:采用tf-idf算法建立poi数据与城市人口密度权重关系;s03:通过对各个类别的poi点构建泰森多边形,将泰森多边形与人口格网叠置,按照poi类别占人口密度的权重计算每一个泰森多边形的人口密度;利用建筑物的建筑占地面积与高度属性,分别与各层泰森多边形叠加合并,得到建筑物内人口分布;s04:通过将无建筑物的泰森多边形中人口分配到建筑物中来完成人口数量修正。优选的,所述步骤s01中,所述区域内建筑物信息融合方法具体为:遍历每一个poi,以该poi所在位置为圆心,并确定起始半径值,构建该poi的圆形辐射区域;若辐射区域内没有建筑物,则以一定步长扩大半径,直至辐射区域内有建筑物;计算辐射区域内,该poi到每一个建筑物的几何距离,选取距离最小的建筑物,赋予该建筑物的类别与高度属性为poi的类别与高度。优选的,所述步骤s02中,所述将tf-idf算法建立poi数据与城市人口密度权重关系具体步骤包括:所有poi数据放入人口格网内,依次遍历每一类poi,计算每个格网内每一类poi的tf值。第j个格网内第i类poi的tfi,j值计算公式为:其中:tfi,j指第i类poi在第j个格网中出现的频率,ni,j表示第j个格网中第i类poi的个数,∑knk,j表示第j个格网中包含的poi总数;遍历每一个格网,计算每一类poi的idf值;第i类poi的idfi的计算公式为:其中:idfi指第i类poi的逆频率值,|d|表示格网总数,{|j:poii∈dj|}表示包含第i类poi的格网数,|j:poii∈dj|表示包含第i类poi的格网数;根据tf-idf的计算公式,计算每个格网内每类poi的tf-idf,计算公式如下:tf-idfi,j=tfi,j×idfi;利用皮尔森相关系数公式,计算poi类别与人口密度相关关系,相关系数计算公式为:其中:i表示第i类poi,j表示第j个格网,表示第i类poi与人口密度的相关系数,n表示格网总数,tii,j表示第i类poi在第j个格网中的tf-idf值,pdj表示第j个格网的人口密度;将各类别的poi与城市人口相关系数归一化,结果作为poi类别分配城市人口密度的权重。优选的,所述步骤s03中,所述对各个类别的poi点构建泰森多边形具体为:将所有poi放入人口格网内,计算每个格网内每一类别poi的中心点z(x,y),对所有中心点构建delaunay三角网,记录每个三角形与其对应的中心点信息trianglea[zl,zm,zn];其中:xi,yi为格网内点i的坐标值。找出每个中心点的对应的三角形,并表示为zl[trianglea,triangleb…],对每个三角形建立外接圆,并记录外接圆的圆心oa(x,y);将共享同一中心点的三角形对应的外接圆圆心连接起来,即得到泰森多边形。优选的,所述步骤s04还包括人口重分配模型的评价,具体为:将worldpop格网数据与重分配人口后的建筑物数据做叠加,根据每个格网内的原人口与每个格网内部建筑物中包含的总人口做线性回归分析,计算r2与rmse值。第二方面,本发明提供一种基于城市内涝风险评估的人口空间分布模拟装置,具体包括:第一单元:用于获取城市建筑物poi分类与高度信息,且进行区域内建筑物信息融合;第二单元:用于通过tf-idf算法建立poi数据与城市人口密度权重关系;第三单元:用于通过对各个类别的poi点构建泰森多边形,将泰森多边形与人口格网叠置,按照poi类别占人口密度的权重计算每一个泰森多边形的人口密度;利用建筑物的建筑占地面积与高度属性,分别与各层泰森多边形叠加合并,得到建筑物内人口分布;第四单元:用于通过将无建筑物的泰森多边形中人口分配到建筑物中来完成人口数量修正。第三方面,本发明还另提供了一种计算机可读存储介质,其上储存有计算机程序,该程序被处理器执行时,实现上述方法的步骤。第四方面,本发明还另提供了一种基于城市内涝风险评估的人口空间分布模拟装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现上述方法的步骤。本发明记载的技术方案所带来的有益效果:1、在已有与人口空间化相关的研究中,忽略了人口统计单元内部与人口活动强相关的地理要素,会导致城市暴雨洪涝灾害中与人口分布相关的计算分析不准确,本发明提出的方法将人口通过poi与地理要素建筑物相关联,将人口重分配到建筑物中,在城市暴雨内涝灾害下能更加准确的进行各种城市功能分析;2、poi数据具有很高的时效性,且数据源更新及时,数据量丰满。因此,本发明提出的方法适用于大多数城市人口精细化分配,可操作性强;3、选取与城市人口高度相关的poi数据,采用tf-idf算法,降低了poi的冗余度,进一步提高了poi与人口的关联,能够较为准确的反应出人口的分布情况;4、现有的基于移动端定位数据、社交网络签到等vgi数据来反映人口数量的方法,一方面数据获取不全,另一方面不能确定这些vgi数据与人口数量的具体相关关系,在评估人口数量时,误差太大,而本发明以城市极端暴雨为背景,“无建筑物无人口”为前提,利用poi数据与泰森多边形的性质,将人口统计数据重分配到建筑物中,人口再分配过程中没有损失人口,保证了人口的完整性,在城市功能分析中更加准确。附图说明图1:本发明一种基于城市内涝风险评估的人口空间分布模拟方法一较佳实施方式中的流程框架结构示意图;图2:本发明一种基于城市内涝风险评估的人口空间分布模拟方法一较佳实施方式中的delaunay三角网构建过程示意图;图3:本发明一种基于城市内涝风险评估的人口空间分布模拟方法一较佳实施方式中的研究区域poi类别图;图4:本发明一种基于城市内涝风险评估的人口空间分布模拟方法一较佳实施方式中的研究区域建筑物类别图;图5:本发明一种基于城市内涝风险评估的人口空间分布模拟方法一较佳实施方式中的研究区域人口格网密度图;图6:本发明一种基于城市内涝风险评估的人口空间分布模拟方法一较佳实施方式中的研究区域基于建筑物的人口分布图;图7:本发明一种基于城市内涝风险评估的人口空间分布模拟方法一较佳实施方式中的研究区域人口重分配精度评价图;具体实施方式本发明提供了一种基于城市内涝风险评估的人口空间分布模拟方法及装置,为了更好的理解上述技术方案,下面通过附图以及具体实施例对本发明技术方案进行详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本发明技术方案的详细说明,而不是对本发明技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以互相组合。实施例一:图1为本发明一较佳实施方式中一种基于城市内涝风险评估的人口空间分布模拟方法的流程框架结构示意图。本发明提供的一种基于城市内涝风险评估的人口空间分布模拟方法,该方法具体包括:s01:城市建筑物信息获取及融合;s02:建立poi数据与城市人口密度权重关系;s03:面向建筑物的人口重分配;s04:人口数量修正。其中,s01城市建筑物信息获取及融合,具体的:poi、人口格网、建筑物图斑数据的获取:利用网络爬虫,爬取研究区域内poi数据;从worldpop官网获取世界人口格网数据;从openstreetmap获取研究区域内建筑物矢量数据;poi分类与高度信息提取:将poi按照其所能提供的功能分类,并将poi地址信息中的楼层号作为poi的高度,提取出其高度信息。建筑物信息的融合:遍历每一个poi,以该poi所在位置为圆心,并确定起始半径值,构建该poi的圆形辐射区域;若辐射区域内没有建筑物,则以一定步长扩大半径,直至辐射区域内有建筑物;计算辐射区域内,该poi到每一个建筑物的几何距离,选取距离最小的建筑物,赋予该建筑物的类别与高度属性为poi的类别与高度。其中,s02建立poi类别与城市人口密度权重关系,具体的:tf-idf算法是自然语言处理中的一个常见算法。其主要思想是:若某个词语在某篇文章中出现的频率很高,但在其他文章中很少出现,则认为此词语或者短语具有很好的辨识度。由此可以类比,在一个区域中,某类poi出现的频率很高,而在另外的区域中数量较少,那么这块区域的功能类型很大程度上就由这种poi类型主导。利用tf-idf算法,可以得出poi类别与人口密度的相关关系,从而确定poi类别与城市人口密度的权重关系。将所有poi数据放入人口格网内,依次遍历每一类poi,计算每个格网内每一类poi的tf值。第j个格网内第i类poi的tfi,j值计算公式为:其中:tfi,j指第i类poi在第j个格网中出现的频率,ni,j表示第j个格网中第i类poi的个数,∑knk,j表示第j个格网中包含的poi总数。遍历每一个格网,计算每一类poi的idf值。第i类poi的idfi的计算公式为:其中:idfi指第i类poi的逆频率值,|d|表示格网总数,{|j:poii∈dj|}表示包含第i类poi的格网数,|j:poii∈dj|表示包含第i类poi的格网数。根据tf-idf的计算公式,计算每个格网内每类poi的tf-idf,计算公式如下:tf-idfi,j=tfi,j×idfi利用皮尔森相关系数公式,计算poi类别与人口密度相关关系,相关系数计算公式为:其中:i表示第i类poi,j表示第j个格网,表示第i类poi与人口密度的相关系数,n表示格网总数,tii,j表示第i类poi在第j个格网中的tf-idf值,pdj表示第j个格网的人口密度。第五步:将各类别的poi与城市人口相关系数归一化,结果作为poi类别分配城市人口密度的权重。其中,s03面向建筑物的人口重分配,具体的:对于同一类型的poi,每个poi承担的功能一致,由此可以假设每个人出行会选择距其最近的poi点。而泰森多边形具有如下特征:每个泰森多边形内只有一个离散点;泰森多边形内的点到相应离散点的距离最近;位于泰森多边形边上的点到其两边的离散点距离相等。因此,分别对各个类别的poi点构建泰森多边形,将泰森多边形与人口格网叠置,按照poi类别占人口密度的权重计算每一个泰森多边形的人口密度。最后,利用建筑物的建筑占地面积与高度属性,分别与各层泰森多边形叠加合并,最终得到建筑物内人口分布。将所有poi放入人口格网内,计算每个格网内每一类别poi的中心点z(x,y),对所有中心点构建delaunay三角网如图2所示,对于新加入的poi中心点(a)如图2(a)所示中的g点,依次找出与该点最近的四个中心点(a、b、c、f点)所构成的共边的两个三角形;若该点在两三角形外接圆的内部,如图2(b)所示;则删除共边ab,如图2(c)所示;将改点依次与其他四个中心点依次连接,构成新的三角形,如图2(d)所示。记录每个三角形与其对应的中心点信息trianglea[zl,zm,zn]。其中:xi,yi为格网内点i的坐标值。找出每个中心点的对应的三角形,并表示为zl[trianglea,triangleb…],对每个三角形建立外接圆,并记录外接圆的圆心oa(x,y)。将共享同一中心点的三角形对应的外接圆圆心连接起来,即得到泰森多边形。重复以上过程,依次构建每个poi类别的泰森多边形,并依据poi类别占人口密度的权重,计算每一个泰森多边形的人口密度。将泰森多边形与建筑物进行叠加,可以得到在每一类别poi影响下的建筑物人口popeg。其中,popeg表示第e个建筑物在第g类poi影响下的人口数,sei表示第e个建筑物第i部分的面积,he表示第e个建筑物的楼层高度,tsi表示第e个建筑物第i部分所在的泰森多边形,为该泰森多边形的面积,为该泰森多边形的人口数量。根据每次叠加后的结果,汇总计算建筑物的人口,计算方法为:其中,corg第g类poi与占人口密度的权重,popeg表示第e个建筑物在第g类poi影响下的人口数。其中,s04人口数量修正,具体的:有些泰森多边形中并无建筑物,为了避免人口损失,需要将此类泰森多边形内的人口也分配到建筑物中。无建筑物的泰森多边形人口的分配:对于泰森多边形内无建筑物的人口分配,采用反距离比例法,即距离该泰森多边形越近的建筑物,分配到的人口最多,反之,则最少。在初分配的基础上进行二次修正,从而保证了人口数没有损失。pope=pope+δpope其中,pop′e为第e个建筑物内最终人口数,δpope为第e个建筑物的修正人口数,δpopgf第g类poi对应的泰森多边形中,第f个没有建筑物的泰森多边形所对应的人口数,distance(e,f)表示第e个建筑物到第f个泰森多边形的距离。对于形成的人口重分配模型可进行模型评价:将worldpop格网数据与重分配人口后的建筑物数据做叠加,根据每个格网内的原人口与每个格网内部建筑物中包含的总人口做线性回归分析,计算r2与rmse值。以南京市鼓楼区为研究区域,从百度地图获取poi数据,并将poi分为市场购物、餐饮酒店、政府机构、生活服务、医疗设施、住宅小区、公司企业、旅游景点、教育培训、交通设施十大类,如下表格1所示。表格1poi分类与人口相关系数类别相关系数分配权重市场购物0.74940.1245餐饮酒店0.70100.1164政府机构0.66620.1106生活服务0.60560.1006医疗设施0.58920.0978住宅小区0.57620.0957公司企业0.57170.0949旅游景点0.54160.0899教育培训0.53540.0889交通设施0.48270.0801poi如图3所示,,从osm下载该区域建筑物矢量图斑,并依据poi类别将建筑物图层赋予相应属性,建筑物类别如图4所示,人口格网密度如图5所示;计算研究区域内poi与人口的相关系数,结果如表格1所示。依据poi构建泰森多边形,并依据泰森多边形将人口分配到建筑物中。分配结果如图6所示。构建worldpop人口与建筑物人口模型,人口重分配精度评价中r2与rmse的值分别为0.889和587.83,如图7所示。实施例二:基于前述实施例一中的一种基于城市内涝风险评估的人口空间分布模拟方法同样的发明构思,本发明提供一种基于城市内涝风险评估的人口空间分布模拟装置,具体包括:第一单元:用于获取城市建筑物poi分类与高度信息,且进行区域内建筑物信息融合;第二单元:用于通过tf-idf算法建立poi数据与城市人口密度权重关系;第三单元:用于通过对各个类别的poi点构建泰森多边形,将泰森多边形与人口格网叠置,按照poi类别占人口密度的权重计算每一个泰森多边形的人口密度;利用建筑物的建筑占地面积与高度属性,分别与各层泰森多边形叠加合并,得到建筑物内人口分布;第四单元:用于通过将无建筑物的泰森多边形中人口分配到建筑物中来完成人口数量修正。前述实施例一中的一种基于城市内涝风险评估的人口空间分布模拟方法的各种变化方式和具体实施例同样是哟用于本实施例的种基于城市内涝风险评估的人口空间分布模拟装置,通过前述对种基于城市内涝风险评估的人口空间分布模拟方法的详细描述,本领域技术人员可以清楚的知道本实施例中种基于城市内涝风险评估的人口空间分布模拟装置的实施系统,所以为了说明书的简洁,在此不再详述。实施例三:基于与前述实施例一中一种基于城市内涝风险评估的人口空间分布模拟方法同样的发明构思,本发明还另提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现上述方法的步骤。实施例四:本发明还另提供了一种基于城市内涝风险评估的人口空间分布模拟装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现上述方法的步骤。本领域内的技术人员应明白,本发明的实施例可提供为系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本说明书是参照根据本说明书实施例的系统、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。显然,本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样,倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内,则本说明书也意图包含这些改动和变型在内。当前第1页12