1.本发明涉及一种大规模轨迹数据模拟流感时空传播过程的方法及系统。
背景技术:2.流感是由流感病毒、副流感病毒引起的急性呼吸道感染疾病,通过染病者咳嗽或打喷嚏时产生的飞沫和微粒,病毒很容易在人与人之间传播,严重危害了人民群众的生命健康。人类活动的时空演变和人口密度的相关波动是传染病暴发动态的关键驱动因素。通过追踪城市个体之间高时空分辨率下的接触,从离散个体出发,基于不同个体活动的时间和位置信息等推断可能被感染的个体,有助于准确表达流感时空扩散过程,提高对流感传播空间模式预测的准确性。近年来,大规模个体轨迹数据(手机位置数据、浮动车gps数据、公交刷卡数据等)出现了爆发式增长,可以精准定位移动个体的时空信息,为突破传染病防控在时空精准性上的瓶颈提供了新的契机。
3.目前,城市尺度下的基于智能体的传染病模型主要通过出行调查数据重构个体移动和个体间的接触网络,并研究传染病在时间序列上的传播特征。
4.但是,现有技术至少存在如下缺点:构建面向真实世界的智能体模型需要大量真实的个体数据,否则无法知晓精确的个体位置和个体间的接触。尽管已有研究尝试基于轨迹数据进行人群移动建模,进而构建传染病扩散模型,但是,现有基于轨迹数据的传染病扩散建模方法尚不能有效解决融合人口属性(例如年龄、性别、职业、家庭结构)与轨迹数据移动特征的个体建模需求、缺乏融合轨迹数据构建城市个体时空邻近关系的有效方法(例如,相同时间出现在相同地点的个体),更忽略了人口稠密的现代城市中个体接触空间的复杂性;同时,轨迹数据具有样本有偏性,不能代表整个城市的全部人口。针对传染病传播过程,个体在流感病毒传播过程中表现出明显异质性,现有很多研究为简化模型参数忽略了参数间的相互影响。此外,基于智能体的空间显式传染病模型往往以较低的时空分辨率进行研究,难以从时空动态机制的角度揭示城市尺度下流感的传播过程,导致对流感爆发的时空模式预测出现延迟和偏差。
技术实现要素:5.有鉴于此,有必要提供一种大规模轨迹数据模拟流感时空传播过程的方法及系统。
6.本发明提供一种大规模轨迹数据模拟流感时空传播过程的方法,该方法包括如下步骤:a.基于人口普查数据、建筑物普查数据合成城市人口,并为合成城市人口的个体赋予相应的人口属性;b.对赋予人口属性的合成城市人口的个体,以手机位置数据为主、出行调查数据为辅,构建个体的活动链;c.以构建的个体的活动链为基础,以一小时为时间步长,动态构建一天中24个时间序列的接触网络;d.根据构建的一天中24个时间序列的接触网络,采用seir模型模拟流感在高时空分辨率下的传播。
7.其中,该方法还包括步骤:该方法还包括步骤e:在时间和空间两个视角下对模拟
结果进行分析,得到感染者之间的空间传播路径,准确定位流感疫情传播过程中的关键空间位置。
8.所述人口普查数据包括:年龄、性别、职业类型、家庭类别、家庭规模、家庭年龄成分;所述建筑物普查数据包括:建筑位置信息、楼高、建筑面积、建筑物功能;其中,所述建筑物功能包括:工厂、教学楼、居民住宅、办公楼、商场。
9.所述人口属性包括个体属性、家庭属性、是否为有手机个体;其中,所述个体属性包括:年龄、性别、职业;所述家庭属性包括:家庭结构、家庭住址、工作地。
10.所述的步骤b具体包括如下步骤:对有手机个体的出行轨迹基于手机位置数据进行构建:将同一个手机号的数据按时间排序,构成该手机用户一天的出行轨迹,基于手机基站划分泰森多边形,与手机基站位于同一泰森多边形的多个建筑物即为个体位置的候选集合;对无手机个体的出行轨迹基于出行调查数据进行构建:以出行调查的每条出行信息进行构建,得到同一交通小区的多个建筑物为个体位置的候选集合;根据上述得到的个体位置的候选集合,构建个体的活动链。
11.所述的步骤c具体包括如下步骤:根据构建的个体的活动链,以小时为时间粒度,比较不同个体在一天内进行的活动类别,将相同时刻进行相同活动且所处建筑位置相同的个体设置为时空同现的个体,基于活动类别,为时空同现的个体间赋予不同的接触概率,在接触概率的约束下,生成智能体间以小时为分辨率的动态接触网络。
12.所述活动类别包括:居家、上班/上学、休闲娱乐活动。
13.所述的步骤d具体包括如下步骤:以小时为时间单位,追踪感染事件发生在何时何地、由谁传染给谁,在流感传播过程中,个体被感染的概率称为有效感染概率p,有效感染概率的公式如下:
14.p=p
c
×
p
i
×
r
15.其中,p
c
为个体间的接触概率,p
i
为个体的感染概率,r为该个体的相对传染性;
16.最后通过蒙特卡洛方法决定该个体是否被感染。
17.所述通过蒙特卡洛方法决定该个体是否被感染包括:基于计算机生成均匀分布的伪随机数,将伪随机数与有效感染概率相比较,若伪随机数小于等于有效感染概率,则个体被感染,重复以上过程,直到最终的每天新感染人数趋势与真实数据一致且计算出的基本再生数大于1。
18.所述的步骤e具体包括如下步骤:时间序列上进行城市尺度、行政区划尺度两种尺度下的对比分析,将城市划分为1km
×
1km的网格,分析每个网格每天新感染的病例数;
19.通过构建父代感染者与子代感染者的传播拓扑关系构建疫情树,再由多棵疫情树组成疫情树林,得到父代感染者与子代被感染者之间的空间传播路径,准确定位流感疫情传播过程中的关键空间位置。
20.本发明提供一种大规模轨迹数据模拟流感时空传播过程的系统,该系统包括人口属性赋予模块、活动链构建模块、接触网络构建模块、传播模拟模块,其中:所述人口属性赋予模块用于基于人口普查数据、建筑物普查数据合成城市人口,并为合成城市人口的个体赋予相应的人口属性;所述活动链构建模块用于对赋予人口属性的合成城市人口的个体,以手机位置数据为主、出行调查数据为辅,构建个体的活动链;所述接触网络构建模块用于以构建的个体的活动链为基础,以一小时为时间步长,动态构建一天中24个时间序列的接
触网络;所述传播模拟模块用于根据构建的一天中24个时间序列的接触网络,采用seir模型模拟流感在高时空分辨率下的传播。
21.本发明大规模轨迹数据模拟流感时空传播过程的方法及系统的有益效果包括:
22.(1)融入大规模手机位置数据后,个体的移动性得到更真实的还原,在区域间的移动聚集性更强,活动空间较出行调查数据有所增加。移动模型中个体的出行位置用建筑物坐标表示,使得基于智能体的空间显式传染病模型可以在不同的时空尺度上反演流感爆发的时空信息。
23.(2)基于智能体的空间显式传染病模型设置了与流感传播相关的大量参数,提高了模型的可解释性,有助于揭示流感在高时空分辨率下的传播机制。模拟结果在城市尺度、行政区划尺度均能与原始流感数据的趋势相吻合,模拟结果刻画的疫情的空间信息有效解决了无法真实定位感染者空间位置及潜在高风险传播区域的问题。
24.(3)创新性的采用疫情树林刻画流感在小尺度空间范围下的传播规律,分析流感在格网内部及格网间的传播特征,定位流感传播过程中的高风险区域。模型可以反映流感在区域内部的传播强度、描绘流感在区域间的传播规律,有助于准确定位流感疫情传播过程中的关键空间位置。
附图说明
25.图1为本发明大规模轨迹数据模拟流感时空传播过程的方法的流程图;
26.图2为seir模型下流感自然史示意图;
27.图3为本发明实施例提供的疫情树林示意图;
28.图4为本发明大规模轨迹数据模拟流感时空传播过程的系统的硬件架构图;
29.图5为本发明实施例提供的合成个体年龄及性别分布示意图;
30.图6为本发明实施例提供的合成家庭结构分布示意图;
31.图7为本发明实施例提供的城市尺度下流感扩散过程模拟结果与真实病例比较示意图;
32.图8为本发明实施例提供的城市尺度下100次模拟结果产生的再生数的分布示意图;
33.图9为本发明实施例提供的流感扩散过程模拟结果在10个区尺度上与真实病例的比较示意图;
34.图10为本发明实施例提供的流感在城市内部传播的时空分布示意图;
35.图11为本发明实施例提供的流感在空间单元内部进行传播的强度示意图;
36.图12为本发明实施例提供的流感传播过程中一个网格所能影响的网格数量示意图;
37.图13为本发明实施例提供的两个网格间发生流感传播的事件数(连接强度)示意图;
38.图14为本发明实施例提供的流感传播过程中的空间聚集现象示意图。
具体实施方式
39.下面结合附图及具体实施例对本发明作进一步详细的说明。
40.参阅图1所示,是本发明大规模轨迹数据模拟流感时空传播过程的方法较佳实施例的作业流程图。
41.步骤s1,基于人口普查数据、建筑物普查数据合成城市人口,并为合成城市人口的个体赋予相应的人口属性。也即是,融合多源数据构建城市人口移动模型。其中:
42.所述人口普查数据包括:年龄、性别、职业类型、家庭类别、家庭规模、家庭年龄成分;所述建筑物普查数据包括:建筑位置信息、楼高、建筑面积、建筑物功能;其中,所述建筑物功能包括:工厂、教学楼、居民住宅、办公楼、商场。
43.所述人口属性包括个体属性、家庭属性、是否为有手机个体;其中,所述个体属性包括:年龄、性别、职业;所述家庭属性包括:家庭结构、家庭住址、工作地。
44.具体而言:
45.首先,根据人口普查数据中年龄、性别、职业类型等个体属性的概率分布,通过蒙特卡洛模拟为每个合成城市人口的个体分配相应的个体属性。其次,根据人口普查数据中家庭类别、家庭规模、家庭年龄成分等家庭属性的概率构建合成家庭,并将合成城市人口的个体填充进合成家庭。最后,根据不同性别和年龄段的手机使用率进行蒙特卡洛模拟,为合成城市人口的个体赋予是否为有手机个体的属性,将合成城市人口的个体分为有手机个体和无手机个体两类。
46.步骤s2,对赋予人口属性的合成城市人口的个体(以下简称“个体”),以手机位置数据为主、出行调查数据为辅,构建个体的活动链。也即是,以手机数据为主、出行调查数据为辅,基于个体出行的时空特征与建筑物普查数据结合,实现建筑物尺度的个体移动建模。具体而言:
47.对有手机个体的出行轨迹基于手机位置数据进行重构,无手机个体的出行轨迹基于出行调查数据进行构建。此时,通过手机数据识别出的有手机个体的职住地的空间范围细化到手机基站服务范围,基于出行调查记录的无手机个体的职住地的空间范围细化到交通小区。
48.进一步地,所述手机位置数据包括:匿名手机号、时间、基站经纬度,将同一个手机号的数据按时间排序,构成该手机用户一天的出行轨迹,此时用户的出行位置为手机基站的位置。然后,基于手机基站划分泰森多边形(泰森多边形的范围即为手机基站的服务范围),与手机基站位于同一泰森多边形的多个建筑物即为个体位置的候选集合。
49.出行调查是对个体出行行为的调查,所述出行调查数据包括:个体工作单位、出发地、目的地、出发时间、结束时间、出行方式、出行目的等,但位置信息以交通小区为单位。无手机个体的出行轨迹以出行调查的每条出行信息进行构建,得到同一交通小区的多个建筑物即为个体位置的候选集合。
50.根据上述得到的个体位置的候选集合,构建个体的活动链。
51.步骤s3,以构建的个体的活动链为基础,以一小时为时间步长,动态构建一天中24个时间序列的接触网络。
52.也即是,基于城市人口的个体活动链动态构建接触网络。根据构建的个体的活动链,以小时为时间粒度,比较不同个体在一天内进行的活动类别,将相同时刻进行相同活动且所处建筑位置相同的个体设置为时空同现的个体。基于活动类别,为时空同现的个体间赋予不同的接触概率。在接触概率的约束下,生成智能体间以小时为分辨率的动态接触网
络。其中,所述活动类别包括:居家、上班/上学、休闲娱乐活动。
53.具体而言:
54.在一个时间段的接触网络中,以顶点代表出行个体,出现在相同位置的个体之间用边相连,所述位置以家庭(居家)、工作单位(工作),建筑地址(休闲)为单位。相同时间出现在相同位置的个体间以一定的概率产生接触,该接触概率记为p
c
。
55.一个个体在一天中有24个接触网络,以一个接触网络为例,网络中的顶点表示个体,出现在相同位置的个体用边相连,表示两个个体相同时间的出行位置相同。然后,根据表1的接触概率,判断相同时间出现在相同位置的两个个体是否真正产生接触,例如,感染者为成年人时,其居家的时候以0.25的概率与未成年人发生接触,以0.4的概率与成年人发生接触。
56.个体从事不同活动时,个体间的接触概率不同(见表1),根据接触概率每1小时生成一个个体间的接触网络,一天24个接触网络构成最终的动态接触网络。
57.表1个体间接触概率
[0058][0059]
步骤s4,根据构建的一天中24个时间序列的接触网络,采用seir模型模拟流感在高时空分辨率下的传播。具体而言:
[0060]
seir模型根据流感自然史将个体分为四种状态(图2):易感期、潜伏期、感染期、恢复期。如图2所示,由于疫苗的接种以及自身抗体的产生,一部分易感人群对流感病毒具有免疫力;一个易感个体以一定的概率被感染进入潜伏期;病毒在体内寄生若干时间后,个体具有传染性,进入传染期;处于传染期的感染者可能显现出流感相应的症状,也可能没有明显症状。最后该个体被治愈,进入恢复状态。
[0061]
模拟过程以小时为时间单位,追踪感染事件发生在何时何地、由谁传染给谁。在流感传播过程中,个体被感染的概率称为有效感染概率p。在模型中,有效感染概率的公式如下:
[0062]
p=p
c
×
p
i
×
r
[0063]
其中p
c
为个体间的接触概率,p
i
为个体的感染概率,r为该个体的相对传染性。最终通过蒙特卡洛方法决定该个体是否被感染:基于计算机生成均匀分布的伪随机数,将伪随机数与有效感染概率相比较,若伪随机数小于等于有效感染概率,则个体被感染。重复以上过程,直到最终的每天新感染人数趋势与真实数据一致且计算出的基本再生数大于1。
[0064]
步骤s5:在时间和空间两个视角下对模拟结果进行分析,探究流感爆发趋势及强度,分析流感传播过程中的高风险区域,准确定位流感疫情传播过程中的关键空间位置。
[0065]
其中,所述流感爆发趋势及强度是指:流感的爆发趋势主要体现在每天新感染的病例在时间上产生的曲线,所述曲线大致呈正态分布,若曲线幅度较窄,表明爆发速度较快,反之,爆发速度较为缓和,曲线峰值表示爆发的严重程度,峰值越高越严重。
[0066]
所述高风险区域为累计感染人数多的区域,表示易感者在这些区域被感染的风险高。
[0067]
所述关键空间位置为区域间的传播连接性较强的位置,即对关键空间位置进行干预,可以减少流感病毒向其他区域传播,进而降低城市内部传染病的传播风险。
[0068]
具体包括:
[0069]
时间序列上进行城市尺度、行政区划尺度两种尺度下的对比分析。为了准确表达流感时空扩散过程,将城市划分为1km
×
1km的网格,分析每个网格每天新感染的病例数,所述病例数为100次模拟结果的平均值。通过构建父代感染者与子代感染者的传播拓扑关系构建疫情树,再由多棵疫情树组成疫情树林(图3),以揭示父代感染者与子代被感染者之间的空间传播路径,准确定位流感疫情传播过程中的关键空间位置,揭示流感在城市中传播时的传播距离与传播强度的关系及空间集聚效应。
[0070]
所述定位流感疫情传播过程中的关键空间位置,主要采用过分析流感病毒在空间网格间的传播强度,一个网格与其他网格的传播连接性越强(图13)、与该网格相关的网格数量越多(图12),那么该位置越重要,需要重点干预。
[0071]
网格间的空间距离表示流感的传播距离,网格间的连接权重表示流感在网格间的传播强度,为了揭示传播距离与传播强度的关系,本实施例计算了二者之间的皮尔逊相关系数r,r=-0.098,说明传播距离与传播强度呈极弱的负相关关系。
[0072]
空间集聚效应体现在连接权重大于100的区域有明显的空间聚集现象(图14),表示这些区域内部具有极强的相互传播的能力。
[0073]
参阅图4所示,是本发明大规模轨迹数据模拟流感时空传播过程的系统10的硬件架构图。该系统包括:人口属性赋予模块101、活动链构建模块102、接触网络构建模块103、传播模拟模块104以及分析模块105。
[0074]
所述人口属性赋予模块101用于基于人口普查数据、建筑物普查数据合成城市人口,并为合成城市人口的个体赋予相应的人口属性。也即是,融合多源数据构建城市人口移动模型。其中:
[0075]
所述人口普查数据包括:年龄、性别、职业类型、家庭类别、家庭规模、家庭年龄成分;所述建筑物普查数据包括:建筑位置信息、楼高、建筑面积、建筑物功能;其中,所述建筑物功能包括:工厂、教学楼、居民住宅、办公楼、商场。
[0076]
所述人口属性包括个体属性、家庭属性、是否为有手机个体;其中,所述个体属性包括:年龄、性别、职业;所述家庭属性包括:家庭结构、家庭住址、工作地。
[0077]
具体而言:
[0078]
所述人口属性赋予模块101首先根据人口普查数据中年龄、性别、职业类型等个体属性的概率分布,通过蒙特卡洛模拟为每个合成城市人口的个体分配相应的个体属性。接着根据人口普查数据中家庭类别、家庭规模、家庭年龄成分等家庭属性的概率构建合成家庭,并将合成城市人口的个体填充进合成家庭。最后根据不同性别和年龄段的手机使用率进行蒙特卡洛模拟,为合成城市人口的个体赋予是否为有手机个体的属性,将合成城市人
口的个体分为有手机个体和无手机个体两类。
[0079]
所述活动链构建模块102用于对赋予人口属性的合成城市人口的个体(以下简称“个体”),以手机位置数据为主、出行调查数据为辅,构建个体的活动链。也即是,以手机数据为主、出行调查数据为辅,基于个体出行的时空特征与建筑物普查数据结合,实现建筑物尺度的个体移动建模。具体而言:
[0080]
所述活动链构建模块102对有手机个体的出行轨迹基于手机位置数据进行重构,无手机个体的出行轨迹基于出行调查数据进行构建。此时,通过手机数据识别出的有手机个体的职住地的空间范围细化到手机基站服务范围,基于出行调查记录的无手机个体的职住地的空间范围细化到交通小区。
[0081]
进一步地,所述手机位置数据包括:匿名手机号、时间、基站经纬度,将同一个手机号的数据按时间排序,构成该手机用户一天的出行轨迹,此时用户的出行位置为手机基站的位置。然后,基于手机基站划分泰森多边形(泰森多边形的范围即为手机基站的服务范围),与手机基站位于同一泰森多边形的多个建筑物即为个体位置的候选集合。
[0082]
出行调查是对个体出行行为的调查,所述出行调查数据包括:个体工作单位、出发地、目的地、出发时间、结束时间、出行方式、出行目的等,但位置信息以交通小区为单位。无手机个体的出行轨迹以出行调查的每条出行信息进行构建,得到同一交通小区的多个建筑物即为个体位置的候选集合。
[0083]
所述活动链构建模块102根据上述得到的个体位置的候选集合,构建个体的活动链。
[0084]
所述接触网络构建模块103用于以构建的个体的活动链为基础,以一小时为时间步长,动态构建一天中24个时间序列的接触网络。也即是,所述接触网络构建模块103基于城市人口的个体活动链动态构建接触网络。根据构建的个体的活动链,以小时为时间粒度,比较不同个体在一天内进行的活动类别,将相同时刻进行相同活动且所处建筑位置相同的个体设置为时空同现的个体。基于活动类别,为时空同现的个体间赋予不同的接触概率。在接触概率的约束下,生成智能体间以小时为分辨率的动态接触网络。其中,所述活动类别包括:居家、上班/上学、休闲娱乐活动。
[0085]
具体而言:
[0086]
在一个时间段的接触网络中,以顶点代表出行个体,出现在相同位置的个体之间用边相连,所述位置以家庭(居家)、工作单位(工作),建筑地址(休闲)为单位。相同时间出现在相同位置的个体间以一定的概率产生接触,该接触概率记为p
c
。
[0087]
一个个体在一天中有24个接触网络,以一个接触网络为例,网络中的顶点表示个体,出现在相同位置的个体用边相连,表示两个个体相同时间的出行位置相同。然后,根据表1的接触概率,判断相同时间出现在相同位置的两个个体是否真正产生接触,例如,感染者为成年人时,其居家的时候以0.25的概率与未成年人发生接触,以0.4的概率与成年人发生接触。
[0088]
个体从事不同活动时,个体间的接触概率不同(见表1),根据接触概率每1小时生成一个个体间的接触网络,一天24个接触网络构成最终的动态接触网络。
[0089]
表1个体间接触概率
[0090][0091][0092]
所述传播模拟模块104用于根据构建的一天中24个时间序列的接触网络,采用seir模型模拟流感在高时空分辨率下的传播。具体而言:
[0093]
seir模型根据流感自然史将个体分为四种状态(图2):易感期、潜伏期、感染期、恢复期。如图2所示,由于疫苗的接种以及自身抗体的产生,一部分易感人群对流感病毒具有免疫力;一个易感个体以一定的概率被感染进入潜伏期;病毒在体内寄生若干时间后,个体具有传染性,进入传染期;处于传染期的感染者可能显现出流感相应的症状,也可能没有明显症状。最后该个体被治愈,进入恢复状态。
[0094]
模拟过程以小时为时间单位,追踪感染事件发生在何时何地、由谁传染给谁。在流感传播过程中,个体被感染的概率称为有效感染概率p。在模型中,有效感染概率的公式如下:
[0095]
p=p
c
×
p
i
×
r
[0096]
其中p
c
为个体间的接触概率,p
i
为个体的感染概率,r为该个体的相对传染性。最终通过蒙特卡洛方法决定该个体是否被感染:基于计算机生成均匀分布的伪随机数,将伪随机数与有效感染概率相比较,若伪随机数小于等于有效感染概率,则个体被感染。重复以上过程,直到最终的每天新感染人数趋势与真实数据一致且计算出的基本再生数大于1。
[0097]
所述分析模块105用于在时间和空间两个视角下对模拟结果进行分析,探究流感爆发趋势及强度,分析流感传播过程中的高风险区域,准确定位流感疫情传播过程中的关键空间位置。
[0098]
其中,所述流感爆发趋势及强度是指:流感的爆发趋势主要体现在每天新感染的病例在时间上产生的曲线,所述曲线大致呈正态分布,若曲线幅度较窄,表明爆发速度较快,反之,爆发速度较为缓和,曲线峰值表示爆发的严重程度,峰值越高越严重。
[0099]
所述高风险区域为累计感染人数多的区域,表示易感者在这些区域被感染的风险高。
[0100]
所述关键空间位置为区域间的传播连接性较强的位置,即对关键空间位置进行干预,可以减少流感病毒向其他区域传播,进而降低城市内部传染病的传播风险。
[0101]
具体包括:
[0102]
所述分析模块105从时间序列上进行城市尺度、行政区划尺度两种尺度下的对比分析。为了准确表达流感时空扩散过程,将城市划分为1km
×
1km的网格,分析每个网格每天新感染的病例数,所述病例数为100次模拟结果的平均值。所述分析模块105通过构建父代
感染者与子代感染者的传播拓扑关系构建疫情树,再由多棵疫情树组成疫情树林(图3),以揭示父代感染者与子代被感染者之间的空间传播路径,准确定位流感疫情传播过程中的关键空间位置,揭示流感在城市中传播时的传播距离与传播强度的关系及空间集聚效应。
[0103]
所述定位流感疫情传播过程中的关键空间位置,主要采用过分析流感病毒在空间网格间的传播强度,一个网格与其他网格的传播连接性越强(图13)、与该网格相关的网格数量越多(图12),那么该位置越重要,需要重点干预。
[0104]
网格间的空间距离表示流感的传播距离,网格间的连接权重表示流感在网格间的传播强度,为了揭示传播距离与传播强度的关系,本实施例计算了二者之间的皮尔逊相关系数r,r=-0.098,说明传播距离与传播强度呈极弱的负相关关系。
[0105]
空间集聚效应体现在连接权重大于100的区域有明显的空间聚集现象(图14),表示这些区域内部具有极强的相互传播的能力。
[0106]
本技术实施例一:
[0107]
(1)人口属性建模。根据人口普查数据中年龄、性别、职业类型等个体属性的概率分布,通过蒙特卡洛模拟为每个合成个体分配相应的个体属性,合成个体的年龄、性别分布如图5所示。根据人口普查数据中家庭类别、家庭规模、家庭年龄成分等家庭属性的概率构建合成家庭,并将合成个体填充进合成家庭,图6展示了本实施例构建的合成家庭的大小分布情况。本实施例构建的合成人口与2017年深圳市统计年鉴发布的各区人口数据相比,人口数量基本吻合。
[0108]
(2)在城市整体水平上,模拟曲线与流感真实数据在趋势上吻合度较高,可以反映流感爆发强度、爆发持续时间、峰值等重要信息。图7展示了流感扩散过程模拟结果与真实病例在时间序列上的比较,图8展示了整个模拟周期内模型产生的再生数,再生数大于1表示流行病正在传播扩散,小于1表示流行病趋于消亡。再生数的值大于1时,再生数先上升后下降,且100次模拟结果显示再生数的值在大于1的部分波动性较大。再生数的值小于1时,再生数前期先稍微下降,后期基本趋于平稳,100次模拟结果显示再生数在小于1的部分波动性较小。
[0109]
(3)在行政区划尺度下,大部分行政区仍然可以较好反映流感爆发强度及爆发趋势(图9)。坪山区、龙华区、光明区、大鹏区由于医院、社康较少,流感病例的时空密度稀疏(图9最后一行),造成模拟结果与真实流感数据在趋势上偏差较大。
[0110]
(4)图10是模拟深圳市流感扩散时空分布的结果,每个网格内的数值为100次模拟结果的平均值。本实施例提出的融合手机位置数据构建的基于智能体的空间显式传染病模型可以支持追踪感染者的位置信息,及其与其他易感者的交互情况,有效解决了无法真实定位感染者空间位置及潜在高风险传播区域的问题。
[0111]
(5)根据100次模拟结果构建疫情树,在1km
×
1km的空间尺度下,本实施例分析了每个空间单元在疫情传播过程中的重要性(图11-14)。图11反映的是流感在每个空间单元内部进行传播的数量,即父代感染者与子代被感染者的家庭位置均位于同一网格,这种感染事件往往发生在同小区的邻居间。从图11可以看出,罗湖区东南部存在一个高危区域,流感较容易在该位置内部发生感染传播,可以提醒生活在该区域的居民注意防范流感在邻居间的传播。图12、13、14反映的是流感传播过程中父代感染者与子代被感染者分别处于两个空间单元的情况。不同空间单元的父代感染者与子代被感染者的直线传播路径构成了网格
间的连接关系,将网格与网格之间的连接关系组成社交网络,图12描述的网格的值即为该网格在社交网络中的度,反映了一个网格所能影响的网格数量。可以看出,福田区与罗湖区交界处的空间单元与其他空间单元相比,会对深圳市较多地理空间产生影响。通过分析发现,流感在网格与网格间进行传播时,网格间连接关系的权重不同(连接权重表示两个网格间发生流感传播的事件数)。99.9%的网格间的连接权重小于100(图13),连接权重大于100的区域有明显的空间聚集现象(图14)。虽然连接权重大于100的区域占比非常小,但识别这部分区域至关重要,因为这部分区域对流感传播的影响较大,流感在该区域的扩散概率较大,而这部分区域明显的空间聚合现象又为流行病遏制措施的实施提供了便利。网格间的空间距离表示流感的传播距离,网格间的连接权重表示流感在网格间的传播强度,为了揭示传播距离与传播强度的关系,本实施例计算了二者之间的皮尔逊相关系数r,r=-0.098,说明传播距离与传播强度呈极弱的负相关关系。
[0112]
本发明建立了基于智能体的空间显式传染病模型。在传统依据统计数据进行个体移动建模方法的基础上,提出了一种新的融合大规模手机位置数据进行个体移动建模的时空框架,重构城市个体活动链。模型包含城市区域内的全部人口(兼具人口属性和移动行为),个体出行位置估算到建筑物,个体活动场所以家庭(居家)、工作单位(工作)、建筑(娱乐)为单元,以此构建个体间的动态接触网络。然后采用seir模型模拟流感在城市的时空传播过程,模拟的时间步长为1小时,空间尺度以建筑为单位,并且,在模拟过程中充分考虑个体对流感病毒反应的异质性。
[0113]
需要说明的是,本发明不局限在手机数据、出行调查数据、人口普查数据、建筑物普查数据等数据的融合。本发明能够针对多种传染病的传播进行模拟,例如:流感、登革热等近距离传播的疾病,此外,本发明对传染病在时间和空间上的传播均有良好的分析能力,尤其是空间分析能力。
[0114]
虽然本发明参照当前的较佳实施方式进行了描述,但本领域的技术人员应能理解,上述较佳实施方式仅用来说明本发明,并非用来限定本发明的保护范围,任何在本发明的精神和原则范围之内,所做的任何修饰、等效替换、改进等,均应包含在本发明的权利保护范围之内。