1.本技术涉及管理领域、生物数学领域和计算机技术领域等,尤其涉及一种考虑区域风险等级特异性的疫苗分配方法、系统及终端。
背景技术:2.注射疫苗被看作是最有效、最治本的控制传染病的措施。由于病毒的不确定性和疫苗开发、生产和交付方面的限制,在传染病大流行的早期阶段可能无法获得有效的疫苗。预计从分离一种新的大流行性病毒到开始大规模生产疫苗至少需要几个月的时间。因此,疫苗的供应往往是有限的,而随着疫情的扩散,人们对疫苗的需求呈现爆炸式增长。在疫苗稀缺的情况下,疫苗的分配策略很大程度上影响疫情的发展。不合理的疫苗分配,不仅不能减缓疫情,还会加剧社会的不公平,促使社会动乱。从人道主义角度,如何进行有效的疫苗分配以尽量减少传染病的感染人数和死亡人数是一个值得研究的问题。
3.现有的疫苗分配系统多集中于按照年龄、职业,地理空间等进行疫苗分配,但是值得注意的是传染病的传播具有以爆发点为中心四处扩散的特性,较少有人考虑了这个特性。本系统考虑了传染病传播的特点,应用机器学习的方法对风险等级进行划分,进而提出了考虑区域风险等级特异性的疫苗分配方法。同时,鉴于传染病预测模型与优化模型结合的复杂性,现有疫苗分配系统无法根据实际疫情数据对传染病预测模型参数进行调整,无法做出高效准确的疫苗分配决策。
4.综上,考虑区域风险等级特异性的疫苗分配系统有发明和推广的必要。
技术实现要素:5.为解决以上技术问题,本技术提出了一种考虑区域风险等级特异性的疫苗分配方法、系统及终端,构建了基于实际疫情数据进行参数调整的传染病预测模型,并结合传染病传播的特点,应用机器学习的方法对风险等级进行划分,进而提出了考虑区域风险等级特异性的疫苗分配方法,使得在疫苗供应不足的情况下,最小化传染病的感染人数或死亡人数,促进社会公平,减缓社会动乱。
6.第一方面,本技术提出了一种考虑区域风险等级特异性的疫苗分配方法,包括:
7.统计人口信息(人口规模数据、人口迁移数据)和疫情传播特征信息(传染病传播特性和死亡人数、感染人数、康复人数等疫情相关数据);
8.根据人口信息和疫情传播特征信息,计算新增确诊人口密度和疫情源头地区人口的迁入率,并将其作为特征;
9.根据新增确诊人口密度和疫情源头地区人口的迁入率,对城市进行风险等级分类;
10.根据风险等级分类结果、人口信息和疫情传播特征信息,建立考虑区域风险等级特异性的传染病预测模型;
11.根据人口信息和疫情传播特征信息,通过解决反向问题,对考虑区域风险等级特
异性的传染病预测模型的部分重要参数进行求解;
12.根据传染病预测模型、优化思想和疫苗的有效性,建立考虑区域风险等级特异性的疫苗分配模型,并确定各风险等级区域的疫苗最优分配方案。
13.第二方面,本技术提供一种考虑区域风险等级特异性的疫苗分配系统,包括:
14.信息获取单元,用于获取人口信息和疫情传播特征信息;
15.区域风险等级分类单元,用于首先将疫情源头地区定义为极高风险等级地区,然后根据人口信息和疫情传播特征信息,计算新增确诊人口密度和疫情源头地区人口的迁入率,并对各个城市(除疫情源头地区以外)进行风险等级分类;
16.传染病预测模型训练单元,用于构建考虑区域风险等级特异性的传染病预测模型,并通过线性逼近约束优化算法解决反向问题,对模型的部分重要参数进行训练;
17.疫苗最优分配方案单元,用于根据传染病预测模型、优化思想和疫苗的有效性,建立考虑区域风险等级特异性的疫苗分配模型,并确定各风险等级区域的疫苗最优分配方案。
18.第三方面,本技术提供一种终端
19.至少有一个cpu;
20.至少有一个存储器,用于存储至少一个计算机程序;
21.至少有一个输出设备;
22.当上述至少一个计算机程序被至少一个cpu执行时,使得上述任一项考虑区域风险等级特异性的疫苗分配方法的步骤得以实现,并由至少一个输出设备输出最终的各风险等级区域的疫苗最优分配方案。
23.该申请提供的方法、系统及终端的优势在于:提出了一种考虑区域风险等级特异性的疫苗分配方法,利用人口信息和疫情传播特征信息,划分区域风险等级,并构建了考虑区域风险等级特异性的传染病预测模型和考虑区域风险等级特异性的疫苗分配模型,最终确定了各风险等级区域的疫苗最优分配方案。该方法充分考虑了传染病的传播特性,使得有限的疫苗得到最合理的分配,以最小化感染人数和死亡人数,减少传染病带来的社会损失。
附图说明
24.为了更清楚地说明本技术实施例或背景技术中的技术方案,下面将对本技术实施例或背景技术中所需要使用的附图进行说明。
25.图1是本技术提出的考虑区域风险等级特异性的疫苗分配方法的流程图;
26.图2是本技术提出的疫苗分配方法的具体应用场景流程图;
27.图3是本技术提出的考虑区域风险等级特异性的疫苗分配系统的结构示意图;
28.图4是本技术提供的终端示意图。
具体实施方式
29.图1是本技术提出的考虑区域风险等级特异性的疫苗分配方法的流程图,上述方法包括以下内容:
30.在步骤101中,统计人口信息和疫情传播特征信息。其中,人口信息包括人口规模
数据和人口迁移数据,疫情传播特征信息包括传染病传播特性和死亡人数、感染人数、康复人数等疫情相关数据。传染病传播特性包括,存在无症状患者这一群体,无症状患者存在一定的传染性,其传染性弱于有症状患者;传染病传播以爆发点为中心向四周呈现环形扩散的趋势。
31.具体的,人口规模数据来自中国国家统计局;人口迁移数据来自于腾讯位置大数据官网;死亡人数、感染人数、康复人数等疫情相关数据来自中华人民共和国国家卫生健康委员会和相关省份卫生健康委员会官方网站。传染病传播中以爆发点为中心向四周呈现环形扩散的特性,主要通过引入两个特征(新增确诊人口密度和疫情源头地区人口的迁入率)来刻画。传染病传播中有关无症状患者的特性,主要通过在传统易感-感染-康复模型(sir)中增加新的隔间和新的感染路径来刻画。
32.在步骤102中,根据人口信息和疫情传播特征信息,以新增人口密度和疫情源头地区人口的迁入率为特征,对城市进行风险等级分类。
33.具体的,首先将疫情源头地区定义为极高风险等级地区。然后,根据人口信息和疫情传播特征信息,计算新增确诊人口密度和疫情源头地区人口的迁入率,并将其作为特征。为了使得两个特征在同一量级上,还需要对数据进行标准化和0-1缩放处理。接着,根据新增确诊人口密度和疫情源头地区人口的迁入率两个特征,利用误差平方和(sse)和轮廓系数法确定簇数值,采用k-mean算法对除疫情源头地区以外的城市进行聚类。
34.上述步骤102可以基于以下方式实现:
35.根据公式计算新增确诊人口密度和疫情源头地区人口的迁入率,所述公式为:
[0036][0037][0038]
其中,i'i(0)表示城市i在所研究时间段内初始时刻的累计感染人数;i'i(n)表示城市i在所研究时间段内最后时刻的累计感染人数;ai是城市i的人口规模;pi(t)被定义为迁移率,fi(t)表示隶属于疫情源头地区的城市向城市i迁移的人口占疫情源头城市迁移人口总数的比例。
[0039]
根据公式对特征进行标准化和0-1缩放处理,以为聚类做准备,所述公式为:
[0040][0041][0042]
其中,x表示特征,μ为特征的平均值,σ为特征的标准差。x
min
为同一特征中的最小值,x
max
为同一特征中的最大值。
[0043]
根据公式对除疫情源头地区以外的城市进行聚类,所述公式为:
[0044][0045]
其中,k为除疫情源头地区以外的城市聚类的簇数,x(i)为处理后的特征,μ
(k)
为每簇的质心,c为城市的聚类情况。
[0046]
在步骤103中,根据风险等级分类结果、人口信息和疫情传播特征信息,构建考虑
区域风险等级特异性的传染病预测模型,并通过解决反向问题求解其重要参数。
[0047]
具体的,考虑到无症状患者对在疾病传播中的重要作用,利用包含4种流行病学状态的微分方程组,本技术提出了考虑无症状患者具有传染性的seir模型。该模型主要包括四个状态,s表示容易感染的人群,e表示已经被感染但是暂时没有出现症状的人群,i表示已经被感染且出现一定症状的人群,r表示在感染后康复的人群。其中,e又包括两个部分,e1表示自感染到康复都没有出现症状的人群,e2表示此时无症状但随后会出现症状的人群。在考虑无症状患者具有传染性的seir模型的基础上,基于传染病以爆发点为中心向四周呈现环形扩散的特性和风险等级分类的结果,本技术进一步将人群按照风险等级划分为多个子群体,构建考虑区域风险等级特异性的传染病预测模型。考虑区域风险等级特异性的传染病预测模型的参数,一部分可以通过查阅文献获得,一部分关键参数(βe、βi和vk)受到疫情实际情况的影响,在数据可获得的情况下可以通过求解反向问题来获得。
[0048]
上述步骤103可以基于以下方式实现:
[0049]
根据风险等级分类结果、人口信息和疫情传播特征信息,构建考虑区域风险等级特异性的传染病预测模型,所述模型为:
[0050][0051][0052][0053][0054][0055][0056][0057][0058][0059][0060]
其中,下标k指代风险等级小组,k=1,2
…
k;λk表示每个风险等级小组易感染人群被感染的速率,受感染人数、感染率和接触率(和)等多个因素的影响;βe表示易感者接触无症状患者时的被感染概率;βi表示易感者接触有症状患者时的被感染概率;τ表示无
症状但随后会出现症状的患者转化为有症状患者的速率;表示自感染到康复都没有出现症状的患者康复的速率;γ表示有症状患者康复速率;vk表示每个风险等级小组有症状患者的死亡率;s
κ
表示每个风险等级小组中容易感染的人群;e
κ
表示每个风险等级小组中已经被感染但是暂时没有出现症状的人群,e
1k
表示每个风险等级小组中自感染到康复都没有出现症状的人群,e
2k
表示每个风险等级小组中此时无症状但随后会出现症状的人群;i
κ
表示每个风险等级小组中已经被感染且出现一定症状的人群;r
κ
表示每个风险等级小组中感染后康复的人群;s(t),e(t),i(t 和r(t)为每个状态的总人数。
[0061]
根据公式计算传染病预测模型的关键参数,所述公式为:
[0062][0063]
βe<βi[0064]
其中,ia(t)和da(t)分别是传染病的实际感染人数和死亡人数;ie(t)和de(t)是使用传染病模型预测的感染人数和死亡人数;n表示可获得的实验数据总数。无症状患者的传染病病毒携带量少于有症状患者,这意味着易感者接触无症状患者时的被感染概率(βe)小于易感者接触有症状患者时的被感染概率(βi)。
[0065]
在步骤104中,根据传染病预测模型、优化思想和疫苗的有效性,建立考虑区域风险等级特异性的疫苗分配模型,并确定各风险等级区域的疫苗最优分配方案。
[0066]
具体的,疫苗接种是减少传染病疾病负担的主要战略,可以通过直接作用或者间接作用降低易感者的感染速率。直接作用是指接种疫苗可以通过增强人体对传染病病毒的抵抗力来直接降低易感者的感染速率。间接作用是指在接种疫苗后,感染人数减少,传染的力度变小,进一步间接减少易感者的感染速率,达到正向促进的作用。值的注意的是,并非所有接种疫苗的人都能产生病毒的抗体,即疫苗存在一定的有效性 (ε),这就意味着注射疫苗的人仍然有(1-ε)概率被感染。疫苗的分配策略与每个地区的疫情风险等级紧密相关,本技术将区域风险等级特异性的传染病预测模型嵌入优化模型中,用其来预测t时间后死亡人数或者感染人数。同时,由于疫苗生产能力有限,接种剂量是大规模接种政策的瓶颈,疫苗分配部分仅受疫苗数量的约束。因此,本技术在风险等级划分的基础上进一步将人群分为注射疫苗的人群和没有注射疫苗的人群,以感染人数或者死亡人数最小为决策目标,以每个风险等级地区注射疫苗的百分比为决策变量,以各个风险等级地区注射疫苗剂量之和小于可获得的疫苗总量为约束,构建考虑区域风险等级特异性的疫苗分配模型。然后根据考虑区域风险等级特异性的疫苗分配模型和疫情相关数据,输入可获得的疫苗总量,确定各风险等级区域的疫苗最优分配方案。
[0067]
上述步骤104可以基于以下方式实现:
[0068]
根据传染病预测模型、优化思想和疫苗的有效性,建立考虑区域风险等级特异性的疫苗分配模型,并确定各风险等级区域的疫苗最优分配方案,所述模型为:
[0069][0070]
subject to 0≤pk≤1,
[0071][0072][0073][0074][0075][0076][0077][0078][0079][0080][0081][0082][0083][0084][0085][0086][0087]
其中,分别为各风险等级中未接种疫苗的易感、无症状、有症状、康复和死亡的人数,为各风险等级中接种疫苗的易感、无症状、有症状、康复和死亡的人数,w为可供分配的疫苗剂量数。当b=0时,目标函数为t时间后死亡人数最少,当 b=1时,目标函数为t时间后感染人数最少。最后通过
遗传算法计算每个群集接种疫苗的最佳比例pk。
[0088]
图2是本技术提出的疫苗分配方法的具体应用场景流程图,应用于传染病疫苗在各风险等级地区中的分配,上述方法包括以下内容:
[0089]
在步骤201中,利用爬虫等技术,获得人口信息和疫情传播特征信息。
[0090]
具体的,通过python爬虫收集包括疫情源头地区在内的所有城市每日的死亡人数、感染人数、康复人数、疫情源头地区人口迁移指数和疫情源头地区人口向其他城市迁移的比例以及所有城市的人口规模数据。
[0091]
在步骤202中,根据人口信息和疫情传播特征信息,计算新增确诊人口密度和疫情源头地区人口的迁入率,并将其作为特征。
[0092]
根据公式计算新增确诊人口密度和疫情源头地区人口的迁入率,所述公式为:
[0093][0094][0095]
为了使得两个特征在同一量级上,还需要对数据进行标准化和0-1缩放处理。
[0096]
举例来说,经过上述计算和数据处理,某城市的新增确诊人口密度和疫情源头地区人口的迁入率分别为0.832972和0.633348。此外,还可以分别得到其他城市的新增确诊人口密度和疫情源头地区人口的迁入率。
[0097]
在步骤203中,根据新增确诊人口密度和疫情源头地区人口的迁入率,对城市进行风险等级分类。
[0098]
将疫情源头地区定义为极高风险等级地区。
[0099]
具体的,疫情源头地区疾病进展速度比其他城市快,将其归为单独的一类,即极高风险等级地区。
[0100][0101]
其中,k为除疫情源头地区以外的城市聚类的簇数,x(i)为处理后的特征,μ
(k)
为每簇的质心,c为城市的聚类情况。
[0102]
举例来说,根据各城市新增感染人口密度和疫情源头地区人口迁入率对其他城市进行聚类。首先,利用误差平方和(sse)和轮廓系数法确定簇数值为4,然后利用k-means算法将除疫情源头地区以外的城市进行聚类。据此,包括疫情源头地区在内的所有城市被划分为5个风险等级。
[0103]
在步骤204中,根据风险等级分类结果、人口信息和疫情传播特征信息,建立考虑区域风险等级特异性的传染病预测模型。
[0104]
根据风险等级分类结果、人口信息和疫情传播特征信息,构建考虑区域风险等级特异性的传染病预测模型,所述模型为:
[0105][0106]
[0107][0108][0109][0110][0111][0112][0113][0114][0115]
举例来说,模型中一共有5个风险等级区域,k=5;无症状但随后会出现症状的患者转化为有症状患者的速率(τ)为0.196;自感染到康复都没有出现症状的患者康复的速率为0.25;有症状患者康复速率(γ)为0.1;每个风险等级小组中自感染到康复都没有出现症状的人群与每个风险等级小组中此时无症状但随后会出现症状的人群的比值为0.41。
[0116]
在步骤205中,根据人口信息和疫情传播特征信息,通过解决反向问题,对考虑区域风险等级特异性的传染病预测模型的部分重要参数进行求解。
[0117]
根据公式计算传染病预测模型的关键参数,所述公式为:
[0118][0119]
βe<βi[0120]
举例来说,通过计算可得,低风险等级地区的死亡率为0.0003、中风险等级地区的死亡率为0.0019、高风险等级地区的死亡率为0.0030、较高风险等级地区的死亡率为0.0066、极高风险等级地区的死亡率为 0.0075。易感者接触无症状患者时的被感染概率(βe)比易感者接触有症状患者时的被感染概率(βe)为 21/23。
[0121]
在步骤206中,根据传染病预测模型、优化思想和疫苗的有效性,建立考虑区域风险等级特异性的疫苗分配模型,并确定各风险等级区域的疫苗最优分配方案。
[0122]
根据传染病预测模型、优化思想和疫苗的有效性,建立考虑区域风险等级特异性
的疫苗分配模型,所述模型为:
[0123][0124]
subject to 0≤pk≤1,
[0125][0126][0127][0128][0129][0130][0131][0132][0133][0134][0135][0136][0137][0138][0139][0140][0141]
通过遗传算法求得,当有4千万剂量疫苗,且疫苗有效性为0.9时,无论目标函数为
t时间后死亡人数最少还是t时间后感染人数最少,其分配策略一致。其中,分配给极高风险等级地区1.033千万剂量疫苗,分配给较高风险等级地区0.108千万剂量疫苗,分配给高风险等级地区1.281千万剂量疫苗,分配给中风险等级地区1.578千万剂量疫苗,暂时不给低风险等级地区分配疫苗。当拥有的疫苗剂量有限时,优先将疫苗分配给风险等级较高的区域,然后按照风险等级依次分配给其他区域。
[0142]
图3是本技术提出的考虑区域风险等级特异性的疫苗分配系统的结构示意图,包括以下内容:
[0143]
信息获取单元301,用于统计人口信息和疫情传播特征信息;
[0144]
区域风险等级分类单元302,用于首先将疫情源头地区定义为极高风险等级地区,然后根据人口信息和疫情传播特征信息,计算新增确诊人口密度和疫情源头地区人口的迁入率,并对各个城市(除疫情源头地区以外)进行风险等级分类;
[0145]
传染病预测模型训练单元303,用于构建考虑区域风险等级特异性的传染病预测模型,并通过线性逼近约束优化算法解决反向问题,对模型的部分重要参数进行训练;
[0146]
疫苗最优分配方案单元304,用于根据传染病预测模型、优化思想和疫苗的有效性,建立考虑区域风险等级特异性的疫苗分配模型,并确定各风险等级区域的疫苗最优分配方案。
[0147]
信息获取单元301,用于统计人口信息和疫情传播特征信息。其中,人口信息包括人口规模数据和人口迁移数据,疫情传播特征信息包括传染病传播特性和死亡人数、感染人数、康复人数等疫情相关数据。
[0148]
区域风险等级分类单元302,用于首先将疫情源头地区定义为极高风险等级地区,然后根据人口信息和疫情传播特征信息,计算新增确诊人口密度和疫情源头地区人口的迁入率,并对各个城市(除疫情源头地区以外)进行风险等级分类,具体的,首先将疫情源头地区定义为极高风险等级地区。然后,根据人口信息和疫情传播特征信息,计算新增确诊人口密度和疫情源头地区人口的迁入率,并将其作为特征。为了使得两个特征在同一量级上,还需要对数据进行标准化和0-1缩放处理。接着,根据新增确诊人口密度和疫情源头地区人口的迁入率两个特征,利用误差平方和(sse)和轮廓系数法确定簇数值,采用k-mean算法对除疫情源头地区以外的城市进行聚类。
[0149]
传染病预测模型训练单元303,用于构建考虑区域风险等级特异性的传染病预测模型,并通过线性逼近约束优化算法解决反向问题,对模型的部分重要参数进行训练;
[0150]
具体的,根据风险等级分类结果、人口信息和疫情传播特征信息,构建考虑区域风险等级特异性的传染病预测模型,所述模型为:
[0151][0152][0153][0154]
[0155][0156][0157][0158][0159][0160][0161]
其中,下标k指代风险等级小组,k=1,2
…
k;λk表示每个风险等级小组易感染人群被感染的速率,受感染人数、感染率和接触率(和)等多个因素的影响;βe表示易感者接触无症状患者时的被感染概率;βi表示易感者接触有症状患者时的被感染概率;τ表示无症状但随后会出现症状的患者转化为有症状患者的速率;表示自感染到康复都没有出现症状的患者康复的速率;γ表示有症状患者康复速率;vk表示每个风险等级小组有症状患者的死亡率;s
κ
表示每个风险等级小组中容易感染的人群;e
κ
表示每个风险等级小组中已经被感染但是暂时没有出现症状的人群,e1k表示每个风险等级小组中自感染到康复都没有出现症状的人群,e2k表示每个风险等级小组中此时无症状但随后会出现症状的人群;i
κ
表示每个风险等级小组中已经被感染且出现一定症状的人群;r
κ
表示每个风险等级小组中感染后康复的人群;s(t),e(t),i(t) 和r(t)为每个状态的总人数。
[0162]
根据公式计算传染病预测模型的关键参数,所述公式为:
[0163][0164]
βe<βi[0165]
其中,ia(t)和da(t)分别是传染病的实际感染人数和死亡人数;ie(t)和de(t)是使用传染病模型预测的感染人数和死亡人数;n表示可获得的实验数据总数。无症状患者的传染病病毒携带量少于有症状患者,这意味着易感者接触无症状患者时的被感染概率(βe)小于易感者接触有症状患者时的被感染概率(βi)。
[0166]
疫苗最优分配方案单元304,用于根据传染病预测模型、优化思想和疫苗的有效性,建立考虑区域风险等级特异性的疫苗分配模型,并确定各风险等级区域的疫苗最优分配方案。
[0167]
具体的,建立考虑区域风险等级特异性的疫苗分配模型:
[0168]
[0169]
subject to 0≤pk≤1,
[0170][0171][0172][0173][0174][0175][0176][0177][0178][0179][0180][0181][0182][0183][0184][0185][0186]
其中,分别为各风险等级中未接种疫苗的易感、无症状、有症状、康复和死亡的人数,为各风险等级中接种
疫苗的易感、无症状、有症状、康复和死亡的人数,w为可供分配的疫苗剂量数。当b=0时,目标函数为t时间后死亡人数最少,当 b=1时,目标函数为t时间后感染人数最少。最后通过遗传算法计算每个群集接种疫苗的最佳比例pk。
[0187]
图4是本技术提供的终端示意图包括以下内容:
[0188]
至少有一个cpu401;
[0189]
至少有一个存储器,用于存储至少一个计算机程序402;
[0190]
至少有一个输出设备403;
[0191]
当上述至少一个计算机程序被至少一个cpu执行时,使得上述任一项考虑区域风险等级特异性的疫苗分配方法的步骤得以实现,并由至少一个输出装置输出最终的各风险等级区域的疫苗最优分配方案。
[0192]
所述终端还可以包括输入终端设备、网络接入设备等,不仅限于存储器401、cpu402、输出设备403。存储器401可以是ram、rom或硬盘等,主要用于存储与系统相关的全部信息,包括输入的原始数据、计算机程序、处理器可执行的指令以及上述任一项考虑区域风险等级特异性的疫苗分配方法步骤的运行结果;cpu402是终端的核心,主要用于与存储设备进行交互、解析并执行计算机指令,实现图3所示的步骤301至步骤304;输出设备403包括显示器、投影仪、打印机、语音输出系统等,主要用于输出最终的考虑区域风险等级特异性的疫苗最优分配方案。