一种流行病流行估计方法、设备及计算机可读介质与流程

文档序号:27080413发布日期:2021-10-24 12:11阅读:178来源:国知局
一种流行病流行估计方法、设备及计算机可读介质与流程

1.本发明涉及流行病监测技术领域,尤其涉及一种流行病流行估计方法、设备及计算机可读介质。


背景技术:

2.流感是一种常见的呼吸道传染病,对公共卫生造成重大的发病率和死亡率影响。每年季节性流感估计会在全球造成大约300万至500万例严重疾病和多达65万人死亡,给保健服务造成重大负担。为了遏制这些流行病,每个季节重大流感活动的开始必须宣布,及时警惕季节性流感流行的发生,可使卫生界启动适当的流感应对计划,并为随后大幅增加医疗服务的发病率和利用率做好准备。在温带地区,季节性流感流行病一般发生在冬季;然而,由于循环病毒株、人口免疫、人类流动性以及环境和其他因素的差异,这些流行病的确切发病、持续时间和严重程度尚不清楚。因此,一种直观和可靠的估计流行病发作的方法,对公共卫生决策者非常有价值,因为它可以帮助公共卫生机构及时应对即将到来的流行病高峰。
3.当发病率超过流行阈值时,定义为流行开始。因此,计算疫情阈值背后的算法成为检测疫情发生的关键。目前卫生界提出了一系列不同复杂性的方法,在计算流行病阈值方面没有达成共识。以前广泛使用的获取时变流行阈值的方法来自1963年serfling提出的周期回归模型。此后,开发了各种类似serfling的回归模型,以检测流感流行的发病和高峰时间,并描述流感的季节模式。然而,这些serfling模型方法存在很多缺点。
4.一些研究试图界定流行病阈值,同时考虑到流行病曲线的特性,例如病例数目的增加。利用指数平滑技术和流行病曲线数值导数的性质,nobre和stroup检测了流行开始。这种方法不需要长期的历史数据,可以应用于不到一年的监视系列;然而,先决条件包括所选择的多项式模型必须很好地拟合数据,并且需要探索性分析来选择指数平滑模型的参数。世界卫生组织欧洲区域办事处和欧洲疾病预防控制中心实施了移动流行病方法,以确定欧洲流感监测的基线流感活动和流行病阈值。最大累积率百分比曲线的斜率小于预定的标准δ,mem计算最佳流行持续时间后的流行开始和结束。虽然mem可以用于分析一个单一的流感季节,只需33周的观察,但确定δ是困难的,因为它是具体国家。最近有人开发了一种移动logistic回归方法(mlrm)来确定中国大陆30个省份季节性流感流行的阈值。mlrm用logistic回归模型逼近累积流行病曲线。在mem之后,mlrm选择最佳流行持续时间,r2小于0.01略有变化。然而,mlrm的应用仅限于对称流行波,不适合于非对称或双峰流行波。
5.虽然检测流行病发病的主要方法是基于阈值的,但也提出了一些估计流行病发病的非阈值方法。为了研究流感的时空传播模式,charu等人和geoghegan等人用分段回归模型(srm)确定流行病的发病时间。他们将分段回归模型拟合到流行病曲线的前半部分(即峰值前流感样疾病ili的每周时间序列),其中断点量化了发病率的突然变化,其时间与流行开始相对应。srm不依赖于任何阈值,可以应用于单一流感季节,而不需要历史数据,因为它完全根据流行病曲线的特性来定义流行开始。但srm估计的流行病设定与使用其他流感监
测系统的其他基于阈值的方法之间的一致性尚不清楚。


技术实现要素:

6.有鉴于此,本发明的目的是提供一种流行病流行估计方法、设备及计算机可读介质,能够直观和可靠的估计流行病流行,可以用来建立特定地区的流行阈值,如实地描述流感疫情,可作为流感监测系统的有效补充。
7.本发明通过以下技术手段解决上述技术问题:
8.一种流行病流行估计方法,设{y
t
,t=1,2,...,t}表示对应t周的流感季节的每周流行病曲线,其中y
t
是每个哨点在第t周报告的流感样疾病ili病例数,具体包括以下步骤,
9.s1、在给定的点k(t,y
t
)(t=1,2,...,t)为圆心o(t
c
,y
tc
),做半径为r的圆,所述圆由k点周围的n个点进行最小二乘法拟合而成;当k在流行病曲线的边缘(或者)时,流行病曲线的第一个或最后一个点被线性外推,以个额外点来填充曲线,在k处的原始曲率ct是半径r的倒数;
10.s2、切线点最接近k,将直线ok与拟合圆相交确定,然后计算出切线向量pq的方向角角度θt;
11.s3、基于方向角θt和上阈值h对原始曲率ct进行滤波;
12.s4、找出每一半边的流行病曲线上具有最大滤波曲率的点t0和t
e

13.s5、切点坐标对应流行开始时间和流行开始强度,同样切点坐标对应于流行病结束时间和流行病结束强度。
14.进一步,所述步骤s1中的n≥3,且n为奇数。因为需要三个点来确定一个圆,n≥3,且为了对称n为奇数。
15.进一步,所述步骤s1中的n为5或者7。经验证,在固定h的情况下,n=5或者7的流行开始和持续时间的一致性大致相同,比n=3更好。
16.进一步,所述步骤s3中对原始曲率ct进行滤波,具体为:
[0017][0018]
其中,i是指示函数,产生最大yt的参数t指峰值时间。
[0019]
进一步,所述步骤s4中找出t0和t
e
,具体方法为:,具体方法为:
[0020]
本发明还公开了一种基于最大曲率法的流行病流行估计设备,包括存储器、处理
器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
[0021]
本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述方法的步骤。
[0022]
本发明的有益效果:
[0023]
本发明将流行病曲线增加阶段的最大曲率点定义为流行开始,将位于流行病曲线下降阶段的最大曲率点定义为流行结束;为了减少流行病曲线中小波动的影响,本发明适合一个最小二乘法拟合圆到它周围的n点,而不是直接计算曲线上每个点的接触圆,而是将最小二乘法拟合圆到它周围的n个点。因为需要三个点来确定一个圆,n≥3,且为了对称n为奇数;拟合圆的曲率只衡量流行病曲线在给定的点上改变方向的速度有多快。本发明进一步利用给定点切线矢量的方向角表示其变化方向。在流行病曲线的前半部分[0
°
,90
°
]之间具有最大曲率和方向角的点被定义为流行开始;在后半部分[270
°
,360
°
]之间具有最大曲率和方向角的点确定为流行结束,任何可能出现在上阈值(h c/s/w)以上的点都会被消除,因为这些点已经处于流行状态。因此本发明能够直观和可靠的估计流行病流行,可以用来建立特定地区的流行阈值,如实地描述流感疫情,可作为流感监测系统的有效补充。
附图说明
[0024]
图1是冲绳2012/2013年流行周最小二乘圆拟合示意图;
[0025]
图2是本发明最大曲率法(mcm)的图解;
[0026]
图3是srm和mcm与etm的比较图。
具体实施方式
[0027]
以下将结合附图对本发明进行详细说明:
[0028]
本实施例以日本的季节性流行病流行估计为例进行说明。
[0029]
日本是一个弓形的岛屿条带,从24
°
n延伸到46n,约2400公里。在其最宽的点,日本不超过230公里。日本分为47个地方行政机构。北海道是最北的县;冲绳是最南的县。日本大部分地区位于温带,亚热带气候湿润。然而,日本的气候从北部凉爽潮湿的大陆气候(如北海道北部)到南部温暖的热带雨林气候(如冲绳岛石垣)各不相同。
[0030]
流感(不包括禽流感及流感大流行,例如新流感或重新出现的流感)在日本的国家传染病流行病学监测下接受哨点监测。每周诊断为ili的患者的人数的报告来源于日本各地大约5000家哨点医疗机构(3000家为儿科,2000家为内科)基于(iso8601周日期系统,根据weeks结束日志)。工作人员

管理层机构使用的报告ili的标准已在其他地方说明。国家传染病研究所的数据汇总为每周病例总数和每周包括国家和地级每个哨点的平均病例数。监测数据表于每周二在传染病周报网站上公布,提供了日本传染病监测系统的详细描述。
[0031]
在研究中,从每年9月的第35周到次年8月的第34周定义为流感季节。下载从2012年第35周到2018年第34周(从2012

09

02到2018

08

26按周结束日期计算)的idwr监测数据表。研究期间涵盖了2012/2013年至2017/2018年的六个流感季节。在以下流行病开始的估算中,只使用每个哨点每周ili病例数,以便与经验流行阈值相兼容。
[0032]
本实施例使用etm、srm和本发明的三种方法估计2012/2013年至2017/2018年六个
流感季节中每个州流感流行的开始时间。流行结束与流行开始的时间顺序相反。流行病的持续时间被定义为从开始时间到结束时间的期间。因此,我们重点描述了估计流行开始的算法。
[0033]
首先采用经验阈值法(etm),将连续三周内每个哨点每周ili报告的病例数超过预先规定的阈值y0时,即发生流行。连续三周的第一周对应流行开始。本实施例使用y0=1.0c/s/w标准,这是日本全国流感流行的阈值。这一阈值是根据2000年日本流感监测哨点10多年的观测结果经验性地确定的。
[0034]
在使用分段回归法(srm),srm拟合分段线性模型来确定流行病曲线前半部分的断点,这与流行开始相对应。换句话说,断点是两条拟合直线之间最大斜率差的最优结点位置。为了找到最优断点,将断点的对数似然函数最大化。使用srm确定流行开始。使用r包分段实现srm,并在总结该过程。
[0035]
鉴于流行病曲线的独特特征,从曲率的角度来确定流行的开始可能更合适。因此,本发明使用最大曲率法mcm来检测流行病的流行开始和结束。mcm将流行病曲线增加阶段的最大曲率点定义为流行开始。同样,位于流行病曲线下降阶段的最大曲率点定义为流行结束。为了减少流行病曲线中小波动的影响,该mcm适合一个最小二乘法拟合圆到它周围的n点,而不是直接计算曲线上每个点的接触圆,而是将最小二乘法拟合圆到它周围的n个点。因为需要三个点来确定一个圆,n≥3,且为了对称n为奇数。拟合圆的曲率只衡量流行病曲线在给定的点上改变方向的速度有多快。我们进一步利用给定点切线矢量的方向角表示其变化方向。在流行病曲线的前半部分[0
°
,90
°
]之间具有最大曲率和方向角的点被定义为流行开始;在后半部分[270
°
,360
°
]之间具有最大曲率和方向角的点确定为流行结束。任何可能出现在上阈值(h c/s/w)以上的点都会被消除,因为这些点已经处于流行状态。
[0036]
设{yt,t=1,2,...,t}表示对应t周的流感季节的每周流行病曲线,其中yt是每个哨点在第t周报告的ili病例数,为简单起见,以下称为强度。最大曲率法包括医学步奏:
[0037]
第一步,在给定的点k(t,yt)(t=1,2,...,t),圆心o(tc,ytc)、半径r的圆是由k点周围的n个点进行最小二乘法拟合而成的。当k在流行病曲线的边缘(或者时,流行病曲线的第一个(或最后一个)点被线性外推,以个额外点来填充曲线,在k处的原始曲率ct是半径r的倒数。
[0038]
第二步,切线点最接近k,其通过直线0k与拟合圆相交确定,然后计算出切线向量pq的方向角θt(以度为单位)。
[0039]
第三步,基于方向角θt和上阈值h对原始曲率ct进行滤波。
[0040][0041]
其中,工是指示函数,产生最大yt的那个参数t就是峰值时间。
[0042]
步骤4,找出每一半边的流行病曲线上具有最大滤波曲率的点和
[0043]
第5步,切点坐标对应流行开始时间和流行开始强度,同样切点坐标对应于流行病结束时间和流行病结束强度。
[0044]
上述使用的三种方法,包括etm、srm和mcm,在2012/2013年至2017/2018年的六个流感季节中,估计日本47个省中的每个省的流行病特征参数。其中,etm是一种基于1.0c/s/w的全国流行起始阈值来检测疫情的阈值方法。srm是一种现有的非阈值方法,用于捕获流行病曲线的断点作为流行开始。mcm也是一种基于流行病曲线最大曲率的非阈值检测方法。本实施例使用etm的估计作为参考标准来评估其他两种方法的性能。
[0045]
etm估计数的不完整性表明,经验流行阈值不适合于位于日本最南端或附近的省(如冲绳和鹿儿岛)的流感活动水平。冲绳严重缺乏有效的etm估计是由于背景流感活动水平高于1.0c/s/w的经验流行阈值。人们认识到,热带地区的背景流感活动全年都很活跃。因此,冲绳的流感季节性定义较少,那里的最低流感活动通常比其他更多的北部省份晚。相比之下,使用mcm建立的冲绳流行开始和结束阈值(1.9和2.6c/s/w)最大,远高于其他省份,经验流行阈值为1.0c/s/w,忠实反映冲绳流感流行特点。
[0046]
所有省份的流行病曲线都是不对称的,因为当接近流行结束时,与前半部分相比,流行病曲线的下半部相对温和。这种流行病曲线的不对称性不仅解释了为什么无论采用何种方法,在流行开始时都比在流行结束时更好地与etm达成一致,而且还表明,流行开始和结束的阈值可能是不同的,应该单独确定。mcm和etm之间的高度一致性保证了在日本流感哨点监测系统中继续使用mcm得到的流行阈值。虽然仅用六个可用的流感季节就确定了特定地区的流行开始和结束阈值,但随着今后有更多的数据可用,这些阈值可以进一步细化。除了本研究中使用的平均统计量外,其他计算阈值的程序也值得探索。
[0047]
2012/2013年、2014/2015年和2016/2017年期间mcm得出的季节性的流行病结束强度的iqr比其他三个季节的iqr更宽。这可以由流行病的严重程度来解释。在日本,2012/2013年、2014/2015年和2016/2017年流感季节的特点是a(h3)亚型占优势,而其他三个季节的优势病毒亚型是a(h1n1)pdm09和b/yamagata。以a(h3n2)亚型为主的流感流行通常比以a(h1n1)和b[52]为主的流感流行更为严重,这可能影响流行病曲线的形状。因此,建立流行病阈值,特别是流行病流行结束阈值,可以纳入关于主要流感病毒亚型的信息。
[0048]
所提出的mcm具有几个特性,使其广泛适用于公共卫生监测中的疫情估计。首先,mcm是直观的,因为它通过捕获具有最大曲率的局部点来定义流行开始。mcm是一种完全基于流行病曲线形状的非阈值确定流行起病的方法。在mcm的实现过程中,预先指定了一个上限h来限制点的搜索范围。然而,灵敏度分析表明,mcm对h具有很大的鲁棒性。因此,这个阈值不需要像etm中的y0那样精确,很容易被设置。此外,它还提供了根据流感活动的背景水平调整搜索范围的灵活性。这些特性加上冲绳的成功,使mcm有可能估计亚热带和热带地区的流行病特征参数,在这些地区,各种可引起急性呼吸道疾病的呼吸道病原体,如呼吸道合胞病毒、副流感病毒等,常年传播。因此,亚热带和热带地区的流感模式复杂,全年急性呼吸
道疾病背景率高缺乏明显的ili季节性。
[0049]
第二,与广泛使用的serfling样回归模型相比,需要大量的历史数据来估计模型参数,mcm的参数是预先指定的。这意味着mcm可以应用于历史数据有限的地区和分析通常持续一个季节的流感大流行。用经验阈值、serfling型回归模型和srm确定的流行病集被用来研究流感大流行和流行病的空间传播。利用mcm可以获得对流感空间传播的新见解,因为它完全根据流行病曲线的特性来定义流行开始。
[0050]
第三,虽然mcm中的计算比srm更复杂,但使用我们的新mcm导出的估计值与使用etm导出的估计值吻合得更好。etm和mcm所得出的流行病数据集之间的高度一致性意味着,在确定日本国家流行病发病指标时,可能考虑到曲线特性,如曲率。
[0051]
最后,mcm不仅对参数n和h的建模具有鲁棒性,而且对流感季节的划分和流行峰的确定也具有鲁棒性。关于流行开始的估计,mcm通过只使用当前点周围的n个点拟合一个最小二乘圆来计算每个点的曲率。在搜索最大曲率的局部点时,mcm还考虑到每个点处曲率的变化方向,这确保了只有流行病曲线上升阶段的点才是目标。相反,srm适合两条折线,使用流行病曲线上半部分的所有点。因此,当流感季节开始和结束时,可能会对流行开始估计产生影响。在本研究中,将每个流感季节的开始定义为第35周是合适的,但冲绳在2012/2013、2014/2015和2016/2srm拟合的第一条折线大约包括上一个流感季节的最后10周,这导致了对前几周的流行病发作估计有偏差。在这种情况下,这些星期的曲率被mcm过滤掉,因为它们的方向角不在[0
°
,90
°
]之间。此外,考虑曲率方向可能使mcm能够克服mlrm[30]的约束,并适用于在亚热带和热带地区观察到的多种流感流行波。此外,srm对疫峰时间的测定比mcm更敏感。然而,疫情高峰可能会受到很大的波动,如2009年中国大流行的国庆节假期期间ili活动的急剧下降。在这种情况下,srm将导致流行病开始估计的很大偏差。
[0052]
本实施例还公开了一种基于最大曲率法的流行病流行估计设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
[0053]
另外,本实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法的步骤。
[0054]
以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。本发明未详细描述的技术、形状、构造部分均为公知技术。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1