一种传染病时空聚集性探测分析方法及系统与流程

文档序号:24166364发布日期:2021-03-05 18:13阅读:88来源:国知局
一种传染病时空聚集性探测分析方法及系统与流程

1.本发明涉及公共卫生疾病预防技术领域,特别是涉及一种传染病时空聚集性探测分析方法及系统。


背景技术:

2.目前,在传染病时空聚集性探测研究领域中,常用的方法可归纳为地图制图法和数据分析法。
3.地图制图法,根据病例的个体数据或者区域统计数据编制感染地图,通过可视化的形式定性地探测感染热点,包括撒点法、分级统计法、分区密度法、网格法等;数据分析法,是通过对病例数据进行处理和分析,得到定量的分析结果,大多数分析结果也可以通过地图制图的方式进行展示,包括聚类法、空间自相关法等。
4.但是地图制图法和数据分析的聚类法、空间自相关分析等分析的所得到的结果都不够准确。


技术实现要素:

5.本发明的目的是:提供一种传染病时空聚集性探测分析方法及系统,能够对提供的传染病数据进行时空扫描,实现对传染病疫情的聚集性探测,大大简化了分析过程,减少了人工干预,提高了工作效率。同时结合了地理信息系统,更加直观、全面地展示了发病聚集区域,为以后开展针对性的预防控制措施,提供了科学参考依据。
6.为了实现上述目的,本发明提供了一种传染病时空聚集性探测分析方法,包括:
7.获取目标区域的传染病病发案例数据,并对目标区域进行划分,获取多个与之对应的子区域;
8.对每个所述子区域进行时空扫描计算,获得每个子区域的病发案例总数;并将所述每个子区域的病发案例总数通过预设的似然函数,计算得到每个子区域的似然值;所述似然值最大的子区域作为聚集子区域;
9.将所述似然值最大的子区域作为聚集子区域,并对所述聚集子区域进行非随机性的显著性分析,得出所述聚集性子区域的聚集概率。
10.进一步地,所述似然函数,采用如下公式表示:
[0011][0012]
其中,为似然值,c为记录病发案例总数,u为扫描子区域的预期病发人数,n为扫描子的实际病发人数。
[0013]
进一步地,所述显著性分析包括:蒙特卡罗方法和t检验方法。
[0014]
本发明实施例还提供一种传染病时空聚集性探测分析系统,包括:扫描单元、数据处理单元和分析单元;其中,
[0015]
所述扫描单元,用于获取目标区域的传染病病发案例数据,并对目标区域进行划分,获取多个与之对应的子区域;
[0016]
所述数据处理单元,用于对每个所述子区域进行时空扫描计算,获得每个子区域的病发案例总数;并将所述每个子区域的病发案例总数通过预设的似然函数,计算得到每个子区域的似然值;所述似然值最大的子区域作为聚集子区域;
[0017]
所述分析单元,用于将所述似然值最大的子区域作为聚集子区域,并对所述聚集子区域进行非随机性的显著性分析,得出所述聚集性子区域的聚集概率。
[0018]
进一步地,所述似然函数,采用如下公式表示:
[0019][0020]
其中,为似然值,c为记录病发案例总数,u为扫描子区域的预期病发人数,n为扫描子的实际病发人数。
[0021]
进一步地,所述显著性分析包括:蒙特卡罗方法和t检验方法。
[0022]
本发明实施例还提供一种计算机终端设备,包括:一个或多个处理器;存储器,与所述处理器耦接,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一项所述的传染病时空聚集性探测分析方法。
[0023]
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述任一项所述的传染病时空聚集性探测分析方法。
[0024]
本发明实施例一种传染病时空聚集性探测分析方法及系统与现有技术相比,其有益效果在于:
[0025]
采用基于时空扫描统计的数据分析方法,将时间和空间两个维度结合起来进行分析,使得分析结果更为科学与全面,并且本发明还可以通过动态变化的窗口来探测感染热点的位置和规模,比其他方法的探测能力和使用价值更强。
附图说明
[0026]
图1为本发明某一实施例提供的一种传染病时空聚集性探测分析方法的流程示意图;
[0027]
图2为本发明某一实施例提供的一种传染病时空聚集性探测分析系统的结构示意图。
具体实施方式
[0028]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0029]
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。
[0030]
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0031]
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0032]
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0033]
本发明第一实施例:
[0034]
如图1所示,本发明实施例提供的一种传染病时空聚集性探测分析方法,所述方法至少包括如下步骤:
[0035]
s101、获取目标区域的传染病病发案例数据,并对目标区域进行划分,获取多个与之对应的子区域;
[0036]
需要说明的是,对于步骤s101,首先需要选定目标区域,获取目标区域传染病病发案例数据,然后对目标区域进行划分,并获得相应的子区域,然后通过扫描对应的子区域,获得该子区域的病发案例总数。
[0037]
s102、对每个所述子区域进行时空扫描计算,获得每个子区域的病发案例总数;并将所述每个子区域的病发案例总数通过预设的似然函数,计算得到每个子区域的似然值;所述似然值最大的子区域作为聚集子区域;
[0038]
需要说明的是,所述似然函数是一种关于统计模型参数的函数,似然函数在推断统计学(statistical inference)中扮演重要角色,尤其是在参数估计方法中。在教科书中,似然常常被用作“概率”的同义词。但是在统计学中,二者有截然不同的用法。概率描述了已知参数时的随机变量的输出结果;似然则用来描述已知随机变量输出结果时,未知参数的可能取值。例如,对于“一枚正反对称的硬币上抛十次”这种事件,我们可以问硬币落地时十次都是正面向上的“概率”是多少;而对于“一枚硬币上抛十次”,我们则可以问,这枚硬币正反面对称的“似然”程度是多少。
[0039]“似然性”与“或然性”或“概率”意思相近,都是指某种事件发生的可能性,但是在统计学中,“似然性”和“或然性”或“概率”又有明确的区分。概率用于在已知一些参数的情况下,预测接下来的观测所得到的结果,而似然性则是用于在已知某些观测所得到的结果时,对有关事物的性质的参数进行估计。
[0040]
s103、将所述似然值最大的子区域作为聚集子区域,并对所述聚集子区域进行非随机性的显著性分析,得出所述聚集性子区域的聚集概率。
[0041]
需要说明的是,所述显著性分析,即为显著性检验(significance test)就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(备择假设)是否合理,即判断总体的真实情况与原假设是否有显著性差异。或者说,显著性检验要判断样本与我们对总体所做的假设之间的差异是纯属机会变异,还是由我们所做的假设与总体真实情况之间不一致所引起的。显著性检验是针对我们对总体所做的假设做检验,其原理就是“小概率事件实际不可能性原理”来接受或否定假设。
[0042]
显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。
[0043]
常把一个要检验的假设记作h0,称为原假设(或零假设)(null hypothesis),与h0对立的假设记作h1,称为备择假设(alternative hypothesis)。
[0044]

在原假设为真时,决定放弃原假设,称为第一类错误,其出现的概率通常记作α;
[0045]

在原假设不真时,决定不放弃原假设,称为第二类错误,其出现的概率通常记作β
[0046]
(3)α+β不一定等于1。
[0047]
通常只限定犯第一类错误的最大概率α,不考虑犯第二类错误的概率β。这样的假设检验又称为显著性检验,概率α称为显著性水平。
[0048]
最常用的α值为0.01、0.05、0.10等。一般情况下,根据研究的问题,如果放弃真假设损失大,为减少这类错误,α取值小些,反之,α取值大些。
[0049]
显著性检验的目的在于:为了消除第一类错误和第二类错误。通常情况下,α水平就是第一类错误。第一类错误是原假设为真却被错误拒绝的概率。第二类错误()是原假设为误却被错误接受的概率或是备择假设为真却被拒绝的概率。如果p值小于某个事先确定的水平,理论上则拒绝原假设,反之,如果p值大于某个事先确定的水平,理论上则不拒绝原假设。常用的显著性水平是0.05,0.01和0.001[1]。不同的水平各有优缺点。水平越小,判定显著性的证据就越充分,但是不拒绝错误原假设的风险,犯第二类错误的可能性就越大,统计效力(就越低。选择水平不可避免地要在第一类错误和第二类错误之间做出权衡。如果犯第一类错误造成的后果不严重,比如在试探性研究中,我们可以将α水平定得高一些,如0.05或0.1。如果研究样本很小,为了提高统计效力,我们在某些研究中也不妨提高α水平。但是,如果犯第一类错误造成的后果很严重,比如我们要基于某项研究发现决定是否在全国推行某项教学改革,我们则需要将α水平定得低一些,如0.01或0.001。
[0050]
在本发明的某一个实施例中,所述预设的似然函数,采用如下公式表示:
[0051][0052]
其中,llr为似然值,c为记录病发案例总数,u为扫描子区域的预期病发人数,n为扫描子的实际病发人数。
[0053]
在本发明的某一个实施例中,所述显著性分析包括:蒙特卡罗方法和t检验方法。
[0054]
需要说明的是,本发明采用时空重排扫描统计量方法。时空扫描单元的病例感染期望值,是后续的数据分析所要用到的,其一般与扫描区域内的人口数量相关。但是由于人口数据通常是按照行政区域为单位提供的,当进行非行政区域扫描时,无法获取相应区域的人口数据,也就无法计算相应扫描单元的病例感染期望值。为解决此问题,采用了时空重排扫描统计量方法,使得分析过程中不需要人口数据,也可以进行后续的数据处理。
[0055]
需要说明的是,本发明基于蒙特卡罗模拟算法的聚集区域非随机性置信度检验。对于异常程度高的时空扫描单元,即我们所需的时空聚集单元,对其进行随机性检验是有必要的。由于扫描统计量的概率分布极为复杂,采取蒙特卡罗假设检验算法。根据原始的总病例感染数据,对每一起病例进行随机的时空打乱,最终得到一个随机数据集。获取n个随机数据集后,对此时空扫描单元进行置信度检验。
[0056]
本发明实施例一种传染病病发案例数据方法与现有技术相比,其有益效果在于:
[0057]
采用基于时空扫描统计的数据分析方法,将时间和空间两个维度结合起来进行分析,使得分析结果更为科学与全面,并且本发明还可以通过动态变化的窗口来探测感染热点的位置和规模,比其他方法的探测能力和使用价值更强。
[0058]
本发明第二实施例:
[0059]
本发明实施例提供的一种传染病时空聚集性探测分析系统200,包括:扫描单元
201、数据处理单元202和分析单元203;其中,
[0060]
所述扫描单元201,用于获取目标区域的传染病病发案例数据,并对目标区域进行划分,获取多个与之对应的子区域;
[0061]
所述数据处理单元202,用于对每个所述子区域进行时空扫描计算,获得每个子区域的病发案例总数;并将所述每个子区域的病发案例总数通过预设的似然函数,计算得到每个子区域的似然值;所述似然值最大的子区域作为聚集子区域;
[0062]
所述分析单元203,用于将所述似然值最大的子区域作为聚集子区域,并对所述聚集子区域进行非随机性的显著性分析,得出所述聚集性子区域的聚集概率。
[0063]
在本发明的某一个实施例中,所述预设的似然函数,采用如下公式表示:
[0064][0065]
其中,llr为似然值,c为记录病发案例总数,u为扫描子区域的预期病发人数,n为扫描子的实际病发人数。
[0066]
在本发明的某一个实施例中,所述显著性分析包括:蒙特卡罗方法和t检验方法。
[0067]
本发明第三实施例:
[0068]
本发明实施例还提供一种计算机终端设备,包括:一个或多个处理器;存储器,与所述处理器耦接,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一项所述的传染病时空聚集性探测分析方法。
[0069]
本发明第四实施例:
[0070]
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述任一项所述的传染病时空聚集性探测分析方法。
[0071]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1