1.一种融合气象因素和搜索指数的手足口病预测方法,其特征在于包括如下步骤:
步骤1,收集气象数据、搜索指数和历史手足口病发病数据,并统计为固定时间间隔内的时序数据;
步骤2,从时间差分的角度计算各个具体因素和历史手足口病发病人数的相关系数,确定最大相关系数对应的时间间隔;
步骤3,根据确定的时间间隔,聚合当前所有的因素和对应若干时间间隔之后某一个时间段内的发病人数;
步骤4,根据差分时间聚合的多因素数据作为模型的样本,对应若干时间间隔之后某一时间段内的发病人数作为预测目标,训练手足口病预测模型;
步骤5,根据训练的模型,输入采集的实时病例数据、搜索数据和气象数据,得到短期内的发病情况。
2.如权利要求1所述的融合气象因素和搜索指数的手足口病预测方法,其特征在于:所述步骤1的具体过程是:
步骤11,设置时间间隔数量为k,用{t1,t2,…,tk}表示连续且等间隔的一个时间段;
步骤12,在{t1,t2,…,tk}中统计气象数据和各个地区、平台的搜索指数,其中,vk={v1,v2,…,vk}表示变量vi在第i个时间间隔内的时序序列,i=1,2,…,k;变量v∈{m,b},其中m表示气象因素的集合,b表示搜索指数;用ck={c1,c2,…,ck}表示历史发病人数时序序列。
3.如权利要求2所述的融合气象因素和搜索指数的手足口病预测方法,其特征在于:所述步骤2中,从时间差分的角度计算各个具体因素和历史手足口病发病人数的相关系数,其计算公式是:
其中,pvcd表示变量v和发病人数c相差d天的pearson相关系数,即v比c早d天;vi表示变量v在第i天的数值,
4.如权利要求3所述的融合气象因素和搜索指数的手足口病预测方法,其特征在于:所述步骤2中,确定最大相关系数对应的时间间隔的具体方法是:根据变量v和发病人数c相差d天的pearson相关系数pvcd计算所有因素{m,b}和病例ck在最大相关系数下的时间差分,记为tvd,对于给定因素v*,其计算公式为:
其中,
5.如权利要求3所述的融合气象因素和搜索指数的手足口病预测方法,其特征在于:所述步骤3的具体过程是:根据tvd聚合所有气象因素和搜索指数,提取所有聚合因素的均值和发病人数的均值增广特征,作为模型的输入xt,当前的发病人数ct作为模型的输出,其聚合公式:
yt←ct
其中,
6.如权利要求1所述的融合气象因素和搜索指数的手足口病预测方法,其特征在于:所述步骤4中,手足口病预测模型包括输入层、表示层、合并层和输出层,其中,输入层用于输入xt数据,包括过去lag个时间间隔的病例数据、差分气象数据和差分搜索指数数据;表示层中,采用lstm处理输入的病例数据,采用全连接层处理输入的气象数据和搜索指数数据;在合并层中合并上一层所有数据,并将合并后的数据输出作为预测数据。
7.如权利要求6所述的融合气象因素和搜索指数的手足口病预测方法,其特征在于:所述步骤4中,层与层之间采用线性整流函数作为激活函数。
8.如权利要求1所述的融合气象因素和搜索指数的手足口病预测方法,其特征在于:所述步骤4中,手足口病预测模型采用均方误差作为目标函数。
9.如权利要求1所述的融合气象因素和搜索指数的手足口病预测方法,其特征在于:所述步骤5中,根据训练好的手足口病预测模型,输入分析和聚合后的实时采集数据,预测下一个时间间隔内的发病人数,其计算公式是:
其中,x′t表示分析和聚合后的实时采集数据,