基于气象环境监测数据的呼吸系统疾病发病趋势预测方法与流程

文档序号:18239968发布日期:2019-07-24 08:56阅读:381来源:国知局
基于气象环境监测数据的呼吸系统疾病发病趋势预测方法与流程
本发明涉及气象服务
技术领域
,尤其涉及一种基于气象环境监测数据的呼吸系统疾病发病趋势预测方法。
背景技术
:气象服务涉及人们生活的方方面面,近年来在全球气候异常变化、极端天气气候事件明显增多的大背景下,天气气候及相应气象因素的异常变化对人类健康的影响已经越来越凸显,倍受科技界、医疗卫生工作者及广大民众的关注。呼吸系统疾病作为危害人类健康的主要疾病之一,它对天气气候的变化尤为敏感。如何通过对当前气象要素及其变化的观测,来进行科学有效的预测未来一段时间内呼吸系统疾病的发病情况,并为民众提供有效的预防提示,是本发明重点讨论的问题。技术实现要素:本发明的目的是目的通过对呼吸系统疾病发病的发病病例与气象要素关系的分析,建立呼吸系统疾病发病趋势预测模型,作出发病率预测和防病措施预报,以帮助民众了解并能提前作出应对,以减轻可能造成的危害。为实现上述目的,本发明提供了一种基于气象环境监测数据的呼吸系统疾病发病趋势预测方法,包括:建立呼吸系统疾病发病趋势预测的多元线形回归模型;获取第一时段内的气象环境监测数据;所述气象环境监测数据包括:平均气温、平均气压、所述第一时段内的最大温差和平均空气质量指数AQI;基于所述多元线形回归模型和所述第一时段内的气象环境监测数据,得到所述第一时段之后第二时段的呼吸系统疾病发病指数;对所述气象环境监测数据进行数据分析,得到所述平均气温、平均气压、所述最大温差和平均AQI分别对应的级别参数;根据所述呼吸系统疾病发病指数和所述级别参数,生成呼吸系统疾病发病趋势预测提示信息。优选的,所述建立所述呼吸系统疾病发病趋势预测的多元线形回归模型具体包括:获取一定时间范围内的潜在样本数据;所述潜在样本数据包括:风速、平均气温、平均气压、降水量、平均湿度、最高气温、最低气温、平均AQI和病例数;对所述潜在样本数据中的每个数据进行分布特征分析,得到各潜在样本数据基于时间轴的数据分布特征;基于所述病例数据的数据分布特征对所述其余各潜在样本数据进行数据筛选,得到样本数据和预测提前量;所述样本数据包括:平均气温、平均气压、平均AQI以及最高气温与最低气温的差值;对所述样本数据进行数据清洗后,以多元线形回归法进行模型训练,得到所述呼吸系统疾病发病趋势预测的多元线形回归模型。优选的,所述多元线形回归模型具体为:y=(coef1×A+coef2×B+coef3×C+coef4×D)+73.9849320209;其中,coef1=-0.94727278,coef2=0.07566679,coef3=-0.67417332,coef4=-0.17595693;y为第二时段的呼吸系统疾病发病指数,A为第一时段内的平均气温,B为第一时段内的平均气压,C为第一时段内的最大温差,D为第一时段内的平均AQI;所述第一时段的起始时间至第二时段的起始时间为所述预测提前量。优选的,所述对所述气象环境监测数据进行数据分析,得到所述平均气温、平均气压、所述最大温差和平均AQI分别对应的级别参数具体包括:获取所述平均气温、平均气压、所述最大温差和平均AQI的级别设定阈值参数;根据所述平均气温、平均气压、所述最大温差和平均AQI的级别设定阈值参数,对所述气象环境监测数据进行分析,得到所述平均气温、平均气压、所述最大温差和平均AQI分别对应的级别参数。优选的,所述根据所述呼吸系统疾病发病指数和所述级别参数,生成呼吸系统疾病发病趋势预测提示信息具体包括:根据所述述呼吸系统疾病发病指数和所述级别参数查询所述呼吸系统疾病发病指数、平均气温、平均气压、最大温差和平均AQI的级别参数分别对应的提示语信息;按照设定规则,将所述呼吸系统疾病发病指数、平均气温、平均气压、最大温差和平均AQI的级别参数进行拼接,生成输出代码;根据所述输出代码,对查询得到的提示语信息进行拼接,生成所述呼吸系统疾病发病趋势预测提示信息。优选的,在所述对所述气象环境监测数据进行数据分析,得到所述平均气温、平均气压、所述最大温差和平均AQI分别对应的级别参数之前,所述方法还包括:分别建立所述呼吸系统疾病发病指数、平均气温、平均气压、所述最大温差和平均AQI的分级查找表;所述分级查找表包括阈值参数、各阈值参数对应的提示语信息和级别参数。进一步优选的,所述气象环境监测数据还包括平均相对湿度,所述方法还包括:建立所述平均相对湿度的分级查找表。优选的,所述方法还包括:统计所述第二时段的实际病例数的数据;将所述第一时段内的气象环境监测数据和所述第二时段的实际病例数的数据作为模型修正样本数据,对所述呼吸系统疾病发病趋势预测的多元线形回归模型进行修正。本发明提供了一种面向户外健身运动的气象参考指数生成方法,对通过对当前气象要素及其变化的观测,对呼吸系统疾病发病的发病病例与气象要素关系的分析,以呼吸系统疾病发病趋势预测模型来进行科学有效的预测未来一段时间内呼吸系统疾病的发病情况,并为民众提供有效的预防提示。附图说明图1为本发明实施例提供的基于气象环境监测数据的呼吸系统疾病发病趋势预测方法流程图;图2为本发明在一段时期内某医院呼吸系统疾病实际就诊人数与通过预测模型计算的呼吸系统发病指数对应的预测就诊人数的对比曲线图。具体实施方式下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。本发明通过对呼吸系统疾病发病的发病病例与气象要素关系的分析,建立呼吸系统疾病发病趋势预测模型,作出发病率预测和防病措施预报,以帮助民众了解并能提前作出应对,以减轻可能造成的危害。该方法可以运用于气象服务、医疗服务、环境、教育等多方位的服务系统中。图1为本发明实施例提供的基于气象环境监测数据的呼吸系统疾病发病趋势预测方法,如图所示,该方法包括如下步骤:步骤110,建立呼吸系统疾病发病趋势预测的多元线形回归模型;其具体步骤可以包括:步骤111,获取一定时间范围内的潜在样本数据;潜在样本数据可以包括气象要素相关的数据,比如:风速、平均气温、平均气压、降水量、平均湿度、最高气温、最低气温、平均空气质量指数(AirQualityIndex,AQI),当然还包括在该时间范围内的病例数。这个病例数是相对能够反映整体情况的病例数。在本发明建立呼吸系统疾病发病趋势预测的多元线形回归模型的过程中,所采用的病例数,是以2013-2017年北京某医院呼吸系统疾病就诊人数为基准的数据。可以将其相应的拆分为以日、3日、周、10天、半月等为时间单位的数据,与同样时间单位的气象要素相关的数据,组成潜在样本数据。但是,潜在样本数据中,气象数据的选取区间早于病例数的选区区间一个周期。例如,在以周为单位进行数据拆分时,以某一周的气象数据和下一周的病例数组成一组潜在样本数据。步骤112,对潜在样本数据中的每个数据进行分布特征分析,得到各潜在样本数据基于时间轴的数据分布特征;具体的,通过对潜在样本数据中的每个数据绘制分布图,就能够能直观看出疾病的高发期、低发期等特征以及其它一些指标的分布特征。步骤113,基于病例数据的数据分布特征对其余各潜在样本数据进行数据筛选,得到样本数据和预测提前量;具体的,将气象要素相关的数据进行分析,得出病例数与气象要素相关的数据的多元线形相关性。结合上述的分布特征,就可以识别出潜在样本数据中与病例数有较强相关性的数据,作为样本数据。将没有关系或相关性不明显的气象数据剔除。经过筛选,我们得到的样本数据包括:平均气温、平均气压、平均AQI以及最高气温与最低气温的差值。在此过程中,同样对于气象数据的选取区间早于病例数的选区区间的单位周期进行合理确定。在本例中,优选的确定该周期为一周。步骤114,对样本数据进行数据清洗后,以多元线形回归法进行模型训练,得到呼吸系统疾病发病趋势预测的多元线形回归模型。具体的,将样本数据包括的平均气温、平均气压、平均AQI以及最高气温与最低气温的差值进行数据清洗,对一些不符合规范的数据可以采用平均替换法、回归替换法等方法进行数据规范化预处理,再用数据清洗后的样本数据采用多元线形回归法进行模型训练,得到呼吸系统疾病发病趋势预测的多元线形回归模型。本发明的一个具体例子中,得到的预测模型为:y=(coef1×A+coef2×B+coef3×C+coef4×D)+73.9849320209;其中,coef1=-0.94727278,coef2=0.07566679,coef3=-0.67417332,coef4=-0.17595693;y为第二时段的呼吸系统疾病发病指数,A为第一时段内的平均气温,B为第一时段内的平均气压,C为第一时段内的最大温差,D为第一时段内的平均AQI;第一时段的起始时间至第二时段的起始时间为预测提前量,具体为一周。在上述具体模型的例子中,预测提前量为一周。当然也可以改变预测提前量并基于上述方法确定模型的权重值(即A、B、C、D)和截距,以得到适应不同预测提前量的预测模型。步骤120,获取第一时段内的气象环境监测数据;气象环境监测数据包括:平均气温、平均气压、第一时段内的最大温差和AQI。第一时段在本例中如上所述,是以一周作为数据统计的周期。步骤130,基于多元线形回归模型和第一时段内的气象环境监测数据,得到第一时段之后第二时段的呼吸系统疾病发病指数;具体的,本步骤按照前述的具体预测模型,以平均气温、平均气压、第一时段内的最大温差和AQI为自变量数据输入模型,即可得到呼吸系统疾病发病指数。在本例中,呼吸系统疾病发病指数与病例数为等比例数据,当然,也可以先将病例数进行规一化处理,再作为样本数据。这样获得的呼吸系统疾病发病指数就是规一化的指数数据了。图2为本发明实际获得的在一段时期内某医院呼吸系统疾病实际就诊人数与通过预测模型计算的呼吸系统发病指数对应的预测就诊人数的对比曲线图。其中虚线为预测值,实线为实际就诊人数值。可以看到二者拟合的比较好,说明本发明的预测模型能够很好的进行呼吸系统疾病发病趋势的预测。步骤140,对气象环境监测数据进行数据分析,得到平均气温、平均气压、最大温差和平均AQI分别对应的级别参数;具体的,可以获取平均气温、平均气压、最大温差和平均AQI的级别设定阈值参数;根据平均气温、平均气压、最大温差和平均AQI的级别设定阈值参数,对气象环境监测数据进行分析,得到平均气温、平均气压、最大温差和平均AQI分别对应的级别参数。在这里我们可以通过建立查找表的方式,以方便进行气象数据到级别参数的对应差别。在一个具体的例子中,可以分别建立呼吸系统疾病发病指数、平均气温、平均气压、最大温差和平均AQI的分级查找表。分级查找表中包括阈值参数、各阈值参数对应的级别参数,还可以包括提示语信息,用于在下述步骤150中生成呼吸系统疾病发病趋势预测提示信息。例如,呼吸系统疾病发病指数数值范围在0-200之间,所以可以将呼吸道发病指数分成五级:较高、高、中等、较低、低。呼吸系统疾病发病指数-分级等级-提示语信息查找表可以如下表1设置:指数值等级提示语0-40低呼吸道疾病发病率低41-80较低呼吸道疾病发病率较低81-120中等呼吸道疾病发病率中等121-160较高呼吸道疾病发病率较高161-200高呼吸道疾病发病率高表1又例如,以平均气温作为基准数据,考虑到对人群的实际影响,我们在具体的计算过程中优选的对应到体感温度这一参数来替代平均气温。体感温度,除了与气温有关,还可以与当地的空气湿度,平均风速,阳光强度等都有关系。业内有许多不同的换算方式。例如可以根据体感温度Tg=To+Tu–Tv来计算。式中,To为百叶箱外温度,Tu为湿度对体感温度的订正值,Tv为风速对体感温度的订正值。其中百叶箱外温度To可由百叶箱内温度T推算得到,一般是加入一个订正值,需要综合考虑日照时数、总云量和百叶箱内最高温度等,可由公式计算得到,在不同季节和不同地区会有明显差异。其它两个订正值也需要根据地区和时段的差异,结合本地气候特点来考虑。又例如可以根据体感温度Tg=Ta+Tr+Tu+Tv来计算;其中,Tr=0.42Ca(1-0.9Mc)La;Tg为体感温度。Ta为气温。Tr为辐射对体感温度影响的修正值;Tu为湿度对体感温度影响的修正值;Tv为风速对体感温度影响的修正值;Ca为外衣吸热能力,比如,白外衣=0.2,杂色外衣=0.6,黑外衣=0.9;Mc为云量系数,比如,晴=0.0,少云=0.3,多云=0.7,阴=1.0;La为辐射增温系数。采用哪种换算方式,是业内人士可以自行选择的,在此不做重点讨论。在本实施例所用方法中,根据体感温度进行区间划分,所建立的体感温度-分级等级-提示语信息查找表,可以如下表2所示。体感温度级别体感温度提示1级<4℃很冷2级4~8℃冷3级8~13℃凉4级13~18℃凉爽5级18~23℃舒适6级23~29℃温暖7级29~35℃暖热8级35~41℃热9级>41℃极热表2在本实施例所用方法中,对于最大温差,则可以采用如下表3所示方式,建立最大温差-分级等级-提示语信息查找表。表3对于平均气压,同样的可以根据气压高低数值,以及所处地理位置的不同,来设定不同的判断标准,并设置相应的提示语。对于AQI,则可以如下表4所示,建立AQI指数-分级等级-提示语信息查找表。表4上述各表仅为举例,并不用于限定本发明的气象数据分级仅能按照表中划分的情况进行分级,当然也不仅仅是能按照表中设定的提示语输出提示信息。步骤150,根据呼吸系统疾病发病指数和级别参数,生成呼吸系统疾病发病趋势预测提示信息。具体的,可以根据述呼吸系统疾病发病指数和级别参数查询呼吸系统疾病发病指数、平均气温、平均气压、最大温差和平均AQI的级别参数分别对应的提示语信息;然后按照设定规则,将呼吸系统疾病发病指数、平均气温、平均气压、最大温差和平均AQI的级别参数进行拼接,生成输出代码;再根据输出代码,对查询得到的提示语信息进行拼接,生成呼吸系统疾病发病趋势预测提示信息。本领域技术人员可以根据实际需要,从上述几个参数中选择其中部分或全部用于提示信息输出。例如,在一个具体的例子中,根据呼吸系统疾病发病指数、AQI、平均气温得到的拼接语句可以如下表5中所例举。表5在优选的例子中,平均相对湿度也可以作为气象监测数据中的一项。在数据统计过程中我们发现,湿度也对于呼吸系统疾病的发病趋势有着比较明确的影响。因此在上述生成呼吸系统疾病发病趋势预测提示信息的过程中,也可以加入平均相对湿度的数据的影响。通过建立平均相对湿度的分级查找表,然后根据平均相对湿度,从查找表中对应得到相对湿度的级别,并得到提示信息,按照规则进行语句拼接,输出呼吸系统疾病发病趋势预测提示信息。在一个具体的例子中,我们以6位编码规则进行编写提示语的编写,6位编码分别对应呼吸系统疾病发病指数、AQI、平均气温、最大温差、平均气压和平均湿度。根据他们各自的数据对应到分级等级并得到相应的提示语信息,通过语句拼接生成呼吸系统疾病发病趋势预测提示信息。当然还可以在最后保留一位备用编码,以方便进行功能扩展。本发明实施例提供的面向户外健身运动的气象参考指数生成方法,对通过对当前气象要素及其变化的观测,对呼吸系统疾病发病的发病病例与气象要素关系的分析,以呼吸系统疾病发病趋势预测模型来进行科学有效的预测未来一段时间内呼吸系统疾病的发病情况,并为民众提供有效的预防提示。在基于多元线形回归模型和第一时段内的气象环境监测数据,得到第一时段之后第二时段的呼吸系统疾病发病指数之后,还可以通过与第二时段的实际病例数的数据进行对比,进一步对模型进行修正。从而通过一次次的不断修正,来逐步完善呼吸系统疾病发病趋势预测的模型。具体可以对第二时段的实际病例数的数据进行统计,然后将第一时段内的气象环境监测数据和第二时段的实际病例数的数据作为模型修正样本数据,对呼吸系统疾病发病趋势预测的多元线形回归模型进行修正。专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或
技术领域
内所公知的任意其它形式的存储介质中。以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1