本发明属于地区性未来水位预测领域,具体涉及一种基于回归模型的短期水位预测方法。
背景技术:
现有的水位预测方式往往是将过去多年的该点水位测量数据进行数据搜集和统计,通过数学模型进行拟合与训练,获得对未来较长时间的水位预测。虽然模型多样,但是由于其模型输入变量仅为该点的历年水位数据,存在适应性差、预测数据误差大、不符合现实情况等缺点;同时该类模型的预测时间跨度较长,无法保证其时效性。因此,急需一种结合该地历史降雨量与水位变化进行短期水位预测的模型,提高预测的准确度。
技术实现要素:
针对现有技术存在的上述技术问题,本发明的目的在于提供一种基于回归模型的短期水位预测方法。
所述的一种基于回归模型的短期水位预测方法,其特征在于包括以下步骤:
1)对水位观测点的历史水位数据进行搜集与导入;
2)对搜集的历史水位数据进行分析处理,即对水位数据当中的空值剔除,同时采用6倍标准差法将历史水位数据当中的异常值剔除,并进行历史水位数据的标准化处理;
3)对水位观测点地区的历史雨量数据进行分析处理,即是将水位观测点周边的所有相关联雨量观测点的历史雨量数据提取出来,采用关联历史雨量数据均值法对缺失的历史雨量数据进行填充,最后对各雨量观测点的历史雨量数据进行标准化处理;
4)建立水位观测点地区的未来水位短期预测模型,即按照水位预测的不同时间点、不同精确程度设置历史水位数据和历史雨量数据的提取时间段和时间间隔,将该提取时间段内的已经进行过标准化处理后的各个关联雨量观测点的历史雨量数据和历史水位数据导入到训练模型当中,通过贝叶斯岭回归模型对历史雨量数据和历史水位数据进行训练和模拟,最后获得水位观测点的未来某时间段内的水位预测结果。
所述的一种基于回归模型的短期水位预测方法,其特征在于步骤2)中,对搜集的历史水位数据进行分析处理的具体步骤如下:
s1:对水位数据当中的空值剔除,即对于水位点数据缺失的时间点予以剔除;
s2:对剔除空值后的历史水位数据进行均值计算,在获得历史水位数据的均值之后,通过标准差公式计算出整个历史水位数据的标准差,均值的计算公式如式(1)所示,标准差的计算公式如式(2)所示;
wi—表示某一历史时间点的水位数据;
σ—表示历史水位数据的标准差;
s3:由式(1)获得的历史水位数据的均值以及式(2)获得的历史水位数据的标准差,通过6倍标准差法剔除所有历史水位数据当中的无效数据,即剔除超过六倍标准差范围的所有历史水位数据,以保障预测结果的准确性,剔除过程如公式(3)所示;
s4:为了能够看出水位观测点历史水位的升降情况,对历史水位数据进行标准化处理,进行标准化处理的公式如式(4)所示;为了能够可以了解到水位的上升和下降情况,历史水位数据以相邻时间点的差值法进行处理,以方便后续数据的分析,所述相邻时间点的差值法处理过程如公式(5)所示;
ws=wn-1-wn(5)
w—水位观测点的标准化前历史水位数据;
wmax—历史水位最大值数据;
wmin—历史水位最小值数据;
ws—水位观测点的标准化后历史水位数据;
wn—水位观测点的第n个时间点的历史水位数据;
wn-1—水位观测点的第n-1个时间点的历史水位数据。
所述的一种基于回归模型的短期水位预测方法,其特征在于步骤3)中,对水位观测点地区的历史雨量数据进行分析处理的具体过程为:在水位观测点周边选取若干雨量观测点,将所有雨量观测点的历史雨量数据提取出来,采用关联历史雨量数据均值法对缺失的历史雨量数据进行填充,最后对各雨量观测点的历史雨量数据进行标准化处理,详细的标准化处理过程如公式(6)所示:
rs—某雨量观测点某时刻标准化后的历史雨量数据;
r—某雨量观测点某时刻原始历史雨量数据;
rmin—某时刻所有雨量观测点最小历史雨量值;
rmax—某时刻所有雨量观测点最大历史雨量值。
所述的一种基于回归模型的短期水位预测方法,其特征在于还包括模型可视化过程,具体为:通过所建立的水位观测点地区的未来水位短期预测模型,进行数据训练获得水位观测点的未来某时间段内的水位预测值后,以折线图的形式展示历史水位数据拟合情况和未来某时间段内的水位预测值的对比情况,以确定所建立的未来水位短期预测模型的精确度。
相对于现有技术,本发明取得的有益效果是:
本发明涉及水文的大数据处理方法和贝叶斯岭回归模型在水位预测当中的应用,通过两者的结合能够进行现有水文数据的分析与该地区未来水位的预测。本发明计划以水位预测点(即水位观测点)的水位数据、水位预测点周边实时降雨量数据作为数据输入端,结合回归模型进行水位预测点的未来短期水位预测。本发明的方法考虑到了雨量、降水时间段、原有水位等不同因素对未来对水位变化的影响,能够更加准确对未来短时间内的水位进行预测。
附图说明
图1为本发明所述短期水位预测方法的流程示意图。
具体实施方式
下面结合具体实施例对本发明作进一步说明,但本发明的保护范围并不限于此。
本发明提供一种技术方案:一种新的短期水文预测方案,包括以下建模步骤:
步骤一:对水位预测点的水位数据进行搜集与导入;
步骤二:对水位预测点地区的历史水位数据进行分析处理;
步骤三:对水位预测点地区的历史雨量数据进行分析处理;
步骤四:水位预测点地区未来水位短期预测模型建立;
步骤五:模型可视化并得出结论。本发明所述短期水位预测方法的流程示意图如图1所示。
1.对水位预测点的水位数据进行搜集与导入:
首先以5173-w水位预测点为例子,其对应相关联的雨量点雨量观测点有3个,分别为1689-r、3534-r和5921-r。对水位观测点的历史水位数据以及所述3个雨量观测点的历史雨量数据进行搜集与导入工作,搜集的数据包括测量站点编号、站点名称、时间点(每5分钟取一个历史雨量测量数据)、以及该时间点的数据值。详细的雨量观测点所需提取的数据内容如表1所示。同时按照预测精度需求设置雨量观测点数据的导入时间范围在2016-12-01到2018-02-01时间段内,样本的时间间隔设置为5min。
表1测量点数据内容表
2.对5173-w水位预测点地区的历史水位数据进行分析处理:
对于5173-w水位预测点内搜集的历史水位数据进行数据清洗工作,对于水位点数据缺失的时间点予以剔除,同时为了避免在水位数据当中存在异常数据,采用6倍标准差法进行剔除异常值:
1)计算观测点历史水位均值:对搜集到的历史水位数据进行均值计算,获得5173-w水位预测点的水位均值,计算如公式(1)所示。
wi——表示某一历史时间点的水位数据;
2)计算观测点历史水位标准差:在获得历史水位数据的均值之后,通过标准差公式计算出整个历史水位数据的标准差,详细的计算如公式(2)所示。
σ—表示历史水位数据的标准差;
3)剔除历史水位数据中的异常值:由式(1)获得的历史水位数据的均值以及式(2)获得的历史水位数据的标准差,通过6倍标准差法剔除所有历史水位数据当中的无效数据,即剔除超过六倍标准差范围的所有历史水位数据。以保障预测结果的准确性,剔除过程如公式(3)所示,即每个有效的历史水位数据均需在公式(3)所限定的范围内。
4)水位观测点水历史水位数据标准化:为了能够看出水位观测点历史水位的升降情况,对该观测点的历史水位数据进行标准化处理,进行标准化处理的公式如式(4)所示;为了能够可以了解到历史水位的上升和下降情况,历史水位数据以相邻时间点的差值法进行处理,以方便后续历史水位数据的分析,所述相邻时间点历史水位数据的差值法处理过程如公式(5)所示;
ws=wn-1-wn(5)
w—水位观测点的标准化前历史水位数据;
wmax—历史水位最大值数据;
wmin—历史水位最小值数据;
ws—水位观测点的标准化后历史水位数据;
wn—水位观测点的第n个时间点的历史水位数据(n越大代表时间越久远);
wn-1—水位观测点的第n-1个时间点的历史水位数据。
3.对5173-w水位预测点地区的历史雨量数据进行分析处理:
将5173-w水位预测点周边的所有相关联雨量观测点,即1689-r、3534-r和5921-r三个雨量观测点的历史雨量数据提取出来,采用关联历史雨量数据均值法对缺失的历史雨量数据进行填充,最后对各雨量观测点的历史雨量数据进行标准化处理,详细的标准化过程如公式(6)所示:
rs—某雨量观测点某时刻标准化后的历史雨量数据;
r—某雨量观测点某时刻原始历史雨量数据;
rmin—某时刻所有雨量观测点最小历史雨量值;
rmax—某时刻所有雨量观测点最大历史雨量值。
4.该地区未来水位短期预测模型建立:
1)按照水位预测的不同时间点、不同精确程度设置历史水位数据和历史雨量数据的提取时间段和时间间隔,如在本实施例当中,设置了历史水位与雨量数据的分析与训练时间从2016-02-01至2018-02-01时间段内随机选取训练样本与观测样本,将该提取时间段内的已经进行过标准化处理后的各个关联雨量观测点的历史雨量数据和历史水位数据导入到训练模型当中,最终进行模型运行。
2)历史水位数据成组提取设定:对水位数据进行成组提取,每一组数据的提取间隔如下:以某一时间的水位点数据作为时间原点数据,同时提取该时间点水位过去-15min,-45min,-75min,-105min,以及未来3小时和6小时的水位水位数据作为一组水位数据。以此方法按照时间顺序依次提取所需的水位点历史水位数据组。
3)历史雨量数据成组提取设定:对历史雨量数据进行成组提取,每一组数据的提取间隔如下:以某一时间的雨量点雨量数据作为时间原点数据,通过斐波那契数列提取过去1,2,3,5……55个小时的雨量数据,以及未来1,2,3,4,5,6小时的雨量数据作为一组历史雨量数据。以此方法按照时间顺序依次提取所需的雨量点历史雨量数据组。
4)模型建立:通过贝叶斯岭回归模型设置不同时间点雨量数据与水位数据的权重,数据距离预测时间越久远,权重越低,数据距离预测时间越近,权重越高。将历史水位数据组以及历史水位数据组导入值模型到中进行训练和模拟,利用贝叶斯岭回归模型进行数据的拟合。最后获得对于预测水位点未来某时间段内1小时的水位预测工作。
5.模型可视化并得出结论:
通过以上的模型建立与数据训练获得想要的水位点的预测水位值,并以折线图的形式展示历史拟合情况和未来预测的水位预测情况,以确定所建立的未来水位短期预测模型的精确度。
本说明书所述的内容仅仅是对发明构思实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式。