基于机器学习的海洋大气折射率预测方法

文档序号:27072814发布日期:2021-10-24 10:12阅读:320来源:国知局
基于机器学习的海洋大气折射率预测方法

1.本发明涉及无线电气象学和电波科学技术,特别涉及一种基于机器学习的海 洋大气折射率预测方法。


背景技术:

2.由于海洋环境湿度、气压、风速、波浪等气候因素会随海面高度变化而变 化,海面上空的大气折射率也会发生相应改变。由于大气折射率的分布不同导 致电磁波射线的曲率半径也有所不同,根据射线曲率半径与地球半径的比值可 以将大气折射分为负折射、无折射、标准折射、超折射、临界折射等。当折射 率的改变满足一定条件时便形成了大气波导,导致超视距现象和雷达盲区的出 现,这对海上低空范围的通信、探测、导航等系统的性能影响显著。因此,针 对海洋大气折射率的探测、预测,对于构建无缝、可靠、安全的海洋信息感知 及通信至关重要。
3.对大气折射率传统的预报方法主要包括基于探空实测和中尺度数值预报模 式。前者能够提供精准的大气折射率信息但高度依赖数据集的获取,进而严重 限制了其适应性,后者实用性更高但在量化大气折射率精度方面仍存不足。因 此,亟需探寻能够有效提高中尺度数值预报模式精准度的大气折射率预测新机 制。近年来,大数据及机器学习技术方兴未艾,已经广泛应用于图象识别、自 然语言处理等各个领域,并取得了优异的预测效果,而针对海洋大气折射率预 报的相关工作亟待展开。考虑探空数据获取大气折射率曲线的准确性以及数值 模式预报大气折射率的实用性,基于上述所说的两种数据,利用机器学习理论 方法,有望深入挖掘数据之间的内在规律和联系,构建探空数据驱动的中尺度 数值模式大气折射率预测模型,提高传统方法预测的准确性、实用性、拓展性。


技术实现要素:

4.有鉴于此,本发明提出一种基于机器学习的海洋大气折射率预测方法。
5.上述方法可以具体包括:获取中尺度数值模式预报气象参数与探空实测气 象参数的数据特征及其分布情况;采用双线性插值、神经网络拟合等对齐方法 进行时空层面的数据预处理,获得两种气象参数之间的差异规律和气象参数的 变化规律;基于提供的两种气象参数,引入梯度提升决策树等机器学习模型, 得到融入探空实测气象参数特征的中尺度数值模式预报气象参数修正机制;基 于预报气象参数修正机制,利用气象参数到大气折射率的映射关系,得到新型 大气折射率预报机制。
6.其中,上述中尺度数值模式预报气象数据与探空实测气象数据的数据特征 包括:以python的netcdf4、numpy模块为例提取数据特征,中尺度数值模式 预报气象参数提供24个时间段的数据,包括海面水汽压、气温、气压、水汽混 合比等参数,实用性更高但在精度方面存在不足;探空实测气象参数提供2个 时间段的数据,包括气压、水汽压、水汽混合比、高度、温度、露温、风向和 风速等参数,精度高但拓展性低。
7.上述中尺度数值模式预报气象数据与探空实测气象数据的分布情况包括: 以本
发明所用数据为例,中尺度数值模式预报数据集中分布在南海区域其间距 分辨率约为25km,在某一时刻,数据量可达711450个,具有数据密集且体量 大的特点;探空实测数据在全球均有分布,分布极为稀疏且相距较远,共计只 有536个。
8.上述利用双线性插值、神经网络拟合等对齐方法进行时空层面的数据预处 理数据预处理手段包括:结合两种数据的时间特征并查阅世界时(utc)和北 京时间的对应关系,进行两种数据时间层面对齐;以python的basemap模块为 例,绘制中尺度数值模式格点和探空观测站点的分布地图,筛选得到南海区域 的29个探空观测站点;利用双线性插值方法处理数值模式数据进行经纬度对齐, 得到经纬度对齐的两种数据;以及利用神经网络拟合方法处理探空观测数据进 行垂直高度对齐,得到垂直高度层面对齐的两种数据。
9.上述利用机器学习模型得到预报气象参数修正机制包括:设计两种气象参 数组成的三种特征工程方案;以梯度提升决策树(gbdt)与极端梯度提升树 (xgboost)两种机器学习模型为例,基于三种特征工程提供的特征映射,使用 不同的训练集数据训练gbdt和xgboost模型,并使用验证集数据检验模型的 拟合情况,最后使用测试集数据检验模型的修正能力,得到六种气象参数修正 方案;以及通过模型评估指标对比,得到最优的气象参数修正机制。
10.其中,上述两种气象参数组成的三种特征工程方案包括:特征工程一:仅 使用对齐后的1个模拟数据;特征工程二:使用探空数据周围的4个原始模拟 数据;以及特征工程三:使用对齐后的1个模拟数据和3个地理变量。
11.其中,上述模型评估指标包括:模型拟合优度;修正数据与模拟数据相较 探空数据的平均误差;以及根均方根误差(rmse)。
12.上述得到新型大气折射率预报机制包括:根据预报气象参数修正机制,得 到更精确的预报气象参数;根据修正气象参数到大气折射指数的映射关系,得 到更高精度的新型大气折射率预报机制;以及通过对比大气折射率曲线情况和 修正与平均误差,验证新型大气折射率预报机制的准确性。
附图说明
13.图1为本发明一些实施例所述的基于机器学习的海洋大气折射率预测方法 流程图;
14.图2为本发明一些实施例所述的双线性插值和神经网络拟合等数据预处理 结果图;
15.图3为本发明一些实施例所述的基于三种特征工程方案和两种机器学习模 型的气象参数修正结果图;
16.图4为本发明一些实施例所述的模型拟合优度、修正数据与模拟数据相较 探空数据的平均误差以及根均方根误差(rmse)对比图;
17.图5为本发明一些实施例所述的三种大气折射率曲线对比图;
18.图6为本发明一些实施例所述的三种大气折射率平均误差对比图。
19.具体实施方式
20.为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作 进一步的详细描述。
21.图1为本发明一些实施例所述的基于机器学习的海洋大气折射率预测方法 流程图。如图1所示,针对传统中尺度数值模拟预报大气折射率不准确问题, 首先,提取中尺度数值模式预报气象参数与探空实测气象参数的数据特征并获 取两种数据的分布情况;然后,采用双线性插值、神经网络拟合等对齐方法进 行时空层面的数据预处理,以获得两种气象参数之间的差异规律和气象参数的 变化规律;接下来,基于提供的两种气象参数,引入梯度提升决策树等机器学 习模型,从而提出融入探空实测气象参数特征的中尺度数值模式预报气象参数 修正机制;最后,基于预报气象参数修正机制,利用气象参数到大气折射率的 映射关系,提出新型大气折射率预报机制。
22.图2为本发明一些实施例所述的双线性插值和神经网络拟合等数据预处理 结果图。从图2可以看出中尺度数值模式预报数据与探空实测数据的相对位置 分布,利用双线性插值方法处理数值模拟数据进行经纬度对齐,得到经纬度对 齐的两种数据。双线性插值方法如下所示:
23.首先,在x方向进行线性插值,得到下式:
[0024][0025][0026]
然后,在y方向进行线性插值,得到下式:
[0027][0028]
其中,探空数据站点周围4个模拟点数据为函数f在q
11
=(x1,y1), q
12
=(x1,y2),q
21
=(x2,y1)及q
22
=(x2,y2)4个点的值,探空数据站点数据为函数f 在点p=(x,y)的值。
[0029]
接下来,利用神经网络拟合方法处理探空观测数据进行垂直高度对齐,得 到垂直高度层面对齐的两种数据。神经网络拟合如下式所示:
[0030]
y
j
=f(β
j

θ
j
)
ꢀꢀ
(4)
[0031]
其中,β
j
为第j个输出神经元的输入,θ
j
为输出层第j个节点的阈值,y
j
为 输出层第j个节点的输出值。神经网络训练是以模型输出值y与实际值y
k
的均 方误差尽可能小为目标,通过对权值和阈值进行更新,实现学习的过程,最终 得到最优解。
[0032]
如图2所示,通过神经网络拟合方法可拟合出0

3000m各项气象参数(水 汽压、温度、气压、水汽混合比)的拟合曲线。接下来,再从拟合曲线中找到 与数值模拟数据同高度的气象参数便可实现两种数据垂直高度对齐。
[0033]
此外,数据预处理手段包括:结合两种数据的时间特征并查阅世界时(utc) 和北京时间的对应关系,进行两种数据时间层面对齐;结合中尺度数值模式格 点和探空观测站点的分布情况,筛选得到南海区域的29个探空观测站点。
[0034]
通过上述数据预处理手段可实现数值模拟数据与探空观测数据一一对应的 关系。
[0035]
图3为本发明一些实施例所述的基于三种特征工程方案和两种机器学习模 型的
气象参数修正结果图。针对三种特征工程方案和两种机器学习模型组合成 六种预报气象参数修正机制,以气象参数水汽压的修正曲线为例呈现该结果, 在修正曲线图中绿色线为gbdt、xgboost模型修正的气象参数曲线,红色线 为探空气象参数曲线。如图3所示,六种修正结果依次为使用特征工程一的 gbdt、xgboost修正结果;使用特征工程二的gbdt、xgboost修正结果;以 及使用特征工程三的gbdt、xgboost修正结果。
[0036]
其中,特征工程三(含有地理变量)的修正曲线与探空数据曲线的吻合程 度更高,这代表着地理变量对修正结果有着至关重要的影响。比较两种机器学 习模型,xgboost较gbdt训练速度更快,且结果更为精确。因此,本发明所 提的预报气象参数修正机制为使用对齐后的模拟数据和地理变量的xgboost修 正模型。
[0037]
为了展示本发明各实施例的使用性能,发明人进行了多种指标多种方法的 对比实验。图4、图5和图6从多个方面展示了实验结果。其中,图4为发明一 些实施例所述的模型拟合优度、修正数据与模拟数据相较探空数据的平均误差 以及根均方根误差(rmse)对比图;图5为本发明一些实施例所述的三种大气 折射率对比图;图6为本发明一些实施例所述的三种大气折射率平均误差对比 图。
[0038]
图4所示的对比实验以模型拟合优度、修正数据与模拟数据相较探空数据 的平均误差以及根均方根误差(rmse)为评估指标,验证本发明所提的预报气 象参数修正机制的修正性能,可通过下述三个公式计算得到实验结果:
[0039][0040][0041][0042]
其中,通过公式(5)可计算出六种预报气象参数修正机制的训练集、测试 集r2,r2越接近1修正效果越好;通过公式(6)可计算出六种修正数据与模拟 数据相较探空实测数据的平均误差,当修正

探空平均误差小于模拟

探空平均误 差时可说明该预报气象参数修正机制有修正效果,平均误差越小修正效果越好; 通过公式(7)可计算出六种预报气象参数修正机制在不同决策树数量条件下的 训练集、测试集均方根误差,误差越小修正效果越好。
[0043]
从图4可以看出,本发明所提的预报气象参数修正机制(使用对齐后的模 拟数据和地理变量的xgboost修正模型)的训练集、测试集r2最高,所得修正 数据与探空实测数据平均误差最小。并且,随着决策树数量的增加,训练集、 测试集的均方根误差下降较快,更为接近0。
[0044]
图5所示的对比实验给出了三个站点的修正大气折射率曲线、模拟大气折 射率曲线与探空大气折射率曲线的结果对比图。三种大气折射率分别通过修正 气象参数、模拟气象参数、探空气象参数计算而得,大气折射率m的计算公式 为:
[0045][0046]
其中,t为大气温度,k;p为大气压强,hpa;e为水汽压,hpa,z为海 拔高度,m,这些参数都可以直接或间接地从数值模拟数据中获取,r为平均地 球半径,取值为6.371
×
106m。
[0047]
从图5可以看出,本发明实例所提的预报气象参数修正机制,结合气象参 数到大气折射率的映射关系得到的修正大气折射率曲线相较于模拟大气折射率 曲线更为接近探空大气折射率曲线,能够很好的反应探空大气折射率曲线中所 显示的波导特征(该特征已放大显示)。因此,本发明可以获得较高的精度修正 大气折射率,这对于接下来提升波导判定及预测的准确性,构建无缝、可靠、 安全的海洋信息感知及通信至关重要。
[0048]
图6所示的对比实验给出了三个站点的修正大气折射率与模拟大气折射率 相较探空大气折射率的平均误差对比图。通过公式(6)可依次计算三个站点的 六种平均误差。
[0049]
从图6可以明显看出,修正

探空数据平均误差远小于模拟

探空数据平均误 差,三个站点的修正大气折射率精度提高均在80%以上,因此,通过预报气象 参数修正机制可以得到更为精准的大气折射率。综上所述,相较于传统中尺度 数值模式的大气折射率预报,本发明实例所提的新型大气折射率预报机制,可 得到更为精准的大气折射率预测结果。
[0050]
以上所述仅为本发明的一个实例而已,并不用以限制本发明,凡在本发明 的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明 保护的范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1