本发明涉及海洋数据的空间场缺失信息检测和补全,结合一维卷积和注意力机制网络在解决海洋数据处理领域问题的应用方法,本发明涉及海洋数据处理,是一种海洋观测数据的空间场插补方法。
背景技术:
1、海洋观测资料为分析揭示海洋环境温盐分布和流场结构、理解和深化海洋环境特性和气候变化规律提供了关键的观测事实基础,其蕴涵的丰富信息资源具有重要的科学意义和应用价值。但是浮标的工作方式和自然损耗决定了数据资料的温盐场序列难以达到空间完整和序列连续(可视为要素场的缺失)。某些海洋观测数据集稀疏、零散、缺损等空间不规则和时间不连续的固有弱点和应用盲区,可能会导致在做海洋的温度和气候预测等研究中产生不准确的结果。
2、如果海洋数据的再分析研究者没有正确的处理稀疏或者缺失的数字可能就会对整个数据做出错误的结论,对未来建模阶段产生重大的影响。在分析数据的过程中如果发现有一个或者多个特征数据是缺失的,就很难完全理解或者相信由此所得到的结论或者建立的分析模型,海洋浮标数据中的缺失值可能会降低研究对象的统计能力,甚至由于估计的偏差而导致严重的错误结果。时间连续、空间均匀的网格化数据和标准化的资料是海面温度预测、洋流分析、气候预测等再分析研究的重要目标。所以需要对稀疏资料插值、缺损数据拟合和温盐空间场重构等工作。对于如何对复杂的海洋浮标观测数据进行空间场的重构和数据拟合,实现海洋气候的准确预测是本专利要解决的问题。
技术实现思路
1、本发明为克服现有技术的不足,本发明旨在对实际海洋要素场数据中普遍存在的数据稀疏和缺失问题进行数据的补全,可以通过兼具时空性的插值方法处理海洋观测数据稀疏问题,并且还能够实现准确的海洋温度和气候的预测任务。
2、需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
3、本发明提供了一种海洋观测数据的空间场插补方法,本发明提供了以下技术方案:
4、一种海洋观测数据的空间场插补方法,所述方法包括以下步骤:
5、步骤1:通过模糊区间规则对海洋浮标原始温盐场数据进行时段划分;
6、步骤2,使用滑动窗口构建深度学习训练集和标签;
7、步骤3,通过lstm模型进行缺失数据点的检测;
8、步骤4,通过tcn对海洋浮标数据潜在时序性特征提取;
9、步骤5,利用多层tcn进行扩张卷积提取更多的历史信息;
10、步骤6,结合注意力机制进行插补特征关联特征的重要信息挖掘;
11、步骤7,经过多个dense层信息还原输出插补的预测结果。
12、优选地,所述步骤1具体为:
13、收集美国大气环境预报中心/美国大气环境研究中心的海面温度再分析资料以及真实的海洋浮标观测数据资料进行数据的插补实验,将不同的时间段根据模糊区间规则划分为不同的样本数据集,得到一组包含温度、湿度、盐度、风向等特征的完整原始训练集。
14、优选地,所述步骤2具体为:
15、采用滑动窗口的方法构建深度学习的标签样本集,对于以天为分段的时间序列,训练样本需要在没有缺失值的观测序列的基础上构建,其中缺失值的长度为m d,滑动窗口的长度需要大于 m d,通过在 m d的两端各保留长度为s d的观测数据,滑动窗口的长度为m+2s d,通过滑动窗口的方式就将从整个训练集中划分出了想要进行插补的标签,通过对整个训练集和标签进行划分得到了测试和验证集。
16、优选地,所述步骤3具体为:
17、进行海洋数据的稀疏数据和缺失数据进行插补,对稀疏和缺失的海洋浮标观测数据进行检测,采用长短期记忆网络模型进行缺失数据点的检测,通过向训练后的lstm模型中输入历史序列,lstm输出检测到时间窗口检测识别数据序列,基于预测的数据点序列能够得到某个时间段的值是否是数据的稀疏或者缺失。
18、优选地,所述步骤4具体为:
19、根据单个样本的稀疏数据和缺失数据检测序列m,对序列中标签为0的缺失数据进行填补,将训练集数据先通过embedding层进行特征降维,通过一层时间卷积网络挖掘潜在的历史信息对于需要填充的数据能够确保通过历史数据进行信息挖掘;
20、给定时间序列,tcn输出相同长度的卷积结果,其中,值依赖于该时段之前的输入值;每一个隐藏层节点数和输入步长是相同的,并且隐藏层t时刻节点的值只依赖前一层t时刻及之前的值;tcn引入了因果卷积,在确保获取足够长的历史有效信息的情况下,降低了深度和复杂程度,tcn的计算公式通过下式表示:
21、
22、
23、其中,滤波器为f,序列为,第一个隐藏层的最后有一个节点为,k为卷积层数,k为可训练偏移参数。
24、优选地,所述步骤6具体为:
25、将因果卷积输出通过attention将其中对于预测插补值有重要影响的特征进行提取,将输入特征的查询变量query(q)和输入的键值对变量key-value pairs映射到输出上,其中输入特征的查询变量query、每个输入特征的键值变量key、每个输入的键通过计算得到的对应值value都是向量,输出是所有输出值的加权和v中所有values输入的键通过计算得到对应的值的加权,其中权重是由query和每个key计算出来的;计算方法包括以下步骤:
26、第一步:计算比较q和k的相似度,用f来表示:
27、
28、第二步:将得到的相似度进行softmax操作,进行归一化:
29、
30、第三步:针对计算出来的权重,对v中所有的values进行加权求和计算,得到attention向量:
31、。
32、优选地,所述步骤7具体为:
33、根据步骤6得到的特征信息attention向量 ,放入dense层进行特征信息的还原,进行信息解码;通过多层dense层的输出,之后进行reshape得到一个预测海洋数据插补值;通过步骤3得到的稀疏和缺失数据标签进行插值,当某个位置上的标签是小于0.5的话就将该位置视为缺失值标记,当这个位置上的标签大于0.5时,将这个位置的值视为完整的值;通过时空信息插值方法对海洋数据中的严重缺失和稀疏的值进行插补。
34、一种海洋观测数据的空间场插补系统,所述系统包括:
35、划分模块,所述划分模块通过模糊区间规则对海洋浮标原始温盐场数据进行时段划分;
36、滑动窗口模块,所述滑动窗口模块使用滑动窗口构建深度学习训练集和标签;
37、缺失数据检测模块,所述缺失数据检测模块通过lstm模型进行缺失数据点的检测;
38、特征提取模块,所述特征提取模块通过tcn对海洋浮标数据潜在时序性特征提取;
39、历史信息获取模块,所述历史信息获取模块利用多层tcn进行扩张卷积提取更多的历史信息;
40、信息挖掘模块,所述信息挖掘模块结合注意力机制进行插补特征关联特征的重要信息挖掘;
41、插补模块,所述插补模块经过多个dense层信息还原输出插补的预测结果。
42、一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现一种海洋观测数据的空间场插补方法。
43、一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现一种海洋观测数据的空间场插补方法。
44、本发明具有以下有益效果:
45、本发明与现有技术相比:
46、本发明方法包括:步骤1,通过模糊区间规则对海洋浮标原始温盐场数据进行时段划分;步骤2,使用滑动窗口构建深度学习训练集和标签;步骤3,通过lstm模型进行缺失数据点的检测;步骤4,通过tcn对海洋浮标数据潜在时序性特征提取;步骤5,利用多层tcn进行扩张卷积提取更多的历史信息;步骤6,结合注意力机制进行插补特征关联特征的重要信息挖掘;步骤7,经过多个dense层信息还原输出插补的预测结果。通过本技术中的技术方案,通过兼具时空性的插值方法处理海洋观测数据集问题,更好的还原了真实的海洋浮标数据中的温盐空间场的稀疏和缺失值。
47、本发明通过以上步骤对海洋浮标观测数据的空间场参数进行插补,将海洋观测数据中稀疏、零散、缺失的数据进行拟合插补,为发掘和利用海洋数据内容进行再分析研究提供了良好的数据支撑,为改进提高大气、海洋的环境参数的数值预报能力提供完整的信息。促进了对海温、洋流、气候的预测研究工作。