本发明涉及中尺度涡数据处理,具体涉及一种用于海洋中尺度涡样本数据的处理及中尺度涡识别方法。
背景技术:
1、中尺度涡是海洋中的一种涡流,各大洋中到处都有这种涡流的存在。中尺度涡在海洋中十分普遍,它们携带着巨大的能量,对海洋中能量和物质运输发挥着关键作用。其中,南海是环流结构复杂、旋涡多发的海域,开展南海中尺度涡识别与跟踪对于全面深入南海生态环境、动力及气候改变等领域的研究具有重要意义。
2、研究人员对海洋中尺度涡已开展了多年的研究,开发了许多自动检测旋涡的方法,按照采用的数据的类型将检测方法分为两类:欧拉方法和拉格朗日方法。其中,欧拉方法基于一个时刻的快照数据或空间场数据,拉格朗日方法基于水团或物质粒子的轨迹数据。由于当前遥感技术的高速发展,遥感影像具有的大尺度、高时间分辨率的特点,使其在海洋中尺度涡识别中被广泛运用,使得基于欧拉方法的海洋中尺度涡识别方法被广大学者所使用。欧拉方法可划分为以下三种:
3、一是基于物理参数的方法,okubo-weiss参数法(简称ow参数法)是最具有代表性的基于物理参数的方法,ow参数法将旋涡定义为ow参数低于特定的负阈值的连接区域,该方法量化了流场中变形相对于旋转的重要性。但该方法存在ow最佳阈值的选取难以确定、物理参数的推导过程会产生噪声项而导致误检率的增加、物理标准可能导致检测失败或低估旋涡的大小等缺陷。
4、二是基于瞬时流场的形状或曲率特征来检测旋涡的几何方法,不同于基于物理参数的方法,几何准则识别旋涡的方法是直接去寻找映射到垂直于旋涡核心的平面上的瞬时流线,最具代表性的sla闭合等值线法是直接基于围绕单个局部极值的海面高度的闭合轮廓,该方法需要确定海面偏差的阈值来界定旋涡边界,而阈值的微小变化将对所识别结构的数量和位置产生重大影响。
5、三是物理参数与几何特征混合方法,通过同时使用物理参数和与流场的几何特性,以获得比单一方法给出的统计结果更可靠的统计结果,混合方法可能会得到较好的识别效果,但其复杂性较高,计算效率偏低。
6、在深度学习领域,训练样本的质量和数量直接决定了模型的性能,尤其是在图像处理领域,样本的数量尤为重要,这是模型的机制决定的。而现阶段,对于旋涡的自动检测,训练样本的数量较少,且训练样本的制作主要通过人工进行标注,费时费力,严重影响了对旋涡的识别速率和识别准确率。
技术实现思路
1、本发明所要解决的技术问题为:现有的用于海洋中尺度涡识别的训练样本较少,降低了对中尺度涡的识别速率和识别准确率。为解决该技术问题,本发明提供了一种用于海洋中尺度涡样本数据的处理及中尺度涡识别方法。
2、本发明解决上述技术问题的技术方案如下:
3、一种用于海洋中尺度涡样本数据的处理方法,包括:
4、步骤s1,获取原始样本数据,所述原始样本数据为海平面高度异常数据,对所述原始样本数据进行预处理,得到预处理数据;
5、步骤s2,通过预设的sla闭合等值线阈值分割所述预处理数据中包含的旋涡数据,得到多个闭合轮廓,所述旋涡数据包括气旋涡和反气旋涡;
6、步骤s3,根据多个所述闭合轮廓和预设的约束条件,得到满足所述约束条件的多个目标轮廓;
7、步骤s4,对多个所述目标轮廓进行类型标注,得到第一样本数据集,所述第一样本数据集包括多个第一样本数据;
8、步骤s5,对所述第一样本数据集进行样本扩充,得到第二样本数据集,所述第二样本数据集包括多个第二样本数据,所述第二样本数据集包含的第二样本数据的数量大于所述第一样本数据集包含的第一样本数据的数量。
9、本发明的有益效果是:首先通过sla闭合等值线阈值检测出旋涡数据,然后对旋涡数据进行分割,得到目标轮廓,再对目标轮廓进行类型标注,得到第一样本数据集,最后根据第一样本数据集进行样本扩充,既减少了人为标注训练数据(即所述目标轮廓)的时间,又解决了深度学习训练样本数量少的问题;以类型标注的方式确定提取到的有效旋涡和无效旋涡,将每个被标注的目标轮廓作为第一样本数据集的组成部分,再对第一样本数据集进行样本扩充,提高了后续深度学习在海洋中尺度涡识别中的泛化能力。
10、在上述技术方案的基础上,本发明还可以做如下改进。
11、进一步,所述步骤s1中,对所述原始样本数据进行预处理,得到预处理数据,包括:
12、对所述原始样本数据进行空间高通滤波处理,得到预处理数据。
13、采用上述进一步方案的有益效果是:通过对所述原始样本数据进行预处理,以删除大尺度涡,并突出中尺度涡,便于后续获取用于训练模型的样本数据。
14、进一步,所述步骤s2中,通过预设的sla闭合等值线阈值分割所述预处理数据中包含的旋涡数据,得到多个闭合轮廓,包括:
15、以预设大小的切片对所述旋涡数据进行分割处理,得到多个闭合轮廓,通过所述切片对所述旋涡数据进行分割处理后得到的每个所述闭合轮廓对应所述旋涡数据的一个横截面。
16、采用上述进一步方案的有益效果是:通过对旋涡数据进行分割处理,根据预设的约束条件确定目标轮廓,可以获得更加紧凑的中尺度的旋涡数据。
17、进一步,所述约束条件包括:
18、所述闭合轮廓对应的形状误差小于等于65%,所述形状误差根据所述闭合轮廓的面积、所述闭合轮廓对应的拟合圆的面积、所述闭合轮廓与所述闭合轮廓对应的拟合圆之间的重合面积确定;
19、所述闭合轮廓包含的像元数i满足8≤i≤1500;
20、若所述闭合轮廓仅包含气旋涡,所述闭合轮廓包含的每个气旋涡的sla值均小于所述闭合轮廓的sla值;若所述闭合轮廓仅包含反气旋涡,所述闭合轮廓包含的每个反气旋涡的sla值均大于所述闭合轮廓的sla值;
21、若所述闭合轮廓包含至少两个气旋涡,所述闭合轮廓包含的每个气旋涡的sla值中仅包含一个最小值;若所述闭合轮廓包含至少两个反气旋涡,所述闭合轮廓包含的每个反气旋涡的sla值中仅包含一个最大值;
22、所述闭合轮廓对应的振幅a满足1cm≤a,所述振幅表征所述闭合轮廓包含的所述旋涡数据对应的sla值中的最大值与所述闭合轮廓的sla值之间的差值的绝对值。
23、采用上述进一步方案的有益效果是:通过sla闭合等值线阈值检测出的旋涡数据中包含有效旋涡和无效旋涡,通过约束条件确定目标轮廓,便于减少后续对目标轮廓进行类型标注的工作量。
24、进一步,所述步骤s5中,对所述第一样本数据集进行样本扩充,得到第二样本数据集,包括:
25、对于每个所述第一样本数据,对所述第一样本数据进行水平翻转处理,得到所述第一样本数据对应的第一处理数据;
26、对于每个所述第一样本数据,对所述第一样本数据进行旋转处理,得到所述第一样本数据对应的第二处理数据;
27、对于每个所述第一样本数据,对所述第一样本数据添加高斯噪声,得到所述第一样本数据对应的第三处理数据;
28、所述第二样本数据集包括各个所述第一样本数据、各个所述第一处理数据、各个所述第二处理数据和各个所述第三处理数据。
29、采用上述进一步方案的有益效果是:根据第一样本数据集进行样本扩充,减少了人工标注的工作量,可进一步减少因为人工漏判或者误判导致丢失第一样本数据,提高了用于训练识别中尺度涡的分类模型的训练样本数量,进而提高了分类模型的学习效果和泛化能力,为进一步提高对中尺度涡的识别速率和识别准确率奠定了基础。
30、为进一步解决现有的用于进行海洋中尺度涡识别的分类模型的学习能力和泛化能力较差的问题,本发明还提供了一种用于海洋中尺度涡识别的分类模型的训练方法,包括:
31、获取待处理数据,将所述待处理数据作为原始样本数据,执行如前所述的用于海洋中尺度涡样本数据的处理方法,得到所述待处理数据对应的第二样本数据集;
32、根据所述第二样本数据集,对预先构建的原始分类模型进行模型训练,得到目标分类模型。
33、本发明的有益效果是:在人工标注的基础上获得第二样本数据集,第二样本数据集中包含大量的第二样本数据,通过第二样本数据集对预先构建的原始分类模型进行模型训练,使得训练得到的目标分类模型具有较好的学习能力和泛化能力。
34、为进一步解决现有的用于海洋中尺度涡识别的方法的识别速率和识别准确率低的问题,本发明还提供了一种海洋中尺度涡识别方法,包括:
35、将待识别数据输入所述目标分类模型中,得到所述待识别数据的分类结果。
36、本发明的有益效果是:通过联合本发明提供的用于海洋中尺度涡样本数据的处理方法和深度学习模型,可实现快速检测中尺度涡,解决了当前在庞大海面高度异常数据中识别海洋中尺度涡识别速率低和识别效率低的问题。
37、为解决现有技术中存在的技术问题,本发明还提供了一种用于海洋中尺度涡样本数据的处理系统,包括:
38、数据获取模块,用于获取原始样本数据,所述原始样本数据为海平面高度异常数据,对所述原始样本数据进行预处理,得到预处理数据;
39、闭合轮廓确定模块,用于通过预设的sla闭合等值线阈值分割所述预处理数据中包含的旋涡数据,得到多个闭合轮廓,所述旋涡数据包括气旋涡和反气旋涡;
40、目标轮廓确定模块,用于根据多个所述闭合轮廓和预设的约束条件,得到满足所述约束条件的多个目标轮廓;
41、数据标注模块,用于对多个所述目标轮廓进行类型标注,得到第一样本数据集,所述第一样本数据集包括多个第一样本数据;
42、数据扩充模块,用于对所述第一样本数据集进行样本扩充,得到第二样本数据集,所述第二样本数据集包括多个第二样本数据,所述第二样本数据集包含的第二样本数据的数量大于所述第一样本数据集包含的第一样本数据的数量。
43、为解决现有技术中存在的技术问题,本发明还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前所述的用于海洋中尺度涡样本数据的处理方法。
44、为解决现有技术中存在的技术问题,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述的用于海洋中尺度涡样本数据的处理方法。