一种基于蜂窝网格集成机制与时空Transformer的渔情预测方法及系统与流程

文档序号:28738677发布日期:2022-02-07 21:10阅读:136来源:国知局
一种基于蜂窝网格集成机制与时空Transformer的渔情预测方法及系统与流程
一种基于蜂窝网格集成机制与时空transformer的渔情预测方法及系统
技术领域
1.本发明涉及一种基于蜂窝网格集成机制与时空transformer的渔情预测方法及系统,特别是涉及数据综合挖掘与分析的领域。


背景技术:

2.海洋渔业资源在人类生存和发展中起着不可替代的作用,是现代社会主要经济活动的一部分。但随着捕捞区域的扩大和超出渔业资源再生速度的高强度捕捞,近海渔业资源环境遭到严重破坏,海洋渔业资源岌岌可危。为了维持渔业资源的可持续开发和利用,实现渔业资源的合理配置,通过对未来渔业资源的合理预测,为适度捕捞提供决策依据。
3.现有技术在实现未来渔业资源预测时,由于预测未来的鱼群的位置与鱼量,需要有关的历史数据,但是由于海洋中的传感器的数量相对较少,无法获得海洋中准确的鱼群位置与数量,且每艘渔船的捕捞量对于各公司也都是保密的,这给鱼群预测带来了极大的挑战。
4.传统的预测方法集中在对海洋环境数据进行分析,如使用环境阈值法分析或栖息地指数模型预测渔场的空间分布。但这些数据在时间和空间上都不是细粒度的,对于实际应用中的指导意义并不大。


技术实现要素:

5.发明目的:提出一种基于蜂窝网格集成机制与时空transformer的渔情预测方法,以解决现有技术存在的上述问题,通过局部区域的划分,以及端到端的预测框架,显著地丰富了样本量和降低特征维数,同时通过时空数据的综合分析,获取更为丰富的时空特征,为时空数据挖掘提供更具价值的见解。
6.技术方案:第一方面,提出了一种基于蜂窝网格集成机制与时空transformer的渔情预测方法,该方法具体包括以下步骤:步骤1、根据需求选择海洋中待进行渔情预测的区域;步骤2、构建规则且大小相等的小区域,利用所述小区域对待进行渔情预测的区域进行划分;步骤3、获取待进行渔情预测区域的渔船轨迹与海洋环境遥感数据,并进行数据预处理;步骤4、利用聚类算法对预处理后的数据进行分析,获取渔船作业时的捕鱼轨迹点;步骤5、将所述轨迹点映射到所述小区域中,结合时间与空间维度,获得表示渔情状况的数据;步骤6、构建预测模型,接收所述表示渔情状况的数据以及海洋环境数据,并输出预测结果;
步骤7、通过数据集成策略整合所述预测结果,获得最终的渔情预测状况,并输出。
7.针对现有技术中出现的区域数据无法有效预测的问题,通过局部到局部的预测框架,有效丰富样本数量的同时降低了特征维数。同时,通过结合时间和空间维度上的数据特征,克服了现有技术中时间依赖性上的不足,使得模型预测准确度得到提高。
8.在第一方面的一些可实现方式中,小区域为具有各向同性特征的正六边形网格,呈现蜂窝网格状。与现有技术中采用的方形栅格相比,正六边形网格只有共享边邻域一种,在距离度量和连通性上没有歧义,同时还具有各向同性的特征,更贴合实际方向不受限制的应用。
9.在第一方面的一些可实现方式中,采用局部到局部的预测措施,将小区域及其附近区域中的数据输入预测模型中进行分析处理;进一步的,基于划分出的小区域,在待进行渔情预测的区域内数据映射为小区域内的数据向量后,将对应的小区域数据向量转换为一个便于被神经网络接收的二维张量,输入预测模型进行分析处理。
10.其中,预测模型包括:一个位置嵌入层、堆叠的时空transformer模块、数据融合层和预测层。
11.具体的,时空transformer模块根据应用需求进行堆叠,用于提取时间和空间上的依赖关系,进一步包括:空间transformer模块和时间transformer模块。
12.其中,空间transformer模块对数据处理的步骤进一步包括:首先,计算每个小区域中所对应的空间属性值向量;其次,计算获取空间自注意力的权重;再次,通过计算自注意力权重与值向量的加权和,得到小区域空间transformer中每一个头部的编码;从次,将头部编码串联起来并输入前馈网络进行特征提取;最后,加入残差连接,并在整合前馈网络输出值后输出最终获得的空间张量。其中,所述空间属性值向量包括:query空间向量、key空间向量和value空间向量。
13.时间transformer模块对数据处理的步骤进一步包括:首先,根据时空transformer模块输出的空间张量计算每个小区域中所对应的时间属性值向量;其次,计算获取时间自注意力的权重;再次,通过计算自注意力权重与值向量的加权和,得到小区域时间transformer中每一个头部的编码;从次,将头部编码串联起来并输入前馈网络进行特征提取;最后,加入残差连接,并在整合前馈网络输出值后输出最终获得的时间张量。其中,所述时间属性值向量包括:query时间向量、key时间向量和value时间向量。
14.针对现有技术中采用全局区域要素作为预测模型的输入,输出全局区域标签的技术方案,通过局部到局部的数据处理方案,克服特征维度爆炸的问题,另外通过将自注意力机制从时间、空间数据扩展到时空数据,有效地提取时空特征,在满足局部依赖的前提下,实现对未来数据的预测,以及模型预测准确度的提高。
15.在第一方面的一些可实现方式中,预测模型的融合层位于时空transformer模块之后,用于将环境因素嵌入到时空transformer提取的时空特征中;具体的,利用两个全连接层对环境数据进行特征提取,获得环境因素,随后通过融合层将环境因素嵌入到时空transformer提取的时空特征中,从而获得融合后的数据张量,最后,基于融合层的输出进行预测,并输出预测的结果。
16.在第一方面的一些可实现方式中,预测模型的预测层包括:卷积层和一个全连接层;其中,预测层基于融合层的输出结果进行数据预测,获得局部区域的预测值,针对预测
结果的精准度,采用区域重叠取平均的措施进行最终预测值的获取;具体的,预测模型输出大量的特征张量,随后转换为局部小区域映射,针对重叠部分的区域则对应有重叠的映射,通过取平均值的措施获取最终的区域预测值,进而获得最终的渔情预测状况,并作为后续决策的依据。
17.通过重叠区域取平均值的策略,不仅提高了预测的准确度,同时还增强了预测的性能,有效提高预测模型的准确度和鲁棒性。
18.第二方面,提出一种基于蜂窝网格集成机制与时空transformer的渔情预测系统,该系统具体包括:传感器,用于采集待研究区域内的传感数据;数据预处理模块,用于接收传感器采集到的传感数据并进行数据处理;区域划分模块,用于构建规则且大小相等的小区域,以及利用所述小区域对待进行研究的区域进行划分;预测模型,用于对经过数据预处理模块处理后的数据进行数据分析,并将分析结果输出;所述预测模型包括:一个位置嵌入层、堆叠的时空transformer模块、数据融合层和预测层;其中所述时空transformer模块根据应用需求进行堆叠,用于提取时间和空间上的依赖关系,进一步包括:空间transformer模块和时间transformer模块;集成策略模块,用于集成预测模型输出的分析结果,并采用取平均值的方法获得最终的预测结果。
19.第三方面,提出一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现渔情预测方法。
20.有益效果:本发明提出了一种基于蜂窝网格集成机制与时空transformer的渔情预测方法及系统,不同于以往的时空预测将研究区域划分为方形栅格,本发明利用蜂窝格网对研究区域进行区域划分,由于蜂窝网格的各向同性特征优于方形网格,因此更加符合海洋中运动方向不受限制的情况。
21.同时分析预测过程中还提出一个局部到局部的预测和基于蜂窝网格的集成策略框架,该框架不仅极大地丰富样本量和降低特征维数,还通过集成策略的实施提高了模型预测的准确度和鲁棒性,为时空数据挖掘领域提供了有价值的见解。
22.另外,受transformer在自然语言处理和计算机视觉方面取得的先进成就的启发,本发明设计了时空transformer架构。通过将自注意力机制从时间、空间数据扩展到时空数据,有效地提取时空特征,提高模型预测的准确度。
附图说明
23.图1为本发明的数据处理流程图。
24.图2为本发明研究区域划分结构对比示意图。
25.图3为蜂窝网格局部区域划分示意图。
26.图4为本发明预测模型数据处理示意图。
27.图5为本发明空间transformer数据处理示意图。
28.图6本本发明时间transformer数据处理示意图。
29.图7为本发明集成策略整合预测结果示意图。
具体实施方式
30.在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员而言显而易见的是,本发明可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明发生混淆,对于本领域公知的一些技术特征未进行描述。
31.申请人认为由于过度捕捞的现象导致近海渔业资源环境遭到严重破坏,使得海洋渔业资源岌岌可危,为了维持渔业资源的可持续开发和利用,通过对未来渔业资源的合理预测,为适度捕捞提供决策依据。然而现有技术在进行渔情预测时,由于海洋中的传感器的数量相对较少、捕捞数据不易获取、预测数据在时间和空间上不是细粒度的问题,导致预测出的数据对于实际应用中的指导意义并不大。
32.在一个实施例中,针对海洋中需求进行预测分析的区域,提出一种基于蜂窝网格集成机制与时空transformer的渔情预测方法,针对现有技术存在的海洋短时鱼群和鱼量无法有效预测的问题,通过设计局部到局部的预测框架,显著地丰富了样本量和降低特征维数;同时为了能更好的捕获时空特征,本实施例设计了时空transformer框架,用于为时空数据挖掘提供有价值的见解。
33.具体的,如图1所示,一种基于蜂窝网格集成机制与时空transformer的渔情预测方法,包括以下步骤:步骤1、根据需求选择海洋中待进行渔情预测的区域;步骤2、构建规则且大小相等的小区域,并利用小区域对待进行渔情预测的区域进行划分;步骤3、根据预设时间段获取待进行渔情预测区域的渔船轨迹与海洋环境遥感数据,并进行数据预处理;步骤4、利用聚类算法对预处理后的数据进行分析,获取渔船作业时的捕鱼轨迹点;步骤5、将获取到的轨迹点映射到构建的小区域中,结合时间与空间维度,获得表示渔情状况的数据;步骤6、构建预测模型,接收表示渔情状况的数据以及海洋环境数据,并输出预测结果;步骤7、通过数据集成策略结合输出的预测结果,获得最终的渔情预测状况,并输出。
34.其中海洋环境遥感数据包括通过传感器获取到的海洋温度、盐度、叶绿素浓度等。
35.本实施例在数据预测过程中,通过结合时间和空间维度上的数据特征,在海洋环境数据的基础上进行依赖关系分析,克服了现有技术中时间依赖性上的不足,使得模型预测准确度得到提高。
36.在进一步的实施例中,进行时空数据预测分析时,对需要进行分析的区域,往往采用如图2所示的方形网格进行划分,由于方形网格的邻域有共享边邻域和共享顶点邻域两种,这两种邻域在距离度量和连通性上会产生不一致性,因此,方形网格不是空间分析的最佳选择。
37.针对方形网格在距离度量与连通性上存在的歧义,本实施例提出一种正六边形的
蜂窝网格对研究区域进行划分,与方形网格相比,正六边形网络只有共享边邻域一种,在距离度量和连通性上没有歧义,同时还具有各向同性的特征,与海洋中运动方向不受限制的情况更加符合。
38.构建完正六边形的蜂窝网格分析区域后,将获取到的渔船轨迹点进行聚类,获得捕鱼轨迹点,随后将捕鱼轨迹点投影到蜂窝网格,在时间与空间维度进行聚合,从而得到在每个网格中每一段时内渔船作业的总时间,并利用此作业时间代表渔情状况,获得所有代表渔业资源状况的张量数据,其对应的表达式为:式中,表示总天数;,其中表示划分区域的总个数。
39.本实施例针对现有技术利用方形网格划分研究区域存在歧义的技术问题,提出正六边形蜂窝网格的替换方案,有效解决了方形网格在距离度量和连通性方面存在不一致的问题,同时更符合实际海洋中运动方向不受限制的特点。
40.在进一步的实施例中,由于现有技术常采用全局区域要素作为预测模型的输入,同时输出全局区域的标签,因此,对未来数据进行分析预测时,这样的操作需要较长的样本历史序列,尤其是在研究范围广阔的情况下,更容易面临特征维度爆炸的问题。针对全局策略,本实施例提出一种局部到局部的预测技术方案,通过将小区域内的数据输入预测模型,在满足局部依赖的前提下,实现对未来数据的预测。同时,局部到局部的预测方式更加符合海洋中在短时间内远距离依赖不强的特点。
41.具体的,如图3所示,选定一个中心网格,每个中心网格的第一圈有6个环绕网格,第二圈有12个环绕网格,利用向量表示一个中心区域的局部蜂窝网格映射,其中n表示相邻层的序列索引。将一圈环绕局部映射网格表示为向量,两圈环绕局部映射网格表示为向量,图3中指出了围绕中心网格的两圈邻域中蜂窝网格的相对位置,第n圈的网格索引预设为从右方向开始。根据划分好的蜂窝网格,将对应映射的数据向量送入搭建的预测模型中,获得对应的预测数据。其中,表示在t时间段内,以网格i为中心网格的局部区域渔情状况;m表示分析过程中预设的m个历史时间段;t表示预测的时间段数。
42.完成蜂窝网格映射后,将对应的渔情状况表达方式转换为一个便于被神经网络接收的二维张量x,其对应表达式为:,式中n表示个局部区域,m表示从t-m+1到t时间段内的m个历史时间段。
43.为了编码每个网格区域的时空位置特征,本实施例在预测模型的时空transformer模块之前设置了位置嵌入层。通过可学习矩阵e将每个蜂窝网格的特征线性地
映射到张量中,随后将产生的输入预测模型中。其中,,,张量表达式具体为:式中,e表示学习矩阵,表示i区域t时间段的渔况;表示一个可学习的位置编码,用于编码每个单元格的时空位置特征;中的d代表的是d维。二维张量x的表达式:表示的维度为,,此时,仅代表一个数(一维),为了提取位置信息,需要将每个数进行维度的扩张,也就是将原本的一个数替换为d个数,这d个数具有更丰富位置特征。具体做法就是利用e和这些可学习的张量来完成。中的右上标的0同下方transformer模块中的层表示的是同个意思,因为这一层位于第一层transformer模块之前,所以用0来表示。
44.本实施例通过局部到局部的映射方案相比于现有技术中采用的全局映射,在提供了更多的样本同时,减少了数据维度。优选实施例中,当分析数据为一年的数据时,共划分为500个区域,全局映射设计需要将这500个区域同时送入网络,而在按天划分的前提下样本数量只有365个。然而,采用本实施例提出的局部到局部策略,维数被限制在一个局部区域映射,考虑划分出的中心区域及附近两圈的网格区域,共有19个蜂窝网格,因此分析区域数量远小于全局区域划分出的500个区域,与此同时,对应的样本数量变为:500*365=182500个样本,极大程度上弥补了原始数据量的不足。
45.在进一步的实施例中,由于单个网格区域的渔情状况会受到其相邻区域的渔情状况、历史渔况信息和海洋环境条件的影响。因此为了捕捉这些影响,本实施例提出一种时空transformer模型,通过提取时间和空间上的依赖关系同时嵌入海洋环境数据来准确预测渔情状况。
46.具体的,如图4所示,本实施例提出的时空transformer模型包括:一个位置嵌入层、堆叠的时空transformer模块、数据融合层和预测层。其中,每一个时空transformer模块包括一个空间transformer和一个时间transformer,用于共同提取空间、时间特征。时空transformer块可以进一步堆叠,形成深度模型用于提取深度时空特征。随后,数据融合层被用来整合外部环境因素。最后,预测层利用两个全卷积层来整合这些时空特征,进行渔情预测。
47.如图5所示,为利用空间transformer获得空间依赖关系的数据流程,在每个空间transformer中,首先计算每个网格所对应的空间属性值向量,每个向量都是由前一个模块的输出计算得出。其中,空间属性值向量包括:query空间向量、key空间向量和value空间向量,对应的表达式如下所示:
式中,ln()表示标准化层,用于避免梯度消失和梯度爆炸的问题;w表示可学习的参数;表示多头注意力机制,取值范围为,其中表示头的数量;表示每个注意力头的维度,表达式为。
48.随后,通过点乘法计算空间自注意力的权重,蜂窝网格(i,t)区域向量的空间自注意力权重,其满足前提条件为,对应的计算表达式如下:式中,表示从空间角度计算自注意力权重;表示网格(i,t)区域在第层空间transformer中,头部所对应的空间query向量;表示向量的转置;表示表示网格区域在第层空间transformer中,头部所对应的空间key向量。因为需要提取空间依赖,所以网格i要与邻近的n个区域建立联系,即。通过计算自注意力权重与值向量的加权和,得到第块空间transformer中每一个头部的编码,其对应表达式为:式中,表示空间自注意力权重系数,其值代表了在t时间段内,网格会对网格产生多大的影响,通过对区域的value向量加权求和得到;表示网格区域在第层空间transformer中,头部所对应的空间value向量。因为是捕获空间依赖,所以,保持不变。在获取后所有来自头部向量之后,将其串联起来,并通过前馈网络神经进行特征提取。为了缓解产生梯度消失和梯度爆炸的风险,在每次操作后使用残差连接,对应张量的表达式更新为:
式中,表示前馈神经网络的参数。
49.通过空间transformer可以获得表征n个局部区域,m个历史时间段渔况空间特征的张量,随后将获得的空间特征张量送入时间transformer进行时间依赖的提取。
50.如图6所示,为利用时间transformer获得时间依赖关系的数据流程,与空间transformer一样,在每个时间transformer模块中,根据前一个空间transformer模块的编码向量,为每个网格计算一个时间所对应的时间属性值向量,其中,时间属性值向量包括:query时间向量、key时间向量和value时间向量,对应的表达式如下所示:对应的表达式如下所示:对应的表达式如下所示:式中,ln()表示标准化层,用于避免梯度消失和梯度爆炸的问题,随后,通过点乘法计算时间自注意力的权重,蜂窝网格(i,t)区域向量的时间自注意力权重,其满足前提条件为,对应的计算表达式如下:式中,表示从时间角度计算自注意力权重;表示网格(i,t)区域在第层时间transformer中,头部所对应的时间query向量;表示向量的转置;表示网格区域在第层时间transformer中,头部所对应的时间key向量。因为需要提取时间依赖,所以t时间段渔况信息需要与之前的m个时间段渔况信息建立联系,即。通过计算自注意力权重与值向量的加权和,得到第块时间transformer中每一个头部的编码,其对应表达式为:式中,表示时间自注意力权重系数,其值代表了在i区域,时间
段的渔况会对时间段的渔况产生多大的影响,通过对时间段的value向量加权求和得到;表示网格区域在第层时间transformer中,头部所对应的时间value向量。因为是捕获时间依赖,所以,保持不变。
51.最后,在获取后所有来自头部向量之后将其串联起来,通过前馈网络神经进行特征提取,在每次操作后使用残差连接,对应张量的表达式更新为:为:经过l层时空transformer模块之后可以得到张量,其中表示n个区域;。将会送入下一个时空transformer模块。最终会得到。
52.本实施例通过将自注意力机制从时间、空间数据扩展到时空数据,有效地提取时空特征,提高模型预测的准确度。
53.在进一步的实施例中,考虑到海洋中的环境因素也会对鱼群的时空分布产生影响。在第l层时空transformer模块之后添加了一层融合层,将环境因素嵌入到时空transformer提取的时空特征中。该过程首先利用两个全连接层对环境数据进行特征提取,然后得到融合后的张量,对应表达式为:式中,表示外部环境因素数据;表示两个全连接层,用于提取海洋环境特征。
54.最后,预测层使用了卷积核为的卷积层和一个全连接层,基于融合层的输出来进行预测输出。预测层的输入为。输出为多步预测表示对于n个区域未来t天的鱼情状况为:式中,代表全连接层,此处的下标同上方的都表示全连接层。具体来说是函数的意思,这个函数由全连接层组成。通过最优化的网络参数,便可以得到局部区域的预测值。为了提高预测的准确度,本实施例进一步提出一种区域重叠取平均的集成策略。如图7所示,训练好的网络通过实时特征输出大量的特征张量y,并进一步转化为局部蜂
窝网格映射,有a、b、c、w等,重叠的局部蜂窝网格映射对网格w有不同的预测,利用这些重叠预测值的平均值来预测网格w区域的渔情状况。
55.本实施例通过集成策略的实施,可以有效提高模型的准确度和鲁棒性。
56.在一个实施例中,提出一种基于蜂窝网格集成机制与时空transformer的渔情预测系统,该系统具体包括:传感器,用于采集待研究区域内的传感数据;数据预处理模块,用于接收传感器采集到的传感数据并进行数据处理;区域划分模块,用于构建规则且大小相等的小区域,以及利用所述小区域对待进行研究的区域进行划分;预测模型,用于对经过数据预处理模块处理后的数据进行数据分析,并将分析结果输出;所述预测模型包括:一个位置嵌入层、堆叠的时空transformer模块、数据融合层和预测层;其中所述时空transformer模块根据应用需求进行堆叠,用于提取时间和空间上的依赖关系,进一步包括:空间transformer模块和时间transformer模块;集成策略模块,用于集成预测模型输出的分析结果,并采用取平均值的方法获得最终的预测结果。
57.在一个实施例中,提出一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现渔情预测方法。
58.综上,本技术所提出的蜂窝网格划分区域,利用蜂窝网格所具备的各向同性特征符合海洋中运动方向不受限制的情况;时空transformer模型可以有效地提取时空特征,这两种方式都可以有效地提高预测地精准度。局部到局部地预测方式也更加符合海洋中远距离依赖不强的情况,降低数据维度、提高训练速度的同时极大地丰富了训练样本量。而集成策略的实施使得预测模型更具鲁棒性。
59.如上所述,尽管参照特定的优选实施例已经表示和表述了本发明,但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下,可对其在形式上和细节上做出各种变化。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1