一种基于宽度学习系统的台风路径分类方法与流程

文档序号:30068463发布日期:2022-05-18 01:31阅读:333来源:国知局
一种基于宽度学习系统的台风路径分类方法与流程

1.本发明属于台风路径分类技术领域,特别涉及一种基于宽度学习系统的台风路径分类方法。


背景技术:

2.台风是全球最严重的自然灾害之一,因此研究台风活动的变化规律及其成因对台风预报及防灾减灾有极大的科学意义。
3.宽度学习系统(bls)是一种基于随机向量函数链接神经网络的增量式学习算法,由于其训练过程无须反复迭代样本数据且通过岭回归求解伪逆的方式计算网络输出层权重矩阵,因此与普通神经网络相比更适合处理需要计算量较大的工作,如数据分类等。
4.宽度学习系统由特征映射层、增强节点层和输出层组成,其中特征映射层和增强向量层共同作为系统的输入。特征映射层通过特征映射函数随机生成权重实现对样本的特征提取。增强节点层通过正交规范化的随机权重对特征向量进行增强计算,引入激活函数函数增强模型的非线性分类能力,从而达到充分提取样本数据特征信息的目的。最后通过对特征映射层和增强节点层的合成矩阵进行伪逆运算,即可求出系统输入到输出的权重矩阵。当利用宽度学习系统解决分类问题时,将待分类的数据集和待分类数据集的标签集作为宽度学习系统的输入,训练宽度学习系统,宽度学习系统输出各数据分别属于各个类别的概率,概率最大所在的类别最即为该数据所被判别的类别。
5.台风路径是台风在运动过程中,台风中心点经过的位置组成的时间序列,因台风运动受区域环境、气候等影响导致其运动路径复杂,因此对台风路径进行分类分析较难。目前已有对台风路径的分类研究主集中在对台风进行聚类分析,利用相似阈值对台风路径进行分类。但这种方法只适用于较少的台风路径分类,当台风路径集很大时,相似阈值定义较难,通用型较差。


技术实现要素:

6.为解决现有技术存在的上述问题,本发明提出了一种利用宽度学习系统结合台风路径特征表示的台风路径分类方法。
7.本发明方法包括以下步骤:
8.s1、构建台风路径种类集合。利用改进的dbscan算法对台风路径进行聚类分析,利用动态时间规整算法代替dbscan算法中的相似度计算方法计算路径间的相似度,将相似性大的路径自动聚为一类,建立台风路径的种类标签矩阵;
9.s2、构建台风路径的特征矩阵。利用改进的层次聚类算法对台风路径通过特征表示来统一长度,因台风路径点是严格按照时间先后顺序排列的数据序列,因此本发明将层次聚类算法进行改进,只对各个路径相邻点进行层次聚类分析,以相邻点的欧几里得距离(欧氏距离)为度量标准,将欧氏距离较小的点进行合并,将所有台风路径统一长度,实现各个台风路径的特征表示,得到台风路径特征矩阵;
10.s3、建立基于宽度学习系统的台风路径多分类模型,并利用该模型进行台风路径分类。宽度学习系统(bls)是一种基于随机向量函数链接神经网络的增量式学习算法,本发明将s1得到的台风路径种类标签矩阵和s2得到的台风路径特征矩阵作为模型的输入,特征映射层随机生成权重对输入样本进行特征提取,增强节点层通过正交规范化的随机权重对特征向量进行增强计算,利用激活函数函数增强模型的非线性分类能力,最后通过对特征映射层和增强节点层的合成矩阵进行伪逆运算,求出系统输入到输出的权重矩阵,输出矩阵每行的输出值即为bls求出的各路径分别属于各个类别的概率,各行最大值所在位置索引即为各条测试路径所被判别的类别,从而实现台风路径的分类预测。
11.本发明与现有技术相比有以下优点:
12.第一,本发明方法中采用了改进的dbscan聚类算法建立台风路径的种类集合,可以根据历史各个台风路径的相似性自动生成种类集合。
13.第二,本发明方法采用了改进层次聚类的特征表示方法,将不同台风路径数据统一尺度,为分类提供基础。
14.第三,本发明方法采用了宽度学习系统对台风路径进行分类,实现了台风路径的自动分类。
附图说明
15.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
16.图1是本发明的具体实施方式中基于宽度学习系统的台风路径分类方法流程图。
具体实施方式
17.如图1所示,本发明包括以下步骤:
18.s1、通过聚类算法建立台风路径种类集。
19.因台风路径是台风运动过程中台风中心按照时间先后顺序排列的轨迹序列,而dbscan算法是一种基于密度的聚类算法,它可以发现任意形状的簇,自动确定簇的数量,并对噪声具有鲁棒性,因此很适合于对台风路径这种轨迹类数据进行聚类分析,将相似性大的路径自动聚为一类。相似度一般利用距离进行衡量,距离越小相似度越大。原始的dbscan算法在做聚类分析时,采用的是欧氏距离度量方法,此方法只适合用于具有相同个数的点的台风路径且其没有考虑路径的波动情况,因此本发明利用动态时间规整算法作为路径的距离度量方法。动态时间规整算法是通过把需要比较的不同路径进行伸长或缩短,直到长度一致,再计算路径间距离。因此台风路径种类集建立过程为:
20.(1)设扫描邻域半径eps,最小包含路径个数minpts,任选台风路径样本中一条未被访问的路径开始,利用动态时间规整算法计算该路径与其他路径的距离,找出与其距离在eps之内(包括eps)的所有附近路径。
21.(2)如果附近路径的数量大于等于minpts,则当前路径与其附近路径形成一个簇,并且出发路径被标记成已访问。
22.(3)重复(1)-(2)步,处理该簇内所有未被标记成已访问的路径,若附近路径的数量小于minpts,则该路径被标记为噪声数据。
23.(4)若簇内所有路径都被标记成已访问,重复(2)-(3)步直到所有对象都被归为某个簇或标记成噪声数据,输出各个路径的种类标签矩阵。每个路径的特征矩阵记为路径特征的标签矩阵记为y。
24.s2、各个台风路径的数据长度可能不同,因此不能直接利用原始数据构造特征矩阵进行分类。考虑到台风路径无法用函数关系来准确拟合,因此,利用改进的层次聚类算法从各个台风路径上提取相同个数点来表示台风路径,这一过程本发明命名为台风路径特征表示,各个提取的点叫做特征点,各个特征点组成的为特征路径。层次的聚类算法的计算原理是先计算样本之间的距离,每次将距离最近的点合并到同一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个大类,不停的合并,直到达到规定的条件。本发明利用改进的层次聚类方法对台风路径进行特征表示,只以相邻点的欧几里得距离(欧氏距离)为度量标准,将欧氏距离小的点进行合并,把合并的点作为路径的特征点。若li为点ti到点t
i+1
的距离,其中xi和yi分别为点ti的经度和纬度,x
i+1
和y
i+1
分别为点t
i+1
的经度和纬度,具体计算步骤如下:
25.a1、计算原始台风路径上各相邻点之间的距离li。
26.a2、将所有距离li保存在集合s中,s={l1,l2,

,l
n-1
},其中,l1为点t1和点t2点之间的距离,l2为点t2和点t3之间的距离,l
n-1
为点t
n-1
和点tn之间的距离,i表示点的序号,n表示点的总数。
27.a3、将s集合中距离最小的两点合并为一个点,并用两点的经度和纬度的均值表示该点,形成新路径。
28.a4、按步骤a2重新计算新路径上各个相邻点之间的距离,更新集合s。
29.a5、转步骤a3,直到所有新路径的点数达到样本集中最短路径集的长度,输出特征路径集f。
30.s3、建立基于宽度学习系统的台风路径分类模型,并基于该模型进行分类预测。宽度学习系统(bls)是一种基于随机向量函数链接神经网络的增量式学习算法,将特征路径集f和标签矩阵y作为输入,特征映射层随机生成权重对输入样本进行特征提取,增强节点层通过正交规范化的随机权重对特征向量进行增强计算,利用激活函数函数增强模型的非线性分类能力,最后通过对特征映射层和增强节点层的合成矩阵进行伪逆运算,求出系统输入到输出的权重矩阵,输出矩阵每行的输出值即为bls求出的各路径分别属于各个类别的概率,各行最大值所在位置索引即为各条测试路径所被判别的类别,从而实现台风路径的分类预测。
31.最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1