终端区气象场景识别系统

文档序号:28697919发布日期:2022-01-29 12:42阅读:109来源:国知局
终端区气象场景识别系统

1.本发明属于空中交通运行管理中的机场终端区运行气象场景分析技术领域,具体涉及一种终端区气象场景识别系统。


背景技术:

2.在空中交通领域,具有高动态性的气象条件是影响管制运行的重要因素,也是学者们及业界研究的重点对象。随着气象雷达数据产品不断完善,可视化气象数据(尤其是对流天气的可视化)也快速应用于航行计划和管制决策的制定。尽管可视化的气象数据可为空管人员决策提供了直观感知,但复杂多变的气象影响无法直接转化为管制决策,不同管制人员的经验差异会导致决策制定及实施效果的不同。为了提高管制策略有效性与决策效率、提供空中交通运行受气象影响程度的快速客观评估,相关研究人员提出了利用历史运行的相似性提供当前决策的支持,而气象场景识别概念是其核心内容。
3.气象场景识别过程包括气象图像特征提取和场景聚类划分。2015年和2016年kuhn k等人采用机器学习的方法进行特征提取(以pca为主),然后基于提取出的特征采用经典聚类方法来解决气象场景识别问题,但是传统机器学习方法对图像特征的提取存在着一定的不足。深度学习方法的发展加速了图像数据的广泛应用,能够在对数据无知的情况下,更完整地保留数据信息。由此,基于深度学习的对流天气场景识别存在较大的应用需求与研究空间。目前关于终端区气象场景识别的研究现状如下:尚未针对终端区高维气象图像数据的降维方法进行有效对比研究;对考虑严重程度和空间分布的终端区气象场景进行识别研究较少,部分研究以区域扇区为主;尚未将深度卷积自编码嵌入聚类的方法应用到终端区气象场景识别中。
4.因此基于无监督降维和聚类的终端区气象场景识别方法可以弥补上述空白领域,从而辅助管制员对历史对流天气场景进行分析,进而辅助其做出决策。对终端区气象场景识别进行数据降维方法对比,可以为未来在实际终端区气象场景识别应用及相关辅助分析工具开发时提供方法建议,在各种方法中给出更适用于对流天气图像降维的降维方法,以更准确、科学地进行后续研究。
5.另一方面,由于深度学习在各领域取得的卓越成就,不少学者将深度学习运用到民航领域,以预测相关研究为主,而在实际运行中,我们很少能够获得相关的标签,而打标签又是一个非常繁重的工作,因此为了减少不必要的工作量,有学者提出利用部分样本标签进行学习即半监督学习,而如何打标签、为哪些样本打标签则是其重要的基础,而无监督学习能够较好的解决其问题,这也使得无监督学习在初步研究时能够发挥重要作用。
6.因此,基于上述技术问题需要设计一种新的终端区气象场景识别系统。


技术实现要素:

7.本发明的目的是提供一种终端区气象场景识别系统。
8.为了解决上述技术问题,本发明提供了一种终端区气象场景识别系统,包括:
9.深度卷积自编码嵌入聚类场景识别模块,构建基于改进深度卷积自编码的嵌入聚类方法,对图像降维和气象场景识别;
10.评估模块,选取相应的无监督聚类效果评估指标,对气象场景识别进行评估;以及
11.验证模块,对识别的气象场景进行验证,并确定所识别出场景的特点。
12.进一步,所述深度卷积自编码嵌入聚类场景识别模块适于构建基于改进深度卷积自编码的嵌入聚类方法,以进行图像降维和气象场景识别,即
13.卷积自编码神经网络的学习是使其损失函数最小,对于输入对流天气图像x={x1,x2,...,xi},有k个卷积核,每个卷积核参数由wk和bk组成,用表示卷积层:
14.hk=σ(x*wk+bk);
15.式中,σ为relu激活函数;*为2d卷积;
16.每张特征图h与其对应的卷积核的转置进行卷积操作并将结果求和,然后加上偏置,得到反卷积操作:
[0017][0018]
式中,y为重构图像,y={y1,y2,...,yi};h为整个特征图组;为权重在两个维度上的翻转操作;c为偏执,常数项;
[0019]
将输入的样本和最终利用特征重构得出来的结果进行欧几里得距离比较,并根据bp算法,以获取一个完整的卷积自编码器损失函数:
[0020][0021]
通过卷积运算获取梯度值:
[0022][0023]
式中,δh和δy分别为隐藏状态和重建状态的增量;
[0024]
通过随机梯度来更新权重,以进行卷积自编码网络的训练,完成对图像数据降维。
[0025]
进一步,所述深度卷积自编码嵌入聚类场景识别模块适于构建改进深度卷积自编码嵌入聚类方法,以进行图像降维和气象场景识别,即
[0026]
将深度自编码中的解码和编码的全连接层替换为卷积层,使用拉平操作,拉平特征向量,利用聚类损失和重构损失作为损失函数,将编码层和解码层修改为卷积层和池化层共同实现图像特征提取,然后利用聚类损失和重构损失作为损失函数,对模型进行训练。
[0027]
进一步,所述评估模块适于选取相应的无监督聚类效果评估指标,对气象场景识别进行评估,即
[0028]
根据dbi指数、平均轮廓系数、ch得分对气象场景识别进行评估;
[0029]
db指数为:
[0030][0031]
其中,avg(ci),avg(cj)代表了簇ci,cj内样本间的平均距离;d
cen
(ci,cj)代表了簇ci,cj中心点间的距离;
[0032]
平均轮廓系数为:
[0033][0034]
其中,ai表示点i与所在簇中其他所有点距离的平均值;bi表示点i与其他不同簇中其他所有点距离的平均值的最小值;
[0035]
ch指数为:
[0036][0037]
其中k表示聚类数量;n代表样本量;ssb为类间方差;ssw为类内方差;
[0038]
dbi指数大于等于0越接近于0评估越好;
[0039]
平均轮廓系数-1~1之间,越接近于1评估越好;
[0040]
ch得分大于0,得分越高评估越好。
[0041]
进一步,所述验证模块适于对识别的气象场景进行验证,并确定所识别出场景的特点,即
[0042]
通过可视化方法及实际运行数据对识别的气象场景进行验证,并确定所识别出场景的特点。
[0043]
本发明的有益效果是,本发明通过深度卷积自编码嵌入聚类场景识别模块,构建基于改进深度卷积自编码的嵌入聚类方法,对图像降维和气象场景识别;评估模块,选取相应的无监督聚类效果评估指标,对气象场景识别进行评估;以及验证模块,对识别的气象场景进行验证,并确定所识别出场景的特点,实现了气象场景的分类识别,为管制员提供一种更直观的历史结果,并为现场管制运行提供一种较有效的事前分析手段。
[0044]
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
[0045]
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0046]
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0047]
图1是本发明所涉及的终端区气象场景识别系统的流程图;
[0048]
图2是本发明中pca降维示意图;
[0049]
图3是本发明中hog降维示意图;
[0050]
图4是本发明中cae降维示意图;
[0051]
图5是本发明中改进深度卷积自编码嵌入聚类方法示意图;
[0052]
图6是本发明中pca-kms场景识别结果示意图;
[0053]
图7是本发明中hog-kms场景识别结果示意图;
[0054]
图8是本发明中cae-kms场景识别结果示意图;
[0055]
图9是本发明中idcec场景识别结果示意图;
[0056]
图10是本发明中idcec识别出的五类气象场景下繁忙时段终端区实际流量分布图。
具体实施方式
[0057]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0058]
图1是本发明所涉及的终端区气象场景识别系统的流程图。
[0059]
如图1所示,本实施例提供了一种终端区气象场景识别系统,包括:深度卷积自编码嵌入聚类场景识别模块,构建改基于进深度卷积自编码的嵌入聚类方法,对图像降维和气象场景识别;评估模块,选取相应的无监督聚类效果评估指标,对气象场景识别进行评估;以及验证模块,对识别的气象场景进行验证,并确定所识别出场景的特点,实现了进行初步无监督识别,为后续半监督识别奠定研究基础,同时实现了气象场景,的分类识别为管制员提供一种更直观的历史结果,并为现场管制运行提供一种较有效的事前分析手段。
[0060]
在本实施例中,当前数据降维方法较多,但在针对图像数据时,被广泛使用且效果较优的方法主要有pca、hog、cae;根据对流天气的图像数据,通过pca、hog、cae对图像数据降维。
[0061]
图2是本发明中pca降维示意图。
[0062]
在本实施例中,通过pca对图像数据降维,即
[0063]
pca是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p个正交方向,然后对多维变数系统进行降维处理,使之能以一个较高的精度转换成低维变数系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统;
[0064]
假设有p个指标,用向量表示为x=(x1,x2,...,x
p
);
[0065]
其中xi=(x
1i
,x
2i
,...,x
ni
)

,x
ni
代表第n个样本在第i个(i=1,2,...,p)指标上的观测值,样本为单个对流天气图像,则,第i个主成分为:
[0066]
pi=a
1i
x1+a
2i
x2+...+a
pi
x
p

[0067]
满足pi与pj(i≠j,i,j=1,2,...,p)不相关,
[0068][0069]
第i个主成分pi是x1,...,x
p
的一切线性组合中方差第i大的,而对应的系数向量(a
1i
,a
2i
,...,a
pi
)则为x的协方差矩阵的第i个最大的特征值所对应的特征向量,在实践中奇异值分解经常被用来代替协方差矩阵的特征值分解。降维结果如图2所示。
[0070]
图3是本发明中hog降维示意图。
[0071]
在本实施例中,通过hog对图像数据降维,即对流天气图象是一种较为简单的图像,而hog特征(histogram of oriented gradient,方向梯度直方图)通过计算和统计图像局部区域的梯度方向直方图来构成特征,达到对图像数据降维的目的,是一种经典的图像
特征提取方法;
[0072]
通过计算和统计对流天气图像局部区域的梯度方向直方图来构成特征,以对图像数据降维;
[0073]
将对流天气图像灰度化;
[0074]
利用γ校正法对输入对流天气图像进行颜色空间的标准化;
[0075]
计算对流天气图像每个像素的梯度,像素点(x,y)的梯度为:
[0076]gx
(x,y)=h(x+1,y)-h(x-1,y);
[0077]gy
(x,y)=h(x,y+1)-h(x,y-1);
[0078]
式中,g
x
(x,y),gy(x,y),h(x,y)分别表示输入对流天气图像中像素点(x,y)的水平方向梯度、垂直方向梯度和像素值;
[0079]
像素点(x,y)处的梯度值和梯度方向分别为:
[0080][0081][0082]
将对流天气图像划分成小格;统计每个小格的梯度直方图,构成每个小格的描述特征;将预设个数的小格组成一个块,一个块内的所有小格的描述特征串联起来得到这个块的hog特征;将对流天气图像内所有块的hog特征串联起来,得到该对流天气图像的hog特征,完成对图像数据降维。降维结果如图3所示。
[0083]
在本实施例中,所述无监督聚类气象场景识别模块适于将降维后的图像数据加入到无监督聚类器中,以进行无监督聚类气象场景识别,即
[0084]
采用k-means聚类,随机选取k个聚类中心,为μ1,μ2,...,μk;
[0085]
对于每个降维后的样本i,计算其所属类:
[0086][0087]
对于每一个类j,重新计算其聚类中心:
[0088][0089]
直到收敛,或达到训练次数,进行无监督聚类气象场景识别。
[0090]
图4是本发明中cae降维示意图;
[0091]
在本实施例中,将cae降维后的气象图像数据加入到上述的无监督聚类器中,进行无监督聚类气象场景识别,用于比较深度卷积自编码嵌入聚类方法的效果。图5是本发明中改进深度卷积自编码嵌入聚类方法示意图;
[0092]
在本实施例中,所述深度卷积自编码嵌入聚类场景识别模块适于构建改进深度卷积自编码嵌入聚类(improved deep convolution embedding clustering,idcec)方法,以进行图像降维和气象场景识别,即
[0093]
自编码器是一种基于无监督学习的神经网络,用来提取样本内在特征,由编码器
和解码器两部分组成,通常用来作特征学习或数据降维。编码器将输入数据编码成潜在变量,解码器再把潜在变量重构为原数据。由于自编码器能够对数据进行降维,并有效滤除冗余信息,在图像检索方面极具优势,因此被广泛采用。
[0094]
卷积自编码器(cae)实现的过程与自编码器的思想是一致的,都是使用先编码再解码,比较解码数据与原始数据的差异来进行训练,最后获得稳定的参数。卷积自编码神经网络的学习是使其损失函数最小,对于输入对流天气图像x={x1,x2,...,xi},假设有k个卷积核,每个卷积核参数由wk和bk组成,用hk表示卷积层:
[0095]hk
=σ(x*wk+bk);
[0096]
式中,σ为relu激活函数;*为2d卷积;
[0097]
其中偏差被广播到整个图,每个潜在图使用单个偏差,因此每个滤波器对整个输入的特征进行特殊化操作,再利用该方法进行重建。每张特征图h与其对应的卷积核的转置进行卷积操作并将结果求和,然后加上偏置,得到反卷积操作:
[0098][0099]
式中,y为重构图像,y={y1,y2,...,yi};h为整个特征图组;为权重在两个维度上的翻转操作;c为偏执,常数项;
[0100]
将输入的样本和最终利用特征重构得出来的结果进行欧几里得距离比较,并通过bp算法进行优化,就可以得到一个完整的卷积自编码器损失函数:
[0101][0102]
与标准网络一样,反向传播算法用于计算误差函数相对于参数的梯度,使用以下公式通过卷积运算可以获得梯度值:
[0103][0104]
式中,δh和δy分别为隐藏状态和重建状态的增量;
[0105]
通过随机梯度来更新权重,以进行卷积自编码网络的训练,完成对图像数据降维。降维结果如图4所示。如图5所示,针对深度嵌入式聚类算法,为了更好地处理图像数据和对数据进行降维,将深度自编码中的解码和编码的全连接层替换为卷积层,最后使用拉平操作,拉平特征向量,利用聚类损失和重构损失作为损失函数,但是考虑到最后拉平操作保留特征层的处理很容易导致特征损失,因此将编码层和解码层修改为卷积层和池化层共同实现图像特征提取,然后利用聚类损失和重构损失作为损失函数,对模型进行训练;所述模型为改进后的深度自编码嵌入式聚类模型,即上述对深度自编码改进后的模型进行了训练。
[0106]
在本实施例中,所述评估模块适于选取相应的无监督聚类效果评估指标,对气象场景识别进行评估,即考虑到当前样本很难为其打上标签,相似场景识别是一个无监督聚类过程,因此需要聚类内部评估指标对聚类效果进行评估,利用经典的聚类内部指标,根据dbi指数(davies-bouldin index,大于等于0,越接近于0越好)、平均轮廓系数(average silhouette coefficient,asc,-1~1之间,越接近于1越好)、ch得分(calinski-harabasz score,大于0,越高越好)对气象场景识别进行评估,对不同方法下的两类、五类相似场景结果进行了评估,其结果如表1所示;
[0107]
表1:评估结果
[0108][0109]
db指数为:
[0110][0111]
其中,avg(ci),avg(cj)代表了簇ci,cj内样本间的平均距离;d
cen
(ci,cj)代表了簇ci,cj中心点间的距离;
[0112]
平均轮廓系数为:
[0113][0114]
其中,ai表示点i与所在簇中其他所有点距离的平均值;bi表示点i与其他不同簇中其他所有点距离的平均值的最小值;
[0115]
ch指数为:
[0116][0117]
其中k表示聚类数量;n代表样本量;ssb为类间方差;ssw为类内方差;
[0118]
dbi指数大于等于0越接近于0评估越好;
[0119]
平均轮廓系数-1~1之间,越接近于1评估越好;
[0120]
ch得分大于0,得分越高评估越好。
[0121]
图6是本发明中pca-kms场景识别结果示意图;
[0122]
图7是本发明中hog-kms场景识别结果示意图;
[0123]
图8是本发明中cae-kms场景识别结果示意图;
[0124]
图9是本发明中idcec场景识别结果示意图;
[0125]
图10是本发明中idcec识别出的五类气象场景下繁忙时段终端区实际流量分布图。
[0126]
在本实施例中,所述验证模块适于对识别的气象场景进行验证,并确定所识别出场景的特点,即通过可视化方法及实际运行数据对识别的气象场景进行验证,并确定所识别出场景的特点,即
[0127]
图6给出了pca-kms方法对五类终端区气象场景的识别结果,从上到下分别为类1、类2、类3、类4、类5,可以看出pca-kms方法可以将五类终端区气象场景识别出来,但是第二类场景中,存在于机场东南及机场附近的对流天气均存在,且第三类和第四类相似,均为机场南部的对流天气,但是第三类对流天气恶劣程度略低于第四类,而第五类为终端区大部分被覆盖的恶劣对流天气。可见pca-kms方法能够对终端区气象场景进行识别,但是其识别结果和数值相关性更大,对对流天气分布位置的识别效果较差。
[0128]
图7给出了hog-kms方法对五类终端区气象场景的识别结果,从上到下分别为类1、类2、类3、类4、类5,可以看出,相对于pca-kms方法,hog-kms方法对终端区气象场景的识别效果更好,类1-类5分别代表了无/弱对流天气、机场附近的对流天气、机场南部对流天气、机场北部对流天气、终端区大部分被覆盖的恶劣对流天气,但是在类2中会出现与机场附近对流天气轮廓相似的机场北部对流天气、南部对流天气,同时在类3、类4中出现了机场附近的对流天气。可见hog-kms方法相对于pca-kms方法能够更好的对终端区气象场景的分布位置进行识别,但是由于气象轮廓原因,仍然存在部分气象场景分离性较差。
[0129]
图8给出了cae-kms方法对五类终端区气象场景的识别结果,从上到下分别为类1、类2、类3、类4、类5,可以看出,类1-类5分别代表了无/弱对流天气、机场附近的对流天气、机场南部对流天气、机场北部对流天气、终端区大部分被覆盖的恶劣对流天气,但是可以看到,类2中出现了机场南部对流天气,类4中出现了机场附近对流天气。可见cae-kms方法和hog-kms方法一样,虽然相对于pca-kms方法能够更好的对终端区气象场景的分布位置进行识别,但仍然存在部分气象场景分离性较差。
[0130]
图9给出了idcec方法对五类终端区气象场景的识别结果,从上到下分别为类1、类2、类3、类4、类5,可以看出,类1-类5分别代表了无/弱对流天气、机场附近的对流天气、机场南部对流天气、机场北部对流天气、终端区大部分被覆盖的恶劣对流天气,从图中可以看出,idcec方法对hog-kms、cae-kms方法下部分气象场景分离性较差的结果进行了优化,提高了场景识别的精度。
[0131]
为了进一步对场景识别结果进行验证,利用航空器运行数据对其进行分析
[0132]
从图10中可以看出,类1中流量分布最高,类5最低,这和二者的场景识别结果分别对应于弱/无对流天气及终端区大部分被覆盖的恶劣对流天气,同时可以看到,类2由于机场附近被对流天气覆盖,其流量众数为8架次/10min,仅高于类5,由类3、类4的流量分布可以得出,终端区流量以北部为主,当北部受对流天气影响时,其流量下降较多,通过了idcec不仅能够对终端区气象场景进行有效识别,且识别结果与实际航班运行相关性较大
[0133]
综上所述,本发明通过深度卷积自编码嵌入聚类场景识别模块,构建基于改进深度卷积自编码的嵌入聚类方法,对图像降维和气象场景识别;评估模块,选取相应的无监督聚类效果评估指标,对气象场景识别进行评估;以及验证模块,对识别的气象场景进行验证,并确定所识别出场景的特点,实现了气象场景的分类识别,为管制员提供一种更直观的历史结果,并为现场管制运行提供一种较有效的事前分析手段。
[0134]
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0135]
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1