本发明属于航空电子技术领域,涉及一种基于数据挖掘的飞行数据异常识别模型构建方法。
背景技术:
数据管理系统记录了飞机整个飞行过程的全机数据,随着航空电子技术的发展,记录的参数个数、参数信息量急剧上升,现有的飞行数据判读手段效率低下,如何能够准确识别异常飞行数据来有效保证飞行安全、预防飞行事故发生,已成为关注的焦点。
技术实现要素:
发明目的:本发明的目的是提出一种飞行数据异常识别模型构建方法,解决当前在构建飞机异常识别模型时因缺少故障数据和具体的飞机参数知识而导致的判读效率低下的问题。
技术方案:一种飞行数据异常识别模型构建方法,构建方法如下:
步骤(1),读取飞行数据作为样本数据,将样本数据进行预处理,对样本数据中可能存在的非法值、空值等进行筛选和处理,完成数据清洗;
步骤(2),采用降维的方法完成数据特征提取;
步骤(3),根据提取的数据特征和数据挖掘算法,完成模型训练,形成异常识别模型,能够区分数据特征,即是否存在异常;
步骤(4),选取新的数据源作为测试样本,利用步骤(3)训练好的模型识别数据状态,输出结果。
所述步骤(1),在对样本数据进行预处理时,首先通过飞行阶段划分数据,不同的飞行阶段数据特征不同。
所述步骤(2),在进行数据特征提取时,针对不同类型的飞行数据采用不同的特征提取方式;飞行数据分为连续量和离散量,对于连续量,将数据划分为时间为t秒的时间片,对所有t秒的时间片内进行特征提取,统计数据特征;对于离散量,采用0和1两个特征量进行划分并提取特征。
优选地,在完成模型训练并形成异常识别模型后,根据不断增加的测试样本数据、设置模型参数不断优化异常识别模型,能够更加准确识别异常飞行数据。
有益效果:本发明基于数据挖掘的方式构建飞行数据异常识别模型,能够针对海量历史飞行数据自动识别异常飞行数据;本发明是完全通过数据去建立异常识别模型,不依赖具体的先验知识(具体故障逻辑和专家知识);本发明异常模型的构建相比其他数据挖掘模型,不需要提前标签数据(即训练数据分为正常标签和异常标签),只需要认为是一类数据去构建模型。
附图说明
图1为本发明飞行数据异常识别模型构建流程图。
具体实施方式
本发明实施过程以飞行数据工程值参数作为数据源,首先需将多架次的飞行数据文件分别保存为csv格式,csv的存储格式:行表示时间信息,列是具体的参数和对应数值。下面结合附图对本发明做进一步详细说明,请参阅图1。整个实施过程包括以下步骤:
步骤(1),读取飞行数据作为样本数据,将样本数据进行预处理,对样本数据中可能存在的非法值、空值等进行筛选和处理,完成数据清洗;
步骤(2),采用降维的方法完成样本数据特征提取;
步骤(3),根据提取的数据特征和数据挖掘算法,完成模型训练,形成异常识别模型,能够区分数据特征(是否存在异常);
步骤(4),根据不断增加的测试样本数据、设置模型参数不断优化模型;
步骤(5),选取新的数据源作为测试样本,利用训练好的模型识别数据状态,输出结果。
所述步骤(1),在对样本数据进行预处理时,首先通过飞行阶段划分数据,主要飞行阶段分为开车滑行、起飞、初始爬升、巡航、下降、进近、着陆等,不同的飞行阶段数据特征不同。以发动机高压转速、地速、无线电高度等参数数值来划分飞行阶段,例如开车滑行阶段,两台发动机高压转速nh≥66%±1%,且地速增加(持续30秒),且主轮空地信号为地面状态;起飞阶段判断左右发扭矩>50%,且地速>50kt,且地速增加(持续3秒),且无线电高度<5ft;爬升阶段判断无线电高度>1500ft,且气压高度持续增加(持续30秒)。
所述步骤(2),在进行数据特征提取时,针对不同类型的飞行数据采用不同的特征提取方式;飞行数据分为连续量和离散量,对于连续量,将数据划分为时间为t秒的时间片,对所有t秒的时间片内进行特征提取(采用极值、均值、方差等计算方式),统计数据特征;对于离散量,采用0和1两个特征量进行划分并提取特征。
本发明基于大量的飞行数据,利用数据挖掘算法构建模型,将飞参数据经过预处理后映射到高维特征空间,通过寻找一个超平面,将正常的飞参数据和异常飞参数据划分开来,数据挖掘算法实现构造一个超平面,通过对飞参数据的训练学习,得到一个优化的超平面,目的使更多的样本点位于超平面上,带入测试样本数据,如果输出是一个正值(1),则是正常样本点,如果输出是一个负值(-1),则为异常数据点。