一种飞机任务传感器多过程域测试数据融合信息拾取方法与流程

文档序号:35681898发布日期:2023-10-08 21:09阅读:34来源:国知局
一种飞机任务传感器多过程域测试数据融合信息拾取方法

本技术属于传感器测试数据智能分析领域,具体涉及一种飞机任务传感器多过程域测试数据融合信息拾取方法。


背景技术:

1、通过分析飞机生产中各过程的任务传感器测试数据,推断任务传感器飞行时的精度是否达到出厂指标要求,对于提高飞机试飞效率、保障一次性合格率具有重要实际价值和意义。

2、然而,由于飞机原始任务传感器测试数据涉及多个过程域,不同过程域测试数据维度和样本量差距较大,导致用于任务传感器精度评估的测试数据质量下降,无法直接将原始测试数据用于精度评估,且冗余测试数据会显著增加精度评估的存储需求和计算复杂度。

3、为此,需要对任务传感器多过程域下的测试数据进行信息拾取,以提取有效的测试数据信息。目前,常用的信息拾取方法往往基于某种相关度量变量来衡量原始数据各项特征与目标参数的相关性,从而选出与目标参数存在高相关度的特征,构成新的数据集替代原始数据进行数据挖掘,该类方法可以反映目标与多维数据特征之间的相关关系,且具有效率高、泛化能力好等优点。

4、然而,由于目前常见的信息拾取方法只依据某一种相关度量变量对数据进行选择,无法在适应海量数据巨大计算量的同时,使得所选特征集同时具有较好的线性相关性和非线性相关性,具有一定的局限性。

5、经分析,飞机多过程域测试数据的各参数项与飞行精度关系比较复杂,同时存在线性相关特征和非线性相关特征,且会有外部环境等噪声影响,并且各过程域的数据维度和样本量大小不一致,为了在保证较低时间复杂度的前提下更全面的探索各特征与目标参数间的相关关系,需要依据不同过程域中数据的特性对各过程域采用不同的相关度量变量进行信息拾取。


技术实现思路

1、本发明的目的是为了解决上述现有技术存在的问题,即现有的信息拾取方法应用于多过程域测试数据时,无法在保证低时间复杂度的基础上,使结果较为全面的覆盖目标参数相关信息。因此,本发明提出一种飞机任务传感器多过程域测试数据融合信息拾取方法.

2、为实现上述技术效果,本技术的技术方案如下:

3、一种飞机任务传感器多过程域测试数据融合信息拾取方法,包括如下步骤:

4、首先根据数据量对过程域进行划分,分为小样本过程域数据和大样本过程域数据,对于小样本过程域数据,基于交叉熵实现信息拾取;对于大样本过程域数据,采用线性相关系数与非线性相关系数结合的方法进行大样本数据信息拾取,得到更全面的信息拾取结果;最后,在此基础上得到多个过程域与目标参数具有高相关性的完整特征集,实现多过程域数据的信息拾取。

5、进一步地,一种飞机任务传感器多过程域测试数据融合信息拾取方法具体步骤如下:

6、步骤一,获取多域数据;

7、步骤二,将多域数据划分为小样本过程域数据和大样本过程域数据;

8、步骤三,针对小样本过程域数据,基于交叉熵的信息拾取方法,交叉熵用来表征两个分布的相似程度,通过计算特征与目标参数的联合分布密度来表征交叉熵,并根据交叉熵判断特征与目标参数的相关性、计算相关系数,设置阈值筛选出相关阈值符合要求的特征,从而进行信息拾取;

9、步骤四,针对大样本过程域数据,先计算各特征与目标参数的协方差和标准差,选出与目标变量存在较高线性相关性的特征;再分析各特征与目标参数之间的独立性,并基于此选出非线性相关特征,从而得到更全面的信息拾取结果;

10、步骤五,将针对小样本过程域数据信息拾取得到的特征集和针对大样本过程域数据信息拾取得到的特征集汇总,得到多个过程域与目标参数具有高相关性的完整特征集,实现多过程域数据的信息拾取。

11、进一步地,步骤二中将多域数据划分为小样本过程域数据和大样本过程域数据的标准为本领域现有方法。

12、进一步地,步骤三的具体流程如下:

13、1)假设一个任务系统经过多过程域测试得到数据集为d为过程域的数量,对数据集进行预处理后,得到预处理后数据集为则经预处理后的第i个过程域的数据集记为:

14、

15、目标参数记为:

16、

17、其中,n表示任务系统的样本数量,m表示此过程域的特征数量;

18、2)进行数据联合分布密度计算:将特征与目标变量离散在二维空间中,并且使用散点图来表示,将当前二维空间在x轴,y轴方向分别划分为x格和y格,根据散点在各个方格中落入的情况,计算和的联合分布密度,公式如下:

19、

20、其中,nij为落在位于第i行,第j列的格子里的点数,niy为落在位于第i行所有格子里的点数和,nxj为落在位于第j列所有格子里的点数和,m为总点数;

21、由联合分布密度计算特征与目标参量间的相关性记为:

22、

23、调整画线的位置和数量,使大多数点分布在少量几个格子里,此时可以得到最大交叉熵,计算最大相关系数如下式:

24、

25、其中b为可搜寻网格的上界,控制了能够检测的相关关系的复杂度。

26、通过相关系数拾取地面测试过程域与飞行精度相关的参数项,假设各过程域拾取的参数项个数统一用m'表示,n表示任务系统的样本数量,最终得到第i过程域信息拾取后的数据,可以表达为:

27、

28、再进一步地的,步骤1)中对数据集的预处理包括:剔除重复值和离群点和填补空缺值。

29、进一步地,步骤四具体为:

30、针对部分过程域中的时间序列存在大量样本的大样本过程域数据,基于线性与非线性相关系数结合的方法实现大样本量的过程域数据信息拾取,首先对大样本过程域数据进行预处理,预处理后的飞行数据与公式(1)的表达式相同;

31、假设过程域数据的第k个特征表达式为飞行精度序列与公式(2)的表达式相同;

32、首先,计算过程域参数与飞行精度的线性相关系数,相关系数越接近于1,表示两变量线性相关性越强,结合相关系数根据实际工作需要选择符合要求参数项;

33、然后,计算过程域参数与飞行精度的非线性相关系数,当距离相关系数为0时,说明两个参数项相互独立,距离相关系数越大,说明两个参数项的距离相关性越强,结合相关系数根据实际工作需要选择符合要求参数项。

34、再进一步地,针对大样本过程域数据的数据集的预处理包括:剔除重复值和离群点和填补空缺值。

35、再进一步地,计算过程域参数与飞行精度的线性相关系数的具体计算公式如下:

36、

37、其中,e(·)为数学期望或均值,d(·)为方差,开根号为标准差,cov(xi,yi)为随机变量xi,yi的协方差。

38、再进一步地,计算过程域参数与飞行精度的非线性相关系数的具体计算公式如下:

39、

40、其中,和分别为:

41、

42、

43、

44、同理计算和

45、进一步地,所述步骤五具体为:将线性系数和非线性系数筛选的相关过程域参数项进行联合,最终得到信息拾取技术的输出为:

46、

47、本技术优点在于:

48、为实现异构测试数据的信息拾取,本专利提出了一种先对数据格式进行处理构造与目标参数特性一致的样本序列,再基于联合分布密度对异构数据进行信息拾取的方法。设计的方法可以准确地从异构数据中拾取到与飞行精度存在较高相关性的特征。数据格式变换使得更多特征与目标参数特性一致,符合信息拾取模型的输入要求,有助于更充分的挖掘异构数据与目标参数关联信息,基于联合概率分布的信息拾取方法精度较高,可同时提取与目标参数相关的线性相关及非线性相关特征,适用于小样本数据。根据机理分析,信息拾取的参数相关度较高。

49、本发明提出了小样本-大样本融合的信息拾取方法,为不同大小的样本相对应设计了复杂度低-特征信息覆盖全面的方法。本发明研究对象是多过程域的测试信息,可以对数据类型不同的数据进行信息拾取。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1