1.本发明涉及人工智能技术与工业背景下的故障预测相结合的学科交叉领域,尤其是采用基于迁移学习的深度学习方法解决复杂系统的剩余使用寿命预测问题。
背景技术:2.随着工业4.0时代的到来,各种大型复杂装备性能的不断提高以及复杂性的不断增加,故障预测与健康管理(prognostics health management,phm)技术在航空、航海、原子能、结构工程等领域得到越来越广泛的应用。作为故障预测与健康管理技术的关键,剩余使用寿命(remaining useful life,rul)预测具有重要的研究价值。准确的预测剩余使用寿命能够有效评估系统的健康状态,协助用户合理地制定维修计划,从而显著地优化整个系统的维护策略。
3.现有的剩余使用寿命预测方法可以大致划分为基于模型的方法和数据驱动的方法。由于研究对象和故障模式的复杂性,很难建立合适的模型,基于模型的方法受到了很大的限制。另一方面,无需事先了解对象系统的任何先验知识,数据驱动的剩余使用寿命预测方法受到了越来越多的关注。数据驱动的剩余使用寿命预测方法的本质是通过机器学习算法模型构建系统退化数据和剩余使用寿命之间的映射关系。近年来兴起的深度学习方法,例如卷积神经网络(convolutional neural network,cnn)、循环神经网络(recurrent neural network,rnn)及其变体长短时记忆网络(long short term memory neural network,lstm)等拓展了数据驱动剩余使用寿命方法的范围。
4.值得一提的是,上述有监督的数据驱动学习类方法都假设离线的训练数据和在线的测试数据必须来自于相同的分布。然而,在现实的剩余使用寿命预测任务中,这一假设很难得以满足。其原因在于,不同的设备工作的操作条件存在差异,这将导致数据特征存在差异。除此之外,不同设备可能由于故障模式的不同,在退化数据层面上具备不同的特征分布形式。因此,训练数据和测试数据之间不可避免地存在域分布差异。近年来,以域自适应(domain adaptation,da)学习为导向的迁移学习(transfer learning,tl)被广泛地应用于跨域条件下的剩余使用寿命预测任务中。跨域条件下的剩余使用寿命预测采用源域的有标签数据进行训练,并采用少量目标域的未标记的样本提取源域和目的域之间的域不变表示,进而实现目标域的剩余使用寿命预测。需要注意的是,传统的迁移学习方法都是实现的源域和目标域的全局对齐。然而,复杂系统在退化过程中的不同退化阶段在数据表征上存在不同的分布。为此,仅仅采用全局的域自适应方法将会混淆不同退化阶段所表征的子域之间的细粒度特征,由此降低复杂系统剩余使用寿命的预测效果。如何提取复杂系统退化数据的时间依赖特征并结合深度子域自适应网络有待于进一步的研究。
技术实现要素:5.本发明的目的是为了解决迁移学习中全局域自适应方法中子域之间细粒度特征混淆所导致的剩余使用寿命预测准确率降低的问题,而提出基于变分局部加权子域自适应
网络的剩余使用寿命预测方法。
6.基于变分局部加权子域自适应网络的剩余使用寿命预测方法具体过程为:
7.步骤一、数据预处理,获得训练数据集和验证数据集;
8.步骤二、搭建变分局部加权子域自适应网络;具体过程为:
9.步骤二一、搭建变分自编码器-长短时记忆子网络;
10.步骤二二、基于变分自编码器-长短时记忆子网络,设计不同类别的软标签;
11.步骤二三、基于软标签搭建局部加权深度子域自适应子网络;
12.步骤三、基于训练集训练变分局部加权子域自适应网络,得到训练好的变分局部加权子域自适应网络;
13.步骤四、在线预测目标域数据,对目标域数据进行步骤一的数据预处理,将预处理后的目标域数据输入训练好的变分局部加权子域自适应网络,输出剩余使用寿命。
14.本发明有益效果
15.本发明提出了一种新颖的基于变分局部加权子域自适应网络的方法预测复杂系统的剩余使用寿命,为协助用户有效评估系统的健康状态,合理地制定维修计划,从而显著地优化整个系统的维护策略。
16.本发明旨在减少剩余使用寿命预测任务中离线数据和在线数据的域分布差异,从而实现无监督条件下的目标域剩余使用寿命预测。具体而言,本发明将复杂系统的退化数据压缩映射到具备可解释性的潜在空间,以描述数据源域和目标域之间的域差异。与此同时,本发明还致力于源域和目标域的子域自适应对齐,捕捉不同退化阶段所表征的子域之间的细粒度特征,进而提升复杂系统的剩余使用寿命预测效果。
17.(1)传统的有监督数据驱动的学习类方法难以减少离线数据和在线数据之间的域分布差异。为此,无需目标域的标签数据,本发明能够根据有标签的源域数据实现无监督条件下的目标域退化数据的剩余使用寿命预测。
18.(2)本文在提出的方法中引入了具备良好可解释性的变分自编码器-长短时记忆网络,能够将输入数据压缩映射到描述数据分布的可解释性潜在空间,并构建其与剩余使用寿命之间的映射关系。与此同时,具备可解释性的潜在空间能够很好地描述源域和目标域之间的域差异。
19.(3)不同于传统的全局对齐方法,本文提出了一种局部加权深度子域自适应网络捕捉复杂系统在不同退化阶段的细粒度信息,从而更好地学习源域和目标域之间的域不变特征,提升剩余使用寿命预测效果。
附图说明
20.图1为本发明的工作流程图;
21.图2为本发明中的变分自编码器-长短时记忆子网络结构图;其中f
fce
和g
lstm
分别表示编码器的全连接层和lstm网络的映射关系,其中f
fcd
表示解码器的映射关系。
22.图3为本发明中长短时记忆网络结构单元图;
23.图4为本发明剩余使用寿命的实际值和相应软标签的对照关系图;
24.图5为本发明变分局部加权子域自适应网络的结构图;
25.图6a为任务oc1-oc2的剩余使用寿命预测结果;
26.图6b为任务oc2-oc1的剩余使用寿命预测结果。
具体实施方式
27.具体实施方式一:本实施方式基于变分局部加权子域自适应网络的剩余使用寿命预测方法具体过程为:
28.利用基于变分自编码器-长短时记忆网络-局部加权深度子域自适应网络预测复杂系统的剩余使用寿命。其主要步骤依次为:
29.步骤一、数据预处理,获得训练数据集和验证数据集;
30.步骤二、搭建变分局部加权子域自适应网络;具体过程为:
31.步骤二一、搭建变分自编码器-长短时记忆子网络;
32.步骤二二、基于变分自编码器-长短时记忆子网络,设计不同类别的软标签;
33.步骤二三、基于软标签搭建局部加权深度子域自适应子网络;
34.步骤三、基于训练集训练变分局部加权子域自适应网络,得到训练好的变分局部加权子域自适应网络;
35.步骤四、在线预测目标域数据,对目标域数据进行步骤一的数据预处理,将预处理后的目标域数据输入训练好的变分局部加权子域自适应网络,输出剩余使用寿命。
36.具体实施方式二:本实施方式与具体实施方式一不同的是,所述步骤一中数据预处理;具体过程为:
37.步骤一一、收集工业系统(多工况工业系统)在工作过程中的传感器历史数据作为源域数据和目标域数据;
38.步骤一二、剔除传感器历史数据中数值为恒值的常数特征,完成特征筛选,以防止冗余数据对剩余使用寿命预测产生的消极影响,实现数据降维;
39.步骤一三、采用时间窗口(一段时间)的形式将步骤一二经过特征筛选的源域数据进行组合,组合后的时间窗口数据为源域数据集(源域数据集为有标签的数据集);
40.采用时间窗口(一段时间)的形式将步骤一二经过特征筛选的目标域数据进行组合,组合后的时间窗口数据为目标域数据集(目标域数据集为无标签的数据集);
41.取有标签的源域数据集和无标签的目标域数据集得到数据集,并将80%的数据集分为训练数据集,将20%的数据集作为验证数据集。
42.其它步骤及参数与具体实施方式一相同。
43.具体实施方式三:本实施方式与具体实施方式一或二不同的是,所述步骤二一中搭建变分自编码器-长短时记忆子网络;具体过程为:
44.变分自编码器-长短时记忆子网络包括编码器层、重参数层和解码器层;
45.输入数据经长短时记忆子网络lstm的映射关系g
lstm
、编码器的全连接层映射关系f
fce
、编码器的全连接层参数ξ
fce
(权重和偏置)和长短时记忆网络的网络权重参数ξ
lstm
,得到均值μ和标准差σ;
46.基于均值μ和标准差σ得到数据的潜在低维空间z;
47.基于数据的潜在低维空间z、解码器的映射关系和解码器全连接层的网络权重参数,得到剩余使用寿命的预测值rul
pi
。
48.本发明中的变分自编码器-长短时记忆子网络包含变分自编码器模块和长短时记
忆网络模块这两个部分,其结构图如图2所示。
49.其它步骤及参数与具体实施方式一或二相同。
50.具体实施方式四:本实施方式与具体实施方式一至三之一不同的是,所述长短时记忆子网络由输入门i
t
、遗忘门f
t
、输出门o
t
和记忆模块c
t
这4个部分组成;
51.lstm通过输入门确定需要输入的信息,遗忘门选择性地遗忘次要的信息,输出门则确定输入信息能够用于最终输出的比例,记忆模块决定上一时刻长短时记忆网络单元的记忆值,最终的隐含层输出为输出门的输出值和记忆模块的输出值之间的乘积,长短时记忆子网络数学表达式可以表示为式(1)—式(5)所示。
52.f
t
=σ(uf[h
t-1
,x
t
]+bf)(1)
[0053]it
=σ(ui[h
t-1
,x
t
]+bi)(2)
[0054]ct
=f
t
*c
t-1
+i
t
*tanh(uc[h
t-1
,x
t
]+bc)(3)
[0055]ot
=σ(wo[h
t-1
,x
t
]+bo)(4)
[0056]ht
=o
t
*tanh(c
t
)(5)
[0057]
其中,x
t
表示lstm在t时刻的输入向量,h
t-1
和h
t
分别表示lstm在t-1和t时刻的隐藏层状态,c
t-1
表示t-1时刻记忆模块的输出,f
t
、i
t
、o
t
、c
t
分别表示t时刻遗忘门、输入门、输出门和记忆模块的输出,uf和bf分别表示遗忘门的权重和偏置向量,ui和bi分别表示输入门的权重和偏置向量,uc和bc分别表示记忆模块的权重和偏置向量,wo和bo分别表示输出门的权重和偏置向量,σ表示sigmoid激活函数,tanh表示双曲正切函数,*表示乘积;
[0058]
lstm隐含层的状态值由遗忘门、输入门、输出门和记忆模块共同决定,可以有效地避免权重矩阵的累次相乘而引发的梯度消失和梯度爆炸等问题。
[0059]
作为能够挖掘系统退化过程中数据中长期时间依赖信息的循环神经网络,长短时记忆网络通过其特有的门控结构控制单元着信息的传递和控制,其结构单元如图3所示。
[0060]
其它步骤及参数与具体实施方式一至三之一相同。
[0061]
具体实施方式五:本实施方式与具体实施方式一至四之一不同的是,所述变分自编码器-长短时记忆子网络包括编码器层、重参数层和解码器层;
[0062]
输入数据经长短时记忆子网络lstm的映射关系g
lstm
、编码器的全连接层映射关系f
fce
、编码器的全连接层参数ξ
fce
(权重和偏置)和长短时记忆子网络的网络权重参数ξ
lstm
,得到均值μ和标准差σ;
[0063]
基于均值μ和标准差σ得到数据的潜在低维空间z;
[0064]
基于数据的潜在低维空间z、解码器的映射关系和解码器全连接层的网络权重参数,得到剩余使用寿命的预测值rul
pi
;
[0065]
具体过程为:
[0066]
作为一种重要的生成网络模型,变分自编码器(variationalauto-encoder,vae)旨在通过变分推理的方式对输入数据进行压缩并映射到能够描述数据分布的潜在空间,并通过解映射获得网络的输出结果,在此过程中令输出结果能对应于目标分布的均值和方差。
[0067]
具体地说,假设输入数据xi由一个两步随机过程产生。首先根据先验分布生成隐变量zi,然后由条件分布产生数据xi。其中的最优参数θ
*
可以通过形如公式
(6)所示的极大似然估计求解:
[0068][0069]
其中θ
*
为最优参数矩阵,θ为参数矩阵,n为输入数据数目,i为样本的编号,xi为第i个输入样本数据。由于传统的采样估计法存在困难,变分自编码器的核心在于通过构建神经网络的方式寻找生成数据x的潜在低维空间z的后验分布q
φ
(z|x)。为此,变分自编码器通过变分推断以最大化目标函数的一个下界的方式间接优化原始的目标函数,如公式(7)所示:
[0070][0071]
其中第一项为样本在后验概率下的对数似然估计,第二项为用于度量近似后验分布与标准高斯分布之间差异的kl散度,z为数据的潜在低维空间,q
φ
(z|x)为生成数据x的潜在低维空间z的后验分布,为目标函数,kl为kullback
–
leibler散度损失函数,kl(q
φ
(z|xi)||p
θ
(z|xi))为分布q
φ
(z|xi)和分布p
θ
(z|xi)之间的kl散度,e
z~q
为潜在低维空间z服从分布q条件下的数学期望。为了解决模型由于随机采样而无法实施反向传播算法的问题,vae引入了重参数技巧,如下式所示:
[0072]
zi=μ(xi;φ)+σ(xi;φ)
×
ε
[0073]
其中μ(xi;φ)为表征分布的均值,σ(xi;φ)为表征分布的标准差,ε为重参数采样的常数量,zi为第i个数据样本对应的低维空间。通过编码器学习输入数据的分布,将输入数据映射到表征分布均值μ(xi;φ)及标准差σ(xi;φ),并在标准正态分布中采样ε,以生成潜在变量zi。在此基础上,本文提出的变分自编码-长短时记忆网络,其结构如图2所示。通过基于长短时记忆网络的编码器学习数据在时序上的依赖性,并将输入的时间窗口数据所代表的空间x压缩到潜在的可解释隐变量空间z,也就是表征分布的均值μ(xi;φ)及标准差σ(xi;φ),可以表示成如公式(9)所示的形式;接着,通过上式可以计算可解释的隐变量z,并通过下式所示的解码器实现由潜在的隐变量向剩余使用寿命的映射关系:
[0074]
rul
pi
=f
fcd
(zi;ξ
fcd
)
[0075]
1)、输入数据经长短时记忆子网络lstm的映射关系g
lstm
、编码器的全连接层映射关系f
fce
、编码器的全连接层参数ξ
fce
和长短时记忆子网络的网络权重参数ξ
lstm
,得到均值μ和标准差σ;
[0076][0077]
其中f
fce
表示编码器的全连接层映射关系,g
lstm
表示长短时记忆子网络lstm网络的映射关系,ξ
fce
表示编码器的全连接层参数,ξ
lstm
表示长短时记忆子网络的网络权重参
数;xi表示第i个输入样本数据;φ表示由输入样本数据xi生成潜在低维空间zi的模型参数;
[0078]
2)、基于均值μ和标准差σ得到数据的潜在低维空间zi;
[0079]
zi=μ(xi;φ)+σ(xi;φ)
×
ε(9)
[0080]
其中μ(xi;φ)为表征分布的均值,σ(xi;φ)为表征分布的标准差,ε为重参数采样的常数量,zi为第i个输入数据样本的潜在低维空间;
[0081]
通过编码器学习输入数据的分布,将输入数据映射到表征分布均值μ(xi;φ)及标准差σ(xi;φ),并在标准正态分布中采样ε,以生成潜在变量zi。在此基础上,本文提出的变分自编码-长短时记忆网络,其结构如图2所示;
[0082]
3)、基于数据的潜在低维空间zi、解码器的映射关系和解码器全连接层的网络权重参数,得到剩余使用寿命的预测值rul
pi
;
[0083]
rul
pi
=f
fcd
(zi;ξ
fcd
)(10)
[0084]
其中f
fcd
表示解码器的映射关系,ξ
fcd
表示解码器全连接层的网络权重参数,rul
pi
为剩余使用寿命的预测值。
[0085]
在此过程中,施加衡量概率分布差异的kullback
–
leibler散度损失函数进行限制。
[0086]
其它步骤及参数与具体实施方式一至四之一相同。
[0087]
具体实施方式六:本实施方式与具体实施方式一至五之一不同的是,所述变分自编码-长短时记忆子网络的损失函数可以表示成公式(11)所示的形式:
[0088][0089]
其中l
vae-lstm
为变分自编码-长短时记忆子网络的损失函数,第一项是剩余使用寿命的真实值和预测值之间的平方误差项,第二项则是利用变分推理求解的潜在空间正则化约束项,rul
ti
为第i个样本的剩余使用寿命真实值;kl(q
φ
(zi|xi)||p
θ
(zi))为分布q
φ
(zi|xi)和分布p
θ
(zi)之间的kl散度,q
φ
(zi|xi)为第i个输入样本数据xi的潜在低维空间zi的后验分布,p
θ
(zi)为生成输入样本数据xi的潜在低维空间zi的先验分布,(||)表示kl散度中的和运算符号,kl为散度,n为输入数据数目,i为样本的编号。
[0090]
其它步骤及参数与具体实施方式一至五之一相同。
[0091]
具体实施方式七:本实施方式与具体实施方式一至六之一不同的是,所述步骤二二中基于变分自编码器-长短时记忆子网络,设计不同类别的软标签;具体过程为:
[0092]
对于深度子域自适应网络,解决子域自适应中的源域和目标域的对齐问题的前提条件是子域数量是有限的,由此才能明确描述条件概率。然而,剩余使用寿命预测问题从本质上而言是回归问题,其标签种类是无限的,这将对度量条件分布之间的差异存在着很大
的挑战。考虑到系统退化过程中不同阶段的内在相似性和剩余使用寿命标签的无限性,本发明提出了一种离散化策略,将系统的整个退化过程离散成多个退化阶段。
[0093]
具体而言,本发明中假设剩余使用寿命的最大限制值为the;
[0094]
针对第m个源域样本的标签,直接采用剩余使用寿命真实值ruli计算软标签表示成公式(12)所示的形式:
[0095][0096]
其中round表示四舍五入函数,rul
ti
为第i个样本的剩余使用寿命真实值,c为类别总数;
[0097]
其中其中表示源域样本中软标签向量的第c个元素,c=1,2,
…
,c;
[0098]
针对目标域样本,则是根据剩余使用寿命预测值计算软标签
[0099][0100]
其中其中代表目标域数据中软标签向量l
jt
的第c个元素;
[0101]
以实施例中的飞机涡扇发动机数据集为例,the被设定为125,c被设定为10,剩余使用寿命的实际值和相应软标签的对照关系如图4所示。总结而言,本发明通过对复杂系统进行退化阶段的划分设计软标签,进而减少源域和目的域之间的距离。
[0102]
其它步骤及参数与具体实施方式一至六之一相同。
[0103]
具体实施方式八:本实施方式与具体实施方式一至七之一不同的是,所述步骤二三中基于软标签搭建局部加权深度子域自适应子网络;具体过程为:
[0104]
本发明提出的深度子域自适应网络的本质是一种无监督的领域自适应方法。假设源域数据样本ds可以形式化地表示为:ds={(x
ms
,y
ms
)|m=1,2,
…
,ns},其中x
ms
和y
ms
分别表示第m个源域样本所代表的特征变量和相应的剩余使用寿命标签;目标域数据样本d
t
可以形式化地表示为:d
t
={(x
jt
,y
jt
)|j=1,2,
…
,n
t
},其中x
jt
和y
jt
分别表示第j个目标域样本所代表的特征变量。传统的领域自适应方法通常采用最大均值差异(maximum mean discrepancy,mmd)衡量源域数据分布p和目标域数据分布q之间的差异,如公式(13)所示:
[0105][0106]
其中hk表示由显著核k定义的可再生核希尔伯特空间(reproducing kernel hilbert space,rkhs),xs和x
t
分别表示源域ds和目标域d
t
中的数据,φ定义了由原始数据到rkhs的映射关系,且k意味着核函数关系k(xs,x
t
)=《φ(xs),φ(x
t
)》,《.》意味着内积运算,p为源域数据分布,q为目标域数据分布。
[0107]
值得一提的是,本发明考虑系统退化过程中的不同阶段的内在联系,引入一种局部加权最大均值差异(local weighted maximum mean discrepancy,lwmmd)度量源域和目标域中相关子域间的距离,可以表示为公式(14)所示的形式:
[0108][0109]
其中表示局部加权最大均值差异(local weighted maximum mean discrepancy,lwmmd)度量源域和目标域中相关子域间的距离,ec表示子域划分条件下的条件期望,表示源域数据属于第c类别的样本的条件期望,表示目标域数据属于第c类别的样本的条件期望,hk表示由显著核k定义的可再生核希尔伯特空间(reproducing kernel hilbert space,rkhs),在此空间中,概率分布p的平均嵌入可以表示为uk(p),则uk(p)是空间hk内的一个唯一元素,对于空间hk中的任意函数f∈hk,存在公式(15)中的表达式:
[0110][0111]
xs和x
t
分别表示源域ds和目标域d
t
中的数据,φ定义了由原始数据到rkhs的映射关系,p
(c)
和q
(c)
分别表示属于类别c的源域d
s(c)
和目标域d
t(c)
的数据分布;
[0112]
具体而言,属于各个类别的每一个样本都将会被赋予不同的权重,公式(14)中的局部加权最大均值差异度量源域和目标域中相关子域间的距离可以进一步地改写为公式(16)所示的形式:
[0113][0114]
其中和分别表示属于第c个类别的第m个源域样本和第j个目标域样本的权重值,c为类别总数,||.||表示二范数;
[0115]
值得一提的是,和满足公式(17)所述的条件:
[0116][0117]
在此基础上,对于第m个源域样本和第j个目标域样本的权重值,权重和的表达式如公式(18)—(19)所示:
[0118][0119][0120]
其中表示源域数据中软标签向量的第c个类别;代表目标域数据中软标签向量l
jt
的第c个类别;
[0121]
需要注意的是,软标签向量li是对离散化退化阶段的一种独热编码向量。
[0122]
当样本xi来自于源域数据ds时,软标签向量li可以直接通过公式(12)所描述的方式进行计算;
[0123]
然而,本发明所提出的方法在本质上是无监督领域自适应的。因此,当样本xi来自于目标域数据d
t
时,软标签向量li则需要通过公式(8)—(10)中的变分自编码器-长短时记忆子网络的前向过程计算剩余使用寿命的预测值后,再根据公式(12)中的方法进行计算。
[0124]
通过上述描述,可以获得每一个源域样本和目标域样本的权重值,进而实现样本局部加权最大均值差异的运算。若要实现源域和目标域的局部领域自适应,一个十分重要的环节是公式(16)中的局部加权最大均值差异的设计。考虑到步骤2中搭建的变分自编码器-长短时记忆子网络中通过变分自编码器求解所获得的表征分布均值μ(xi;φ)及标准差σ(xi;φ)能够很好地描述系统在退化过程中的不同阶段,具备特殊的特征表示和很好的可解释性。因此,将相应的均值和方差所张成的具备可解释性的潜在空间作为公式(16)的输入,能够很好地实现不同退化阶段内部的领域自适应。
[0125]
为此,公式(16)中的局部加权最大均值差异损失函数可以拓展地写成公式(20)所示的形式:
[0126][0127]
其中γ是高斯rbf核函数的带宽,ns为源域数据样本的数目,n
t
为目标域数据样本的数目,和分别表示属于第c个类别的第m个源域样本和第j个源域样本x
jt
的权重值,和分别表示属于第c个类别的第m个源域样本和第j个目标域样本的权重值,为表征源域第j个样本在生成模型参数φ条件下的分布均值,为表征源域第j个样本在生成模型参数φ条件下的分布标准差,为表征源域第j个样本在生成模型参数φ条件下的分布标准差,为表征目标域域第m个样本在生成模型参数φ条件下的分布均值,为表征目标域第m个样本在生成模型参数φ条件下的分布标准差;
[0128]
在获得源域数据和目标域数据之间的局部加权最大均值差异后,可以通过最小化公式(20)中的内容以达到对齐作为不同退化阶段的各个子域之间的差异。
[0129]
因此,结合公式(11),整个变分局部加权子域自适应网络的目标损失函数可以定义成如公式(21)所述的形式:
[0130]
[0131]
其中λ为变分自编码器-长短时记忆子网络与局部加权最大均值差异损失之间的加权折衷系数。
[0132]
通过设计如公式(20)所述的损失函数,能够兼顾剩余使用寿命预测精度和源域与目标域数据之间的局部加权距离,进而在无需目标域剩余使用寿命标签的情况下很好地实现剩余使用寿命预测。图5展示了本发明变分局部加权子域自适应网络的结构。整个变分局部加权子域自适应网络的损失函数为图5中3个损失之和。
[0133]
其它步骤及参数与具体实施方式一至七之一相同。
[0134]
具体实施方式九:本实施方式与具体实施方式一至八之一不同的是,所述类别总数c的取值由步骤二中搭建变分局部加权子域自适应网络训练过程确定;具体过程为:
[0135]
在变分局部加权子域自适应网络训练过程中将类别总数c设置为超参数,通过网格搜索的方式遍历c的取值,选择在验证数据集中网络剩余使用寿命预测效果最好的类别总数c作为划分的类别总数。
[0136]
其它步骤及参数与具体实施方式一至八之一相同。
[0137]
具体实施方式十:本实施方式与具体实施方式一至九之一不同的是,所述步骤三中基于训练集训练变分局部加权子域自适应网络,得到训练好的变分局部加权子域自适应网络;具体过程为:
[0138]
训练集作为变分局部加权子域自适应网络的输入,相应时刻下工业系统真实的剩余使用寿命作为变分局部加权子域自适应网络的输出,对变分局部加权子域自适应网络进行训练,得到训练好的变分局部加权子域自适应网络。
[0139]
其它步骤及参数与具体实施方式一至九之一相同。
[0140]
训练变分局部加权子域自适应网络;具体过程为:
[0141]
将步骤一中经过数据预处理的训练数据集输入到步骤二中搭建的变分局部加权子域自适应网络中,训练网络,构建输入的传感器采集数据和输出剩余使用寿命之间的映射关系;
[0142]
将离线采集的某一种工况的历史数据作为源域数据和另一种工况下的无标签的历史数据作为目标域数据训练模型;
[0143]
将目标域对应工况的数据作为在线数据,以用于最终的预测。在此过程中,选择80%的源域数据作为训练数据集,20%的源域数据作为验证数据集,选取训练效果最好的网络模型,并将其保存为最终的预测模型。其中,网络训练的损失函数为均方误差损失函数,优化算法为adam优化算法,学习速率为0.001,网络训练过程在1块gpu(gtx 3080ti显卡)的硬件环境下进行。
[0144]
在线预测剩余使用寿命;具体过程为:
[0145]
将目标域对应工况的数据作为在线数据,经过步骤1中数据预处理,输入到步骤5中训练好的变分局部加权子域自适应网络中,可以实现跨域条件下的在线剩余使用寿命的实时预测;
[0146]
本发明采用均方根误差(root mean square error,rmse)指标评估提出的神经网络模型对于在线工作过程中复杂系统或者设备的剩余使用寿命预测效果。均方根误差的表达式如式(22)所示:
[0147][0148]
其中,n为测试数据的样本数量,i为样本的序号,rul
pi
和rul
ti
分别为第i个样本剩余使用寿命的预测值和真实值。
[0149]
采用以下实施例验证本发明的有益效果:
[0150]
实施例一
[0151]
本文采用nasaames预测中心提供的商用模块化航空推进系统仿真(commercialmodular aero-propulsion system simulation,cmapss)模拟的多运行工况下飞机涡扇发动机的退化数据。整个数据集包含了飞机涡扇发动机在4种不同操作条件下的工作数据,每一种操作条件下的数据都包含了用于模型训练的训练数据集和用于模型检验的测试数据集。其中,训练数据集包含了飞机涡扇发动机的全生命周期数据,测试数据集则包含了飞机涡扇发动机在一段时间内的初始退化数据,该段时间最后一个时刻的飞机涡扇发动机剩余使用寿命将被用于模型验证。数据集配置如表格1所示。每个工况下的飞机发动机退化数据均由具备26个变量的多元时间序列组成,包含了发动机id、运行时间、描述操作条件的海拔、马赫数、海平面温度等运行参数以及21种工作过程中的传感器数据。
[0152]
表1cmapss数据集描述
[0153][0154]
从表格1可以看出,数据集的四种运行工况下的子集拥有不同的操作条件和故障模式。换句话说,这四个数据子集的数据分布具有显著的差异性。因此,如何实现不同工况数据之间的无监督跨域迁移具备很大的挑战。在此基础上,本发明的研究任务是仅仅采用某一种工况下的数据作为有标签的源域数据训练变分局部加权子域自适应网络,并弥补源域数据和另一工况下无标签的目标域数据之间的域距离,进而实现针对目标域工况下的飞机涡扇发动机的剩余使用寿命预测。为了完善实验细节,本发明研究了多种跨域组合下的剩余使用寿命预测任务,可以总结出如表格2所示的形式。
[0155]
表2多种跨域组合下的剩余使用寿命预测任务
[0156][0157]
第1步、数据预处理:对nasaames预测中心提供的多工况飞机涡扇发动机数据集进行特征筛选,选择编号为2,3,4,7,8,9,11,12,13,14,15,17,20和21等14种传感器数据。接
着,采用时间窗口的形式将经过特征筛选的数据进行组合,与相应时刻下复杂设备真实的剩余使用寿命共同构成数据集的输入和输出。
[0158]
第2步、搭建变分局部加权子域自适应网络;具体过程为:
[0159]
步骤21、搭建变分自编码器-长短时记忆子网络;
[0160]
步骤22、基于变分自编码器-长短时记忆子网络,设计不同类别的软标签;
[0161]
步骤23、基于软标签搭建局部加权深度子域自适应子网络;
[0162]
第3步、基于训练集训练变分局部加权子域自适应网络,得到训练好的变分局部加权子域自适应网络;
[0163]
网络训练的损失函数为均方误差损失函数,优化算法为adam优化算法,学习速率为0.001,网络训练过程在1块gpu(gtx 3080ti显卡)的硬件环境下进行。
[0164]
第4步、在线预测目标域数据,对目标域数据进行第1步的数据预处理,将预处理后的目标域数据输入训练好的变分局部加权子域自适应网络,输出剩余使用寿命。
[0165]
图6a、6b展示了提出的方法在表格2中oc1-oc2任务下在飞机涡扇发动机测试数据集剩余使用寿命的预测值和真实值。表格3展示了本发明与多种现有的迁移学习方法在多种跨域组合下的剩余使用寿命预测任务结果对比。从图6a、6b和表格3中可以看出,本发明提出的方法能够在跨域条件下有效地预测复杂系统或者设备的剩余使用寿命,为协助用户有效评估系统的健康状态,合理地制定维修计划,从而显著地优化整个系统的维护策略。
[0166]
表3本发明与多种现有的迁移学习方法的预测结果对比
[0167][0168]
本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于
本发明所附的权利要求的保护范围。