本申请涉及故障诊断归因,特别是涉及一种基于逐层增量期望传播的可解释性故障诊断归因方法。
背景技术:
1、目前,已经有研究人员将逐层相关性传播(layer-wise relevance propagation,lrp),应用于卷积神经网络,得到了输入信号对故障分类结果像素级贡献分布情况,增强了故障分类结果的可解释性。应用于统计过程控制的故障诊断,丢弃冗余输入特征,提高了类别间的可变实行;也有基于shapley加性解释(shapley additive explanations, shap)的方法对故障原因进行解释,有效地避免机器人设计中的错误,从而阻止了未来将发生的故障。
2、xai归因方法主要集中在故障分类问题上,而将故障诊断问题简单地处理为分类问题存在一定的弊端,如无法辨识未训练的新故障类别、现实世界故障样本稀少、多模态下的不同类故障可能源自同一系统参数变化(即应归属于同一类故障);而基于残差/(faultdetection index, fdi)生成的故障诊断方法不存在上述问题,它仅用正常数据进行建模,可以辨识任何故障类型。但是,深度网络fdi模型也同样面临统计量贡献归因问题,现有的方法无法计算统计量的归因。为此,需研究适用于深度网络fdi模型的xai技术。
技术实现思路
1、基于此,有必要提供一种基于逐层增量期望传播的可解释性故障诊断归因方法。
2、本发明提供了一种基于逐层增量期望传播的可解释性故障诊断归因方法,包括:
3、s1:获取离线正常样本、在线样本,根据所述离线正常样本训练得到fdi生成模型;
4、s2:通过反向传播更新输入的方法获取基线;
5、s3:将优化后的所述基线输入至fdi生成模型进行单次前向传播,记录其中各层激活值的基线;
6、s4:将所述在线样本输入至所述fdi生成模型,经前向传播得到统计量,并记录其中各层神经元的激活值;所述激活值用于反向归因;
7、s5:通过逐层增量期望传播计算公式确定所述fdi生成模型中各层贡献率矩阵,并进行反向传播;
8、s6:基于所述各层贡献率矩阵确定在线样本对统计量的贡献率以及在线样本的根源变量。
9、优选的,s2中,所述通过反向传播更新输入的方法获取标准基线包括:
10、步骤1:确定优化目标;
11、步骤2:通过多次学习标准基线取平均值增加标准基线的稳定性。
12、优选的,优化目标的表达式为:
13、;
14、其中,表示优化后的基线; t2表示统计量; h u(·)为无监督神经网络;为 h u(·)经离线训练后的参数;表示神经网络的输入层激活值,表示神经网络的输入层。
15、优选的,fdi生成模型的表达式为:
16、;
17、其中, r( k)表示fdi生成模型; h u(·)为无监督神经网络; z( k)表示 k时刻样本的实际值, i表示单位矩阵,表示 k时刻由潜变量生成/重构的观测值。
18、优选的,s1中,训练过程包括:
19、采用均方误差作为损失函数,将所述离线正常样本输入至无监督神经网络中,并通过所述损失函数训练所述无监督神经网络,直至到达最大迭代次数,训练结束,训练后的所述无监督神经网络即为所述fdi生成模型。
20、优选的,逐层增量期望传播计算公式的表达式为:
21、;
22、;
23、其中,表示贡献率矩阵; i表示贡献率矩阵的第 i行, j表示贡献率矩阵的第 j行, m( l-1)表示神经网络的第( l-1)层神经元数目,表示第( l-1)层的第 i个神经元对第 l层的第 j个神经元激活的贡献矩阵,表示符号修正后的贡献矩阵,表示神经网络第 l层第 j个神经元。
24、优选的,在线样本对统计量的贡献率以及在线样本的根源变量的计算公式为:
25、;
26、;
27、其中, i cause表示在线样本的根源变量;表示第 i个输入变量对统计量的贡献矩阵, z i表示第 i个输入变量, j t表示统计量, mz表示输入变量的维度,表示贡献矩阵的第 i行第 j列元素,表示统计量相加之前的向量。
28、优选的,还包括:通过故障隔离率和平均故障隔离率评估归因性能;故障隔离率、平均故障隔离率的计算公式为:
29、;
30、;
31、其中,表示故障隔离率,表示平均故障隔离率,表示第 c类故障的样本中正确溯因的样本量; nc表示总的故障类别数量; n( c)表示总的故障样本数量。
32、有益效果:考虑不同非线性激活函数下网络层输入对输出的绝对激活贡献,通过定义正/负贡献、精确量化输入变量引起的绝对激活增量,提出了与加权变量起点无关的逐层增量期望传播(layer-wise incremental expectation propagation,liep)方法,细致地分析和量化非线性函数各组分的贡献大小,以提高归因精度。同时,提出统计量等效网络化表示方法,构建了适用于故障检测指标生成模型的可解释归因新框架,搭建了深度网络归因与统计量归因的桥梁。该方法加强了深度网络故障归因的可解释性,有效提升了故障隔离的准确度。
1.一种基于逐层增量期望传播的可解释性故障诊断归因方法,其特征在于,包括:
2.根据权利要求1所述的基于逐层增量期望传播的可解释性故障诊断归因方法,其特征在于,s2中,所述通过反向传播更新输入的方法获取标准基线包括:
3.根据权利要求2所述的基于逐层增量期望传播的可解释性故障诊断归因方法,其特征在于,优化目标的表达式为:
4.根据权利要求1所述的基于逐层增量期望传播的可解释性故障诊断归因方法,其特征在于,fdi生成模型的表达式为:
5.根据权利要求1所述的基于逐层增量期望传播的可解释性故障诊断归因方法,其特征在于,s1中,训练过程包括:
6.根据权利要求1所述的基于逐层增量期望传播的可解释性故障诊断归因方法,其特征在于,在线样本对统计量的贡献率以及在线样本的根源变量的计算公式为:
7.根据权利要求1所述的基于逐层增量期望传播的可解释性故障诊断归因方法,其特征在于,还包括:通过故障隔离率和平均故障隔离率评估归因性能;故障隔离率、平均故障隔离率的计算公式为: