基于零样本学习的复合故障诊断方法

文档序号：26052070发布日期：2021-07-27 15:27阅读：713来源：国知局

本发明故障诊断领域，尤其涉及一种基于零样本学习的复合故障诊断方法。

背景技术：

在实际系统中，轴承的多个地方出现故障已成为常态，轴承发生复合故障时，由于故障之间的相互耦合效应导致其振动信号特征十分复杂，因此，对复合故障诊断的研究十分困难。传统复合故障的研究方法主要有基于解析模型的复合故障诊断、基于定性经验的复合故障、基于信号分析的复合故障。上述的三种方法需要大量的先验知识，因此实际应用中需要较强的复杂性和较低的适用性。

基于深度学习的复合故障诊断，需要用到复合故障信号样本进行训练，然而，在实际工况下，复合故障信号存在难以采集和标注的问题。目前的智能方法尚未解决这一问题，因此大大局限了基于深度学习的复合故障诊断方法的实际应用。

技术实现要素：

为了解决上述现有技术中缺乏有效的复合故障诊断方法的缺陷，本发明提出了一种基于零样本学习的复合故障诊断方法。

本发明采用以下技术方案：

一种基于零样本学习的复合故障诊断方法，包括以下步骤：

s1、建立训练数据集：训练数据集ds由带标记的单一故障信号组成，记作xi表示作为第i个第一训练样本的单一故障信号，xi∈ri×1，ri×1表示一维信号，ri表示一维信号包含的点数；n表示第一训练样本总数，yi为xi对应的类别标签，x表示单一故障信号集合，y^s表示所述单一故障信号对应的类别标签的集合，表示xi的语义向量，语义向量为一维向量；

s2、构建特征提取器：结合训练数据集对第一神经网络进行训练，获取用于从第一训练样本的二维时域图中提取与第一训练样本的类别标签相匹配的视觉特征的特征提取器，视觉特征表现为一维向量；

s3、构建特征向量匹配模型：通过特征提取器提取第一训练样本的二维时域图的视觉特征作为样本特征，获取第一训练样本对应的语义向量和样本特征组成第二训练样本，并获得包含多个第二训练样本的第二训练集；结合第二训练集对第二神经网络进行训练，获得用于判断视觉特征与语义向量的匹配程度的特征向量匹配模型；

s4、构建参照样本：将不同类别标签对应的语义向量进行组合，形成对应不同类别标签组合的复合故障语义向量，将标记有类别标签组合的复合故障语义向量记作参照样本；

s5、构建故障诊断模型：结合参照样本与特征向量匹配模型构建故障诊断模型，故障诊断模型用于提取测试数据的二维时域图的视觉特征，并用于确定与该视觉特征相匹配的参照样本，以根据该参照样本标记的类别标签组合对测试数据进行标注。

优选的，单一故障信号xi对应的语义向量的获得，包括以下步骤：

s11、将单一故障信号xi的一维向量记作si＝{ai1,ai2,ai3,......airi}，air表示单一故障信号xi的第r个点值，1≤r≤ri；

s12、构建单一故障信号xi对应的语义向量

其中，βi为单一故障信号xi对应的阈值参数，cir表示真值，类别相同的单一故障信号对应的阈值参数相同。

优选的，步骤s2具体为：构建由用于提取二维时域图的视觉特征的第一部分和用于获取视觉特征对应的类别标签的第二部分组成的第一神经网络；结合训练数据集对第一神经网络进行训练，获取训练完成的第一神经网络作为用于根据第一训练样本的二维时域图识别类别标签的第一类别诊断模型，并从第一类别诊断模型中获取用于提取二维时域图的视觉特征的部分作为特征提取器。

优选的，第一神经网络训练过程中，采用交叉熵损失函数，其公式为：

其中，yi为第一训练样本xi真实的类别标签，pi为第一训练样本xi对应的模型预测标签。

优选的，步骤s2中，特征提取器用于提取维度为r×1的视觉特征，r表示视觉特征包含的特征属性数量，max()表示最大值函数，表示r1、r2、......rn中的最大值；

步骤s3中，训练特征向量匹配模型时，采用的损失函数为：

w1表示第一个全连接层参数，w2表示第二个全连接层参数；表示语义向量被嵌入视觉空间后形成的视觉语义向量，其维度为r×1；f(xi)表示特征提取器提取的视觉特征，α表示超参数。

优选的，步骤s3中构建的特征向量匹配模型，用于将第一训练样本xi的语义向量嵌入视觉空间，获得维度为r×1的视觉语义向量；特征向量匹配模型还用于计算视觉特征与视觉语义向量之间的余弦距离，根据余弦距离判断获得的视觉特征与视觉语义向量是否匹配；

步骤s5中所构建的故障诊断模型，用于获取与测试数据对应的视觉特征之间的余弦距离最小的参照样本，并根据该参照样本的类别标签组合对测试数据进行标注。

优选的，步骤s1中r1＝r2＝......＝rn，步骤s4中将对应不同类别标签的语义向量进行组合，获得对应不同类别标签组合的参照样本；步骤s5中构建的故障诊断模型，用于将参照样本转换为r×1维度的视觉语义向量，并用于将获得的测试数据的视觉特征与转换为视觉语义向量的参照样本进行匹配。

优选的，将多个维度均为r0×1的语义向量组合成复合故障语义向量的模型如下：

其中，c1、c2....cp表示维度为r0×1的语义向量，r0表示点数，c表示c1、c2....cp组合后的复合故障语义向量，p表示下标。

优选的，在步骤s5之后还包括步骤s6：故障诊断，对测试数据进行处理，获取二维时域图；通过特征提取器提取测试数据的二维时域图的视觉特征作为测试特征；基于故障诊断模型获取与测试特征匹配的参照样本，并获取该参照样本对应的类别标签组合作为测试数据的类别标签组合。

优选的，单一故障信号和测试数据经小波变换，获得对应的二维时域图。

本发明的优点在于：

(1)本发明提出的一种基于零样本学习的复合故障诊断方法，首先将试验台采集的数据进行小波变换处理，然后将单一故障数据作为训练集，复合故障作为测试集。本发明构建了关联表示故障类别的类别标签的语义向量，将此作为辅助信息帮助分类。本发明方法首先将训练集输入到特征提取器中，提取故障视觉特征f(xi)，然后将单一故障语义信息和视觉特征进行匹配，使得故障视觉特征和语义特征更好的适配。最后，特征提取器提取复合故障的视觉特征，去匹配复合故障语义信息，进而识别复合故障类别。

(2)本发明中针对单一故障数据设置阈值参数，通过比对原始数据点和阈值参数的大小关系进行二进制编码得到单一故障数据的语义向量，然后通过单一故障数据的语义向量的线性组合构建表达复合故障语义向量的参照样本，解决了复合故障样本难以获取的真实情况，实现了跨类学习技术。

(3)本发明中在对单一故障数据进行语义向量的转换时，采用与单一故障的类别标签相对应的阈值参数βi，如此，可针对不同的类别标签设置阈值参数βi，保证了语义向量与类别标签的匹配程度。且本发明中，语义向量的定义不需要专家知识，且简明易于计算，从实验的结果看，精度很高。

(4)本发明中，在第一类别诊断模型的训练过程中同时训练特征提取器，第一类别诊断模型以标注有类别标签的单一故障数据作为第一训练样本，数据信号可通过小波变换转换获得二维时域图。如此，便可获得二维时域图与类别标签的对应关系，第一类别诊断模型经充足的第一训练样本进行训练，保证了模型参数的可靠性，从而也保证了特征提取器的可靠性。

(5)本发明实现了在无复合故障样本的情况下，基于单一故障样本，对复合故障实现有效地分类。

附图说明

图1为本发明提出的一种基于零样本学习的复合故障诊断方法流程图；

图2为实施例中作为第一训练样本的单一故障信号波形图；

图3为实施例中复合故障波形图；

图4为实施例中单一故障信号和部分复合故障的二维时域图；

图3、图4中横坐标表示时间，纵坐标表示振幅；

图5为实施例中不同任务的复合故障诊断精度统计图。

具体实施方式

参照图1，本实施方式提出的一种基于零样本学习的复合故障诊断方法，包括以下步骤。

s1、建立训练数据集：训练数据集由带标记的单一故障信号组成，记作xi表示作为第i个第一训练样本的单一故障信号，xi∈ri×1，ri×1表示一维信号，ri表示一维信号包含的点数；n表示第一训练样本总数，yi为xi对应的类别标签，x表示单一故障信号集合，y^s表示所述单一故障信号对应的类别标签的集合，表示xi的语义向量，语义向量为一维向量。

具体的，本实施方式中，作为第一训练样本xi的单一故障信号由ri个连续的点值组成，语义向量为对第一训练样本xi中各点值进行阈值比较后形成的二进制字符串。

本实施方式中，作为第一训练样本的单一故障信号xi对应的语义向量的获得，包括以下步骤：

s11、将单一故障信号xi的一维向量记作si＝{ai1,ai2,ai3,......airi}，air表示单一故障信号xi的第r个点值，1≤r≤ri，ri表示xi的点数；

s12、构建单一故障信号xi对应的语义向量

其中，βi为单一故障信号xi对应的阈值参数，cir表示真值。

本实施方式中，阈值参数βi与单一故障信号xi一一对应，如此，可针对不同的类别标签设置阈值参数βi，保证了语义向量与类别标签的匹配程度，即类别相同的单一故障信号对应的阈值参数相同。

s2、构建特征提取器：结合训练数据集对第一神经网络进行训练，获取用于从第一训练样本的二维时域图中提取与第一训练样本的类别标签相匹配的视觉特征的特征提取器，视觉特征表现为一维向量。

具体的，本步骤中，首先构建由用于提取二维时域图的视觉特征的第一部分和用于获取视觉特征对应的类别标签的第二部分组成的第一神经网络；结合训练数据集对第一神经网络进行训练，获取训练完成的第一神经网络作为用于根据第一训练样本的二维时域图识别类别标签的第一类别诊断模型，并从第一类别诊断模型中获取用于提取二维时域图的视觉特征的部分作为特征提取器。

本实施方式中，在第一类别诊断模型的训练过程中同时训练特征提取器，第一类别诊断模型以标注有类别标签的单一故障数据作为第一训练样本，数据信号可通过小波变换转换获得二维时域图。如此，便可获得二维时域图与类别标签的对应关系，第一类别诊断模型经充足的第一训练样本进行训练，保证了模型参数的可靠性，从而也保证了特征提取器的可靠性。

具体实施时，第一类别诊断模型训练过程中，采用交叉熵损失函数，其公式为：

其中，yi为第一训练样本xi真实的类别标签，pi为第一训练样本xi对应的模型预测标签。

具体的，本实施方式中，特征提取器可表示为：

其中，f(xi)表示特征提取器提取的视觉特征，表示特征提取器，θg表示其模型参数。

具体实施时，特征提取器可采用二维全卷积神经网络，其结构表示为：

其中，表示卷积操作，w^g和b^g表示卷积核以及偏置，h为卷积操作的结果。

s3、构建特征向量匹配模型：通过特征提取器提取第一训练样本的二维时域图的视觉特征作为样本特征，获取由语义向量和样本特征组成第二训练样本，并获得包含多个第二训练样本的第二训练集；结合第二训练集对第二神经网络进行训练，获得用于判断视觉特征与语义向量的匹配程度的特征向量匹配模型。

具体实施过程中，可设置，当第二训练样本中的语义向量和样本特征对应同一第一训练样本时，该第二训练样本标注“0”；当第二训练样本中的语义向量和样本特征对应不同的第一训练样本时，该第二训练样本标注“1”，然后结合带标注的第二训练样本对第二神经网络进行训练，以获得特征向量匹配模型。

具体的，本步骤s3中，训练特征向量匹配模型时，采用的损失函数为：

w1表示第一个全连接层参数，w2表示第二个全连接层参数；表示语义向量被嵌入视觉空间后形成的视觉语义向量，其维度与特征提取器提取的视觉特征的维度相等，该维度记作r×1；f(xi)表示特征提取器提取的视觉特征，α表示超参数。

具体实施时，为了保证最终对复合故障诊断的精确性，应设置例如ri＝1000时，可设置r＝2048。

s4、构建参照样本：将不同类别标签对应的语义向量进行组合，形成对应不同类别标签组合的复合故障语义向量，将标记有类别标签组合的复合故障语义向量记作参照样本。

本实施方式中，语义向量以二进制表示，对不同的语义向量进行组合时，首先要保证语义向量的维度相同，然后根据以下模型对语义向量进行组合：

其中，c1、c2....cp表示维度为r0×1的语义向量，具体表示由r0个点值组成的一维语义向量；c表示c1、c2....cp组合后的复合故障语义向量，p表示下标。

例如，本实施方式中，对单一故障信号xi对应的语义向量和单一故障信号xi+k对应的语义向量进行组合，1≤i≤n，1≤i+k≤n，i≠i+k，和维度相等，均为ri×1，组合获得的复合故障语义如下：

s6、故障诊断，对测试数据进行处理，获取二维时域图；通过特征提取器提取测试数据的二维时域图的视觉特征作为测试特征；基于故障诊断模型获取与测试特征匹配的参照样本，并获取该参照样本对应的类别标签组合作为测试数据的类别标签组合。

本实施方式在步骤s3中构建的特征向量匹配模型，用于将第一训练样本的语义向量嵌入视觉空间，获得维度为r×1的视觉语义向量；特征向量匹配模型还用于计算视觉特征与视觉语义向量之间的余弦距离，根据余弦距离判断获得的视觉特征与视觉语义向量是否匹配。步骤s5中所构建的故障诊断模型，用于获取与测试数据对应的视觉特征之间的余弦距离最小的参照样本，并根据该参照样本的类别标签组合对测试数据进行标注。

具体实施时，可在步骤s3中根据样本标注为“0”及对应同一第一训练样本的语义向量和样本特征组成的第二训练样本训练特征向量匹配模型，将特征向量匹配模型记作f(f(x),s,w)；其中，f(x)表示通过特征提取器输出的视觉特征，s表示语义向量，w表示模型参数。该特征向量匹配模型结合上述损失函数l2(w1,w2)训练过程中，可实现最小化参数w，使得对应相同第一训练样本的语义向量和视觉特征更好的匹配。

如此，本实施方式中，结合参照样本与特征向量匹配模型构建的故障诊断模型对测试数据进行诊断以获得测试数据对应的复合故障标签n(即类别标签组合)为：

其中，xj表示测试数据，f(xj)表示特征提取器从测试数据xj对应的二维时域图中提取的视觉特征，表示任意参照样本，维度转换后的参照样本，d(.)表示余弦距离，arg表示目标函数，即测试数据xj对应的复合故障标签n为与视觉特征f(xj)之间的余弦距离最小的参照样本的类别标签组合。

具体实施时，为了保证数据处理效率，可在步骤s1中，设置作为第一训练样本的单一故障信号xi的维度固定，即r1＝r2＝......＝rn。如此，步骤s4中可直接将对应不同类别标签的语义向量进行组合，获得对应不同类别标签组合的参照样本，且参照样本的维度均为r1；当r不等于r1时，通过故障诊断模型对测试数据进行诊断时，首先需要将照样本转换为r×1维度的视觉语义向量，再将获得的测试数据的视觉特征与转换为视觉语义向量的参照样本进行匹配。即，此时，步骤s5中构建的故障诊断模型，需要两个功能，第一用于将参照样本转换为r×1维度的视觉语义向量，第二用于将获得的视觉特征与转换为视觉语义向量的参照样本进行匹配。

具体实施，在构建故障诊断模型时，可直接从特征向量匹配模型获得转换后的视觉语义特征以组合成参照样本，如此，参照样本的维度与特征提取器提取的视觉特征的维度相等，可直接将视觉特征与参照样本进行匹配，有利于提高工作效率。

以下结合一个具体的实施例，对上述方法进行验证。

本实施例中，在任务a和任务b的训练集中，任务如表1所示，从内圈(if)、外圈(of)、滚动体(bf)每个类别的故障数据中随机选取500、1000,1500个样本进行模型训练，观察不同第一训练样本数对最终故障诊断精度的影响。

表1数据设置

实验结果如图5所示，随着第一训练样本的数量增加，任务a和任务b的复合故障诊断精度均随之增加。其中在任务a上最高能达到77.73％，在任务b上最高能达到54.59％。可见，该故障诊断模型在无复合故障样本的情况下，能够有效地分类。

以上仅为本发明创造的较佳实施例而已，并不用以限制本发明创造，凡在本发明创造的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明创造的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐娟;周龙;丁煦;樊玉琦
技术所有人：合肥工业大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。