1.本发明涉及故障识别领域,具体涉及一种故障诊断模型生成方法、故障诊断方法及电子设备。
背景技术:2.故障诊断在机械设备的健康管理中起着至关重要的作用。随着机器学习,特别是深度学习的快速发展,智能故障诊断(intelligent fault diagnosis,ifd)成为了当前工程领域的热点课题。基于数据驱动的ifd可以自动的从监测数据中提取有效特征,并建立监测数据的特征与故障状态的对应关系,从而指导使用者进行适时的维护决策,进而保证在较少的设备停机时间、较低的维护成本的前提下,避免故障的发生和不必要的经济损失,实现设备可靠性和经济效益之间的平衡。
3.通常来说,高精度的基于深度学习的ifd需要满足两个基本假设:正常状态和故障状态下都有大量的标记数据。但是,在真实的工程场景中,设备通常在正常状态下工作,可供收集的故障数据很有限,同时,运行条件和工作环境的变化导致了数据分布的差异,因此很难构建用于故障诊断模型训练的理想数据集。在这种情况下,如果直接用有限的故障数据训练诊断模型,则泛化性能较差,诊断精度较低。
技术实现要素:4.为了解决现有技术中的至少一个技术问题,本公开提供了一种故障诊断模型生成方法、故障诊断方法及电子设备,以提高诊断精度。
5.本公开的第一方面,提供了一种故障诊断模型生成方法,包括:
6.获取源域样本和目标域样本,所述源域样本包括实验室环境中的设备检测数据以及相应的设备故障标签,所述目标域样本包括真实环境中的设备检测数据以及相应的设备故障标签;
7.根据所述源域样本对分类模型进行预训练,以得到预训练模型,其中,所述分类模型包括用于分类的softmax层;
8.用预设的待替换的softmax层替换所述预训练模型的softmax层,以得到待训练模型;
9.根据所述目标域样本训练所述待训练模型,以生成故障诊断模型。
10.可选的,所述获取源域样本和目标域样本之前,所述方法包括:
11.获取实验室数据和真实数据,所述实验室数据和真实数据均为时间序列数据,所述实验室数据包括实验室中的设备检测数据以及相应的设备故障标签,所述真实数据包括工业中的设备检测数据以及相应的设备故障标签;
12.将所述实验室数据和所述真实数据分割成相同长度的样本,以生成所述源域样本和目标域样本。
13.可选的,根据滑动窗口法,将所述实验室数据和所述真实数据分割成相同长度的
样本。
14.可选的,所述实验室数据对应的设备和真实数据对应的设备的类别相同;
15.所述实验室数据对应的设备与所述真实数据对应的设备的型号或尺寸不同。
16.可选的,所述分类模型为残差全卷积神经网络模型;
17.所述分类模型包括依次设置的输入层、第一卷积层、第二卷积层、第三卷积层、池化层和输出层,所述输出层使用所述softmax层分类;
18.所述第一卷积层和第三卷积层均为残差结构;
19.所述第一卷积层、第二卷积层和第三卷积层均用于执行卷积、批归一化和激活。
20.可选的,所述根据所述源域样本对分类模型进行预训练,包括:
21.根据所述源域样本的训练集数据训练所述分类模型;
22.根据所述源域样本的验证集数据验证已训练的所述分类模型,若精度符合要求,则得到所述预训练模型,若精度不符合要求,则用所述源域样本的训练集数据继续训练所述分类模型。
23.可选的,所述对分类模型的softmax层的神经元数量与所述源域样本中的设备故障标签的类别数量;
24.所述用预设的待替换的softmax层替换所述预训练模型的softmax层,以得到待训练模型,包括:
25.根据所述目标域样本中的设备故障标签的类别数量,生成所述待替换的softmax层,其中,所述待替换的softmax层的神经元数量与所述目标域样本中的设备故障标签的相同,所述待替换的softmax层的参数随机初始化;
26.将待替换的softmax层替换到所述预训练模型的softmax层,以得到所述待训练模型。
27.可选的,所述根据所述目标域样本训练所述待训练模型,以生成故障诊断模型包括:
28.根据所述目标域样本的训练集数据训练所述待训练模型的所有模型参数;
29.根据所述目标域样本的验证集数据验证已训练的所述待训练模型,若精度符合要求,则得到故障诊断模型,若精度不符合要求,则根据所述目标域样本的训练集数据继续训练所述待训练模型的所有模型参数。
30.本公开的第二方面,一种故障诊断方法,包括:
31.获取设备检测数据;
32.将所述设备检测数据输入根据本公开第一方面任一所述的故障诊断模型生成方法生成的故障诊断模型,得到设备故障诊断结果。
33.本公开的第三方面,一种电子设备,包括:
34.处理器;以及
35.存储程序的存储器;
36.其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据本公开第一方面任一项所述的方法。
37.本技术实施例中提供的一个或多个技术方案,可以利用源域样本训练分类模型得到预训练模型,替换预训练模型中用于分类的softmax层得到待训练模型,利用目标域样本
训练待训练模型得到故障诊断模型,使得可以基于少量目标域样本得到精确的故障诊断模型,最终提高故障诊断精度。
附图说明
38.附图示出了本公开的示例性实施方式,并与其说明一起用于解释本公开的原理,其中包括了这些附图以提供对本公开的进一步理解,并且附图包括在本说明书中并构成本说明书的一部分。
39.图1示出了根据本公开示例性实施例的故障诊断模型生成方法的一种流程图;
40.图2示出了根据本公开示例性实施例的故障诊断模型生成方法的一种子流程图;
41.图3示出了根据本公开示例性实施例的时间序列数据的分割示意图;
42.图4示出了根据本公开示例性实施例的分类模型的示意图;
43.图5示出了根据本公开示例性实施例的故障诊断模型生成方法的另一种子流程图;
44.图6示出了根据本公开示例性实施例的故障诊断的一种流程图;
45.图7示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
46.下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
47.应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
48.本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
49.需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
50.本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
51.本公开的故障诊断模型生成方法和故障诊断方法的执行主体可以根据具体案例进行调整,如执行主体可以可以是服务器、电子设备、计算机等。
52.以下参照附图描述本公开的方案:
53.参见图1,一种故障诊断模型生成方法,包括:
54.s101,获取源域样本和目标域样本,源域样本包括实验室环境中的设备检测数据
以及相应的设备故障标签,目标域样本包括真实环境中的设备检测数据以及相应的设备故障标签;
55.s102,根据源域样本对分类模型进行预训练,以得到预训练模型,其中,分类模型包括用于分类的softmax层;
56.s103,用预设的待替换的softmax层替换预训练模型的softmax层,以得到待训练模型;
57.s104,根据目标域样本训练待训练模型,以生成故障诊断模型。
58.本公开的故障诊断模型生成方法,将实验室环境中的设备检测数据以及相应的设备故障标签作为源域样本,将真实环境(如工业环境)中的设备检测数据以及相应的设备故障标签作为目标域样本,以样本多且平衡的源域样本预训练分类模型,并在预训练完成后用预设的待替换的softmax层替换预训练模型中用于分类的softmax层,再以样本少的目标域样本训练替换了softmax层的模型,以达到迁移学习的目的,最终生成故障诊断模型。如此,利用实验室获取的量大且平衡的数据辅助真实环境获取的量少且不平衡的数据,训练得到精度高的故障诊断模型,实现真实环境的精确识别。
59.如此可以用少量目标域样本(真实环境的数据样本)即可生成精度更高的故障诊断模型。克服了目标域样本少且不平衡的局限性,能够较好的处理小数据、不平衡数据的故障诊断(intelligent fault diagnosis with small&imbalanced data,s&i-ifd)问题。
60.尽管实验室环境中的设备工况、尺寸、型号等与真实设备可能有较大差异,但内部的组成结构、故障类型和故障原因相似。因此,充分利用大量且平衡的公开的实验室数据,可有效的挖掘其内部包含的特征和信息,并将其迁移到待诊断的真实设备中,使得故障诊断模型的诊断结果更精准。
61.其中,可以知道的,预设的待替换的softmax层是用于替换预训练模型的softmax层的,使得替换预训练模型的softmax层不再是经源域样本的softmax层,一方面,使得替换softmax层得到的待训练模型在训练时,softmax层能更好被目标域样本训练,使得少量目标域样本可以训练出高精度的故障诊断模型。另一方面,在目标域和源域中的设备故障标签的分类数不相同时,可以使得替换前的softmax层更适用源域样本训练,替换后的softmax层更适用目标域样本训练。还可以知道的,待替换的softmax层可以是经参数初始化的softmax层。
62.可以知道的,本技术中的分类模型是以包含用于分类的softmax层的分类模型。分类模型可包括输入层、隐藏层和输出层,输出层用该softmax层分类。softmax层是本领域的常用分类层,本实施例不再详细描述。
63.在一个实施方式中,参见图2,获取源域样本和目标域样本之前,故障诊断模型生成方法方法包括:
64.s201,获取实验室数据和真实数据,实验室数据和真实数据均为时间序列数据,实验室数据包括实验室中的设备检测数据以及相应的设备故障标签,真实数据包括工业中的设备检测数据以及相应的设备故障标签;
65.s203,将实验室数据和真实数据分割成相同长度的样本,以生成源域样本和目标域样本。
66.在训练分类模型,分类模型使用神经网络进行深度特征提取之前,可采用数据分
割方法将其分割为一定长度的时间片段,分割的源域样本和目标域样本可以更好的训练分类模型以及基于分类模型得到的待训练模型。
67.示例性的,可采用滑动窗口法(sliding window,sw)将作为源域数据的实验室数据和作为目标域数据的真实数据分割成相同长度的样本。参见图3,图3是时间序列数据的分割示意图,sw中最重要的两个参数是窗口k的窗口宽度d1和滑动步长d2,窗口宽度d1是分割的长度,滑动步长d2是滑动窗口在读取数据过程中每次移动的长度。
68.因此,对于长度为l的时间序列数据,以窗口宽度d1和滑动步长d2进行分割,可以得到的样本数n如公式一所示,其中[.]为取整函数。
[0069][0070]
对于一条固定的时间序列,窗口宽度越窄、滑动步长越小,分割得到的样本数量就越多,因此可以通过调整这两个参数来调整样本的数量。由于目标域数据中的数据呈现不平衡状态,因此针对不同的类的数据,保持窗口宽度恒定,选择不同的滑动步长,从而均衡不同类的样本的数量,便于后续深度网络的特征提取。
[0071]
示例性的,实验室数据对应的设备和真实数据对应的设备的类别相同,实验室数据对应的设备与真实数据对应的设备的型号或尺寸不同。可以知道的,实验室数据对应的设备与真实数据对应的设备的型号或尺寸相同时,训练效果更佳。但作为实际运用场合,往往相同型号和尺寸的设备的实验室数据并不足够多,因此,本技术可以与真实数据对应的设备的型号或尺寸不同的实验室数据进行预训练。
[0072]
在一个实施方式中,参见图4,分类模型为残差全卷积神经网络模型,分类模型为残差全卷积神经网络模型(简称:resfcn)时可以更好地解决s&i-ifd问题,由于fcn在时间序列方面表现出较好的鲁棒性,为后续的迁移学习提供了较好的基础,残差模块可用于解决梯度消失和梯度爆炸问题,并能减缓过拟合问题,分类模型的输入是一个可变长度的时间序列,输出是对数据所处的类的预测,即在本实施方式中是对设备的故障状态类的预测。分类模型包括依次设置的输入层401、第一卷积层402、第二卷积层403、第三卷积层404、池化层405和输出层406,输出层使用softmax层分类。输入层401后为第一卷积层402、第二卷积层403、第三卷积层404三个卷积层,每个卷积层都会进行卷积conv、批归一化bn和激活三个步骤,其中,激活的激活函数为整流线性单元relu。随后为一个池化层405,进行全局平均操作,也就是将前一层的结果在时间轴上进行平均。池化层可以极大的减少深度模型中的参数数量,同时可以解释学习到的特征。输出层406使用softmax做分类,该层的神经元数量等于类的数量。同时,在第一卷积层402和第三卷积层403中使用了残差结构,用于防止梯度消失、梯度爆炸和过拟合。
[0073]
在网络预训练中,首先将源域数据集划分为训练集和验证集。选定一个较小的epoch,使用训练集数据对网络进行训练。将验证集数据输入训练好的模型中进行验证,如果精确度符合要求,则网络预训练结束;否则,再次使用训练集数据继续进行训练,直到精确度符合要求。由于选取的epoch较小,因此在训练过程中不会出现过拟合,逐步的进行训练可以保证最终的预训练网络处于非欠拟合和非过拟合的状态,有较好的泛化性,能够正确的提取源域中与故障相关的特征。
[0074]
本公开的方法,根据故障诊断数据的时序特征,针对性的使用了数据分割方法和
网络模型。跨越了源域和目标域数据的较大差距,有效的挖掘和结合了源域数据中的普遍性特征和目标域数据中的个性化特征,充分地利用了已有信息,提高了故障诊断精度。
[0075]
在一个实施方式中,参见图5,根据源域样本对分类模型进行预训练,包括:
[0076]
s501,根据源域样本的训练集数据训练分类模型;
[0077]
s502,根据源域样本的验证集数据验证已训练的分类模型,若精度符合要求,则得到预训练模型,若精度不符合要求,则用源域样本的训练集数据继续训练分类模型。
[0078]
在对分类模型进行预训练中,首先将源域样本划分为训练集数据和验证集数据。选定一个较小的epoch(时期),使用训练集数据对分类模型进行训练。将验证集数据输入训练好的分类模型中进行验证,如果精确度符合要求,则网络预训练结束;否则,再次使用训练集数据继续进行训练,直到精确度符合要求。由于选取的epoch较小,因此在训练过程中不会出现过拟合,逐步的进行训练可以保证最终的预训练网络处于非欠拟合和非过拟合的状态,有较好的泛化性,能够正确的提取源域中与故障相关的特征。
[0079]
在一个实施方式中,对分类模型的softmax层的神经元数量与源域样本中的设备故障标签的类别数量;
[0080]
用预设的待替换的softmax层替换预训练模型的softmax层,以得到待训练模型,包括:
[0081]
根据目标域样本中的设备故障标签的类别数量,生成待替换的softmax层,其中,待替换的softmax层的神经元数量与目标域样本中的设备故障标签的相同,待替换的softmax层的参数随机初始化;
[0082]
将待替换的softmax层替换到预训练模型的softmax层,以得到待训练模型。
[0083]
本实施方式可以使得模型训练时,源域样本中的故障类别数量与目标域中的故障类别数据不相同,减少对源域样本的要求限制,并依旧使训练得到的故障检测模型具有较好的精度。
[0084]
在一个实施方式中,根据目标域样本训练待训练模型,以生成故障诊断模型包括:
[0085]
根据目标域样本的训练集数据训练待训练模型的所有模型参数;
[0086]
根据目标域样本的验证集数据验证已训练的待训练模型,若精度符合要求,则得到故障诊断模型,若精度不符合要求,则根据目标域样本的训练集数据继续训练待训练模型的所有模型参数。
[0087]
由于源域数据和目标域数据的分布有较大差异,因此预训练的分类模型不能直接用于目标域数据的智能诊断。为了解决这一问题,本公开采用迁移学习方法,使用少量目标域样本数据对预训练模型进行微调,提取两个域数据之间的跨域不变量,最终实现故障的智能诊断。
[0088]
首先,使用源域样本训练得到预训练模型。然后,删除预训练神经网络的softmax层,将其替换为另一个softmax层,该层的神经元数量等于目标域中类的数量。添加的softmax层使用glorot’s uniform初始化方法进行随机初始化。以这个模型为基础,在目标域上进行重新训练。为了保证模型的收敛性,对整个网络的参数进行调整,而不是只对最后的softmax层参数进行调整。
[0089]
本公开还提供了一种故障诊断方法,包括:
[0090]
获取设备检测数据;
[0091]
将设备检测数据输入根据本公开任一的故障诊断模型生成方法生成的故障诊断模型,得到设备故障诊断结果。
[0092]
作为本公开的一个具体实施方式,参见6,将实验室数据和真实数据的数据分割,得到源域样本和目标域样本。源域样本包含训练集数据(多且平衡)和验证集数据。真实数据可以分为真实数据(预测集)和真实数据(测试集),数据分割后得到目标域样本(训练)和目标域样本(测试)。利用源域样本包含的训练集数据(多且平衡)和验证集数据以及目标域样本(训练)和目标域样本(测试)进行网络预训练、模型迁移和模型测试。
[0093]
网络预测试601:利用源域样本的训练集数据可以对分类模型进行预训练得到预训练模型,其中,分类模型可以是残差全卷积神经网络模型,即残差fcn网络。利用源域样本的验证集数据验证预训练模型是否精度符合要求,若精度符合要求,则进行模型迁移,若不符合要求,则继续训练。
[0094]
模型迁移602:则将目标域样本(训练)作为相应的测试集数据(少且不平衡)来模型微调预训练模型,微调预训练模型可包括用预设的待替换的softmax层替换预训练模型的softmax层,以得到待训练模型,根据目标域样本训练待训练模型,得到故障诊断模型-s&i-ifd模型,得到s&i-ifd模型后可进行模型测试。
[0095]
模型测试603:将目标域样本(测试)作为测试集样本(平衡)来测试s&i-ifd模型,根据s&i-ifd模型的诊断结果,测试s&i-ifd模型的精度。
[0096]
针对本公开的技术方案,进行了实验,实验结果显示本公开的方法的平均精度达到98.43%,表面本技术的方法对提高故障检测精度具有明显的提高效果。其中,以凯斯西储大学的轴承数据中心的数据作为源域数据和源域样本,以自于帕德伯恩大学轴承数据中心的数据作为目标域数据和目标域样本,以笔记本电脑为实验设备,以python软件进行试验。
[0097]
本公开示例性实施例还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器。存储器存储有能够被至少一个处理器执行的计算机程序,计算机程序在被至少一个处理器执行时用于使电子设备执行根据本公开实施例的方法。
[0098]
本公开示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质,其中,计算机程序在被计算机的处理器执行时用于使计算机执行根据本公开实施例的方法。
[0099]
参考图7,现将描述可以作为本公开的服务器或客户端的电子设备700的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0100]
如图7所示,电子设备700包括计算单元701,其可以根据存储在只读存储器(rom)702中的计算机程序或者从存储单元708加载到随机访问存储器(ram)703中的计算机程序,来执行各种适当的动作和处理。在ram 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也
连接至总线704。
[0101]
电子设备700中的多个部件连接至i/o接口705,包括:输入单元706、输出单元707、存储单元708以及通信单元709。输入单元706可以是能向电子设备700输入信息的任何类型的设备,输入单元706可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元707可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元704可以包括但不限于磁盘、光盘。通信单元709允许电子设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙tm设备、wifi设备、wimax设备、蜂窝通信设备和/或类似物。