一种极端不平衡数据故障诊断的BCTGAN数据扩充方法

文档序号:38566876发布日期:2024-07-05 11:36阅读:64来源:国知局
一种极端不平衡数据故障诊断的BCTGAN数据扩充方法

本发明涉及机械故障诊断领域,尤其涉及一种面对极端不平衡数据故障诊断的bctgan(具有平衡调节及串行cnn-transformer结构的生成对抗网络)数据扩充方法。


背景技术:

1、极端不平衡数据故障诊断是专门针对具有极端不平衡特性(即各类别的样本数量相差十分悬殊)的数据集进行故障检测与诊断的技术。

2、在故障诊断领域,基于深度学习的故障诊断技术,在由低成本传感器广泛部署并与互联网连接后带来的机械大数据处理上有着广泛的应用,然而大多数情况下,故障数据都是稀缺的,这是由于机械系统关键零部件出现异常或故障的过程是渐进的,且这种情况下,设备不能长时间带故障运行,所以收集到的异常(故障)状态下数据十分有限,还可能存在某些类别的故障数据远少于正常数据或其他故障类别数据的情况。这种极端不平衡性给故障诊断带来了很大的挑战。如何设计分类方法以同时保证数据样本中多数类、少数类的分类精度,大量解决不均衡分类的方法被提出来解决这些问题,这些方法主要集中在3个层面上:数据预处理、特征提取以及分类器改进上。数据预处理层面上,研究者主要对少数类(多数类)按照一定的规则增加(减少)样本数量(即重采样)以使数据集均衡。

3、在现有技术中,中国专利公开号为cn202310320320.4的发明专利提供了一种变转速和样本不均衡下基于ganaelstm的锥齿轮故障诊断方法,设计包括采用生成对抗网络理论构建数据生成模块,利用自动编码器和长短时记忆网络理论构建故障诊断模块,最后数据生成模块生成伪样本数据,并补充到原始数据集中,形成均衡数据集,并且将一维振动信号转变为二维时频灰度图像处理。该专利无法直接处理原始时序信号,并且当数据极度缺少时,也无法扩充有效数据。

4、然而,全球新型工业体系下,机械设备需要满足更高效率、更高精度的、更加复杂的生产任务,复杂多变的状况下机器故障精准识别显得尤为重要,面对数据极其稀缺的工业情形,如何提升诊断模型的准确率与可解释性具有十分重大的意义。

5、以往的研究表明,基于gan的数据扩充技术在处理不平衡故障建模方面具有明显的优势。然而,现有技术在处理极端不平衡时显得有所不足,尤其在样本分布复杂多样、不均衡模式多变时,现有方法更是无法有针对性策略和相应的优化措施。


技术实现思路

1、本发明的目的是提供一种新的极端不平衡数据故障诊断的bctgan数据扩充方法,以克服现有的数据生成方法在机械故障诊断中还存在的一些技术问题。

2、本发明的第一个方面,是提出一种极端不平衡数据故障诊断的bctgan数据扩充方法,该方法至少包括如下步骤:

3、步骤1. 使用cnn-transformer(卷积与transformer串行结构)作为生成对抗网络中生成器的基础结构,判别器采用cnn(卷积网络)结构,从局部和整体还原故障振动信号特征;

4、步骤2. 使用拼接、反转、加噪等微增强方式对原始样本初步扩充,同时使用smote增强方式对原始样本处理产生对抗样本,两种增强方式同时作用,帮助模型稳定训练并增加多样性,对原始时间序列样本进行微增强和smote增强两种方式预处理;

5、步骤3. 使用时域、频域、时频域等多域特征比较生成样本和原始样本的差异,剔除离群的样本;

6、步骤4. 使用少量的故障样本先扩充数据后,再利用卷积分类器实现对故障时间序列的识别;

7、在一个实施例中,步骤1中,使用cnn-transformer作为生成对抗网络中生成器的基础结构,判别器采用cnn结构,从局部和整体还原故障振动信号特征是利用反卷积层和transformer模块顺次串行连接构成cnn-transformer模块,从而作为生成器的基础结构,结合判别器的卷积层共同作为整个生成对抗网络的架构。

8、在一个实施例中,在步骤1中,包括在噪音输入后,首先通过一个线性层将噪声向量放大到所需形状,接着通过所设计的一维转置卷积和transformer的交替结构,transformer模块首尾两端也加入了具有残差连接的转置卷积,并通过多头注意力机制和归一化层,逐步实现对振动信号从局部到全局的建模。

9、在一个实施例中,利用cnn-transformer对噪音向样本序列映射的计算公式如下所示:

10、;

11、;

12、;

13、其中, 表示噪声输入, 表示前一步骤输入的向量,表示经过第一个dropout后输出的向量,表示经过第二个dropout后输出的向量。表示反卷积,表示多头注意力机制,表示层归一化。

14、在一个实施例中,在步骤2中,包括在已有的故障样本中添加噪声、对前后两个时间序列样本拼接、对样本某一段作翻转产生微增强作用的样本,同时在已有样本之间选出几个样本通过smote方法产生smote增强的样本,同时利用两种增强方法设计新的损失函数项帮助稳定训练过程。

15、在一个实施例中,新的损失函数的计算公式如下所示:

16、;

17、;

18、其中,表示判别器,表示生成器,表示边界样本,是调节因子,是带有初始参数的编码器,、、分别表示真实样本、边界样本、生成样本的概率分布,是判别器的损失函数,是生成器的损失函数,z表示噪声,x代表真实样本。

19、在一个实施例中,在步骤2中,包括对原始时间序列样本预处理,计算公式如下:

20、;

21、其中,表示原始数据,表示转换后的数据。和分别表示原数据中的最大值和最小值。

22、在一个实施例中,在步骤3中,包括利用傅里叶变换和连续小波变换将时域下生成的伪样本和原始样本转换为频域、时频域特征,  cwt方法预处理过程定义如下:

23、 ;

24、其中,是小波系数,它表示原始信号x(t)的小波变换结果。a表示小波基函数的缩放因子,用于控制小波函数的频带宽度。b表示小波基函数在时间轴上的平移,用于控制小波函数的中心位置。表示选择的小波基函数,这里选择的是cmor3-3小波,其具体形式如下:

25、;

26、;

27、其中,是小波基函数的归一化因子,用于确保小波变换的结果在尺度和平移上的一致性。

28、在一个实施例中,在步骤3中,包括计算时域下伪样本和原始样本的pearson相关性系数,计算频域、时频域下伪样本和原始样本的mse差异值,将pearson相关系数较小或者mse差异值较大的伪样本剔除。计算公式如下:

29、;

30、;

31、;

32、其中,是时域差异损失,是频域差异损失,是时频域差异损失,pearson表示pearson相关系数计算公式,mse表示计算mse差异值,x,y代表两个时域样本,xfft,yfft表示两个频域样本,xcwt,ycwt表示两个时频域样本。

33、在一个实施例中,在步骤4中,包括利用bctgan对少量故障样本扩充后将生成样本和样本集合并训练卷积分类器,并利用未参与训练的剩余原始样本作为测试样本集,将测试样本集作为训练好的卷积分类器的输入,输出每个测试样本属于每一类的标签值,根据所输出的各类标签值大小,判断相应测试样本属于的类别,最后计算出accuracy、precision、recall和auc四个评价指标,评价bctgan方法。

34、本发明的第二个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被执行时实现前述的极端不平衡数据故障诊断的bctgan数据扩充方法。该程序可在pc、移动终端或者类似的运算装置中执行。

35、本发明的第三个方面,提供一种用于机械故障诊断的硬件设备,包括数据存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述的极端不平衡数据故障诊断的bctgan数据扩充方法的步骤。

36、本发明的优点和有益效果:

37、针对极端不均衡数据处理问题,本发明推出了"用于小样本、极端不平衡和多模式不均衡工业场景下故障诊断的基于平衡调节的cnn-transformer架构的生成对抗网络(bctgan) ", 首先将串行的cnn和transformer作为生成器的基础结构。其次设计了样本的微增强和smote增强来帮助模型训练,微增强简单增加样本数量,smote增强帮助增加多样性,通过设计新的损失函数项,两者共同平衡训练过程。最后设计的多域特征筛选方法帮助剔除离群的样本。在三个数据集上的结果表明,所提方法由于传统及一般基于gan的故障诊断方法,具有巨大潜力。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1