本发明涉及故障诊断技术领域,特别是涉及轴承故障诊断方法。
背景技术:
轴承故障是众多机械故障之一,由于轴承在工业生产中应用广泛,因此准确进行轴承故障诊断具有很大的现实意义,目前轴承故障诊断中常用的方法是贝叶斯网络(bayesiannetwork,bn)模型。在bn模型应用中,需要首先确定bn模型的参数,贝叶斯网络参数学习是指在bn模型结构已知的前提下估算出bn模型参数的问题,即在结构已知的情况下,通过样本数据和先验知识,获得所有网络节点的条件概率分布的过程。bn模型的参数学习算法中,常采用最大似然估计(maximumlikelihoodestimation,mle)和最大后验概率(maximumaposterior,map)估计算法来完成给定观察数据估计/学习模型参数。在数据比较充足时,通常采用mle算法,可以获得较好的参数学习精度。map估计与mle计算类似,但在参数学习中map融入了要估计量的先验分布在其中。故map可以看做mle的泛化形式。
然而,某些系统中获取大量样本数据非常困难,人们仅仅能获得样本量较小的数据集。此时,仅用mle、map计算方法往往会发生错误,导致推理、诊断模型结果荒谬。
迁移学习作为一种人工智能(artificialintelligence,ai)技术受到人们的关注。它是一种通过从已经学习的相关任务转移知识来改进新任务中的学习方法,将已经学到的模型参数通过某种方式来分享给新模型从而提升模型的学习效率和准确性。zhou提出了一种基于子片段迁移学习的bn参数学习方法,通过将目标bn模型和资源bn模型分别拆分成若干子片段(fragment)搜寻满足源域(资源网络)和目标bn适应度函数的映射,然后再利用动量匹配(momentmatch)融合完成参数学习(详见:zhouy,hospedalestm,fentonn.whenandwheretotransferforbayesnetparameterlearning[j].expertsystemswithapplications,2016,55(c):361-373.)。但该方法学习复杂度较高,计算耗时长,且匹配适应度函数中参数选取存在随机性。在故障诊断等目标识别领域,实时性要求限制了该方法的应用。
技术实现要素:
本发明实施例提供了基于迁移学习bn模型的轴承故障诊断方法,可以解决现有技术中存在的问题。
本发明提供了轴承故障诊断方法,包括以下步骤:
步骤1,获取轴承目标域样本集和源域样本集;
步骤2,根据目标域样本集和源域样本集计算各个源域样本占源域总样本的源权重系数;
步骤3,建立目标轴承诊断bn模型结构,根据目标轴承诊断bn模型结构和目标域样本集计算目标域初始bn参数的参数平衡系数α1和总源域的bn参数的参数平衡系数α2;
步骤4,建立源域轴承诊断bn模型结构,根据源域样本集和源域轴承诊断bn模型结构的关系确定各个源域bn模型参数,并根据目标域样本集计算目标域初始bn模型参数;
步骤5,根据各个源域bn模型参数计算得到总源域bn模型参数,通过总源域bn模型参数和目标域初始bn模型参数确定目标域最终bn模型参数;
步骤6,获取待诊断轴承的观测证据,利用该观测证据结合目标轴承诊断bn模型进行故障推理,完成轴承故障诊断。
本发明中的轴承故障诊断方法,首先获得目标域数据集和源域(资源网络)充足数据集;再根据源域数据样本贡献的不同得到不同源域bn参数的权重因子;然后根据目标域样本统计量与小数据集样本阈值的关系自定义计算得到源域参数和目标域参数的权重系数;最后依据传统参数学习方法计算出目标域bn模型的初始参数和各个源域bn模型的参数;可通过目标域数据集和源域充足数据集来学习到目标轴承诊断bn模型的最终参数。由此确定出的模型,既适用于样本充足时的建模,也适用于样本数据集规模较小的情形。该诊断方法既考虑了目标域样本数据集,对诊断的影响,又充分考虑了源域样本数据集对bn模型的贡献,从而提高了轴承故障诊断的正确性,尤其是小样本数据下,该方法依然有效。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的轴承故障诊断方法的概括流程图;
图2为本发明实施例提供的轴承故障诊断方法的详细流程图;
图3为本发明提供的目标轴承诊断bn模型结构图;
图4为本发明提供的源域轴承诊断bn模型结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,本发明提供了轴承故障诊断方法,由以下步骤实现:
获取轴承目标域样本集和源域样本集;
计算各个源域样本占源域总样本的源权重系数;
计算目标域初始bn参数的参数平衡系数α1和总源域的bn参数的参数平衡系数α2;
计算出各个源域bn参数和目标域初始bn参数;
计算出目标bn最终参数;
利用建立的bn模型和bn推理算法,完成轴承故障推理诊断。
如图2所示,上述方法的具体步骤为:
第1步:根据相关领域专家知识建立目标轴承诊断bn模型结构g1,源域轴承诊断bn模型结构g2(n);n=1,2,...,q。q为源域的个数,q取自然数。
第2步:获取样本数据,并对样本数据进行处理。
可选的,样本数据处理方法可采用“基于小波包和bn模型的深沟球轴承故障诊断”一文中的小波包分解、能量求和特征量获取和离散化处理,对样本数据处理后得到目标域样本集和源域样本集。
第3步:确定目标域样本集的大小m和各个源域样本集的大小m(n)。
第4步:根据目标轴承诊断bn模型结构g1计算小样本集阈值c1,并根据源域轴承诊断bn模型结构g2(n)计算小样本集阈值c2(n)。
第5步:计算各个源域中样本值占源域总样本值的源权重系数k(n),如公式(1)所示:
这里的各个源权重系数k(n)系数之和为1,同时源权重系数k(n)的取值为[0,1]之间的任意实数。
第6步:根据小样本集阈值c1和目标域样本集大小m计算得到目标域初始bn模型参数的平衡系数α1和总源域bn模型参数的平衡系数α2,具体如公式(2)所示:
这里的平衡系数α1和α2为[0,1]之间的任意实数。其中x为常量系数取[0,1]的任意数。可选的,x取0.5。
第7步:求取各个源域的bn模型参数;
根据小样本集阈值c2(n),对各个源域的样本统计值进行判断:若第t个源域样本统计值大于阈值c2(t),其中t=1,2,...,q,则采用最大似然估计的方法学习出各个源域的bn模型参数θni,其中i取自然数,为源域bn模型子节点的第i个节点;否则返回第2步。
第8步:计算总源域的bn模型参数;
对计算得到的各个源域bn模型参数进行加权求和,计算得到总源域的bn模型参数θsi,具体如公式(3)所示:
第9步:对于目标域样本集中的样本采用最大后验估计的方法计算目标域初始bn模型参数θtj,其中j为目标域bn模型的第j个节点。
第10步:计算出目标域最终bn模型参数θij,如参数融合公式(4)所示:
θij=α1θtj+α2θsi(4)
第11步:获取待诊断轴承的观测证据,即待诊断样本。
对观测的轴承振动信号进行数据采集及离散化处理,可以获得观测证据ev,即待诊断故障特征向量数据。
第12步:在目标轴承诊断bn模型中,输入待诊断的观测证据ev,利用pearl的连接树算法(参见judeapearl著《causality:models,reasoningandinference(第2版)》,cambridgeuniversitypress,2009)进行推理,从而完成故障诊断类型节点信度更新,得到目标属性概率ω'。
第13步:判断目标属性概率ω'是否大于或等于诊断属性概率阈值ω。若不满足则返回第11步,重新获取待诊断轴承的观测证据;若满足则输出目标属性,完成轴承故障诊断。其中,诊断属性概率阈值ω在目标bn模型与资源bn模型满足结构一致性和参数维度一致性时设置。
下面将结合具体实例对本发明中的技术方案进行清楚、完整地描述。
本实例中数据取自美国凯斯西储大学轴承数据中心提供的滚动轴承故障数据。实验装置的驱动端轴承型号为skf6205-2rsjem,风扇端轴承型号为skf6203-2rsjem。在风扇端和驱动端轴承座上各安装了加速度传感器来采集振动加速度信号。加速度传感器可以采集滚动轴承正常、内圈、滚动体和外圈的运行状态信息。振动加速度信号由16通道数据记录仪采集,驱动端轴承故障采样频率取12khz,电机负载为2马力时转速为1750rpm。
实验中,通过电火花加工的方式分别为驱动端轴承的内圈、外圈和滚动体制造点蚀损伤,模拟不同损伤程度的故障,在损伤直径分别从小到大(0.007mil、0.014mil、0.021mil和0.028mil)时进行测试。
由于该实验采用了破坏性实验,公开数据中的0.007mil和0.021mil条件下是相对完整的数据集,而0.014mil的数据存在缺失(详见:http://www.eecs.case.edu/laboratory/bearing/download.htm)。
本实施例选择点蚀损伤直径为0.007mil和0.021mil的数据作为源域样本,点蚀损伤直径为0.014mil的数据作为目标域样本进行bn建模,以对轴承进行诊断。
基于以上背景,本发明中的轴承诊断流程为:
第1步:根据相关领域专家知识建立目标轴承诊断bn模型结构g1,源域轴承诊断bn模型结构g2(n),n=1,2,...,q,q取2,即有两个源域,分别为点蚀损伤直径为0.007mil和0.021mil的源域样本。
目标轴承诊断bn模型结构g1如图3所示,源域轴承诊断bn模型结构g2(1)、g2(2)如图4所示。
目标轴承诊断bn模型结构g1中,用轴承故障类型作为父节点t,t有p=4个取值事件,分别对应滚动轴承“正常”、“内圈”、“外圈”和“滚动体”故障,分别用“1”、“2”、“3”、“4”表示。以8个离散化特征向量t0、t1…t7作为子节点,每个子节点有3个取值事件,分别为振动信号的“高频”、“中频”、“低频”分量,分别用“1”、“2”、“3”表示。用有向边依次连接父节点和子节点,即依次连接父节点和子节点,即依次以t作为8条有向边的箭尾,箭头分别指向t0、t1…t7。
同理,源域轴承诊断bn模型结构g2(1)中,用轴承故障类型作为父节点p1,以8个离散化特征向量p10、p11…p17作为子节点,用有向边依次连接父节点和子节点,即依次以p1作为8条有向边的箭尾,箭头分别指向p10、p11…p17;其中p1的取值事件与t相同,g2(1)的子节点取值状态与g1中子节点的取值状态相同。g2(2)2与g2(1)的模型结构相同,且父节点和子节点的取值事件一致。本实施例中源域轴承诊断bn模型结构为2个。
第2步:获取样本数据,并对样本数据进行处理。
在本实施例中轴承损失直径为0.007mil的源域样本数据已按照“基于小波包和bn模型的深沟球轴承故障诊断”进行小波包分解、能量求和特征量获取和离散化处理;同理对损失直径为0.021mil的源域样本数据和0.014mil的目标域样本数据进行相同操作的处理。
第3步:确定目标域样本集大小m和各个源域样本集的大小m(n);本实施例中目标域样本集取前35组数据,两个源域样本集分别取300组和150组数据取,即m=35;m(1)=300,m(2)=150。
第4步:根据目标轴承诊断bn模型结构计算小样本集阈值c1,并根据源域轴承诊断bn模型结构计算小样本集阈值c2(n)。
根据文献(kollerd,friedmann.probabilisticgraphicalmodels:principlesandtechniques-adaptivecomputationandmachinelearning[m].mitpress,2009.)中提出的bn小样本集阈值求解方法,本发明根据目标轴承诊断bn模型结构g1计算可得c1=76;同理根据源域轴承诊断bn模型结构g2计算可得为c2(1)=76、c2(2)=76。
第5步:计算各个源域中样本值占源域总样本值的源权重系数k(n)。
本实施例中,由m(1)=300、m(2)=150,可以由式(1)计算出0.007mil的源域样本占源域总样本值的权重k(1)=0.66,0.014mil的源域样本占源域总样本值的权重k(2)=0.34。
第6步:计算得到目标域初始bn模型参数的平衡系数α1和总源域bn模型参数的平衡系数α2。
在本实施例中,取x=0.5,目标域即损失直径0.014mil的样本参数c1=76,根据公式(2)计算得到,α1=0.43、α2=0.57。
第7步:求取各个源域的bn模型参数。
在本实施例中m(1)=300、m(2)=150,即0.007mil和0.021mil原网络的每个子节点的样本统计值为300和150;因为预设值c2(1)=76、c2(2)=76,所以两个源域的样本量均大于预设值c2(n),因此采用最大似然估计的方法学习出0.007mil和0.021mil的源域bn模型的参数θ1i和θ2i(i=1,2…8)。例如i=1时,取源网络g2(1)和g2(2)的第一个子节点的样本统计值,根据最大似然估计方法计算出:
类似的,可以计算出所有源域的bn模型参数。
第8步:计算总源域的bn模型参数。
在本实施例中,已计算出k(1)=0.66,k(2)=0.34,由公式(3)可以计算得到总源域的bn参数θsi:
θsi=0.66θ1i+0.34θ2i
比如i=1,取源网络g2(1)和g2(2)的第一个子节点的样本统计值,根据公式(3)可以得到:
类似地,可以计算出总源域的bn模型参数。
第9步:对于目标域样本集中的样本采用最大后验估计的方法计算目标域初始bn模型参数θtj。
在本实施例中m=35,即0.014mil目标网络的每个子节点的样本统计值为35;因为预设值c1=76,所以目标域的样本统计值小于预设值c1,因此采用最大后验估计的方法计算出目标域bn模型的初始参数θtj。比如i=1,取目标网络g1的第一个子节点的样本统计值,根据最大后验估计方法计算出θt1=0.5000。
类似地,可以计算出全部目标域初始bn模型参数。
第10步:计算出目标域最终bn模型参数θij。
根据迁移学习机制,利用公式(4)可以计算出目标域最终bn模型参数θij。
在本实施例中,令j=1,2…8。计算出目标域bn模型的所有子节点参数。比如j=1,根据公式(4)则可以得到:
类似地,可以计算出全部目标域最终bn模型参数。
第11步:获取待诊断轴承的观测证据。
对观测的轴承振动信号进行数据采集、离散化等处理,可以获得观测证据ev,即待诊断故障特征向量数据。
在本实施例中,输入外圈故障的一组处理数据,其待观测轴承证据ev=[23222333],其中“1”、“2”、“3”表示为轴承振动信号做特征提取后对应的特征向量。
第12步:在目标轴承诊断bn模型中,输入待诊断观测证据ev,利用连接树算法进行推理,从而得到目标属性概率ω'。
输入待诊断观测证据ev,利用连接树算法进行推理结果如表1所示。
为“外圈”故障的目标属性概率ω'为0.858;而t为“正常”、“滚动体”或“内圈”等故障的目标属性概率ω'为0.000、0.136、0.006。
表1外圈故障数据推理结果
第13步:判断目标属性概率ω'是否大于或等于诊断属性概率阈值ω。若不满足则返回第11步,重新获取待诊断轴承的观测证据;若满足则输出目标属性,完成轴承故障诊断。
由于本实施例采用本用例选择点蚀损伤直径为0.007mil、0.021mil和0.014mil的数据,实验数据源于相同的实验平台,因此其bn模型满足结构一致性和参数维度一致性,即资源子网络所对应的子节点拥有的父节点数量与目标子网络所对应的子节点拥有的父节点数量的相同;目标子网络与资源子网络的各个父节点的状态数以及子节点的状态数均相同。因此可以使用迁移学习方法进行诊断bn模型建模,即可以采用本发明方法,获得其诊断信息。
在本实施例中,设置诊断属性概率阈值ω=0.70。
诊断出的“t”为外圈故障的目标属性概率ω'大于诊断属性概率阈值ω=0.70,而其他情况均小于0.70,因此,输出目标属性,即此时诊断结果为“外圈(发生)故障”。
此时,故障诊断过程完成。否则返回第11步,继续通过传感器系统继续捕获目标观测证据。
类似的,在本实施例中采用目标域0.014mil(35组轴承故障数据)利用本发明方法进行参数学习构建诊断bn模型,随后用全部169组数据在已建立的bn模型下,利用联合树算法进行推理验证,推理、诊断识别结果见表2。
表2169组轴承样本数据推理识别结果
本发明中基于变加权迁移学习bn模型的轴承故障诊断方法,充分利用了迁移学习从相近领域中获取数据和信息,解决了数量不足的情况下现有方法参数学习结果的精确性问题,可广泛应用于嘈杂、不确定以及难以获取大量相关数据的环境中。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。