基于数据预处理和深度学习的设备剩余使用寿命预测方法

文档序号:31597532发布日期:2022-09-21 07:26阅读:79来源:国知局
基于数据预处理和深度学习的设备剩余使用寿命预测方法

1.本发明涉及设备剩余使用寿命预测技术领域,具体涉及一种基于数据预处理和深度学习的设备剩余使用寿命预测方法。


背景技术:

2.随着大数据技术的发展和传感器技术的进一步成熟,传感器可以监测得到更全面的机器设备历史运行数据,利用设备历史运行数据,可以建立基于深度学习的预测模型来预测设备的剩余使用寿命,从而可以更加灵活的安排设备维护计划,减少资源浪费,降低安全事故发生的概率。因此,本发明提出建立基于数据预处理和深度学习的设备剩余使用寿命预测模型,根据预测的结果能准确地对设备的运行进行指导,是保障设备可靠安全使用的重要手段,更是使社会产能和经济效益提高的强有利方法。
3.目前针对设备剩余使用寿命预测方面,国内外已经进行了一些研究,首先在数据预处理方面,针对缺失值处理这个问题,目前常用方法主要包括两种:1)删除含有缺失值的样例;2)可能值插补缺失值等。由于本发明研究的设备状态数据是时序数据,直接删除含有缺失值的样例会使得数据不在时间上连续。可能值插补的方法有包括以下几种:1)简单插补,即将数据属性的均值或者众数作为此缺失值填充。这种方法实现简单,效率高,适合对缺失值不敏感的数据集;2)多重插补,多值插补的思想来源于贝叶斯估计,认为待插补的值是随机的,它的值来自于已观测到的值,但该方法计算过于冗杂。此外,目前多数设备状态数据中所包含的特征过于冗余,在对缺失值进行处理的基础上,还需要进一步对数据进行特征降维,去除多余变量。经过上述步骤得到的数据仅仅体现在时域上的变化,如果能够通过变换将数据的频域特征也体现出来,那么数据包含的信息就会更多。
4.在剩余使用寿命预测的方法研究方面,目前国内外常用的包括基于模型的方法,基于知识的方法和基于数据的方法。基于模型的方法需要清楚地了解设备的结构和机制,这在一些情况下往往难以实现;基于知识的方法会受到专家经验和知识的限制,在缺少相关专业背景的情况下得到的最后剩余使用寿命预测结果往往难以满足要求;基于数据的方法仅需要通过对设备状态数据进行分析建立剩余使用寿命预测模型,该方法可有效弥补上述两种方法的不足。目前国内外针对基于数据的设备剩余寿命预测方法已经有了一些研究。如中国专利“一种基于igs-svm的锂离子电池剩余使用寿命预测方法及系统”(公开号:cn113281671a)。该方法依靠机器学习算法训练数据,得到剩余使用寿命预测模型,但随着计算能力的提升,数据量的增加,深度学习在处理大数据时将更有优势,第一,深度学习算法逐层直接自动进行特征的学习和提取,第二,深度学习能分析出数据变化内含的健康状态变化,这种复杂的关联性一般的机器学习算法很难学习,尤其是面对高维多种类的海量数据。


技术实现要素:

5.本发明的目的在于,针对上述现有技术的不足,提供一种基于数据预处理和深度
学习的设备剩余使用寿命预测方法,以解决设备剩余使用寿命的预测问题。
6.为实现上述目的,本发明采用的技术方案如下:
7.本发明提供了一种基于数据预处理和深度学习的设备剩余使用寿命预测方法,该方法包括:
8.采集并选取用于反映设备退化状态的历史数据;
9.对历史数据进行数据预处理,以形成经处理的数据,数据预处理包括缺失值填补和特征降维;
10.基于小波变换对经处理的数据进行时频转换,以得到设备历史运行的时频数据;
11.对时频数据进行贴标签,得到标签数据,标签数据用于训练设备剩余使用寿命预测模型,设备剩余使用寿命预测模型用于对设备剩余使用寿命进行预测;
12.基于卷积神经网络构建设备剩余使用寿命预测模型;
13.构建模型评价函数对所构建的设备剩余使用寿命预测模型进行评价。
14.可选地,采集并选取用于反映设备退化状态的历史数据,包括:从设备状态数据集中选取多组设备全生命周期数据,从中选择能够表征设备退化状态且能够被连续监测和记录的特征参量,作为设备的退化变量,全生命周期表示设备从最开始正常运转到退化至不能再运转而需要维护时的整个生命周期。
15.可选地,对历史数据进行数据预处理,以形成经处理的数据,具体包括:对历史数据进行缺失值填补时,采用均值插补方法,利用取缺失值前后的一部分数据的均值来填充缺失值的方式进行缺失值填充;然后进一步通过主成分分析法对历史数据进行特征降维操作,特征降维操作包括特征归一化、计算样本协方差矩阵、特征分解与排序。
16.可选地,基于小波变换对经处理的数据进行时频转换,以得到设备历史运行的时频数据,具体包括:
17.基于复数morlet小波函数,对经处理的数据进行连续小波变换,得到设备历史运行的时频数据。
18.可选地,对时频数据进行贴标签,得到标签数,包括:基于全周期使用寿命是100%全寿命,需要维护时的寿命是0%全寿命,根据下式得到每个时刻实际的剩余使用寿命
[0019][0020]
其中rul(t)表示某时刻t的设备剩余使用寿命,frul表示全新时刻的可用寿命,actfrul表示设备从全新到需要维护的实际运行的寿命值。
[0021]
可选地,基于卷积神经网络构建的设备剩余使用寿命预测模型包括输入层-卷积层-池化层-卷积层-池化层-卷积层-池化层-全连接层-输出层,进而利用标签数据来训练设备剩余使用寿命预测模型,得到最终的设备剩余使用寿命预测模型。
[0022]
本发明的有益效果包括:
[0023]
本发明提供的基于数据预处理和深度学习的设备剩余使用寿命预测方法包括:采集并选取用于反映设备退化状态的历史数据;对历史数据进行数据预处理,以形成经处理的数据,数据预处理包括缺失值填补和特征降维;基于小波变换对经处理的数据进行时频转换,以得到设备历史运行的时频数据;对时频数据进行贴标签,得到标签数据,标签数据用于训练设备剩余使用寿命预测模型,设备剩余使用寿命预测模型用于对设备剩余使用寿
命进行预测;基于卷积神经网络构建设备剩余使用寿命预测模型;构建模型评价函数对所构建的设备剩余使用寿命预测模型进行评价。通过对设备历史运行数据进行数据预处理及特征转换,并且通过卷积神经网络结构来训练数据,建立能够预测设备剩余使用寿命的模型,实现了设备剩余使用寿命的准确预测,为指导后续设备维护时间的确定提供了有效依据。
附图说明
[0024]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0025]
图1示出了本发明实施例提供的基于数据预处理和深度学习的设备剩余使用寿命预测方法的流程示意图;
[0026]
图2a至图2e为本发明实施例提供的同一轴承5组不同时间段(时间顺序从小到大)的时序数据经小波变换后的时域、时频及时频三维图像示意图;
[0027]
图3为本发明实施例提供的案例验证数据中的轴承在时间线上的振动信号示意图;
[0028]
图4a至图4d为本发明实施例提供的案例验证中线性贴标签方式下的4组轴承剩余使用寿命趋势结果图;
[0029]
图5a至图5d为本发明实施例提供的案例验证中分段贴标签方式下的4组轴承剩余使用寿命趋势结果图;
[0030]
图6a至图6d为本发明实施例提供的案例验证中百分制贴标签方式下的4组轴承剩余使用寿命趋势结果图。
具体实施方式
[0031]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0032]
图1示出了本发明实施例提供的基于数据预处理和深度学习的设备剩余使用寿命预测方法的流程示意图,如图1所示,本发明提供了一种基于数据预处理和深度学习的设备剩余使用寿命预测方法,该方法包括:
[0033]
步骤101、采集并选取用于反映设备退化状态的历史数据。
[0034]
具体地,采集并选取用于反映设备退化状态的历史数据,包括:从设备状态数据集中选取多组设备run-to-failure全生命周期数据,从中选择能够表征设备退化状态且能够被连续监测和记录的特征参量,作为设备的退化变量,全生命周期表示设备从最开始正常运转到退化至不能再运转而需要维护时的整个生命周期。不同类型的工业设备可选择各自的待监测参数,主要包括振动、加速度信号等
[0035]
步骤102、对历史数据进行数据预处理,以形成经处理的数据。
[0036]
数据预处理包括缺失值填补和特征降维。可选地,对历史数据进行数据预处理,以形成经处理的数据,具体包括:对历史数据进行缺失值填补时,采用均值插补方法,利用取缺失值前后的一部分数据的均值来填充缺失值的方式进行缺失值填充;然后进一步通过主成分分析法对历史数据进行特征降维操作,特征降维操作包括特征归一化、计算样本协方差矩阵、特征分解与排序。
[0037]
具体地,本发明以轴承历史运行数据代表设备的状态数据。由于轴承部分缺失对整体数据质量影响不大,采用多重插补计算过于冗杂,本发明将采用计算较为简单的均值插补的方法对缺失值进行填充。又因为轴承运行数据具有很明显的时序特征,如果在某一特征上用全部的值做均值计算来填充缺失值,是不符合轴承运行时数据规律的,因此本发明提出利用将缺失值前后的部分数据做均值运算来填充缺失值的方式进行缺失值填充。填充值计算如下式所示。
[0038][0039]
其中fmv是要填充的缺失值,n代表此时刻前后n个时刻,fi为i时刻的特征值。n是超参数,可以根据实际需求设定。
[0040]
在上述对数据缺失值进行填补的基础上,进一步对数据进行特征降维,去除多余变量。本发明采用主成分分析法进行降维,具体步骤为:
[0041]
1)特征归一化
[0042]
将各特征向量进行标准化处理,以降低不同变量的量纲不同而导致的降维失败或不准确问题。本发明采取min-max归一化的方式,将特征归一化到[0,1]之间。具体公式如下:
[0043][0044]
其中,ximax表示所有样本的特征i的最大值,ximin表示所有样本的特征i的最小值。表示样本j的第i个特征值。经过归一化处理,可以将样本进行规约。
[0045]
2)计算样本协方差矩阵如式:
[0046][0047]
3)特征分解
[0048]
将协方差矩阵xx
t
进行特征值分解如式:
[0049]
xx
t
ωi=λiωi[0050]
将求得的特征值排序:λ1≥λ2≥

≥λd′

[0051]
4)取最大的d

个特征值所对应的特征向量w1,w2,

,wd′
,得到特征降维后的样本矩阵。其中d

是超参数,可以根据实际需求设定。
[0052]
步骤103、基于小波变换对经处理的数据进行时频转换,以得到设备历史运行的时频数据。
[0053]
小波变换包括一维、二维的连续小波变换等,在一维小波变换中,首先给定基本小波函数此时,信号f(t)的连续小波变换可定义为下式:
[0054][0055]
从式中可以看出,小波变换包含了两个尺度函数a,b,其中尺度a控制小波函数的伸缩,平移量b控制小波函数的平移,即a对应频率,b对应于时间。可选地,基于小波变换对经处理的数据进行时频转换,以得到设备历史运行的时频数据,具体包括:基于复数morlet小波函数,对经处理的数据进行连续小波变换,得到设备历史运行的时频数据。
[0056]
为了更直观的观察分析小波变换得到的时频特征,本发明选取同一轴承5组不同时间段(时间顺序从小到大)的时序数据进行小波变换,图2a至图2e给出变换后的时域、时频及时频三维图像。从图2e可以看到,频域在轴承严重损坏时会出现周期性脉冲现象。相比于只从时域分析数据,经过小波变换后,可以同时从时域、频域角度分析、观察时序数据,故而可以挖掘出时序数据中更多的隐藏信息,有助于提高后续深度学习模型的预测准确度。
[0057]
步骤104、对时频数据进行贴标签,得到标签数据。
[0058]
标签数据用于训练设备剩余使用寿命预测模型,设备剩余使用寿命预测模型用于对设备剩余使用寿命进行预测。
[0059]
本发明采用的卷积神经网络是一种监督学习算法,在训练的时候,需要对当前的样本数据设置标签。目前常用的有两种对设备剩余使用寿命贴标签的方式,一种用线性函数来拟合机器的剩余使用寿命真实值,如下式所示:
[0060]
rul(t)=actfrul-t
[0061]
另一种用分段函数来拟合机器的剩余使用寿命真实值,该方法认为在一开始,设备的剩余使用寿命保持不变,当设备运行一段时间之后,才开始线性下降,如下式所示:
[0062][0063]
上式中,actfrul指的是设备的从全新到需要维护的实际运行的寿命值,mrul指的是设备会出现性能急剧损坏的时间。本发明考虑到设备在全新时的参考寿命frul是固定的,但是在实际使用过程中,会受到环境影响等,导致不同的机器实际的使用时长并不一样,鉴于此,提出另一种贴标签的方法,即百分制贴标签的方法,该方法认为全周期使用寿命是100%全寿命,需要维护时的寿命是0%全寿命,即每个时刻实际的剩余使用寿命如下式所示。
[0064][0065]
其中rul(t)表示某时刻t的设备剩余使用寿命,frul表示全新时刻的可用寿命,actfrul表示设备从全新到需要维护的实际运行的寿命值。
[0066]
步骤105、基于卷积神经网络构建设备剩余使用寿命预测模型。
[0067]
可选地,基于卷积神经网络构建的设备剩余使用寿命预测模型包括输入层-卷积层-池化层-卷积层-池化层-卷积层-池化层-全连接层-输出层,进而利用标签数据来训练
设备剩余使用寿命预测模型,得到最终的设备剩余使用寿命预测模型。
[0068]
本发明所设计的卷积神经网络结构参数如下表1。
[0069]
表1卷积神经网络结构参数
[0070]
结构规模输入层(256,256,3)卷积层(3,3,32),padding=same池化层(2,2,32)卷积层(3,3,64),padding=same池化层(2,2,64)卷积层(3,3,128),padding=same池化层(2,2,128)全连接层64输出层1
[0071]
需要说明的是,在每一个卷积层和全连接层后,本发明都加了relu激活函数来避免梯度消失或者梯度爆炸问题,relu函数计算如下式:
[0072][0073]
最后,基于步骤104得到的数据对该模型训练得到最终的剩余使用寿命预测模型。
[0074]
步骤106、构建模型评价函数对所构建的设备剩余使用寿命预测模型进行评价。
[0075]
构建模型评价函数对所得模型进行评价,具体设计依据为:若设备剩余使用寿命的预测值大于实际值,会造成设备故障采取措施滞后的情况出现,若设备剩余使用寿命的预测值小于实际值,代价往往小于设备剩余使用寿命的预测值大于实际值的情况,基于此准则设计评价函数score。
[0076]
本发明所设计的评价函数score的计算过程为:首先根据设备i的预测值rul与实际值actrul计算出模型对于设备i的错误率eri,见下式:
[0077][0078]
再根据eri计算模型的评分ai,见下式:
[0079][0080]
模型的最终得分score是所有测试设备得到的ai的和。score值越大,代表模型得到的rul预测值越贴近真实值,score计算如下式,其中,i是设备编号:
[0081][0082]
本发明基于数据预处理和深度学习的设备剩余使用寿命预测方法,为了使预测的
设备剩余使用寿命更加准确,提出了对设备历史运行数据进行数据预处理及特征转换,得到了设备历史运行数据的时频特征图;由于本发明采用的卷积神经网络是监督算法,本发明设计了对样本贴标签的方式;最后,提出了一种卷积神经网络结构来训练数据,得到了能够预测设备剩余使用寿命的模型,并利用评价函数比较了多种贴标签方式下训练得到的模型的性能,从而为指导后续设备维护时间的确定提供了有效依据。
[0083]
案例说明
[0084]
本发明基于2012phm竞赛数据集进行案例说明,此数据集是对轴承从全新状态进行加速实验,直到其振动信号的振幅超过20g。数据的采样频率为25.6khz,即每1/10s采样2560条振动信号数据。图3为该数据中的轴承在时间线上的振动信号示意图。
[0085]
2012phm竞赛数据集给出三种不同转速和压力下的轴承数据,包括1800rpm和4000n、1650rpm和4200n、1500rpm和5000n。本发明利用1800rpm和4000n状态下的轴承数据进行验证。在此实验条件下,有7组轴承数据,详细信息如下表2。
[0086]
表2 7组轴承数据表
[0087][0088]
一、有效性验证
[0089]
该测试将本发明所设计的卷积神经网络结构分别在三种标签下对4组测试数据集进行了验证,得到线性贴标签方式下的4组轴承剩余使用寿命趋势如图4a至图4d,分段贴标签方式下的4组轴承剩余使用寿命趋势如图5a至图5d,百分制贴标签方式下的4组轴承剩余使用寿命趋势如图6a至图6d。由图4a-图6d可以看出,三种贴标签方式下训练的深度学习模型都可以拟合轴承的退化趋势,给出轴承任意时刻的剩余使用寿命值,用户则可以根据轴承的剩余使用寿命趋势决定机器的维护时间。
[0090]
二、剩余寿命预测准确度分析
[0091]
由图4a-图6d轴承的剩余使用寿命趋势图得到的三种贴标签方式下4组测试数据集的预测rul与真实rul结果如下表3。
[0092]
表3预测rul与真实rul结果表
[0093][0094]
基于上表计算每组实验的score值,结果如下表4所示,根据表中的score值可以看出,百分制贴标签的方式得到的score值大于分段贴标签方式,分段贴标签方式score值大于线性贴标签方式,所以,百分制贴标签的方式训练得到的模型性能更好。通过上述案例有效验证了本发明所提方法的准确性和可靠性。
[0095]
表4 score值表
[0096][0097]
综上所述,本发明针对设备剩余使用寿命的预测问题,提出了一种基于数据预处理和深度学习的设备剩余使用寿命预测方法,由于传感器直接得到的设备历史运行数据具有数据缺失、存在特征冗余等问题,故本发明将在建立深度学习模型之前,首先采用可能值插补的方法对设备历史运行数据填充缺失值,并应用主成分分析法对数据特征进行降维;经预处理后的数据只能反应其在时域上的变化,为了使其反应出设备更多的特征,以使得深度学习模型预测结果更加准确,本发明将对预处理后的数据采用小波变换的方式进行特征转换,将数据从时域转化到时频域,得到设备历史运行的时频数据。针对很多深度学习方法未考虑数据中不含设备剩余使用寿命的问题,本发明进一步设计了对时频数据贴标签的方式。在此基础上利用卷积神经网络的基本组件构建了一种新的剩余使用寿命预测模型,可以客观准确地预测被监测设备的剩余使用寿命,为指导后续的设备故障管理和维护工作提供依据。
[0098]
上述实施例只为说明本发明的技术构思及特点,其目的在于让本领域普通技术人员能够了解本发明的内容并加以实施,并不能以此限制本发明的保护范围,凡根据本发明
精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1