本发明是一种针对多变环境影响下的加速退化数据,基于集成学习思想、贝叶斯方法和机器学习方法的寿命预测方法,属于寿命预测技术领域。
背景技术:
对于产品而言,对其开展寿命预测是一项十分必要的工作,它能够指导维修策略,从而降低维修成本和系统风险。目前,对于高可靠性产品来说,其寿命预测的开展主要通过分析加速退化数据来实现。然而,现有的研究中,在考虑加速退化数据的同时,往往忽略可能影响产品退化的多变环境,忽略这些影响可能会导致预测结果的不准确。针对这一问题,当前应用比较广泛的是采用多种数学变换的方式将环境因素作为因子,但在实际应用中,很难确定一个参数来精准的表示多变应力对退化的影响。因此,需要进一步提出更为适宜的方法来表征多变环境应力和寿命之间的关系。
在对于多种应力影响的寿命预测模型建模方面,贝叶斯方法和机器学习方法是目前较为有效的两类方法,其中贝叶斯方法可以通过先验信息不断更新迭代得到精确的评估值,且可以结合马尔科夫蒙特卡洛(mcmc)方法实现参数快速求解,该方法在描述不确定性和解决小样本问题上存在很大的优势,但也会存在模型选择困难问题和先验信息难获取问题;机器学习方法可以单纯通过分析数据间规律而建立预测模型,但对于数据量有一定的要求,且容易出现过拟合现象。同时,两类方法都会存在随着数据波动增大预测稳定性降低的问题。从以上分析可知,两类方法的特点在使用中可以实现优势互补,若可以将两种方法有效结合并解决二者存在的问题,则可以建立较为可行的预测模型。在模型融合和解决预测稳定性方面,集成学习方法,尤其是bagging方法,可以将多个具有相同或不同能力的模型进行动态有机融合,在实现精度提升的同时,大幅度提高了算法的泛化能力,为解决上述问题提供了有效的技术途径。
因此,面向需解决的具体问题,本专利提出针对多变环境条件影响的加速退化数据,基于集成学习算法对贝叶斯网络、两种典型机器学习算法(支持向量机和bp神经网络)有效集成的寿命预测方法,该方法具有一定独创性。
技术实现要素:
本发明的目的是为了解决上述问题,提出一种能够有效的利用多变环境影响的加速退化数据对产品的寿命进行预测的方法,并获得准确有效且相对稳定的预测结果。
本发明的具体步骤为:
步骤一、数据集划分及数据集重采样;
步骤二、建立基于贝叶斯方法的寿命预测子模型;
步骤三、建立基于支持向量机的寿命预测子模型;
步骤四、建立基于bp神经网络的寿命预测子模型;
步骤五、建立集成寿命预测模型。
本发明的优点在于:
(1)本发明建立了多变环境应力和加速应力与产品寿命的关系模型,可准确描述多变环境对产品寿命的影响;
(2)本发明利用集成学习方法融合了贝叶斯方法和机器学习两类方法,综合了两类方法的优点,提高了模型泛化能力,并获得更为精确的预测结果。
附图说明
图1是本发明的流程图;
图2是支持向量机子模型训练效果图;
图3是bp神经网络预测子模型训练效果图;;
图4是集成预测模型预测效果图;
图5是各模型误差对比图。
具体实施方式
下面将结合附图和实施例对本发明作进一步的详细说明。
方法的流程图如图1所示,包括以下几个步骤:
步骤一、数据集重采样及数据集划分
本专利应用集成学习算法集成贝叶斯方法和机器学习方法,根据其算法要求,数据集需要进行重采样;
假设采集到同时包含加速退化数据和多变环境数据的数据{si,di,δyi,ti},i=1,2,...,n,其中si=[si1,si2,…sim]为应力组合,m为应力的个数;di为退化量;δyai为退化增量;ti为时间;n为数据的数量;
首先,采用bagging算法对同时包含进行n中取n的有放回重采样,得到三组采样数据集sji(j=a,b,c),分别用于贝叶斯方法、支持向量机方法和bp神经网络方法寿命预测子模型构建;
然后,根据基于支持向量机方法和bp神经网络方法构建预测子模型的需要,数据集需要分成两部分,训练集和测试集。训练集是用于拟合模型参数的数据集。测试集是独立于训练集的数据集,但其遵循与训练集相同的概率分布,并用于评估训练模型的性能。因此,将数据集sb和sc按照75/25的比例划分为训练集和测试集。
步骤二、建立基于贝叶斯方法的寿命预测子模型
本专利应用wiener过程、gamma过程等随机过程模型来构建性能退化模型,并采用广义线性模型作为加速模型建立应力与寿命的关系;
将采样数据集sa中的包含加速退化数据和多变环境数据的应力组合sai、退化增量δyai和时间间隔δt作为输入,带入上述模型中。然后,利用马尔科夫蒙特卡洛方法(mcmc)对模型参数进行求解,并将求解所得模型代入性能退化模型中,即得到基于贝叶斯方法的寿命预测子模型fbayesian。
步骤三、建立基于支持向量机的寿命预测子模型
首先,对采样数据集sb中数据进行归一化处理。然后将数据集中的应力组合sbi及时间t作为输入,将退化数据dbi作为模型的输出,应用归一化处理后训练集进行模型训练;
为得到良好的训练效果,对支持向量机中参数进行初始化,并选择核函数(如rbf核函数等),同时利用网格搜索算法/粒子群优化算法等,对核函数参数进行优化。当模型中预测精度达到一定标准后,即得到基于支持向量机的寿命预测子模型fsvm。
步骤四、建立基于bp神经网络的寿命预测子模型
根据采样数据集sc中的应力组合sci及时间t作为输入,将退化数据dci作为网络的输出,通过分析输入输出数据结构确定输入层、输出层和隐层数目从而建立神经网络;
然后,将训练集和测试集归一化后输入到网络中进行训练,当训练误差满足要求后,即得到基于bp神经网络的寿命预测子模型fbp。
步骤五、建立集成寿命预测模型
由步骤二~步骤四,可以得到三个寿命预测子模型,进而可以根据集成学习bagging方法对子模型进行融合,建立集成寿命预测模型;
由于svm和bp神经网络方法均为黑盒算法,无法得知具体的模型关系,因此,集成预测模型采用数据方式进行集成,对子模型输出计算平均值,公式如下:
式中,fbayesian,fsvm和fbp分别代表三个寿命预测子模型,fensemble则为以数据形式表示的集成寿命预测模型。
实施例:
(1)仿真试验概述
假设某一产品受三种应力影响,且每种应力均为多变应力(变化范围如表1所示)。若产品的性能退化过程可用线性函数描述,假定其退化规律服从维纳过程,加速模型选取广义线性模型,即:
其中
根据表1,2中参数及退化增量的分布,设定采样时间间隔δt为5,采样点数目为1000,性能初始值y0为100,利用蒙特卡洛仿真可以获得一系列退化增量,然后用初值减去增量即可得到加速退化仿真数据。
表1应力变化范围
表2仿真模型参数取值
(2)集成预测模型构建
步骤一、数据集划分及数据集重采样;
为验证最终模型有效性,从原始仿真的1000个数据中,取后250个数据作为验证数据,不参与模型的训练,前750个数据则作为训练集。然后,利用bagging方法将训练集进行750取750的有放回重采样,得到三组采样集。将后两组仿真数据按照75/25的比例划分为采样训练集和采样测试集。
步骤二、建立基于贝叶斯方法的寿命预测子模型;
选择维纳过程来描述退化模型,并选择广义线性模型为加速模型。根据数据建立线性回归方程,采用多项式回归方法进行拟合,得到未知参数b0,b1,b2,b3的初始值(如表3所示)。接下来假设四个参数先验分布均服从均值为此初始值,方差为10^3的正态分布;
根据维纳过程性质及共轭先验分布的性质可知,方差的倒数与时间间隔乘积1/σ2·δt服从伽玛分布且其组成的两个分布参数也服从伽马分布,即:
1/σ2·δt~gamma(c,d)
由于先验信息未知,设定c,d初始值如表3所示,其数值在进行mcmc计算时会自动变化并逐渐接近真实值;
表3模型参数先验分布
其后验分布可表示为:
进而针对后验分布模型采用mcmc方法进行抽样仿真,对其进行200000次仿真抽样迭代运算,当所构建的马尔科夫过程平稳时,即得到所求的解。不同方差真值下的采样集参数评估结果如表4所示:
表4模型参数评估结果
最后,利用表4中参数可得到多变应力与退化数据的关系模型,即贝叶斯预测子模型。
步骤三、建立基于支持向量机的寿命预测子模型;
本专利借助matlab工具完成svm预测子模型构建,具体过程如下:
首先,对采样训练集和测试集数据进行归一化处理,并以三个多变应力为模型输入,加速退化数据为输出;
然后,核函数选择rbf核函数,并采用粒子群算法(pso)对其参数进行优化,对模型参数c和g的取值范围均设为[0,100],进化代数为100,种群数量为20,交叉验证折数为5;
最后,根据粒子群算法求得的最优参数,建立svm模型并进行训练(训练集和测试集效果如图2所示),得到svm训练子模型。
步骤四、建立基于bp神经网络的寿命预测子模型;
本专利借助matlab工具完成bp预测子模型构建,采取4-15-1的网络结构方式,将3种应力和1组时间数据作为输入节点数据,将1组累计退化数据作为输出节点数据,对数据进行归一化处理后输入到网络中;
然后,采用粒子群算法(pso)对bp神经网络参数进行优化,对模型参数c和g的取值范围均设为[0,100],进化代数为100,种群数量为20,设置最大迭代次数为1000;学习速率为0.05;学习目标为0.00001;
最后,根据粒子群算法求得的最优参数,对网络进行训练,在训练过程中,调整隐层神经元数,确定最佳神经元数。当网络参数迭代达到目标值或性能达到要求时,可得到最优预测网络,即bp神经网络预测子模型,模型在训练集和测试集效果如图3所示。
步骤五、建立集成寿命预测模型。
将划分的250个测试数据分别输入到贝叶斯预测子模型、svm预测子模型和bp神经网络预测子模型中,再根据公式(1)计算得到集成学习预测模型。其预测结果与原始值对比如图4所示。
(3)预测结果评估与对比
为验证应用集成预测模型进行预测的具体效果,本专利将未进行重采样的原始仿真数据训练集分别利用贝叶斯方法、svm和bp神经网络方法进行预测,并采用均方根误差(rmse)和平均绝对误差(mae)来表征预测结果的性能,分别计算了前50、100、150、200和250个数据点的rmse和mae值,将其结果与集成模型预测结果进行对比,如图5所示。
由图中分析可知,集成预测模型在各个数据点下均较单独应用其子模型包含的三个方法精度高,可见,通过对三种方法进行集成,在一定程度上提高了模型的预测精度。该预测方法可以为处于多变环境影响下的产品的寿命预测提供较为准确的预测结果,从而更精准的指导维修管理。