锂离子电池寿命的早期预测方法

文档序号:30527517发布日期:2022-06-25 08:25阅读:411来源:国知局
锂离子电池寿命的早期预测方法

1.本发明属于新能源汽车动力电池技术领域。


背景技术:

2.为了应对全球范围内能源紧缺与环境污染问题,可再生能源以及电气化交通运输得到了快速发展。其中,锂离子电池因其低成本,长寿命,高能量密度等优点被广泛应用于电动汽车等领域。在重复充放电过程中,电池容量下降导致其性能损失是难以避免的。因此,准确地预测电池寿命对于维护和保障电池的正常使用有着十分重要的作用,及时更换将要达到寿命失效阈值的电池也为电动汽车的安全行驶提供了保障。
3.一般来说,电池寿命的预测往往需要大量的实验数据与实验资源,耗时数月乃至数年的时间才能确定电池的终止寿命(end of life,eol),作为描述电池寿命的最直接指标,电池的容量衰减也是一个长期缓慢的过程。因此,利用短期的电池循环充放电数据,预测电池的寿命得到了许多研究人员的关注,也为电池的生产,使用和优化提供了新的可能,在实际应用中有着重要的意义,如及时更换即将达到eol的电池,保障电动汽车的续驶里程,减少电动汽车使用中存在的“安全焦虑”等。因此,从电池的早期充放电循环数据中提取相应的老化特征,对于电池寿命的预测十分重要。
4.目前电池寿命预测的研究方法主要分为基于机理模型的方法,基于模型的滤波方法与基于数据驱动的方法。基于机理模型的方法一般需要计算量大,且容易受到外界条件的影响,实际应用中不适用;基于模型的滤波方法的准确性通常受到电池模型精度的影响,而建立一个准确的电池模型仍是目前研究的难点问题之一。近年来,随着机器学习技术的快速发展,基于数据驱动的方法因其无需复杂的先验知识,准确性高,泛化性好的优势,在电池寿命预测领域得到了越来越广泛地应用。
5.数据驱动类方法可以预测锂离子电池的寿命,但不同方法有其具体的假设与应用的局限性,如可用数据的数量,环境和操作条件的不确定性,以及电池类型和材料的差异等,都会对电池寿命预测的准确性带来影响。现有的方法主要基于大量的循环老化数据实现电池寿命的预测,但是实际应用中提取大量的循环老化数据是一个成本极大的工作,并且大量的数据会增加数据驱动方法的计算负担。在这种情况下,采用小样本和早期循环老化数据对电池寿命进行预测成为了一个新的可能。在电池容量衰减过程中,前期容量变化平缓,到接近寿命阈值时才会出现大幅衰减。基于电池在早期的循环充放电相关数据,实现寿命预测,可以大大减小数据采集与提取过程的工作量,在实际中也有着良好的应用前景。此外,考虑到电池数据集中存在着长寿命电池样本与短寿命电池样本,二者之间的特征可能存在明显差异,传统的随机抽样构建的训练集与测试集可能会导致训练集与测试集中的样本偏向于其中某一种样本,从而为预测结果带来负面的影响。
6.此外,目前的研究方法大多采用基于单一学习器的机器学习方法,但是单一学习器的预测精度和泛化性往往得不到保证,因此,如何提升单一学习器的预测精度与泛化性以达到符合实际应用的标准是目前亟待解决的问题。


技术实现要素:

7.本发明的目的是从电池容量尚未发生明显下降的早期循环数据中,提取早期老化特征用于电池的寿命预测,以降低数据提取及处理过程工作负担的锂离子电池寿命的早期预测方法。
8.本发明步骤是:s1、锂离子电池早期老化特征提取s2、快速搜索聚类的早期老化特征筛选快速搜索聚类方法过程是:

对于由n个电池和s个特征组成的电池早期老化特征数据集对于由n个电池和s个特征组成的电池早期老化特征数据集n和i分别表示电池和特征的编号,表示第n个电池的第i个特征;x
norm
表示归一化后得到的早期老化特征数据,即其中,x
min
与x
max
分别表示x的最大值与最小值;

特征xi与xj之间的欧几里得距离表示为其中,与分别表示第n个电池的第i个和第j个特征,d
ij
表示特征之间的欧几里得距离;

特征xi的局部密度ρi表示为其中,局部密度ρi表示其他特征与特征xi之间的距离小于截止距离dc的特征总数;

对特征xi的局部密度进行降序排序,并得到相应的排序下标{ρi}=ρ
i1
≥ρ
i2
≥...≥ρ
ij
≥...≥ρ
is
,1≤i≤s,1≤j≤s,控制距离δi为

由控制距离δi与局部密度ρi得到特征xi的决策值γi,即γi=δi*ρiꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中,较大的γi值对应的特征xi被选作聚类中心特征;

当非中心特征xi和xj属于不同的簇时,由ρi和ρj计算簇的边界密度bi,如果bi大于或等于ρi和ρj的平均值的最大值,则将特征xi分配给一个聚类簇c,边界密度bi为其中,i表示属于聚类簇c的第i个特征;s3、锂离子电池早期寿命预测

输入数据集为{tn,yn},tn与yn分别表示第n个电池的筛选特征与寿命的观测值,弱学习器表示为h(t),初始化权值向量设迭代次数为k,当前时刻的权值分布为dk,训练输入数据得到的弱学习器表示为hk(t);

弱学习器hk(t)在训练集上的预测误差即即其中,m表示预测误差的上确界,也就是最大预测误差;

总体预测误差εk表示为

当前预测器的权重系数为其中,

更新训练集的权值分布,更新过程表示为其中,表示一个规范化因子;最后得到强学习器的权重向量w=(w1,w2,...,wk),其中

根据得到的权重构建强学习器,强学习表示为

bp神经网络隐含层的输出表示为h
t
=f1(whx
t
+bh)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)其中,x
t
表示输入的特征数据,h
t
为隐含层输出,wh为隐含层与输入层神经元之间的权重,bh表隐含层的偏置,f1为隐含层激活函数,这里选择为sigmoid函数,即

输出层的激活函数为线性函数,输出层的输出表示为o
t
=f2(w
oht
+bo)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)其中,o
t
表示输出层输出结果,也就是bp神经网络的预测值,wo和bo分别表示输出
层的权重与偏置,f2为purelin激活函数;

每一时刻预测的均方误差作为损失函数,表示为其中,o
t
,y
t
分别为神经网络输出值与实际输出值,n
train
为训练集样本数;权重与偏置参数的更新过程表示为权重与偏置参数的更新过程表示为其中,η表示学习率,与表示损失函数j对于w与b的偏导数。
9.本发明的有益效果:1.考虑到电池循环老化实验周期较长,且获取全寿命周期数据的成本较大,本发明从电池的早期循环老化数据中,提取与电压,电流,充电时间,温度,增量容量曲线,内阻等相关的早期老化特征,用于实现电池寿命的预测,进而对达到失效阈值的电池进行及时更换,保障电池的安全使用;2.考虑到大量的电池早期老化特征中存在的特征冗余问题,采用快速搜索聚类算法对提取的早期老化特征进行聚类与筛选。与传统的聚类算法如k-means相比,快速聚类搜索方法不需要指定聚类簇的数目,计算速度快,进一步提高预测的准确性与效率;3.针对单一机器学习方法准确度低,泛化性差的问题,采用集成学习框架中的adaboost方法,基于预测误差不断修改样本权重,模型会在训练过程中更加侧重于权重高的样本。根据学习误差率计算当前子模型的权重,让精度更高的子学习器占据更高的权重,提高预测精度,并且可以有效减小单个预测方法的过拟合问题。
附图说明
10.图1是快速搜索聚类得到的电池早期老化特征对应的ρ值图;图2快速搜索聚类得到的电池早期老化特征对应的δ值图;图3快速搜索聚类得到的电池早期老化特征对应的γ值图;图4基于快速搜索聚类的电池早期老化特征聚类结果分析图;图5adaboost-bp计算示意图;图6基于集成学习的锂离子电池早期寿命预测整体框图;图7基于adaboost-bp的锂离子电池早期寿命预测结果图;图8本发明提出方法的预测评价指标与其他方法对比示意图。
具体实施方式
11.本发明的步骤是:第一步,锂离子电池早期老化特征提取本发明从电池循环老化数据的前100个循环中提取30个与电压,温度,充电时间,
容量,增量容量曲线相关的早期老化特征。
12.第二步,基于快速搜索聚类的早期老化特征筛选基于电池的早期充放电循环数据,提取电池的老化特征后,采用快速搜索聚类(clustering by fast search,cfs)方法筛选有效的早期老化特征,以减小特征的冗余度。
13.cfs方法的计算过程为首先,对于由n个电池和s个特征组成的电池早期老化特征数据集首先,对于由n个电池和s个特征组成的电池早期老化特征数据集n和i分别表示电池和特征的编号,表示第n个电池的第i个特征。
14.x
norm
表示归一化后得到的早期老化特征数据,即其中,x
min
与x
max
分别表示x的最大值与最小值。
15.其次,特征xi与xj之间的欧几里得距离可以表示为其中,与分别表示第n个电池的第i个和第j个特征。d
ij
表示特征之间的欧几里得距离。d
ij
的值越小,表示特征xi与xj越接近。
16.特征xi的局部密度ρi可以计算为其中,局部密度ρi表示其他特征与特征xi之间的距离小于截止距离dc的特征总数。由于dc设置的过大或过小都会对聚类的效果带来负面影响,这里选取dc为2%,以确保每个特征的邻居点的平均数目为总数据点的1%~2%。
17.最后,对特征xi的局部密度进行降序排序,并得到相应的排序下标{ρi}=ρ
i1
≥ρ
i2
≥...≥ρ
ij
≥...≥ρ
is
,1≤i≤s,1≤j≤s。控制距离δi的计算过程为其中,d
ij
表示欧几里得距离。ρ
ij
=1意味着特征xi对所有特征具有最大的局部密度,ρ
ij
>1表示特征xi和xj在不同的候选簇下具有较高的局部密度。
18.由控制距离δi与局部密度ρi可以得到特征xi的决策值γi,即γi=δi*ρiꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中,较大的γi值对应的特征xi被选作聚类中心特征。
19.由于可以选择任意两个簇之间区域内特征的局部密度作为确定边界密度的参考值,当非中心特征xi和xj属于不同的簇时,由ρi和ρj计算簇的边界密度bi。如果bi大于或等于ρi和ρj的平均值的最大值,则将特征xi分配给一个聚类簇c。边界密度bi为
其中,i表示属于聚类簇c的第i个特征。
20.第三步,基于集成学习的锂离子电池早期寿命预测经过对电池循环充放电过程的电池老化数据进行特征提取与特征筛选,选择每一个聚类中心的特征作为每一类的代表特征,用于电池寿命的早期预测。本发明采用集成学习框架下的boosting方法,通过梯度增强的方式将预测精度较低的弱学习器逐步提升为预测精度较高的强学习器,以处理基于小样本,具有高维度,非线性的电池早期寿命预测问题。
21.adaboost方法的主要思想是通过预测误差不断修改样本权重,权重高低代表了子模型在训练过程中的重要性程度。子学习器在训练过程中更加侧重于权重高的样本,进行“特殊照顾”。根据学习误差率,计算当前子学习器的权重,让精度高的子学习器具有更高的权重,提高预测精度,有效地减小单个预测方法的过拟合问题。具体地预测流程为
22.首先,输入数据集为{tn,yn},tn与yn分别表示第n个电池的筛选特征与寿命的观测值。弱学习器表示为h(t),初始化权值向量设迭代次数为k,当前时刻的权值分布为dk,训练输入数据得到的弱学习器表示为hk(t)。
23.其次,计算弱学习器hk(t)在训练集上的预测误差即即其中,m表示预测误差的上确界,也就是最大预测误差。
24.总体预测误差表示为
25.计算当前预测器的权重系数为其中,
26.更新训练集的权值分布,更新过程表示为其中,表示一个规范化因子。
27.最后,得到强学习器的权重向量w=(w1,w2,...,wk),其中
28.根据得到的权重构建强学习器,强学习可表示为
29.本发明中的弱学习器选择为bp神经网络,其计算简单,通过变量间不断进行双向传递实现对神经元之间权重,偏置等参数的更新,但是其存在着容易陷入局部最优,导致映射关系建立不准确的问题。
30.bp神经网络隐含层的输出表示为h
t
=f1(whx
t
+bh)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)其中,x
t
表示输入的特征数据,h
t
为隐含层输出,wh为隐含层与输入层神经元之间的权重,bh表隐含层的偏置,f1为隐含层激活函数,这里选择为sigmoid函数,即
31.输出层的激活函数为线性函数,输出层的输出表示为o
t
=f2(w
oht
+bo)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)其中,o
t
表示输出层输出结果,也就是bp神经网络的预测值,wo和bo分别表示输出层的权重与偏置,f2为purelin激活函数。
32.bp神经网络的权重与偏置更新过程通过梯度下降法进行更新,确定每一时刻预测的均方误差(mean square error,mse)作为损失函数,可表示为其中,o
t
,y
t
分别为神经网络输出值与实际输出值,n
train
为训练集样本数。
33.权重与偏置参数的更新过程可表示为权重与偏置参数的更新过程可表示为其中,η表示学习率,与表示损失函数j对于w与b的偏导数。
34.为了验证本发明提出的方法的有效性,采用均方根误差(root mean square error,rmse)和平均绝对误差(mean absolute error,mae)来验证本发明所提出方法的预测精度,即测精度,即
其中,与yn分别表示寿命的预测值与实际观测值。
35.以下对本发明进行详细的说明和验证第一步,锂离子电池早期老化特征提取现有的寿命预测方法一般需要大量的长期历史退化数据,这个获取历史数据的过程时间长,成本大,不利于电池的快速开发与验证。利用早期循环老化数据准确预测电池寿命可以有效地加快锂离子电池的开发和优化,对及时更换失效电池,保障电池的安全使用有着重要的意义。
36.本发明中所采用的电池的循环寿命范围为300~2300个循环不等,所有的电池数据在72种不同的充放电工况下测量得到。本发明选取前100次循环的电压,温度等老化数据用于电池的早期寿命预测,总计提取30个与电压,温度,充电时间,内阻,增量容量曲线等多方面因素相关的早期老化特征,分为充电时间相关,温度相关,电压相关,内阻相关,增量容量曲线相关,容量相关等六组。下面将具体介绍每个特征的含义:
37.第一组:与充电时间相关特征,f1~f3f1表示第100个循环与第10个循环的充电时间之差,f2表示在恒流充电阶段第100个循环与第10个循环之间的充电时间差,f3表示第10个循环到第100个循环的平均充电时间。
38.第二组:温度相关特征,f4~f16f4~f6分别表示第100个循环与第10个循环之间的最大温度之差,平均温度之差与最小温度之差。f7~f12是从随循环次数变化的t(v)曲线中提取的,分别表示δt
100-10
(v)=t
100
(v)-t
10
(v)曲线的最小值,均值,最大值,方差,峰度以及坡度。f13表示第100个循环与第10个循环之间充放电过程温度峰值之差。f14与f15分别表示第100个循环与第10个循环在充电过程与放电过程达到温度峰值的时间之差。f16表示第100个循环和第10个循环之间温度曲线所围成面积之差。
39.第三组:电压相关特征,f17~f22f17~f22是从随循环次数变化的q(v)曲线中提取的,分别表示δq
100-10
(v)=q
100
(v)-q
10
(v)曲线的最小值,均值,最大值,方差,峰度以及坡度。
40.第四组:内阻相关特征,f23~f25f23表示从第10个循环到第100个循环的最小内阻,f24表示第100个循环与第10个循环之间的内阻差,f25表示第10个循环到第100个循环的内阻平均值。
41.第五组:增量容量曲线相关特征,f26~f28f26表示第100个循环与第10个循环的增量容量曲线峰值之差,f27表示第100个循环与第10个之间的增量容量曲线峰值对应的电压值之差,f28表示第100个循环与第10个循环之间增量容量曲线围成的面积之差。
42.第六组:容量相关特征,f29~f30f29与f30分别表示第10个循环到第100个循环的容量的线性拟合曲线的斜率与截距。
43.第二步,基于快速搜索聚类方法的早期老化特征筛选本发明从电池老化数据集的早期老化数据中提取了30个特征用于电池的寿命预测过程。但是,考虑到电池老化的时间较长,可用于机器训练的退化电池样本数量相对较
少,而输入特征相对较大,这使得预测相当具有挑战性。为了避免特征冗余,提高预测精度和效率,采用快速搜索聚类(clustering by fast search,cfs)对有效特征进行过滤和选择。
44.与传统的聚类分析算法相比,cfs只使用数据点之间的距离和密度来寻找聚类和聚类中心。它可以检测具有非球形结构的数据,自动确定正确的簇数,并且计算简单,而传统聚类算法比如k-means很难通过经验表示敏感性特征的聚类簇数量。例如,当电池运行条件发生变化时,所采集与温度和电压等数据相关的特征也会发生变化。cfs可以通过每对点之间的距离,来自动找到潜在簇的可用数量及其簇中心,避免了建立目标函数并执行迭代计算的需要,大大简化了计算过程。cfs将相同类型的电池特征聚合成一个簇,然后将簇中心表示为所选特征,从而有效地消除了冗余特征。具体的计算过程为
45.首先,对于由n个电池和s个特征组成的电池早期老化特征数据集首先,对于由n个电池和s个特征组成的电池早期老化特征数据集n和i分别表示电池和特征的编号,表示第n个电池的第i个特征。x
norm
表示归一化后得到的早期老化特征数据,即其中,x
min
与x
max
分别表示x的最大值与最小值。
46.其次,特征xi与xj之间的欧几里得距离可以表示为其中,与分别表示第n个电池的第i个和第j个特征;d
ij
表示特征之间的欧几里得距离。d
ij
值越小,表示特征xi与xj越接近。
47.特征xi的局部密度ρi为其中,局部密度ρi表示其他特征与特征xi之间的距离小于截止距离dc的特征总数。如果截止距离dc较大,局部密度ρi也会较大,会导致区分度较差。如果dc较小,会导致一个聚类簇被分成多个,影响聚类效果。因此这里选取dc为2%,以确保每个特征的邻居点的平均数目为总数据点的1%~2%。
48.当特征xi与这些特征是不同聚类簇的聚类中心候选特征时,特征xi与最大局部密度之间的控制距离δi是特征xi与其他有着最大局部密度的特征间最大的欧几里得距离。因此,对特征xi的局部密度进行降序排序,并得到相应的排序下标{ρi}=ρ
i1
≥ρ
i2
≥...≥ρ
ij
≥...≥ρ
is
,1≤i≤s,1≤j≤s。
49.控制距离δi为其中,ρ
ij
=1表示特征xi对所有特征具有最大的局部密度,但当特征xi和xj作为集
群中心候选对象时,特征xi与xj之间的欧几里得距离最大。因此,特征xi的ρi和δi值高于邻近特征的值,这是由与同一候选聚类的截止距离决定的。若ρ
ij
>1,表明特征xi和xj在不同的候选簇下具有更高的局部密度。因为特征xi的局部密度根据局部密度按降序排列,所以特征xi和xj之间的欧几里得距离在任意两个候选簇上都是最小的。
50.特征xi会产生一个较大的决策值γi,由控制距离δi与局部密度ρi可以得到特征xi的决策值γi,即γi=δi*ρiꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中,较大的γi值对应的特征xi被选作聚类中心特征。
51.由于可以选择任意两个簇之间区域内特征的局部密度作为确定边界密度的参考值,当非中心特征xi和xj属于不同的簇时,由ρi和ρj计算簇的边界密度bi。如果bi大于或等于ρi和ρj的平均值的最大值,则将特征xi分配给一个聚类簇c。边界密度bi为其中,i表示属于聚类簇c的第i个特征。
52.基于cfs的早期特征的筛选如图1~图4所示,图1~图3分别表示每个特征对应的局部密度ρ,控制距离δ与决策值γ。其中图3是经过排序后得到的决策值示意图,用来进一步确定聚类中心,从图3中可以看出f8,f22,f23,f18的γ值与其他特征相比有着明显的跳变现象,所以确定f8,f22,f23,f18为四个聚类簇的中心特征。图4表示的是所有特征的二维聚类结果,具体的特征聚类情况如表1所示。
53.表1所有聚类簇的中心点和每个聚类簇中的特征样本
54.第三步,基于集成学习的锂离子电池早期寿命预测经过特征提取与特征筛选,选择每一个聚类中心的特征作为每一类的代表特征,用于电池寿命的早期预测。考虑到原始数据集中存在长寿命电池样本与短寿命电池样本,采用简单的随机抽样可能会导致训练集与测试集偏向于某一种电池样本从而导致预测误差较大。因此,这里采用分层随机抽样,选取60%的训练集,40%的测试集,并保证训练集与测试集中的长寿命样本与短寿命样本符合相同的比例。将训练集作为集成学习模型的输入对模型进行训练,再利用测试集数据得到相应的预测结果来验证方法的有效性。
55.本次用于电池寿命预测的集成学习框架为boosting方法,其主要通过梯度增强的方式将预测精度较低的弱学习器逐步提升为预测精度较高的强学习器。在boosting方法中,adaboost在处理小样本,高维度,非线性问题中有着很出色的效果,得到了广泛的应用。
56.adaboost的主要思想是通过预测误差不断修改样本权重,权重高低代表着其子模型在训练过程中的重要程度,子模型会在训练过程中更加侧重于权重高的样本,进行“特殊照顾”。根据学习误差率,计算当前子模型的权重,让精度更高的子学习器具有更高的权重,提高预测精度,并且可以有效减小单个预测方法的过拟合问题。adaboost算法的流程如图5所示。预测流程如下
57.首先,输入数据集为{tn,yn},tn与yn分别表示第n个电池的筛选特征与寿命的观测值。弱学习器表示为h(t),初始化权值向量设迭代次数为k,当前时刻的权值分布为dk,训练输入数据得到的弱学习器表示为hk(t)。
58.其次,计算弱学习器hk(t)在训练集上的预测误差即即其中,m表示预测误差的上确界,也就是最大预测误差。
59.总体预测误差表示为
60.计算当前预测器的权重系数,即其中,
61.更新训练集的权值分布,更新过程表示为其中,表示为一个规范化因子。
62.完成迭代过程后,得到强学习器的权重w=(w1,w2,...,wk),其中
63.根据得到的权重构建强学习器,强学习器可表示为
64.本发明中的弱学习器为bp神经网络,其计算简单,通过信息间不断进行双向传递,更新神经元之间的权重和偏置等参数,但是其存在着容易陷入局部最优,导致映射关系建立不准确的问题。
65.bp神经网络隐含层的输出表示为ht
=f1(whx
t
+bh)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)其中,h
t
为隐含层输出,wh为隐含层与输入层神经元之间的权重,bh表隐含层的偏置,f为隐含层激活函数,这里选择为sigmoid函数,即
66.输出层的激活函数为线性函数,输出层的输出可表示为o
t
=f2(w
oht
+bo)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)其中,o
t
表示输出层输出结果,也就是bp神经网络的预测值,wo,bo分别表示输出层的权重与偏置,f2为purelin激活函数。
67.bp神经网络的权重与偏置更新过程通过梯度下降法进行更新。确定每一时刻预测的均方误差(mean square error,mse)作为损失函数,即其中,o
t
,y
t
分别为神经网络输出值与实际输出值,n
train
为训练集样本数。
68.权重与偏置参数的更新过程表示为权重与偏置参数的更新过程表示为其中,η表示学习率,与表示损失函数j对于w与b的偏导数。
69.本发明中所提出的基于集成学习的锂离子电池早期寿命预测的整体框图如图6所示。
70.为了验证本发明提出的方法的有效性,采用均方根误差(root mean square error,rmse),平均绝对误差(mean absolute error,mae)来验证本发明所提出的方法的预测精度,具体计算过程为测精度,具体计算过程为其中,与yn分别表示寿命的预测值与实际观测值。
71.验证例:为了进一步验证本发明的有效性,采用一个具体实例对本发明提出的方法进行验证。本发明基于麻省理工学院与斯坦福大学合作实验室的一组公开的锂离子电池数据集,对本发明提出的方法进行验证。
72.首先,从电池的早期循环老化数据中提取相应的早期老化特征,从前100个循环中提取30个与电压,温度,充电时间,内阻,增量容量曲线等相关的特征。
72.然后,为了消除大量早期老化特征中存在的冗余性,提高预测的精确度与效率,采用快速聚类搜索算法对早期老化特征进行聚类分析,选取每一个聚类簇的聚类中心作为该
聚类簇的候选特征用于后续的寿命预测过程。
73.其次,将提取的候选特征分为60%的训练集与40%的测试集,同时考虑到样本中存在的长寿命样本与短寿命样本,采用随机分层抽样,保证训练集与测试集中包括相同比例的长寿命样本与短寿命样本,减小因样本数据不均衡而带来的预测误差。将训练集数据作为提出的集成学习方法adaboost-bp的输入进行训练,得到相应的弱学习器的权重,将测试数据输入已训练好的模型得到最终的预测结果。预测结果及误差如图7所示。从图7中可以看出预测寿命与实际寿命比较接近,从误差分布中可以看出,对大多数电池样本而言,预测误差均保持在-100~100个循环误差之间,说明本发明提出的方法在仅利用前100个循环的早期老化特征对于电池寿命的预测结果可以达到满意的效果。
74.为了进一步说明本发明提出方法的有效性,将本发明提出的方法与其他传统机器学习方法进行对比,均在10次随机筛选训练集与测试集进行预测得到的平均的rmse与mae的对比图如图8所示。本发明提出方法在10次随机筛选得到的不同的训练集与测试集下得到的预测寿命的rmse为82.84个循环,mae为62.34个循环,相比于一些经典的单一机器学习方法,比如bp神经网络,长短时记忆神经网络(long short-term memory,lstm),支持向量回归(support vector regression,svr)等相比,预测的rmse减小了71.9%,59.1%和70.1%,mae分别减小了69.6%,44.3%与71.5%。由此可见本发明在利用小样本早期数据实现对电池寿命的预测准确性与传统单一机器学习算法相比有着显著提升。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1