1.本发明涉及一种矿山经济评价原材料价格预测方法,特别涉及一种基于混合学习模型的矿山经济评价原材料价格预测方法。
背景技术:2.关于原材料的价格预测的研究,具有重要学术价值和实际应用价值,其在石油价格预测、铁矿石采购等问题上具有广泛的实际背景。矿石是冶炼工业的重要原料,也是各种金属原料市场和产品市场的风向标,更是具有商品属性和金融属性的原材料。大量事实或实验分析结果表明,科学地预测矿石价趋势有助于冶炼生产企业在恰当的时间以恰当的价格做出最合理的采购。因此,关于矿石的价格预测的研究是一个值得关注的重要研究课题。目前,关于原材料的价格预测模型的研究已经引起学术界和企业界的关注,并取得了一些研究成果,然而这些研究成果尚未形成系统的体系,缺乏高精度原材料价格预测模型。因此对矿石的价格预测进行系统研究,并构建出具有高精度且适用性广的价格预测模型,是当前需要解决的技术问题。
技术实现要素:3.本发明为解决公知技术中存在的技术问题而提供一种基于混合学习模型的矿山经济评价原材料价格预测方法。
4.本发明为解决公知技术中存在的技术问题所采取的技术方案是:一种基于混合学习模型的矿山经济评价原材料价格预测方法,基于变分模态分解模型及神经网络模型建立矿山经济评价原材料价格预测模型;采用变分模态分解模型将历史原材料价格时序数据分解为若干个imf历史分量;将imf历史分量作为训练样本对神经网络模型进行训练;采用变分模态分解模型将当前原材料价格时序数据分解为若干个imf当前分量;将imf 当前分量输入至训练完成的神经网络模型,由神经网络模型得到对应各imf当前分量的未来价格预测结果,将各imf当前分量的未来价格预测结果求和,得到最终原材料未来价格预测结果。
5.进一步地,采用变分模态分解模型将历史原材料价格时序数据分解为k个本征模态函数,这些本征模态函数分别显示原材料价格时序数据的不同频率及与频率对应的时间段的特征;变分模态分解模型中的k的取值为使分量的中心频率相对接近的值。
6.进一步地,k值从3依次增加到8。
7.进一步地,当分量的中心频率接近个数≥2个时,k值取上一次确定的k值。
8.进一步地,变分模态分解模型中的带宽限制取值,为使迭代搜寻变分模态分解模型最优解时间最短的值。
9.进一步地,带宽限制取值从300逐步到1500。
10.进一步地,变分模态分解模型中,参数噪声容限取值0,直流分量取值0,初始化中心频率取值1,判别精度取值1
×
10-7
。
11.进一步地,采用变分模态分解模型将原材料价格时序数据分解为k个本征模态函
数的方法包括如下步骤:
12.s1:设uk是原始信号f的第k个模态序列,设uk(t)是原始信号f(t)的第k个模态函数,δ(t)是狄拉克分布函数;通过希尔伯特变换计算uk(t),则uk(t)的单边频谱表示为:
[0013][0014]
s2:在模式的分辨信号中添加一个预估的中心频率,该模式的频率调制到相应的基带:
[0015][0016]
s3:计算模态函数uk(t)的带宽,约束优化问题表示为:
[0017][0018]
其中公式(3)的约束为:
[0019][0020]
s4:使用拉格朗日函数λ(t)和二次惩罚因子α求解约束问题的最优解,将约束优化问题转化为无约束优化问题;
[0021][0022]
使用乘法算子交替方向法,在两个方向上交替更新λ
n+1
直到满足以下迭代条件:
[0023][0024]
其中ε>0,λ
n+1
表示为:
[0025][0026][0027][0028]
式中:
[0029]
τ是更新的噪声参数;
[0030]
n为执行周期;
[0031]
i为求和的数列的序号;
[0032]
k为vmd分解所得的模态序列的序号;
[0033]
ω为vmd分解所得模态序列的中心频率;
[0034]
uk为vmd分解所得的第k个模态序列;
[0035]
ωk为第k个模态序列的中心频率;
[0036]
λ为拉格朗日函数;
[0037]
ε为判别精度;
[0038]
λ(t)为变量t的拉格朗日函数;
[0039]
为第n+1个执行周期的第k个模态序列;
[0040]
为第n+1个执行周期的第k个模态序列的中心频率;
[0041]
λ
n+1
为第n+1个执行周期的拉格朗日函数;
[0042]
为第n+1个执行周期的第k个模态序列的预估值;
[0043]
为第n个执行周期的第k个模态序列的预估值;
[0044]
为第n个执行周期的中心频率ω的拉格朗日函数的预估值;
[0045]
为第n+1个执行周期的中心频率ω的拉格朗日函数的预估值;
[0046]
为中心频率为ω的原始序列函数的预估值;
[0047]
为中心频率为ω的第n个执行周期的第k个模态序列的预估值;
[0048]
为中心频率为ω的第n+1个执行周期的第k个模态序列的预估值;
[0049]
为第n个执行周期的第k个模态序列的中心频率;
[0050]
为第n+1个执行周期的第k个模态序列的中心频率。
[0051]
进一步地,神经网络模型基于长短期记忆神经网络建立。
[0052]
进一步地,通过实验评估及验证矿山经济评价原材料价格预测模型的预测效果。
[0053]
本发明具有的优点和积极效果是:本发明可以对不平稳、波动大、变化快的原材料价格进行准确及快速的预测。工程实践中,可以使用本发明对原材料价格进行预测,为矿山经济评价工作提供数据支撑。
附图说明
[0054]
图1是本发明一种时序数据分解方法变分模态分解的流程图;
[0055]
图2是本发明一种长短期记忆网络结构图;
[0056]
图3是本发明一种基于变分模态分解的长短期预测网络框架示意图;
[0057]
图中:
[0058]
k为本征模态函数个数。
[0059]
k为vmd分解所得的模态序列的序号;
[0060]
n为执行周期。
[0061]
ω为vmd分解所得模态序列的中心频率。
[0062]
uk为vmd分解所得的第k个模态序列。
[0063]
ωk为第k个模态序列的中心频率。
[0064]
λ为拉格朗日函数。
[0065]
为第1个执行周期的第k个模态序列的预估值。
[0066]
为第1个执行周期的拉格朗日函数的预估值。
[0067]
为第1个执行周期的第k个模态序列的中心频率。
[0068]
σ为sigmoid函数。
[0069]
x
t
为历史数据。
[0070]
x
′
t
为历史数据x
t
与第t个神经元的输出数据h
t
与x
t
矩阵连接后的新矩阵。
[0071]ft1
为x
′
t
经过sigmoid函数处理后所得的结果。
[0072]ft2
为i
t
与c
′
t
相乘所得结果。
[0073]it
为x
′
t
经过sigmoid函数处理后所得的结果,决定x
′
t
中的有效信息。
[0074]
x
t
为第t个神经元的输入数据。
[0075]c′
t
为x
′
t
经过tanh函数处理后所得的结果。
[0076]ct
第t个神经元的历史信息。
[0077]ct-1
为第t-1个神经元的历史信息。
[0078]ht
为第t个神经元的输出数据。
[0079]ht-1
为第t-1个神经元的输出数据。
具体实施方式
[0080]
为能进一步了解本发明的发明内容、特点及功效,兹列举以下实施例,并配合附图详细说明如下:
[0081]
本技术中的如下英文短语、单词及缩写的中文释义如下:
[0082]
vmd:变分模态分解。
[0083]
imf:本征模态函数。
[0084]
lstm:长短期记忆网络模型。
[0085]
output:输出。
[0086]
sigmoid:sigmoid函数。
[0087]
tanh:双曲正切函数。
[0088]
ar:自回归模型。
[0089]
arima:差分整合移动平均自回归模型。
[0090]
svr:支持向量回归模型。
[0091]
linear:线性核函数。
[0092]
polynomial:多项式核函数。
[0093]
gru:门控循环单元网络模型。
[0094]
cnn-lstm:卷积神经网络-长短期记忆网络模型。
[0095]
emd-lstm:基于经验模态分解的长短期记忆网络模型。
[0096]
vmd-lstm:基于变分模态分解的长短期记忆网络模型。
[0097]
rmse:均方根误差。
[0098]
mae:平均绝对误差。
[0099]
mape:平均绝对百分比误差。
[0100]
pccs:皮尔逊相关系数。
[0101]
请参见图1至图3,一种基于混合学习模型的矿山经济评价原材料价格预测方法,基于变分模态分解模型及神经网络模型建立矿山经济评价原材料价格预测模型;采用变分模态分解模型将历史原材料价格时序数据分解为若干个imf历史分量;将imf历史分量作为训练样本对神经网络模型进行训练;采用变分模态分解模型将当前原材料价格时序数据分解为若干个imf当前分量;将imf当前分量输入至训练完成的神经网络模型,由神经网络模型得到对应各imf当前分量的未来价格预测结果,将各imf当前分量的未来价格预测结果求和,得到最终原材料未来价格预测结果。
[0102]
优选地,采用变分模态分解模型可将历史原材料价格时序数据分解为k个本征模态函数,这些本征模态函数可分别显示原材料价格时序数据的不同频率及与频率对应的时间段的特征;变分模态分解模型中的k的取值可为使分量的中心频率相对接近的值。
[0103]
优选地,k值可从3依次增加到8。
[0104]
优选地,当分量的中心频率≥2个且接近时,k值可取上一次确定的k值。
[0105]
优选地,变分模态分解模型中的带宽限制取值,可为使迭代搜寻变分模态分解模型最优解时间最短的值。
[0106]
优选地,带宽限制取值可从300逐步到1500。
[0107]
优选地,变分模态分解模型中,参数噪声容限可取值0,直流分量可取值0,初始化中心频率可取值1,判别精度可取值1
×
10-7
。
[0108]
优选地,采用变分模态分解模型将原材料价格时序数据分解为k个本征模态函数的方法可包括如下步骤:
[0109]
s1:设uk是原始信号f的第k个模态序列,设uk(t)是原始信号f(t)的第k个模态函数,δ(t)是狄拉克分布函数;通过希尔伯特变换计算uk(t),则uk(t)的单边频谱表示为:
[0110][0111]
s2:在模式的分辨信号中添加一个预估的中心频率,该模式的频率调制到相应的基带:
[0112][0113]
s3:计算模态函数uk(t)的带宽,约束优化问题可表示为:
[0114][0115]
其中公式(3)的约束为:
[0116][0117]
s4:使用拉格朗日函数λ(t)和二次惩罚因子α求解约束问题的最优解,将约束优化问题转化为无约束优化问题;
[0118][0119]
使用乘法算子交替方向法,在两个方向上交替更新直到满足以下迭代条件:
[0120][0121]
其中ε>0,λ
n+1
表示为:
[0122][0123][0124][0125]
式中:
[0126]
τ是更新的噪声参数;
[0127]
n为执行周期;
[0128]
i为求和的数列的序号;
[0129]
k为vmd分解所得的模态序列的序号;
[0130]
ω为vmd分解所得模态序列的中心频率;
[0131]
uk为vmd分解所得的第k个模态序列;
[0132]
ωk为第k个模态序列的中心频率;
[0133]
λ为拉格朗日函数;
[0134]
ε为判别精度;
[0135]
λ(t)为变量t的拉格朗日函数;
[0136]
为第n+1个执行周期的第k个模态序列;
[0137]
为第n+1个执行周期的第k个模态序列的中心频率;
[0138]
λ
n+1
为第n+1个执行周期的拉格朗日函数;
[0139]
为第n+1个执行周期的第k个模态序列的预估值;
[0140]
为第n个执行周期的第k个模态序列的预估值;
[0141]
为第n个执行周期的中心频率ω的拉格朗日函数的预估值;
[0142]
为第n+1个执行周期的中心频率ω的拉格朗日函数的预估值;
[0143]
为中心频率为ω的原始序列函数的预估值;
[0144]
为中心频率为ω的第n个执行周期的第k个模态序列的预估值;
[0145]
为中心频率为ω的第n+1个执行周期的第k个模态序列的预估值;
[0146]
为第n个执行周期的第k个模态序列的中心频率;
[0147]
为第n+1个执行周期的第k个模态序列的中心频率。
[0148]
优选地,神经网络模型可基于长短期记忆神经网络建立。
[0149]
优选地,可通过实验评估及验证矿山经济评价原材料价格预测模型的预测效果。
[0150]
下面以本发明的一个优选实施例来进一步说明本发明的工作步骤及工作原理:
[0151]
目前,为了解决emd中存在的模态混合问题,最早由dragomiretskiy konstantin 和zossodominique于2014年提出了变分模态分解(variational modedecomposition,vmd),是一种用于自适应和非递归信号处理的多分辨率技术。它可以将原始信号分解为不同频率下的本征模态函数(imf)uk,这些imf的中心频率分布在具有一定稀疏性的谱域中,且其频带是受限的。每个imfuk会集中在中心频率ωk周围,会随着分解过程而确定。在信号处理中,变分模态分解是一种信号分解估计方法。该方法在获取分解分量的过程中通过迭代搜寻变分模型最优解来确定每个分量的频率中心和带宽,从而能够自适应地实现信号的频域剖分及各分量的有效分离。
[0152]
递归神经网络(rnn)具有一些反馈回路,神经元将上一时刻的输出作为该时刻的输入。在每个时刻,神经元会将该时刻的输入与当前模型的状态相结合作为输出。在时刻t, rnn的主要结构输入不仅来自输入层t
x
,还来自于t-1时刻的隐藏层。由于rnn可以看作是在时间序列中相同神经网络结构的复制,rnn是一个分层展开的结构,其中包含单个人工神经元结构和隐藏层。
[0153]
长短期记忆网络(long-short term memory,lstm)是hochreiter s和schmidhuber 于1997年提出的。lstm网络可以学习长期依赖性信息,解决了rnn对时间序列的长期特征学习能力不足的问题,在时间序列预测包括价格预测领域有着十分广泛的应用。在lstm 模型中,下一时刻的数据每次都由前一个数据和历史数据预测,这些数据由神经元处理。每个神经元都有三个输入参数:历史存储的信息c
t-1
,历史数据x
t
和表示最后一个神经元的预测结果和该神经元的输入参数的h
t-1
。每个神经元含有4个门,分别是遗忘门、输入门、更新门和输出门。
[0154]
如图1所示,为本发明一种变分模态分解方法。
[0155]
如图2所示,将原材料价格时序数据使用vmd进行分解,得到k个本征模态函数(imf),它们分别显示了原始序列在低频到高频、不同时间尺度上的特征。vmd的分解过程包括步骤s1-s4:
[0156]
s1:设uk是原始信号f的第k个模态序列,设uk(t)是原始信号f(t)的第k个模态函
数,δ(t)是狄拉克分布函数;通过希尔伯特变换计算uk(t),则uk(t)的单边频谱表示为:
[0157][0158]
s2:在模式的分辨信号中添加一个预估的中心频率,该模式的频率可以调制到相应的基带:
[0159][0160]
s3:计算模态函数uk(t)的带宽,约束优化问题表示为:
[0161][0162]
其中公式(3)的约束为:
[0163][0164]
s4:使用拉格朗日函数λ(t)和二次惩罚因子α求解约束问题的最优解,将约束优化问题转化为无约束优化问题;
[0165][0166]
使用乘法算子交替方向法,在两个方向上交替更新λ
n+1
直到满足以下迭代条件:
[0167][0168]
其中ε》0,λ
n+1
表示为:
[0169][0170][0171][0172]
其中τ是更新的噪声参数。
[0173]
如图3所示,为长短期记忆神经网络模型的单元结构。
[0174]
将得到的k个imf分别作为输入序列,确定lstm网络模型的超参数,划分训练集与测试集,得到各个分量的预测结果。lstm的状态更新计算过程包括s5-s9:
[0175]
s5:前一个单元处理的数据h
t-1
和当前时间的输入数据x
t
通过矩阵连接,得到x
′
t
:
[0176]
x
′
t
=[h
t-1
,x
t
]
ꢀꢀꢀ
(10)
[0177]
s6:在遗忘门中,lstm会确定在此单元中丢弃哪些信息。经过sigmoid函数处理, x
′
t
可以得到f
t1
。lstm可以通过f
t1
过滤的数据记忆大量的历史数据。
[0178]ft1
=σ(wf·
x
′
t
+bf)
ꢀꢀꢀ
(11);
[0179]
s7:在输入门中,lstm获得了新的数据,经过sigmoid函数处理后,x
′
t
可以得到i
t
。i
t
决定了x
′
t
中的有用数据。此外,x
′
t
被tanh函数处理以计算出c
′
t
。
[0180]it
=σ(wi·
x
′
t
+b
t
)
ꢀꢀꢀ
(12);
[0181]c′
t
=tanh(wc·
x
′
t
+b
t
)
ꢀꢀꢀ
(13);
[0182]ft2
=i
t
×c′
t
ꢀꢀꢀ
(14);
[0183]
s8:在更新门中更新c
t
。将c
t-1
和f
t1
与矩阵相乘,以此获得历史数据。为了在单元中保持更准确的规则以保证预测的准确性,将f
t2
添加到方程中来获得输出c
t
。
[0184]ct
=f
t1
×ct-1
+f
t2
ꢀꢀꢀ
(15);
[0185]
s9:经过sigmoid函数处理,x
′
t
可以得到o
t
。o
t
决定哪一个c
t
需要保留作为结果。此外,c
t
被tanh函数处理后得到h
′
t
,h
′
t
和o
t
相乘得到最终数据h
t
。
[0186]ot
=σ(wo·
x
′
t
+bo)
ꢀꢀꢀ
(16);
[0187]ht
=o
t
×
tan h(c
t
)
ꢀꢀꢀ
(17);
[0188][0189][0190]
上式中:
[0191]
σ为sigmoid函数。
[0192]
wf为遗忘门权重矩阵。
[0193]
wo为输出门权重矩阵。
[0194]
wc为更新门权重矩阵。
[0195]
wi为输入门权重矩阵。
[0196]bf
为遗忘门偏移量。
[0197]bo
为输出门偏移量。
[0198]bt
为输入门偏移量。
[0199]ft1
为x
′
t
经过sigmoid函数处理后所得的结果。
[0200]ft2
为i
t
与c
′
t
相乘所得结果。
[0201]it
为x
′
t
经过sigmoid函数处理后所得的结果,决定x
′
t
中的有效信息。
[0202]
x
t
为历史数据。
[0203]
x
′
t
为历史数据x
t
与第t个神经元的输出数据h
t
与x
t
矩阵连接后的新矩阵。
[0204]c′
t
为x
′
t
经过tanh函数处理后所得的结果。
[0205]ct
第t个神经元的历史信息。
[0206]ct-1
第t-1个神经元的历史信息。
[0207]ot
为输出门的输出。
[0208]ht
为第t个神经元的输出数据。
[0209]ht-1
为第t-1个神经元的输出数据。
[0210]
σ(x)为x的sigmoid函数。
[0211]
tanh(x)为x的双曲正切函数。
[0212]
如表1所示,为本发明的优选实施例与其它预测方法的预测结果指标对比。
[0213]
表1模型对比结果
[0214][0215]
以上所述的实施例仅用于说明本发明的技术思想及特点,其目的在于使本领域内的技术人员能够理解本发明的内容并据以实施,不能仅以本实施例来限定本发明的专利范围,即凡本发明所揭示的精神所作的同等变化或修饰,仍落在本发明的专利范围内。