一种基于SARIMA-LSSVM的钢材产品需求量预测方法与流程

文档序号:36480671发布日期:2023-12-25 10:36阅读:33来源:国知局
一种基于的制作方法

本发明属于时间序列预测分析方法,特别涉及一种基于sarima-lssvm的钢材产品需求量预测方法。


背景技术:

1、在中国,钢铁企业的生产订单以固定客户的期货订单为主,潜在客户的现货订单为辅。通常,钢铁企业现货订单量(即:钢材产品在现货市场的潜在需求量)占订单总量的5%左右。然而,钢材现货产品的获利水平高于期货产品且完工产品的附加值亦高于半成品。因此,钢铁企业对于完工产品现货的潜在需求量的关注度逐渐升高。在钢铁企业中,精准预测钢材产品的潜在需求量可以为生产和库存计划以及原料采购计划的制定提供重要支持。然而,潜在客户的不确定性以及现货市场中的固有噪声致使钢铁企业难以确定钢材产品的潜在需求量。因此,开发科学的需求预测方法来精准预测钢材产品的潜在需求量对于钢铁企业至关重要。

2、季节性自回归综合移动平均(seasonal autoregressive integrated movingaverage,简称sarima)是预测季节性时间序列的一种常见模型,该模型在短期内具有较高的预测精度。作为一种统计模型,它假设时间序列数据成分中存在线性模式,故而存在对数据中隐藏的非线性模式提取不足的缺陷;sarima模型的参数优化问题本质上是一个多目标问题,然而,现有研究仅将sarima模型精度视为唯一的优化目标,存在单一精度目标难以提高模型泛化能力并无法防止模型过拟合的问题,且现有研究使用所有样本数据训练sarima模型的计算成本较高。


技术实现思路

1、针对现有技术存在的不足,本发明的目的是提供一种基于sarima-lssvm的钢材产品需求量预测方法。

2、发明所采用的技术方案是:一种基于sarima-lssvm的钢材产品需求量预测方法,其技术要点包括以下步骤:

3、步骤1:从数据库中提取钢材产品在现货市场上的日需求量数据,并将其转换成时间序列zt;

4、步骤2:采用基于改进多目标差分进化(multi-objective differentialevolution with improved mutation strategies,简称moide)算法的带有稀疏策略的sarima模型拟合钢材产品需求量数据的线性分量,从而得到一系列预测值和相应的残差εt;

5、步骤2.1:采用单位根检验法检验钢材产品需求量时间序列是否平稳;如果是,转至步骤2.2,如果否,执行差分操作直到时间序列满足平稳性,由此,得到sarima(p,d,q)(p,d,q)s模型中常规差分阶数d和季节性差分阶数d;

6、步骤2.2:基于钢材产品需求量时间序列图中需求量数据重复触及峰值和/或谷值的固定时间间隔确定sarima(p,d,q)(p,d,q)s模型中的季节长度s;

7、步骤2.3:基于平稳时间序列的自相关函数图、偏自相关函数图以及拟合模型的精度和复杂性确定sarima(p,d,q)(p,d,q)s中自回归(autoregressive,简称ar)部分的阶数p、移动平均(moving average,简称ma)部分的阶数q、季节性自回归(seasonalautoregressive,简称sar)部分的阶数p和季节性移动平均(seasonal moving average,简称sma)部分的阶数q的最大值pmax、qmax、pmax和qmax;

8、步骤2.4:根据拟合模型的精度和复杂性设置所有sarima(p,d,q)(p,d,q)s模型中的参数c、φp(p=1,2,...,pmax)、θq(q=1,2,...,qmax)、φp(p=1,2,...,pmax)和θq(q=1,2,...,qmax)相应稀疏阈值c′、φ′、θ′、φ′和θ′的取值范围;

9、步骤2.5:将moide算法和稀疏策略相结合进而应用于sarima模型的参数估计过程中,在一次算法运行后同时得到sarima模型的最优结构和最优参数取值方案;

10、步骤2.6:使用步骤2.5得到的最优sarima模型对钢材产品需求量数据进行滚动预测,得到需求量时间序列的滚动预测值和相应的残差εt;

11、步骤2.7:检验sarima模型是否有效:如果是,转到步骤3;如果否,转到步骤2.2;

12、步骤3:采用基于差分进化(differential evolution,简称de)算法的最小二乘支持向量机(least squares support vector machine,简称lssvm)模型拟合残差数据εt中的非线性分量,从而得到一系列预测值

13、步骤3.1:将残差数据εt进行归一化处理,得到训练样本集;

14、步骤3.2:基于实际运行条件设定正则化参数γ、高斯核函数的权重a1、高斯核的宽度σgauss以及多项式核幂级数dploy的取值范围;

15、步骤3.3:基于de算法得到lssvm模型的最优参数取值方案;

16、步骤3.4:使用步骤3.3得到的最优lssvm模型对归一化残差数据进行滚动预测和反归一化处理,得到残差数据的滚动预测值

17、步骤3.5:检验混合模型sarima-lssvm是否有效:如果是,转到步骤4;如果否,转到步骤3.2;

18、步骤4:将和相加得到钢材产品需求量的最终预测值

19、上述方案中,所述步骤2.5的具体方法为:

20、步骤2.5.1:初始化参数取值方案种群和moide算法参数,设置参数取值方案的种群规模np,方案中待估计的参数总数m,初始迭代次数g=0,最大迭代次数gmax,候选参数取值方案个体基因的变异概率f,不同参数取值方案个体的交叉概率cr,外部档案集

21、采用随机策略生成初始参数取值方案种群的方法为:

22、为提高预测精度并降低计算成本,设计一个参数取值方案个体为同时包含ar部分阶数p不超过pmax、ma部分阶数q不超过qmax、sar部分阶数p不超过pmax、sma部分阶数q不超过qmax的所有sarima(p,d,q)(p,d,q)s模型的参数集合;将所有sarima(p,d,q)(p,d,q)s模型中的参数c、φp、θq、φp和θq按顺序进行编码,得到moide算法种群中的一个参数取值方案,其中,p=1,2,...,pmax,q=1,2,...,qmax,p=1,2,...,pmax,q=1,2,…,qmax;设定种群中第g个参数取值方案为则表示模型中第h个参数的编码值,g=1,2,…,np,h=1,2,…,m;每个参数取值方案的编码值基于均匀分布进行生成,和分别代表取值的上下界;

23、步骤2.5.2:基于稀疏策略计算种群中每个参数取值方案的目标函数适应值,得到种群中最好的参数取值方案个体;

24、步骤2.5.3:执行g=g+1,如果g>gmax,则转至步骤2.5.8;否则,转至步骤2.5.4;

25、步骤2.5.4:对于第g个参数取值方案在种群中任意抽取3个编号不为g的互不相同的参数取值方案,组合这些方案得到对应于目标方案的变异方案

26、步骤2.5.5:将编号相同的方案个体和上的部分元素实施交叉操作得到方案个体对应的交叉方案个体

27、步骤2.5.6:计算并比较参数取值方案和目标函数的适应值,基于方案的优劣来确定还是可以成为下一代候选参数取值方案集合中的个体;

28、步骤2.5.7:基于候选方案集和外部档案集中参数取值方案个体之间的支配关系更新外部档案集arch_set;

29、步骤2.5.8:如果当前迭代次数g>gmax,则停止运行算法,输出sarima模型的最优参数值并由此确定模型的最优结构;否则转至步骤2.5.3。

30、上述方案中,所述步骤2.5.2的具体方法为:

31、对于每一个参数取值方案个体设计其目标函数为sarima模型的精度和复杂性,分别表示为均方根误差和模型中非零参数的个数;通过最小化(1)和(2),计算每一个的适应值,目标函数(1)和(2)的具体表达式为:

32、

33、

34、其中zt和分别代表钢材产品需求量数据的实际值和预测值;是一个0-1变量:表示小于所设定的对应稀疏阈值;否则,

35、基于稀疏策略确定模型参数和目标函数的具体方法为:

36、在参数优化过程中,如果sarima模型中常数项的取值满足|c|<c′,即:设置且否则,设置如果模型中ar部分的参数满足|φp|<φ′,即:|设置且否则,设置换言之,参数为0的样本点不参与目标函数(1)和(2)的计算;执行相同的操作得到模型中ma部分的参数θq,即:sar部分的参数φp,即:和sma部分的参数θq,即:的值以及对应各部分参数的的值;基于上述操作得到目标函数(1)和(2)的值。

37、上述方案中,所述步骤3.3的具体方法为:

38、步骤3.3.1:初始化参数取值方案种群和算法参数,设置参数取值方案的种群规模np1,待估计的参数总数m1,初始迭代次数g1=0,最大迭代次数候选参数取值方案个体基因的变异概率f1,不同模型参数取值方案个体的交叉概率cr1;

39、步骤3.3.2:结合模型中各参数的定义域,采用随机策略生成初始参数取值方案种群;

40、步骤3.3.3:执行g1=g1+1,如果则转至步骤3.3.7;否则,转至步骤3.3.4;

41、步骤3.3.4:对于第g1个参数取值方案个体采用变异策略“de/rand/1”生成对应于该方案个体的变异方案个体

42、步骤3.3.5:将编号相同的方案个体和上的部分元素实施交叉操作得到方案个体对应的交叉方案个体

43、步骤3.3.6:计算并比较参数取值方案和目标函数的适应值,基于方案的优劣来确定还是可以成为下一代候选参数取值方案集合中的个体;

44、步骤3.3.7:如果当前迭代次数则停止算法运行,输出lssvm模型的最优参数取值方案;否则转至步骤3.3.3;

45、步骤3.3.8:基于最优参数值采用高斯消元法得到lssvm模型的参数α和b。

46、本发明的有益效果是:该基于sarima-lssvm的钢材产品需求量预测方法,包括提取钢材产品需求量数据并将其转换成时间序列;开发基于moide的带有稀疏策略的sarima模型提取需求量数据中的线性分量,得到一系列预测值和相应的残差;使用基于de的lssvm模型提取残差数据中的非线性分量,得到相应的预测值;最后将两次得到的预测值进行相加得到最终的预测结果的步骤。该方法集成了sarima模型和lssvm模型的优点,且在sarima参数优化过程中考虑了模型的稀疏策略以及模型的精度和复杂性目标,能够充分捕捉隐藏在钢材产品需求量数据中的线性和非线性成分,在降低计算成本的同时提高了钢材产品需求量的预测精度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1