时间序列模型建立方法及装置与流程

文档序号:13557858阅读:704来源:国知局
时间序列模型建立方法及装置与流程

本发明涉及统计技术领域,具体而言,涉及一种时间序列模型建立方法及装置。



背景技术:

时间序列模型作为一种短期预测模型,是可以广泛应用于经济、医学、气象、地理、水文、地质等各个领域。但是由于该模型的算法复杂,在建模时对数据序列有着极为严格的校验过程和复杂变换过程,而在实际生活中很少有平稳数据序列,所以该模型在实际研究中很少应用。目前,常用的时间序列模型是r语言官方公布的auto.arima算法,但是auto.arima算法只包含时间序列模型中的平稳性检验、定阶和差分过程,也就是仅仅实现了平稳性检验、差分和定阶的自动化,导致auto.arima算法的实用性很差。



技术实现要素:

本发明的目的在于提供一种时间序列模型建立方法及装置,用以改善上述问题。

为了实现上述目的,本发明实施例采用的技术方案如下:

第一方面,本发明提供了一种时间序列模型建立方法,应用于银行的电子设备,用于对银行的资产负债进行预测,所述方法包括:获取所述银行的历史数据序列;判断历史数据序列是否满足预设条件;当历史数据序列满足预设条件时,对历史数据序列进行多次模型拟合,得到最终模型群;对最终模型群进行筛选,得到最终模型;根据最终模型,得到银行的预测数据序列。

第二方面,本发明提供了一种时间序列模型建立装置,应用于银行的电子设备,用于对银行的资产负债进行预测,所述装置包括历史数据序列获取模块、判断模块、最终模型群获得模块、最终模型获得模块及预测数据序列获得模块。其中,历史数据序列获取模块用于获取所述银行的历史数据序列;判断模块用于判断历史数据序列是否满足预设条件;最终模型群获得模块用于当历史数据序列满足预设条件时,对历史数据序列进行多次模型拟合,得到最终模型群;最终模型获得模块用于对最终模型群进行筛选,得到最终模型;根据最终模型,得到银行的预测数据序列;预测数据序列获得模块用于根据最终模型,得到银行的预测数据序列。

相对现有技术,本发明具有以下有益效果:本发明提供的一种时间序列模型建立方法及装置,通过获取银行的历史数据序列,并在历史数据序列满足预设条件时,对历史数据序列进行多次模型拟合,得到最终模型群;然后对最终模型群进行筛选,选择aicc值最小的模型作为最终模型,确保最终模型达到最好的拟合效果,最后得到的银行未来一段时间内的预测数据序列更加准确,可以有效引导银行资产负债结构的调整趋势,具有良好的应用价值。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本发明实施例提供的电子设备的方框示意图。

图2示出了本发明实施例提供的时间序列模型建立方法流程图。

图3为图2示出的步骤s102的子步骤流程图。

图4为图2示出的步骤s103的子步骤流程图。

图5为图2示出的步骤s104的子步骤流程图。

图6为图5示出的子步骤s1045的子步骤流程图。

图7为图2示出的步骤s105的子步骤流程图。

图8示出了本发明实施例提供的电子设备的参数配置界面。

图9为利用本发明实施例提供的时间序列模型建立方法获得的预测值。

图10利用本发明实施例提供的时间序列模型建立方法获得的预测图。

图11示出了本发明实施例提供的时间序列模型建立装置的方框示意图。

图12为图11示出的时间序列模型建立装置中判断模块的方框示意图。

图13为图11示出的时间序列模型建立装置中最终模型群获得模块的方框示意图。

图14为图11示出的时间序列模型建立装置中最终模型获得模块的方框示意图。

图15为图14示出的最终模型获得模块中第二执行单元的方框示意图。

图16为图11示出的时间序列模型建立装置中预测数据序列获得模块的方框示意图。

图标:100-电子设备;101-存储器;102-存储控制器;103-处理器;200-时间序列模型建立装置;201-历史数据序列获取模块;202-判断模块;2021-白噪声检验单元;2022-平稳性检验单元;2023-定阶差分单元;2024-判定单元;203-最终模型群获得模块;2031-中间模型群获得单元;2032-残差获取单元;2033-最终模型群获得单元;204-最终模型获得模块;2041-aicc值计算单元;2042-备选模型获得单元;2043-显著性判断单元;2044-第一执行单元;2045-第二执行单元;20451-疏系数模型建立单元;20452-aicc值获取单元;20453-第一子执行单元;20454-第二子执行单元;205-预测数据序列获得模块;2051-模型预测单元;2052-异常值检测单元。

具体实施方式

下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

请参照图1,图1示出了本发明实施例提供的电子设备100的方框示意图。电子设备100可以是,但不限于商业银行工作人员的台式机、笔记本电脑、智能手机、平板电脑等等。所述电子设备100包括时间序列模型建立装置200、存储器101、存储控制器102及处理器103。

所述存储器101、存储控制器102及处理器103各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述时间序列模型建立装置200包括至少一个可以软件或固件(firmware)的形式存储于所述存储器101中或固化在所述电子设备100的操作系统(operatingsystem,os)中的软件功能模块。所述处理器103用于执行存储器101中存储的可执行模块,例如所述时间序列模型建立装置200包括的软件功能模块或计算机程序。

其中,存储器101可以是,但不限于,随机存取存储器(randomaccessmemory,ram),只读存储器(readonlymemory,rom),可编程只读存储器(programmableread-onlymemory,prom),可擦除只读存储器(erasableprogrammableread-onlymemory,eprom),电可擦除只读存储器(electricerasableprogrammableread-onlymemory,eeprom)等。其中,存储器101用于存储程序,所述处理器103在接收到执行指令后,执行所述程序,本发明任一实施例揭示的流程定义的服务器所执行的方法可以应用于处理器103中,或者由处理器103实现。

处理器103可以是一种集成电路芯片,具有信号处理能力。上述的处理器103可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)、语音处理器以及视频处理器等;还可以是数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器103也可以是任何常规的处理器等。

第一实施例

请参照图2,图2示出了本发明实施例提供的时间序列模型建立方法流程图。时间序列模型建立方法包括以下步骤:

步骤s101,获取银行的历史数据序列。

在本发明实施例中,历史数据序列可以是银行过去一段时间内的资产数据或者负债数据。过去一段时间可以是几年或者几个月,以当日为基准,例如,从当日起过去的3年、3个月等,过去一段时间的长短可以根据银行业务灵活调整。若要对银行的资产进行预测,则从银行的数据系统中获取过去一段时间的资产数据;若要对银行的负债进行预测,则从银行的数据系统中获取过去一段时间的负债数据。

步骤s102,判断历史数据序列是否满足预设条件。

在本发明实施例中,预设条件是历史数据序列既是平稳序列又非白噪声序列。在建立时间序列模型之前,需要先对获取的历史数据序列进行检验,检验方法可以包括:

首先,对历史数据序列进行白噪声检验,以判断历史数据序列是否为纯随机序列。若判定该历史数据序列是白噪声,即纯随机序列,则说明该历史数据序列的数据项之间不具有相关性,不能用时间序列模型,此时,利用滑动平均法对该历史数据序列进行预测;若判定该历史数据序列不是白噪声,即不是纯随机序列,则说明该历史数据序列的数据项之间具有相关性,此时对该历史数据序列进行平稳性检验。

其次,平稳性检验用于检验历史数据序列是否为平稳序列,若历史数据不是平稳序列,则对该数据序列进行定阶,并根据阶数进行差分,把该历史数据序列处理为平稳序列;此时对已得到的平稳序列再次进行白噪声检验,若该平稳序列为白噪声序列,则使用滑动平均法进行预测;若该平稳序列非白噪声序列,则进入模型拟合阶段。

请参照图3,步骤s102可以包括以下子步骤:

子步骤s1021,对历史数据序列进行白噪声检验,以判断历史数据序列是否为纯随机序列。

在本发明实施例中,对历史数据序列进行白噪声检验,可以判断该历史数据序列的数据项之间是否具有相关性,在建立时间序列模型之初,首先对历史数据序列做白噪声检验,可以确保整个运算的严谨性。

子步骤s1022,当历史数据序列不是纯随机序列时,对历史数据序列进行平稳性检验,以判断历史数据序列是否为平稳序列。

在本发明实施例中,平稳性检验可以使用adf检验法,adf检验要求对样本量有一定要求,但是在实际应用中,所采集到的历史数据序列的样本容量都能达到检验所需水平,有4种形式:

1.不含漂移项、截距项:

2.含有漂移项,不含截距项:

3.不含漂移项,含有截距项:

4.含有漂移项、截距项:

同时,adf检验采用t统计量其中,t为样本总量,φ1、φ2…φp为ols估计值,的标准差估计量,δyt表示样本的一阶差分。

作为一种实施方式,在开发过程中将这四种检验方式写成了循环,根据数据序列中漂移项和截距项的情况选择对应的检验方法,并计算相应的τ值,如果都不能通过检验,则判断存在单位根,即历史数据序列是不平稳序列。

子步骤s1023,当历史数据序列不是平稳序列时,对历史数据序列进行定阶差分,以得到平稳序列。

在本发明实施例中,可以采用作为acf函数:rk=cov(xt,xt-k)=e(xt-μ)(xt-k-μ)的相合估计,其中,i为滞后阶数,n为历史数据序列观测值,为观测平均值,自相关系数用于判断ma函数的阶数。一般来说,随着k的增长,自相关函数逐渐衰减,最终不显著异于零,绘制函数图像,如果函数是骤然下降为零,则函数截尾,如果函数是缓慢下降为零,则函数拖尾。

通过比较的值与的大小,可以判断是否显著异于零,n为样本数目。在使用r语言绘制自相关图像时会自动默认标出两条高度为的虚线,一般来说,模型阶数要尽可能少,有时候有的阶数的虽然超过了虚线,但会考虑把它当做偶然值处理,取较小的阶数。

pacf函数:用rt-k(k>0)在两侧同时乘以p阶自回归过程

rt=φ1rt-1+φ2rt-2+…+φprt-p+at

得到rtrt-k=φ1rt-1rt-k+φ2rt-2rt-k+…+φprt-prt-k+atrt-k;

对上式两侧求期望得到γk=φ1γk-1+φ2γk-2+…+φpγk-p,其中,其中γk为序列滞后k期的相关系数,该方程两侧除以γ0得到yule-walker方程:

ρk=φ1ρk-1+φ2ρk-2+…+φpρk-p

对于p阶自回归过程rt=φk1rt-1+φk2rt-2+…+φkkrt-k+at,把φkk视为历史数据序列滞后k阶的偏自相关函数,因为这恰好是滞后k阶值在排除之前滞后阶数之后对当期值的影响大小度量。此时yule-walker方程为:

ρj=φk1ρk-1+φk2ρk-2+…+φkkρj-k

将k=1,2,3……依次带入上式可求解偏自相关系数。

子步骤s1024,当历史数据序列是平稳序列时,判定历史数据序列满足预设条件。

步骤s103,当历史数据序列满足预设条件时,对历史数据序列进行多次模型拟合,得到最终模型群。

在本发明实施例中,得到最终模型群的过程可以包括:首先,对满足预设条件的历史数据序列进行多次模型拟合,建立多个模型,构成一个中间模型群。在模型拟合阶段,差分次数和阶数的所有组合方式一共有192种,根据这192种参数组合方式拟合192个模型,形成中间模型群;然后,获取中间模型群中每个模型的残差,并对残差进行白噪声检验,若残差不是白噪声,则将该残差对应的模型移出模型群,若残差是白噪声,则保留,得到最终模型群。

请参照图4,步骤s103可以包括以下子步骤:

子步骤s1031,对历史数据序列进行多次模型拟合,建立多个模型,构成一个中间模型群。

子步骤s1032,获取中间模型群中每个模型的残差。

子步骤s1033,对中间模型群中每个模型的残差进行残差检验,若残差为白噪声则保留该模型,若残差非白噪声则剔除该模型,以得到最终模型群。

在本发明实施例中,对中间模型群中每个模型的残差进行残差检验也就是对每个模型的残差进行白噪声检验,又称ljung-box检验,该检验方法检验每期残差之间与其滞后若干阶数的残差之间是否存在相关性,如果存在,则模型未被完全拟合,如果不存在,且正态性检验通过,则证明残差为白噪声序列,模型拟合成功。

ljung-box统计量计算方式如下:

其中,n为序列观测值个数,也叫作序列长度,lag为滞后阶数,acfi为序列i阶自相关函数值:

rt为序列第t期的随机变量值,acf函数可以用r语言中stats包来实现。

ljung-box统计量近似服从自由度为lag-1的卡方分布(由于是残差,减少了一个自由度,在纯随机性检验中,统计量的自由度是lag),由此可计算得到p值。

如果近期残差无自相关则远期一般来说也不会自相关,该检验可以由相关代码计算前12阶统计量的p值,当p值大于0.05时,无自相关假设成立。

步骤s104,对最终模型群进行筛选,得到最终模型。

在本发明实施例中,对最终模型群进行筛选的过程可以包括:首先,检测最终模型群是否为空,若是,则使用滑动平均法进行预测;若否,则选择aicc值最小的模型作为备选模型;然后,对该备选模型进行t检验,以判断备选模型的自回归系数是否具有显著性,若自回归系数具有显著性,则把该备选模型作为最终模型,若否,则表明历史数据序列在时间上是间隔的,此时需要进行疏系数分析,以得到最终模型。

作为一种实施方式,疏系数分析可以包括:首先,根据备选模型,建立疏系数模型;然后,对该疏系数模型的残差做白噪声检验,若残差非白噪声,则放弃该疏系数模型,返回备选模型;若残差是白噪声,则比较疏系数模型与备选模型的aicc值,并选择aicc值较小者作为最终模型。

请参照图5,步骤s104可以包括以下子步骤:

子步骤s1041,计算最终模型群中每个模型的aicc值。

子步骤s1042,获取aicc值最小的模型,并将该模型作为备选模型。

在本发明实施例中,获取aicc值(也称aicc)最小的模型采用的是aic/aicc/bic信息准则,aic=-2log极大似然估计+2k,对于普通的arima模型,p、q分别为ar模型、ma模型的阶数,如果模型包含截距或者常数项,则k=p+q+1,否则k=p+q。对于含有季节项的arima模型k还要加上季节阶数。aic估计量通过增加惩罚函数,确保选择简洁的模型,但它是一个有偏估计,对于较大的参数数量相对于数据容量的比率,偏差会相当大。

aicc在aic中增加了一个非随机惩罚项,可以消除近似偏差,n是有效样本容量,实验证明,在k/n大于10%的情况下,aicc的表现优于许多其他模型选择准则,包括aic、bic。在时间序列模型建模中,选择aicc值作为最终选择依据。

子步骤s1043,对备选模型进行t检验,以判断备选模型的自回归系数是否具有显著性。

在本发明实施例中,t检验为其中,是第i个自回归系数的估计值,是第i个自回归系数的标准误差,即标准差的估计,为第i个自回归系数的真实值,原假设备择假设先假设原假设成立,则成立,服从自由度为n-2的t分布,n为自变量观测值个数。设α为置信水平,一般α=0.05,若t*>t1-α(n-2)则原假设不成立,自回归系数显著。

子步骤s1044,当自回归系数具有显著性时,设置备选模型为最终模型。

子步骤s1045,当自回归系数不具有显著性时,对备选模型进行疏系数分析,以得到最终模型。

请参照图6,子步骤s1045可以包括以下子步骤:

子步骤s10451,根据备选模型,建立疏系数模型。

子步骤s10452,获取疏系数模型的aicc值。

子步骤s10453,当备选模型的aicc值小于疏系数模型的aicc值时,设置备选模型为最终模型。

子步骤s10454,当疏系数模型的aicc值小于备选模型的aicc值时,设置疏系数模型为最终模型。

步骤s105,根据最终模型,得到银行的预测数据序列。

在本发明实施例中,预测数据序列可以是未来的一段时间内银行的资产或负债的数据序列,可以是未来的几天或者几个月,以当日为基准,例如,从当日起为未来的30天、2个月等,具体时间长短可以根据银行业务灵活调整。根据最终模型,得到银行的预测数据序列的方法可以包括:首先,利用最终模型,输出银行的预测数据序列,预测数据序列可以包括预测值、预测图及最终模型的系数与aicc值;然后,利用bonferroni算法,检测历史数据序列和预测数据序列中的异常值,并对异常值点进行标注。

作为一种实施方式,最终的输出包括预测数据序列及其80%和95%置信区间、预测数据序列的折线图与其80%和95%置信区间对应的面积图、最终模型的自回归系数及aicc值、最终模型群中各模型的系数与对应的aicc值。同时输出最终模型群中各模型和最终模型的自回归系数与aicc值是为了便于将最终模型与最终模型群中其他模型进行对比,以便在对比中确认模型选优的过程。

请参照图7,步骤s105可以包括以下子步骤:

子步骤s1051,利用最终模型,输出银行的预测数据序列。

子步骤s1052,利用bonferroni算法,检测历史数据序列和预测数据序列中的异常值。

在本发明实施例中,首先,运用bonferroni算法判断新息异常值。如果处于时间t时的误差(也称为新息)受到了扰动(即误差是e't=et+ω1ptt,其中et是一个零均值白噪声过程,ptt是指在t时刻为1,其余时刻为0的脉冲响应函数),那么在t时就会出现一个新息异常值,因此,e't=et+ωi,在其余情况下e't=et,假设在没有受到扰动的情况下:

则在受到扰动的情况下:

或者是其中,且当j为负数时因此,即便随着观测值逐渐远离异常值的发生点扰动效应渐弱,时刻t的新息异常值仍会对时刻t及其以后的所有观测值产生扰动。

用没有受到扰动的过程ar(∞)来表示残差:

at=y't-π1y't-1-π2y't-2-…

为简化起见,假设过程的均值为零,且所有参数已知。一般我们用估计得到的参数代替实际参数,这些结果可能受到了扰动的影响。在零假设与无异常值和大样本的情况下,这种近似替代对下述检验流程的有效性可以忽略不计。如果序列只在t时刻有新息异常值,那么残差为at=ωi+et,其余情况下at=et,因此ωi可为方差等于σ2。因此,用于检验时刻t上的新息异常值有如下统计量:

零假设为时间序列中没有异常值,检验统计量近似的服从标准正太分布。在t实现已知时,确定观测值为异常值的条件是在5%的显著性水平上相应标准残差的大小超过1.96。由于不知道t是哪一个时刻,故需要对全部观测值进行检验,此外还需要估计σ。简单而保守的做法是应用bonferroni算法来控制多重检验的总体误差率,令

λ1=max|λ1,t|

最大值在t=t时刻取得,若λ1>0.025/n×100,即超过了标准正态分布的上百分位数,那么第t个观测值必然是新息异常值,该流程确保了错误认定的概率不超过5%。

然后,运用bonferroni算法判断可加异常值。假设t时刻存在可加异常值,在其他时点没有异常值,则可证明

at=-ωaπt-t+et,其中,π0=-1,当且仅当j为负数时πj=0,故当t<t时at=et时,at=ωa+et,at+1=-ωaπ1+et+1,at+2=-ωaπ2+et+2,以此类推,ωa的最小二乘估计量为:

其中,而估计量的方差为ρ2σ2,则可以定义检验统计量

零假设是预测数据序列无异常值,备择假设为预测数据序列有一个在t时的可加异常值的情况,检验统计量渐进服从标准正态分布,可应用bonferroni算法来控制总体误差,此外异常值的性质事先无法得知。当在时间t上检验到异常值时,如果|λ1,t|>|λ2,t|,观测值为新息异常值,否则为可加异常值。

在本发明实施例中,时间序列模型建立方法已封装为时间序列函数,并可以在电子设备100设置时间序列模型建立方法的参数配置界面,请参照图8,以测算银行未来30日内负债变动情况,只需输入此前一年银行各项负债数据并选择日期,电子设备100的处理器103就可以调用时间序列函数,就可以快速测算出银行未来30日内负债预测值,并以折线图形式输出,若需要修改某项负债的数据,只需点击“编辑”便可重新输入该项资产的数据。

作为一种实施方式,假设可以得到某银行过去两年(24个月)的活期存款数据如下;

调用时间序列函数之后,请结合参照图9和图10,可以输出银行未来10期的资产预测值、预测图及其置信区间。

在本发明实施例中,与现有的时间序列模型相比,本发明提供的时间序列模型建立方法具有以下优点:第一,在时间序列模型建立之前对历史数据序列进行白噪声检验,可以确保预测结果的准确性及整个运算的严谨性;第二,实际应用中很多历史数据序列是不平稳的或是白噪声序列,因此针对纯随机序列使用滑动平均法进行预测,可以确保时间序列模型的稳健性;第三,使用了多次差分和多次定阶的相互组合的循环运算的架构,计算每一种参数组合的误差,最后选定误差最小的模型作为最终模型,输出该模型的运算结果。在这个过程中,建立了192个模型,并选择aicc值最小的作为最终模型,显著优于auto.arima只计算一次定阶和差分的运算方式;第四,本发明提供的时间序列模型建立方法,最终输出包括预测数据序列及其80%和95%置信区间、预测数据序列的折线图与其80%和95%置信区间对应的面积图、最终模型的自回归系数及aicc值、最终模型群中各模型的系数与对应的aicc值,显著优于只输出预测值和预测图的auto.arima。

需要说明的是,本发明实施例提供的时间序列模型建立方法,除了包含auto.arima算法中的平稳性检验、定阶差分过程以外,其他过程及整个时间序列模型建立方法的架构,均为创造性的内容,凡在该创造性的内容中所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

第二实施例

请参照图11,图11示出了本发明实施例提供的时间序列模型建立装置200的方框示意图。时间序列模型建立装置200包括历史数据序列获取模块201、判断模块202、最终模型群获得模块203、最终模型获得模块204及预测数据序列获得模块205。

历史数据序列获取模块201,用于获取银行的历史数据序列。

在本发明实施例中,历史数据序列获取模块201可以用于执行步骤s101。

判断模块202,用于判断历史数据序列是否满足预设条件。

在本发明实施例中,判断模块202可以用于执行步骤s102。

请参照图12,图12为图11示出的时间序列模型建立装置200中判断模块202的方框示意图。判断模块202包括白噪声检验单元2021、平稳性检验单元2022、定阶差分单元2023及判定单元2024。

白噪声检验单元2021,用于对历史数据序列进行白噪声检验,以判断历史数据序列是否为纯随机序列。

在本发明实施例中,白噪声检验单元2021可以用于执行子步骤s1021。

平稳性检验单元2022,用于当历史数据序列不是纯随机序列时,对历史数据序列进行平稳性检验,以判断历史数据序列是否为平稳序列。

在本发明实施例中,平稳性检验单元2022可以用于执行子步骤s1022。

定阶差分单元2023,用于当历史数据序列不是平稳序列时,对历史数据序列进行定阶差分,以得到平稳序列。

在本发明实施例中,定阶差分单元2023可以用于执行子步骤s1023。

判定单元2024,用于当历史数据序列是平稳序列时,判定历史数据序列满足预设条件。

在本发明实施例中,判定单元2024可以用于执行子步骤s1024。

最终模型群获得模块203,用于当历史数据序列满足预设条件时,对历史数据序列进行多次模型拟合,得到最终模型群。

在本发明实施例中,最终模型群获得模块203可以用于执行步骤s103。

请参照图13,图13为图11示出的时间序列模型建立装置200中最终模型群获得模块203的方框示意图。最终模型群获得模块203包括中间模型群获得单元2031、残差获取单元2032及最终模型群获得单元2033。

中间模型群获得单元2031,用于对历史数据序列进行多次模型拟合,建立多个模型,构成一个中间模型群。

在本发明实施例中,中间模型群获得单元2031可以用于执行子步骤s1031。

残差获取单元2032,用于获取中间模型群中每个模型的残差。

在本发明实施例中,残差获取单元2032可以用于执行子步骤s1032。

最终模型群获得单元2033,用于对中间模型群中每个模型的残差进行残差检验,若残差为白噪声则保留该模型,若残差非白噪声则剔除该模型,以得到最终模型群。

在本发明实施例中,最终模型群获得单元2033可以用于执行子步骤s1033。

最终模型获得模块204,用于对最终模型群进行筛选,得到最终模型。

在本发明实施例中,最终模型获得模块204可以用于执行步骤s104。

请参照图14,图14为图11示出的时间序列模型建立装置200中最终模型获得模块204的方框示意图。最终模型获得模块204包括aicc值计算单元2041、备选模型获得单元2042、显著性判断单元2043、第一执行单元2044及第二执行单元2045。

aicc值计算单元2041,用于计算最终模型群中每个模型的aicc值。

在本发明实施例中,aicc值计算单元2041可以用于执行子步骤s1041。

备选模型获得单元2042,用于获取aicc值最小的模型,并将该模型作为备选模型。

在本发明实施例中,备选模型获得单元2042可以用于执行子步骤s1042。

显著性判断单元2043,用于对备选模型进行t检验,以判断备选模型的自回归系数是否具有显著性。

在本发明实施例中,显著性判断单元2043可以用于执行子步骤s1043。

第一执行单元2044,用于当自回归系数具有显著性时,设置备选模型为最终模型。

在本发明实施例中,第一执行单元2044可以用于执行子步骤s1044。

第二执行单元2045,用于当自回归系数不具有显著性时,对备选模型进行疏系数分析,以得到最终模型。

在本发明实施例中,第二执行单元2045可以用于执行子步骤s1045。

图15为图14示出的最终模型获得模块204中第二执行单元2045的方框示意图。第二执行单元2045包括疏系数模型建立单元20451、aicc值获取单元20452、第一子执行单元20453及第二子执行单元20454。

疏系数模型建立单元20451,用于根据备选模型,建立疏系数模型。

在本发明实施例中,疏系数模型建立单元20451可以用于执行子步骤s10451。

aicc值获取单元20452,用于获取疏系数模型的aicc值。

在本发明实施例中,aicc值获取单元20452可以用于执行子步骤s10452。

第一子执行单元20453,用于当备选模型的aicc值小于疏系数模型的aicc值时,设置备选模型为最终模型。

在本发明实施例中,第一子执行单元20453可以用于执行子步骤s10453。

第二子执行单元20454,用于当疏系数模型的aicc值小于备选模型的aicc值时,设置疏系数模型为最终模型。

在本发明实施例中,第二子执行单元20454可以用于执行子步骤s10454。

预测数据序列获得模块205,用于根据最终模型,得到银行的预测数据序列。

在本发明实施例中,预测数据序列获得模块205可以用于执行步骤s105。

请参照图16,图16为图11示出的时间序列模型建立装置200中预测数据序列获得模块205的方框示意图。预测数据序列获得模块205包括模型预测单元2051及异常值检测单元2052。

模型预测单元2051,用于利用最终模型,输出银行的预测数据序列。

在本发明实施例中,模型预测单元2051可以用于执行子步骤s1051。

异常值检测单元2052,用于利用bonferroni算法,检测历史数据序列和预测数据序列中的异常值。

在本发明实施例中,异常值检测单元2052可以用于执行子步骤s1052。

综上所述,本发明提供的一种时间序列模型建立方法及装置,应用于银行的电子设备,用于对银行的资产负债进行预测,所述方法包括:获取所述银行的历史数据序列;判断历史数据序列是否满足预设条件;当历史数据序列满足预设条件时,对历史数据序列进行多次模型拟合,得到最终模型群;对最终模型群进行筛选,得到最终模型;根据最终模型,得到银行的预测数据序列。本发明提供的时间序列模型建立方法,首先,在时间序列模型建立之前对历史数据序列进行白噪声检验,可以确保预测结果的准确性及整个运算的严谨性;其次,实际应用中很多历史数据序列是不平稳的或是白噪声序列,因此针对纯随机序列使用滑动平均法进行预测,可以确保时间序列模型的稳健性;再次,使用了多次差分和多次定阶的相互组合的循环运算的架构,计算每一种参数组合的误差,最后选定误差最小的模型作为最终模型,输出该模型的运算结果。在这个过程中,建立了192个模型,并选择aicc值最小的作为最终模型,显著优于auto.arima只计算一次定阶和差分的运算方式;最后,本发明提供的时间序列模型建立方法,最终输出包括预测数据序列及其80%和95%置信区间、预测数据序列的折线图与其80%和95%置信区间对应的面积图、最终模型的自回归系数及aicc值、最终模型群中各模型的系数与对应的aicc值,显著优于只输出预测值和预测图的auto.arima。因此,本发明在运算过程中可以确保最终模型达到最好的拟合效果,得到的银行未来一段时间内的预测数据序列更加准确,可以有效引导银行资产负债结构的调整趋势,具有良好的应用价值。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1