一种空气质量指数预测方法和装置与流程

文档序号:11134389阅读:586来源:国知局
一种空气质量指数预测方法和装置与制造工艺

本发明涉及电子技术领域,尤其涉及一种空气质量指数预测方法和装置。



背景技术:

随着工业化和城镇化的推进以及城市车辆的持续增加,大气污染日益加重,城市空气质量逐步恶化,雾霾天气也越来越多,严重影响了人们的工作生活,由此造成的健康损害引起了政府和民众的广泛关注。

AQI(空气质量指数,Air Quality Index)是定量描述城市空气质量情况的一个参数,也是目前衡量空气质量情况最常参考的指标。AQI通过函数关系将二氧化硫(SO2)、一氧化碳(CO)、二氧化氮(NO2)、臭氧(O3)以及悬浮颗粒物PM2.5和PM10五类污染物的含量信息折算为一个参数。AQI的取值区间为[0,500],AQI数值越大、级别越高,表面空气污染状况越严重。

对一个城市的AQI进行快速、准确地预测可为预防和治理空气污染发挥积极作用。目前,针对AQI预测的方法主要分为两大类:

(1)因素预测法:通过建立AQI与其各影响因素之间的定量关系预测AQI。然而,由于AQI的影响因素复杂,涉及数据量大,且各影响因素之间具有高度的非线性关系,因此难以建立精确的预测模型,预测精度差。

(2)基于时间序列的预测法:该类方法又可细分为两类,具体为针对原始AQI时间序列的预测方法和融入数据分解技术的AQI时间序列预测方法。其中,数据分解技术例如EMD(经验模态分解,Empirical Mode Decomposition)、EEMD(集合经验模态分解,Ensemble Empirical Mode Decomposition)。然而,目前融入数据分解技术的AQI时间序列预测法,只采用单一数据分解技术对AQI时间序列数据进行分解以降低数据序列的非平稳性,虽然在一定程度上提高了预测精度,但由于其分解后的数据序列中依然存在高频震荡数据序列,导致预测精度难以大幅提高。

所以,现有预测AQI的方法都存在预测精度差的技术问题。



技术实现要素:

本发明实施例提供了一种空气质量指数预测方法和装置,用于通过两阶段分解及极限学习机对空气质量指数进行预测,实现提高预测精度的技术效果。

第一方面,本发明提供了一种空气质量指数预测方法,包括:

获得待预测地理位置的历史空气质量指数AQI数据;

根据互补集合经验模态分解CEEMD方法,将所述历史AQI数据分解为m个固有模态函数IMF分量和一个趋势分量;其中,m为大于1的自然数;

获得所述m个IMF分量中的高频IMF分量;

基于变分模态分解VMD方法,获得所述高频IMF分量的n个变分模态VM分量;其中,n为大于1的自然数;

基于极限学习机模型,获得所述n个VM分量的预测值、所述高频IMF分量以外的其它IMF分量的预测值以及所述趋势分量的预测值;

获得所述高频IMF分量对应的所述VM分量的预测值的第一线性叠加值,并将所述第一线性叠加值确定为所述高频IMF的预测值;

获得所述高频IMF的预测值、所述其它IMF分量的预测值以及所述趋势分量的预测值的第二线性叠加值,并将所述第二线性叠加值确定为所述待预测地理位置的AQI预测值。

可选的,根据互补集合经验模态分解CEEMD方法,将所述历史AQI数据分解为m个固有模态函数IMF分量和一个趋势分量,包括:

向所述历史AQI数据序列中加入辅助白噪声,获得两个新的集合IMF信号;其中,向所述历史AQI数据序列中加入辅助白噪声是以期望为0,标准差为0.2,正负成对且呈正态分布的形式加入;

基于经验模态分解EMD对所述两个新的集合IMF信号中的每一个信号进行分解,获得每个新的集合IMF的IMF分量;

判断循环次数是否达到预设次数N;

当循环次数未达到预设次数时,再次执行:向所述历史AQI数据序列中加入辅助白噪声,获得两个新的集合IMF信号,以及基于经验模态分解EMD对所述两个新的集合IMF信号中的每一个信号进行分解,获得每个新的集合IMF的IMF分量;

当所述循环次数达到所述预设次数N时,获得2N组IMF分量,确定所述2N组IMF分量的平均值为所述历史AQI数据的所述m个IMF分量和所述趋势分量;其中,每组IMF分量均包括m个IMF分量和一个趋势分量。

可选的,获得所述m个IMF分量中的高频IMF分量,包括:

按照频率从高到低对所述m个IMF分量进行排序;

确定满足预设条件的IMF分量为所述高频IMF分量。

可选的,基于变分模态分解VMD方法,获得所述高频IMF分量的n个变分模态VM分量,包括:

初始化和n;其中,为第1次迭代中的第k个模态函数,为的傅里叶转换,λ表示朗格拉日乘法算子,{λ1}为第1次迭代中的拉格朗日乘法算子,为的傅里叶转换,为初始化中心频率,uk为k个模态函数,ωk为中心频率,n为迭代次数;

根据下列公式更新uk

根据下列公式更新ωk

其中,为当前剩余量的维纳滤波,为当前模态函数功率谱的重心,分别为g(t)、ui(t)、λ(t)和的傅里叶转换,g(t)为所述高频IMF分量,ui(t)为第i个模态函数,λ(t)为拉格朗日乘法算子,为uk经过n+1次迭代后的值,1≤i≤k,α为二次惩罚因子;

根据下列公式更新λ:

其中,为λ(ω)经过n次迭代后的傅里叶转换,为λ(ω)经过n+1次迭代后的傅里叶转换,τ为更新系数;

判断是否成立,其中,e>0;为uk经过n次迭代后的傅里叶转换;

当成立时,将uk作为所述n个VM分量;

当不成立时,再次更新uk和ωk

可选的,基于极限学习机模型,获得所述n个VM分量的预测值、所述高频IMF分量以外的其它IMF分量的预测值以及所述趋势分量的预测值,包括:

基于极限学习机模型,根据所述n个VM分量中每个VM分量的每前8个数据预测第9个数据,获得每个VM分量的预测值,进而获得所述n个VM分量的预测值;

基于极限学习机模型,根据所述其它IMF分量中每个IMF分量的每前8个数据预测第9个数据,获得每个IMF分量的预测值,进而获得所述其它IMF分量的预测值;

基于极限学习机模型,根据所述趋势分量的每前8个数据预测第9个数据,获得所述趋势分量的预测值。

可选的,所述历史AQI数据的长度大于500。

第二方面,本发明提供了一种空气质量指数预测装置,包括:

第一获得模块,用于获得待预测地理位置的历史空气质量指数AQI数据;

CEEMD分解模块,用于根据互补集合经验模态分解CEEMD方法,将所述历史AQI数据分解为m个固有模态函数IMF分量和一个趋势分量;其中,m为大于1的自然数;

第二获得模块,用于获得所述m个IMF分量中的高频IMF分量;

VMD分解模块,用于基于变分模态分解VMD方法,获得所述高频IMF分量的n个变分模态VM分量;其中,n为大于1的自然数;

极限学习机模块,用于基于极限学习机模型,获得所述n个VM分量的预测值、所述高频IMF分量以外的其它IMF分量的预测值以及所述趋势分量的预测值;

第一线性叠加模块,用于获得所述高频IMF分量对应的所述VM分量的预测值的第一线性叠加值,并将所述第一线性叠加值确定为所述高频IMF的预测值;

第二线性叠加模块,用于获得所述高频IMF的预测值、所述其它IMF分量的预测值以及所述趋势分量的预测值的第二线性叠加值,并将所述第二线性叠加值确定为所述待预测地理位置的AQI预测值。

可选的,所述CEEMD模块用于向所述历史AQI数据序列中加入辅助白噪声,获得两个新的集合IMF信号;其中,向所述历史AQI数据序列中加入辅助白噪声是以期望为0,标准差为0.2,正负成对且呈正态分布的形式加入;基于经验模态分解EMD对所述两个新的集合IMF信号中的每一个信号进行分解,获得每个新的集合IMF的IMF分量;判断循环次数是否达到预设次数N;当循环次数未达到预设次数时,再次执行:向所述历史AQI数据序列中加入辅助白噪声,获得两个新的集合IMF信号,以及基于经验模态分解EMD对所述两个新的集合IMF信号中的每一个信号进行分解,获得每个新的集合IMF的IMF分量;当所述循环次数达到所述预设次数N时,获得2N组IMF分量,确定所述2N组IMF分量的平均值为所述历史AQI数据的所述m个IMF分量和所述趋势分量;其中,每组IMF分量均包括m个IMF分量和一个趋势分量。

可选的,所述第二获得模块用于按照频率从高到低对所述m个IMF分量进行排序;确定满足预设条件的IMF分量为所述高频IMF分量。

可选的,所述VMD分解模块用于初始化和n;其中,为第1次迭代中的第k个模态函数,为的傅里叶转换,λ表示朗格拉日乘法算子,{λ1}为第1次迭代中的拉格朗日乘法算子,为{λ1}的傅里叶转换,为初始化中心频率,uk为k个模态函数,ωk为中心频率,n为迭代次数;根据下列公式更新uk:根据下列公式更新ωk:其中,为当前剩余量的维纳滤波,为当前模态函数功率谱的重心,分别为g(t)、ui(t)、λ(t)和的傅里叶转换,g(t)为所述高频IMF分量,ui(t)为第i个模态函数,λ(t)为拉格朗日乘法算子,为uk经过n+1次迭代后的值,1≤i≤k,α为二次惩罚因子;根据下列公式更新λ:其中,为λ(ω)经过n次迭代后的傅里叶转换,为λ(ω)经过n+1次迭代后的傅里叶转换,τ为更新系数;判断是否成立,其中,e>0;为uk经过n次迭代后的傅里叶转换;当成立时,将uk作为所述n个VM分量;当不成立时,再次更新uk和ωk

可选的,所述极限学习模块用于基于极限学习机模型,根据所述n个VM分量中每个VM分量的每前8个数据预测第9个数据,获得每个VM分量的预测值,进而获得所述n个VM分量的预测值;基于极限学习机模型,根据所述其它IMF分量中每个IMF分量的每前8个数据预测第9个数据,获得每个IMF分量的预测值,进而获得所述其它IMF分量的预测值;基于极限学习机模型,根据所述趋势分量的每前8个数据预测第9个数据,获得所述趋势分量的预测值。

可选的,所述历史AQI数据的长度大于500。

本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:

在本发明实施例的技术方案中,首先通过CEEMD将非平稳的历史AQI数据序列分解成一系列具有不同频率特征的IMF分量和趋势分量,然后,通过VMD将其中的每个高频IMF分量进一步分解为若干VM分量,进一步通过极限学习机模型对各个VM分量以及除高频IMF分量以外的其它IMF分量和趋势分量进行预测,并将与每个高频IMF分量对应的VM分量的预测值进行线性叠加得到该IMF的预测值,最后通过将所有IMF及趋势分量的预测值进行线性叠加得到最终的AQI预测值。相较于现有技术,对于AQI的预测具有更高的精度。

附图说明

图1为本发明实施例中的AQI预测方法流程图;

图2为本发明实施例中预测AQI的数据流向示意图;

图3为本发明实施例中的示例性历史AQI数据序列;

图4为本发明实施例中分解图3示出的历史AQI数据序列获得的IMF分量示意图;

图5为分解图4示出的第一个IMF分量获得的VM分量示意图;

图6为不同预测方法的拟合曲线示意图;

图7为图6示出的不同预测方法的预测误差值条形图;

图8为本发明实施例中的AQI预测装置示意图。

具体实施方式

本发明实施例提供了一种空气质量指数预测方法和装置,用于通过两阶段分解及极限学习机对空气质量指数进行预测,实现提高预测精度的技术效果。

为了解决上述技术问题,本发明提供的技术方案总体思路如下:

在本发明实施例的技术方案中,首先通过CEEMD将非平稳的历史AQI数据序列分解成一系列具有不同频率特征的IMF分量和趋势分量,然后,通过VMD将其中的每个高频IMF分量进一步分解为若干VM分量,进一步通过极限学习机模型对各个VM分量以及除高频IMF分量以外的其它IMF分量和趋势分量进行预测,并将与每个高频IMF分量对应的VM分量的预测值进行线性叠加得到该IMF的预测值,最后通过将所有IMF及趋势分量的预测值进行线性叠加得到最终的AQI预测值。

下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。

本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

本发明第一方面提供了一种AQI预测方法,请参考图1,为本发明实施例中的AQI预测方法示意图,以及图2,为本发明实施例中预测AQI的数据流向示意图。该方法包括:

S101:获得待预测地理位置的历史空气质量指数AQI数据;

S102:根据互补集合经验模态分解CEEMD方法,将所述历史AQI数据分解为m个固有模态函数IMF分量和一个趋势分量;

S103:获得所述m个IMF分量中的高频IMF分量;

S104:基于变分模态分解VMD方法,获得所述高频IMF分量的n个变分模态VM分量;

S105:基于极限学习机模型,获得所述n个VM分量的预测值、所述高频IMF分量以外的其它IMF分量的预测值以及所述趋势分量的预测值;

S106:获得所述高频IMF分量对应的所述VM分量的预测值的第一线性叠加值,并将所述第一线性叠加值确定为所述高频IMF的预测值;

S107:获得所述高频IMF的预测值、所述其它IMF分量的预测值以及所述趋势分量的预测值的第二线性叠加值,并将所述第二线性叠加值确定为所述待预测地理位置的AQI预测值。

为了更加清楚地描述本发明实施例的技术方案,下面将结合一组具体数据来说明。本领域技术人员应当理解,尽管本发明实施例中结合具体数据进行介绍,但仅是一种示例性,在具体实现过程中,并不限于下述案例。

图3所示出了本发明实施例的示例性历史AQI数据序列。图3中的数据为湖北省武汉市自2014年7月1日至2016年6月30日的日AQI序列,共计731个数据。从图3中可以看出,AQI序列波动较剧烈,且无明显变化规律。在S101中,获取上述包含731个历史AQI数据的历史AQI数据序列。在具体实现过程中,历史AQI数据的长度应大于500,以保证预测的准确性。

然后,在S102中,利用CEEMD(互补集合经验模态分解,Complementary Ensemble Empirical Mode Decomposition)方法,将该历史AQI数据序列分解为m个IMF(固有模态函数,Intrinsic Mode Function)分量和一个趋势分量。其中,m为大于1的自然数。在本发明实施例中,通过以下步骤进行分解:

S1021:向所述历史AQI数据序列中加入辅助白噪声,获得两个新的集合IMF信号;

S1022:基于经验模态分解EMD对所述两个新的集合IMF信号中的每一个信号进行分解,获得每个新的集合IMF的IMF分量;

S1023:判断循环次数是否达到预设次数N;

S1024:获得2N组IMF分量,并计算所述2N组IMF分量的平均值。

具体来讲,在本发明实施例中,S1021中加入辅助白噪声,是以期望为0,标准差为0.2,正负成对且呈正态分布的形式加入。具体通过以下公式(1)和公式(2)加入,

其中,X(t)为历史AQI数据序列,wi(t)为第i次加入的辅助白噪声的值。其中,wi(t)的幅值为0.2~2.5倍原始信号的标准偏差,或者随噪声的强度而适当调整,本发明不做具体限制。和则表示了加入辅助白噪声后形成的两个新的集合IMF信号。

接下来,在S1022中,对和进行EMD(经验模态分解,Empirical Mode Decomposition)分解,获得和各自的IMF分量。具体通过以下过程获得:

(1)识别出信号x(t)的所有极值点,获得信号x(t)的上包络线emax(t)和下包络线emin(t),进一步获得上下包络线的平均值m1(t),

m1(t)=[emax(t)+emin(t)]/2。 公式(3)

x(t)表示加入了辅助白噪声的信号,即或

(2)x(t)减去m1(t)得到移除低频的新数据序列h1(t),

h1(t)=x(t)-m1(t)。 公式(4)

(3)由于h1(t)通常不是IMF分量,所以还需要进行k次筛选,直到筛选出所得到的平均曲线趋于零,此时筛选结果才是IMF分量。具体来讲,令h1k(t)表示第k次筛选所得的数据,h1(k-1)(t)表示第k-1次筛选所得的数据。利用限制标准差SD的值来判断筛选结果是否为IMF分量,其中,

其中,T为当前筛选序列长度。当SD在[0.2,0.3]中时,筛选结束,获得筛选结果,即IMF分量

h1k(t)=x(t)-m1k(t)。 公式(6)

其中,m1k(t)为上下包络序列的平均值序列第k次筛选后所获得的数据。

(4)令c1=h1k(t),c1即为信号x(t)的第一个IMF分量,即x(t)的高频成分,因此,获得移除最高频成分的差值数据序列

r1=x(t)-c1。 公式(7)

然后,再次通过上述利用公式(5)中SD的值筛选出第二个IMF分量c2

然后再获得移除c2的序列,并再筛选出第三个IMF分量c3。依次类推,直到获得c2,c3,…,cn和残差项rn。换言之,本发明实施例中x(t)可理解为

其中,cj为第j个IMF分量,而rm就为趋势分量。

接下来,在S1023中判断S1021到S1022的循环次数是否达到预设次数N。其中,本发明实施例中的N为100~1000中的任意值,本发明不做限制。在预测图3所示的历史AQI数据序列中,可以取N=500。

当循环次数未达到N=500时,重新加入一组新的辅助白噪声,进而再次获得两组IMF分量。

当循环次数达到N=500时,为了消除多次加入的辅助白噪声的影响,取对应的IMF分量的均值为最终的IMF分量。具体来讲,通过下列公式(9)获得对应的IMF分量的均值:

其中,IMFj表示第j个分量,1≤j≤m,如图4中的IMF1、IMF2、IMF3、IMF4、IMF5、IMF6、IMF7、IMF8、IMF9和Res。表示第i次加入辅助白噪声得到的分解得到的第j个IMF,表示第i次加入辅助白噪声得到的分解得到的第j个IMF。

接下来,执行S103,具体为:

按照频率从高到低对所述m个IMF分量进行排序;

确定满足预设条件的IMF分量为所述高频IMF分量。

首先按照每个IMF的频率将m个IMF进行排序,然后选择满足预设条件的IMF分量为高频IMF分量。本发明实施例中的预设条件例如为排序中的第一位,或者频率较高且对预测结果影响较大,本发明不做具体限制。为了方便后续介绍,假设取排列在第一位的IMF分量为高频IMF分量,如图4中的IMF1。

接下来,在S104中,将高频IMF分量分解成n个VM(变分模态,Variational Mode)分量。n为大于1的自然数,本发明所属领域的普通技术人员可以根据实际进行设置,本发明不做具体限制。在处理图3示出的历史AQI数据时,可以设置n=10。本发明通过以下步骤对高频IMF分量进行分解:

S1041:将高频IMF分量分解为k(其中,k=10)个模态函数,每个模态均为具有中心频率的有限带宽。使每个模态的带宽估计之和最小,约束条件为f与各模态之和相等,则约束变分问题如下:

其中,g(t)表示高频IMF分量,uk为g(t)的第k个模态函数,ωk为uk的中心频率,δ(t)为uk的Dirac分布。

S1042:为获得该约束变分的最优解,基于增广拉格朗日函数将公式(11)转换为公式(12),以将约束性变分问题转化为非约束性变分问题。

其中,λ为朗格拉日乘法算子,公式(12)中的α为二次惩罚因子。

S1043:初始化和n。

其中,为第1次迭代中的第k个模态函数,为的傅里叶转换,λ表示朗格拉日乘法算子,{λ1}为第1次迭代中的拉格朗日乘法算子,为{λ1}的傅里叶转换,为初始化中心频率,uk为k个模态函数,ωk为中心频率,n为当前迭代次数。初始化就是把各个变量赋为默认值,本发明实施例中的初始化就是将和n赋值为0。

S1044:交替更新和λn+1

其中,通过公式(13)更新

通过公式(14)更新

通过公式(15)更新λn+1

其中,为当前剩余量的维纳滤波,为当前模态函数功率谱的重心,分别为g(t)、ui(t)、λ(t)和的傅里叶转换,ui(t)为第i个模态函数,为uk经过n+1次迭代后的值,1≤i≤k,为λ(ω)经过n次迭代后的傅里叶转换,为λ(ω)经过n+1次迭代后的傅里叶转换,τ为更新系数。

S1045:判断公式(16)是否成立。

其中,e为大于0的任意值,为uk经过n次迭代后的傅里叶转换。

如果此时公式(16)不成立,则返回步骤S1044,重新更新和λn+1。如果公式(16)成立,则执行S1046:将uk作为所述n个VM分量。输出此时的uk,uk中的10个量就是高频IMF的VM分量,如图5所示。

接着,执行S105:基于极限学习机模型,获得所述n个VM分量的预测值、所述高频IMF分量以外的其它IMF分量的预测值以及所述趋势分量的预测值。在本发明实施例中,具体为通过如下过程实现S105:

根据输入ELM(极限学习机,Extreme Learning Machine)模型的序列,利用每前8个数据预测第9个数据。

具体来讲,输入ELM模型的序列为每个高频IMF分量的VM分量,高频IMF分量以外的每一个IMF分量,以及趋势分量。在具体实现过程中,输入顺序,即获得预测值的顺序可以任意选择,本发明不做具体限制。图3中IMF′i表示第i个IMF分量IMFi的预测值,Res’表示趋势分量Res的预测值。

利用每前8个数据预测第9个数据,是指从序列中的第9个数据开始,每个数据的预测值根据前8个数据来预测。具体来讲,请参考公式(17),

x'i+9=f(xi+1,xi+2,…,xi+8) 公式(17)

公式(17)中的x'i+9表示第i+9个数据的预测值,i≥0,xi+1,xi+2,…,xi+8表示第i+9个数据的前8个数据,公式(17)中的f为建立的ELM。

换言之,第9个数据由第1~8个数据预测,第10个数据由第2~9个数据预测,第11个数据由第3~10个数据预测,…

其中,模型训练时设存在N个独立的训练样本{(xi,ti),i=1,2,…,N}。xi表示ELM的输入样本,ti为期望输出样本,具体输入样本值xi=[xi1,xi2,…,xin]T∈R,具体期望输出样本值ti=[ti1,ti2,…,tim]T∈R。

假设激活函数为p(x),隐含层神经元的阈值为bi,那么网络输出yj

其中,j=1,2,…,N,wi=[wi1,wi2,…,win]为输入层神经元与隐含层第i层之间的连接权值,βi=[βi1i2,…,βim]为隐含层第i个神经元与输出层神经元之间的连接权值。

容易看出,公式(18)可以转化为

Y=Hβ, 公式(19)

其中,Y为网络的输出矩阵,H为网络的隐含层输出矩阵,β为隐含层与输出层之间的连接权值。

公式(19)中的矩阵形式为

当激活函数p(x)无限可微时,输入层与隐含层之间的连接权值w以及隐含层神经元的阈值b在训练前可以随机选择,且在训练过程中保持不变。而隐含层与输出层之间的连接权值β可以为公式(20)的最小二乘解,

即H+为隐含层输出矩阵H的Moore-Penrose广义逆矩阵。

接下来,在S106中,将高频IMF分量的VM进行线性叠加,并将线性叠加得到的第一线性叠加值作为高频IMF分量的预测值。

具体来讲,如果高频IMF分量仅有一个,则将所有VM分量线性叠加得到的第一线性叠加值作为该唯一的高频IMF分量的预测值。如果高频IMF分量有多个,则将每个高频IMF分量自身分解出的VM分量进行叠加,得到每个高频IMF分量的第一线性叠加值,进而将由自身的VM分量叠加出的值作为该高频IMF分量的预测值。

最后,在S107中,将S106获得的每个高频IMF分量的预测值、每个其它IMF分量的预测值以及趋势分量的预测值线性叠加,得到的第二线性叠加值就是AQI预测值。

图6示出了不同预测方法的拟合曲线示意图。其中,未添加标识符的曲线表示历史AQI数据序列,曲线“ELM”表示现有的直接预测方法的拟合曲线,曲线“CEEMD-ELM”表示现有的融入CEEMD分解技术的AQI预测方法的拟合曲线,曲线“VMD-ELM”表示现有的融入VMD分解技术的AQI预测方法的拟合曲线,曲线“CEEMD-VMD-ELM”表示本发明实施例的预测方法的拟合曲线。

图7示出了图6所示的不同预测方法的预测误差值。本发明实施例中的误差包括平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分误差(MAPE)。可以看出,相较于现有技术中的多种预测方法,本发明的预测方法误差最小,因此,本发明提高了AQI预测的精度。

基于与前述实施例中AQI预测方法同样的发明构思,本发明第二方面还提供一种AQI预测装置,如图8所示,包括:

第一获得模块101,用于获得待预测地理位置的历史空气质量指数AQI数据;

CEEMD分解模块102,用于根据互补集合经验模态分解CEEMD方法,将所述历史AQI数据分解为m个固有模态函数IMF分量和一个趋势分量;其中,m为大于1的自然数;

第二获得模块103,用于获得所述m个IMF分量中的高频IMF分量;

VMD分解模块104,用于基于变分模态分解VMD方法,获得所述高频IMF分量的n个变分模态VM分量;其中,n为大于1的自然数;

极限学习机模块105,用于基于极限学习机模型,获得所述n个VM分量的预测值、所述高频IMF分量以外的其它IMF分量的预测值以及所述趋势分量的预测值;

第一线性叠加模块106,用于获得所述高频IMF分量对应的所述VM分量的预测值的第一线性叠加值,并将所述第一线性叠加值确定为所述高频IMF的预测值;

第二线性叠加模块107,用于获得所述高频IMF的预测值、所述其它IMF分量的预测值以及所述趋势分量的预测值的第二线性叠加值,并将所述第二线性叠加值确定为所述待预测地理位置的AQI预测值。

可选的,CEEMD模块102用于向所述历史AQI数据序列中加入辅助白噪声,获得两个新的集合IMF信号;其中,向所述历史AQI数据序列中加入辅助白噪声是以期望为0,标准差为0.2,正负成对且呈正态分布的形式加入;基于经验模态分解EMD对所述两个新的集合IMF信号中的每一个信号进行分解,获得每个新的集合IMF的IMF分量;判断循环次数是否达到预设次数N;当循环次数未达到预设次数时,再次执行:向所述历史AQI数据序列中加入辅助白噪声,获得两个新的集合IMF信号,以及基于经验模态分解EMD对所述两个新的集合IMF信号中的每一个信号进行分解,获得每个新的集合IMF的IMF分量;当所述循环次数达到所述预设次数N时,获得2N组IMF分量,确定所述2N组IMF分量的平均值为所述历史AQI数据的所述m个IMF分量和所述趋势分量;其中,每组IMF分量均包括m个IMF分量和一个趋势分量。

可选的,第二获得模块103用于按照频率从高到低对所述m个IMF分量进行排序;确定满足预设条件的IMF分量为所述高频IMF分量。

可选的,VMD分解模块104用于初始化和n;其中,为第1次迭代中的第k个模态函数,为的傅里叶转换,λ表示朗格拉日乘法算子,{λ1}为第1次迭代中的拉格朗日乘法算子,为{λ1}的傅里叶转换,为初始化中心频率,uk为k个模态函数,ωk为中心频率,n为迭代次数;根据下列公式更新uk:根据下列公式更新ωk:其中,为当前剩余量的维纳滤波,为当前模态函数功率谱的重心,分别为g(t)、ui(t)、λ(t)和的傅里叶转换,g(t)为所述高频IMF分量,ui(t)为第i个模态函数,λ(t)为拉格朗日乘法算子,为uk经过n+1次迭代后的值,1≤i≤k,α为二次惩罚因子;根据下列公式更新λ:其中,为λ(ω)经过n次迭代后的傅里叶转换,为λ(ω)经过n+1次迭代后的傅里叶转换,τ为更新系数;判断是否成立,其中,e>0;为uk经过n次迭代后的傅里叶转换;当成立时,将uk作为所述n个VM分量;当不成立时,再次更新uk和ωk

可选的,极限学习模块105用于基于极限学习机模型,根据所述n个VM分量中每个VM分量的每前8个数据预测第9个数据,获得每个VM分量的预测值,进而获得所述n个VM分量的预测值;基于极限学习机模型,根据所述其它IMF分量中每个IMF分量的每前8个数据预测第9个数据,获得每个IMF分量的预测值,进而获得所述其它IMF分量的预测值;基于极限学习机模型,根据所述趋势分量的每前8个数据预测第9个数据,获得所述趋势分量的预测值。

可选的,所述历史AQI数据的长度大于500。

前述图1-图7实施例中的AQI预测方法的各种变化方式和具体实例同样适用于本实施例的AQI预测装置,通过前述对AQI预测方法的详细描述,本领域技术人员可以清楚的知道本实施例中AQI预测装置的实施方法,所以为了说明书的简洁,在此不再详述。

本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:

在本发明实施例的技术方案中,首先通过CEEMD将非平稳的历史AQI数据序列分解成一系列具有不同频率特征的IMF分量和趋势分量,然后,通过VMD将其中的每个高频IMF分量进一步分解为若干VM分量,进一步通过极限学习机模型对各个VM分量以及除高频IMF分量以外的其它IMF分量和趋势分量进行预测,并将与每个高频IMF分量对应的VM分量的预测值进行线性叠加得到该IMF的预测值,最后通过将所有IMF及趋势分量的预测值进行线性叠加得到最终的AQI预测值。相较于现有技术,对于AQI的预测具有更高的精度。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1