摘要:本文利用统计软件Eviews3.1对四川省宜宾市政府2004 年10月1日到11月30日的PM10浓度时间序列数据进行了分析,建立了ARMA 模型并对2004年12月1至3日的PM10浓度进行了预测。结果表明模型有较好的预测效果。
关键词: ARMA 模型;Eviews3.1;预测
Abstract: In this paper, the author analyzes PM10 time-series datas of Yibin city, Sichuan Province from October 1, 2004 to November 30 , using Eviews3.1.The author establishes ARMA model and predictes PM10 Concentration from December1,2004 to December 3,2004.The result shows that the model has a good prediction effect.
Key words:ARMA model; Eviews3.1 ;prediction
1 时间序列模型(ARMA)简述
ARMA模型是20世纪70 年代由计量经济学家Box-Jenkins创立的,用于对随机时间序列进行分析研究的一种方法。Box在文[1]对ARMA(p,q)模型给出了具体的建模方法。
ARMA模型把时间序列作为随机过程来研究,必须考虑时间序列的统计特性。虽然对事物变化的全过程进行一次观测所得的结果,即时间序列的单个变量值的出现具有不确定性,但整个时间序列的变化却具有一定的规律性。一般说来,除少数情况以外,时间序列具有自相关性、动态记忆性等特征。自相关性是指时间序列各观测值之间的依存关系,这种关系可以用相关函数来表示;动态记忆性是从系统的观点来看,在某一时刻进入系统的输入对系统后继行为的影响;自相关性、动态记忆性表现了事物发展的延续性。ARMA 模型就是对时间序列的自相关性、自身的动态记忆性的具体描述,建模的过程就是动态记忆性的量化过程。
根据时间序列动态记忆性的内容不同,ARMA 模型有三种类型:自回归(AR:Auto-Regressive)模型、移动平均(MA:Moving-Average)模型和自回归移动平均(ARMA:Auto-Regressive Moving-Average)模型。
AR(p)即P阶自回归模型的形式为:
MA(q)即q阶移动平均模型的形式为:
ARMA(p,q)即p阶自回归q 阶移动平均模型的形式为:
式中,et为随机扰动项。
从以上三种模型的形式可知,AR模型描述的是系统对过去自身状态的记忆,MA模型描述的是系统对过去时刻进入系统的噪声(随机扰动项)的记忆,而ARMA模型则是系统对过去自身状态以及进入系统的噪声的记忆。
2 PM10浓度时间序列模型的建立
2004年10月1日至12月3日的四川省宜宾市2004年度宜宾市政府的PM10浓度数据资料见表1。本文将此数据序列简记为yt序列,仅对2004年10月1日至11月30的数据利用Box-Jenkins方法建立ARMA模型,其过程如下,
表1 2004年10月1日至2004年12月3日四川省宜宾市的PM10浓度 单位:(mg/m3) 时间 浓度 时间 浓度 时间 浓度 时间 浓度 2004.10.01 0.093 2004.10.17 0.062 2004.11.02 0.099 2004.11.18 0.086 2004.10.02 0.091 2004.10.18 0.079 2004.11.03 0.122 2004.11.19 0.105 2004.10.03 0.093 2004.10.19 0.076 2004.11.04 0.120 2004.11.20 0.067 2004.10.04 0.085 2004.10.20 0.080 2004.11.05 0.115 2004.11.21 0.086 2004.10.05 0.097 2004.10.21 0.095 2004.11.06 0.120 2004.11.22 0.094 2004.10.06 0.086 2004.10.22 0.048 2004.11.07 0.104 2004.11.23 0.099 2004.10.07 0.117 2004.10.23 0.053 2004.11.08 0.101 2004.11.24 0.101 2004.10.08 0.150 2004.10.24 0.056 2004.11.09 0.085 2004.11.25 0.066 2004.10.09 0.204 2004.10.25 0.062 2004.11.10 0.096 2004.11.26 0.051 2004.10.10 0.261 2004.10.26 0.078 2004.11.11 0.067 2004.11.27 0.055 2004.10.11 0.153 2004.10.27 0.080 2004.11.12 0.073 2004.11.28 0.079 2004.10.12 0.148 2004.10.28 0.077 2004.11.13 0.062 2004.11.29 0.112 2004.10.13 0.147 2004.10.29 0.097 2004.11.14 0.068 2004.11.30 0.108 2004.10.14 0.125 2004.10.30 0.119 2004.11.15 0.059 2004.12.01 0.107 2004.10.15 0.109 2004.10.31 0.117 2004.11.16 0.074 2004.12.02 0.086 2004.10.16 0.074 2004.11.01 0.115 2004.11.17 0.078 2004.12.03 0.083 数据来源:四川省宜宾市监测站
2.1 PM10浓度时间序列的平稳性检验
利用Eviews3.1软件[3]绘制的2004年10月1日至11月30日的四川省宜宾市的PM10浓度时间序列数据图如图1所示。从数据图可知该序列没有明显变化趋势。
图1 PM10浓度时间序列图
利用Eviews3.1软件对原序列进行ADF单位根检验[2]的结果如表2。当置信度取10% 时,ADF值小于-2.5932,可以得知该序列不含单位根,也就是可以认为该序列平稳。序列的自相关和偏自相关系数图也显示大多数自相关和偏自相关系数值落在置信区间里面,因此可以认为该序列是一个随机时间序列。因此,可以对该样本建立ARMA模型。
表2 PM10浓度单位根检验结果
ADF Test Statistic
-2.749990 1% Critical Value -3.5457 5% Critical Value -2.9118 10% Critical Value -2.5932
2.2 PM10浓度时间序列模型识别与定阶
对此时间序列利用Eviews3.1软件计算自相关和偏自相关函数如图2。从图中可以初步选定模型ARMA(1,1),ARMA(1,2), ARMA(1,3),ARMA(6,1),ARMA(6,2),ARMA(6,3)。
图2 序列yt的AC 与PAC 图
2.3 PM10浓度时间序列模型的建立与检验
表3 模型的检验结果 (p,q) AdjustedR-squared AIC BIC (1,1) 0.554467 -4.564213 -4.494402 (1,2) 0.547533 -4.532828 -4.428111 (1,3) 0.540793 4.502409 -4.362786 (6,1) 0.544155 -4.370946 -4.115468 (6,2) 0.566704 -4.406368 -4.114393 (6,3) 0.678983 -4.691438 -4.362966 对于上述选择的四个阶数不同的ARMA 模型,将综合考虑用AIC 准则和Schwarz 准则以及校正R2来确定模型的阶数以找到对最适合此序列的模型。运用Eviews3.1 软件,对序列分别利用四个模型进行分析,通过比较四个模型分析结果,此时间序列yt更适合拟合ARMA(6,3) 模型。即: yt=0.645495yt-1+0.543310yt-2+0.292824yt-3-0.745655yt-4+0.182398yt-5+0.071807yt-6+et+0.405097et-1-0.321897et-2-0.937163et-3
表4 ARMA(6, 3)模型各项系数 Variable Coefficient Std. Error t-Statistic Prob. AR(1) 0.645495 0.132000 4.890119 0.0000 AR(2) 0.543310 0.140570 3.865040 0.0003 AR(3) 0.292824 0.143950 2.034211 0.0477 AR(4) -0.745655 0.151733 -4.914255 0.0000 AR(5) 0.182398 0.164989 1.105519 0.2747 AR(6) 0.071807 0.138772 0.517446 0.6073 MA(1) 0.405097 0.055800 7.259868 0.0000 MA(2) -0.321897 0.050898 -6.324346 0.0000 MA(3) -0.937163 0.000232 -4032.527 0.0000 R-squared 0.726541 Mean dependent var 0.096982 Adjusted R-squared 0.678983 S.D. dependent var 0.037975 S.E. of regression 0.021516 Akaike info criterion -4.691438 Sum squared resid 0.021296 Schwarz criterion -4.362966 Log likelihood 138.0146 Durbin-Watson stat 1.918721 Inverted AR Roots .99 .58+.28i .58 -.28i -.21 -.65+.66i -.65 -.66i Inverted MA Roots .96 -.68 -.72i -.68+.72i 对此模型的残差进行检验,得到残差的自相关图和偏自相关图。图形表明,模型的残差都在置信区间范围内,可认为与0无明显差异,已基本上消除了自相关和偏自相关,表明残差序列是独立的。