正文:
而,%20
%20 %20(8)
这说明,在一定的样本观测值和显著性水平下,给出的X越接近%20
%20,δ越小。如在(X,Y)平面上划成曲线,则%20
%20形成一个包围回归直线的带域,在%20
%20处带域最窄。因此,如果给出X预报Y时,则预报区间越短(X越靠近%20
%20),带域宽度越窄,说明预报的精度越高。
在实际计算中,n值往往过大,要求的预报区间较短,这时%20
%20,结果得预报区间的近似式:%20
%20=68.3%
这说明,观测值Y可能落在%20
%20之间的概率为68.3%,同样,观测值Y落在%20
%20之间的概率为95.4%,落在%20
%20之间的概率为99.7%,即:%20
%20=95.4%;%20
%20=99.7%
%20称为可信区间。用回归方程预报Y时,%20
%20越小,可信区间越窄,预报的精度越高。当r=1时,Y和X呈函数关系,这时%20
%20=0,表示所有观测值都落在配合直线上。
%20
3.3、回归模型基本假设诊断
3.3.1多重共线性诊断
%20如果某两个或多个解释变量之间出现了近似相关性,则称为多重共线性。多重共线性的诊断方法有很多,本研究采用SPSS提供的方差膨胀因子方法。其原理为:
%20设计辅助函数
作OLS回归后得判定系数R
i2,定义方差膨胀因子为下式,因子越大,多重共线性越明显:
%20
一般认为%20VIF
i>8或10时,多重共线性显著,且X
i为多余变量.
3.3.2%20
异方差性诊断
` %20对于多元线性回归方程%20Y
i=f(X
i,u
i),如果随着样本观察值X
i的变化,u
i的方差为常数,与
i无关,即假定%20Var(u
i)=s
u2=常数被满足%20,则称模型是具有同方差性的。如果假定不被满足,即u
i的方差随着Xi的变化而变化Var(u
i)=s
ui2=%20s
u2%20f(X
i)≠常数,则称模型具有异方差性。对于异方差性的检验,已经发现了一些检验方法,主要有图示检验法,等级相关系数法和
Goldfeld—Quandt检验等。本研究采用直观实用的图示检验法。
用标准化残差做统计检验量:
%20
%20式中,%20
%20%20是第
i个残差的标准差,其计算公式为:
根据标准化残差图可以直观地判断误差项ε服从正态分布这一假定是否成立。如果这一假定成立,那么标准化残差的分布也应该服从正态分布。因此在标准化残差图中,大约有95%的标准化残差在-2~+2之间。SPSS统计软件有生成这个图形的功能。
3.3.3%20
自相关性诊断
自相关又称序列相关。用公式表示为E(U
IU
J)≠0%20I≠J,如果存在自相关,继续用最小二乘法进行参数估计会带来一系列后果。得到的参数估计是无偏的,但不是有效估计量;常用的检验方法会得到严重错误的结论,预测的结果也会失败。对自相关的存在与否可以进行各种检验,其中用得最多的是Durbin-Watson检验法。因为大多数涉及到时间序列的数据都表现出正的自相关性,所以Durbin-Watson检验法假设:
H
0:ρ=0,序列不存在自相关性;H
1:ρ≠0,序列存在自相关性。
检验统计量: %20
其中,
,
和
分别是各期的观测值和预测值。随着系列相关度变大,d值变小。D
u和d
l 分别是临界值的上界和下界。他们可以通过对应K(解释变量个数)和n(观测值个数)查表获得。
如果d<d
l 拒绝H
0: ρ=0
如果d>d
u 不拒绝H
0: ρ=0
如果d
l<d<d
u 不能确定
四、研究分析
下面就运用前述线性回归原理建立内地赴澳门游客量预测模型,并做出预测。
4.1变量和数据
从前面的分析中,我们知道,影响游客需求的经济变量有很多,而人们总是根据不同的研究目的选定因变量,再确定与之相适应的自变量。考虑到澳门的特殊情况,并通过对描述统计图的直观观察发现:内地赴澳游客量的变化,主要受中国内地的经济发展和人民收入因素影响。因此,本研究选择大陆人均可支配收入(personal discretionary income)、中国国内生产总值(CGDP)两地商品进出口贸易总额(TT)、中国消费物价指数(CCPI)、港币与人民币汇率(ERHC)作为观察的预测变量。表2是2001年1季度—2008年1季度各变量季度数据,表中已经注明各数据的来源。
4/8 首页 上一页 2 3 4 5 6 7 下一页 尾页