正文:i。再由(3)式求出b
0,把求出的b
0和b
i代回(1)式,即得要求的多元线性回归方程。
在实际计算中,由于变量Y和X
%20i可能有不同的量纲和数值上的很大差异,而正规方程组(5)的系数矩阵(S
IJ),又都是X的二次项,所以S
IJ之间在数值上的差异可能非常之大,求解时难免会带来较大的舍入误差。为了避免这一点,常将正规方程组(3-2)标准化(过程略)。结果得正规方程组的标准形式:
%20
%20 %20
%20 (6)
式中:%20
%20为标准回归系数;%20
%20为变量%20
%20和%20
%20之间的单相关系数;%20
%20为变量%20
%20和Y之间的单相关系数。它们都是无因次量。且恒有%20
%20。
由于软件技术的发展,这些复杂的计算过程都已经可以在计算机软件(如SPSS.15)中解决。
3.2检验
建立的回归方程并不一定能正确反映Y和X的变化规律。因为用最小二乘法建立回归方程时并没有用到Y和X必然存在线性相关的假定,即使观测值在散点图上呈现完全散乱的点子,没有线性相关,同样可以建立一个回归方程,只是这种方程毫无价值而已。所以还要解决两个问题:①变量之间的线性相关是否存在,即变量的相关程度问题。也就是所谓的拟合优度问题,即本多元线性回归模型的误差是最小的;②用回归方程预报时,能有多大的随机误差,即预报的精度问题。这是检验回归方程有无实际价值的两个重要问题。对这两个问题,可以运用统计学的方法进行检验。
3.2.1%20
变量的相关程度
这实际上包括两个检验。一个是Y和X
i整体之间的相关程度,即回归模型的整体显著性。二是X
I与Y之间的相关度,各自变量显著性。前者用F检验来测试,后者用t-test%20来测试。
3.2.1a%20Y和Xi整体之间的相关程度,即回归模型的整体显著
H
0:Y与X
I整体之间不相关;H
1:%20Y与X
I整体之间相关.
%20 %20(6)
而,%20
需要注意的是在此处R是复相关系数。b
i’是X
i的标准回归系数;%20
%20为变量%20
%20和Y之间的单相关系数。
把%20
%20值同临界值%20
%20作比较。若计算的%20
%20<%20
%20,则说明Y和X
i整体之间的线性关系不显著;若%20
%20>%20
%20则表明线性关系显著,拒绝H
0,。说明所建的回归方程基本上反映了Y和X
i整体之间的变化规律。
3.2.1b自变量回归显著性检验。
假设H
0:b
i=0,回归变量作用不显著;H
1:b
i≠0,回归变量的作用显著。
构建统计量: %20
(7)
其中
—回归系数b
i的最小二乘估计;
—标准残差;
—矩阵(XX
-1)主对角上第
i+1个元素,如果T的绝对值
tav—自由度为v的分布水平双侧分为数V=n-p-1
3.2预报精度
用剩余的均方差
%20作为衡量回归方程预报精度的指标。%20
%20=%20
所谓预报精度问题,就是在一定的显著性水平α下寻找一个偏差δ,使得按给定的X预报Y时的观测值,以(1-α)的概率落在(Y-δ,%20Y+δ)的区间内,即:
3/8 首页 上一页 1 2 3 4 5 6 下一页 尾页