内容摘要:我国区域经济发展差距日益引起重视。一般认为,基础设施在区域空间系统形成与演进中发挥出基础性作用。因为,在社会化大生产和专业化分工过程中,市场范围的扩大以良好的基础设施为前提。但是,必须辩证地认识到,基础设施在空间层面的区域非均衡性往往受制于区域经济和社会发展的诸多差异性因素,两者是双向多重的动态相关关系。本文主要采用因子分析和结构方程模型这两种方法来分析我国省际基础设施差异及其影响因素的问题。
关键词:基础设施;省际差距;实证分析
20世纪中期以后,西方发达国家的经济增长率大幅下降,许多经济学家都对此产生浓厚的兴趣。诸多实证研究指向一点,即基础设施投资部分显得不足,以至于造成经济增长的缓滞。于是,基础设施的省际差距也应当会造成省际增长率的差异,基于此,学术界在涉及研究我国不同省份之间经济发展水平的差异时,往往要将基础设施作为外生变量放入计量模型。然而,基础设施所涉及的变量很广,而大多数学者都采用了比较“变通”的方式进行研究。比如选用铁路和公路密度(许召元和李善同,2006;罗长远,2006)、各种与基础设施相关的财政支出(郭庆旺和贾俊雪,2006)、城市化比率(踪家峰和李静,2006)等指标来指代基础设施。但这样会带来一些新的问题,比如指代基础设施的数据往往过于片面,根据这些指标得出的基础设施对经济增长的贡献值也就显得多少有些“单薄”。而且,基础设施更多地表现为实物,一味地采用价值量来衡量基础设施往往由于地区差异而减损了其本有的统计特征。举例而言,同样一笔用于基础设施的支出,即使是在上海和安徽这两个并不遥远的地方,所能带来的基础设施产出及其效应都会大不一样(骆永民,2008)。
基于上述讨论,本文十分关心如何能采用更多的指标来更加全面地反应基础设施的省际差异问题,并且哪些指标能够对基础设施的省际差异差生巨大影响。
一、基本方法简介
由于本文试图采用更加广泛的基础设施内容来进行分析,故而需要采用十几个甚至几十个指标来综合反映各个省份的基础设施,为此我们需要设计一些“潜变量”(由其他指标聚合而成的变量)。常规的设计潜变量的方法有两种,一种是基于主成分分析的因子分析,另一种是基于结构方程模型的所谓探索性因子分析。本文需要一方面讨论基础设施的省际差异,一方面讨论省际差异的原因,故而我们综合使用了两种方法。
基础设施是一个涵义十分丰富的概念,要想找到一个合适的指标来指代基础设施的全部内容也是徒劳的,于是为了尽可能少地损失各种指标所给我们带来的信息,因子分析和结构方程模型无疑是我们最好的选择。本文曾经试图采用主成分得分和主成分回归法来讨论基础设施的省际差异以及基础设施对经济增长的促进作用,但在分析之后发现该种方法本身存在一定的问题,且为经济增长和公共物品提供人为地确定了一个因果顺序。所以在讨论省际差异时为了直接得到相关的因子得分并为结构方程模型提供聚合方式的选择提供建议,本文主要采用了因子分析作为分析方法,而讨论省际差异的形成因素时,则主要采用结构方程模型进行分析。下面我们对因子分析和结构方程模型做一简介。
1、因子分析简介
因子分析是从研究矩阵内部各变量之间的相关关系出发,找出控制所有变量的少数几个公因子,将每个指标变量表示成公因子的线性组合,以再现原始变量与因子之间的相关关系。假设有N个样本,P个指标,X=(x1,x2,…,xp)T为可以观测的随机向量,要寻找的公因子为F=(F1,F2,...,Fm)T,模型为:
X1 = a11F1 + a12F2 + ...... + a1mFm + ε1
X2 = a21F1 + a22F2 + ...... + a2mFm + ε2
、…… ……
Xp = ap1F1 + ap2F2 + ...... + apmFm + εp(1)
在进行相关系数检验后求出各因子的得分值并进行分析。因子得分模型为:
Fi= bi1X1+ bi2X2 + …+ binXn, ( i= 1, 2 ,…, m ) (2)
本文将采用主成分分析法来选择公共因子,并结合SPSS统计软件进行分析。具体的分析步骤如下:
第一,进行信度分析,看这些指标是否内在一致。目前国外最常用的信度指标是Cronbach的α信度系数。Cronbach认为,α小于0.35为低信度,在0.35和0.7之间为中信度,在0.7以上为高信度。
第二,在进行因子分析之前,还必须进行KMO抽样适当性参数(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)检验和Bartlett球形检验(Bartlett’s Test of Sphericity)。前者衡量的是这些变量之间的偏相关性。通常认为,该值在0.7以上效果较好,0.6时效果很差,0.5以下不适合进行因子分析。后者衡量的是这些相关阵是否是单位阵,若拒绝该假设则说明这些变量之间的确存在相关关系。这两个参数检验皆通过,则说明这些变量间存在共同因素,适合进行因子分析。
第三,对选入的指标进行因子分析,按照相应的计量要求提取公共因子,并以公共因子的大小指代相应基础设施的提供情况。
2、结构方程模型简介
因子分析可以得到反映基础设施省际水平的因子得分,但这一得分却并不十分适宜进行影响因素回归分析。因为影响因素很可能和基础设施是双向因果关系,比如GDP差距既是基础设施差距的原因,同时也是基础设施差距形成的结果。这样常规的回归分析显得十分无力,而我们采用的又是截面数据,不可能采用双向因果的VAR模型或者其他相关模型进行内生化模型研究。为此,能同时处理双向因果关系或者相关关系的结构方程模型就显得十分可取。下面我们介绍一下结构方程模型的基本用法。
结构方程模型( Structural Equation Modeling,简称SEM)是一种非常通用的综合性统计分析技术和模型方法,主要利用联立方程求解。而这种分析方法又显然不同于计量经济学中的联立方程模型,计量经济学中的联立方程模型只能处理可测量的变量间的复杂关系,而结构方程模型不仅可以处理可测变量间的相互因果联系,更能利用因子分析的方式构建多个“潜变量”,并讨论潜变量之间或者潜变量和可测变量之间的复杂关系。显然,结构方程模型为高度抽象并难以测量的变量提供了进行计量的可能。正是因为结构方程模型的这种显著优越性,才使其成为近年来心理学、社会学和经济学研究中极其重要的实证方法,其具体的估计方式可用如下方程式表达:
测量方程:x =Λxξ+δ,y =Λyη +ε (3)
结构方程:η =Bη +Γξ+ζ (4)
方程中各变量含义如下:x为外生观测变量(在因子分析中用来生成外生潜变量的那些变量),ξ为外生潜变量,Λx为外生观测变量在外生潜变量上的因子载荷矩阵,δ为外生观测变量的误差项。y为内生观测变量(在因子分析中用来生成内生潜变量的那些变量),η为内生潜变量,Λy为内生观测变量在内生潜变量上的因子载荷矩阵,ε为内生变量的误差项。B 和Γ都是路径系数,B 表示内生潜变量之间的关系,Γ则表示外生潜变量对于内生潜变量值的影响,ζ为结构方程的误差项。