
第四节 空间相依性的表现形式
本节根据空间计量经济模型的结构特征,对空间计量经济学一般模型的设定类型进行了分类,并对空间计量经济模型之间的转换关系进行了说明。空间计量经济研究的主要模型分为以下几种类型:空间滞后模型、空间误差结构模型、高阶空间自回归模型、混合空间过程模型,以及时空面板模型等。在空间计量经济模型的估计中,以空间滞后和空间误差模型的估计为代表,说明了对具有非均匀误差和包含空间滞后因变量的空间回归模型的估计特点,并给出了相应的估计子。
一 空间相依性的随机过程模型
空间相依性的数学表达式可以通过一个空间随机过程构造一定空间位置上的随机变量与其他空间位置上的同一变量之间的函数关系来表示。空间相依性说明邻近观测单元抽取的样本是相互关联的,而不是独立的。可见,空间随机过程并不满足传统概率统计方法假设经济变量是纯随机变量,并要求观测样本是相互独立且服从一定概率分布的条件。因而,基于观测样本的空间分布特征,空间自相关的存在说明传统的统计推断与检验方法在揭示经济变量的空间变化性上的局限性。因此,空间相依性意味着一定空间位置上的经济变量不是纯随机变量,而是既有随机性的特征,又有结构性特征的随机经济变量。
(一)一阶纯空间自回归过程模型(SAR)和空间移动平均过程模型(SMA)
空间自相关与时间序列分析(yt=ρyt-1+εt)类似,空间随机过程可以分为一阶纯空间自回归过程(SAR)和空间移动平均过程(SMA),其定义分别见下式(2-6)和(2-7):
y=ρWy+ε 或 y=(I-ρW)-1ε (2-6)
y=λWy+ε 或 y=(I+λW)ε (2-7)
其中,W表示元素行列为n×n的空间权重矩阵;y为n×1的随机变量;ε为n×1的误差向量,并且服从均值为零和方差为σ2的正态分布;I是n×n的单位矩阵;ρ、λ分别为空间自回归和空间移动平均参数。另外,与一阶纯空间自回归过程和空间移动平均过程相对应的协方差定义分别见下式(2-8)和(2-9):
Cov(y,y)=σ2[(I-ρW)′(I-ρW)]-1 (2-8)
Cov(y,y)=σ2[I+λ(W+W′)+λ2WW′] (2-9)
更一般的情况,E(εε′)=σ2Ω,并允许异方差的存在,其中,Ω为空间相关矩阵。那么,式(2-8)的协方差矩阵可以表示为:
Cov(y,y)=σ2[(I-ρW)-1Ω(I-ρW′)]-1 (2-10)
由于空间权重矩阵W不是对称矩阵,特别是在行标准化后,或利用κ最邻近方法之后,因此,(I-ρW)-1≠(I-ρW′)-1,它的逆可以扩展为一个无穷级数,即可以得到如下高阶扩展式(2-11):
(I-ρW)-1=I+ρW+ρ2W2+ρ3W3+… (2-11)
类似地,由W′可以得到两个转置矩阵积的扩展式,见如下表达式(2-12):
I+ρ(W+W′)+ρ2(WW+WW′+W′W′)+ρ3(WWW+WWW′+WW′W′)+… (2-12)
其中,ρ用最小二乘法得到的估计为,但由于最小二乘法的有偏性,并不能保证
的无偏性,即
。为了保证空间自回归系数ρ的无偏性和一致性,可以用最大似然法的无偏估计方法进行估计,详见James P.LeSage(1999)[1]。σ2的最大似然法估计为
。一阶纯空间自回归过程的协方差矩阵的结构表明,任一空间位置上的冲击将会产生一个空间乘数效应影响到其他所有空间邻近位置,即使SAR过程中的空间权重矩阵W仅涉及一阶邻域,但协方差的空间影响结果远远超过一阶邻域,包括全局空间自相关,但对于更高阶的邻近权重矩阵来说,空间随机过程更复杂,并且协方差的强度呈现减弱趋势。
空间移动平均过程的协方差则表明SMA过程不会像空间自回归过程一样产生一个空间乘数效应,仅通过一阶(W)或二阶(WW′)邻近权重矩阵产生局部的空间相互作用,它揭示的是局部空间自相关模式。式(2-9)说明与W(W′)或WW′中的非0元素相对应,对角线以外的元素为非0。在一阶邻近权重矩阵W的情况下,矩阵的积WW′中的元素对于一阶和二阶邻域都为非0,而对于二阶以上的空间邻域来说不存在空间协方差过程。
另外,空间随机过程与时间序列随机过程的显著差别在于即使误差向量ε满足独立同分布,式(2-8)和式(2-9)中的对角线元素也不是常数[见式(2-12)],即存在异方差性。此外,异方差取决于空间权重矩阵W中的邻近结构,并涉及复杂的估计与检验[2]。因此,随机变量y的协方差过程并不总是平稳的。
(二)空间条件自回归过程(SCAR)
除了应用SAR和SMA两种类型的空间随机过程模拟空间相关性结构性的方法以外,第三种类型的空间随机过程就是基于条件分布的空间条件自回归过程(SCAR)得到日益关注,例如,贝叶斯空间模拟等。通过建立给定观测单元的随机变量在邻近观测单元条件下的密度函数,构造一个合理的联合密度函数,并假设服从正态分布并忽略异方差性。那么,空间观测单元i在其他空间观测单元给定的条件下,它的条件数学期望可以作为邻近单元的线性函数表示为CAR模型,见下式:

对于给定的wij,存在具有以下方差的联合多元正态分布:
E[yy′]=σ2(I-ρW)-1 (2-14)
式(2-14)的方差结构还可以扩展到Logistic和Poisson空间自相关模型,该等式具有两个重要特征。第一,空间权重矩阵W具有对称特征,但不包括行标准化或κ最邻近空间权重矩阵,而且对空间自回归系数ρ产生显著影响,比在行标准化空间权重矩阵的情景下的ρ小得多。第二,CAR模型所产生的空间协方差的范围和强度要比相应的SAR模型小得多[见SAR模型中的扩展式(2-11)和(2-12)]。
(三)空间误差成分模型(SEC)
产生空间自相关的另一种模型是空间误差成分模型,一些文献将这种误差项分解为特定位置或局部成分的误差和区域邻近效应或外溢效应成分两部分(见Kelejian and Robinson 1993,1995)[3]。在空间误差成分模型中,误差项可以表示为:
ε=Wη+ξ (2-15)
其中,ε为误差项;η为n×1误差成分向量,为体现区域邻近效应或外溢效应的误差成分;ξ为n×1特定位置或局部成分的误差成分向量。每个误差成分均值都为0并服从独立同分布。即:E(η)=E(ξ)=0,E(ηη′)=σ2ηI,E(ξξ′)=σ2ξI,E(ηiξj)=0,∀i,j。那么,误差的空间方差-协方差矩阵见下式:
Cov(ε,ε)=σ2ηWW′+σ2ξI (2-16)
其中,σ2η、σ2ξ分别为涉及区域邻近效应和特定位置变化的空间方差成分;WW′为矩阵之积,并具有正定性;I为单位矩阵。因此,误差的空间方差-协方差矩阵是具有σ2η≥0和σ2ξ>0的正定矩阵。
通过比较式(2-16)与(2-9)的方差项可以发现,SEC模型的空间过程非常类似于SMA的空间过程,两个模型都有I和WW′项,但SEC模型中并没有W和W′项,并不是像SMA过程一样仅涉及单一的误差项ε,而是涉及两个互不相关的误差成分项η和ξ。因此,这意味着SEC模型所体现的空间相互作用仅是SMA模型所反映的空间相互作用的一个子集。此外,通过W的一阶邻域结构可以看出,空间误差协方差仅含有WW′的非零项中所包含的一阶邻域结构,超过二阶邻域则不存在任何空间自相关。
(四)时空因子误差成分模型(FSEC)
在面板数据模型中,通常假设有未观测到的误差成分存在,并由给定时间段中所有横截面观测单元所产生,即一种与位置和时间有关的误差项,以及一个特殊的误差项。这提出了空间自相关的一种特殊形式,即所有误差项都是等相关的。其中,时间误差成分被表示为由所有横截面观测单元所产生的一个未观测到的共同效应,用因子ft来表示,但不像标准的SEC模型,每个横截面观测单元都对因子ft有一个显著影响。位置为i和时间为t的误差项εit可以表示如下:
εit=δift+ξit (2-17)
其中,ft为横截面观测单元所产生的一个未观测到的共同效应;δi为对因子ft的一个特定横截面影响因素;ξit为均值为0的独立同分布的误差项。因此,观测单元位置为i和j之间、时间为t的横截面空间协方差可以表示如下:
Cov(εit,εjt)=δiδjσ2f (2-18)
以上因子误差成分模型可以扩展到多个因子[4]。例如,可以包含多个因子和相应的由横截面差异所产生的影响因素。
(五)空间随机过程的渐近性
正如时间序列分析一样,空间随机过程的估计子求解和统计检验是以空间渐近性为基础的,并利用大数定律和中心极限理论进行最优无偏估计,包括估计的一致性、渐近有效性、渐近正态性。然而,空间计量分析并不是简单地从一维时间序列分析扩展到二维空间随机过程分析。因为,实际情景要复杂得多,有关空间相依性分析的文献也有限。首先,空间随机过程要满足大数定律和中心极限定理,建立估计子的一致性和渐近正态性,需要对空间序列中所产生的相依性和异质性进行条件约束。例如,对于SAR和SMA模型中所产生的异方差来说,依赖传统相关平稳序列的分析方法显然不适用于空间随机过程SAR和SMA模型。除了传统的类似于时间域中不同相关过程的矩条件外,特定的空间条件用于对空间系数有关的空间权重和参数空间进行约束。实际上,基于简单空间邻近结构的大多数空间权重满足这些条件,而对于基于经济距离的一般权重情况并没有要求。
空间渐近性的第二个显著特点是可以用两种不同的方式逼近极限,即通过递增域渐近方法和填实渐近方法[5]。递增域渐近方法是由一个在边缘(边界点)不断地增加新的观测单元的抽样结构组成的,类似于时间序列分析中的一般渐近方法。填实渐近方法适用于空间域是有界的情景,通过在已有观测单元之间增加新的观测单元,以此产生一个不断致密的空间域。用于递增域渐近方法的许多分析并不完全适用于填实渐近方法。在大多数空间计量经济学的应用中,默认的空间结构是一个递增域。
最后,对于涉及空间权重的空间过程来说,空间渐近性需要考虑适用三角矩阵的大数定律(CLT)和中心极限定理(LLN)[6]。这是因为对于边界观测单元来说,样本权重矩阵随着增加新的观测单元而变化。也就是说,新增加的观测单元改变了已有观测单元的邻近结构[7]。同时,增加了空间过程的复杂度,而时间序列分析则不会出现这种情况。
二 空间相依性的距离衰减函数模型
空间自相关性除了空间随机过程的表示方法以外,还可以用更简洁的形式,用更少的参数或外生变量距离倒数函数来直接表示方差-协方差矩阵中的元素,例如:
Cov[εiεj]=σ2f(dij,φ) (2-19)
其中,εi、εj为回归误差项;σ2为误差方差;f为距离衰减函数;dij为观测单元位置i与j之间的距离;φ为n×1维参数向量。基于距离衰减函数的方差-协方差矩阵可表示如下:
Cov[ε,ε]=σ2Ω(dij,φ) (2-20)
其中,Ω(dij,φ)为正定空间相关矩阵。特别是当dij=0时,f(dij,φ)=1,以保证空间相关矩阵中的元素ωii=1,|ωij|≤1,∀i,j。因此,与SAR和SMA空间随机过程相比,由于Ω矩阵的对角线元素为常数,这种用距离函数表示的空间自相关模型并没有产生异方差性。这种模型主要应用在房地产开发的空间计量分析中,以揭示基于距离衰减函数的空间集聚现象。
最后,需要说明的是距离衰减函数的选择并不是随意的,它决定了模拟全局空间自相关的程度,并需要确保协方差矩阵正定性的约束,以及考虑距离度量的尺度和单位。例如,负指数距离衰减函数的应用等,以产生一个有效的空间相关矩阵。
三 空间相依性的非参数距离模型
空间自相关的非参数距离模型是对基于距离函数的空间协方差表示方法的一种补充,也是对基于异方差的空间域与空间协方差矩阵估计方法的一个扩展。非参数距离模型的空间协方差是不同观测位置的距离函数,但函数形式并没有设定,并不要求一个明确的空间过程或距离衰减的函数形式,而是采用非参数的方法估计矩阵中的元素。例如,在空间面板模型中,可以避免用描述空间相关性变化的距离窗宽,而是通过应用基于矩条件的每个时间期的横截面均值,以及在时间维上的渐近特性,以此产生一个空间协方差结构的估计子。见如下基于回归误差项的空间协方差矩阵中的元素:
Cov(εi,εj)=f(dij) (2-21)
其中,εi、εj为回归误差项;f为距离衰减函数;dij为观测单元位置i与j之间的合理度量单位的距离[8]。对于V=n-1X′∑X的最简单的估计形式有:

其中,δ为距离的截止值;xi、xj分别为观测单元位置i和j的列向量;X为距离向量;、
分别为观测单元位置i和j的残差值;n为样本总数;
为估计子遵循与时间序列中同样的原理,对样本空间协方差进行加总。为了保证
估计子的正定性,核函数被应用于向量积中,见如下
的空间协方差估计子:

其中,K(dij/d)为核函数,有关核函数的详细特性见Conley和Topa(2002)[9];d为距离的一个合理的截止值。这个估计子的结构表明,超过合理的距离截止值将产生数值为0的空间协方差,但随着样本的增大,这种截止值也会达到一个较高的取舍点。因此,这意味着在较大的观测样本中,这种估计模型可能会产生更全局的空间自相关模式。