
第五节 空间自相关的度量与检验
空间自相关的度量与检验分为全局度量与检验和局部度量与检验两种。全局度量与检验是用于整个地理区域并具有相同模式或空间过程的度量值,空间自相关的度量值为整个区域的一个平均值。空间自相关的局部度量与检验是用于每个观测单元的一个空间自相关的度量值,不同位置的观测单元具有不同的空间自相关的度量值。
空间自相关的检验也称为空间模式的检验。在实践上,对空间自相关存在与否的检验往往比对空间自相关的估计更重要,正如对时间域中横截面回归中序列相关的检验一样,决定着模型选择的合理性。因为,在模型构建中,如果忽略了空间滞后中的自相关,即使误差项不存在空间自相关,也会导致模型参数的有偏估计;而忽视了空间误差中的自相关,则会产生模型参数的不一致性和无效估计,并导致t统计值和R2值的有偏推断。因此,空间自相关在解释经济活动的空间过程和模式,以及其外部性、集聚性、空间趋势、共同因子和空间异常等方面会挖掘出重要的新信息。
一 全局空间自相关的度量与检验
全局空间自相关的检验主要包括Moran’s I、Geary’sC、Getis-Ord’sG(d)三种检验方法。一般来讲,Moran’s I方法是一种更全局的度量方法,并对观测单元的极值很敏感,而Geary’sC方法对邻近单元的差异更敏感。不过都可以很好地揭示集聚现象,但不能够区分是低值集聚还是高值集聚。虽然两种方法都产生相似的结果,但Moran’s I方法更具有稳健性。相比之下,揭示空间集中程度的G(d)方法可以区分由相对高值或低值产生的“热点”或“冷点”集聚。
(一)Moran’s I的度量与检验方法
空间统计检验的最常用的规范检验方法是基于Moran统计系数I的检验方法(Moran,1948,1950),类似于Pearson相关系数检验,它是一个协方差检验,主要用于观测单元为多边形或质点的空间分布模式的统计检验,包括空间集聚模式、空间发散模式、空间随机模式的检验。其中,统计检验的观测值为连续变量,Moran’s I的数值在-1和1之间变化,它的计算方法类似于通常应用的两个变量之间的相关系数的计算方法,其差别主要在于Moran’s I的计算方法是基于特定位置的观测变量值与其所有邻近观测单元的同一观测变量值的空间加权平均值之间的相关系数,也称为观测变量与其空间滞后变量之间的自相关系数,即空间自相关系数。它的正式定义如下:

其中,N为观测单元的多边形数目或质点数目;wij是相邻两单元i和j的空间权重,由wij构成的矩阵为对称矩阵;当两单元i和j相邻时,wij=1;当两单元i和j不相邻时,wij=0;xi为观测单元i的观测变量值;为观测单元的变量均值。
对空间自相关的检验是基于一个近似标准正态分布的标准离差Z值的计算。数据抽样的零假设为观测值均服从一个渐近正态分布或自由抽样时,Moran系数的I的数学期望和方差的计算方法见下式:

其中,为观测单元空间权重之和;
为相邻两单元空间权重的平方和的平均值,并且i≠j;
为观测单元的相邻单元个数的平方和,
为矩阵中行空间权重的总和,
为矩阵中列空间权重的总和;σ2N(I)为数据抽样服从渐近正态分布时的方差;Z为标准正态分布的标准离差。当标准离差Z的值大于0.01、0.05或0.1置信水平的临界值时(大于2.54或小于-2.54、大于1.96或小于-1.96、大于1.645或小于-1.645),则拒绝零假设[10],说明统计上存在显著的空间自相关。更进一步地说,Z值大于0,则存在正相关;否则,Z值小于0,则存在负相关。
当数据抽样的零假设为观测值服从随机分布或非自由抽样时,Moran系数I的数学期望和离差Z值的计算方法与式(2-25)和(2-27)相同,而方差的计算方法见下式:

其中,为Kurtosis度量,即频率分布的峰度值;σ2R(I)为数据抽样服从随机分布时的方差。其他变量描述与数据抽样服从渐近正态分布时相同。
(二)Geary’sC的度量与检验方法
Geary’sC(Geary,1954)统计检验是基于邻近观测单元之间观测值离差的计算来检验全局观测单元之间的自相关性。这种检验方法类似于Durbin-Watson,也是一种方差检验方法。它的标准离差Z服从一个渐近标准正态分布。见下式:

其中,Geary’s C的数值分布于0(最大的正空间自相关)和一个正值2(高的负空间自相关)之间。理论上,E(C)=1,并且Z(C)=0为完全正相关,表现为集聚性;Z(C)=1为没有自相关,表现为随机性;Z(C)=2为完全负相关,表现为发散性。如果Geary’s C的数值小于1,那么,它揭示的是一个正空间自相关。当Z(C)<0时,揭示的是正自相关;当Z(C)>0时,揭示的是负自相关。它的方差的计算与Moran’s I的方差计算一样,同样基于数据抽样的渐近正态分布或随机分布的零假设(详见Lee和Wong,2000),当观测值均服从一个随机分布或非自由抽样时,它的方差可以表示如下:

其中,N、wij、xi、、w0、w1、w2、k与Moran’s I中变量的含义相同。
(三)Getis-Ord’s G(d)的度量与检验方法[11]
Getis-Ord’s G(d)是基于距离的度量方法,用于表示一定距离范围内,邻近空间单元i和j之间的相关程度或集聚特性。它的计算式可以表示如下:

其中,wij为1或0,所构成的矩阵为对称矩阵;xi、xj都大于0,并且i≠j。当G(d)>E(G)时,则由高值产生热集聚(高值集聚);当G(d)<E(G)时,则由低值产生冷集聚(低值集聚)。Z(G)的统计检验常用于检验差异的统计不显著性。E(G)=W/n(n-1),其中,W为一定邻近距离d范围内观测点或单元数,,
;n为研究区域内的总点数或单元数。另外,σ(G)的计算较复杂,详见Getis和Ord(1992)。σ2(G(d))的方差见下式:
σ2(G(d))=E(G(d)2)-(E(G(d)))2 (2-34)
二 局部空间自相关的度量与检验
局部空间自相关用于度量与检验全局空间中特定区域的集聚程度、局部异常或局部不稳定性,每个区域都有不同的空间模式或过程。此外,每个观测单元都有一个反映空间自相关强度和类型的计算值,以检查每个观测单元对全局自相关的贡献。局部空间自相关反映的是特定位置变量值的高低,而不是变量的均值或期望值。这种局部空间自相关往往发生于非平稳的空间过程,即空间相依性随位置不同而发生变化。局部空间自相关往往存在于全局空间自相关中,但不同区域的空间集聚具有显著差异。有时没有全局空间自相关,但也发生小的局部空间集聚。局部空间自相关的度量主要包括局部Moran’s I、局部Getis-Ord’s G(d),其检验方法与全局空间自相关的检验类似。
(一)Moran’s I的局部度量与统计检验
根据Anselin(1995)的定义,Moran’s I的局部度量与检验也称为LISA度量方法,它是最常用的局部空间自相关的度量与检验方法。它的计算式可以定义如下:

其中,zi、zj分别为邻近空间单元i和j的xi和xj的标准化观测值,即,
,
;Ii为观测单元i的Moran’s I的计算值
为Ii的数学期望;σ2(Ii)=E(I2i)-(E(Ii))2为Ii的方差;其他变量描述与全局自相关中的描述相同。另外,全局自相关与局部自相关的比例关系可以表示为
。Z(Ii)>0,表示在观测单元i的邻近区域具有高相似值的集聚特征;Z(Ii)<0,表示在观测单元i的邻近区域具有低相似值的集聚特征。
(二)Geary’s C的局部自相关度量与检验方法
Geary’s C检验在全局自相关Geary’s C的基础上,可以得到每个观测单元的局部自相关度量值。它的计算式可以表示如下:

其中,Ci为在观测单元i的Geary’s C的局部自相关度量;为观测单元的方差;σ2(Ci)=E(C2i)-(E(Ci))2为Geary’sC的方差;其他变量描述与全局自相关中的描述相同。
(三)Getis-Ord的局部度量与统计检验
Getis-Ord统计检验用于度量在观测单元i的邻近区域变量值xj的加权和的集中程度,并为区分“热点”或“冷点”集聚,以及异质性方面的重要工具。它的计算式可以表示如下:

其中,为Getis-Ord的局部度量的数学期望;Gi(d)为每个观测单元的空间自相关的局部度量值,其他变量描述与全局自相关中的描述相同。i≠j;xj>0;W为包含二态量值的元素wij,并构成对称矩阵。当Gi(d)>0时,表示在观测单元i的邻近区域具有高相似值的集聚特征;当Gi(d)<0时,表示在观测单元i的邻近区域具有低相似值的集聚特征。σ2(Gi(d))方差见下式:

[1] James P.LeSage(1999),The Theory and Practice of Spatial Econometrics,Department of Economics,University of Toledo.
[2] Anselin L.(2003),“Spatial Externalities,Spatial Multipliers and Spatial Econometrics”,International Regional Science Review,26(2):153-166.
[3] Kelejian H.H. and Robinson D.P.(1995),Spatial Correlation:A Suggested Alternative to the Autoregressive Model.In Anselin L. and Florax R.J.,editors,New Directions in Spatial Econometrics,pages 75-95,Springer-Verlag,Berlin.
[4] Hsiao C. and Pesaran M.H.(2004),Random Coefficient Panel Data Models,Working paper,University of Cambridge,Cambridge,United Kingdom.
[5] Cressie N.(1993),Statistics for Spatial Data,Wiley,New York.
[6] Cressie N.(1993),Statistics for Spatial Data,Wiley,New York.
[7] Kelejian H.H. and R.I.Prucha(1999),On the Asymptotic Distribution of the Moran I Test Statistic with Applications.Working Paper,Department of Economics,University of Maryland,College Park,MD.
[8] Conley T.G.(1999),“GMM Estimation with Cross-sectional Dependence”,Journal of Econometrics,92:1-45.
[9] Conley T.G. and Topa G.(2002),“Socio-economic Distance and Spatial Patterns in Unemployment”,Journal of Applied Econometrics,17:303-327.
[10] 零假设:没有任何空间自相关,即Moran’s I=0;备择假设:存在空间自相关,即Moran’s I≠0。
[11] Getis A. and Ord J.K.(1992),“The Analysis of Spatial Association by Use of Distance Statistics”,Geographical Analysis,24(3):189-206.