正文
为了直观反映这种结果偏误,作者在边长为1的正方形上随机分布250个白色点代表的城镇,使用数据生成过程(DGP)构建两个独立的但是高度空间相关的空间噪声变量,分别称为“历史变量”和“现代结果”。然后,作者采用没有调整空间相关性的异方差稳健标准误得到了大小为-3.8的t统计量,名义显著性为0.01%。回归的Monte Carlo显著性水平是10%:十分之一的仿真的t统计量绝对值大于3.8,38%的仿真的t统计量绝对值大于2,21%的仿真的t统计量绝对值大于3。仿真数据没有引入空间趋势:如果这样做,t统计量的膨胀将更加严重。
为了解决这一问题,我们往往需要对标准误进行调整处理。图2展示了几种空间相关性修正方法的表现。标记为“HC”的线反映的是没有空间相关性修正的异方差稳健标准误,在空间相关性逐渐增加后会伴随很大的显著概率。标记为“Conley 0.1”的线使用了Conley (1999)的方法修正,采用矩形核函数,允许最大0.1的相关性,虽然比HC有所改进,但在空间相关性较大时仍过度显著。标记为“36 Clusters”的线使用基于6×6方格的聚类标准误,表现与“Conley 0.1”修正相似。标记为“BCH 4”和“BCH 6”的修正方法展示了本文提出的新方法的表现,可以看到有很大的改进。
图2 不同方式调整标准误对应的5%显著性水平下的拒绝零假设的频率
为了检验是否存在真实的处理效应,作者提出了两种诊断检验方法:第一个是安慰剂检验,采用空间噪声取代处理变量。第二个检验则构建了与处理变量无关的合成结果变量(空间趋势加上空间噪声)。作者选取了经济学顶级期刊上发表的30篇关于历史持续性的研究,对基准回归的结果进行了检验。图3展示了30篇研究的基准结果在不同检验下的p值,灰色点表示原文报告的p值大小,蓝色点表示基准回归添加了空间趋势控制变量(经纬度的二次项或者世界银行的区域划分)后的p值,红色点表示安慰剂检验结果的p值。另外,在作者汇报的合成结果变量检验中,30个研究的15个依然在5%水平下显著。这些结果表明,如果回归分析中没有考虑空间趋势,会导致回归结果的显著性失真。而经典文献中近一半基准回归的显著性结果可能是由于空间相关性处理不当导致的。