正文
:林育莉 (中山大学)
邮箱
:[email protected]
编者按
:本文摘译自下文,特此致谢!
Source
:Cattaneo M D, Titiunik R, Vazquez-Bare G. Analysis of regression-discontinuity designs with multiple cutoffs or multiple scores[J]. The Stata Journal, 2020, 20(4): 866-891. -PDF-
目录
[
1. 简介
2. 方法介绍
2.1 非累积多断点
2.2 累积多断点
2.3 多分配变量
3. 命令介绍
4. Stata 实操
4.1 非累积多断点
4.2 累积多断点
4.3 多分配变量
5. 参考文献
6. 相关推文
1. 简介
在经济学、政治学、公共学等学科中,学者通常会遇到具有多断点或多分配变量的断点回归问题。在本文中,我们将介绍 Stata 的
rdmulti
命令,它由
rdmc
、
rdmcplot
、
rdms
三个命令组成,并可用于分析具有多断点和多分配变量问题。同时,本文也将使用模拟数据来展示
rdmulti
命令涵盖的所有三个情形设定:非累积多断点、累积多断点和多分配变量。
非累积多断点 (Noncumulative multiple cutoffffs):数据中每个单位都面临一个断点且不同单位的断点不相同;
累积多断点 (Cumulative multiple cutoffffs):单位有一个分配变量和一系列有序的断点;
多分配变量 (Multiple scores):政策处理由两个或者多个分配变量 (比如经度和纬度) 各自的断点决定。
2. 方法介绍
2.1 非累积多断点
在这种情况下,模型中有且只有一个分配变量
,结果变量为向量
。每一个单位有一个断点
,其中
。例如,Chay 等 (2005) 研究了智利政府于 1990 年提出的一项学校改善计划的效果。在这项计划中,表现不佳的学校可获得用于改善基础设施额和师资培训等项目的公共资金。该项目的分配是基于学校水平的测试分配变量是否低于断点值。在智利的 13 个行政区中,断点值是不同的。在该例中,
代表每所学校的行政区域。
与标准单断点 RD 方法不同,
是随机变量。当个体的分配变量超过相应的临界值时,将接受处理,即
。该设计的关键特征是变量
对总体进行划分,即每个单位面对有一个
值。从标记看,无论他或她所面临的具体临界值是多少,每个人的潜在结果都是相同的(Cattaneo 等,2020)。这里仅考虑有限多断点,因为这是实证中最自然的设置。在实践中,连续截断被离散用于估计和推断,具体如下:
在规则条件下,即包括了条件期望的平滑性,具体的断点处理效应为:
更为规范地定义为:
混合 RD 估计 (Pooled RD estimate) 是通过对分配变量去断点化实现,
,从而使断点值归零。
其中,
所有这些参数都可以很容易通过使用局部多项式方法来估计,并可以在适当的情况下对断点进行调整。即除了汇集数据外,RD 方法还可以单独应用于每个截止值。因此,
rdmulti
使用 Calonico 等 (2017) 的
rdrobust
命令,以实现基于局部多项式方法的带宽选择、估计和推理。
混合参数
的权重是通过
来进行估计的,详情可参见 Cattaneo 等 (2016)。如果给定带宽为
,
当用户没有指定时,
rdmc
命令在估计混合效应时可使用
rdrobust
选择的带宽来估计权重。
2.2 累积多断点
在具有累积多断点模型中,个体对分配变量的不同范围接受不同的处理 (或不同的处理程度)。在这种设定下,如果