正文
|
因果推断
|
合成控制法
|
PSM-Matching
🍓 课程推荐:
连享会:2025面板数据因果推断专题 · 线上
嘉宾:徐轶青,斯坦福大学
时间:2025 年 6 月 14-15;21-22;28-29 日每天9:00-12:30
咨询:王老师 18903405450(微信)
作者
:王曦池 (中山大学)
邮箱
:[email protected]
温馨提示:
文中链接在微信中无法生效。请点击底部
「阅读原文」
。或直接长按/扫描如下二维码,直达原文:
编者按
:本文主要摘译自下文,特此致谢!
Source
:Valentim V, Núñez A R, Dinas E. Regression discontinuity designs: a hands-on guide for practice[J]. Italian Political Science Review/Rivista Italiana di Scienza Politica, 2021, 51(2): 250-268.
-PDF-
目录
1. 背景介绍
2. 我们为什么需要 RDD?
3. RDD 该怎么做?
3.1 识别 (Identification)
3.2 估计 (Estimation)
4. 实证指南
5. 灵感
5.1 选举胜利的门槛
5.2 固定的议会门槛
5.3 人口阈值
5.4 年龄不连续
5.5 空间上的不连续性
6. 总结
7. 相关推文
1. 背景介绍
Valentim 等 (2021) 为学术界在应用研究中使用 RDD 提供了一个基于直觉、面向实践的指南。本文介绍了 RDD 基本的工作原理,提供了帮助进行稳健性检验的检查表,并简要介绍了一些应用 RDD 的阅读清单,帮助你激发灵感。该指南技术性较低,目的在于为 RDD 初学者提供垫脚石,很适合初学者的快速入门。
2. 我们为什么需要 RDD?
当我们想考察任期对之后的选举结果的影响时,我们该如何做?
直接回归
:你首先可能会想到将之后的选举结果设定为一个虚拟变量,1 表示选举胜利,0 表示选举失败。这样的设定会产生一些问题:那些能获得选举成功的人,可能在能力方面和未获得成功的人有差别,而这些能力方面的差别将同样影响之后的选举结果。
加入控制变量
:接下来,我们很容易想到通过加入控制变量,来解决直接回归导致的问题。但是,现实中总有因素无法度量或观测,我们永远无法自信地说出:自己已观测和控制了所有可能影响选举结果的因素。
将结果随机分配给样本
:从理论上讲,一种可行的方法是抽取政治家的样本,随机赋予其中一半人赢得选举,另一半人输掉选举,然后测量他们在选举中的表现。这种方法可以将所有混杂变量的中心趋势在预期中跨组收敛到相同的值。但在现实中,就像是我们无法对实验对象随机施加暴力一样,这样的做法是不道德、不可行的。
RDD
:前面三种方法都各有缺点,那么面对这类问题,我们该如何研究呢?RDD 或许是一个不错的选择。RDD 是被认为最接近随机实验的检验方法,能够缓解参数估计的内生性问题。
Lee (2001) 使用 RDD 的思路估计在任对连任的影响。进入 21 世纪以来,RDD 在社会科学中越来越常见,每当存在有一个固定的
门槛/分界点
能够划定实验组与对照组时,RDD 就会被考虑使用。和其它方法相比,它具有以下优势:
3. RDD 该怎么做?
RDD 的底层逻辑是:在分界点上,除了我们关心的处理效应 (treatment) 外,没有其他因素 (个人能力、资金等) 会导致结果跳跃。这意味着在分界点两侧,即接近胜选 (但落选) 和恰好胜选的实验对象,是良好的反事实估计。
接下来的例子使用 Dinas 等 (2015) 的原始数据,本例和第一部分提出的问题相似,试图解决在多党制下,小党的议会代表权是否使他们更有可能在随后的选举中取得成功。下图为该例子的图形结果:
下面我们主要从 RDD 的识别和估计两个步骤展示 RDD 过程,最后再简要介绍模糊 RDD 的两阶段。
3.1 识别 (Identification)
3.1.1 基本概念
RDD 所需的唯一假设,要求潜在结果在 treatment 附近连续平滑移动。根据这一假设,发生在不连续点的唯一变化是治疗状态的转变
横轴
:运行变量/配置变量 (running variable),在本例中为政党在
届选举中的得票率。如下图,其中分界线 (cutoff) /门槛 (threshold) 决定了
属于实验组/处理组 (treatment group) 还是对照组 (control group) ,变量值取决于实际得票率与门槛间的距离
纵轴
:结果 (outcome) ,在本例中为政党在