正文
最新专题
|
计量专题
|
关于连享会
🍓 课程推荐:
连享会:2025面板数据因果推断专题 · 线上
嘉宾:徐轶青,斯坦福大学
时间:2025 年 6 月 14-15;21-22;28-29 日每天9:00-12:30
咨询:王老师 18903405450(微信)
温馨提示:
文中链接在微信中无法生效。请点击底部
「阅读原文」
。或直接长按/扫描如下二维码,直达原文:
作者:
徐云娇 (厦门大学)
邮箱:
[email protected]
目录
-
1. 从回归到匹配
-
2. 精确匹配
-
2.1 性别、年龄等精确匹配
-
2.2 近邻匹配+离散变量精确匹配
-
3. 模糊匹配
-
4. 参考文献
Angrist & Pischke (2014) 总结了计量经济学研究的 “盖世五侠” (Furious Five) ——随机实验、回归、工具变量、断点回归设计和双重差分。也许你会奇怪,难道匹配 (matching) 不配拥有姓名吗?其实,匹配已经包含在回归中,它的本质思想就是回归,只要搞懂了回归,众多高大上的匹配方法便也不在话下。
1. 从回归到匹配
在学习匹配之前,我们必须要对回归的基本思想进行回顾,并且需要弄明白我们在回归方程中加入控制变量的目的是什么,它们起到了怎样的作用。
1.1 控制变量
当讨论私立大学教育是否对个人未来收入有所影响时,可以建立的回归模型如下:
其中,
是模型的因变量 (dependent variable),也就是学生
毕业后赚取的收入,也被称为结果变量 (outcome variable);
是模型的处理变量 (treatment variable),也就代表了学生是否进入私立大学的虚拟变量 (进入私立大学取 1,否则为 0)。
是模型的控制变量 (control variable),譬如学生的高中成绩、父母的收入等。我们将这些变量纳入模型的目的是消除模型的混杂偏差 (confounding bias),举例来说,父母的收入往往同时影响孩子大学的选择和未来的收入,即父母收入是学校选择和个人收入的一个混杂因素 (confounder)。用因果图表示如下:
上图显示,
是
和
的共同原因 (common cause),所以
与
之间有两条路径:一条为
,也称因果路径 (causal path);另一条为
,也称后门路径 (backdoor path)。因而,
到
的相关性包含了两部分,一部分是真正的因果关系造成的相关性,另一部分是由于混杂因素
造成的相关性 (赵西亮,2017)。
为了得到真正的私立大学教育 (
) 对个人未来收入 (
) 的影响,我们需要想办法将后门路径造成的相关性阻断。在回归模型中引入
作为控制变量,便可以阻断后门路径产生的相关性,使得回归系数 (
) 表现出的相关性只剩下因果路径的相关性。用因果图可以表示为:
总结以上,控制变量
的引入,消除了混杂偏差,使回归系数具有因果效应的解释。
1.2 匹配
匹配的思想是,对于干预组 (私立大学) 个体,在控制组 (公立大学) 中寻找特征相似的个体与其相匹配,从而用控制组个体的结果来估计干预组个体的反事实结果,进而分离出处理变量的因果效应。这其实非常类似于在简单回归模型中引入控制变量。