专栏名称: 连享会
连玉君老师团队分享,主页:lianxh.cn。白话计量,代码实操;学术路上,与君同行。
目录
相关文章推荐
科学家庭育儿  ·  对,我没穿内衣!活了30多年,最爽的就是这个 ... ·  2 小时前  
GBA Community  ·  71-Yr-Old Woman Wins ... ·  2 天前  
GBA Community  ·  71-Yr-Old Woman Wins ... ·  2 天前  
51好读  ›  专栏  ›  连享会

Stata-从匹配到回归:精确匹配、模糊匹配和PSM

连享会  · 公众号  ·  · 2025-06-05 22:00

正文

请到「今天看啥」查看全文


最新专题 | 计量专题 | 关于连享会
图片


🍓 课程推荐: 连享会:2025面板数据因果推断专题 · 线上
嘉宾:徐轶青,斯坦福大学
时间:2025 年 6 月 14-15;21-22;28-29 日每天9:00-12:30
咨询:王老师 18903405450(微信)

图片


温馨提示: 文中链接在微信中无法生效。请点击底部 「阅读原文」 。或直接长按/扫描如下二维码,直达原文:

作者: 徐云娇 (厦门大学)
邮箱: [email protected]



目录

  • 1. 从回归到匹配

    • 1.1 控制变量

    • 1.2 匹配

    • 1.3 二者异同

  • 2. 精确匹配

    • 2.1 性别、年龄等精确匹配

    • 2.2 近邻匹配+离散变量精确匹配

  • 3. 模糊匹配

    • 3.1 Dale & Krueger (2002)

    • 3.2 PSM

  • 4. 参考文献




Angrist & Pischke (2014) 总结了计量经济学研究的 “盖世五侠” (Furious Five) ——随机实验、回归、工具变量、断点回归设计和双重差分。也许你会奇怪,难道匹配 (matching) 不配拥有姓名吗?其实,匹配已经包含在回归中,它的本质思想就是回归,只要搞懂了回归,众多高大上的匹配方法便也不在话下。

1. 从回归到匹配

在学习匹配之前,我们必须要对回归的基本思想进行回顾,并且需要弄明白我们在回归方程中加入控制变量的目的是什么,它们起到了怎样的作用。

1.1 控制变量

当讨论私立大学教育是否对个人未来收入有所影响时,可以建立的回归模型如下:

其中, 是模型的因变量 (dependent variable),也就是学生 毕业后赚取的收入,也被称为结果变量 (outcome variable); 是模型的处理变量 (treatment variable),也就代表了学生是否进入私立大学的虚拟变量 (进入私立大学取 1,否则为 0)。

是模型的控制变量 (control variable),譬如学生的高中成绩、父母的收入等。我们将这些变量纳入模型的目的是消除模型的混杂偏差 (confounding bias),举例来说,父母的收入往往同时影响孩子大学的选择和未来的收入,即父母收入是学校选择和个人收入的一个混杂因素 (confounder)。用因果图表示如下:

上图显示, 的共同原因 (common cause),所以 之间有两条路径:一条为 ,也称因果路径 (causal path);另一条为 ,也称后门路径 (backdoor path)。因而, 的相关性包含了两部分,一部分是真正的因果关系造成的相关性,另一部分是由于混杂因素 造成的相关性 (赵西亮,2017)。

为了得到真正的私立大学教育 ( ) 对个人未来收入 ( ) 的影响,我们需要想办法将后门路径造成的相关性阻断。在回归模型中引入 作为控制变量,便可以阻断后门路径产生的相关性,使得回归系数 ( ) 表现出的相关性只剩下因果路径的相关性。用因果图可以表示为:

总结以上,控制变量 的引入,消除了混杂偏差,使回归系数具有因果效应的解释。

1.2 匹配

匹配的思想是,对于干预组 (私立大学) 个体,在控制组 (公立大学) 中寻找特征相似的个体与其相匹配,从而用控制组个体的结果来估计干预组个体的反事实结果,进而分离出处理变量的因果效应。这其实非常类似于在简单回归模型中引入控制变量。







请到「今天看啥」查看全文