专栏名称: 连享会
连玉君老师团队分享,主页:lianxh.cn。白话计量,代码实操;学术路上,与君同行。
目录
相关文章推荐
桃桃淘电影  ·  马伯庸曹盾二搭神了,拍出年度最扎心打工人 ·  12 小时前  
豆瓣电影  ·  最高9.2分,解压神作,一爽到底 ·  2 天前  
中国电影资料馆  ·  光影绘长卷|“纪念中国电影诞生120周年 ... ·  2 天前  
51好读  ›  专栏  ›  连享会

2025年面板数据因果推断专题,开课倒计时5天

连享会  · 公众号  ·  · 2025-06-08 22:00

正文

请到「今天看啥」查看全文


近年来,徐老师主要研究基于面板数据的因果推断问题,在学术发表之外,他与合作者开发了多个 R Stata 软件包,包括: panelView gsynth fect tjbal bpCausal interflex ebalance 等。


3. 为什么要学习这门课?

近年来,因果推断在经济学、政治学等社会科学领域大行其道。由于进行随机实验的难度较大,采用观察性数据 (observational data) 进行因果推断仍是社会科学研究的主流,而这其中尤以面板数据 (panel data) 应用最广,主要有如下三个原因:

  • 其一,在 “大数据” 时代,面板数据越来越容易获得;
  • 其二,工具变量、断点回归等 “自然实验” 法对研究设计的要求较高,很多研究中并不能找到合适的工具变量或断点;
  • 其三,面板数据兼具时间和空间两个维度,使其在因果推断中具有独特优势。

2000 年以来,使用面板数据进行因果推断的方法论经历了几轮革新和演进。先是固定效应和随机效应模型并驾其驱,继而是倍分法 (DID) 的异军突起以及双重固定效应 (TWFE) 模型的大行其道,接着是合成控制法 (SCM) 的兴起,再到过去 5 年以来对于 DID 和 TWFE 的大规模反思 (后文简称「 大反思 」)。在诸多方法面前,研究者常常感到无所适从。

这门短课程的一个主要目的就是讲清楚这些方法的来龙去脉。我将采取 先「正着讲」,再「反着讲」 的授课方式。

所谓 「正着讲」 是指,先把「 大反思 」之前与 DID 和 TWFE 相关的各类估计方法、应用细则梳理一遍,使刚接触这些方法的学员能够追赶上目前国际、国内期刊的主流方法论。

所谓 「反着讲」 是指,将这轮「 大反思 」到目前为止的前因后果讲清楚,进而引导学员使用一些好用的方法来直接回应这轮反思中出现的各类批评。

为此,我力求将三天的课程设置成一个比较完整的体系,并达到以下 教学目的

  • 第一,希望学员经过 6 个半天的学习 (尚需另外花费 1-2 个月的时间演练吸收),能对目前国际、国内主流的面板数据因果推断方法有所掌握,能读懂多数期刊论文中使用的相关方法;
  • 第二,紧跟学术前沿,至少从直觉上明白最新的方法要解决的问题及其执行思路;
  • 第三,在研究中能够上手实操,合理应用上述方法。

为此,本次课程突出 两个特点

  • 一方面,我会尽力把基础知识讲解透彻,进度上不求快,并尽可能回答学员们的问题;
  • 另一方面,我在每个专题中都会提供几篇比较经典的论文,展示这些方法的合理应用。


4. 你能学到什么?

内容安排 上,本期课程基本上遵循了由浅入深、循序渐进的原则,共 7 讲。

第 1、2 讲先 “正着讲” ,介绍经典倍分法 (DID) 和介绍双重固定效应 (TWFE)。DID 和 TWFE 目前仍然是国际、国内应用研究的主流。

在开始正题之前,我们先讲一些准备知识,包括:课程设计、所需要的基本统计知识、术语,常用统计量和推断方法。

第 1 讲 “正着讲” 。介绍经典倍分法 (DID) 主要发展过程、前提假设、估计方法,及其估计量的性质。如何将基本的 2x2 DID 拓展到适合多期数据的经典多期 DID 模型 (注意,此时所有干预组获得干预的时间是一样的)。进一步,如何利用交叉项回归获得动态效应图,并以此为基础来判断「平行趋势假设」的可靠性。讨论经典 DID 模型估计结果不确定性的来源和潜在影响。我们将以 Card & Kruege (1994) 和 Sances (2016) 为主要的案例,并学习相关代码。

第 2 讲 介绍双重固定效应 (TWFE) 模型,包括它的假设、估计方法和性质。理解为什么在 强参数假定 下,TWFE 是 DID 的拓展,并可以用来估计交错 DID 或更一般情况下的因果效应。学习如何使用动态设定 (dynamic specification) 来估计动态效应,并由此判断「强外生性假设」的可靠性。介绍如何在 TWFE 模型中控制时间趋势和非时变协变量造成的趋势差异。介绍 TWFE 的多个拓展,包括如何使用连续的干预变量,如何将 DID 的思路应用于截面数据 (如问卷调查),如何估计所谓的「广义 DID」(以及如何做稳健性检验),如何使用三重差分 (DDD) 估计因果效应的异质性。本讲将使用 Bleakley (2010) 和 Cao, Xu & Zhang (2022) 作为主要案例,并学习相关代码。

第 1-2 讲所涵盖的内容,目前仍然是国际、国内应用研究的主流方法。

第 3 讲 讨论近年来对 DID 的反思和“平行趋势”假设的更深入的理解。本讲包含三个部分:(1) 再次讨论如何在 DID 中引入不随时间变化的协变量;(2) 介绍如何将匹配、加权法与经典 DID 结合起来;(3) 介绍双重稳健估计量的涵义和应用。本讲以 Truex (2014) 为主要案例,并学习相关代码。

第 4 讲 开始 “反着讲” 。重新审视 TWFE 的识别假设,理解三种违反识别假设的情况。其中,会重点讲解因果效应存在异质性的后果。我将通过讲授两篇理论计量论文 (Goodman-Bacon (2021) 和 de Chaisemartin and D’Haultfœuille (2020)) 和一篇实操应用论文 (Stevenson & Wolfers (2006)) 的方式,引导大家深入理解因果效应异质性对于交错型 DID 模型无偏性估计的影响。

第 5 讲 介绍五种新的估计量,包括 interaction weighted (交互加权法) 、 csdid panelmath did_m imputation method (插补法)。讲解他们的异同;手动实现交互加权法和插补法;讲解如何使用新的估计和诊断工具。本讲以 Grumbach & Sahn (2020) 和 Christensen & Garfias (2021) 作为主要案例,并学习相关代码。

第 6 讲 介绍合成控制法 ( SCM )。本讲将重点介绍 SCM 的基本原理、前提假设和估计方法,讨论 SCM 的优点和主要缺陷。在此基础上,介绍文献中对 SCM 的几种改进思路,并就其中两种方法 (ASCM 和 SDID) 进行深入讲解。 在这一讲中,我们将使用 ADH (2010)、ADH (2015) 以及 Cao & Chen (2022) 作为主要案例,并学习相关代码。

第 7 讲 最后一讲着重讲解 潜因子法 。该方法既可以视为插补法的拓展,也可以视为单位时间趋势的拓展,它还和 SCM 有紧密的联系。我们将介绍基于交互固定效应的潜因子法、矩阵填补法 (matrix completion),以及基于贝叶斯框架的潜因子法,并讨论他们的优缺点。本讲使用 Xu (2017)、Fouirnaies and Mutlu-Eren (2015),以及 Qian, Vreeland & Zhao (2022) 作为主要案例,并学习相关代码。







请到「今天看啥」查看全文