专栏名称: 连享会
连玉君老师团队分享,主页:lianxh.cn。白话计量,代码实操;学术路上,与君同行。
目录
相关文章推荐
天津日报  ·  连续3天,天津这些车辆不限行! ·  14 小时前  
天津日报  ·  中央巡视组进驻,杨燕伟任上被查! ·  昨天  
天津日报  ·  中方宣布:迅速撤侨! ·  昨天  
天津日报  ·  著名音乐人陈彼得去世 ·  昨天  
生态梦网  ·  赶快收藏!生态城社区联系方式全公开 ·  2 天前  
51好读  ›  专栏  ›  连享会

Stata: psestimate-倾向得分匹配(PSM)中匹配变量的筛选

连享会  · 公众号  ·  · 2025-06-05 22:00

正文

请到「今天看啥」查看全文



时间:2025 年 6 月 14-15;21-22;28-29 日每天9:00-12:30
咨询:王老师 18903405450(微信)

图片


温馨提示: 文中链接在微信中无法生效。请点击底部 「阅读原文」 。或直接长按/扫描如下二维码,直达原文:



倾向得分匹配分析 (PSM) 已经在诸多领域得到了应用。虽然 PSM 不能完全解决内生性问题,但却能在很大程度上缓解自我选择问题导致的偏差。在前期文献中,Becker & Ichino (2002, Stata Journal, 2(4):358-377) 对 PSM 的分析过程进行了详细的介绍,Stata 中也有多个命令可以执行 PSM 分析,如 pscore , psmatch2 , treatrew (Stata Journal, 14(3): 541-561), gpscore (SJ 8(3):354--373), kmatch

  1.  net describe st0328,from(http://www.stata-journal.com/software/sj14-1)

平衡性假设

在 PSM 匹配时,用treat变量对控制变量进行Logit回归,得到倾向得分值。倾向得分值最接近的控制组个体即为实验组的配对样本,通过这种方法可以最大程度减少实验组与控制组个体存在的系统性差异,从而减少估计偏误。在进行PSM匹配后的其他估计前比如PSM-DID 估计前,还需进行协变量的平衡性假设检验,即匹配后各变量在实验组和控制组之间是否变得平衡,也就是说实验组和控制组协变量的均值在匹配后是否具有显著差异。如果不存在显著差异,则支持进一步的模型估计。

在平衡性检验之前,我们先使用 psmatch2 命令进行PSM匹配,处理变量为 train ,协变量为 age educ black ,结果变量为 re78 ,采用一对一近邻匹配,具体操作如下:

  1. use ldw_exper.dta,clear

  2.  psmatch2 train age educ black,out(re78) logit ate neighbor(1) common caliper(.05) ties

PSM 匹配完成之后,我们需要检验匹配后的样本是否满足平衡性假设,即实验组与控制组的匹配协变量是否没有显著性差异,在这里可以使用 pstest 命令进行检验,具体如下:

  1.  pstest age educ black hisp married , t(train)

平衡性假设检验结果如下:

  1. ------------------------------------------------------------------------------

  2. |Mean|     t-test    |  V(T)/

  3. Variable|TreatedControl%bias |    t    p>|t||  V(C)

  4. ------------------------+--------------------------+---------------+----------

  5. age                     |25.52724.71411.4|1.190.234|1.24

  6. educ                    |10.29110.401-6.0|-0.590.557|1.60*

  7. black                   |.84066.87363-8.9|-0.900.370|.

  8. hisp                    |.06044.09066-10.9|-1.090.277|.

  9. married                 |.18681.15229.2|0.880.380|.

  10. ------------------------------------------------------------------------------

根据t检验结果发现,以上5个协变量在实验组与控制组之间不存在显著性差异。

那么,在进行 PSM 分析之前,应当如何选择匹配协变量,使模型实现最佳的拟合效果呢?今天介绍的 psestimate 命令可以通过比较不同模型的极大似然值,帮助我们选择能实现最佳拟合效果的协变量的一阶和二阶形式。

The psestimate command estimates the propensity score proposed by Imbens and Rubin (2015).  The main purpose of the program is to select a linear or quadratic function of covariates to include in the estimation function of the propensity score.

1. 命令的安装与示例数据导入

在Stata命令窗口执行第一行代码即可完成对 psestimate 命令的下载,然后输入第二行命令下载网上示例数据 nswre74.dta(LaLonde, 1986),并执行第三行命令导入数据。

  1. ssc install psestimate, replace //安装命令

  2. net get psestimate  //下载命令附带的数据到当前工作路径下

  3. use"psestimate.dta", replace

2. 命令的语法

该命令的语法如下:

  1.  psestimate depvar [indepvars][if][in][, options]

  2.  options

  3.       totry(indepvars)

  4.       notry(varlist)

  5.       nolin

  6.       noquad

  7.       clinear(real)

  8.       cquadratic(real)

  9.       iterate(#)

  10.       genpscore(newvar)

  11.       genlor







请到「今天看啥」查看全文