Stata：聚束效应-另类断点回归（微信文章未删减版）

👇 连享会 · 推文导航 | www.lianxh.cn

🍎 Stata：Stata基础 | Stata绘图 | Stata程序 | Stata新命令
📘 论文：数据处理 | 结果输出 | 论文写作 | 数据分享
💹 计量：回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归
⛳ 专题：SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析
🔃 因果：DID | RDD | 因果推断 | 合成控制法 | PSM-Matching
🔨 工具：工具软件 | Markdown | Python-R-Stata
🎧 课程：公开课-直播 | 计量专题 | 关于连享会

连享会课程 · CGE 专题：理论与实操

从 0 到 1：学以致用的 CGE 课程

可计算一般均衡模型 (Computable General Equilibrium, CGE) 是研究宏观经济问题的利器。CGE 的基本思想是，在整个经济中，供应和需求是相互关联的，这使得一个部门或市场的变化会传递到其他部门和市场。

CGE 模型由一系列描述不同经济部门、市场和要素之间关系的方程构成，用以分析各种经济政策和外部冲击 (如税收、贸易、环境、政治) 的影响。我们可以采用模拟分析来评估它们对经济系统中关键指标的影响，如就业、产出、通胀、收入分配等。

🍎 通过本期课程的学习，希望大家能掌握如下内容：

基本目标：

什么是一般均衡，相对于局部均衡而言有什么区别？
如何构建一个简单的一般均衡模型？
一般均衡与投入产出表是如何结合的？
如何构建一个标准的一般均衡模型？

进阶目标：

CGE 模型实操与写作示例：如何熟练的运用 GAMS 软件对构建模型，并且有效的 debug。包括如何解决模型报错；如何得到基准情景的解；如何得到正确的反事实情景的解。
CGE 模型潜在的扩展：针对不同的研究方向，对模型进行不同类型的扩展。例如如何嵌入能源与碳排放模块，以运用于能源与环境经济学领域；如何分解不同收入人口，以研究更细致的分配效应；如何拆分中央政府和地方政府，或细化税收种类，以研究财政领域的问题。
CGE 建模灵活性的掌握：以嵌入能源与环境模块为例，掌握 CGE 模型的灵活性，帮助你撰写你要研究的特定议题。

🍎 本课程主要分为三个模块：

T1 基础：投入产出表、社会核算矩阵与 CGE 模型
T2 扩展：模型的变种、扩展及其实操
T3 进阶：嵌入特殊模块、结果输出与解读

作者：曾振声 (中山大学)
邮箱：zengzhsh6@mail2.sysu.edu.cn

温馨提示： 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码，直达原文：

1. 引言

1.1 什么是聚束效应？
1.2 为什么要讨论聚束效应？
1.3 传统非线性预算集方法

2. 聚束理论

2.1 拐点
2.2 断点
2.3 优化摩擦

3. 聚束估计量
4. Stata 命令介绍

4.1 bunchbounds 命令
4.2 bunchtobit 命令
4.3 bunchfilter 命令
4.4 bunching 命令

5. Stata 应用实例

5.1 估计弹性边界
5.2 弹性的半参数点估计
5.3 摩擦误差

6. 参考资料
7. 相关推文

1. 引言

1.1 什么是聚束效应？

为了方便大家理解，笔者先举一个生活中的例子。

考虑一条正常的步行街，在天晴的时候，街道上和屋檐下的人群密集程度大致相近。天空中突然下起大雨，没带伞的人迅速躲到了屋檐下，而带了伞的人则撑开伞继续行走。此时，屋檐下的人数密度会突然增加，出现了所谓的聚集。

取个学术点的名字，就叫做「聚束」。

聚束效应 (bunching) 是指在面临政策扰动时，个体出于自身效用最大化主动选择集中于一点，形成了类似离散分布才存在的质量点。从概率密度函数看，原连续的分布出现截断，质量点对应的概率大于 0。

与断点回归 (RDD) 和拐点回归 (RK) 类似，聚束效应也出现了断点或拐点。但聚束效应与这两者之间存在一个关键的不同之处——在 RDD 或 RK 模型中，个体无法干预政策，其分布高于或低于阈值是外生的；而 bunching 恰好相反，个体面对突如其来的政策变化可以自由选择扎堆。

在聚束效应中，政策是内生的，我们研究的正是个体面对政策所表现出来的个人选择。因此在分析特定阈上观察到的离散跳跃时，要依据分配变量的可操作来选择方法。

1.2 为什么要讨论聚束效应？

在介绍聚束理论模型之前，我们不妨来看看关于聚束的讨论是如何起源的。聚束效应本质上是经济学家开发出来的方法，所以研究的问题一定是建立在现实背景下的。有关于聚束效应的讨论，实际上是来源于税收方面相关的研究。

许多国家的个人所得税实行阶梯税率，即累进税制。当个人收入突破一定阈值时，超出阈值的部分会征收更高的所得税，阈值前后对应了边际税率的改变。与此同时，存在另一种征税制度，在阈值前后，其平均税率发生改变。

经济学家关心的是所得税对于劳动力供给存在什么影响，并尝试求出劳动力供给 (或收入) 对税率变动的弹性。直观来看，在征收阶梯税的情况下，对于恰好高出临界点某个较小区间的人来说，由于边际税率的提高造成边际收益的下降，他们最优的选择不是提供原有量级的劳动，反而是减少劳动投入以获得更多的闲暇时间，将税前收入封顶在临界点。

尽管他们的税后可支配收入降低，会造成了消费效用的降低，但是闲暇时间的增多却带来了更大的效用提升，最终个人效用在零界点实现了最大化。与此同时，更高收入的人群也会相应的减少劳动投入，以获得新税率下的最高效用。

税率的突然改变，使原本分布在一个较小区间内的人群主动选择聚集在一个点上，于是就出现了聚束效应。对于政府而言，如何设计税率的变动量以防止过度伤害劳动者的积极性便值得深思。因此，收入对税率变动的弹性估计便成为了一个具有现实意义的研究问题。

随着行政数据可获得性的提高，聚束效应分析方法的应用日渐普遍。该方法在逐渐开始在社会保障、社会保险、福利项目、教育、管制、私人部门定价及参照依赖偏好等方面得以应用。

1.3 传统非线性预算集方法

传统非线性预算集方法也对聚束效应中的弹性进行了研究，但其出发点与本篇介绍的聚束理论有很大不同。传统非线性预算集的计量经济学研究最早是 Burtless 和 Hausman (1978)，以及 Hausman (1981) 开发的，他们考察了劳动力供给在负所得税和联邦所得税条件下的反应。

通过观察，他们发现了具有两种类型拐点的片状线形预算集。边际税率离散增加会造成凸型拐点，而离散下降会造成非凸型拐点。前者在收入分布中可以观察到聚束，后者则直接产生一个洞。

这种参数估计方法优点在于理论与经验间有明确的关系，但缺点是尽管其理论假设了模型存在聚束，调查数据却没有显示出任何聚束现象。按照 Saez (1999，2010) 证实的拐点聚束的大小与劳动力供给的补偿弹性成正比，传统非线性预算集方法会导出零补偿弹性。

允许模型中存在两个误差则可以解决这个问题。第一个误差代表未能观测到的偏好异质性，第二个误差为优化误差，也可称为测量误差。偏好误差会影响个体最终选择的位置是否在拐点处，优化误差反映了个体无法精确调整工作时间，从而聚束受到现实约束。

为了估计补偿弹性和人们的行为反应，非线性预算集方法需要对这两个误差的分布进行假设，并采用参数估计方法对聚束和拐点进行识别。因此，数据中是否存在聚束或拐点就更多成为了数据拟合的技术性问题。而聚束点本身提供的反应性信息却没被用上。

本篇介绍的聚束理论与其不同，采用非参数估计的方法，仅仅从拐点局部发生的情况出发获得补偿弹性的估计。这种聚束理论可以捕捉政策的准实验变化，充分利用事实。

2. 聚束理论

以税收为例子，税率的改变大致分为两种情况：边际税率的改变及平均税率的改变。在不考虑摩擦的情况下，两种税率变动机制会造成两种不同的聚束效应。边际税率的变动会造成收入分布出现拐点，而平均税率的变动造成收入分布出现断点。

2.1 拐点

2.1.1 模型搭建

边际税率不连续造成拐点的分析是由 Saez (2010) 开创的。考虑个人对税后收入 (消费价值) 和税前收入 (努力成本) 的偏好，定义如下效用函数：

其中，代表收入，代表税收函数，衡量个人能力，能力的异质性由密度分布捕获。假设能力分布、偏好和税收制度是平滑的，个人自我优化产生的收入分布也是平滑的，并用表示收入的分布。

为了简化讨论，考虑线性税制，则边际税率变化前后的函数如 (2) 式：

考虑一般情况，即边际税率增长，则可做出如下预算集图。

当边际税率在节点从原先的提升至时，具有能力为的个体成为了边际聚束个体。在税率变化之前，他们的效用曲线和线性约束相切点的横坐标为，在边际税率产生的新线性约束下，其效用函数与新约束集不存在切点，因此拐点为其最大效用点。边际聚束个体的收入水平为。

所有最初位于区间 () 上的个体都会聚集在拐点处，而所有最初位于以上的劳动者都会依据新的约束降低劳动投入。由于收入大于边际聚束个体的劳动者同步降低了劳动投入，聚束发生后，收入密度分布图中不会存在 “空洞”。

由上图所示，劳动者的收入分布从原先的连续下降，变为处存在聚束。聚束质量恰好等于阴影部分面积，也即处损失的全部质量。

2.1.2 同质性偏好下的补偿弹性

进一步地，补偿收入弹性可以从边缘聚束个体中求出。边缘个体收入变化量可以理解为劳动力减少量，同时与超额聚束量成比例。定义劳动力投入变化量对税率变化量的弹性：

在变动很小的情况下，税率变动不会产生收入效应，式 (3) 中求得的弹性为补偿弹性，它是聚束点处的局部弹性。当税率变动很大时，个体收入选择的改变还会收到收入效应的影响，此时弹性应由补偿弹性和未补偿弹性加权平均求得。

一般而言，我们仅考虑边际税率变动较小的情况，故本文不对未补偿弹性做过多赘述，仅提供未补偿弹性计算公式供读者参考。未补偿弹性的计算方法为，其中。

通过 (4) 式将总聚束质量与收入变动量联系起来：

由于通常很小，一般可认为收入分布在聚束段上为常数。

2.1.3 异质性偏好假设下的弹性

上述分析建立在所有劳动者拥有同质效用函数的基础上，故得出处的弹性仅取一个值。若放宽同质性偏好假设，则可求得异质弹性。

定义为劳动者能力和弹性的联合概率分布，为弹性的个体的收入分布。对弹性进行积分求得总收入分布。

在任一弹性水平下，边际聚束个体减少的收入量为。不同弹性下收入减少量的均值与总的聚束质量有如下关系：

上式将局部平均收益弹性与聚束质量联系了起来。当拐点税率变动很小时，式 (5) 有效。但是，当拐点处税率变动很大时，弹性还受收入效应的影响。因此有必要以参数形式对劳动者的效用函数进行假设，以获得补偿收入弹性的准确估计。设准线性等弹性效用函数形式如下：

上式的假定可将收入效应剔除在外，在该假设下劳动者此时的收入：

为了求解一般化的补偿弹性，我们考虑边际聚束个体在聚束前后均满足预算集与效用函数相切的条件。通过对 (6) 式进行假设得出 (7) 式，用 (7) 式表示两个相切条件：

真实情况

反事实

联立可解出下式：

等价于：

式 (9) 给出的弹性估计，是式 (3) 弹性的一般化形式。当很小的时候，很小，我们有且。

参数化估计的得出的弹性在税率变动量很小的时候，结果与非参数估计得出的补偿弹性一致。这也意味着当税率变动很小的时候，可简单采用非参数估计，而当税率变动大的时候，需要引入参数假定。

2.1.4 非凸拐点

前面讨论的聚束效应，是在边际税率上升的假设下开展的，约束集产生凸拐点。而当边际税率离散下降时，会产生非凸拐点。

非凸拐点的聚束表现与凸拐点大为不同，劳动者收入分布在聚束点周围会产生一个洞。本来收入在阈值以下某特定范围内的个体由于税收激励，劳动投入严格聚集在了阈值以上。

而收入低于边际聚束个体的劳动者则无动于衷，他们并不会受到边际税率下降的激励。这类劳动者提高其劳动投入使自身税前收入位于 () 对其并没有任何好处，反而会降低效用。

因此，在该区间内，收入分布出现空洞。

2.2 断点

同样是税率变动，平均税率的变化引起的聚束与边际税率变动引起的聚束完全不同。Kleven 和 Waseem (2013) 研究了税务责任不连续的问题，提出了断点聚束效应。关于劳动者收入分布及能力分布均等假设均与拐点聚束效应时一致。断点聚束分析同样可以先从同质性收入弹性开始，推广到异质性弹性。

2.2.1 模型建立

考虑平均税率在阈值后上升的情况 (比例税率的不连续性)，税收函数表示如下：

如下图所示，收入位于内的个体由于平均税率提升在断点处聚束。对于收入为的边际聚束个体，他们在断点与税率变动后的最优内部点中无偏好。

此时，没有任何个体愿意选择其劳动收入位于区间内，从收入分布上看则对应出现了空洞。收入高于边际聚束个体的劳动者由于税收降低积极性，也会相应减少劳动投入，但是其收入仍然位于阈值以上。

在这种情况下，断点聚束产生了一个完全被占优的区间，如下图所示。

在该区间内，劳动者通过向断点移动可以同时实现剩余消费和闲暇时间的提升。因此，在任何偏好假定下，该区间都是被完全占优的。被占优区间的存在，为聚束区间提供了下界。当补偿收入的弹性为 0 时，聚束区间恰好为被占优区间。同时，图中阴影部分面积即为断点处的聚束量。

2.2.2 同质偏好下的弹性

在效用函数同质的情况下，与拐点相同，断点聚束同样利用边际聚束个体的反应估计补偿收入弹性。利用边际聚束个体在断点和内部最优点效用无差异可进行求解，过程如下。

基于式 (6) 假定，可写出断点处的效用:

基于偏好假定的一阶导数条件，得出，代入效用函数求出处效用：

利用效用相等进行求解，得下式：

式 (13) 给出了收入变动百分比、税率变动百分比以及收入补偿弹性的关系，此时弹性为前两者的隐函数。

在无优化摩擦的情况下，当补偿弹性趋近 0 时，式 (13) 表明聚束区间存在下界，该下界大小恰好为完全被占优区间的大小：

2.2.3 异质偏好下的弹性

与拐点聚束中同质偏好类似，将区间内的弹性进行积分，可得到收入分布如下图所示：

异质性偏好下，收入分布仅仅在严格被占优的区间出现空洞，这是因为拥有异质偏好的劳动者有部分可能会在区间内取得最大效用。故断点聚束引发收入分布的空洞，会逐渐收敛于反事实。

利用式 (5) 可将聚束量与平均收入反应联系起来。再利用式 (13) 可以估计出在平均收入反应下的弹性，该弹性通常不等于所有弹性的均值。

2.2.4 平均税率下降

平均税率下降的情况与平均税率上升的情况最大不同之处在于：它不会创造一个完全被占优区间。

这是因为在平均税率下降时，目标个体向上进行聚束，在获得更多消费剩余的同时一定伴随闲暇时间的减少。当弹性趋近于 0 时，聚束区间大小也会趋近于 0，而非。

在这种情况下，同样可以利用断点及边际聚束个体原切点等效用，求解补偿弹性。这种方法依赖效用函数的参数假设，下式给出收入变动、税率变动及补偿弹性的隐函数，详细分析不再赘述。

由于弹性实际上可以同式 (3) 中一样进行非参数识别，Kleven 和 Waseem (2013) 开发出了一套简化的方法。这种方法通过引入隐性边际税率——一种类似在聚束区间的平均税率：

从而给出了简化的弹性表达，如下式所示：

2.3 优化摩擦

现实中，聚束效应的发生并没有前面讨论的那么理想。

个体可能会面临较高的调整成本、注意力成本 (Chetty 等 2011；Chetty，2012；Kleven 和 Waseem，2013)。个体还可能无法精确地瞄准零界点。这都会导致聚束现象表现为弥漫性多余质量而非点质量。

在这种情况下，原先聚束量表达式就应该扩展为，其中表征优化摩擦。

断点聚束相比于拐点聚束而言，更不容易收到摩擦的影响，原因是平均税率的改变相比边际税率改变力度更大，劳动者拥有更强的动力去克服摩擦。

3. 聚束估计量

本文主要对拐点聚束展开下述讨论。聚束效应中，各种方法均是采用质量点去估计弹性参数。Bertanha 等 (2021) 开发了半参数估计和非参数估计的方法，这种相比之前讨论的估计方法依赖更少的假设，因此本文主要介绍该方法及其估计。

考虑聚束发生过程，代理人会将其等弹性的准线性效用函数最大化，这导致了其最优收入的数据生成过程 (DGP) 如下：

其中，

表示报告收入的自然对数；
表示个体未被观测到的能力异质性；
为待估计弹性；
预算集的斜率在拐点由变为，其中，表示边际税率，考虑边际税率递增；
式中的阈值分别表示能力的下限和上限；。

上述的数据生成过程表明聚束的质量取决于区间的大小。

下式给出代估计变量间的关系：

式 (19) 包括了 5 个变量: 分别为 (a) 的累积分布函数，(b) 聚束点，(c) 线性约束，(d) 表征能力异质性的累积分布函数以及 (e) 弹性。

式 (18) 将变量 (b)-(e) 映射到了可观测的的累积分布中。而变量 (a)-(c) 可直接被观测。因此，通过上面 2 个式可以解出弹性。

传统的弹性估计方法需要对能力的累积分布进行相关假设，特别地，需要为设定特定函数。

Bertanha 等 (2021) 则采用了两种不同的策略。第一个策略是通过对非参数的异质性分布系列做一个温和的形状限制来确定弹性的上界和下界，从而部分确定弹性。第二种策略是利用协变量和对异质性分布的半参数化限制来确定弹性。

4. Stata 命令介绍

本文着重介绍 Bertanha 等 (2021) 提出的估计方法。其第一种策略由命令 bunchbounds 实现，该策略通过假设异质性概率密度函数 (PDF) 的斜率大小的约束，即 Lipschitz 连续性，来部分识别弹性。

第二种策略由 bunchtobit 实现，这是一种半参数方法，利用协变量来进行点识别。它依赖于 bunching 可以被重写为一个中间删减的回归模型。

由于现实存在摩擦误差，因此在实施上述两种策略前，通常先使用 bunchfilter 对的摩擦误差进行过滤。

命令 bunching 则以集成的方式，实现上述三个命令同样的效果。

4.1 bunchbounds 命令

* 命令安装
ssc install bunching
cnssc install lpdensity // 使用 bunchbounds 命令前必须安装 lpdensity

需要注意的是，所有命令只需安装 bunching 即可。

* 命令语法
bunchbounds depvar [if] [in] [weight], kink() s0() s1() m()
       [nopic savingbounds(filename[,replace])]

其中，

varname: 响应变量，如收入的对数；
kink：结点的位置，必须是一个与响应变量单位相同的实数，在该节点税率等发生改变；
s0：是一个实数，在很多应用中，它是扭结点之前斜率的对数；
s1：必须是一个严格小于 s0 的实数，在许多应用中，它是扭结点之后斜率的对数；
m：是未观察到的异质性的概率密度函数 (PDF) 的最大斜率幅度，是一个严格的正标量。

options 选项：

nopic：抑制显示图形，默认是显示图形；
savingbounds(filename[,replace])：将部分识别集的坐标作为异质性 PDF 的斜率大小的函数保存在文件名 .dta 中。

4.2 bunchtobit 命令

采用串联、Tobit 回归和协变量来确定响应变量对预算斜率变化的弹性。在 Stata 中，根据 Bertanha 等 (2021)的程序设定。该命令用数据的不同子样本运行一系列中间删失的 tobit 回归，且该过程从全样本开始，按照扭结点为中心的对称窗口进行收缩。

弹性估计值被看成是使用数据百分比的函数，最终该命令会给出每个截断窗口中最合适的 tobit 分布。

* 命令语法
bunchtobit depvar [indepvars] [if] [in] [weight], kink() s0() s1()
       [binwidth(#) grid(numlist) nopic numiter(#) 
       savingtobit(filename[,replace]) verbose ]

其中，

depvar：响应变量；
kink：结点的位置，必须是一个与响应变量单位相同的实数，在该节点税率等发生改变；
s0：是一个实数，在很多应用中，它是扭结点之前斜率的对数；
s1：必须是一个严格小于 s0 的实数，在许多应用中，它是扭结点之后斜率的对数。

options 选项：

grid(numlist)：是一个从 1 到 99 的整数列表。列表中的值对应于样本的百分比，这些百分比定义了关键点周围的对称截断窗口。截断的 Tobit 模型在这些样本和全样本上进行估计，因此估计的数量总是比列表中的条目数量多一个。例如，如果 grid(15 82)，那么 bunchtobit 就会对 Tobit 模型进行三次估计，分别使用 kink 点周围 100%、82% 和 15% 的数据。numlist 的默认值是 10(10)90，它提供 10 个估计值；
verbose：显示 Tobit 估计的详细输出，包括最大化似然的迭代，默认不显示；
numiter(#)：最大化 Tobit 可能性时允许的最大迭代次数，它必须是一个正整数，默认为 500；
binwidth(#)：直方图的分档宽度；
nopic：抑制显示图形，默认是显示图形；
savingtobit(filename[,replace])：保存带有每个截断窗口的 Tobit 估计值的 filename.dta。filename.dta 文件包含八个变量，对应于代码存储在 r() 中的矩阵。

4.3 bunchfilter 命令

带有摩擦误差的数据的分布是连续的，没有质量点。这种类型的数据在经济学的扎堆应用中很常见。例如，应税收入的分布通常在边际税率变化的拐点处有一个驼峰，而不是在拐点处有一个质量点。

该命令可在该类混合离散数据中，去除连续分布的摩擦误差。

* 命令语法
bunchfilter depvar [if] [in] [weight], kink(#) deltam(#) deltap(#) generate(varname)
       [binwidth(#) nopic pctobs(#) polorder(#)]

其中，

depvar：响应变量；
kink：结点的位置，必须是一个与响应变量单位相同的实数，在该节点税率等发生改变；
deltam：是结点与要过滤的摩擦误差的下限之间的距离，它必须是一个实数，且与响应变量的单位相同；
deltap：是结点与要过滤的摩擦误差的上限之间的距离，它必须是一个实数，且与响应变量的单位相同；
generate(varname)：生成过滤后的变量，用户指定的名称为 varname。

options 选项：

binwidth(#)：直方图的分档宽度；
nopic：抑制显示图形，默认是显示图形；
pctobs(# real)：为了达到更好的拟合效果，多项式回归使用的是结点周围的对称窗口中百分之 pctobs 的样本观测值。默认值为 40 (取整数，最小=1，最大=99)；
polorder(# integer)：多项式回归的最大阶数，默认值为 7 (最小=2，最大=7)。

4.4 bunching 命令

bunching 是 bunchbounds、bunchtobit、bunchfilter 命令的组合。

* 命令语法
bunching depvar [indepvars] [if] [in] [weight], kink(#) s0(#) s1(#) m(#)
       [nopic savingbounds(filename[,replace]) binwidth(#) grid(numlist) numiter(#)
       savingtobit(filename[,replace]) verbose
       deltam(#) deltap(#) generate(newvar) pctobs(#) polorder(#)]

该命令的详细介绍可从上述三个命令的介绍中获得，故不赘述。

5. Stata 应用实例

采用 (18) 式的数据生成过程，让扭结点，弹性为 0.5，斜率，，按照如下式生成数据：

. webuse set "http://fmwww.bc.edu/repec/bocode/b/"
. webuse bunching.dta, clear
. histogram y

做出模拟数据的直方图如下，观察到数据存在聚束效应。

5.1 估计弹性边界

运用 bunchbounds 命令估计弹性边界，选择 = 2.0794，最大斜率为 2，税率按照数据生成过程。

. bunchbounds y [fweight=w], k(2.0794) s0(0.2624) s1(-0.1054) m(2)

Your choice of M:
2.0000

Sample values of slope magnitude M
 minimum value M in the data (continuous part of the PDF): 
  0.0000
 maximum value M in the data (continuous part of the PDF): 
  0.3879
 maximum choice of M for finite upper bound: 
  1.5932
 minimum choice of M for existence of bounds: 
  0.0090

Elasticity Estimates
 Point id., trapezoidal approx.: 
  0.4893
 Partial id., M = 2.0000 :
  [0.3912 , +Inf]
 Partial id., M = 1.59 :
  [0.4055 , 0.9354]

如图所示，在选择最大斜率为 2 的情况下，弹性的边界为 0.3914 至正无穷。同时，有图中的实竖线给出了弹性存在有限上界时的最大斜率为 1.5923，此时弹性估计的范围为 [0.4055, 0.9353]。注意到，在任何情况下，真实弹性 0.5 都在估计的弹性边界内。

该图还显示了随着最大斜率的增加，上界如何增加及以下界如何减少。使用梯形近似法确定的弹性点发生在边界聚集的水平红线处。

5.2 弹性的半参数点估计

运用 bunchtobit 实现弹性的半参数点估计，该估计不要去异质性 PDF 服从正态分布 (Bertanha 等，2021)。可以通过比较正确指定的模型的估计值和错误指定的模型的估计值来进行稳健性检验。

该命令默认对十个不同的子样本进行了弹性估计。每个子样本都是对称截断的，且以临界点为中心，并包括临界点的观测值。

. bunchtobit y x1 x2 x3 , k(2.0794) s0(0.2624) s1(-0.1054) binwidth(0.08)

bunchtobit_out[10,5]
        data %  elasticity     std err  # coll cov        flag
 1         100   .50526488   .00688012           0           0
 2          90   .50574235   .00710933           0           0
 3          80   .50635666    .0071992           0           0
 4          70   .50547742   .00724238           0           0
 5          60   .50612254   .00732554           0           0
 6          50   .50550213   .00750714           0           0
 7          40   .50566617    .0079238           0           0
 8          30   .50529854   .00857916           0           0
 9          20   .50243629   .01001292           0           0
10          10   .48578085   .01864996           0           0

由于模型被正确地指定，对于任何被截断的子样本来说，报告的弹性估计值都非常接近真实值 0.5。

bunchtobit 还为每个子样本生成一个最佳拟合图，以及所有子样本的弹性估计图。下图列示了 100% 截断子样本的最佳拟合图，图中黑色拟合线为截断的 Tobit 模型隐含结果变量的估计值。

同时，画出弹性对应的每个截断子样本的估计值 (黑线) 和 95% 置信区间 (灰色阴影) 如下图。

最后一个子样本的协变量系数可以通过使用 estimates replay 命令获得。

. estimate replay

------------------------------------------------------------------------------
active results
------------------------------------------------------------------------------
Log pseudolikelihood = .14898244                        Number of obs = 10,000
 ( 1)  [eq_l]x1 - [eq_r]x1 = 0
 ( 2)  [eq_l]x2 - [eq_r]x2 = 0
 ( 3)  [eq_l]x3 - [eq_r]x3 = 0
------------------------------------------------------------------------------
             |               Robust
             | Coefficient  std. err.      z    P>|z|     [95% conf. interval]
-------------+----------------------------------------------------------------
eq_l         |
          x1 |     -0.267      0.157    -1.70   0.089       -0.576       0.041
          x2 |      3.471      1.579     2.20   0.028        0.377       6.565
          x3 |      0.380      0.183     2.08   0.038        0.022       0.738
       _cons |      5.400      1.916     2.82   0.005        1.645       9.155
-------------+----------------------------------------------------------------
eq_r         |
          x1 |     -0.267      0.157    -1.70   0.089       -0.576       0.041
          x2 |      3.471      1.579     2.20   0.028        0.377       6.565
          x3 |      0.380      0.183     2.08   0.038        0.022       0.738
       _cons |      4.951      1.774     2.79   0.005        1.474       8.428
-------------+----------------------------------------------------------------
lngamma      |
       _cons |      0.921      0.350     2.63   0.009        0.234       1.607
-------------+----------------------------------------------------------------
       sigma |      0.398      0.880                         0.200       0.791
      cons_l |      2.150      4.060                        -5.807      10.107
      cons_r |      1.971      3.765                        -5.409       9.351
         eps |      0.486      0.019                         0.449       0.522
------------------------------------------------------------------------------

5.3 摩擦误差

当摩擦误差存在时，必须首先将其过滤掉，然后才能应用聚类估计方法。采用 bunchfilter 操作及结果如下：

. bunchfilter yfric [fw=w], kink(2.0794) generate(yfiltered) deltam(0.12) deltap(0.12)

[ 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% ]

对比下图过滤摩擦前后的 CDF 和 PDF 图，未过滤摩擦前，CDF 几乎连续，没有出现聚束。而 PDF 函数聚束也不明显。

实际上，如果没有摩擦误差，按照数据生成过程，有 5.16% 的响应集中在扭结处。但存在摩擦误差会将这一比例降低到零。在用 ·bunchfilter· 去除摩擦后，过滤后的数据有 5.15% 的响应在扭结处。

上述三条命令可以使用 bunching 一次性实现，代码如下，不展开赘述分析。

. bunching yfric x1 x2 x3, k(2.0794) s0(0.2624) s1(-0.1054) m(2) gen(yfilter) ///
>     deltam(0.1054) deltap(0.0953) pctobs(30) polorder(7)

6. 参考资料

Bertanha M, McCallum A H, Payne A, et al. Bunching estimation of elasticities using Stata[J]. 2021. -PDF-
Kleven H J. Bunching[J]. Annual Review of Economics, 2016, 8: 435-464. -PDF-
Bertanha M, McCallum A H, Seegert N. Better bunching, nicer notching[J]. arXiv preprint arXiv:2101.01170, 2021. -PDF-
Finance and Economics Discussion Series 2021-006. -Link-
Chen S X. The effect of a fiscal squeeze on tax enforcement: Evidence from a natural experiment in China[J]. Journal of Public Economics, 2017, 147: 62-76. -PDF-
Saez E. Do taxpayers bunch at kink points?[J]. American economic Journal: economic policy, 2010, 2(3): 180-212. -PDF-
Kleven H J, Waseem M. Using notches to uncover optimization frictions and structural elasticities: Theory and evidence from Pakistan[J]. The Quarterly Journal of Economics, 2013, 128(2): 669-723. -PDF-
Chetty R, Friedman J N, Olsen T, et al. Adjustment costs, firm responses, and micro vs. macro labor supply elasticities: Evidence from Danish tax records[J]. The quarterly journal of economics, 2011, 126(2): 749-804. -PDF-
Kleven H J, Schultz E A. Estimating taxable income responses using Danish tax reforms[J]. American Economic Journal: Economic Policy, 2014, 6(4): 271-301. -PDF-

7. 相关推文

Note：产生如下推文列表的 Stata 命令为：
lianxh 断点, m
安装最新版 lianxh 命令：
ssc install lianxh, replace

专题：断点回归RDD

倒U型+RDD：利用断点回归检验 U 形关系
Stata：基于大带宽的断点分位数回归稳健推断-rdqte
Stata：RDD-DID-断点回归与倍分法完美结合
RDD断点回归：多个断点多个分配变量如何处理
Stata+R：一文读懂精确断点回归-RDD
RDD：离散变量可以作为断点回归的分配变量吗？
RDD：断点回归可以加入控制变量吗？
断点回归RDD：样本少时如何做？
Stata：断点回归分析-RDD-文献和命令
Stata：两本断点回归分析-RDD-易懂教程
Stata：时间断点回归RDD的几个要点
Stata：断点回归分析-(RDD)-文献和命令
Stata：断点回归RDD简明教程
RDD：断点回归的非参数估计及Stata实现

New！ Stata 搜索神器：lianxh 和 songbl GIF 动图介绍
搜：推文、数据分享、期刊论文、重现代码 ……
👉 安装：
. ssc install lianxh
. ssc install songbl
👉 使用：
. lianxh DID 倍分法
. songbl all

🍏 关于我们

连享会 ( www.lianxh.cn，推文列表) 由中山大学连玉君老师团队创办，定期分享实证分析经验。
直通车： 👉【百度一下：连享会】即可直达连享会主页。亦可进一步添加「知乎」,「b 站」,「面板数据」,「公开课」等关键词细化搜索。