专栏名称: 计量经济圈

记录一个我们生活在其中的时代社会，囊括的主题如下：经济、社会、世界和计量工具。

必读! 动态面板模型为啥比静态的好? 一篇搞清楚动态面板模型, 附代码解读和案例.

计量经济圈 · 公众号 · 财经 · 2025-05-07 11:18

主要观点总结

动态面板模型是一种用于处理面板数据中动态性和内生性问题的计量经济学方法。它通过将滞后被解释变量引入模型，并利用广义矩估计（GMM）来估计参数，以捕捉数据的生成过程中的动态依赖性。与静态面板模型相比，动态面板模型能够更准确地刻画数据的生成过程，区分变量的短期冲击效应和长期累积效应，并可能减少遗漏变量偏误。在经济学各个领域，如宏观经济增长、公司金融、劳动经济学和国际贸易等，动态面板模型因其能够处理持续性和内生性问题而得到广泛应用。在估计动态面板模型时，必须确保原始误差项不存在序列相关，并使用适当的工具变量以处理内生性问题。常用的估计方法包括Arellano-Bond差分GMM和Blundell-Bond系统GMM。估计后，需要进行一系列设定检验，如Arellano-Bond检验、Sargan/Hansen检验等，以验证模型假设的有效性。

关键观点总结

关键观点1: 动态面板模型的定义和重要性

动态面板模型是一种计量经济学方法，用于处理面板数据中的动态性和内生性问题，通过引入滞后被解释变量来捕捉数据的生成过程中的动态依赖性。

关键观点2: 动态面板模型的应用和优势

动态面板模型在经济学各个领域得到广泛应用，因为它能够更准确地刻画数据的生成过程，区分变量的短期和长期效应，并可能减少遗漏变量偏误。

关键观点3: 估计动态面板模型的方法

常用的估计方法包括Arellano-Bond差分GMM和Blundell-Bond系统GMM，需要确保原始误差项不存在序列相关，并使用适当的工具变量。

关键观点4: 设定检验和结果解读

在估计动态面板模型后，需要进行一系列设定检验，如Arellano-Bond检验、Sargan/Hansen检验等，以验证模型假设的有效性。

关键观点5: 动态面板模型的案例研究

Arellano和Bond（1991）的研究是动态面板GMM方法应用的开创性工作之一，通过估计英国制造业企业的动态劳动力需求模型，展示了动态面板模型在经济学研究中的应用。

正文

请到「今天看啥」查看全文

2.2.一阶差分： 该变换从当期值减去上一期值：Δyit=yit−yi,t−1。变换后的方程为 Δyit=ρΔyi,t−1+ΔXit′β+Δνit。虽然 μi 被消除了，但新的内生性问题仍然存在。Δyi,t−1=yi,t−1−yi,t−2 包含了 yi,t−1，而 Δνit=νit−νi,t−1 包含了 νi,t−1。由于 yi,t−1 与 νi,t−1 相关（通过模型），导致 Δyi,t−1 与 Δνit 相关，即 E(Δyi,t−1Δνit)≠0。

因此，动态面板模型中滞后被解释变量的内生性问题根植于模型结构本身以及消除个体效应的标准变换方法。这使得传统的 OLS、FE、RE 估计量均不适用，需要采用基于工具变量（IV）或广义矩估计（GMM）的方法来获得一致估计。

主要的动态面板模型估计方法

为了解决动态面板模型中的内生性问题，特别是 Nickell 偏误，研究者发展了基于广义矩估计（GMM）的方法。GMM 利用模型假设所蕴含的矩条件来构造估计量。最主要的两种方法是 Arellano-Bond (1991) 的差分 GMM 和 Blundell-Bond (1998) 的系统 GMM。这些方法特别适用于 N 大 T 小的面板数据。

1.Arellano-Bond (差分 GMM) 估计量

Arellano-Bond (AB)估计量，有时也称为差分GMM，建立在Holtz-Eakin, Newey, and Rosen (1988) 的工作基础上。

1.1一阶差分消除个体效应： 首先对模型进行一阶差分，以消除不随时间变化的个体固定效应 μi。 Δyit=ρΔyi,t−1+ΔXit′β+Δνit

1.2.利用滞后水平值作为工具变量： 差分后，解释变量 Δyi,t−1 仍然与差分误差项 Δνit 相关（因为两者都包含 νi,t−1）。为了解决这个内生性问题，差分GMM 方法使用滞后水平值作为 Δyi,t−1 的工具变量。

这里的核心假设是，原始误差项 νit 不存在序列相关，即 E(νitνis)=0 对于t≠s。同时，假定解释变量 Xit 是前定或严格外生的（相对于 νit）。

在上述假设下，对于差分方程（时间从 t=3 开始），yi,t−2 与 Δνit=νit−νi,t−1 是不相关的，因为 yi,t−2 只依赖于 νi,t−2,νi,t−3,...。同时，yi,t−2 与内生变量 Δyi,t−1 是相关的（只要 ρ≠0）。因此，yi,t−2 是一个有效的工具变量。

不仅 yi,t−2，所有更早的滞后水平值 yi,t−3,yi,t−4,...,yi1 都是有效的工具变量。Arellano 和 Bond (1991) 指出，随着时间 t 的推移，可用的工具变量数量会增加。例如，在 t=3 时，只有 yi1 可用作工具；在 t=4 时，yi1,yi2 都可用作工具，以此类推。GMM 框架允许有效地利用所有这些可用的矩条件：E(yi,t−sΔνit)=0 对于 t≥3,s≥2 。

对于其他前定或内生的解释变量 ΔXit，也可以使用其适当滞后的水平值作为工具变量。

3.GMM 估计： 利用这些矩条件，通过 GMM 框架求解参数 ρ 和 β。GMM 寻找能使样本矩尽可能接近于零（即满足正交条件）的参数值。

一步 GMM，使用一个假定误差项 Δνit 为独立同分布（或至少是同方差）的初始权重矩阵进行估计。

两步 GMM，使用一步 GMM 的残差构造一个更有效的（允许异方差和序列相关，尽管差分GMM 假设 νit 无序列相关）权重矩阵，然后重新估计。理论上两步 GMM 更有效率，但小样本下标准误可能向下偏误。Windmeijer (2005) 提出了小样本修正方法。

差分GMM 适用条件是，N大T小的面板数据；模型存在动态性（ρ≠0）；原始误差项νit不存在序列相关（这是工具变量有效性的关键）；解释变量Xit 至少是前定的。

差分GMM可能存在的问题是弱工具变量问题，当被解释变量 yit 具有高度持续性（即 ρ 接近 1）时，滞后水平值 yi,t−s 对其差分值 Δyi,t−1 的预测能力会很弱。这是因为当 yit 接近随机游走时，yi,t−s 与 Δyi,t−1 的相关性趋于零。同样，如果个体效应 μi 的方差相对于 νit 的方差很大，也会导致工具变量变弱。弱工具变量会导致 GMM 估计量产生严重的有限样本偏误，且精度下降。

2.Blundell-Bond (系统 GMM) 估计量

为了解决差分 GMM 在持续性序列中可能出现的弱工具变量问题，Blundell 和 Bond (1998) 在 Arellano 和 Bover (1995) 的工作基础上提出了系统 GMM估计量。系统 GMM 通过增加额外的矩条件来提高估计效率和减少偏误。

2.1.结合差分方程和水平方程， 系统 GMM 同时估计一个由差分方程和水平方程组成的方程系统。

差分方程——与差分 GMM 相同为 Δyit=ρΔyi,t−1+ΔXit′β+Δνit。

水平方程——原始模型的水平形式为 yit=ρyi,t−1+Xit′β+μi+νit。

2.2.为水平方程增加工具变量， 系统 GMM 的关键创新在于为水平方程引入了额外的工具变量。差分 GMM 只使用了差分方程的矩条件。系统 GMM 使用滞后差分值作为水平方程中内生变量（如 yi,t−1 和 Xit）的工具变量。

核心附加假设是，除了差分 GMM 的假设外，系统 GMM 需要一个关于初始条件的额外假设，即个体效应 μi 与被解释变量的初始差分（或后续差分）不相关，即 E(μiΔyi2)=0（或更一般地，E(μiΔyit)=0对于t=2,3,...）。这个假设意味着，尽管 μi 可能与 yit 的水平值相关，但它与 yit 的变化量不相关。这通常被解释为过程在初始时期（或均值上）是平稳的。

在这个附加假设下，对于水平方程，yi,t−1 的差分值 Δyi,t−1=yi,t−1−yi,t−2 可以作为 yi,t−1 的有效工具变量。因为 Δyi,t−1 与 μi 不相关（根据附加假设），并且与水平方程的误差项 νit 也不相关（只要 νit 无序列相关）。同时 Δyi,t−1 与 yi,t−1 显然是相关的。

系统GMM 使用的矩条件包括差分方程的矩条件（同差分 GMM）：E(yi,t−sΔνit)=0 对于 t≥3,s≥2和水平方程的矩条件：E(Δyi,t−1(μi+νit))=0 对于 t≥3。类似地，对于其他内生或前定变量 Xit，也可以使用其滞后差分 ΔXi,t−1 等作为水平方程的工具变量。

2.3.GMM 估计， 在一个统一的 GMM 框架内，利用来自差分方程和水平方程的所有矩条件来估计参数。同样存在一步和两步估计量。

它适用条件为N 大 T 小的面板数据；模型存在动态性；原始误差项 νit 不存在序列相关；解释变量 Xit 至少是前定的；关键附加假设：初始条件假设 E(μiΔyit)=0 成立。

当被解释变量序列具有强持续性（ρ 接近 1）或个体效应方差较大时，系统 GMM 通常比差分 GMM 表现更 好，估计量偏误更小、效率更高。这是因为它利用了水平方程中的信息，而滞后差分作为水平方程的工具变量在这种情况下通常不是弱工具；结合了差分和水平信息，可能更稳健。

然而，系统GMM需要更强的假设，依赖于关于初始条件的额外假设，如果该假设不成立，系统 GMM 的估计量可能不一致。此外，还存在工具变量过多问题，即系统 GMM 使用的矩条件比差分 GMM 多得多。随着 T 的增加，工具变量的数量会迅速膨胀（与 T2 成比例）。过多的工具变量可能导致过度拟合内生变量，使得估计量在有限样本中偏向于有偏的 OLS 或组内估计量，弱化 Sargan/Hansen 检验，过度识别检验的功效降低，可能无法拒绝无效的工具变量，导致检验结果过于乐观（例如，p 值接近 1）。实践中通常需要限制工具变量的数量，例如限制滞后阶数或使用 Roodman (2009) 提出的 collapse 选项（将工具矩阵折叠成更小的集合）。

差分 GMM vs. 系统 GMM比较

适用场景

差分 GMM，当序列持续性不强（ρ 显著小于 1）且个体效应方差相对较小时，差分 GMM 的假设较弱，可能是足够的。

系统 GMM，当序列具有强持续性（ρ 接近 1）或个体效应方差很大时，差分 GMM 的工具变量可能很弱，导致估计偏误和效率低下。此时，如果初始条件假设合理，系统 GMM 通常是更好的选择。

优劣总结

差分 GMM，假设较弱，实现相对简单。但在持续性序列中表现不佳。

系统 GMM，在持续性序列中表现更好，效率更高。但依赖更强的初始条件假设，且更容易遇到工具变量过多的问题，需要更谨慎地选择和限制工具变量。

使用选择的建议

通常建议同时估计两种模型并比较结果。如果结果差异很大，需要仔细检查假设的合理性（特别是系统 GMM 的初始条件假设）和工具变量的有效性。进行稳健性检验，如限制工具变量滞后阶数或使用 collapse 选项，观察结果是否稳定。

动态面板 GMM 估计量在主流统计软件中都能实现

Stata 提供了多个命令用于估计动态面板模型，主要包括 xtabond、xtdpdsys、xtdpd 以及xtabond2。

1.xtabond: 实现 Arellano-Bond (1991) 差分 GMM 估计量。

基本语法: xtabond depvar indepvarsin，默认使用一阶差分，并自动使用 y 的滞后水平值（从 t-2 开始）作为 Δyi,t−1 的工具变量。默认将 indepvars 视为严格外生变量，并使用其差分值作为自身的工具。

2.xtdpdsys: 实现 Arellano-Bover (1995) / Blundell-Bond (1998) 系统 GMM 估计量。

基本语法: xtdpdsys depvar indepvarsin，同时估计差分方程和水平方程。差分方程使用滞后水平值作工具（同 xtabond）。水平方程默认使用 y 的滞后差分值（通常是 Δyi,t−1）作为 yi,t−1 的工具。默认将 indepvars 视为严格外生变量。

3.xtdpd: 提供更灵活的 GMM 框架，允许精确指定模型和工具变量结构，可以处理更复杂的模型，例如误差项存在 MA(q) 序列相关或更复杂的前定变量结构。语法相对复杂，需要用户手动指定 GMM 式工具 (dgmmiv, lgmmiv) 和标准 IV 式工具 (iv)。

4.xtabond2: 集成了差分 GMM 和系统 GMM，并提供了更多选项来控制工具变量矩阵（如 gmmstyle(), ivstyle(), laglimits(), collapse），以及更全面的检验输出。语法与官方命令有所不同，需要显式指定滞后被解释变量和工具变量。

常用选项 (适用于 xtabond, xtdpdsys, xtdpd, xtabond2 有类似选项)。

lags(#): 模型中包含的被解释变量滞后阶数 p (默认 1) 。

pre(varlist [, lagstruct(min, max)]): 指定 varlist 为前定变量。GMM 式工具使用其水平值的滞后（通常从 t-1 或 t-2 开始，最多到 max 阶）。

endogenous(varlist [, lagstruct(min, max)]): 指定 varlist 为内生变量。GMM 式工具使用其水平值的滞后（通常从 t-2 开始，最多到 max 阶）。

maxldep(#): 限制用作工具的 depvar 滞后水平值的最大阶数。

maxlags(#): 类似地限制 pre 和 endogenous 变量的工具滞后阶数。

twostep: 使用两步 GMM 估计（默认一步）。

vce(robust): 计算对异方差和组内自相关稳健的标准误。对于两步 GMM，通常包含 Windmeijer 小样本修正。

noconstant: 模型不包含常数项。

artests(#): 报告 Arellano-Bond 序列相关检验结果，最高到 # 阶（默认 2）。

xtabond2 特有选项: gmmstyle(), ivstyle() 用于指定变量及其工具变量的类型和滞后；collapse 用于减少工具数量；robust 隐含 vce(robust)；noleveleq 强制只估计差分 GMM。

基本操作流程

xtset panelvar timevar: 声明面板数据。

xtabond depvar xvars, lags(p)... 或 xtdpdsys depvar xvars, lags(p)... 或 xtabond2 depvar L.depvar xvars, gmm(...) iv(...)...: 估计模型。

estat abond: (仅用于官方命令后) 进行 Arellano-Bond 序列相关检验。

estat sargan: (仅用于官方命令后) 进行 Sargan/Hansen 过度识别检验。(xtabond2 会自动报告这些检验)。

R 中最常用的实现动态面板 GMM 的包是 plm，library(plm)

设定检验与结果解读

在使用 GMM 估计动态面板模型后，必须进行一系列设定检验，以评估模型假设的有效性，特别是关于误差项序列相关性和工具变量有效性的假设。

1.序列相关检验 (Arellano-Bond tests)

这些检验的核心目的是验证 GMM 估计量有效性的关键假设——原始（水平）误差项 νit 不存在序列相关。如果 νit 存在序列相关，那么例如 yi,t−2 可能与 Δνit 相关，从而导致工具变量无效。检验是针对差分后的残差 Δν^it 进行的。

AR(1) 检验，检验原假设 H0:E(ΔνitΔνi,t−1)=0。预期结果，拒绝 H0 (即 p 值 < 0.05 或 < 0.10)。理由是，如果原始误差 νit 是序列不相关的，那么一阶差分 Δνit=νit−νi,t−1 必然会引入负的一阶序列相关（因为 Δνit 和 Δνi,t−1 都包含 νi,t−1）。因此，拒绝 AR(1) 的原假设是符合预期的，它本身并不表明模型有问题。可能的异常情况包括，如果未能拒绝 AR(1) 的 H0 (p 值较大)，这反而可能暗示原始误差 νit 本身存在正的序列相关，这会使得 GMM 估计所依赖的标准假设失效。

AR(2) 检验，检验原假设 H0:E(ΔνitΔνi,t−2)=0。预期结果: 不拒绝 H0 (即 p 值 > 0.05 或 > 0.10)。理由是，如果原始误差 νit 序列不相关，那么 Δνit=νit−νi,t−1 和 Δνi,t−2=νi,t−2−νi,t−3 之间应该没有相关性。不拒绝 AR(2) 的原假设，是支持“νit 无序列相关”这一关键假设的重要证据，从而支持了使用 yi,t−2 及更早滞后项作为工具变量的有效性。异常情况包括，如果拒绝了 AR(2) 的 H0 (p 值较小)，则表明原始误差 νit 可能存在二阶或更高阶的序列相关，这违反了标准 GMM 估计的假设，使得 yi,t−2 等工具变量无效，估计结果不可信。此时可能需要使用更滞后的工具变量（例如 yi,t−3 作为 Δyi,t−1 的工具），或者考虑 xtdpd 命令允许的更复杂的误差结构。

要记住，理想的检验结果是 AR(1) 检验显著，而 AR(2) 检验不显著。

2.过度识别检验 (Sargan/Hansen test)

目的是，当使用的工具变量数量严格多于模型中内生解释变量的数量时，模型是过度识别的。过度识别检验（也称 J 检验）用于检验这些“多余的”工具变量是否满足其有效性的基本条件，即它们与误差项正交（不相关）。检验的原假设 H0 是，所有工具变量都是有效的（即与误差项不相关，且被正确地排除在模型之外）。

Sargan 检验，由 Sargan (1958) 提出，适用于假定误差项条件同方差的情况。通常与一步 GMM 结果一起报告。

Hansen 检验，由 Hansen (1982) 提出，是 Sargan 检验在允许异方差情况下的推广。它适用于两步 GMM 估计量，并且通常被认为是更稳健的检验，尤其是在使用两步 GMM 时。

预期结果是，不拒绝 H0 (即 p 值较大，例如 > 0.10)。

不拒绝原假设意味着没有足够的证据表明工具变量是无效的，这支持了模型的设定和 GMM 估计结果的有效性。

异常情况包括，如果拒绝了 H0 (p 值较小)，则表明至少有一部分工具变量可能与误差项相关，即工具变量无效。这严重质疑了整个 GMM 估计结果的可靠性。需要重新审视模型设定或工具变量的选择。

正如之前提到的，特别是在系统 GMM 中，当 T 相对较大时，工具变量的数量可能变得非常庞大，甚至超过 N。这会导致过度识别检验（尤其是 Hansen 检验）的功效大大降低，几乎总是不拒绝原假设（p 值趋近于 1），从而失去其检验能力，给人以虚假的“模型通过检验”的印象。因此，一个非常高（如 > 0.8 或 > 0.9）的 Hansen 检验 p 值，或者工具变量数量接近或超过 N 时，应引起警惕。建议检查工具变量数量，并通过限制滞后阶数或使用 collapse 选项来减少工具数量，进行稳健性检验。