本研究的目的是批判性地回顾2016至2017年期间《欧洲社会学评论》上所有涉及回归分析并调整了控制变量的文章(总共95篇)。核心问题是:在回归分析中,是否提供了足够的理论依据来解释所选的控制变量,特别是这些控制变量是否有助于正确理解暴露变量(X)与结果变量(Y)之间的关系。这两个问题本质上探讨了控制变量是否能够体现研究者关于因果机制的合理假设。
为此,作者在回顾过程中设定了三个主要标准:
-
效应参数的定义:
首先,本文关注的是研究是否明确界定了研究的“参数”,即他们究竟在估计什么样的效应。只有在研究者明确了效应的定义之后,才有可能进行对控制变量选择的批判性审视,因此效应参数的定义可以视作是研究中其他所有统计假设的基础。在没有明确效应参数定义的情况下,任何进一步的讨论都可能缺乏实质性。
-
控制变量选择的理论依据:
其次,本文将检视研究是否为所选的控制变量提供了充分的理论依据。根据因果推断的基本原则,控制变量的选择应该是基于对因果路径的假设,而非仅仅基于数据中的相关性。理论基础的缺失或薄弱,往往导致控制变量选择的随意性,进而影响结果的可靠性。本文将考察文章中是否明确定义了控制变量的因果角色,特别是它们是否是暴露变量与结果变量之间的因果链条的“祖先”变量(即在因果路径上应该被控制的变量),或者是否只是一些无关的相关变量。
-
回归系数的解释:
最后,本研究将检视文章是否对回归系数进行了适当的因果推断解释。尤其是在多元回归分析中,通常会存在多个控制变量,且回归系数的解释常因对因果路径的误解面临理解错误的风险。可以说,如果控制变量选择不当,回归系数就可能不再具有清晰的因果解释效力。因此本文的回顾标准要求,回归系数的解释必须符合因果推断的基本规则,即解释的系数应反映的是暴露变量与结果变量之间的因果效应。
值得一提的是,Lundberg、Johnson和Stewart(2021)的研究使用了与以上部分重叠的标准回顾了《美国社会学评论》(ASR)中的35篇定量文章,进一步佐证了本篇文章回顾标准的效度。
通过这三大回顾标准,作者希望能够揭示现有文献在因果推断方法上的常见不足,并提出改进建议。特别是在控制变量选择和回归系数解释上,针对很多研究存在忽视理论假设、未能充分考虑潜在偏误的情况作出辨析。这些标准为后续的分析提供了清晰的框架,同时为改进定量社会学研究方法提供了指导。
为深入理解控制变量选择的重要性及其在因果推断中的作用,本文引入了因果图模型(DAG)作为可视化工具,帮助指导控制变量的选择。DAG通过图形化展示变量之间的因果关系,帮助研究者明确哪些变量应被控制,哪些应被排除。本文认为,DAG不仅能提升因果推断的透明度,还能帮助研究者更好地理解控制变量选择的理论依据,减少方法学上的错误。
在进行实际回顾之前,本文希望澄清并避免两种可能的误解:
第一个误解是,读者可能认为我们的回顾标准仅适用于那些假设图形因果模型优于潜在结果框架的研究者(例如计量经济学中的框架,Angrist和Pischke,2009年提出,Morgan和Winship(2007年)或Gangl(2010年)等学者将其引入社会学领域)。实际上,这篇回顾同样可以基于潜在结果框架进行,并且在实证结果上不会有任何实质性差异。尽管如此,我们希望因果图模型的方法能够为应用社会学研究者提供启示,推动这一思想的传播。
第二个误解是,读者可能认为,只要满足所有回顾标准,就能证明某个分析是有效、合理的,或者符合良好的实践标准。我们认为,这些回顾标准只是最低要求。如果一个分析涉及调整了控制变量的关联,我们要求对这些控制变量提供某种理论性解释。提供这些解释并不意味着它们一定是正确的,或在所有必要的控制变量都已调整的情况下是完整的。即便我们的标准得到满足,未观察到的异质性(unobserved heterogeneity)仍可能成为问题,针对这一点,我们在文中明确提到控制未观察到的异质性的方法(Wooldridge,2010)。