正文
事实上,定量方法与定性方法对社会科学研究都是不能缺少的。对一些重要的研究问题而言,这两种方法都能形成非常出色的研究成果。同时,二者也都有非常清晰的缺陷,学术工作者对此应该有清楚的认识。在对方法论的讨论中,我们首先要认识到定量方法的缺陷与局限,破除对定量方法的迷信。其次,质性研究需要超越当前普遍存在的低水平的局面,向高水平的定性研究发展。在此基础上,我们应该认识到,将二者割裂开来、对立起来是无益的、错误的。方法论的发展,最重要是要形成统一的对因果关系的认识框架,而定性与定量方法或具体的某一种定性或某一种定量方法,均只是学术工作者从事因果理论探索的工具。
本文结构如下:我们首先概述当前实证研究在方法使用上的现状,集中阐述对定量方法的低水平使用和质性研究中常见的问题。然后,通过回顾现有方法论讨论中的经典的因果效应范式,分析其追求“原因的效应”的宗旨、假设和条件,我们将讨论指向定性研究在因果推断型研究中的特殊作用。之后,我们梳理质性研究方法领域的诸多理论基础,如机制发现、案例选择、过程追踪等,指出高水平的质性研究应该努力的方向。在此之后,我们围绕解释和推断因果关系提出评判实证研究科学化水平的统一因果关系理论和可能的实现路径,例如多元主义方法论、嵌套分析、实验逻辑等。我们还将以两个例子说明好的研究如何结合量化和定性研究方法的优势,进行因果推断的研究。最后是简短的几点结论。
20世纪后半叶,社会科学研究日益走上微观化和实证化的分析路径。以美国为代表的实证社会科学研究在方法特别是定量研究方法的使用上,取得了长足的进步。但是,在讨论研究方法时,我们首先应该明确,定量方法尽管带有“科学化”和“数学化”的光环,但在实际应用中却存在诸多巨大的陷阱。也就是说,使用定量研究方法很可能生产出表面看起来“科学”或“严格”但实际上却包含了严重的方法论错误的结果。因此,要正确地使用量化的研究方法,真正使量化方法服务于好的实证研究,首先要破除对量化方法的迷信,认识到量化方法的内在缺陷。
以政治学、社会学等学科为例,最常见的量化研究是通过问卷调查获得数据,然后进行描述性、相关性或多元回归的分析。这是“行为主义革命”以来发展起来的主要的量化研究方法,构成了当代社会科学研究的基本的量化方法体系。但是,这一量化研究模式存在着几个巨大的技术性陷阱,是一般学术工作者需要注意的。
第一,问卷调查对样本的代表性有着十分严格的规定。这种代表性的核心要求是全体中的任何个体在抽样之前被抽中的概率是相等的。为了达到这一目标,就需要实现抽样过程充分的随机性。然而很多研究者对这种量化研究所需的基础性前提缺乏方法论上的认识,要么利用熟人网络、互联网社交媒体等途径获取“方便样本”,要么一味追求更大的样本量。这些方式都是忽视了样本代表性的错误抽样方法。现有实践中,很多硕士论文、博士论文的研究中采用的问卷数据,都没有按照严格的抽样方法来获得样本。已经发表的论文中,抽样方法不符合随机性的标准也是非常常见的现象。
第二,大样本的数据集若要用于统计学分析,必须满足很多条件。每个样本观察值作为相关性和回归分析方法中最基本的分析单元,需要符合“同质性”这个标准很高的统计学假设。根据特定的研究目的,所有不同层次的观察单位,包括每个样本、各个变量、单个变量上的各个取值之间,都应当假定是彼此同质的。
第三,使用问卷调查对行为、态度进行测量,并由此进行因果关系的推论,具有很大的问题。一方面,截面数据难以展现确定的因果关系;另一方面,使用问卷调查来测量政治或社会观念、态度、行为,在问卷的问题设计和研究者试图测量的变量之间,很容易出现差距。此外,由于问卷调查和截面数据的先天缺陷,在使用问卷数据构建回归模型的时候,试图建立因变量和自变量之间的因果关系的空间是非常有限的。
事实上,现有诸多建立在非问卷数据上的量化研究,在概念的操作化、变量的测量、回归模型的稳健性等方面也都有很多值得商榷的地方。首先,概念的操作化需要满足一定的信效度标准,包括在长时间保持稳定,或要经得起不同测度标准下数据集检验的信度标准,以及在考虑测量指标是否真实抓住概念本质程度基础上的聚合与区分 、内容与准则等不同的效度标准。其次,测量规则的设定总是面临来自事实和概念两方面的风险,包括过度主观性下对事实的简单化通约所造成的事实混乱和测量规则不能完全反映概念内涵所导致的形成概念偏移这两类错误。因此,测量规则能否尽可能地同时准确反映主观概念和客观事实,将成为检验一项操作规则优劣的关键。
这些量化研究中存在问题实际上可能源于理论、现实和方法三者之间的相互脱节。著名量化方法专家安德鲁·阿伯特指出,常见的通过线性回归进行定量分析的数据和模型需要满足几个重要条件,包括变量对属性的测量、单一的因果关系、因果关系不存在序列特征、各组因果关系直接相互独立、因果关系不受更高层级的因素(时空)影响等等。但是事实上,一般社会科学中多数的数据集和因此建立的因果模型都难以满足这些条件。为了解决简单的相关性分析和常见的线性模型在方法论上的严重缺陷,统计学家不断地发明一些更复杂的技术,比如分层线性模型、结构方程模型、倾向值匹配等。但这些方法对于多数学者来说往往不容易掌握,无法将其付诸应用。其结果就是,很多量化研究在样本的代表性、数据的质量、变量与概念的匹配、因果关系的假设和确认、因果效应的估算等环节都呈现出极大不足。
在认识论上,量化分析是建立在通过统计学模型来估算自变量对因变量的因果效应的范式上的。比如,如果有抽样调查的数据,就可以通过回归模型估算,在全社会范围内,平均每多上一年学会对就业人员工资收入产生多大的影响。这个估算“原因的效应”范式的重点在于测算某一因素(如教育)对某一结果(如收入水平)会产生多大的影响,而不是去发现某一结果(如收入水平的提高)是由或会因为什么因素造成的。实际上,影响收入的因素很多,有总体的经济发展水平、国家的经济政策、个人从事的行业、个人所处的区域、个人本身的素质如教育程度或领导能力等等。这些因素各自对收入的影响,是很难在同一个回归模型中进行估算的。
通过严格地选取样本、测量各个变量,然后建立严格的统计学模型——多数是回归模型,包括近年来根据严格的面板回归、双重差分等技术——来估算某自变量是否会对因变量产生显著的影响,可以说是量化研究的一条黄金标准。这是由美国三位著名的学者加里·金、罗伯特·基欧汉、悉尼·维巴在他们影响巨大的《社会科学中的研究设计》一书中对因果关系与因果推论所做的经典定义。必须指出,相对医学、心理学等领域而言,在通过统计学模型估算自变量对因变量产生效应这一方法上,政治学、社会学等学科已经是后来者。但是,KKV提出的这一研究设计范式,却在政治学研究方法论中获得了霸主般的地位,对政治学实证研究产生了统治性的影响。这一范式认为,因果关系首先表现为因果效应。因此进行因果推论最主要的工作是发现变量间的因果效应,即找出自变量(解释变量)不同取值时对应的因变量(被解释变量)的观察值中所产生的部分系统性差异。尽管KKV也承认某个相同的因果效应背后可能具有不同的具体影响机制,但他们仍然将识别“原因的效应”作为实现因果推断的方法。
长期坚持推动质性研究的学者,针对KKV对因果关系判断和因果推论的上述认知,从多个角度进行了批判。事实上,KKV所设定的因果效应范式错误地引导了社会科学中的推论逻辑。例如,就KKV因果推论逻辑下所强调的“最大化的观察值” ——即因果推论必须建立在大样本的观察值上进行——这一点而言,为了发现影响效应下的单位同质性和理解单位之间的异质性这两种说法可能存在一定程度上的矛盾,拉里·巴特尔斯认为要求样本最大化这种符合同质性假设的观察样本很难经得起推敲。现有许多研究以国家为单位进行大样本的回归分析,就是一个典型例子:将美国、中国这样的几亿、十几亿人口,社会经济结构非常复杂的国家与毛里求斯、马尔代夫、苏丹等人口、经济规模、社会经济结构差别巨大的国家当作“同质性”的观察单元来进行回归分析,问题是巨大的。另外,在比较政治或国际政治研究领域,以国家为单位的样本数量并非实验样本,很难像自然科学那样被人为增加,又或者从研究问题出发而根本不需要增加。