正文
p
(
H
1
)
和
p
(
H
0
)
)。更重要的是,正是贝叶斯因子根据当前数据将先验概率更新为后验概率。
因此,
NHST
与贝叶斯因子回答了不同的问题。
NHST
试图回答“假定我们已知两个变量
的关系(如,两种条件没有差异),出现当前观测数据的模式或者更加极端模式的概率(
p
(more extreme > observed data|H0)
)有多大”的问题;而贝叶斯因子试图回答的是,在当前数据更可 能在哪个理论模型下出现。考虑到研究者往往想知道当前数据模式条件下,
H
0
或者
H
1
为真的 概率(分别为
p
(
H
0
|data)
与
p
(
H
1
|data)
),在假设检验中,贝叶斯因子具有一些
NHST
不具备的 优势,下一小节将对这些优势进行详细说明。
对贝叶斯因子大小的解读,在
Jeffreys (1961)
的基础上,
Wagenmakers, et al. (2017)
对贝叶斯因子的大小所代表的意义进行原则上的划分(见表
2
)。但是这个划分仅是大致参考,不能严格对应,研究者需要根据具体的研究来判断贝叶斯因子的意义。
由于贝叶斯因子中先验概率具有至关重要的作用,因此如何选择备择假设的先验分布变成 了一个非常重要的问题。其中一个较为合理的做法是,根据采用该范式的先前研究(如元分析得到的效应量)来假设备择假设的先验分布。但这种做法在很多情况下并不现实:首先根据范式的不同,效应量的可能分布不同;更重要地,由于许多研究本身具有一定的探索性,并没有先前研究结果作为指导。因此,更加常用的做法是使用一个综合的、标准化的先验。
例如,在贝叶斯
t
检验中,零假设的先验比较好确定,但是对于备择假设的先验分布应该 如何选择,则比较困难。有研究者指出,使用柯西分布(
Cauchy distribution
)可能是比较合理 的选择。与标准正态分布相比,柯西分布在
0
附近概率密度相对更小一些,因此其比 标准的正态允许更多较大的效应(见图
1
);而与均匀分布(即效应量在所有值上的分布完全相 同)相比,柯西分布更偏好零假设一些。因此,对于备择假设的先验分布,可以如下表示:
Jeffreys (1961)
最早提出在贝叶斯因子中使用柯西分布作为先验来比较两样本的问题。最近
研究者的进一步验证表明,柯西分布可以作为先验用于计算心理学常规假设检验中的贝叶斯因 子,如
t
检验、
ANOVA
和相关分析等。这些验证性的工作,为贝叶斯因子在心理学 及相关学科研究中的应用打下了基础。
如前所述,在假设检验中,贝叶斯因子除了更加符合人们的直觉之外,还具有一些
NHST
具备的优势。这些优势可以总结为五个方面(见表
1
)。以下将从这五个方面展开。
如前所述,贝叶斯因子的计算同时考虑
H
0
和
H
1
,并根据全部现有数据对
H
0
和
H
1
为真的 先验概率进行更新,在此基础之上,比较在当前数据下哪个理论模型(
H
0
和
H
1
)更合理。这种思路与
NHST
不同:在
NHST
框架之下,计算
p
值需要假定
H
0
为真,而对
H
1
不做任何假
设,因此
p
值与
H
1
无关;
NHST
的逻辑是,如果
H
0
为真,观察到当前数据出现的概率非常小,则拒绝
H
0
,接受
H
1
;这种情况下,
NHST
忽略了一种可能性:当前数据下,
H
1
为真的概率与
H
0
为真的概率相当或者更小。例如,在
Bem (2011)
中,
H
0
是被试的反应不受到未来出现 刺激的影响,
H
1
是未来出现的刺激会影响到被试当前反应,即被试能够“预知”尚未出现的刺 激。虽然采用
NHST
的逻辑
Bem (2011)
得到了
p
< 0.05
的结果,即
H
0
为真时,得到当前数据 的概率(
p
(
data
|H0)
)很低,因此作者选择拒绝
H
0
而接受
H
1
,认为被试能够预知未来出现的刺 激。然而,研究者更关心的是,根据当前数据,某个模型
/
假设(如
H
1
)为真的概率(
p
(
H
1
|
data
)
), 而非零假设
H
0
为真时得到当前数据的概率(
p
(
data
|
H
0
)
)。考虑到先验知识告诉我们
H
1
本身为 真的概率可能非常低,在当前数据模式下,
H
1
为真的可能性
p
(
H
1
|
data
)
极可能比
H
0
为真的可 能性
p
(
H
0
|
data
)
更低。
此外,
p
值等于在
H
0
为真的情况下,多次重复实验观察到与当前数据一样极端或者更加极端结果的概率
,即
p
值是假定
H
0
为真时概率分布的尾端面积的积分值。因此,对
p
值的理 解需要假定存在着比当前数据更加极端的数据模式,而人们在直觉上并不太擅长做出这种假定, 常常会带来对
p
值的误解。
因此,由于贝叶斯因子分别量化了当前数据对
H
0
和
H
1
的支持强度,对
H
0
和
H
1
同等对待, 而不是像
NHST
一样完全不考虑
H
1
。另外,贝叶斯因子不需要假定未出现的数据,也更加符合人们的直觉。
同样,由于同时量化了当前数据对
H
0
和
H
1
各自的支持强度,贝叶斯因子可以用来支持
H
0
。在贝叶斯的框架下,只要
H
0
和
H
1
假设是具体的,贝叶斯因子就可以根据当前数据对他们 的后验概率进行一次更新,从而得到当前数据更支持哪个假设的结果。如果
H
0
比
H
1
更加符
合数据的模式,则贝叶斯因子能够表明当前数据支持
H
1
。但是,在传统的
NHST
框架之下,由于假设检验仅在
H
0
为真的假设下进行,仅凭借大于显著性性水平(比如
0.05
或
0.005
)的
p
值是无法为
H
0
是否为真提供证据。比如,仅依据假设检验的结果
p
= 0.20
并不能断言有证据 表明没有效应(
evidence of absence
)(除非结合样本量、效应量和统计效力
Power
做出综合判断)。
在实际的研究中,能够对
H
0
提供量化的证据具有非常重要的意义,它可以直观地让 研究者区分出有证据表明没有效应(
evidence of absence
)和没有证据表明有效应(
absence of evidence
)这两种情况。更具体来说,贝叶斯因子的结果有三种状态:(
1
)提供了支持
H
1
的 证据(即有证据表明有效应);(
2
)支持
H
0
的证据(即有证据表明没有效应);或(
3
)证据对 两者都不支持(没有足够的证据表明有效应还是无效应)。例如,零假设与备择假设相比的贝 叶斯因子
BF
01
=
15
,则说明的是在这种情况下,观察到的数据出现在
H
0
为真情况下的可能 性是在
H
1
为真情况下的可能性的
15
倍,表明
当前数据更加支持没有效应的假设
H
0
。但是, 假如
BF
01
=
1.5
,则说明观察到的数据出现在
H
0