正文
朗博·阿道夫·雅克·凯特勒
(Lambert Adolphe Jacques Quetelet)
理解这一可能性,并不遗余力地将自己的数据分为足够相似的集合进行分析。
凯特勒的正态曲线研究对高尔顿产生了深远的影响,因为该研究提供了一种尺度,能够用来分门别类地给人评个三六九等。然而,当高尔顿自己用这一曲线的时候,他预测说其始终适用于“同一种族的人”。所以,高尔顿给欧洲白人想象出了一条钟形曲线,给非洲人想了另一条,给亚洲人第三条,以此类推。相互比较曲线就能表明种族之间的巨大差异。
在殖民主义盛行时期,像高尔顿这样的种族主义观点在英国上层社会并不罕见,但是高尔顿赋予了它们科学背书。
他拥有全球旅行家的威名,这是维多利亚时代博物学家的传统操作,就像他那位搭乘过小猎犬号的表亲一样。他对其他人种劣于英国白人的评价进一步将这些观点推上常识的神坛,合理化殖民者在亚洲、非洲和美州难以估量的暴行。
与此同时,在高尔顿的时代,对优生学的支持凤毛麟角。在自己人生的最后时光,高尔顿发表了题为《概率——优生学的基础》
(
Probability, the Foundation of Eugenics
)
的演讲。他感叹公众尚未了解优生学,尤其是那些仍然和“几乎随便什么人”结婚的人,惋惜他们不考虑优生潜能,他还预言公众的意见将会动摇,在“当收集到足够的证据,让所有人都能够理解真相的时候”。
卡尔·皮尔逊
数学先驱,卡方检验提出者,赞扬美国的原住民大屠杀
优生学运动最伟大的圣战士就是卡尔·皮尔逊,此人如今主要的功绩在于
创造了数学统计学科
。皮尔逊涉猎多个学科领域,是一位知识渊博的多产学者。剑桥毕业之后,他先后学习过物理、哲学、法律、文学、历史和政治科学,随后成为 UCL 的应用数学教授。在那里,他接触到了高尔顿的思想,这两位卓有成效地合作了多年。皮尔逊称优生学为
“人类种族的自觉定向演化”
,他还说高尔顿带着“先知般的热情”理解他的想法。
皮尔逊拥有极端的种族主义政治观点,而优生学为这些观点提供了发声的语言和平台。
在皮尔逊看来,种族之间的冲突不可避免,也合理可取,因为冲突有助于淘汰劣等群体。
正如他本人所说,“历史向我展现了一种方式,也只有这种方式,能够造就高级文明,就是种族之间的斗争,生理和心理都更优越的种族才会生存下来。”他将美国对美洲原住民
的种族灭绝视为一场伟大胜利。
作为统计学家,皮尔逊拥有高尔顿缺乏的数学技巧,极大完善了统计学理论的严谨性。1901 年,他与高尔顿和生物学家拉斐尔·威尔顿
(Raphael Weldon)
一起创立了《生物测量学》
(
Biometrika
)
期刊,几十年来一直是统计学理论的首要刊物(直到今日仍受到高度重视)。皮尔逊一直担任编辑,直至 1936 年逝世。
皮尔逊尝试解决的第一批理论问题之一,就是困扰凯特勒和高尔顿的双峰分布,并引出了显著性检验的最初案例。
到了 19 世纪末,随着科学家们开始收集更多数据,以更好理解演化过程,这样的分布开始更经常地出现。威尔顿收集过一些拥有特别与众不同测量值的螃蟹壳,这启发了皮尔逊,想要搞清楚,究竟如何确定观察结果是否呈正态分布?
图片来源:
Pixabay
在皮尔逊之前,最佳做法就是将结果收集起来,用直方图展示,看看是否像贝尔曲线。皮尔逊的分析引领他研究出如今著名的
卡方检验
(chi-squared test)
,使用 χ
2
代表经验结果和理论分布之间的“距离”。如果理论正确,利用皮尔逊计算的概率,那么量值不太可能会很高,因为这意味着偏差过大。这形成了我们如今理解的显著性检验的三大组成模板:
1. 假设数据中的某种分布(比如:所有个体都来自同一物种,所以其测量值应呈正态分布)。如今这被称为“零假设”,如同一个稻草人,其对立面是更有趣的研究观点,例如两种人口在某种方面表现出实质性差异。
2. 使用像皮尔逊的 χ
2
那样的检验统计,去测量现实观测与理论预测差距有多远。
3. 判断观测到的偏差是否足以击倒“稻草人“,该偏差通过统计数据偶然变大(至少如此)而得出,如今称为 p 值。通常来说,当 p 值小于 0.05,就有足够的理由否定零假设,其结果具有“统计学显著性”。
在皮尔逊的用法中,“显著性”这个词不一定代表重要性,或者量级,只是形容词“显著的”
(significant)
的名词化,意思是“有指示性”。也就是说,如果实验结果明显指示,理论假设在某种确定程度上是真的,那么实验结果对于理论假设具有“显著性”。
应用自己的检验方法,皮尔逊得出结论,一些像威尔顿螃蟹测量值的数据库并不是真正地呈正态分布。然而,种族差异却是他从一开始就最主要的兴趣点。皮尔逊的统计学研究离不开他对优生学的拥护鼓吹。他最早的一些案例计算就涉及到一系列头骨测量,他认为头骨测量值能够表明种族之间的差异,通过将差异扩大到智力或者性格方面,形成了其优生学思想。
以看似科学的方式来建立差异,向为种族优越性正名迈出了一大步。
与此同时,皮尔逊正在描述识别非正态数据的方法,他写道:“不对称可能由以下事实导致:检测材料中组合到一起的单元并不同质。”而将统计学陈述和优生学陈述结合起来的“同质”一词,对皮尔逊来说具有特别含义,意指种族纯粹性。数据同质性以及其暗示的人种同质性,都无可避免蒙上了种族主义的色彩。
这里有另一经典事例:1904 年,皮尔逊在《生物测量学》杂志上发表了一项研究,他使用自己发明的
“四分相关”
(tetrachoric correlation)
技术,报告了 4000 对兄弟姐妹中,眼睛颜色等遗传性状与诸如“活力”、“自信”和“内省”等这样的心理素质拥有同样的相关性,并总结这些特质拥有同等的遗传性。最后,他断言英国人无法跟上美国人和德国人的进化速度,并建议:“智力可以通过辅助和训练得到培养,但是训练或者教育无法创造智力。你必须通过生育创造出来,这也是治国策略的普遍结果,源于人类心理和生理特征的平等遗传。”