我对迷倒无数人的“显著”也做了点分析,努力说明,所谓“显著”(significant),既非“显山露水”之“显”,亦非“见微知著”之“著”;既非“达官显宦”之显,亦非“功勋卓著”之著。统计分析中的“显著”,意思只是“可能有意思”,“不显著”是“可能没意思”。
听起来玄玄乎乎的“P值”,是坦然自承对结论没有十足把握,不是宣称发现了绝对真理。比如,声明P值是百分之五,不过是承认:“
我认为这个相关系数可能有意思,我做这个结论,犯弃真错误的风险是百分之五”
。如此而已!至于那个相关系数是否真有意思,有什么意思,意思大不大,深不深,统计分析无可奉告,要靠自己“动脑筋”(Aage Clausen教授的口头禅:use your head!)。统计分析的优越,只在于发出的信号清晰,信号标记的概率精确到小数点后若干位。这一点,远胜人间的信号传递。人世间,有“落花有意,流水无情”,例如请斯诺上天安门城楼;也有“烦恼皆由心生”,例如既可鄙又可怜的贾瑞单恋凤姐。明白这一点,
做统计分析时,就能多些冷静,少点自我多情,较有定力抑制无中生有的冲动,不会看到星号就像贾宝玉喜见村女示范纺线,也不会不见星号就如孔夫子梦不见周公惶惶不可终日,当然更不会为了逼出星号对数据大打出手
(在一次学术会议上,Bruce Dickson教授说,数据分析,就是猛掐数据的脖子,一直到它招供为止: squeeze the data until it confesses”,随众人笑过之后,旋即深感凄然)。此外,谈到P值,也不会那么堂而皇之,明明是承认自己的研究结论有犯弃真错误的风险,口气却泰然自若,一副真理在握的气势。
当然,维特根斯坦早就指出,语言归根结蒂是“游戏”。在方法论中,术语归根结蒂是“约定”。约定俗成,游戏能玩下去,沟通有效,误会不深,就没有必要更改术语。翻译界有不少“著名的”错误,比如把德国城市München(读音接近“明兴”或“敏星”)译成“慕尼黑”,历来为方家诟病。但是,翻译领域,正如人间众多舞台,正确战胜不了谬误。面对“怪译”的风车,我有三分自知之明,不当堂吉诃德。在此咬文嚼字,只是希望把被一些奇人的自负无端加高的门槛砍低,恢复原状,
便于对量化分析方法实有兴趣(或者实无兴趣然而被迫学、被迫用)的文科生入门
。当然,我也有个希望,就是初学者少受磨难顺利入门后,不要过河拆桥,也不要回过头来笑吟吟地讥诮刚刚弃掉的独木舟简陋。
哈哈,小编非常期待李老师的《戏说统计》一书早点出版,这样我这个文科生就有希望通过更有趣的方式学会统计学啦。当然,在这本书出版之前,据说李老师专门录制了整整两天的《戏说统计:用日常语言也能学会量化研究方法》,上线后小编会及时推荐哒。