正文
结果如下:
1、 本来大家以为胜出者会是一个绝顶聪明的策略,没想到却是一个看起来最不聪明,而且超级简单的策略:
以牙还牙(Tit for Tat)
。
这个策略在第一回合时采取合作行动,然后在接下来的所有步骤里,只是简单复制对手上一步的行动,一报还一报,你合作,我合作,你背叛,我背叛,你悔改,我也悔改。
2、其它的策略,包括冷酷策略(一旦发现对方背叛,永不再合作)、下马威策略(从背叛开始)、不定期主动背叛策略(时不时的作恶一下)、永远背叛策略、永远合作策略等,都排在后面。
3、总体来说,偏“善良”类的策略,也就是不主动背叛,其表现优于“恶意”类的策略,后者倾向于主动背叛;“宽容”类的策略表现优于“刻薄”类的策略 ,后者失去了再次合作的可能性。
4、最差的策略是随机,其次是一个超级复杂的策略,没人看得懂它想干什么(当时大家嘲笑说,这一定是来自美国政府)。
5、阿克塞尔罗德后来自己还想出了第16个策略,宽容版的以牙还牙 -- 两牙还一牙,你背叛两次,我才报复一次。这个策略表现更优,甚至超过了以牙还牙。
第二轮
这个乌托邦式的结论,让人有些惊讶。只是重复博弈,就一下子从丛林法则进入美好新世界了?
于是,阿克塞尔罗德又举办了第二次竞赛。他把上述所有结果都公之于众,然后再次征集策略。这次他收到了62个策略,再加上随机策略,总共63个。这一次,博弈中的回合数不再固定为200,而改为开放式的不定数。
结果如下:
1、很惊讶,两牙还一牙没有最终获胜,以牙还牙再次成为赢家。后来分析,背后的原因其实是有人针对宽容版的以牙还牙策略制定了恶意的对策,利用了对方的那一次宽容钻了空子。甚至有人设计出了三报还一报的超级宽容策略 ,但也没有成为最终的胜利者。
2、所以,马上就可以有第二个结论,你的策略优劣和对手的出牌是相关的,也就是说外部环境很重要。
3、善意策略再次战胜了恶意策略,前15名中只有一个是恶意策略,而倒数15名中只有一个善意策略。
4、一旦比赛次数为固定次数,则倾向于单次博弈,永远背叛策略会获胜,如果比赛次数是不固定、或者无限次,那就是以牙还牙等善良策略胜出。
第三轮
作为生物学家,道金斯更关心的是这个模拟怎么才最接近自然选择。于是在他建议下,阿克塞尔罗德又模仿自然选择,进行了第三场竞赛。这次,他并没有邀请新的参赛者,而只是使用了第二次竞赛中的63个策略,但是赢家不再得到“金钱”或者“分数”,而是与其完全相同的“后代”,这样世世代代如此传递下去。
结果如下:
1、那些恶意策略,有一些开始蓬勃发展,迅速崛起,比如永远背叛、小偷、骗子,但它们的繁荣只是昙花一现,大部分后来被以牙还牙群殴,像极了好莱坞的英雄片,坏人终被惩罚。大部分恶意策略都在150代之内就灭绝了,唯一活过200代的一个策略叫做“哈灵顿”(Harrington),它靠欺负老实人获利,但随着老实人绝种,它也在1000代之后终于完全灭绝。
2、以牙还牙在6次模拟中有5次得了第一,重复其在第一、二次竞赛时的好运。另外5个虽善良但也会报复的策略几乎和以牙还牙一样成功(在种群数目上),还有一个策略甚至赢了第6次博弈。
3、当所有恶意策略都灭绝后,到了1000代形成了稳态,所有的善良策略与以牙还牙都无法辨认彼此了, 所有人都只是简单的合作到底。