专栏名称: 虎嗅APP
有视角的商业资讯交流平台
目录
相关文章推荐
雷峰网  ·  「车圈恒大」?未免杞人忧天 ·  昨天  
新浪科技  ·  【#小米汽车5月交付超28000辆#】@小米 ... ·  昨天  
IT之家  ·  再也不怕刷屏,微信界面空前清爽 ·  2 天前  
新浪科技  ·  【#特斯拉原型车曝光##特斯拉平价Model ... ·  2 天前  
51好读  ›  专栏  ›  虎嗅APP

我是黄士杰,AlphaGo的“人肉臂”

虎嗅APP  · 公众号  · 科技媒体  · 2017-05-31 16:34

正文

请到「今天看啥」查看全文



1月27日,《自然》杂志以封面论文的形式,介绍了DeepMind团队开发的AlphaGo,以及它击败了欧洲冠军樊麾的消息。

席尔瓦和黄士杰,并列作为这篇论文的第一作者。

在击败樊麾之后,AlphaGo的价值网络、策略网络和搜索能力都在继续增强,使用的硬件也从GPU换成TPU。TPU让AlphaGo的计算能力获得极大提升。

3月9日-15日,AlphaGo和李世石大战五场。最终AlphaGo以4:1取得胜利。当时坐在李世石对面,代替AlphaGo落子的还是黄士杰。

左一为黄士杰,中间坐着的是樊麾

黄士杰第一次出现在全球观众的视线里。

黄士杰像机器人一样,出现在李世石和全球观众的视线里。

李世石后来回忆说:“黄士杰是此次人机对弈中最辛苦受累的人,他担心我会受到影响,对弈期间,他一直面无表情,甚至连一次洗手间都没去过”。

一次对弈,最长可能耗时近6个小时。在与李世石的无论对弈中,黄士杰只喝过一口水。黄士杰的这种表现,甚至走进了对手的梦里。

有次酒店的早餐送来后,李世乭的妻子唤醒他起来吃早饭。没想到李世石竟然回答说:“嗯,我要和Aja一起吃。”

与李世石的比赛之后,黄士杰有过短暂的休假,几乎没有采访报道留下。一位名叫Fred Zhou的中国记者告诉量子位,在韩国比赛期间,黄士杰并不被允许接受采访,据说是因为他习惯于表达的毫无保留。

再后来DeepMind放出了棋谱,AlphaGo继续新的成长。这年11月18日,黄士杰总结说:“最近我的一个心得是,人的进步最多是用跑的,电脑的进步却是用飞的”。

在这一年即将结束的时候,AlphaGo又回来了。2016年12月30日,Science News发布了一条推特,基本跟内文无关,推文如下:AlphaGo: “Now, I am the master.”

2017年

事情从2016年12月29日晚开始,一个用户名为“Master”,标注自己是韩国九段的棋手,连续在弈城和野狐围棋平台大杀四方,连续“斩杀”各路围棋高手,包括:柯洁、朴廷桓、井山裕太、陈耀烨、申真谞、常昊、古力、周睿羊……

Master挑起的这场战斗,以60连胜顶级高手而告终。其中柯洁连输三场,期间因为急性肠胃炎而人生第一次住院,这一经历也被编成调侃的小段子。

取得第59场连胜之后,Master在聊天室公布了自己的身份:“我是AlphaGo的黄博士”。果然是AlphaGo,果然又是黄士杰。

“非常期望今年能有机会与围棋组织以及专家共同探索围棋,在相互启发的气氛中共同领会围棋的奥妙。我们希望尽快发布其他公告”,哈萨比斯在稍后的正式声明中说,这再次暗示了AlphaGo与柯洁的大战即将进行。

4月10日下午三点,在中国棋院的发布会上,正式宣布柯洁与AlphaGo的人机大战5月底开打,柯洁当时表态会不惜一切手段与AlphaGo一决胜负:“我不会说输了无所谓,我抱有必胜的心态和必死的信念”。

5月23日,雨从早下到晚,围棋人机大战如期举行。柯洁对面,坐着的仍是黄士杰,仍然作为AlphaGo的“人肉臂”代为落子。

柯洁旁边的桌子上,除了一个水杯,还有两盘水果和零食。而黄士杰这边的桌子上,只有一个白色的瓷质水杯。三场比赛皆是如此。

双方对弈的最后一局

每场比赛结束后,黄士杰都会很快的从对局室,返回现场的观赛大厅。但他只是静静的站在一个角落,低头看着自己的手机,有时朝台上看看,等待柯洁等人站在聚光灯下,而身材不算高大的他时常会被身边的人挡住。

第二场对战结束后,柯洁在台上谈起黄士杰:

“黄博士作为AlphaGo的核心人物,非常了不起。我觉得,他坐在我面前就像个机器人一样(笑)。如果是古力坐在我对面,他可能看到AlphaGo的下法可能会露出惊讶的表情。”

“黄博士来摆棋,可能更让我有和AI对战的感觉。我也特别佩服黄博士,大家看直播也能看到我很爱动,总喜欢活动身体,而黄博士总是一动不动,不上厕所、不喝水、也不吃东西……所以跟黄博士下棋时,我觉得黄博士就是AlphaGo。”

当时哈萨比斯也说:“黄博士非常不可思议,有时候我们也觉得他是个机器人。我想他之前一定对着镜子练过”。

2017年5月27日

“最后一局即将开始,我要亲手下出AlphaGo的每一步棋”,人机大战最后一天的上午9:35,黄士杰在朋友圈发了这样一句话。

量子位当时就有一种异样的感觉。一是黄士杰从来没有在赛前发声,二是这话里明显有着隐忍而又强烈的情绪。

最后一战,柯洁一样情绪强烈。

那天下午1点06,对局中的柯洁摘下眼镜,神情沮丧。两分钟后,柯洁起身离席。代替AlphaGo落下第127子的黄士杰博士,赶紧拿起杯子喝了一口水。随后黄士杰又恢复平静的表情,一直低头看着棋盘。

时间过了很久,离席的柯洁还没回来,黄士杰也开始抬头张望。十多分钟后,柯洁终于回来。后来我们知道,柯洁躲在现场的宣传板后,哭了。

下午1点22分,柯洁又抹了抹眼角。此时双方行至第129手。

经过209手的交锋,柯洁再负AlphaGo。

“其实今天下棋的时候我有点失态了,因为它(AlphaGo)下得实在是太完美了……我只能猜得出它一半的棋,这就是我和它之间巨大的差距”,赛后柯洁在台上哽咽讲出最后一战的感受。

稍后不就,同在台上的哈萨比斯表示,AlphaGo从此“退役”。这时量子位才多少理解了黄士杰早上那条朋友圈的意义。

上述种种发生的时候,黄士杰就坐在台下第一排,正中间的位置,抬着头静静地听着。看不到他有什么表情,也看不到有什么动作。也仍然没有上台发言的机会。有媒体靠近,黄士杰仍是那句:他们不让我接受采访。

5月28日凌晨0:34,黄士杰在朋友圈发出这样一句话:“天下没有不散的筵席,我转往其他专案的时刻已到”。

一切就这样收官了。这是载入人类历史的又一战。

最后

“这几年,特别是来到英国工作之后,有时候我觉得人生就像做梦一样。在团队与同事们的身上,我也看见了人因梦想而伟大的真实意义”,年初有同事问黄士杰以前研究电脑围棋时有没有想到今天,他写下这样一段话。

从开始到现在,黄士杰看着AlphaGo的出生、成长、名满天下。黄士杰一直以AlphaGo的“人肉臂”出现,像一个机器人一样。

但黄士杰,远远不止是AlphaGo的“人肉臂”。

本文转自微信公众号:量子位(ID:QbitAI),虎嗅获得授权转载。

他面无表情,他冷静镇定,他会出现在对手的梦里,他是AlphaGo的“人肉臂”。他热情幽默,多才多艺。他很少登台演讲。他不被允许接受采访。他是AlphaGo真正的创造者。他是Aja,黄士杰。

许峰雄绰号“CB”。

1980年,许峰雄(Feng-Hsiung Hsu)从台湾大学本科毕业,1985年考入卡内基梅隆大学。1988年,CB制造出国际象棋程序Deep Thought(深思),后来经过学弟李开复介绍,1989年加盟IBM继续展开研究。

1997年

这一年5月11日,卡斯帕罗夫与Deep Blue(深蓝)的第二次国际象棋人机大战落幕,最终人类棋王以2½-3½的总比分,不敌IBM的超级电脑。

这是载入人类历史的一战。

Deep Blue,就是CB许峰雄在IBM开发出的新一代国际象棋电脑程序,棋力数百倍于早先的Deep Thought。

卡斯帕罗夫与深蓝的国际象棋人机大战

同年7月,台北成功高中的黄士杰参加联考。当年国文试题第15题,B选项是:现代电脑的优点多得「罄竹难书」令人不得不叹服 。

黄士杰最终考入台湾交通大学,四年后获得计算机与信息科学学士。2001年,黄士杰考入台湾师范大学攻读研究生学位。

2003年,黄士杰硕士毕业。毕业论文:《电脑围棋打劫的策略》。在学校当了一年的研究助理后,2004年,黄士杰再次考入师大资讯工程研究所博士班。

2007年

这年2月28日,台湾师范大学的学生组织了一次围棋同好聚会。随后这个定期的聚会,发展为师大围棋社,黄士杰是其中年纪最大的学长,并担任首届社长。3月,黄士杰拟定了首次对战分组表,比赛地点在男生宿舍地下餐厅。

左一是师大就读期间的黄士杰

同年5月,黄士杰带领师大围棋社参加台湾大专杯围棋赛。曾经有台湾媒体报道称黄士杰曾经带领师大围棋社在这项比赛中夺冠。不过量子位仔细查找后发现,师范大学仅在2009年获得过第五名,其他年份均榜上无名。

同一赛事15个级别的个人战中,前八名也没有看到黄士杰的名字。2004-2011年间,黄士杰一直博士在读,而他的棋力水平是业余六段。

虽然没能在人类的围棋赛中获得瞩目成绩,但黄士杰在另一条路上继续进发。他的一个主要战场是国际计算机游戏协会(ICGA)组织的电脑棋类程序竞赛。顾名思义,来自全世界的电脑高手,在象棋、围棋等领域展开斗法。

在这个比赛中,黄士杰的名字写作:Shih-Chieh Huang。

2006年,黄士杰独自开发的第一款围棋程序AjaGo,获得围棋大赛第11名;他参与的中国象棋程序Elephant(大象),获得大赛的铜牌。此后几年,黄士杰开发的围棋程序参赛成绩一直没有亮眼的成绩。

2010年

这一年9月,哈萨比斯(Demis Hassabis)等三人在英国伦敦合伙成立了一家新公司,名字叫做DeepMind。

2010年黄士杰开发的Erica击败Zen获得冠军

同一个9月,黄士杰在Rémi Coulom的指导下,开发出围棋程序Erica,并在围棋比赛中击败日本的Zen,获得当年的冠军。这在当时可算了不起的成就。Rémi Coulom是另一个围棋程序Crazy Stone的作者。

因为Erica的夺冠,让黄士杰在参加博士毕业答辩前,就已经获邀前往加拿大阿尔伯塔大学攻读博士后,并担任电脑围棋程序的研究员。他的博士论文题目是:《应用于电脑围棋之蒙地卡罗树搜寻法的新启发式演算法》。






请到「今天看啥」查看全文