专栏名称: APPSO
让智能手机更好用的秘密。
目录
相关文章推荐
APPSO  ·  刚刚,11 个 AI「鲁迅」大战 2025 ... ·  17 小时前  
小众软件  ·  另外两件事[250606] ·  昨天  
51好读  ›  专栏  ›  APPSO

柯洁输了!人不是那个人,「狗」更不是那个「狗」

APPSO  · 公众号  · app  · 2017-05-23 15:50

正文

请到「今天看啥」查看全文


这种心态在赛制上也有所体现,除了代表中国选手最高水平的柯洁个人之外,新加入的配对赛和团体赛也非常值得关注。
配对赛将由古力、连笑两位九段当中的一人分别与 AlphaGo 组队,再与剩下的一人进行对决,每方只有 1 小时时间,比赛在 26 日上午打响
团队赛则是时越、芈昱廷、唐韦星、陈耀烨和周睿羊 5 位世界冠军组成人类联队,合力对抗 AlphaGo,每方 2 小时 30 分钟,这将在 26 日下午进行。
当 1 对 1 的对决已经过于残酷,人机组队又会擦出怎样的火花,人类联合组成的“神经网络”面对 AI 又是否还有胜算呢?
人不是那个人,狗不是那条狗
千万别以为“坐”在场上对弈的双方一年来都没有变过,用很哲学的说法来说,他们都已经不再是当年那个存在。
自从今年 4 月确定了本次人机对决之后,柯洁已经有意识地在寻找对抗 AlphaGo 的“神之一手”,在先前进行的新奥杯世界赛和中国围甲联赛中,柯洁在 8 盘比赛中输掉了两盘,而这两盘中出现了一些之前并不常见的运子方法,有观察者表示这是柯洁在尝试以传统套路之外的方法寻找 AlphaGo 的软肋。
从这个角度讲,这三盘比赛中的柯洁的策略或许将与之前完全不同。
那一年,柯洁的世界排名还在 AlphaGo 前面
但 AlphaGo,恐怕在以令人绝望的迭代速度进化着。同样在今年 4 月,AlphaGo 之父哈萨比斯在英国剑桥大学进行了演讲,专门提到为了帮助 AlphaGo 提升,他们还开发了名为 Anti-AlphaGo 的防止过拟合的扰乱工具,之前 AlphaGo 提升一个版本需要 3 个月,现在只需要 1 周。
AlphaGo 对阵李世石时的版本号是 V18,而当下的版本估计已经到了 V60,在逻辑上和棋局策略上已经今非昔比。
这种进化的力量源泉与意义,是蒙特卡洛搜索算法和深度学习模式的不断进化。
为了解释上面这两个似乎每个字都能看懂,但其实都看不懂的词,我们先来看两组数字。
如果读过人工智能的科普文章的话,一定知道 20 年前的 1996 年 5 月,IBM 的
“深蓝”计算机在国际象棋中战胜了世界排名第一的卡斯帕罗夫。
从数学上考虑,国际象棋棋盘上能够发生的不同可能大约是 10 的 46 次方,也就是 10000000000000000000000000000000000000000000000。
但这在围棋面前就是小巫见大巫了,围棋共有 19X19 个落棋点,加上不同的落字方式,全部可能大约是 10 的 170 次方左右,根据荷兰科学家 John Tromp 的计算,大约是 208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935。
大家知道,困扰人类很多问题的原因在于算力,比如一个密码锁,如果只有两位,那么如果忘了密码很多人都会尝试去从 00 试验到 99,但 4 位数的手机密码就没几个人去试了,因为试出来花的时间太长,这就是算力不够。
对于现在的 AI 来说,对弈国际象棋所需的算力已经基本达到,但是妄图用穷举法算出来围棋的各种可能的算力还没达到,这种情况下,就要考虑算法了。
而 AlphaGo,就采取了一种“大智若愚”的办法,让算力不足的计算机“大愚若智”起来。
这就是蒙特卡洛搜索算法,我们明白,很多时候两人对决,其实不需要每一步都走当时最好的那一招,只要出的招是妙招,或者比对方能想象的好就行。这时候,就是一个概率问题。
举个非常简单的例子,从你家到火车站共有 ABCDE 五条路,或许你不知道每条路具体的长度和用时,但此时,如果从你家同时出发 500 人,每条路 100 人,然后你到火车站去观察,假设半小时内到达的人里,走 B 的最多,你就可以断定走 B 是条好路。






请到「今天看啥」查看全文