专栏名称: 拒绝基本dasic
拒绝基本品牌官方订阅号,提供品牌最新资讯和会员服务。我们在全世界寻找跟你一样,最热爱生活的那一小群生命共同体。
目录
相关文章推荐
甘肃省司法厅  ·  【思想引领 ... ·  5 小时前  
甘肃省司法厅  ·  【理论新窗口】建设教育强国,如何强化教育对科 ... ·  6 小时前  
甘肃省司法厅  ·  夜读 | 致高考生:高高兴兴去考试! ·  2 天前  
甘肃省司法厅  ·  甘肃司法行政一周工作回顾 ·  2 天前  
甘肃省司法厅  ·  主播说联播丨“价格战”刹车,中国汽车加速! ·  2 天前  
51好读  ›  专栏  ›  拒绝基本dasic

AlphaGo 是赢了, 但我觉得它其实还是挺笨的

拒绝基本dasic  · 公众号  ·  · 2017-05-26 22:34

正文

请到「今天看啥」查看全文


这么来说,有些异样,为什么这么聪明的 AlphaGo,不真正做成一个机器人,能看棋盘,能下棋子,能思考,还能说笑,会不会更好玩。其实,有时看起来简单的事情,让机器来做不一定简单,这是后话,不啰嗦了


好了,段子讲完了,该言归正传了。免得被唾沫淹死,首先申明一下,AlphaGo 确实很厉害的,也不简单。

但是,为什么又说,AlphaGo 挺 “笨” 的呢?

我们知道,围棋的搜索空间很大,有 3 的 19x19 次方个状态,要在这么大的空间去找最优算法,一个一个看是不可能的, 所以被认为是人类智能的一个高点,解决时需要优化搜索。

人是根据一些输入空间和参数较少的模式识别来记忆和搜索,而机器采用的却是大数据,大记忆和大计算来实现的。说到 AlphaGo 后面的智能和算法,就不能不说 深度学习(DL),强化学习(RL),和蒙特卡洛树搜索(MCTS)。

深度学习,主要用来学习和建立两个模型网络。

一个是评测现在的棋盘状态如何,也就是说给当前的棋盘状态打个分,评估一下赢的期望值,它就是价值网络(Value Network)。输入是棋盘 19x19 每个点的状态,有子或无子,输出是赢的期望值。

按理说,如果要是有一个聪明的数学家或是机器足够聪明,说不准他马上就能在黑板上写一个高级的数学公式。 很遗憾,现在还没有,所以,只能用多层的神经元网络来近似表示这个高级的函数 。这么来说,是不是有点「笨」。







请到「今天看啥」查看全文