专栏名称: EETOP

EETOP电子网(中国电子顶级开发网）是国内最顶级的电子行业工程师社区，涉及：嵌入式、智能硬件、半导体集成电路设计及制造等。为您分享论坛精华内容、行业最新资讯、产品及技术。网址：www.eetop.cn bbs.eetop.cn

采用了TPU技术，新版Alpha Go比去年强十倍！但有人还是觉得它挺“笨”?

EETOP · 公众号 · 硬件 · 2017-05-24 08:15

正文

请到「今天看啥」查看全文

杰米斯·哈萨比斯同时还称，本周将会宣布Alpha Go的未来动向，并在今后披露更多技术细节。他表示，Alpha Go仍需要和人类对弈，通过先学习棋谱，在自我提高，依靠人类棋谱数据和前一版本进一步提升。因此，仅通过自身对决可能无法发现问题，所以通过与顶尖棋手对决才能提高自身的实力，并在其他领域为人类服务。

标题上我们说有人觉得 Alpha Go挺“笨”，下面我们转载一篇来自虎嗅网的观点来解释：

AlphaGo 其实挺“笨”的

首先申明一下，AlphaGo 确实很厉害的，也不简单。但是，为什么又说，AlphaGo 挺“笨”的呢？

我们知道，围棋的搜索空间很大，有3的19x19次方个状态，要在这么大的空间去找最优算法，一个一个看是不可能的，所以被认为人类智能的一个高点，解决时需要优化搜索。人是根据一些输入空间和参数较少的模式识别来记忆和搜索，而机器采用的却是大数据，大记忆和大计算来实现的。说到 AlphaGo 后面的智能和算法，就不能不说深度学习（DL），强化学习（RL），和蒙特卡洛树搜索（MCTS）。

深度学习，主要用来学习和建立两个模型网络。一个是评测现在的棋盘状态如何，也就是说给当前的棋盘状态打个分，评估一下赢的期望值，它就是价值网络（Value Network）。输入是棋盘19x19每个点的状态，有子或无子，输出是赢的期望值。按理说，如果要是有一个聪明的数学家或是机器足够聪明，说不准他马上就能在黑板上写一个高级的数学公式。很遗憾，现在还没有，所以，只能用多层的神经元网络来近似表示这个高级的函数。这么来说，是不是有点“笨”。

二是根据现在的棋盘状态，决定下一个棋子该如何走才能有最大的赢的概率，它就是 AlphaGo 的策略网络（Policy Network）。也就是说，给一个19x19的棋盘状态，在所有空的地方，哪个是最佳的选择，会有最大的赢率。同样，也可以用一个函数来描述，输入是当前棋盘状态，输出是每个空处和它期望的赢的期望值，但这个函数还没有一个高级的数学公式，所以，最后也求助于多层神经网络。