专栏名称: EETOP
EETOP电子网(中国电子顶级开发网)是国内最顶级的电子行业工程师社区,涉及:嵌入式、智能硬件、半导体集成电路设计及制造等。 为您分享论坛精华内容、行业最新资讯、产品及技术 。 网址:www.eetop.cn bbs.eetop.cn
目录
相关文章推荐
哎咆科技  ·  iPhone 20 周年版,才是 iOS ... ·  8 小时前  
EETOP  ·  SERDES相关学习资料 ·  19 小时前  
EETOP  ·  1226页《IC设计工作及学习笔记》分享 ·  2 天前  
Bourns美国柏恩  ·  Bourns ... ·  3 天前  
Bourns美国柏恩  ·  Bourns ... ·  3 天前  
51好读  ›  专栏  ›  EETOP

采用了TPU技术,新版Alpha Go比去年强十倍!但有人还是觉得它挺“笨”?

EETOP  · 公众号  · 硬件  · 2017-05-24 08:15

正文

请到「今天看啥」查看全文


杰米斯·哈萨比斯同时还称,本周将会宣布Alpha Go的未来动向,并在今后披露更多技术细节。他表示,Alpha Go仍需要和人类对弈,通过先学习棋谱,在自我提高,依靠人类棋谱数据和前一版本进一步提升。因此,仅通过自身对决可能无法发现问题,所以通过与顶尖棋手对决才能提高自身的实力,并在其他领域为人类服务。


标题上我们说有人觉得 Alpha Go挺“笨”, 下面我们转载一篇来自虎嗅网的观点来解释:

AlphaGo 其实挺“笨”的


首先申明一下,AlphaGo 确实很厉害的,也不简单。但是,为什么又说,AlphaGo 挺“笨”的呢?

我们知道,围棋的搜索空间很大,有3的19x19次方个状态,要在这么大的空间去找最优算法,一个一个看是不可能的,所以被认为人类智能的一个高点,解决时需要优化搜索。人是根据一些输入空间和参数较少的模式识别来记忆和搜索,而机器采用的却是大数据,大记忆和大计算来实现的。说到 AlphaGo 后面的智能和算法,就不能不说深度学习(DL),强化学习(RL),和蒙特卡洛树搜索(MCTS)。

深度学习,主要用来学习和建立两个模型网络。一个是评测现在的棋盘状态如何,也就是说给当前的棋盘状态打个分,评估一下赢的期望值,它就是价值网络(Value Network)。输入是棋盘19x19每个点的状态,有子或无子,输出是赢的期望值。按理说,如果要是有一个聪明的数学家或是机器足够聪明,说不准他马上就能在黑板上写一个高级的数学公式。很遗憾,现在还没有,所以,只能用多层的神经元网络来近似表示这个高级的函数。这么来说,是不是有点“笨”。

二是根据现在的棋盘状态,决定下一个棋子该如何走才能有最大的赢的概率,它就是 AlphaGo 的策略网络(Policy Network)。也就是说,给一个19x19的棋盘状态,在所有空的地方,哪个是最佳的选择,会有最大的赢率。同样,也可以用一个函数来描述,输入是当前棋盘状态,输出是每个空处和它期望的赢的期望值,但这个函数还没有一个高级的数学公式,所以,最后也求助于多层神经网络。


但是,这两个深度学习网络模型,怎么训练出来的呢?这时,不得不说随机梯度下降(SGD),这个“笨”办法。







请到「今天看啥」查看全文